前言:中文期刊網精心挑選了計算機科學與技術研究方向范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。
計算機科學與技術研究方向范文1
關鍵詞:人才培養;產學研一體;研究性學習;校企合作;多學科融合
近年來,計算機學科自身的內涵、外延和發展的動力與源泉都已經發生了重大的變化。計算機在不同領域中的創新技術與工程應用已經成了計算機學科發展的重要源泉,計算機學科的知識體系也逐漸呈現學科融合的趨勢,人才國際化競爭趨勢越來越明顯。針對這些變化,浙江大學計算機學院根據自身長期積累的教學基礎和在技術與工程應用研究方面的優勢,在人才培養模式上銳意改革,建立了以工程型、復合型、國際化為特色的產學研一體的人才培養體系。
多年來,浙江大學計算機學院利用自身的學科研究特色,針對具有國際競爭力的復合型工程人才培養需求,整合計算機、軟件工程、數字媒體技術、工業設計(信息產品設計方向) 4個專業的資源,圍繞“知識、能力、素質”的培養目標,以能力培養為導向,以精品課程推動課程群建設,并以課程建設為基礎[1-2],構建了多層次的工程實踐能力培養體系[3]、多方位的國際交流能力培養體系、多學科融合的人才培養知識體系,在計算機類工程型、復合型、國際化人才培養模式的探索和實踐方面取得了顯著成效[4]。
1建立多層次的工程實踐能力培養體系
長期以來,浙江大學計算機學院以課程建設為基礎、產學研合作為平臺,積極探索教學科研互動、校企互動、課內外互動的實踐教學模式,針對工程實踐能力培養的不同階段,建立了基礎實踐、工程方法實踐和創新體驗等多層次的實踐教學體系。
1) 引導研究性學習,以課程綜合型實驗為基礎,培養學生基礎實踐能力。
在本科專業基礎和專業課程教學中,大力推行課程設計(俗稱大作業Project),通過團隊式合作、研究式分析、工程化設計完成較大型的系統或軟件的設計題目。課程設計也為教師提供了一種從科研中提煉綜合性、設計性實踐內容,將科研成果轉換為教學內容的有效途徑。
目前我們已在80% 的專業基礎和專業課程中設置了課程設計教學環節,如在3門國家精品課程中分別開設不同類型的綜合實驗:“操作系統”――Linux系統分析、“軟件工程”――典型金融軟件設計、“程序設計基礎”――趣味游戲設計。在實施課程大作業十
作者簡介:陳剛(1973-),男,教授,博士研究生,浙江大學計算機科學與技術學院副院長,研究方向為計算機軟件;何欽銘(1965-),男,教授,博士研究生,研究方向為計算機應用;陳越(1967-),女,教授,博士研究生,研究方向為計算機軟件;陳麗(1970-),女,副研究員,碩士研究生,研究方向為高教管理。
多年經驗的基礎上,組織編寫了國內第一套涵蓋13門計算機專業基礎課程和計算機專業課程的課程設計系列教材。
2) 加強校企合作,將主流技術和工程方法引入教學實踐中,培養學生的工程方法實踐能力。
我們與企業建立戰略技術聯盟,與知名企業合作,包括:共建專業方向和模塊課程、聘請企業教師授課、共同指導畢業設計和學位論文、共建工程訓練教學基地等,將主流技術和工程方法引入教學實踐中。在課堂上組織學生對若干相關熱點問題進行研討,作正式的技術報告,將項目實踐引入課堂教學,鼓勵學生將最新的科學研究成果進行技術化、工程化。讓學生在接觸學科前沿、體驗新技術的同時,培養科學實踐能力和動手能力。目前有9門課程獲教育部-微軟(IBM、Intel、SUN)精品課程,其中嵌入式系統、軟件工程、并行計算與多核程序設計3門課程獲國家精品課程。
我校已經與浙大網新和美國道富銀行共建了金融信息技術方向的課程體系,與阿里巴巴公司共建了電子服務技術方向的課程體系等。開設項目實訓課程10個左右,同時與Intel、微軟、IBM、網易、網新、道富等著名國內外IT企業建立了穩定的企業實習基地30多家。
3) 以學科競賽和科研訓練為手段,激發學生自主創新興趣,培養其創新實踐意識。
我校通過豐富多彩的課外實踐活動,探索課內外互動的實踐機制,加強對學生創新意識的培養,主要包括鼓勵學生參與科技競賽、科研訓練和創新俱樂部(社團)活動等。
一年一度的“浙江大學學生電腦節”已舉辦,每一屆電腦節直接參與學生人數均達到2000余人次,成為浙大最有影響力的學生科技活動之一。學院還積極組織學生參與各類國際競賽,包括ACM大學生程序設計競賽、國際頂級設計大賽等,并頻頻獲獎。近5年共有100多位學生獲省級以上各類競賽獎,其中國際大獎50多項;利用學校的大學生科研訓練計劃(SRTP)和自主設立支持的SRTP項目,使SRTP的學生參與面達90%;先后創建了IBM技術俱樂部、Intel技術俱樂部、騰訊創新俱樂部等近10個與專業技術相關的創新型學術俱樂部,成員超過500人。
4) 以高水平的工程技術研究中心和重大項目為平臺,培養學生的工程創新研究能力。
我校將高水平的工程技術中心作為工程型人才培養的重要基地,并結合近年承擔的面向國家產業發展需求的重大工程技術性項目,吸引一批高年級的本科生進入工程技術型研究基地和課題組,從事高水平的工程技術創新研究工作。
現有的工程技術研究中心有:道富技術中心(金融軟件)、嵌入式系統教育部工程研究中心、計算機輔助產品創新設計教育部工程研究中心、視覺感知教育部-微軟重點實驗室等,每年吸收本科生150位以上。其中,道富技術中心幾乎參與了美國道富銀行所有的核心金融系統研發項目,成為國際化金融信息人才培養的重要平臺,也是吸納畢業生就業的大戶。
2建設全方位的國際交流能力培養體系
我校以雙語課程建設為基礎,大力推行全英語教學,通過營造國際化教學語言環境、拓展國際交流與合作、引進國際師資等方式,構建多方位的國際交流能力培養體系,提升國際化教學的質量。
1) 推進雙語教學,營造國際化教學語言環境,培養國際化交流基礎。
大力推動雙語教學,開展全英文教學,為本校學生和國際生源創造必要的國際化教學語言環境。
目前,我們有46門本科專業課程采用英文教材并實施雙語教學,開設了全英文雙語教學課程共27門,其中數據結構、計算機網絡兩門課程獲國家雙語示范課程;另外我們還聘請外籍英語教師為學生開設高級英文寫作、高級英語口語等實用語言課程。
2) 拓展國際交流與合作,提高學生的跨文化國際交流能力,探索國際合作教學的新模式。
通過形式多樣的海外高校短期交流、中加雙學位項目等,加強學生跨文化國際交流能力的培養,在課程體系建設、課程內容建設、海外師資隊伍的聘任和教師國際交流等方面全面提升國際化教學的質量。
目前,我院已與加拿大、法國、愛爾蘭、荷蘭、新加坡、日本、德國、瑞士、瑞典、澳大利亞等地的19所高校實施本科學生交流。全部項目每年涉及本科生約100余名,達到單屆學生總人數的25%。
2005年開始我院與加拿大西門菲莎大學(Simon Fraser University,簡稱SFU)合作,啟動了中外學生共同參加的雙向“2+2”計算機本科雙學位項目,不僅在培養方案上融合兩所優秀高校的特色,而且在雙方教師的互派、兩國學生的融合教育方面創立了新的模式。接下去,將繼續探索研究生雙學位項目,發揮兩校優勢,積極組建國際化團隊聯合培養研究生。
3) 引進國際師資,拓展國際生源,建設具有國際吸引力的人才培養環境。
我院聘請了一批國際知名大學的學者和國際著名IT公司的高級技術人員參與課程教學,并積極拓展國際生源,形成了具有吸引力的國際化人才培養環境。
近五年來,我院邀請了24位外籍專家學者講授本科專業課程32門次,接受來自加拿大、美國、法國、愛爾蘭、澳大利亞、新加坡等國留學本科生89人(其中2009年接受22人),分別在我院進行課程學習、工程實踐、畢業設計等專業訓練,其中33人為攻讀本科學位的全日制學生。
3創建多學科融合的人才培養知識體系
根據計算機學科交叉融合的發展趨勢和社會需求,我院發揮學科研究優勢,以計算機技術課程為核心,課程叉為基礎,創建了多學科融合的人才培養知識體系。
在專業建設中,我院突出學科交叉融合的特色,催生了新的交叉學科研究方向,實現了教學與科研的良好互動。
1) 以“寬、專、交”的知識體系為目標,建立融合多學科知識的模塊化課程群。
圍繞“寬、專、交”的目標,我院整合計算機、軟件工程、數字媒體、工業設計(信息產品設計方向)4個本科專業的教學內容,并通過模塊化的課程群和交叉課程實現多學科知識體系的融合。
軟件工程專業以計算機核心技術為基礎融合了軟件工程方法、金融信息技術、軟件開發技術、電子服務工程等;數字媒體技術專業以計算機核心技術為基礎融合了多媒體技術、藝術設計等;工業設計專業(信息產品設計方向)[5]以設計方法與技術為基礎融合概念創新設計和計算機嵌入式系統技術等;計算機科學與技術專業則圍繞系統設計與分析的培養目標,融合數字媒體、金融信息技術、人機交互設計等多個應用領域方向。
目前,浙江大學計算機學院共建設完成12個課程群,所有課程群均涉及2個以上專業,如圖1所示。2門學科交叉型課程獲國家精品課程為計算機輔助工業設計、(信息產品)整合與創新設計。
圖1以計算機技術為核心的多學科融合知識體系
2) 發揮學科研究優勢,突出專業建設特色,催生學科研究新方向。
我院工業設計專業是國內唯一一家設立于計算機學科內部的該專業,已形成了“工業設計+嵌入式系統+機電一體化”的復合型人才培養特色,培養了一批信息產品創新設計人才并形成了富有優勢的信息產品創新設計研究方向。軟件工程專業則依托學科在工程技術研究方面的優勢,在金融信息學培養方向上具有很強的特色,形成了金融軟件系統優勢學科研究方向;并充分利用我校在計算機圖形學和多媒體技術研究方面的優勢設立了國內第一家數字媒體技術專業。
目前所有3個拓展專業都被評為國家特色專業,其中工業設計專業被評為第一類特色專業;軟件工程專業的軟件開發技術、金融信息技術、服務科學與技術3個專業方向被評為第二類特色專業(方向)和國家人才培養創新實驗區;數字媒體技術被評為第二類特色專業,同時也已成為國家級動畫教學研究基地。
3) 綜合多學科知識,實踐創新體驗,建立省級研究生教育創新示范基地。
目前我們已有2個教育基地成為浙江省首批研究生教育創新示范基地,分別是浙江大學―網新國際金融信息技術與工程研究生教育創新示范基地、浙江大學―杭州億腦智能科技有限公司信息產品創新設計研究生教育創新示范基地。
網新國際金融信息技術與工程研究生教育創新示范基地與金融等專業的學科交叉,注重計算機軟件、金融學、工程訓練以及外語能力的培養。通過提供研究生的國際化科研實踐基地,實戰性的國際合作項目,不僅可以讓研究生掌握產業動態,融入全球理念并拓展其研究視野和實踐領域,還可以充分發揮研究生的積極性,實現理論研究與國際商業需求的無縫對接。每年選拔的基地研究生不僅可獲得3個月的海外研究和實踐機會,而且有經驗豐富的企業科研人員作為實踐導師并制定以國際化為特色的實踐計劃。同時,合作企業網新國際還將為出訪學生提供與國際專家的合作科研項目,以真實的銀行金融歷史數據為基礎,從事金融數據分析與挖掘方面的研究。
杭州億腦智能科技有限公司信息產品創新設計研究生教育創新示范基地,以“工業設計+嵌入式系統+機電一體化”為創新模式,以技術創新為核心,與形式化的視覺表達相結合,通過功能創新、行為方式等創新模式整合多學科知識,將“設計+技術+商業+用戶”緊密整合在一起,由內而外,真正地將概念設計轉化成生產力,為我國傳統產業的提升作出貢獻。在教學上,引入研究型、應用型課題到專業課教學,推行學科間互動,構建圍繞學科發展的開放式創新教學平臺,建立國際化互動的指導教師團隊,以及建立國際競賽和知識產權成果推進平臺。
4結語
教學改革的深入開展需要有相應的組織與政策
保證。學院十多年前就開始建設以課程群為基礎的課程小組,并以院級教改項目為驅動,教師評價政策為保障,全面推進教學改革的深入開展。目前,已建立了14個本科課程小組(含12個課程群)和9個研究生課程小組,每年投入教學經費近100萬元,同時設立了教學骨干教師崗位,以確保教師從事教學的積極性。
建立產學研一體的工程型、復合型、國際化計算機人才培養體系,有力地提高了人才培養的質量。培養的學生以其扎實的專業基礎、良好的工程實踐能力,在就業市場中廣受好評。近年來,本科生就業率在99%以上,研究生就業率100%,畢業當年起薪保持全校第一。50%以上的就業學生到全球500強企業、國際一流企業工作。2008年48%的本科生出國深造或國內讀研究生,其中出國深造比例13%。近年畢業生中,涌現了許多耀眼的“新星”,如浙江省十大“創業之星”、“手機備備”的發明人方毅,北京奧運會“祥云火炬”的核心設計師章俊,被美國商業周刊稱為TopCoder程序設計競賽“大贏家”并據此要重新評估中國軟件工業水平的吳嘉之等。
參考文獻:
[1] 教育部高等學校計算機科學與技術教學指導委員會. 高等學校計算機科學與技術專業核心課程教學實施方案[M]. 北京:高等教育出版社,2009.
[2] 教育部高等學校計算機科學與技術教學指導委員會. 高等學校計算機科學與技術專業發展戰略研究報告暨專業規范(試行)[M]. 北京:高等教育出版社,2006.
[3] 干紅華,何欽銘,陳德人,等. 工程型國際化軟件人才培養模式探索與實踐[J]. 計算機教育,2008(13):30-34.
[4] 陳根才,何欽銘,陳越,等. 與時俱進的計算機本科教育[J]. 計算機教育,2008(13):26-29.
[5] 孫守遷,應放天,羅仕鑒,等. 多學科知識滲透的創新型工業設計人才培養模式探索與實踐,計算機教育,2008(13):35-37.
Engineering and Compound Oriented Internationalized Computing Talent Training with the Integration of Industry, Education and Research
CHEN Gang, HE Qin-ming, CHEN Yue, CHEN Li
(College of Computer Science and Technology, Zhejiang University, Hangzhou 310027, China)
計算機科學與技術研究方向范文2
關鍵詞:K-means;動態文摘;增量聚類;TAC 2008數據集
中圖分類號:TP312
文獻標識碼:A 文章編號:1672-7800(2015)005-0077-03
作者簡介:郭海蓉(1989-),女,四川眉山人,西南科技大學計算機科學與技術學院碩士研究生,研究方向為自然語言處理;張暉 (1972-),男,四川綿陽人,博士,西南科技大學教育信息化推進辦公室教授,研究方向為文本挖掘、知識工程;趙旭劍(1984-),男,四川綿陽人,博士,西南科技大學計算機科學與技術學院講師,研究方向為中文信息處理、Web信息檢索;李波(1977-),男,四川綿陽人,博士,西南科技大學計算機科學與技術學院講師,研究方向為信息過濾、信息安全;楊春明(1980-),男,四川綿陽人,碩士,西南科技大學計算機科學與技術學院講師,研究方向為文本挖掘、知識工程。
0 引言
隨著互聯網的高速發展,網絡信息日益豐富,為了幫助讀者從海量的網絡文檔中抽取他們感興趣的信息,多文檔文摘技術研究不斷發展[1]。由于傳統的多文檔文摘技術是一種靜態文摘[2],只能對一個靜態的文本集合進行文摘抽取,如果依然使用傳統的靜態文摘方法進行摘要的抽取和更新,則需要不斷重復對歷史文檔集的提取過程,因而非常耗時而且浪費資源。為了適應用戶需求,快速、高效地更新文摘信息,動態文摘技術成為一個新的研究熱點。
目前的動態文摘研究工作大多基于批處理原則以文檔集合為單位進行處理[3]。而在實際應用中,如新聞更新、災難報告、輿情分析等系統,文檔數據是不穩定的數據流,因此需要研究高效的基于數據流處理的動態文摘抽取辦法。為了解決上述問題,本文提出了一種基于聚類的動態文摘方法。該方法通過改進的K-means聚類算法進行句子分類,結合圖中節點權重和時間因素篩選出候選文摘句,根據摘要長度抽取出動態文摘,實現動態文摘的數據流處理和文檔數據流的增量式處理,實時更新文摘內容。改進的K-means算法對文本摘要提取精度有較大提升。
1 相關工作
動態文摘的概念是由DUC(document understand conference)于2007年提出,并成為TAC2008之后TAC會議的3大主要評測任務之一。TAC的動態文摘指,假設用戶已經閱讀過歷史文檔信息,需要獲取當前文檔集合中重要的、新穎的、區別于歷史信息的內容作為更新摘要來向用戶反饋關注事件的最新進展情況[4]。
基于時間因素的相關研究中, Wan[5]等將時間序列應用到文摘抽取中,是對著名的圖排序算法TextRank[6]的改進應用。Boudin等[7]對MMR[8]算法進行擴展應用。Li等[9]提出的PNR2和Du等[10]提出的MRSP就是基于圖模型的代表?;趦热葸^濾的方法也是動態文摘抽取的主流方法之一,Zhang[11]等最早提出了一種基于句子排序算法的內容過濾模型進行動態文摘抽取?;谠隽烤垲惖姆椒芡ㄟ^對文檔數據流進行處理來抽取動態文摘。Wang 和 Li等[12]在2010年實現了基于改進COBWEB算法的動態文摘方法,通過把文檔句構建成一個層次聚類樹,選出聚類結果中最重要的句子作為文摘句。
本文采用改進的K-means聚類劃分子主題,并通過加權公式為句子節點打分的方式實現一種基于增量圖聚類的動態文摘方法。本文方法與其它基于增量聚類方法的動態文摘抽取方法的區別在于:從實際應用需求出發,用改進的K-means方法實現對文檔的數據流處理,并在聚類過程中考慮了數據的刪除,以解決計算機資源限制問題并提高處理效率。
2 改進的K-means算法
在K-means 算法中初始化聚類中心時,采用隨機抽取樣本數據集合中的K個樣本來近似。樣本點抽取的不同將很大程度地影響到聚類結果的獲取。因此,本文采用預處理初始聚類中心點的方法來改進該算法[13]。為了減小聚類結果對初值的依賴性,提高聚類的穩定性,采用聚類中心的搜索算法可以獲得較優的初始聚類中心。在搜索過程中通過對數據隨機取樣,盡量使得取樣后的數據既不失真,又能體現數據的原始分布特征。
對取得的樣本數據進行K-means聚類,通過實驗發現聚類所有數據最終得到的簇中心結果與樣本相近,因此證明此方法可應用于K-means初始聚類中心的選取。為了將初始聚類中心選取所產生的影響最小化,采用多次樣本提取,提取的樣本集在不影響系統需求速度的前提下盡量擴展,并且n次抽樣的樣本總數量約等于原始數據集。對每次樣本進行K-means聚類,得到一組聚類中心,抽樣n次,產生n組聚類中心,然后對n組聚類中心進行聚類準則函數值的比較,確定誤差值最小的一組聚類中心為最優初始聚類中心。
3 基于改進K-means的動態文摘算法
3.1 算法框架
本文提出的動態多文檔摘要算法框架如圖1所示。首先,對文檔集合進行預處理;然后,采用改進的K-means算法進行句子聚類,利用摘要選擇算法獲得候選文摘句;最后,根據摘要長度確定最終摘要。
3.2 預處理
文摘抽取的第一步是對文檔集合進行預處理,首先對其進行句子分解,獲得文檔集合中的所有句子,然后去除停用詞并提取n維術語特征詞集合W(w1,w2,w3,…,wn),再使用術語特征詞構建句子向量S(TFW1,TFW2,TFW3,…,TFWn),最終形成文檔的句子矩陣。其中,TFwi代表術語特征詞wi在句子S中出現頻率。
3.3 基于改進K-means的動態多文檔自動摘要算法
本文的動態文摘算法采用改進K-means算法對文檔句子流進行聚類實現話題的子主題劃分,并增加數據倉庫和數據刪除機制實現增量式的聚類句子節點,同時對每個句子進行權重打分以提高最終文摘質量。句子權重計算公式如下:weight=log(λ)?(currentTime?creatTime(ri)+1)+log(count+1)+D(ri,rcenter),其中rcenter代表聚類中心點。選出每個聚類中weight最大的數據點作為備選文摘句,再根據文摘長度截取weight排名靠前的句子作為最終文摘?;诟倪MK-means的動態多文檔自動摘要算法如下:
算法1:動態文摘算法
輸入:多文檔,聚類個數k,文摘長度w
輸出:動態文摘
(1)將多文檔分解為句子,提取特征詞,構建多維句子向量。
(2)對句子向量進行改進K-means算法聚類,更新K-means聚類簇數據。
(3)將新的句子向量加入數據倉庫,計算句子的重要度,判斷是否刪除數據。
(4)重復(2)-(3)直到當前句子向量集合處理完畢。
(5)計算聚類中心,選出距離聚類中心較近的節點中句子權重排序。
(6)根據要求的文摘長度w截取排名靠前的句子作為動態文摘。
4 實驗結果與分析
4.1 數據集
本文采用TAC 2008Update Summarization 任務的測試語料集。假定讀者對該話題的歷史文檔信息有了解,Update Summarization任務的目的是對每一段時間的文檔集給出100字的文摘,該文摘能反映沿著時間變化的內容更新。
4.2 文摘評測
基于ROUGE準則的評測是由ISI的Lin和Hovy[18]提出的一種自動摘要評價方法。目前,ROUGR評測已經被廣泛應用于TAC的動態文本摘要評測任務中。本文實驗采用TAC 2008的Update Summarization測試數據,將所得動態文摘結果的ROUGE-1(R-1)、ROUGE-L(R-L)、ROUGE-2(R-2)和ROUGE-SU4*(R-SU4)得分與TAC 2008 Update任務中其它系統的得分進行對比,如表1所示。結果表明,本文提出的動態多文檔文摘方法效果良好。
4.3 實驗結果
為了更好地給出采用本文方法后的結果,選取傳統算法作為本文算法結果的對比算法。TAC Baseline是TAC創建的一個文摘評測基本標準,其原理是從最近的文檔集合中選出文章的第一個句子作為文摘;TAC Best表示TAC文摘任務參賽者中的最佳結果。
從評測結果可以看出,傳統K-means算法效果較差,因為傳統K-means算法聚類效果不佳,并且每次都是隨機選取初始聚類中心,穩定性差,同時聚類個數的人工設定也有相當大的影響。而改進后的K-means算法在提升摘要質量上效果明顯,并且對句子的加權也進一步提升了摘要效果。同時,本文方法是基于增量聚類算法,能很好地適用于大數據情況。
5 結語
本文提出了一種基于改進K-means聚類算法的動態多文檔摘要提取新方法,通過改進的K-means算法對句子進行聚類,并提出了新的句子權重計算方法用于動態文摘提取方法,實現了文檔數據流的增量式處理,在TAC 2008數據集的基礎上,使用ROUGE-1.5.5的評測工具包對摘要結果進行評測,驗證了該方法的有效性。后續研究中將著重考慮提高動態文摘算法的準確性和效率,并將該算法更好地應用于超大規模的數據處理中,如輿情分析系統。
參考文獻:
[1] 秦兵,劉挺,李生.多文檔自動文摘綜述[J].中文信息學報,2005(6): 15-22.
[2] 劉美玲,鄭德權,趙鐵軍,等.動態多文檔文摘模型[J].軟件學報,2012(2): 289-298.
[3] LI X,DU L,SHEN Y.Update summarization via graph-based sentence ranking[J].Knowledge and Data Engineering, 2013, 25(5): 1162-1174.
[4] DANG H T,OWCZARZAK K. Update summarization task[C].Overview of the TAC 2008, 2008.
[5] WAN X. TimedTextRank: adding the temporal dimension to multi-document summarization[C].ACM, 2007.
[6] MIHALCEA R,TARAU P.Textrank:bringing order into texts[C].Association for Computational Linguistics,2004.
[7] BOUDIN F,ELBZE M.A scalable MMR approach to sentence scoring for multi-document update summarization[C].Citeseer,2008.
[8] CARBONELL J,GOLDSTEIN J.The use of MMR, diversity-based reranking for reordering documents and producing summaries[C].ACM,1998.
[9] LI W,WEI F,LU Q,et al.Ranking sentences with positive and negative reinforcement for query-oriented update summarization[C].ACM,2008.
[10] DU P,GUO J,ZHANG J,et al. Manifold ranking with sink points for update summarization[C]. ACM,2010.
[11] ZHANG J,CHENG X,XU H,et al.Ictcas’s ictgrasper at tac 2008:summarizing dynamic information with signature terms based content filtering[C].Citeseer,2008.
計算機科學與技術研究方向范文3
2015年北京工業大學碩士研究生擬招生學科目錄已公布,具體內容請各位考生查看如下:
院(所)、學科代碼、名稱 學科方向 招生人數 考試科目 備注 001 機械工程與應用電子技術學院 223 0801 力學 _ 01動力學與控制 _ 02固體力學 _ 03流體力學 _ 04工程力學 27 ①101思想政治理論 ②201英語一 ③301數學一 ④811理論力學或812材料力學I 080200 機械工程 _ 01數字化設計與制造技術 _ 02精密數控加工與自動化裝備 _ 03現代焊接技術與自動化裝備 _ 04機電系統控制及自動化 _ 05機構及機器人系統分析與控制 _ 06機械及微機電系統結構設計 78 ①101思想政治理論 ②201英語一 ③301數學一 ④811理論力學或812材料力學I或813電工學 0804 儀器科學與技術 _ 01精密測試技術與儀器 _ 02現代測控技術及方法 _ 03計算機測試與控制技術 _ 04智能儀器與虛擬儀器技術 23 ①101思想政治理論 ②201英語一 ③301數學一 ④803電子技術I或812材料力學I或813電工學 085201 機械工程(專業學位) _01數字化設計與制造及裝備 _02現代機械系統設計 _03機電液一體化設計與制造 _04現代測控技術與儀器 _05高端裝備強度與動態分析 95 ①101思想政治理論 ②204英語二 ③302數學二 ④809工程力學或813電工學 002 電子信息與控制工程學院 232 0809 電子科學與技術 _ 01信號處理與電路 _ 02數字多媒體信息技術 _ 03信息光電子學與光通信 _ 04超大規模集成電路設計與系統集成 _ 05電子器件、射頻和功率集成電路及可靠性 58 ①101思想政治理論 ②201英語一 ③301數學一 ④822信號與系統或823半導體物理 1、01-02方向選822; 2、03-05方向選823。 0810 信息與通信工程 _ 01語音與音頻信號處理 _ 02多媒體通信技術 _ 03信號處理理論與通信技術 _ 04圖像與視頻信號處理 30 ①101思想政治理論 ②201英語一 ③301數學一 ④822信號與系統 0811 控制科學與工程 _ 01自動控制理論及其應用 _ 02測控技術與自動化系統 _ 03智能系統與智能信息處理 _ 04信息融合與自主導航 _ 05計算機控制技術及其應用 63 ①101思想政治理論 ②201英語一 ③301數學一 ④821自動控制原理 085208 電子與通信工程(專業學位) _ 01信號與信息處理及其應用技術 _ 02圖像處理與模式識別技術 _ 03多媒體通信技術 _ 04無線通信技術 _ 05嵌入式系統技術 35 ①101思想政治理論 ②204英語二 ③302數學二 ④822信號與系統 085210 控制工程(專業學位) _ 01工業過程的建模、控制與優化 _ 02系統工程(系統優化與決策) _ 03信息管理系統 _04生產過程綜合自動化 _ 05智能控制與智能系統 30 ①101思想政治理論 ②204英語二 ③302數學二 ④821自動控制原理 085209 集成電路工程(專業學位) _ 01集成電路設計 _02集成電路制備工藝及相關技術研究 _03微電子器件檢測與可靠性評價技術 16 ①101思想政治理論 ②204英語二 ③302數學二 ④823半導體物理 004 建筑工程學院 246 0814 土木工程 _01工程抗震減震與城市綜合防災減災理論、方法和技術 _02結構新體系與高性能材料 _03結構全壽命設計、健康監測與可持續發展 _04巖土與地下工程安全風險分析、評價方法和技術 _05工程施工技術與風險管理 _06水環境恢復工程及水質處理保障技術 _07建筑環境控制及能源利用技術 119 ①101思想政治理論 ②201英語一或203日語 ③301數學一 ④841結構力學 或833土力學與地基基礎 或843鋼筋混凝土結構 或 845水分析化學與水力學;或846傳熱學Ⅰ或867流體力學Ⅱ 1、土木工程(含工民建、道橋等)或相近專業考生報考方向可選01~05,考試科目可選841或833或843; 2、給排水或相近專業考生報考方向可選06,考試科目可選845; 3、暖通或相近專業考生報考方向可選07,考試科目應選846或867。 0823 交通運輸工程 _ 01道路與鐵道工程 _ 02交通運輸規劃與管理 _ 03交通信息工程及控制 4 ①101思想政治理論 ②201英語一 ③301數學一 ④848道路工程 或 849交通工程或832交通信息與控制 1、01方向選848; 2、02-03方向選849或832。 0815 水利工程 _ 01水文學及水資源 _ 02水力學及河流動力學 _ 03水工結構工程 _ 04水利水電工程 _ 05港口、海岸及近海工程 10 ①101思想政治理論 ②201英語一或203日語 ③301數學一 ④841結構力學或844水力學Ⅱ 085213 建筑與土木工程(專業學位) _01工程抗震減震與城市綜合防災減災理論、方法和技術 _02結構新體系與高性能材料 _03結構全壽命設計、健康監測與可持續發展 _04巖土與地下工程安全風險分析、評價方法和技術 _05工程施工技術與風險管理 _06工程項目管理及信息化 _07水環境恢復工程及水質處理保障技術 _08建筑環境與能源利用技術 100 ①101思想政治理論 ②204英語二或203日語 ③302數學二 ④841結構力學或833土力學與地基基礎或845水分析化學與水力學 或846傳熱學Ⅰ或867流體力學Ⅱ 1、土木工程(含工民建、道橋等)或相近專業考生報考方向可選01~06,考試科目可選841或833或843; 2、給排水或相近專業考生報考方向可選07,考試科目可選845; 3、暖通或相近專業考生報考方向可選08,考試科目應選846或867。 085222 交通運輸工程(專業學位) _01道路交通安全理論與道路工程技術 _02交通規劃與交通控制理論及方法 _03智能交通、仿真與可持續發展整合體系 5 ①101思想政治理論 ②204英語二 ③302數學二 ④848道路工程或849交通工程或832交通信息與控制 1、01方向選848; 2、02-03方向選849或832。 1256 工程管理(專業學位) _ 00不區分研究方向 8 ①199管理類聯考綜合能力 ②204英語二 005 環境與能源工程學院 152 070304 物理化學 _01能源材料物理化學 _02催化化學 _03納米材料物理化學 _04界面物理化學與分離技術 11 ①101思想政治理論 ②201英語一 ③684物理化學I ④887無機化學II · 0807 動力工程及工程熱物理 _ 01可再生能源利用及先進環境能源理論與技術 _ 02強化傳熱傳質理論與工程應用 _ 03制冷低溫系統及其環保節能理論與技術 _ 04車輛及動力系統節能、凈化與控制 23 · ①101思想政治理論 · ②201英語一 · ③301數學一 · ④851傳熱學Ⅱ或852工程熱力學 0817 化學工程與技術 _ 01綠色化學與精細有機化工 _ 02工業催化與納米科學 _ 03膜科學與化工分離技術 _ 04材料化學理論與應用 _ 05先進材料合成及催化應用 25 ①101思想政治理論 ②201英語一 ③302數學二 ④814物理化學Ⅲ或820有機化學I或878化工原理 0830 環境科學與工程 _ 01環境規劃與污染防治 _ 02污染控制化學 _ 03環境分析與監測 _ 04環境規劃與管理 _ 05水污染控制工程 _ 06大氣污染控制工程 28 ①101思想政治理論 ②201英語一或203日語 ③302數學二 ④856環境影響評價或857微生物基礎I或858環境工程學 1、只有05方向招日語考生; 2、01-04方向,選856; 3、05方向選857; 4、06方向選858。 085206 動力工程(專業學位) _01可再生能源利用與先進環境能源技術 _02能源動力系統優化及工程應用 _03制冷低溫系統及其節能環保技術 _04動力機械及車輛動力系統節能、凈化與控制 32 ①101思想政治理論 ②204英語二 ③302數學二 ④851傳熱學Ⅱ或852工程熱力學 085229 環境工程(專業學位) _01水污染控制工程 _02大氣污染控制工程 _03環境規劃與管理 33 ①101思想政治理論 ②204英語二 ③302數學二 ④856環境影響評價或857微生物基礎I或858環境工程學 1、01方向選857; 2、02方向選858; 3、03方向選856。 006 應用數理學院 98 0701 數學 _ 01基礎數學 _ 02應用數學 _ 03運籌學與控制論 _ 04科學計算 35 ①101思想政治理論 ②201英語一 ③663數學分析 ④865高等代數 0714 統計學 _ 01非參數統計與數據分析 _ 02應用統計 _ 03生物統計 _ 04金融工程與應用概率 _ 05經濟統計 14 ①101思想政治理論 ②201英語一 ③663 數學分析 ④865 高等代數 0702 物理學 _ 01理論物理 _ 02凝聚態物理 _ 03光學 25 ①101思想政治理論 ②201英語一 ③662普通物理I ④861量子力學或863光學 1、01方向選861; 2、02方向選861或863; 3、03方向選863。 0803 光學工程 _ 01脈沖激光技術與應用 _ 02信息光學與應用 _ 03微納光學 _ 04光電傳感與檢測技術 7 ①101思想政治理論 ②201英語一 ③301數學一 ④828激光原理 0252 應用統計(專業學位) _01生物醫學統計 _02精算統計 _03數量金融 _04質量管理統計 17 ①101思想政治理論 ②204英語二 ③303數學三 ④432統計學 007 計算機學院 151 0812 計算機科學與技術 _ 01 計算機系統結構 _ 02 計算機軟件與理論 _ 03計算機應用技術 _ 04 信息安全 68 ①101思想政治理論 ②201英語一 ③301數學一 ④895 計算機學科專業基礎 085211 計算機技術(專業學位) _ 01計算機網絡技術 _ 02計算機軟件技術 _ 03計算機應用技術 _ 04信息安全技術 83 ①101思想政治理論 ②204英語二 ③302數學二 ④896數據結構 009材料科學與工程學院 140 0805 材料科學與工程 _ 01生態環境材料與資源循環技術 _ 02稀土、難熔金屬等功能材料 _ 03高性能結構材料技術 _ 04先進材料加工技術 _ 05光電信息與高效能源材料 80 ①101思想政治理論 ②201英語一或203日語 ③302數學二 ④875材料科學基礎 085204 材料工程(專業學位) _ 01生態環境材料與資源循環技術 _ 02稀土、難熔金屬等功能材料 _ 03高性能結構材料技術 _ 04先進材料加工技術 _ 05光電信息與高效能源材料 60 ①101思想政治理論 ②204英語二或203日語 ③302數學二 ④875材料科學基礎 011 經濟與管理學院 182 1201 管理科學與工程 _ 01技術與項目管理 _ 02戰略管理與社會網絡 _ 03信息管理與信息系統 _ 04城市管理 _ 05運作管理與質量管理 _ 06金融工程 25 ①101思想政治理論 ②201英語一或203日語 ③303數學三 ④801管理學或804經濟學原理或805數據庫技術與應用 0202 應用經濟學 _01金融學 _02國際貿易學 _03產業經濟學 _04區域經濟學 _05數量經濟學 _06統計學 _07勞動經濟學 25 ①101思想政治理論 ②201英語一 ③303數學三 ④804經濟學原理 1202 工商管理 _ 01會計學 _ 02企業管理 _ 03旅游管理 _ 04技術經濟及管理 13 ①101思想政治理論 ②201英語一或203日語 ③303數學三 ④801管理學或804經濟學原理 1251 工商管理碩士(專業學位) _ 00不區分研究方向 99 ①199管理類聯考綜合能力 ②204英語二 1252 公共管理碩士(專業學位) _ 00不區分研究方向 20 ①199管理類聯考綜合能力 ②204英語二 012 建筑與城市規劃學院 60 0833 城鄉規劃學 _ 01城鄉規劃理論與方法 _ 02居住區規劃與設計 _ 03城市設計與景觀規劃 _ 04歷史城市與街區保護規劃 _ 05城市防災減災規劃 15 ①101思想政治理論 ②201英語一 ③633城市規劃原理 ④503城市規劃與設計 接收建筑學、城市規劃學(含園林景觀)專業的考生報考。 0851 建筑學(專業學位) _01都市建筑設計及理論 _02歷史建筑的保護與更新 _03建筑與城市綠色環境技術 _04城市設計方法及理論 40 ①101思想政治理論 ②201英語一 ③355建筑學基礎 ④504建筑快速設計 接收建筑學、城市規劃學專業的考生報考。 085237 工業設計工程(專業學位) _ 00不區分研究方向 5 ①101思想政治理論 ②204英語二 ③337工業設計基礎 ④502產品設計 接收工業設計、產品設計、藝術設計專業等相關專業考生報考。
085229 環境工程(專業學位) _01水污染控制工程 _02大氣污染控制工程 _03環境規劃與管理 33 ①101思想政治理論 ②204英語二 ③302數學二 ④856環境影響評價或857微生物基礎I或858環境工程學 1、01方向選857; 2、02方向選858; 3、03方向選856。 006 應用數理學院 98 0701 數學 _ 01基礎數學 _ 02應用數學 _ 03運籌學與控制論 _ 04科學計算 35 ①101思想政治理論 ②201英語一 ③663數學分析 ④865高等代數 0714 統計學 _ 01非參數統計與數據分析 _ 02應用統計 _ 03生物統計 _ 04金融工程與應用概率 _ 05經濟統計 14 ①101思想政治理論 ②201英語一 ③663 數學分析 ④865 高等代數 0702 物理學 _ 01理論物理 _ 02凝聚態物理 _ 03光學 25 ①101思想政治理論 ②201英語一 ③662普通物理I ④861量子力學或863光學 1、01方向選861; 2、02方向選861或863; 3、03方向選863。 0803 光學工程 _ 01脈沖激光技術與應用 _ 02信息光學與應用 _ 03微納光學 _ 04光電傳感與檢測技術 7 ①101思想政治理論 ②201英語一 ③301數學一 ④828激光原理 0252 應用統計(專業學位) _01生物醫學統計 _02精算統計 _03數量金融 _04質量管理統計 17 ①101思想政治理論 ②204英語二 ③303數學三 ④432統計學 007 計算機學院 151 0812 計算機科學與技術 _ 01 計算機系統結構 _ 02 計算機軟件與理論 _ 03計算機應用技術 _ 04 信息安全 68 ①101思想政治理論 ②201英語一 ③301數學一 ④895 計算機學科專業基礎 085211 計算機技術(專業學位) _ 01計算機網絡技術 _ 02計算機軟件技術 _ 03計算機應用技術 _ 04信息安全技術 83 ①101思想政治理論 ②204英語二 ③302數學二 ④896數據結構 009材料科學與工程學院 140 0805 材料科學與工程 _ 01生態環境材料與資源循環技術 _ 02稀土、難熔金屬等功能材料 _ 03高性能結構材料技術 _ 04先進材料加工技術 _ 05光電信息與高效能源材料 80 ①101思想政治理論 ②201英語一或203日語 ③302數學二 ④875材料科學基礎 085204 材料工程(專業學位) _ 01生態環境材料與資源循環技術 _ 02稀土、難熔金屬等功能材料 _ 03高性能結構材料技術 _ 04先進材料加工技術 _ 05光電信息與高效能源材料 60 ①101思想政治理論 ②204英語二或203日語 ③302數學二 ④875材料科學基礎 011 經濟與管理學院 182 1201 管理科學與工程 _ 01技術與項目管理 _ 02戰略管理與社會網絡 _ 03信息管理與信息系統 _ 04城市管理 _ 05運作管理與質量管理 _ 06金融工程 25 ①101思想政治理論 ②201英語一或203日語 ③303數學三 ④801管理學或804經濟學原理或805數據庫技術與應用 0202 應用經濟學 _01金融學 _02國際貿易學 _03產業經濟學 _04區域經濟學 _05數量經濟學 _06統計學 _07勞動經濟學 25 ①101思想政治理論 ②201英語一 ③303數學三 ④804經濟學原理 1202 工商管理 _ 01會計學 _ 02企業管理 _ 03旅游管理 _ 04技術經濟及管理 13 ①101思想政治理論 ②201英語一或203日語 ③303數學三 ④801管理學或804經濟學原理 1251 工商管理碩士(專業學位) _ 00不區分研究方向 99 ①199管理類聯考綜合能力 ②204英語二 1252 公共管理碩士(專業學位) _ 00不區分研究方向 20 ①199管理類聯考綜合能力 ②204英語二 012 建筑與城市規劃學院 60 0833 城鄉規劃學 _ 01城鄉規劃理論與方法 _ 02居住區規劃與設計 _ 03城市設計與景觀規劃 _ 04歷史城市與街區保護規劃 _ 05城市防災減災規劃 15 ①101思想政治理論 ②201英語一 ③633城市規劃原理 ④503城市規劃與設計 接收建筑學、城市規劃學(含園林景觀)專業的考生報考。 0851 建筑學(專業學位) _01都市建筑設計及理論 _02歷史建筑的保護與更新 _03建筑與城市綠色環境技術 _04城市設計方法及理論 40 ①101思想政治理論 ②201英語一 ③355建筑學基礎 ④504建筑快速設計 接收建筑學、城市規劃學專業的考生報考。 085237 工業設計工程(專業學位) _ 00不區分研究方向 5 ①101思想政治理論 ②204英語二 ③337工業設計基礎 ④502產品設計 接收工業設計、產品設計、藝術設計專業等相關專業考生報考。 036 學院 10 010108 科學技術哲學 _ 01科學技術與社會研究 _ 02工程倫理學 _ 03生態哲學與可持續發展問題研究 5 ①101思想政治理論 ②201英語一 ③620科學技術史 ④825哲學 0305 理論 _ 01基本原理 _ 02中國化研究 _ 03思想政治教育 5 ①101思想政治理論 ②201英語一 ③651基本原理 ④883思想政治教育基本原理 035 藝術設計學院 22 1305 設計學 _ 01 產品設計 _ 02 環境設計 _ 03 服裝與服飾設計 _ 04 工藝美術 _ 05 數字媒體藝術 _ 06 視覺傳達設計 7 ①101思想政治理論 ②201英語一 ③622設計史論 ④505快題設計 505考試為6小時。 1351 藝術(專業學位) _ 01 產品設計 _ 02 環境設計 _ 03 服裝與服飾設計 _ 04 工藝美術 _ 05 數字媒體藝術 _ 06 視覺傳達設計 _ 07 動畫 _ 08 繪畫 _ 09 雕塑 8 ①101思想政治理論 ②204英語二 ③622設計史論 或 619美術史論 ④505快題設計 或 506專業創作 1、01-04方向選622和505。 2、05-09方向選619和506。 3、506和505考試時間為6小時。 085237 工業設計工程 _01 工業設計 _02 設計管理 _03 交互設計 7 ①101思想政治理論 ②204英語二 ③337工業設計基礎 ④502產品設計 報考02設計管理的考生須有兩年以上工作經驗,專業不限。 039 城市交通學院 87 0823 交通運輸工程 _ 01交通規劃理論與方法 _ 02道路與交通工程設計方法 _ 03交通安全理論與技術 _ 04智能交通控制與信息處理 _ 05路基路面結構與材料 _ 06道路養護與運營管理 23 ①101思想政治理論 ②201英語一 ③301數學一 ④848道路工程 或 849交通工程或832交通信息與控制 1、01-04方向選849或832; 2、05-06方向選848。 085222 交通運輸工程(專業學位) _01交通規劃技術 _02交通管理與工程設計 _03交通信息與控制技術 _04道路設施設計與施工技術 _05道路養護與管理 23 ①101思想政治理論 ②204英語二 ③302數學二 ④848道路工程或849交通工程或832交通信息與控制 1、01-03方向選849或832; 2、04-05方向選848。 0812 計算機科學與技術 _ 01智能交通信息處理 _ 02虛擬現實與交通仿真 _ 03物聯網信息感知與智能處理 _ 04智能人機交互與多媒體技術 _ 05交通大數據智能處理技術 21 ①101思想政治理論 ②201英語一 ③301數學一 ④895 計算機學科專業基礎 085211 計算機技術(專業學位) _ 01智能交通信息處理 _ 02虛擬現實與交通仿真 _ 03物聯網信息感知與智能處理 _ 04智能人機交互與多媒體技術 _ 05交通大數據智能處理技術 5 ①101思想政治理論 ②204英語二 ③302數學二 ④896數據結構 0811 控制科學與工程 _ 01智能交通系統控制 _ 02自主車輛與車路協同 _ 03交通圖像與視頻信號處理與分析 _ 04交通信息智能化處理 8 ①101思想政治理論 ②201英語一 ③301數學一 ④821自動控制原理 085210 控制工程(專業學位) _ 01智能交通系統管理與控制技術 _ 02智能車輛與車路協同控制技術 _ 03交通信息處理方法與應用 _ 04交通圖像與視頻信號處理技術 7 ①101思想政治理論 ②204英語二 ③302數學二 ④821自動控制原理
計算機科學與技術研究方向范文4
【關鍵詞】大數據 高維數據 挖掘技術
大數據在互聯網上的實施不僅是數據量的增長,也是數據產生的復雜性。在數據量增長過程中,如果達到一定的程度,就會產生規模化的質變現象。大數據中包含的內容比較多,在結構信息上不僅要具有文本數據,視頻數據,還要在采集和處理上提升較快的速度。在企業應用方式上能夠實現良好的生產效率和決策,在政府應用方式上能夠對一些應急方式進行處理,在世界發展中面對巨大的數據挑戰。
1 大數據
1.1 大數據特征
大數據的特征主要表現在四種形式,如:大量化、多樣化、快速化以及價值低密度化。對于大量化來說,該特征主要表現為數據量表達龐大現象,不僅數據的儲存量大,計算量也比較大。對于多樣化來說,主要在結構上實現的,特別是數據表以及半結構化、非結構文本的實現的,還能實現圖像以及視頻等數據來源,在數據傳輸與數據變換之間具有多樣性以及廣泛性。對于快速化來說,它不僅在數據增長以及數據更新模式上能夠實現較快速度,數據在儲存、傳輸以及處理等方式上也比較迅速。對于比較低的價值密度,主要為數據的價值密度比較低。如:對于視頻密度,它能夠在監控期間形成連續性,價值數據的處理僅僅為一小部分。
1.2 大數據構成
大數據的構成不僅是數據量的增長,還是復雜數據的不斷提升。隨著大數據規模化的不斷實施,大數據中的數據類型也實現多樣性,在處理以及采集等方式上也能實現較快速度。大數據是一種海量交易數據,它能夠實現在線系統交易,能夠在結構以及類型中對傳統數據進行系統分析。能實現海量交互數據,它能將大量數據利用傳感器、地理定位以及文件傳輸等方式進行交互式分析。還能實現海量數據處理行為,利用多種數據庫將數據導入到大型分布式數據庫進行查詢、分類,從而實現良好的分析形式。還能對數據進行挖掘,并保證數據在分析期間形成較大需求。如:YunTable就是在傳統式的分布數據與新的NoSQL技術上發展而來的,
2 面向大數據的高維數據挖掘技術研究
2.1 三維矩陣模型
數據來源的不同方式具有不同處理特性,特別在數據調研期間,一般數據調研方式分為單選、多選以及排序等形式。傳統的數據調研主要對一條數據庫實施記錄、分析,該處理方式比較困難。而在大數據儲存形式下,建立了一種新的數據模型,它不僅實現了較大內容,通用性也比較強。如:一般利用向量來表示單選題、多選題,利用矩陣來表示排序題。該數據的表現形式一般都利用社會網絡中的相關數據實施的,選題的主要方式多以比較關鍵性的類別作為代表。如果將已經產生的數據關系進行轉換,在處理以及分析等形式上就要利用映射方式進行轉換。如傳統數據庫與三維矩陣之間的轉換模型,該模型主要對比較關鍵的屬性進行處理,在每個空間維度上都產生多個空間形式。所以利用傳統數據來源,建立三維矩陣模型,能夠實現各個層次元素的有效分析。
2.2 超圖聚類算法
超圖聚類算法是利用原始數據之間關系來表現的,在高維空間中,根據超圖數據集,將圖形實現劃分方式進行優化。該方法在三維矩陣中,將圖形進行分割算法主要利用HMETIS算法來實現。該方法是一種超圖算法,能夠實現良好的電路設計。特別在集成電路設計中,HMETIS算法能夠為劃分形式實現較好的質量表達,并實現數據庫信息的挖掘形式。該算法在實際運算期間,第一步,它需要在粗化階段形成一個最小超圖,然后在下一級超圖中將頂點進行壓縮。第二步,在初始劃分階段,該階段主要對粗化超圖實現二次劃分,由于要保證時間與質量的影響,所以應利用二次方法來實現。第三步,在遷移優化階段,主要的優化方式是將超圖進行細分,然后利用投影方式提高細分質量。超圖方法最有效的處理方式就是利用聚類算法來實現,如Matlab的超圖轉化方式、HMETIS軟件包以及HMETIS算法都能實現聚類的計算結果。
2.3 關聯規則的三維矩陣
關聯規則中的三維矩陣是數據挖掘中的技術之一,形成的關系在屬性以及各個項目中都不能實現預制、隱藏,要保證良好的實現方式,要利用數據庫以及統計方法作為有效基礎。關聯規則的三維矩陣技術隨著數據的儲存與數據不斷發展,無論在置信度,還是在支持度都得到廣泛應用。如:置信度主要對關聯規則中的度數進行衡量,如支持度主要對關聯規則的重要性進行衡量。為了使兩者衡量方式能夠滿足用戶需要,一般要保證關聯規則中支持度與置信度的最小數值。多維數據在空間上的表達形式是一種多維性的儲存模型,它能夠利用偏序關系之間的映射理念為主要依據,在復雜的多維結構上來實現,從而保證數據庫中層次與語義之間的有效表達。如:在海洋中利用多維數據進行監測,將結構以及不同表達形式都實現了重要意義。該多維數據模型的表達實現了多維空間數據表達,在這種關系數據庫中,能夠滿足多樣化、多維型性的海洋數據結構。
3 結論
隨著能源在各個應用領域的不斷消耗,數據成為各個行業發展與創新的主要資源,在社會行業建設中,實現了大數據的豐富與發展。大數據不僅給各個行業發展帶來新的挑戰,還改變了傳統數據的處理方式,將數據信息轉換為真實、有效的應用模式,為實現市場經濟變化提供較大便利。
參考文獻
[1]璽.基于大數據的高維數據挖掘研究[J].信息與電腦(理論版),2015,15:114-115.
[2]呂輝.基于大數據和高維數據的聚類方法的研究與設計實現[D].云南大學,2015.
[3]趙恒.數據挖掘中聚類若干問題研究[D].西安電子科技大學,2005.
[4]李秋虹.基于MapReduce的大規模數據挖掘技術研究[D].復旦大學,2013.
作者簡介
高夏,男,山東省濟南市人。山東大學計算機科學與技術學院軟件工程專業在讀碩士研究生。研究方向為數據挖掘。
計算機科學與技術研究方向范文5
隨著社會經濟的不斷發展,科學技術的進步,計算機技術在各個行業中都逐漸開始得到廣泛的應用,這都極大的促進了計算機技術和各行業的發展和進步。通過對計算機技術的應用,能夠讓人們的生活與工作更加的便捷,在人們生活與工作的各個方面都發揮出了積極的作用。特別是近幾年來,隨著信息化時代的到來,人們越來越依賴計算機技術,對它的應用也更加的廣泛,這促進了人們生活效率和質量的提高。
【關鍵詞】計算機技術 發展 應用
在現代社會中,計算機技術得到了快速的發展,加快了社會發展和轉變的進程。為了更好的應用計算機技術,人們不斷加深對該技術的研究和探索,通過掌握計算機技術的發展方向和趨勢,全面的發揮計算機技術的積極作用,促進社會的快速發展。
1 計算機技術發展的現狀
隨著社會環境和信息技術的變化和發展,促進了現代計算機技術的進步。與傳統的計算機技術相比,現代的計算機技術在信息處理方面得到了不斷的優化,在提高了效率的同時也減少了生產的成本,并逐漸開始形成專業的計算機技術研究。就目前來說,對計算機技術的應用范圍在不斷的擴大,已經開始涉及到現代教學和生產自動化等方面。
在生產的過程中通過應用計算機技術,不斷的提高生產的效率,同時減少了對人工的使用,這極大地促進了整個行業的快速發展。在生產中通過運用計算機技術,能夠實現生產自動化,可以通過事先的程序設計,生產的設備就可以自動的運行和處理相關的問題,能夠對整個生產的過程實現有效控制和精確分析。計算機技術也促進了以軟件業為代表的第三產業的快速發展,不斷的擴大其發展的規模。
與此同時,在計算機技術迅速發展的同時,也存在著很多的問題,比如人們在操作計算機的時候,觀念和意識上還比較落后和薄弱,操作管理水平不高;計算機技術的專業人員的綜合素質不高,能力較弱,還需要不斷的提高;對計算機技術研究方面,人才、資金等方面的投入較少,這不利于該技術的快速發展和進步。這些問題都嚴重阻礙著計算機技術的發展,還需要及時的采取相關措施來解決,確保計算機技術的快速發展和進步。
2 計算機技術發展的方向和趨勢
隨著計算機技術應用范圍的不斷擴大,在各個行業的應用也逐漸趨于成熟,為了實現該技術的不斷進步和突破,計算機技術應該朝著人工智能、網絡化、微型化和綠色化的方向來發展。這樣人們在生活和工作中運用計算機技術就會更加的簡單、方便、快捷,滿足更深層次的需求,同時綠色化發展是所有行業未來發展的目標和方向,這也是實現人們可持續化生存和發展重要途徑和保障。計算機技術是信息技術的基礎和核心,該技術的發展對信息技術的發展、改善社會經濟的環境具有重要的意義和作用,目前人們對計算機技術的分析和研究主要集中在兩個方面,即空間拓展化和結構化。
研究計算機技術的空間拓展化,首先是由于計算機技術的特點比較復雜,具有較高的綜合性,并且發展和應用的領域比較廣泛,這加強了計算機技術與社會經濟生活之間的聯系,彼此之間的相關性和聯系性十分的密切,具有極強的適應性;其次,計算機技術的集成性較強,這能夠在一定程度上減少生產經營的成本,這也在一定程度上提高了計算機技術的適應性;最后是計算機技術的人性化發展,能夠實現該技術的智能化。這能夠在生產經營的過程中利用計算機技術來來替代人工處理,極大的減少了對人力資源的使用,能夠實現資源的優化配置,降低生產經營的成本,對于有些行業,也能夠提高工作的精確度。
研究計算機技術的結構化,首先需要考慮計算機技術更新換代的問題,注重提高自身的水平和能力;其次應該增加人工的干預,探索和分析,計算機技術在發展過程中存在的問題,突破自身的局限和約束;最后需要有效地連接計算機技術和相關行業的發展,實現兩者之間相互促進,共同發展。
3 對計算機技術的應用
隨著計算機技術的快速發展,人們不斷的增加對該技術的應用,并不斷的研究相關的產品,促進了社會經濟活動的快速發展和進步,其中對計算機技術應用最廣泛的主要包括ATM技術應用、磁盤技術應用、光盤記錄應用、并行處理應用、數據庫系統應用、表面封裝應用、移動計算機應用、半導體技術應用、數字處理應用、系統應用、多媒體計算機等方面。
在對計算機技術的應用方面,其中最主要的是對計算機系y技術的應用,該系統十分的完整,主要包括系統應用技術、系統管理技術、系統維護技術、系統結構技術等方面。通過對計算機系統技術的運用,在一定程度上能夠減少生產經營的成本,提高對信息處理的速度。系統管理技術是針對系統內部而言的,改進和完善計算機吞吐能力,規范化和簡化操作的流程,加快了信息處理的速度。計算機技術的進步加快了各個領域對計算機系統的應用,通過整合聲音、文字、圖像、視頻等信息,建立健全的系統體系模式。目前計算機技術的發展逐漸涉及到處理個人數字的層面,隨著技術的不斷進步和發展,所有的信息不再受時間和空間的限制,對該技術的使用更加的廣泛。同時計算機技術逐漸向集成化、精細化、微型化、多元化等方面發展,注重提高該技術的適用性和實用性,加快信息化時代的發展。
4 結語
由此可見,計算機技術給人類社會的發展和進步發揮出了積極的促進作用,逐漸深入到人們生活和工作的各個領域當中,提高了人們生活和工作的便捷程度??偟膩碚f,計算機技術已經深入到人們生活和工作的各個領域當中,人們也在不斷的增加對該技術的研究力度,在研究方面不斷的實現技術上的進步和突破,這對計算機技術本身就起到了極大的促進作用。就目前來說,計算機技術的發展前景十分的廣闊,應用的領域也在不斷的增加,這在提高計算機技術水平的同時,也能夠促進人類的進步和發展。
參考文獻
[1]侯玉芬.淺析計算機網絡技術的未來發展和應用[J].無線互聯科技,2013(03):23.
[2]王吉,張品.淺析計算機控制技術的新發展及應用[J].數字技術與應用,2013(05):249.
[3]王藝潼.淺析計算機網絡技術的發展及應用[J].吉林廣播電視大學學報,2012(12):23-24.
[4]歐文吉斯.淺析計算機網絡技術的應用及發展[J].通訊世界,2016(06):12-13.
[5]覃偉賦.淺析計算機技術應用對現代物流企業發展進程的影響[J].西部交通科技,2015(01):74-77.
作者簡介
陳黎(1991-),男,四川省綿陽市人。大學本科學歷。現就讀于成都理工大學信息科學與技術學院計算機科學與技術專業。研究方向為計算機應用開發、算法研究。
計算機科學與技術研究方向范文6
關鍵詞:GATE;領域抽取
中圖分類號:TP391.1
隨著現代通信和傳播技術的不斷發展,信息巨量生產、高速傳播,人們被大量洶涌而來的信息所包圍。怎么從浩瀚如煙的信息海洋中快速、準確地找到所需要的信息成為當前信息處理的研究重點。
1 信息抽取與GATE框架
1.1 信息抽取。信息抽?。↖nformation Extraction,簡稱IE)是指從文本中直接抽取用戶感興趣的信息,以結構化的形式存入數據庫中,可供用戶直接使用或進行下一步的信息處理[1]。信息抽取是領域相關的,只能抽取特定領域或某些范圍內有限種類的信息。當有大量的文本需要閱讀處理的時候,信息抽取可以高效、精準地提取出所需要的領域信息。
1.2 GATE框架。GATE(General Architecture for Text Engineering)是英國Sheffield大學開發的,應用非常廣泛的開源性自然語言處理框架。GATE框架為信息抽取提供了基本平臺[2]。針對英文信息抽取,已經開發了基于該框架的應用實例插件ANNIE。ANNIE在英文信息抽取的準確率和召回率方面均已達到較高水準,并被一些商業公司使用,如惠普、大英電信等。
2 基于GATE的中文領域信息抽取
2.1 GATE中自帶的中文信息抽取插件。GATE平臺除了提供英文信息抽取插件ANNIE,也提供了中文信息抽取插件Lang_Chinese,但其設計比較簡單。以中文插件Lang_Chinese的默認設置對文本進行抽取時,如希望能抽取出需要的領域信息,如在“教育”領域希望抽取出“學校”等組織單位,“校長”等人員信息,則結果不能讓人滿意。
分析其中的原因,主要有以下幾點:(1)中文分詞處理不夠專業。(2)缺乏針對專業領域構造的中文詞表庫。(3)GATE中自帶的JAPE抽取規則,多是針對英文命名實體識別編寫,對中文支持不夠,導致相當部分的中文不能被識別到。
2.2 改進的GATE中文領域信息抽取。本研究選取Gate7.1為開發平臺,針對其中文信息抽取插件Lang_Chinese的不足,面向“教育”領域,研究了改進的方法。下面就其中的關鍵技術予以介紹:(1)文檔預處理。本研究采用中科院計算技術研究所開發的ICTCLAS分詞系統對文檔進行分詞預處理。本研究將分詞后的文檔刪去詞性信息,將分開的詞組使用空格隔開,這樣就和英文的格式相同,每個分開后的詞語可做為一個Token,便于GATE抽取。(2)增加領域詞表。詞表是GATE進行信息抽取的重要資源,詞表的豐富完整影響著命名實體的識別效果。Gate中的詞表用.lst文件表示,中文組件中自帶有城市名、組織名、公司名等。然后這些詞表名存在.def索引文件中供匹配訪問。(3)修改JAPE規則。GATE中使用JAPE規則來實現命名實體的識別。本文針對中文“教育”領域,編寫對應的JAPE規則,使得該領域的命名實體能夠得到準確的識別抽取。
學校識別。GATE7.1中可以使用自帶unversity.lst詞表將部分大中專院校識別為組織(organization),但對眾多的中小學無法識別。并且組織標注集含義廣泛,學會、公司、政府機構等都會被識別為組織。為了更有針對性的進行識別,本研究新增學校(school)標注,并分別針對中小學、本??圃盒<捌渌黝悓W校撰寫相應的規則。
Macro:PRIMARY_HIGH //定義識別中小學的宏
({Token.string=="小學"}|{Token.string=="附小"}|{Token.string=="中學"}|{Token.string=="附中"}|{Token.string=="小"}|{Token.string=="中"})
Rule:primary_high
//識別中小學名,如北京第一師范小學,南京瑯琊路小學,山東師大附中等
(
({Lookup.majorType==location,Lookup.minorType==county_abbrev})
//county_abbrev.lst中存放了大量的地區名
({Token})?
({Token})?
({Token})?
//分詞后在地區和中小學之間可能出現0個、1個、2個或3個任意詞組
({Token.string=="師范"}|{Token.string=="師范附屬"})?
(PRIMARY_HIGH)
):school
-->
:school.school={kind=inferred,rule="primary_high"}
Rule:university
//識別本專科院校,如上海水產大學等
(
{Lookup.majorType == organization,Lookup.minorType == university}
):school
-->
:school.school={rule="unversity"}
Rule:school
//識別其他各類學校,如幼兒園,成人夜校等
(
{Lookup.majorType==school}
):school
-->
:school.school={rule="school"}
3 實驗結果及結論
對收集的“教育”領域文檔為例進行抽取,如圖1,可以看出本研究能精準的抽取出學校名、專業名、人名?;贕ate的領域抽取有效的提高抽取的召回率,快速準確地抽取出用戶感興趣的信息。
由于時間和精力的關系,本文的提出的中文領域信息抽取,未考慮到中文的詞性。本研究的下一步研究方向,是充分利用中文的詞性信息,編寫出更為精確的JAPE規則,進一步提高信息抽取的準確率和召回率。
參考文獻:
[1]原歡.基于GATE的貨物動態郵件信息抽取方法與應用研究[D].南京航天航空大學,2013.
[2]GATE HOME.https://gate.ac.uk/.
[3]馬續補,郭菊娥.基于GATE的任務信息抽取研究[J].情報雜志,2010(29):155-158+163.
作者簡介:陳曉紅(1981-),女,講師,碩士,研究方向:數據挖掘。