前言:中文期刊網精心挑選了人工智能醫療應用的重要案例范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。
人工智能醫療應用的重要案例范文1
關鍵詞:數據科學;通識教育;大數據教育;教學實踐
0 引言
近年來,在大數據的深刻影響和社會各領域對數據專業人才的強烈需求下,國內外各高校的數據教育興起,一些高校成立了專門的數據研究院,開設數據科學碩士和博士課程。盡管在高校開展數據教育的迫切性得到了重視,但是從結果來看,高校所培養的數據科學專門人才在數量上仍然無法滿足社會的需求。
通過調研世界范圍內相關高校的數據教育開展情況,我們發現,國外知名大學的數據教育開始得較早,采取的方式主要有數據科學通識教育和數據科學專業教育兩種;而國內高校數據教育起步較晚,數據科學的通識性體現得不明顯,主要培養對象還是相關專業的研究生。對比這兩種數據教育模式可知,在數據教育過程中,不僅需要專業教育,也需要通識教育服務于跨學科和交叉學科的發展,這樣才有利于復合型人才的培養,以應對“互聯網+”和大數據時代數據人才匱乏的窘境。
1 數據科學教育的發展現狀
數據技術的不斷發展和人們對數據價值的逐漸認同也推動了一個新的職業――數據科學家的誕生。微軟、谷歌、亞馬遜、Facebook、LinkedIn等數據驅動的公司這幾年紛紛向數據科學家們拋出橄欖枝,并且薪酬不菲。大數據同時也帶領人們重新認識了數據科學這一學科,數據科學不限于計算機和統計學的交叉,更不是它們的專利,在社會生活中的方方面面都有用武之地。紐約大學數據科學中心Vasant Dhar教授對數據科學是這樣定義的:“數據科學旨在研究可普及的數據知識提取”。數據科學教人們如何從數據的世界里發現知識、挖掘財富、獲得信息。數據思維和數據技術將成為學生未來學習、科研和職業發展的另一主要技能。
1.1 國內外數據科學在線課程現狀
在高等教育數據科學課程的開設方面,美國約翰霍普金斯大學、伊利諾伊大學香檳分校、加州大學伯克利分校等國外知名高校率先開展了行之有效的實踐,見表1。
在調研了Coursera、edX和Udacity三大MOOC平臺上的數據科學相關課程之后,不難發現一些現象:
(1)幾乎所有的數據教育課程都沒有限制學習者的專業,無論是人文社科類還是理工科的學生,只要具備課程的先修知識和對數據科學的興趣,都可以進行數據科學相關課程的學習。這是美國通識教育的體現,也說明數據科學可以作為面向交叉學科的課程來開展。
(2)課程的重點內容主要包括統計學、大數據、數據分析、項目實踐等,反映出數據科學培養目標不僅包括數學、統計和編程知識的學習,還需要案例實踐的訓練和業務洞察力的培養。
(3)國內大學的數據科學課程寥寥無幾,除表1中的復旦大學和香港理工大學之外,僅南京大學開設了“用Python玩轉數據”課程,臺灣大學開設了“機器學習基礎”“人工智能”等基礎課程,大數據教育相對落后。
(4)數據科學的先修知識主要包括程序設計、統計學、數據庫基礎等。其中程序設計并不要求精通某一門編程語言,因為對于從事數據科學的人才來說,泛型編程技巧比專長于特定編程語言更加重要。
(5)Python和R是目前在數據科學領域比較流行的編程語言,相對其他語言來說移植性較強,更容易學習,也更適合編程初學者學習。
1.2 國內外高校數據科學教育現狀
美國很多高校都已開設數據科學和大數據的碩士課程,并且畢業生可以有機會進入IBM、亞馬遜、英特爾等企業工作,獲得高達十幾萬美元的年薪。加州大學伯克利分校、哥倫比亞大學從2011年起開設數據科學課程,并在之后的幾年都設立了“數據科學”碩士和博士學位或者項目認證;伊利諾伊大學香檳分校和芝加哥大學則從假期培訓課程起步。這種情況并不局限于世界頂尖大學,全美排名100名左右的北卡羅來納州立大學,在2007年引入了學制為10個月的分析學碩士課程,其畢業生的就業薪資不菲。
在我國,北京航空航天大學于2012年設立了大數據工程碩士學位,2015年又攜手浙江大學、復旦大學等7所高校和阿里云公司開設了“云計算與數據科學”專業。華東師范大學于2013年成立數據科學與工程研究院,致力于培養未來的數據人才。清華大學于2014年成立數據科學研究院,與信息、經管等學院展開合作推出大數據碩士學位項目,不僅公開對外招生,也歡迎本校研究生選修。教育部公布的2015年教育部直屬高校新增審批專業名單中,北京大學、對外經貿大學、中南大學新增了“數據科學與大數據技術”本科專業。云南大學2016年也成立了大數據研究院,將培養大數據方向的博士和碩士生。
根據調研結果可以看到,世界頂尖大學的數據教育不但開始得較早,教育方式也具有層次性。一類是開展數據科學通識教育,面向全校各專業本科生和研究生,先修知識僅為數學、統計和入門級別編程。另外一類是數據科學專業學位教育,面向計算機、統計等相關專業學生,其中以碩士博士培養為主。后者的先修知識要求很高,并且在培養過程中以實踐技能為中心,往往采用校企聯合或校際聯合的培養方式,目標是為社會培養專業型數據人才。與之相比,國內高校的數據教育開展時間不長,尤其在通識教育和交叉學科發展方面經驗不足,多數的數據科學課程都是面向專業教育的。
2 數據科學課程建設的必要性
數據科學雖然看似是被大數據的浪潮“炒”熱的,其實不然。數據科學有著廣闊的研究領域和旺盛的生命力,具備獨特的結構和內涵。將數據科學作為一個學科是很有必要的,它培養的是數據思維和數據技術兼備的數據科學家、首席數據官、數據工程師等復合型人才。在專業技術方面,一個合格的數據科學家不僅需要掌握數學、統計學知識和編程能力,并且還要掌握機器學習、數據挖掘和數據可視化技能。在通用技能方面,他們要具備敏銳的業務洞察力和豐富的實踐經驗,從大量雜亂無章的數據中發現知識的蹤跡,找到相關關系,破解數據的價值。同時,溝通表達能力也是其必需的技能。數據專業人員應該了解非技術人員的實際需求,在獲得數據分析結果之后,用圖形或語言正確地傳達數據內涵,幫助非技術人員充分理解這些數據的意義。由此可見,數據科學家是需要學習多門專業知識的高端復合型人才,不僅需要具備科學家的嚴謹和創造力,還要具備較強的溝通表達能力。
集眾多能力于一身的優秀數據科學家不是一朝一夕可以“煉成”的,對未來數據專業人才的培養應該從高校數據教育抓起,打破學科固有的壁壘,為學生營造多學科交叉、融合的學習環境。高校數據科學通識教育的開展是充分必要的,具體體現在3個方面:
1)滿足社會需求,適應時展。
2011年麥肯錫曾這樣預測:“到2018年,僅美國就將面臨140000~190000的資深數據分析人才和150萬了解如何應用大數據分析結果做出有效決策的管理者的短缺”。無論是金融業、工業、制造業還是服務業,大數據時代稀缺的就是能從數據的整個生命周期來理解數據含義的專業數據科學家。高校作為培養人才的機構,應該順應時展的趨勢,以建設一流大學為目標,積極開展數據科學通識教育和交叉學科改革,組建跨學科的科研教學團隊。這樣一來,學科之間的壁壘被打破,學生們除了學習數據技術以外,還能夠開闊視野,提前接觸各個領域的業務知識,非計算機專業的學生也能有機會學習數據挖掘等大數據技術,有利于復合型數據人才的培養。
2)實施大數據人才戰略,驅動資源平臺的建設。
2015年,黨的十八屆五中全會提出要實施“國家大數據戰略”,標志著大數據戰略正式上升為國家戰略。結合國家的人才強國戰略來思考,各高校應當樹立起強烈的大數據人才培養意識,加強高校與企業、高校與高校之間的合作關系,通過舉辦大數據競賽、合作辦學等方式,建設數據教育資源平臺。2015年,EMC與上海交大合作舉辦了“EMC杯上海交大智慧校園數據分析大賽”,賽題分為校園餐飲消費分析和校園無線網絡流量分析,賽前為參賽者組織數據科學課程培訓。此次大賽不僅促成上海交大對校園卡消費數據和網絡流量數據的開放,也為參賽者提供了一個數據分析的實戰機會。百度、阿里、天貓等都與高校合作舉辦過類似活動,而很多比賽的金獎獲獎團隊的大部分成員都不是計算機或者統計專業的學生。這說明,數據科學教育并不應該局限在少數的相關專業,數據科學通識教育可以激發各專業學生的學習興趣,真正地支持國家的大數據戰略和人才強國戰略。
3)培養學生的數據思維和創新能力。
對于數據科學家來說,在實際的工作過程中,數據技術只是解決問題的一種手段,真正起驅動作用的還是他們的數據思維和創新能力。數據思維需要在長時間與數據密切接觸的氛圍里形成,一切分析結論、決策和預測都來源于真實的數據和縝密的邏輯判斷,而不是憑空猜想。學生通過在大學里學習數學、統計學和計算機能夠有效地培養數據思維,而這些課程都包括在目前國內外高校的通識教育之中。跨學科進行的數據通識教育還可以促進不同學科之間的了解、碰撞和協作。有時,數據科學家不僅需要具備優秀的專業技術,還要具備特定領域的業務知識和面對數據的靈感和直覺,這就是數據科學家的創新能力。學校里的跨學科交流開闊了學生的視野,他們未來就有能力根據一條條數據分析結果,提出富有創造力的解決方案。
3 面向通識教育的數據科學課程教學實踐
為了適應國家經濟社會發展的重大戰略和人才培養需求,吉林大學自2014年起積極構思具有層次性的數據教育方案。2015年,計算機科學與技術學院面向計算機專業本科生和軟件學院研究生開展了“大數據技術與應用”課程。同年,公共計算機教學與研究中心為經濟學院和金融學院本科生開設了“數據科學與大數據分析”課程。這些教學實踐分別針對專業教育和通識教育兩個層次設計,分本科生和研究生兩類教學對象,講授了大數據時代對于獲取、處理和展示傳統數據以外的“數量大”“速度快”和“非結構化”數據的新方法與新技術,培養學生的計算思維、數據思維和互聯網思維,使他們準備好迎接“互聯網+”時代的新機遇與新挑戰。
3.1 課程的具體目標
以為經管、金融類本科生設計的“數據科學與大數據分析”課程為例,它的主要授課對象是大學高年級非計算機專業學生,希望通過一系列的課程研究和改革,結合實際案例和實踐教學的方式,將數據教育植入現有的計算機基礎教育中。在這門通識教育類課程中,要著重為學生講授數據科學和大數據技術在科學研究、互聯網、金融、社會、醫療、商業和政治等多領域中的方法、工具和應用案例,培養學生解決實際問題的能力。
該課程的目標主要包括如下3個大的方面:
1)培養數據思維能力。
課程主要通過真實的數據項目實踐來培養學生的數據思維和項目分析能力。數據項目通常有其使命與目標,須與業務需求保持一致。學生通過調研和分析,總結出具有關鍵意義的數據需求,了解什么樣的業務問題可以轉化成數據問題,什么樣的數據是可以進行計算的,面對結構化、半結構化以及非結構化的數據,該選取什么樣的模型和工具進行計算。最終,當獲得數據分析結果后,學生還要結合專業領域的知識,思考如何把數據解決方案轉化為可執行的業務解決方案,讓決策者更清晰地閱讀數據,這同樣是本課程的關鍵教學環節。
2)提升技術應用能力。
該課程致力于提高學生的高級計算機應用能力。當然,學習之前需要有一定的互聯網、統計學、數據庫等背景知識。大數據涉及的不僅是數據分析,還包括數據挖掘、商務智能和新的技術與新的思維方式,而這樣的技術和思維方式,不僅可以提升學生的計算機技術應用能力,也將提升他們的專業能力和管理能力,甚至創新能力。
3)新的技術發展應用。
該課程綜合全面地介紹大數據背景下新的技術體系?,F有的計算機基礎課程、互聯網金融課程或電子商務課程在介紹大數據時,都是“普及性”和“雜志性”的介紹方法,該課程則不然,它通過案例教學讓學生在真實場景下應用大數據技術并解決實際問題,最后通過企業提供的真實數據,讓學生分組合作,將共同完成一個項目實踐作為最終考核。
3.2 課程的知識模塊設置
該課程的核心思想是為學生全面講述數據的整個生命周期,包括數據獲取、數據準備、模型建立、數據分析和挖掘、數據可視化,以及最終把數據解決方案轉化為可執行的業務解決方案的方法和過程。以實際案例讓學生了解數據處理的基本方法和生態系統,掌握使用相關工具及算法來解決學習、科研和工作中數據問題的綜合技能,重點培養學生的數據思維,并通過數據科學為學生連接自然科學、社會科學與信息技術。具體的知識模塊設置如圖1所示。
(1)問題發現:引導學生發現業務問題,思考解決這個問題所需要的領域知識,思考這個問題是否可以轉換成一個數據問題,培養學生數據思維和計算思維的視角與思考方式。
(2)數據準備:培養學生數據獲取的能力,并使其能夠進行數據清洗與整理,確定保留與丟棄的部分,保證處理前的數據質量。
(3)高級數據分析:在統計方法的基礎上學習高級的數據分析方法,培養學生模型建立的能力,使其掌握數據挖掘的基本思想和基本算法,并能夠使用相關工具進行高級數據分析和數據挖掘,發現知識。
(4)數據可視化:培養學生的圖表表達能力和“用數據說話”的能力。
(5)數據解決方案:讓學生闡釋結果,確定關鍵的發現,并找出價值。
(6)可執行的業務方案:讓學生通過數據模型的建立、分析與驗證獲得數據解決方案,并在此基礎上考慮業務問題和現狀,提出可行的業務方案。