前言:中文期刊網精心挑選了生物信息學的認識范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。
生物信息學的認識范文1
關鍵詞 任務驅動;信息素養;課堂教學;多元評價
中圖分類號:G633.67 文獻標識碼:B
文章編號:1671-489X(2013)27-0102-02
信息社會,學生應該努力學習信息技術,掌握必備信息技能,提高信息素養,適應社會飛速發展。信息素養主要指獲取信息、加工信息、處理信息、利用信息、評價信息等含義廣泛的綜合能力。信息素養以信息技術教學為主要載體,以提高信息能力為最終目標。任務驅動是建立在建構主義理論基礎上的互動教學方法,它以問題動機為核心,以師生的互助協作學習為主,通過不斷自主探究完成學習任務,建構學生自己的新知識體系。那么,教師如何靈活應用任務驅動教學,激發學生主動學習,有效構建學生全面的信息素養呢?
1 創新問題情境是實施任務驅動教學的必要條件
英國科學家波普爾說過:“科學知識的增長永遠始于問題?!眴栴}不但是教師開展任務驅動教學的基本條件,而且是培養學生信息能力的必要條件。因此,教師需研究初中學生的年齡特點和心理特點,積極營造和諧愉快的學習氛圍,積極創新問題情境,啟發學生思維,激發他們主動探究問題的熱情,從而提高學生的信息能力。
如在教“電子賀卡制作”時,教師一上課就為學生創造寬松的情境:“同學們,今天是母親節,大家用什么方式來表達自己對偉大祖國母親的感恩之情呢?”學生爭著舉手發言,有的說用自己的努力學習來回報祖國母親,有的說長大后當一名合格的建設者……教師引導學生:“是否可以用電子賀卡來表達自己的祝福呢?”學生齊聲說可以。教師考考大家:“你們在日常生活中見到過的電子賀卡的制作方法有哪些?請同學們思考后問答?!眴栴}的設置情境開放,極具生活化,激發了學習興趣。
設置問題難易程度要適當,提出時機要恰當,讓學生有話可說。教師在上課時出示已經準備好的幾種紙質卡片,包括明信片、手工自制賀卡、印刷賀卡等,讓學生說說它們各自的特點。問題激發學生積極思考,圍繞問題,他們對賀卡的特點進行了熱烈的討論。教師順勢引導并歸納賀卡的特點,接著提出:“請同學們在PowerPoint中制作一張電子賀卡,并簡明扼要地概括制作過程?!睂W生很快通過操作發現得出:只需要在幻燈片軟件中依次插入圖片、插入藝術字、插入邊框,然后修飾,就可以制作出一張圖文并茂的賀卡了。
教師采用幾個問題引導學生進行自主探究,自己發現答案,讓學生體驗到學習的樂趣。同時,教師及時的贊揚提高了學生的自信心,使學生獲得極大的自豪感和成功感,從而發展學生的信息能力。通過發現問題、分析問題、解決問題的學習過程,學生增強了學習主動性,調動了學習積極性,發展了創新思維。因此,作為教師,要善于創設問題情境,讓學生身臨其境,在師生和諧的課堂氣氛中有計劃開展預先精心設計的課堂教學任務,不斷提高學生的信息素養。
2 優化課堂教學是實施任務驅動教學的根本保證
信息技術教學的本質是提高和發展學習者的信息能力,因此,扎實開展有效的信息技術課堂教學是是實施任務驅動教學和發展學生對信息的綜合運用能力的根本保證。
2.1 營造溫馨的學習氛圍,創造和諧的任務環境
課堂教學是傳播信息意識和發展信息能力的主要陣地。在課堂中,學生通過師生交往、生生交往,有意識地接受學習信息。但這種學習方式要求學生對周圍的學習環境中的干擾信息有一定的屏蔽能力。教學實踐表明,不同的教學環境形成不同的學習氛圍,會影響學生的心理活動,繼而影響學生的學習效率。因此,為了降低學生對周圍學習環境中無效學習信息的干擾,教師應該有意識地加強自身對信息意識的正確運用,最大化削弱不良、無效信息對學習的影響,用幽默的語言和自然的肢體動作,營造溫馨、自然、和諧的生態課堂。教師充滿教學熱情和富有感染力與表現力的語言,讓學生如沐春風,積極思考問題,對問題樂于發表自己的看法,和老師、同學進行探討交流,從而培養信息素養,為順利實施任務驅動教學創造和諧的環境。
2.2 運用任務驅動教學優化學習,發展學生信息能力
在信息技術課中,傳統教學方式依靠單一的教學手段,以教師為課堂的主體,學生往往被動接受知識和操作技能,扼殺了學生的思維發展,背離了素質教育的初衷。如何優化教學方式,學生的學習才能更加有效呢?巴班斯基曾經提出最優化教學的4個重點:一是用最優化的觀點選擇教學方案,力求取得最優的教學效果;二是衡量學生實際的學習可能性;三是考慮現有教學條件和可能性,使教學任務和內容具體化,從中區分出主要任務,突出內容的重點;四是針對不同程度的學生,大體區分優、中、差三組,按最優標準,設計對各組不同學生的教學任務。
根據信息技術的特點,結合任務驅動教學方法,筆者從建構主義學習理論角度概括了任務驅動模式下開展有效教學的4個方面:1)明確任務目標和教學重難點;2)課堂學習重點培養學生積極探究和解決問題的能力;3)學生擁有豐富的學習資料;4)通過問題和任務整合學習資源,對學生的學習進行評價交流和反饋。在信息技術教學中,教師預先對教材進行分析,對學生的年齡特點和心理特點進行分析,然后采用對教學總目標圍而不打的辦法,層層分解,得到若干小任務,讓學生通過探究、思考,完成這些極具生活化和情境化的任務,最終攻破教學目標。
任務驅動教學方法打破了教師為主的傳統教學理念,實現了師生間學習過程的有效雙向互動。但是,在任務的設計中,教師還需注意兩個問題:1)確定任務目標,確定任務難易程度;2)在實施任務驅動教學的時候,要考慮學生的現有能力。
如在蘇教版初中信息技術上冊“有效獲取信息”一課中,對于有效獲取信息的途徑這個總的教學目標,分解成幾個小任務:1)思考蜜蜂跳什么舞是發現蜜源招呼同伴?2)請分組討論蜜蜂跳舞的含義?3)人們是如何發現蜜蜂跳舞規律?4)請同學們通過互聯網來重溫人類發現蜜蜂跳舞規律的過程及重大意義?5)如何才能在互聯網中快速找到蜜蜂跳舞內容的知識呢?6)請同學們談談如何有效獲取信息?教師明確了有效獲取信息這個總的目標后,緊緊抓住“有效”“獲取”兩個重點,分解出不同的任務讓學生完成,通過完成前4個任務,學生就能理解本課的重點獲取信息;通過完成5),學生掌握信息的有效獲取技術手段——搜索引擎;通過完成6),學生的知識技能、過程方法、情感態度等三維教學目標的各方面得到極大提升,學生感受到成功的喜悅之情。
3 養成質疑習慣是實施任務驅動教學的最佳方法
在倡導實現素質教育、創新教育的今天,教師在任務驅動教學中要堅持以生為本,學生自主探究學習為主,引導學生思考問題、發現問題、解決問題,反復驗證問題答案,培養學生的創造精神,提高學生的信息能力,而質疑習慣正是提高學生信息能力的最佳方法。比如在學習了幻燈片制作的工具PowerPoint的基礎知識后,教師布置兩項學習任務:完成簡單的文字或圖片的幻燈片;完成幻燈片背景的更改。任務分為兩個層次,第一個比較容易,學生能輕松完成;第二個任務則有不小的難度,學生需要通過分析問題,提出可能的方法。教師要鼓勵學生在操作中驗證自己的方法,實現幻燈片背景的更改。
愛因斯坦說過:“提出一個問題往往比解決一個問題更重要,因為解決問題也許僅僅是一個教學上或實驗上的技能而已。”
4 構建多元評價是達成任務驅動教學的最佳途徑
為了促進學生信息能力的全面發展,踐行以人為本的教育理念,任務驅動教學中信息技術的教學評價將堅持持續的多元化的動態評價策略,它側重發展學生在學習過程中的自我評價和自我完善,摒棄陳舊的死抱著成績的經驗主義觀點、一成不變的單一評價標準。構建多元化的評價使學生獲得了親身參與探索的體驗后的成就感,提高發現問題和解決問題能力,是學生展示自我信息能力的最佳途徑。
二者的區別體現在二個方面:1)傳統的評價方式,大都是終結性評價,難于體現對學生學習過程的科學評價,往往成為優秀學生的獨家展示,無法針對絕大部分學生的學習進行即時性評價,挫傷部分學生的學習積極性,不利于提高學生的信息能力;2)傳統的評價往往將學生對知識和技能的掌握情況放在評價的首位,忽視了學生的全面發展和個性差異,綜合能力評價和創造能力的評價內容相對偏少。而結合了傳統評價優點的過程性評價在任務驅動模式下應運而生,它對新課程三維目標中包含知識與技能、過程與方法、情感態度與價值觀幾個方面的要求在評價中都得到完整體現。
例如,在學習第1章第2節“有效獲取信息”后,學生學習了“搜索引擎的使用”,教師在任務完成結束階段設計了學生進行自我評價的問題:“我使用搜索引擎進行關鍵字檢索時使用的技巧有那些呢?”學生針對這個問題,從自身實際經驗出發,展開熱烈的討論,答案非常精彩豐富。通過對問題的積極評價,學生對自己的探究思路和思維方式有了新的認識,建立了自信,展示了能力,促進學習的發展。
作為新時代的教師,面臨著有差異學生共同提升信息素養和信息能力的需要。因此,教師要不斷完善任務驅動教學方法,不斷增強個人的教學業務能力,不斷提升教學水平,引導學生自主學習、學會學習,從而探索出培養學生信息能力的有效課堂教學思路。
參考文獻
[1]黃雯霞.中職計算機任務驅動教學方法的探究[J].新教育,2010(z1):110.
[2]張菊貴.信息技術與學科課程整合的目標、原則及教學模式的探索[J].中國教育技術裝備,2003(12):23-24.
[3]賈智榮.課改中信息技術教學方法的探討與實踐一則:“學導式+任務驅動式”教學法的應用[J].網絡科技時代,2007(13):103-105.
生物信息學的認識范文2
生物學科是一門實驗性較強的學科,其實驗教學對學生知識體系建立、能力發展的重要性不言而喻。但是有些生物實驗時空跨度大、有些涉及有危害的材料和試劑,因此難以在目前本科生實驗教學中實施。此外,還有一些實驗需要使用昂貴、精密儀器,其臺件數往往不能滿足本科生實際操作需要。因而現有的生物學真實實驗教學體系并不完整,影響了學生全面掌握生物學實驗技能、制約了學生綜合創新能力的發展。
隨著現代教育技術發展,采用虛擬仿真技術、計算機圖形圖像技術等生成逼真的實驗場景,可以在虛擬情境中完成真實情況下難以甚至不能實現的實驗內容。因此,虛擬仿真實驗教學資源的開發順應而生,虛實結合的新實驗教學體系為培養現代生物學創新人才提供保障。
一 虛擬仿真實驗教學資源建設的緊迫性
《國家中長期教育改革和發展規劃綱要(2010-2020年)》指出,“信息技術對教育發展具有革命性影響,必須予以高度重視”?!督逃畔⒒臧l展規劃(2011-2020》>要求推動信息技術與高等教育深度融合,創新人才培養模式。發展規劃還明確了建沒各級各類優質數字教育資源的工作目標,提出要遴選和開發1500套虛擬仿真實訓實驗系統。
教育部在建設國家級實驗教學示范中心加強實驗教學基礎上,進一步提出建設國家級虛擬仿真實驗教學中心,這一舉措具有重大意義。虛擬仿真實驗教學中心重點開展資源、平臺、隊伍和制度等方面的建設,形成持續服務實驗教學,保證優質實驗教學資源開放共享的有機整體。特別對虛擬仿真實驗教學資源的建設提出了具體要求:即以培養學生綜合設計和創新能力為出發點,創造性地建設與應用軟件共享虛擬實驗、儀器共享虛擬實驗和遠程控制虛擬實驗等優質教學資源,推動信息化條件下自主學習、探究學習、協作學習等實驗教學方法改革。
二 生物學虛擬仿真實驗教學資源開發的必要性
生物學是21世紀自然科學的重點學科之一,對人類社會的可持續發展具有重大影Ⅱ向。生物學也是一門實驗性學科,通過實驗教學,提升學生的觀察能力、發現問題和解決問題的能力,激發學生對生命科學研究的興趣和靈感,培養學生的創新能力和實踐能力。
然而,由于生命科學前沿理論和技術發展迅速、生物學實驗系統性強、時空跨度較大、操作較為繁復、某些實驗材料存在一定危險性以及某些實驗需要昂貴儀器等,造成目前本科生真實實驗教學資源的局限性,具體表現在:
因生物材料的生命特質原因,有些生物學實驗往往周期較長,如動植物的發育實驗、生態學的種群互做實驗、生物進化實驗等。在有限的實驗課時內,現有的真實實驗往往是片段的、不連續的,大尺度時空跨越的實驗內容基本沒有,造成學生知識體系和實驗技能的不完整。
目前的生命科學研究已經深人到在分子水平揭示生命現象的本質,相關的實驗過程往往是微觀的、抽象的,在本科生實驗教學中開展相關真實實驗一方面成本高、消耗大,一方面傳統實驗手段無法幫助學生直觀了解微觀抽象的實驗過程,從而影響實驗教學效果。
現代的、先進的實驗技術推動了生命科學發展,然而有助于學生理解前沿理論的實驗內容難度大、復雜程度高、往往需要使用昂貴的大型科學儀器設備,在本科實驗教學中難以廣泛實施,使得學生不能及時了解、跟進先進的實驗技術和理論知識。
生物實驗可能涉及傷害的、危險的、污染性的實驗內容,因為現有本科生真實實驗教學條件有限而不能實施。例如致病菌、病毒、血液樣品、同位素等等,涉及這些實驗材料和試劑的實驗內容在目前的本科生真實實驗教學中常常都是回避的,導致學生的知識結構不完整、不系統。
生物技術工藝實驗系統化程度高、周期長、成本大,在以往有限課時的本科生真實實驗教學中,僅能安排個別常規技術,難以完成完整的工藝流程。學生在工廠車間的實習也往往無法接觸企業的核心技術和工藝,只能粗略的瀏覽生產過程,沒有落實學生應用能力的培養,造成學生理論和實踐的脫節。
總之,現有的真實生物實驗的局限性在一定程度上限制了學生現代生命科學的視野、影響了學生對先進理論本質的認識以及系統知識體系的形成、制約了完整生物學實驗技能和綜合能力的培養、不能更好的促進學生科研創新能力和實踐能力的培養。
隨著生物科學的迅猛發展和人才培養要求的不斷提高,生物實驗教學的內容愈來愈豐富,要在有限的實驗教學課時內擴大教學量、提高教學質量和效率,必須對傳統生物學實驗教學內容和方法進行改革。虛擬仿真實驗作為真實實驗的重要補充和擴展,既有仿真性、經濟性、安全性的優點,又能保證生物學實驗的系統性、綜合化,與傳統真實實驗有機結合,可以使學生開拓視野,獲得更為全面的技能訓練,掌握完整的生命科學知識體系,對培養學生觀察能力、獨立思考能力、創新能力和實踐能力具有重要意義。
三 虛實結合的實驗教學新體系在綜合創新人才培養中的重要性
根據我校生物科學、生物技術專業人才培養目標,結合我校生物學學科特色,我校開發的虛擬仿真實驗教學資源可以概況為4個模塊:秦嶺生物學野外實踐能力培養模塊、現代生物學綜合創新能力培養模塊、生物學教師實驗教學能力提升模塊以及生物技術工藝仿真實訓模塊。虛擬仿真資源與現有的實際操作實驗教學項日相互融合和互補,搭建了較為完備的“分層次、多模塊、系統化”的本科生生物學實驗教學體系,使學生視野得到開拓,對生命現象過程認識更全面,對知識體系的掌握更系統,同時課題式的仿真實驗項目能點燃思維、激發興趣,加強了本科生的創新精神和實踐能力的培養。
陜西師范大學理科(生物學)基礎科學研究與野外實習基地被批準為國家級實踐教學基地,每年對全國甚至海外高校開放。然而因環境承載能力、后勤保障能力等因素限制,進入基地進行實習的學生有限。我們充分利用秦嶺資源,依托國家級野外實踐教學基地,對生物學宏觀性、時空大尺度實驗進行仿真,為學生提供了新的實驗資源和學習模式,學生可以在這個虛擬環境中開展現實中無法實現的大型野外生物實驗、生態系統實驗等。同時這些教學資源還可以共享給更多的來自全國各地的學生。
生命科學研究早已深入到分子水平。我們將細胞、分子水平的微觀生命反應可視化,將抽象的前沿理論和技術形象化,為學生提供了形象逼真的新型實驗教學資源,提供了以計算機為載體、信息技術為手段的新型學習方式。我們開發的虛擬仿真實驗教學資源運用現代信息技術、教育技術,將學科前沿、研究熱點及學院教師的科研成果引入實驗教學中,將真實的生物學實驗過程中極為迅速、經典技術難以跟蹤、肉眼甚至現代科學儀器無法觀察到的分子變化以及相互作用,借助計算機模擬實現其可視化,形象地描述以往無法給學生展現的微觀生命世界,使學生能更直觀的深刻理解產生生物實驗現象的本質與詳細過程。
生物技術、生物工程是生物學在人類社會的實際應用,有突出的價值和發展空間。以往學生進行生物技術、生物工程實訓需要進入藥廠、食品廠、酒廠等等的車間、工廠。因企業經濟效益和技術保密等,學生只能參與部分生產過程。運用現代信息技術將真實的生產過程引入實驗教學中,借助計算機模擬實際生產中昂貴的各種器械、成本高的運行過程,學生通過模擬操作和控制,直觀的體驗生物技術、生物工程的實際應用。我們為學生提供的生物技術、生物工程實訓新平臺,可以對學生系統進行產品研發、生產工藝的訓練,解決生物技術應用人’才實踐技能與生產實際脫節的瓶頸問題。
師范生的培養是我校的特色,生物學專業師范生因生物學這一個實驗性學科的特殊要求,必須在掌握生物理論教學能力的同時鍛煉實驗教學能力。而目前的現狀是我國54.4%的中學沒有專職生物實驗員,實驗前材料和儀器準備不充分;因生物實驗室和儀器設備短缺,能開出10個以上實驗項目的中學很少;還有11.8%的學校一直沒有開設生物實驗課程。師范生在進行教育實習的時候基本不會進行實驗教學的課程設計、課堂教學等實習內容。中學生物教學經典實驗的虛擬仿真,給生物學專業師范生搭建了中學生物學實驗室的真實情境,可以進行中學生物實驗課的模擬教學訓練,鍛煉了師范生的實驗教學技能。特別是基于這樣的虛擬平臺,多名學生可以同時在任何時間、任何地點、面向任何受眾進行教學模擬,并可以反復演練,充分反映了虛擬仿真實驗教學的高效性、便捷性和經濟性。同時,該平臺可以共享給在職中學教師進行繼續教育培訓;電可以共享給很多沒有實驗條件的中學,供中學生遠程登錄完成實驗內容等,重復發揮“虛擬仿真實驗中心”的開放共享特色。
四 虛實結合的實驗教學新體系的優點
我校生物學虛實結合的實驗教學體系的優點體現在:第一,緊緊結合我校生物科學、生物技術專業學生的培養目標和生物學各類實驗的特點,可以選擇特定的實驗模塊作為必修、或者選修的內容,發揮虛擬仿真實驗可視化、虛擬操作的功能,突破傳統實物生物實驗教學的固有局限性。第二,以傳統實驗的親歷性鞏固學生的事實經驗,以虛擬仿真實驗提升學生獲取科學事實的能力、拓展科學思維、鍛煉實踐能力,有效解決了現有生物學實驗教學資源局限性問題,為培養學生全面、系統的知識體系和合理、前瞻的技能體系開辟了新途徑。第三,虛擬仿真實驗所具有的普適性,使其輻射面廣、受眾廣泛。除我校生物學相關專業在校本科生、研究生以外,我校承擔的國家教師教育、西部教師培訓計劃等均可受益。同時,對在中學任教的生物學教師開放,提高其業務素質,服務我國基礎生物學教育。
生物學虛擬仿真實驗教學中心是我校生物基礎實驗教學中心的重要組成部分,以虛擬仿真的技術手段完成不可及、不可逆等實驗內容,以新型知識載體的形式和真實實驗相互補充,從而實現虛擬實驗與真實實驗協同育人、課內課外一體化的實驗教學新體系,探索了虛實結合的生物學實驗教學新模式,為培養現代生物學綜合創新人才奠定了基礎。
參考文獻
[1]國家中長期教育改革和發展規劃綱要工作小組辦公室.國家中長期教育改革和發展規劃綱要(2010-2020年)[Z].2010.
生物信息學的認識范文3
生物信息學主要由基因組學、蛋白質組學、系統生物學、比較基因組學、計算生物學等學科構成,主要涉及的內容有生物數據的收集、存檔、顯示和分析,體外預測、模擬基因及蛋白質的結構和功能,對生物的遺傳基因圖譜進行分析處理,對大量的核苷酸和氨基酸序列進行比對分析,確定進化地位等。從生物信息學的概念及其涉及的內容中可以明確生物信息學不是一門獨立的學科,所以要求教師在教學過程中掌握多領域的知識和技能,才能較好地把握該課程。
1.高等數學和統計學基礎
生物信息學將數學和統計學作為主要的計算理論基礎,主要包括數學建模、統計方法、動態規劃方法、數據挖掘等方面。此外還包括隱馬爾科夫鏈模型(HMM)在序列識別上的應用,蛋白質空間結構預測的最優理論,DNA超螺旋結構的拓撲學,遺傳密碼和DNA序列的對稱性方面的群論等。因此,在生物信息學教學過程中要求教師具備數學及統計學的計算方法的基礎知識,能夠利用牛頓迭代法、線性方程回歸分析、矩陣求擬、最小二乘法等進行數學建模和計算,從而對基因和蛋白質序列進行比對、進化分析和繪制遺傳圖譜等。
2.生物科學基礎
生物信息學包含的生物類學科有,生物化學、分子生物學、遺傳學等基礎學科,基因工程、蛋白工程、生物技術等應用學科。根據其課程特點,學生在學習生物信息學課程前需要學習生物化學、分子生物學、遺傳學、基因組學、蛋白質組學等基本生物學課程,對于基因序列、蛋白質序列、啟動子、非編碼區等概念有深刻的理解,同時需要對一些重要的生物學數據庫有一定的了解,如美國基因數據庫(GeneBank)、歐洲分子生物學實驗室數據庫(Embl)和日本核酸數據庫(DDBJ)等。此外,要求學生能夠利用生物學數據庫查找基因序列、蛋白質序列、基因及蛋白質結構模型,能夠讀懂數據庫中基因和蛋白質的信息注釋,能夠計算蛋白質序列的分子量和等電點,能夠為擴增特定的基因片段設計引物,能夠對特定物種進行系統發育分析等。
3.計算機科學基礎
計算機是生物信息學的主要輔助工具,利用生物信息學研究生物系統的過程需要能夠熟練使用計算機對大量的生物信息數據進行處理和分析,這主要包括對數據信息進行搜索(收集和篩選)、處理(編輯、整理、管理和顯示)及利用(計算、模擬)。所以,學生在學習生物信息學的過程中需要了解和掌握一些常用的生物信息學軟件,如BLAST和FASTA序列比對分析軟件,Oligo和Primer引物設計軟件,VectorNTI、DNASTAR、DNASIS等綜合分析軟件。此外,學生還需要學習和掌握一些常用的計算機語言,如正則表達式、Unixshell腳本語言和Perl語言。利用生物信息學在處理和分析海量生物數據的過程中,計算機軟硬件資源需要配合處理分析軟件的運行,因此要求計算機操作系統使用Unix和Linux操作系統,這些操作系統需要大量的操作命令進行輸入執行過程,對于經常使用Windows操作系統的學生來說是一個較難跨越的障礙。
二、生物信息學課程教學中存在的問題
目前國內大多數高校的生物信息學教學采用傳統的教學模式,即以課堂式的理論教學為主,缺乏必要的實踐教學。理論教學模式固定、教學方法單一、教學內容狹窄,通常是介紹性、科普性的課程,甚至作為公選課程。少數高校開展生物信息學的實踐課程教學,但多以驗證性實驗為主,缺乏和專業相適應的綜合性、設計性實驗,而開放性實驗更無從談起。
1.教學模式固定單一
生物信息學在內容層面涵蓋諸多學科領域,注重應用性和實踐性。然而,目前大部分高校把生物信息學作為一門孤立的課程,這導致教師需要將大多數課程內容壓縮到一門課程進行教學,在有限的教學時數下灌輸大量內容,增加了學生學習的難度,降低了教學質量。再者,大多數高校僅開展生物信息學的理論教學,忽視實踐教學過程,造成生物信息學理論與實踐內容的脫節,使學生在學習完理論知識后難以深入理解和吸收,無法將所學的知識應用到后續的工作和學習中,最終未能體現出該門課程的價值。
2.教師專業背景薄弱
作為一門交叉學科,生物信息學的教學要求教師具有較強的數學、生物學和計算機科學背景。然而,目前從事生物信息學教學的教師即便具備深厚的生物學背景,但是多數教師在數學和計算機方面較為薄弱,并不具備完整的生物信息學知識體系,對生物信息學發展趨勢也了解不多。在師資缺乏的情況下,院系開設生物信息學課程,教師為了完成教學任務,僅僅在教學中進行介紹性的講解,在課程考查方式上通過小論文、綜述和課外活動等方式完成該課程的學習。因此,無論是理論教學還是實踐教學均無法實現該課程大綱的要求,從而影響學生對生物信息學課程的理解和掌握,生物信息學的實踐操作能力更無從談起。
3.實踐教學薄弱,專業教材缺乏
生物信息學實踐課需要學生在網絡環境下用計算機學習NCBI數據庫的檢索與使用、序列比對分析軟件的應用、蛋白質空間結構圖視軟件的應用、序列拼接軟件的應用等。但是目前,大多數高校開設的生物信息學課程多以理論教學為主,實踐教學課時非常少或者為零,學生對于生物信息學課程的學習僅僅通過教材上抽象的文字描述進行理解和掌握,這導致學生在理論課中學到的知識無法在實踐課中進行驗證或操作,嚴重影響了生物信息學的教學質量,也偏離了教學大綱中強調的重在培養學生實踐操作能力的培養目標。另外,目前還沒有適用于生物科學專業的生物信息學教材。國內各大高校使用的教材多為國外教材的影印版或者中文翻譯版本,這些教材偏重介紹生物信息學的理論和方法,涉及的實踐內容較少,學生需要具有較高的相關知識才能接受和使用這些教材。因此,部分高校在生物信息學教學過程中往往使用自家編寫的簡化教材,從而造成生物信息學教學內容不統一,教學大綱混亂等情況。
4.實踐課程經費不足,實踐教學環境落后
當今,許多發達國家都很重視生物信息學的教學和研究,積極開展各種生物信息資源的收集和分析工作,培養大量生物信息學人才,為整個生物學的理論研究及其相關產業創新(主要是醫藥和農業)提供指導和支撐。國內對生物信息學的關注和認識起步較晚,其發展落后于國際發達國家。國家和高校對生物信息學的教學和科研資金投入力度不大,缺乏必要的儀器設備,生物信息學的實踐教學條件得不到保障,比如大多數高校的生物科學專業沒有相應的計算機實訓室,配套軟件也相對匱乏,落后于國際發展水平。
三、生物信息學教學模式改革的探索
1.修改理論和實踐教學大綱,編寫適用的實踐教材
根據當今生物信息學的發展方向,制定和修改理論教學大綱,除了引物設計、基因和蛋白質序列比對、基因和蛋白質結構功能預測等基本內容外,還需添加系統進化樹分析、聚類分析、蛋白質互作網絡譜圖等較為綜合的內容。另外,增加實踐教學課程比例,充實實踐教學內容,結合理論教學內容增加綜合性、設計性實驗,適當提供科研環境,鼓勵開展開放性實驗。目前國內并沒有系統的、專業的生物信息學實踐教材,因此針對高校生物科學專業方向的特點,聯合多學科領域(數學、生物科學、計算機科學)編寫相應的生物信息學實踐教材,在制定、修改實踐教學大綱和編寫教材的過程中結合學生的接受能力,由淺入深,多設實例和相關練習,使學生循序漸進的理解和掌握生物信息學的原理和方法,掌握更多的生物信息學工具。
2.緊密聯系科研、基于實踐問題開展教學
通過實踐教學把生物信息學教學與科研有機結合起來,能夠促進教學與科研的共同發展。在緊密聯系科研的過程中,采用基于問題的教學(PBL)方法,通過實踐教學環節,培養和訓練學生把所學的生物信息學的知識和方法應用于各種生物科學領域的科研活動中,通過解決實際問題訓練學生的實踐技能,從而促進教學與科研的雙重發展。例如,在生物信息學實踐教學中多加入生產和科研中遇到的經典實例,鼓勵學生利用相關的生物信息學軟件及相關的理論和方法解決問題。學生也可以選擇自己感興趣的課題,利用自己熟悉的、合適的生物信息學軟件和相關知識開展課題研究。此外,專業教師在指導學生課題研究的過程中還可以發現理論和實踐教學的不足,不斷的完善生物信息學理論和實踐課程大綱和內容,提高教學質量。
3.開展多學科實踐結合的教學模式
生物信息學屬交叉學科,包含了不同領域的專業知識和技能,為使生物信息學教學達到教學的目標,該課程教學需要采用多學科實踐結合的教學模式。多學科實踐結合的教學模式是指聯合不同領域、不同學科、不同專業的課程在教學的過程中結合生物信息學涉及到的知識和技能進行基礎性、鋪墊性教學。比如,在高等數學和統計學的教學過程中,針對生物信息學的需求,適當增加數學建模、統計方法、動態規劃方法、數據挖掘等方面的基礎內容,同時,開設實例實踐教學,使學生理解和掌握隱馬爾科夫鏈模型,牛頓迭代法、最小二乘法等方法的應用原理和規則;在生物科學專業課程設置上,尤其是實踐課程的教學過程中,結合生物信息學涉及的引物設計、序列比對分析、基因及蛋白質結構功能預測等方面開展相應的設計性、綜合性、開放性實驗項目,使學生了解和掌握基本的生物信息學原理及軟件的應用;在計算機科學的教學過程中,應根據生物信息學的需求,開設正則表達式、Perl語言、R語言等課程學習,以及增加Linux和Unix操作系統課程學習,使學生在學習生物信息學前打好堅實的基礎。值得注意的是,生物信息學課程與其他課程的開設時間和順序需要有一定的探索和評估,對于開設該課程的時間把握是開展多學科實踐結合的教學模式的關鍵因素。過早開設生物信息學則會導致學生在不具備相應學科基礎的條件下跨越式的接觸生物信息學,無法理解和掌握相關的知識和技能;過晚開設則會使學生學習了相關學科知識和技能后,由于課程銜接不緊,導致在學習生物信息學時出現理解滯后和無法適應的現象。因此,針對不同專業和學科的特點,根據具體情況進行統籌安排,使生物信息學和其他相關學科課程有很好的銜接和過渡,以確保和提高生物信息學的教學質量。
四、結語
生物信息學的認識范文4
>> 案例教學法在《生物信息學》本科教學中的應用 師范院校生物信息學教學的現狀分析 醫學院校生物信息學教學的探究 面向醫科院校生物信息學專業的Java教學實踐 面向生物信息學本科專業的《遺傳學》教學要點及模式探索 離散數學在生物信息學專業本科教學的開展研究 生物信息學中的機器學習 癌癥研究的生物信息學資源 生物信息學中的序列比對算法 師范院校生物信息學本科教學改革與實踐 生物信息學數據庫及運用分析 生物信息學專業MySQL數據庫課程教學方法探討 生物信息學在生物學研究領域的應用 醫學院校生物技術專業生物信息學教學探索 生物背景學生的《生物信息學》課程教學思考與探索 師范院校研究生生物信息學教學改革思考 農業院校生物信息學教學模式探索 探討醫學院校生物信息學創新實踐能力培養 中醫大數據下生物信息學的發展及教育模式淺析 大數據背景下的生物信息學教學探索 常見問題解答 當前所在位置:l)。此外,還有細菌、真菌、植物等分支數據庫。該數據庫也有搜索引擎,其內容詳細的數據記錄了DNA、轉錄產物、蛋白質和基因突變等信息,使用方便,記錄系統、完整,是了解基因結構和功能比較理想的數據庫[2]。
2.3 miRBase數據庫 microRNA是近年來發現的非編碼內源性小RNA分子,其功能主要是調節靶基因的轉錄后水平的表達,是近年來研究的熱點領域。miRBase數據庫更新快,包含miRNA序列數據、功能注釋、靶基因預測等多各方面,是存儲miRNA信息最主要的公共數據庫之一(http:///)。目前,新版本(Ver.21)收錄了223個物種28645個前體miRNA和35 828個成熟miRNA產物,所有數據均可以通過web界面檢索,而且通過與TargetScan鏈接,可以查閱miRNA的潛在的靶基因。
2.4 生物分子信號通路數據庫 信號通路一詞在高中生物就接觸到,到本科階段的《細胞生物學》課程中得以深入學習。據調查,對于本科生而言,他們對信號通路想理解和認識有限,掌握的信號通路都是不完整的。學生在學習時,可借助信號通路數據庫檢索的方式,搜索某基因所參與的信號通路,并且可以直觀的看到該基因在整個信號通路中的地位和作用。信號通路數據庫目前比較常用的是WikiPathways數據庫(http://)。該數據庫集成了主要的基因、蛋白質,允許整個研究者更廣泛參與[3]。該數據最大的特點是將基因之間的關系以圖形方式顯示,使學生直觀了解所感興趣的基因是如何參與到信號通路或生化代謝過程的。
3 常用生物信息學軟件及在線分析工具
3.1 DNA序列分析軟件 在生物科學本科教學過程中,很多課程如《生物化學》《分子生物學》《遺傳學》等,都涉及到DNA序列結構、基因突變等知識點,而且學生掌握到的更多都是一種朦朦朧朧,是懂非懂的知識點。因此,在《生物信息學》課堂上,當講到采用生物信息學軟件進行DNA序列分析時,學生產生了濃厚的興趣。DNA序列分析的軟件有很多,如:BioEdit,DNASIS,DNAStar,DNAClub,DNAMan等,相比較可知,就序列分析而言,我們認為DNAStar軟件最常用,且操作簡單,可視化功能強大,是地方本科院校學生的最佳選擇。
DNASTAR是基因組學、結構生物學和分子生物學領域中的一款綜合性序列分析工具軟件,包含可視化和序列編輯(SeqBuilder),序列組裝(SeqMan)、序列比對(MegAlign)、引物設計(PrimerSelect)、蛋白質結構分析(Protean)、基因查找(GeneQuest)和序列編輯(EditSeq)7個模塊,可用作DNA和蛋白質序列分析、序列重疊群拼接和基因工程管理等方面,目前,該軟件已被90多個國家的制藥,生物技術,學術和臨床研究人員使用。
3.2 RNA結構分析軟件 RNA包含tRNA,mRNA,rRNA和sRNA等多種類型,在蛋白質生物合成過程中起著非常重要的作用。他們的二級結構或高級結構會影響蛋白質合成的效率。因此,對于本科生而言,直觀的了解RNA的二級結構,對于掌握理論知識具有重要意義。RNA結構分析的軟件有如Mfold、RNAdraw和RNAstructure等多個軟件[4-5]。通過比較這些軟件獲得難易度、優缺點和使用復雜程度,我們發現Mfold已完成多次修訂,且實現了網上在線免費試用(http://unafold.rna.albany.edu/?q=mfold),輸出結果靈活多樣,結果直觀,是本科生用于RNA結構分析的最佳選擇。
3.3 序列比對軟件(在線工具) 序列比對也稱序列比較,通過該操作,可以將兩個或多個基因(或蛋白質)序列按照一定的規律排列,使學生直觀的觀察到序列的變異,從而確定序列之間的相似性或同源性。根據序列多少,可分為雙序列比對和多序列比對。序列比對的軟件或在線工具也有很多,其中多序列比對軟件有Clustal(ClustalX和ClustalW)、GCG、BioEdit、DNAMAN和DNAStar件包中的MegAlign等。在這里,適合本科生教學的軟件我們推薦MegAlign和DNAMAN。而兩序列比最常用的則是BLAST在線工具(http://ncbi.nlm.nih.gov/blast),它是NCBI開發的可免費非注冊使用的在線工具,可與NCBI的蛋白質數據庫和基因數據庫鏈接,也可用于蛋白質和基因序列的同源檢索,是本科教學中必須要用到的在線工具。
3.4 系統發育樹構建軟件 在生物進化過程中,細胞內的生物大分子(蛋白質、核酸)的一級結構的變化會出現變異(進化),而生物大分子進化速率相對恒定,我們可以根據生物大分子的序列信息構建系統發育樹,推斷生物進化歷史。系統發育樹構建的軟件有MEGA,PHYLIP,DNAMAN等。在分子進化相關的科學研究中,最常用的是MEGA(即Molecular Evolutionary Genetics Analysis),該軟件更新快(目前的最新版本為MEGA7.0 http:///),運行速度快,操作簡單,結果直觀。因此,在本科教學中,我們推薦MEGA軟件作為系統發育樹構建的軟件。
3.5 Expasy工具 ExPASy,即Expert Protein Analysis System,由瑞士生物信息學研究所維護的蛋白組學相關的在線實用分析平臺,整合了很多蛋白質數據資源和分析工具(http:///),涉及蛋白分類、蛋白質翻譯、結構預測、相似檢索、序列比對等。該在線工具可免費試用,是本科教學過程中值得推薦的分析工具。但是,該工具包數據量大,鑒于本科教學學時的限制,在教學過程中不宜細講,可以引入,讓感興趣的同學自學。
4 結語
隨著分子生物學和生物信息學的迅猛發展,生物信息學數據庫不斷完善,生物分析軟件越來越多,且各具特色??紤]到地方本科院校實際情況,我們介紹了以上的生物信息學數據庫和分析軟件(在線工具),并簡單總結了它們適合于地方性高校本科教學的優點,給出了合理選擇的參考建議,以期為地方本科院?!渡镄畔W》教學提供參考。
參考文獻
[1]Bethesda(MD).The NCBI Handbook[Internet]. 2nd edition[M].National Center for Biotechnology Information(US). 2013.
[2]Yates A,Akanni W,Amode M R,et al. Ensembl 2016[J].Nucleic Acids Res.2016,44(D1):D710-D716.
[3]Kelder T,van Iersel M P,Hanspers K,et al.WikiPathways:building research communities on biological pathways[J].Nucleic Acids Res. 2012,40(Database issue):D1301-D1307.
[4]徐思敏.RNA生物信息相關軟件概述[J].科技信息:科學教研,2008(14):398-399.
生物信息學的認識范文5
一、整合生物信息學的研究領域
盡管目前一般意義上的生物信息學還局限在分子生物學層次,但廣義上的生物信息學是可以研究生物學的任何方面的。生命現象是在信息控制下不同層次上的物質、能量與信息的交換,不同層次是指核酸、蛋白質、細胞、器官、個體、群體和生態系統等。這些層次的系統生物學研究將成為后基因組時代的生物信息學研究和應用的對象。隨著在完整基因組、功能基因組、生物大分子相互作用及基因調控網絡等方面大量數據的積累和基本研究規律的深入,生命科學正處在用統一的理論框架和先進的實驗方法來探討數據間的復雜關系,向定量生命科學發展的重要階段。采用物理、數學、化學、力學、生物等學科的方法從多層次、多水平、多途徑開展交叉綜合研究,在分子水平上揭示生物信息及其傳遞的機理與過程,描述和解釋生命活動規律,已成生命科學中的前沿科學問題(摘自:國家“十一五”生命科學發展規劃),為整合生物信息學的發展提供了數據資源和技術支撐。
當前,由各種Omics組學技術,如基因組學(DNA測序),轉錄組學(基因表達系列分析、基因芯片),蛋白質組學(質譜、二維凝膠電泳、蛋白質芯片、X光衍射、核磁共振),代謝組學(核磁共振、X光衍射、毛細管電泳)等技術,積累了大量的實驗數據。約有800多個公共數據庫系統和許多分析工具可利用通過互聯網來解決各種各樣的生物任務。生物數據的計算分析基本上依賴于計算機科學的方法和概念,最終由生物學家來系統解決具體的生物問題。我們面臨的挑戰是如何從這些組學數據中,利用已有的生物信息學的技術手段,在新的系統層次、多水平、多途徑來了解生命過程。整合生物信息學便承擔了這一任務。
圖1簡單描述了生物信息學、系統生物學與信息學、生物學以及基因組計劃各個研究領域的相關性。可以看出基因組計劃將生物學與信息學前所未有地結合到了一起,而生物信息學的興起是與人類基因組的測序計劃分不開的,生物信息學自始至終提供了所需的技術與方法,系統生物學強調了生物信息學的生物反應模型和機理研究,也是多學科高度交叉,促使理論生物學、生物信息學、計算生物學與生物學走得更近,也使我們研究基因型到表型的過程機理更加接近。虛線范圍代表整合生物信息學的研究領域,它包括了基因組計劃的序列、結構、功能、應用的整合,也涵蓋了生物信息學、系統生物學技術與方法的有機整合。
整合生物信息學的最大特點就是整合,不僅整合了生物信息學的研究方法和技術,也是在更大的層次上整合生命科學、計算機科學、數學、物理學、化學、醫學,以及工程學等各學科。其生物數據整合從微觀到宏觀,應用領域整合涉及工、農、林、漁、牧、醫、藥。本文將就整合生物信息學的生物數據整合、學科技術整合及其他方面進行初步的介紹和探討。
二、生物數據挖掘與整合
生物系統的不同性質的組分數據,從基因到細胞、到組織、到個體的各個層次。大量組分數據的收集來自實驗室(濕數據)和公共數據資源(干數據)。但這些數據存在很多不利于處理分析的因素,如數據的類型差異,數據庫中存在大量數據冗余以及數據錯誤;存儲信息的數據結構也存在很大的差異,包括文本文件、關系數據庫、面向對象數據庫等;缺乏統一的數據描述標準,信息查詢方面大相徑庭;許多數據信息是描述性的信息,而不是結構化的信息標示。如何快速地在這些大量的包括錯誤數據的數據量中獲取正確數據模式和關系是數據挖掘與整合的主要任務。
數據挖掘是知識發現的一個過程,其他各個環節,如數據庫的選擇和取樣,數據的預處理和去冗余,錯誤和沖突,數據形式的轉換,挖掘數據的評估和評估的可視化等。數據挖掘的過程主要是從數據中提取模式,即模式識別。如DNA序列的特征核苷堿基,蛋白質的功能域及相應蛋白質的三維結構的自動化分類等。從信息處理的角度來說,模式識別可以被看作是根據一分類標準對外來數據進行篩選的數據簡化過程。其主要步驟是:特征選擇,度量,處理,特征提取,分類和標識?,F有的數據挖掘技術常用的有:聚類、概念描述、連接分析、關聯分析、偏差檢測和預測模型等。生物信息學中用得比較多的數據挖掘的技術方法有:機器學習,文本挖掘,網絡挖掘等。
機器學習通常用于數據挖掘中有關模式匹配和模式發現。機器學習包含了一系列用于統計、生物模擬、適應控制理論、心理學和人工智能的方法。應用于生物信息學中的機器學習技術有歸納邏輯程序,遺傳算法,神經網絡,統計方法,貝葉斯方法,決策樹和隱馬爾可夫模型等。值得一提的是,大多數數據挖掘產品使用的算法都是在計算機科學或統計數學雜志上發表過的成熟算法,所不同的是算法的實現和對性能的優化。當然也有一些人采用的是自己研發的未公開的算法,效果可能也不錯。
大量的生物學數據是以結構化的形式存在于數據庫中的,例如基因序列、基因微陣列實驗數據和分子三維結構數據等,而大量的生物學數據更是以非結構化的形式被記載在各種文本中,其中大量文獻以電子出版物形式存在,如PubMed Central中收集了大量的生物醫學文獻摘要。
文本挖掘就是利用數據挖掘技術在大量的文本集合中發現隱含的知識的過程。其任務包括在大量文本中進行信息抽取、語詞識別、發現知識間的關聯等,以及利用文本挖掘技術提高數據分析的效率。近年來,文本挖掘技術在生物學領域中的應用多是通過挖掘文本發現生物學規律,例如基因、蛋白及其相互作用,進而對大型生物學數據庫進行自動注釋。但是要自動地從大量非結構性的文本中提取知識,并非易事。目前較為有效的方法是利用自然語言處理技術NLP,該技術包括一系列計算方法,從簡單的關鍵詞提取到語義學分析。最簡單的NLP系統工作通過確定的關鍵詞來解析和識別文檔。標注后的文檔內容將被拷貝到本地數據庫以備分析。復雜些的NLP系統則利用統計方法來識別不僅僅相關的關鍵詞,以及它們在文本中的分布情況,從而可以進行上下文的推斷。其結果是獲得相關文檔簇,可以推斷特定文本內容的特定主題。最先進的NLP系統是可以進行語義分析的,主要是通過分析句子中的字、詞和句段及其相關性來斷定其含義。
生物信息學離不開Internet網絡,大量的生物學數據都儲存到了網絡的各個角落。網絡挖掘指使用數據挖掘技術在網絡數據中發現潛在的、有用的模式或信息。網絡挖掘研究覆蓋了多個研究領域,包括數據庫技術、信息獲取技術、統計學、人工智能中的機器學習和神經網絡等。根據對網絡數據的感興趣程度不同,網絡挖掘一般還可以分為三類:網絡內容挖掘、網絡結構挖掘、網絡用法挖掘。網絡內容挖掘指從網絡內容/數據/文檔中發現有用信息,網絡內容挖掘的對象包括文本、圖像、音頻、視頻、多媒體和其他各種類型的數據。網絡結構挖掘的對象是網絡本身的超連接,即對網絡文檔的結構進行挖掘,發現他們之間連接情況的有用信息(文檔之間的包含、引用或者從屬關系)。在網絡結構挖掘領域最著名的算法是HITS算法和PageRank算法(如Google搜索引擎)。網絡用法挖掘通過挖掘相關的網絡日志記錄,來發現用戶訪問網絡頁面的模式,通過分析日志記錄中的規律。通常來講,經典的數據挖掘算法都可以直接用到網絡用法挖掘上來,但為了提高挖掘質量,研究人員在擴展算法上進行了努力,包括復合關聯規則算法、改進的序列發現算法等。
網絡數據挖掘比單個數據倉庫的挖掘要復雜得多,是一項復雜的技術,一個難以解決的問題。而XML的出現為解決網絡數據挖掘的難題帶來了機會。由于XML能夠使不同來源的結構化的數據很容易地結合在一起,因而使搜索多個異質數據庫成為可能,從而為解決網絡數據挖掘難題帶來了希望。隨著XML作為在網絡上交換數據的一種標準方式,目前主要的生物信息學數據庫都已經提供了支持XML的技術,面向網絡的數據挖掘將會變得非常輕松。如使用XQuery 標準查詢工具,完全可以將 Internet看作是一個大型的分布式XML數據庫進行數據瀏覽獲取、結構化操作等。
此外,數據挖掘還要考慮到的問題有:實時數據挖掘、人為因素的參與、硬件設施的支持、數據庫的誤差問題等。
一般的數據(庫)整合的方法有:聯合數據庫系統(如ISYS和DiscoveryLink), 多數據庫系統(如TAMBIS)和數據倉庫(如SRS和Entrez)。這些方法因為在整合的程度,實體化,查詢語言,應用程序接口標準及其支持的數據輸出格式等方面存在各自的特性而各有優缺點。同時,指數增長的生物數據和日益進步的信息技術給數據庫的整合也帶來了新的思路和解決方案。如傳統的數據庫主要是提供長期的實驗數據存儲和簡便的數據訪問,重在數據管理,而系統生物學的數據庫則同時對這些實驗數據進行分析,提供預測信息模型。數據庫的整合也將更趨向數據資源廣、異質程度高、多種數據格式、多途徑驗證(如本體學Ontology的功能對照)、多種挖掘技術、高度智能化等。
三、生命科學與生物信息學技術的整合
生物信息學的研究當前還主要集中在分子水平,如基因組學/蛋白質組學的分析,在亞細胞、細胞、生物組織、器官、生物體及生態上的研究才剛剛開始。從事這些新領域的研究,理解從基因型到表型的生命機理,整合生物信息學將起到關鍵性的作用。整合生物信息學將從系統的層次多角度地利用已有的生物、信息技術來研究生命現象。另外,由其發展出的新方法、新技術,其應用潛力也是巨大的。圖2顯示了生命科學與生物信息學技術的整合關系。
目前生命科學技術如基因測序、QTL定位、基因芯片、蛋白質芯片、凝膠電泳、蛋白雙雜交、核磁共振、質譜等實驗技術,可以從多方面,多角度來分析研究某一生命現象,從而針對單一的實驗可能就產生大量的不同層次的生物數據。對于每個技術的數據分析,都有了大量的生物信息學技術,如序列分析、motif尋找、基因預測、基因注解、RNA分析、基因芯片的數據分析、基因表達分析、基因調控網絡分析、蛋白質表達分析、蛋白質結構預測和分子模擬、比較基因組學研究、分子進化和系統發育分析、生物學系統建模、群體遺傳學分析等。整合生物信息學就是以整合的理論方法,通過整合生物數據,整合信息技術來推動生命科學干實驗室與濕實驗室的組合研究。其實踐應用涉及到生物數據庫的整合、功能基因的發現、單核苷酸多態性/單體型的了解、代謝疾病的機理研究、藥物設計與對接、軟件工具以及其他應用。
在整合過程中,還應該注意以下幾方面內容:整合數據和文本數據挖掘方法,數據倉庫的設計管理,生物數據庫的錯誤與矛盾,生物本體學及其質量控制,整合模型和模擬框架,生物技術的計算設施,生物信息學技術流程優化管理,以及工程應用所涉及的范圍。
四、學科、人才的整合
整合生物信息學也是學科、教育、人才的整合。對于綜合性高等院校,計算機科學/信息學、生物學等學科為生物信息學的發展提供了學科基礎和保障。如何充分利用高校雄厚的學科資源,合理搭建生物信息學專業結構,培養一流的生物信息學人才,是我們的任務和目標。
計算機科學/信息學是利用傳統的計算機科學,數學,物理學等計算、數學方法,如數據庫、數據發掘、人工智能、算法、圖形計算、軟件工程、平行計算、網絡技術進行數據分析處理,模擬預測等。生物信息學的快速發展給計算機科學也帶來了巨大的挑戰和機遇,如高通量的數據處理、儲存、檢索、查詢,高效率的算法研究,人工智能的全新應用,復雜系統的有效模擬和預測。整合生物信息學的課程設計可以提供以下課程:Windows/Unix/Linux操作系統、C++/Perl/Java程序設計、數據庫技術、網絡技術、網絡編程、SQL、XML相關技術、數據挖掘,機器學習、可視化技術、軟件工程、計算機與網絡安全、計算機硬件、嵌入式系統、控制論、計算智能,微積幾何、概率論、數理統計、線性代數、離散數學、組合數學、計算方法、隨機過程、常微分方程、模擬和仿真、非線性分析等等。
生物學是研究生命現象、過程及其規律的科學,主要包括植物學等十幾個一級分支學科。整合生物信息學的課程設計可以提供以下課程:普通生物學、生物化學、分子生物學、細胞生物學、遺傳學、分子生物學、發育生物學、病毒學、免疫學、流行病學、保護生物學、生態學、進化生物學、神經生物學、基礎醫學、生物物理學、細胞工程、基因工程、分子動力學、生物儀器分析及技術、植物學、動物學、微生物學及其他生物科學、生物技術專業的技能課程。
作為獨立學科的生物信息學,其基本的新算法,新技術,新模型,新應用的研究是根本。課程涉及到生物信息學基礎、生物學數據庫、生物序列與基因組分析、生物統計學、生物芯片數據分析、蛋白質組學分析、系統生物學、生物數據挖掘與知識發現、計算生物學、藥物設計、生物網絡分析等。另外,整合生物信息學的工程應用,也需要了解以下學科,如生物工程、生物技術、醫學影像、信號處理、生化反應控制、生物醫學工程、數學模型、試驗設計、農業系統與生產等。
此外,整合生物信息學的人才培養具有很大的國際競爭壓力,培養優秀的專業人才,必須使其具備優良的生物信息科學素養,具有國際視野,知識能力、科研創新潛力俱佳的現代化一流人才。所以要始終緊跟最新的學術動態和發展方向,整合學科優勢和強化師資力量,促進國際交流。
五、總結及展望
二十一世紀是生命科學的世紀,也是生物信息學快速不斷整合發展的時代,整合生物學的研究和應用將對人類正確認識生命規律并合理利用產生巨大的作用。比如進行虛擬細胞的研究,整合生物信息學提供了從基因序列,蛋白結構到代謝功能各方面的生物數據,也提供了從序列分析,蛋白質拓撲到系統生物學建模等方面的信息技術,從多層次、多水平、多途徑進行科學研究。
整合生物信息學是基于現有生物信息學的計算技術框架對生命科學領域的新一輪更系統全面的研究。它依賴于生物學,計算機學,生物信息學/系統生物學的研究成果(包括新數據、新理論、新技術和新方法等),但同時也給這些學科提供了更廣闊的研究和應用空間,并推動整個人類科學的進程。
我國的生物信息學教育在近幾年已經有了長足的進步和發展。未來整合生物信息學人才的培養還需要加強各學科有效交叉,尤其是計算機科學,要更緊密地與生命科學結合起來,共同發展,讓我們的生命科學、計算機科學和生物信息學的教育和科研走得更高更前沿。
作者簡介:
生物信息學的認識范文6
在1956年美國召開的首次“生物學中的信息理論研討會”上人們提出了生物信息學的概念[1]。近幾年,隨著人類基因組計劃(HGP)的迅猛發展,各種數學軟件以及生物分析軟件的出現,將之前積累的大量不同生物基因序列、蛋白質氨基酸殘基序列、不同生物種屬之間基因序列、蛋白質以及結構序列的保守結構位點進行整合,并據此建立了龐大的數據庫系統。而對于這些數據的分析,必須依靠計算機分析技術的不斷發展,所以就形成了一門由生物科學、計算機科學、信息科學、應用數學、統計學等多門學科相互交叉的學科——生物信息學技術[2-4]。
生物信息學的基礎是各種數據庫的建立和分析工具的發展。迄今為止,生物學數據庫總數已達500個以上。歸納起來可分為4大類:即基因組數據庫、核酸和蛋白質一級結構數據庫、生物大分子三維空間結構數據庫,以及以上述3類數據庫和文獻資料為基礎構建的二級數據庫[7]。常用生物信息學數據庫[8-10]:
European Molecular Biology Laboratory(EMBL)——歐洲分子生物學實驗室http://ebi.ac.uk/ebi_docs/embl_db/ebi/topembl.html
UK Human Genome Mapping Project-Resource Center(HGMP-RC)——英國醫學研究委員會所屬人類基因組圖譜資源中心 http://hgmp.mrc.ac.uk/default.htm
SeqNet:UK Node of European Molecular Biology Network(EMBNet)——歐洲分子生物學信息網http://seqnet.dl.ac.uk/default.htm
GenBank——美國國家生物技術信息中心(NCBI)所維護的供公眾自由讀取的、帶注釋的DNA序列的總數據庫http://ncbi.nlm.nih.gov/Web/Search/index.html
National Center for Biotechnology Information(NCBI)——美國國家生物技術信息中心http://ncbi.nlm.nih.gov/
DNA Databank of Japan(DDBJ)——日本核酸數據庫http://ddbj.nig.ac.jp/default.htm
Genome Sequence DataBase(GSD)——美國國家基因組資源中心維護的DNA序列關系數據庫http://seqsim.ncgr.org/default.htm
Online Mendelian Inheritance in Man(OMIM)——在線人類孟德爾遺傳數據庫http://www3.ncbi.nlm.nih.gov/Omim/searchomim.html
European Drosophila Genome Project http://edgp.ebi.ac.uk/default.htm
The Institute for Genomic Research(TIGR)——美國基因組研究所http://tigr.org/default.htm
The Sanger Centre http://sanger.ac.uk/default.htm
Swiss Institute of Bioinformatics(Expasy)http://expasy.ch/default.htm
GenomeNet(Japan)http://genome.ad.jp/default.htm
Australian National Genomic Information Service(ANGIS)http://morgan.angis.su.oz.au/default.htm
Bioinformatics and Biology Resources on the Internet http://aeiveos.wa.com/biology/index.html
List of other Genome Sites http://hgmp.mrc.ac.uk/GenomeWeb/default.htm
Brunel University Online Teaching Programme http://brunel.ac.uk/depts/bl/project/front.htm
Whitehead Institute for Biomedical Research(WI)http://wi.mit.edu/
WICGR(WI/MIT Center for Genome Research)http://www-genome.wi.mit.edu/
Cold Spring Harbor Laboratory(CSHL)——冷泉港實驗室http://clio.cshl.org/
SMI(Stanford Medical Informatics)http://www-smi.stanford.edu/projects/helix/
BNL(Brookhaven National Laboratory)——美國布魯克海文國家實驗室http://genome1.bio.bnl.gov/
Weizmann Institute of Science——以色列魏茲曼科學研究所 http://bioinformatics.weizmann.ac.il/
中國科學院上海生命科學院生物信息中心(BioSino)http://biosino.org.cn/
北京大學生物信息中心(CBI或PKUCBI)http://cbi.pku.edu.cn/
中國軍事醫學科學院情報研究所 http://bmi.ac.cn/bio/
1 生物信息學在寄生蟲基礎研究中的現狀
隨著HGP的開展[11-12],人體寄生蟲基因組研究也受到了廣泛的重視。1993年美國人類基因組研究中心對HGP 作了修訂,修訂后的HGP 將模式生物基因組列入了HGP的內容[13],認為通過對較為簡單的模式生物基因組的研究,可為人類基因的功能鑒定提供線索,并可從簡單的基因組分析入手建立技術積累經驗。人體寄生蟲是一類結構較簡單的單細胞生物如原蟲或多細胞生物如蠕蟲[14],是研究模式生物較理想的材料。因此,人體寄生蟲基因組計劃也已成為人類基因組計劃中模式生物基因組研究重要內容之一[15-16]。其中,基因序列測定和新基因的發現是人體寄生蟲基因組計劃的首要任務。目前應用生物信息學對下列人體寄生蟲基因組進行了研究[17-18]:
1.1 惡性瘧原蟲 基因組計劃開展較早,研究表明惡性瘧原蟲的基因組大小約30Mb,含15000~17000個基因。在GenBank 中已記載的惡性原蟲5031個基因順序資料中,有3755個為抗原/蛋白質的編基因序列。
1.2 利什曼原蟲 基因組大小約為35Mb,通過構建利什曼原蟲不同時期特異性cDNA文庫和長片段基因組文庫,已經獲得了2000多個EST 序列。
1.3 美洲錐蟲 基因組大小為55 Kb,已建立了標化cDNA 文庫,BAC 文庫和YAC 文庫?,F已完成了7000個EST序列的測定,3號和4號染色體序列已測定。
1.4 絲蟲 基因組大小為100Mb(以馬來絲蟲代表),至目前為止,在GenBank 中EST 序列已達到16500個,鑒定出新基因6000個,占預測基因總數的1/3。
1.5 碩大利什曼原蟲 已有約500個EST 序列進入數據庫,均是從含有引導序列的全長cDNA的5端測出的序列,對利什曼原蟲的目標是測出至少1500個新序列。
1.6 血吸蟲 基因組大小為270 Mb,估計基因數為20000個。血吸蟲基因組計劃始于1995年,早期研究工作主要是新基因的發現和繪制低分辨率的物理圖譜。目前在GenBank中已有的血吸蟲基因EST序列超過45900條,3500 個新基因已被鑒定,占基因總數的15%。
2 生物信息學在包蟲基礎研究中的應用前景
包蟲病是一個世界性的流行病,其防治工作倍受各國研究者重視。包蟲生活史復雜,同一包蟲的不同種株,以及在同一種株的不同發育階段,不同組織,甚至隨著環境的改變,其基因表達變化很大。目前有關包蟲的研究還不是很多,研究資源主要集中于研究包蟲單個基因的序列及其功能,隨著后基因組時代的發展,以及生物信息學的興起,包蟲的研究將從單個基因和功能向全基因組和功能研究轉變,從局部向整體轉變,從而使有目的地大規模研究疫苗和藥物相關基因成為可能。
目前,應用生物信息學在對血吸蟲的基礎研究中取得了很大的進展。這便給了我們一個提示,可以應用生物信息學對包蟲進行基礎研究。首先,可以通過生物信息學的相關網站得到目前已知的包蟲的基因或蛋白序列。目前報道包蟲的核酸序列共11106條[美國國立生物技術信息中心(NCBI)數據庫],見下表:
核酸序列線粒體
內核酸線粒體
外核酸總核酸
序列數Nucleotide5625321097相關EST01000210002GSS077 之后可以通過生物信息學相關工具做以下工作[19]:
2.1 基因功能預測 一個新基因得到后,接下來的工作就是尋找該基因的功能。序列同源比較是預測基因功能的第一步。利用同源比較算法,將待檢測的新基因序列從DNA和蛋白質序列數據庫中進行同源檢索后,就可以得到一系列與新基因同源性較高的基因或片段。這些基因和片段的已知功能信息就為進一步分析新基因功能提供了具有相當參考價值的導向。最主要的生物學數據庫是核酸、蛋白質序列數據庫及其三維結構數據庫[20]。
2.2 尋找蛋白質家族保守序列 通過同源檢索,尋找新基因中包含的該蛋白質家族的保守序列,為進一步深入研究其功能作好準備。多重序列同源比較,被用來尋找基因家族或蛋白質家族中的保守部分[21-22]。由于保守部分常常與家族成員的功能密切相關,蛋白質家族數據庫能夠幫助科學家更好地認識基因的功能。最具代表性的蛋白質家族保守序列的數據庫有PRINTS、BLOCKS、Sbase 和Prosite等。這些數據庫可以幫助我們把新基因所屬的蛋白質家族及其保守部分找出來,并提供該家族其他成員的結構和功能信息[23]。
2.3 蛋白質結構的預測 如果一個可能的新基因通過同源檢索后沒有同源性,就成為孤獨基因了。孤獨基因可以通過結構同源比較,尋找結構同源的基因或直接預測其高級結構來推測其可能的功能。有很多蛋白質高級結構數據庫提供結構同源比較的檢索[20]。
目前,在后基因組時代,研究者們面對的不僅是序列和基因,也有越來越多的完整基因組。對不同種株包蟲基因組之間的比較性研究很可能會得到大量有用信息,而對同一種包蟲生活史不同階段基因組的比較性研究可能會使人們對于該物種的認識更加深入。因此,隨著生物信息學的迅速發展和后基因組計劃的深入,包蟲的基礎研究必將得到極大地發展。人們能夠期望從對基因和基因的生物學功能研究著手,發現更有效的抗包蟲的藥物靶位或疫苗[24-25],并為徹底揭開包蟲的奧秘以及有效的治療與預防包蟲病打下基礎。
參考文獻
[1] 陳穎健.生物信息學[J]. 國外科技動態,2002,10(399):39-41.
[2] Ezio Bartocci,Flavio Corradini,Emanuela Merelli.BioWMS:a web-based Workflow Management System for bioinformatics[J]. BMC Bioinformatics,2007,8(Suppl 1):S2.
[3] Stephen H,Wefer Keith Sheppard.Bioinformatics in High School Biology Curricula:A Study of State Science Standards[J]. CBE-Life Sciences Education,2008,7:155-162.
[4] 馮毅.生物信息學在藥物研發中的應用與展望[J].西部醫學,2007,19(5):971-973
[5] 孫敏,馬月輝.生物信息學研究進展[J].家畜生態學報,2006,27(1):6-10.
[6] 汪凡軍.生物信息學在醫學上的應用[J].國際檢驗醫學雜志,2006,27(2):161-163.
[7] Yang Yong Mei.Application Development of Bioinformatics in Medicine Study[J]. Medical Recapitulate,2007,13(22):1681-1683.
[8] Michelle D,Brazas BF,Francis Ouellette.2008 update on the Bioinformatics Links Directory[J]. Nucl Acid Res,2008,36:W2-W4.
[9] Benson D,Karsch-Mizrachi I,Lipman D,et al.Gen-Bank:update[J]. Nucleic Acids Res,2004,6:23-26.
[10] Apweiler R,Bairoch A,Wu C,et al.UniProt:the Universal Protein knowledgebase[J]. Nucleic Acids Res,2004,6:115-119.
[11] International Human Genome Sequencing Consortium:Initial sequencing and analysis of the human genome[J]. Nature,2001,409:860-921.
[12] Pennisi E.The sequence of the human genome[J]. Science,2001,291:1173-1180.
[13] Collins F,Galas D.Human genome[J]. Science,1993,262(130):43-46.
[14] Alan F,Cowman Brendan S.Functional genomics:identifying drug targets for parasitic diseases[J]. Crabb Trends Parasitology,2003,19(11):538-543.
[15] Rick L,Tarleton Jessica Kissinger.Parasite genomics:current status and future prospects[J]. Current Opinion in Immunology,2001,13(4):395-402.
[16] David A,Johnston Mark L.Genomics and the biology of parasites[J]. BioEssays,2008,21(2):131-147
[17] Sara E,Melville Christiane,Neil Hall.Methods in Molecular Biology Parasite Genomics Protocols[M]. Humana Press,2004:
[18] Yvan Strahm,David Powell,Christophe Lefebvre.EST-PAC a web package for EST annotation and protein sequence prediction[J]. Source Code for Biology and Medicine,2006,(1):2
[19] Samuel Karlin.Statistical signals in bioinformatics[J]. PNAS,2005,102(38):13355-13362.
[20] Sebastien Ribrioux,Adrian Brüngger.Bioinformatics prediction of overlapping frameshifted translation products in mammalian transcripts[J]. BMC Genomics,2008,9:122.
[21] Catherine H,Schein Ovidiu Ivanciuc,Werner Braun. Bioinformatics Approaches to Classifying Allergens and Predicting Cross-Reactivity[J]. Immunol Allergy Clin North Am,2007,27(1):1-27.
[22] Chua Kek Heng,Rofina Yasmin Othman.Bioinformatics in molecular immunology laboratories demonstrated:Modeling an anti-CMV scFv antibody[J]. Bioinformation,2006,1(4):118-120.
[23] Omar J,Jabado Sean Conlan P. Comprehensive viral oligonucleotide probe design using conserved protein regions[J]. Nucl Acid Res,2008,36(1):10.