前言:中文期刊網精心挑選了生物信息學的定義范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。
生物信息學的定義范文1
Shortliffe教授指出,醫生對于計算機和新技術越來越依賴就是其中一個重要問題。由于患者的個體狀況和疾病狀況千差萬別,醫生在診療過程中的邏輯推理也各有特色。但是,計算機的應用有可能削弱醫生和患者之間的和諧關系,使醫患之間的互動和整個診療過程變得呆板機械。在某些情況下,醫生不是根據自己的知識、經驗和邏輯對患者做出診斷,而是依賴于他們使用計算機的方式來做出判斷。實際上,計算機永遠不可能代替人腦,更不可能超過人腦。只有當計算機和人類的智慧與實踐相結合,才能發揮出真正的作用。
生物醫學信息學的定義
根據美國醫藥信息學會(American Medical Informatics Association, AMIA)的定義:Biomedical Informatics (BMI) is the interdisciplinary, scientific field that studies and pursues the effective uses of biomedical data, information, and knowledge for scientific inquiry, problem solving and decision making, motivated by efforts to improve human health.
生物醫學信息學(BMI)是一門研究如何有效利用生物醫學數據、信息和知識的跨學科科學,以滿足科學查詢、解決問題和制定決策的需求,并通過不斷的努力,推動和提高人們的健康。
生物醫學信息學的關鍵屬性
生物醫學信息學主要從事生物醫學數據、信息、知識的產生、存儲、獲取、使用及共享的理論、方法和過程的研究、開發和應用。
生物醫學信息學建立在計算機技術、通訊技術以及信息科學的基礎上,是IT技術在生物醫學領域上的應用。
生物醫學信息學在方法學上可以支持從分子水平到大眾水平的研究、推論、建模、模擬、實驗和轉化。覆蓋從基礎醫學、臨床科研,到臨床診療、公共衛生等多種生物醫學領域的研究和應用。
生物醫學信息學認為生物醫學信息的最終使用者是人。因此,社會科學和行為科學對于技術性解決方案的設計和評價,以及對于復雜經濟、倫理、社會、教育和組織架構的演進,起到了非常重要的影響作用。
BMI各應用領域的相互關系和區別
在生物醫學信息學領域有很多看似非常相近的術語和名詞,很容易被混淆和亂用,例如:信息學、醫學信息學、生物信息學、衛生信息學、生物醫學信息學、公共衛生信息學等等。如何理解這些術語?它們之間的區別和聯系又是怎樣的呢?
Shortliffe教授解釋說:生物醫學信息學是一門基礎性生物醫學科學,是一門應用潛力非常廣泛的科學。生物醫學信息學研究和發展的推動力,是生物學和醫學領域的臨床、科研和實踐中所遇到的各種問題。生物醫學信息學將生物醫學的理論和方法與計算機、信息和通訊技術相結合,以創新和發展新的方法和理論為目標。這些核心理論和方法包括數學建模、數據庫理論、認知科學、統計學、數據挖掘,自然語言處理等等,反過來又促進生物醫學科學和健康科學的研究、應用和創新。
生物醫學信息學理論、方法和技術首先被應用到臨床醫療、診斷和護理等臨床醫學領域,同時也被應用在牙科和獸醫學領域。這些領域關注的是患者個體,是以患者為中心實現臨床相關信息的采集、集成、共享和應用,因此被稱為臨床信息學。
與臨床信息學緊密聯系在一起的是公共衛生信息學,它的應用不是針對單一的患者個體,而是關注整個人群,以大眾健康和管理為目標。臨床信息學和公共衛生信息學共享了很多相同的方法和技術,這兩個方面結合在一起就是我們通常所說的醫學信息學。因此,生物醫學信息學不能等同于醫學信息學。
生物醫學信息學在生物學領域的應用,特別是在細胞生物學和分子生物學上的應用,主要關注的是細胞和分子水平的過程,這部分被稱為生物信息學。
生物醫學信息學在放射影像、圖像成像和分析、以及影像管理方面的應用被稱作影像信息學。影像信息學以組織和器官為主要對象,包括:放射影像、病理影像、超聲影像、皮膚病學、以及分子可視化等等應用領域。
據Shortliffe教授介紹,其實這些應用領域的邊際是非常模糊的,例如生物信息學和影像信息學相結合就產生了分子生物成像學;生物信息學和臨床信息學的結合形成了藥物基因組學,而臨床信息學和公共衛生信息學相結合則形成了大眾消費健康學。
BMI和HIT的關系
生物醫學信息學與計算機科學(軟件和硬件)、臨床科學、基礎生物醫學科學、流行病學、統計學、生物工程學、管理科學及認知科學與決策密切相關。
生物醫學信息學(BMI)與醫學信息技術(Healthcare Information Technology, HIT)有著密切的關系,但相互各有側重。BMI更偏重于BMI理論的研究、方法的建立、教學、以及這些理論和方法在生物醫學研究領域應用。其主要參與者是學術研究人員、科研機構及相關實驗室。而HIT則更偏重于應用,主要是把BMI的方法、理念以及研究成果與醫療臨床實踐相結合,并通過廠商開發成相應的醫療信息系統產品,供醫院和衛生行政機構使用。其主要參與者是醫療IT廠商、醫療臨床機構及衛生行政機構等。在美國,生物醫學信息學領域的學術組織是美國醫藥信息學會(AMIA),而醫學信息技術領域的學術組織是美國醫療信息管理和系統協會(HIMSS)。
加強生物醫學信息學教育和培訓
生物醫學信息學對于生物醫學研究、企業應用系統的研發、圖書館情報學和知識管理、公共衛生統計、生物技術和制藥、臨床實踐和管理、以及政府決策研究,都將發揮重要的作用。
但是,目前要真正把信息技術應用到生物醫學領域以及臨床診療中,還存在一個非常大的障礙,就是缺乏同時具備信息技術知識和生物醫學領域知識的復合型人才。因此,作為交叉科學的生物醫學信息學,要肩負起自己的使命,要為復合型人才的培養做出貢獻。各醫學院校和研究機構,在開展常規的生物醫學信息學學位教育之外,還應該積極開設信息學相關的培訓,為醫學生和護理學生提供雙學位課程。另外,要加強對醫藥衛生專業人員的信息學繼續教育,并積極為臨床醫護人員所進行生物信息學研究提供必要的支持和協作。
Shortliffe教授還指出: IT基礎架構(IT Infrastructure)一向被公認為是實現安全、有效、以患者為中心、及時、高效率和公平六個醫療目標的基礎。但是,臨床信息系統設計和實施40年來的經驗和教訓告訴我們:成功的系統不僅僅取決于技術,而更取決于人、文化和創新性的流程。
生物信息學的定義范文2
【關鍵詞】計算機應用;人工智能;生物信息學;數據挖掘技術
【中圖分類號】TP391
【文獻標識碼】A
【文章編號】1672—5158(2012)10-0078-01
一、生物信息數據庫的現狀及問題
在生物信息學的發展過程中,逐步建立起了大量基于網絡的生物數據庫,而且開發了眾多檢索工具,從而實現了生物信息數據的智能處理和綜合分析。生物信息數據在具有增長迅猛、更新及時、種類繁多等特點的同時,更表現出高度的復雜性、多樣性和不一致性。
隨著生物信息數據量的激增以及數據處理能力的復雜程度不斷提高,現有的生物信息數據庫已經逐漸暴露出許多問題。三大核酸數據庫依靠傳統方式交換數據,無法及時反應出其他專用生物信息數據庫的變化情況以及非核酸類數據信息。網上所提供的大部分數據分析工具采用面向問題的搜索方法,搜索效率隨著問題規模的擴大而降低,并且無法智能地對數據中存在的未知知識進行發掘。為此,在后基因組時代,需要將數據倉庫思想及智能數據挖掘技術運用到生物信息學領域中。
二、基于生物信息數據倉庫的數據挖掘技術
(一) 生物信息數據庫中的算法工具
在生物信息學中,基因比對是最常用和最經典的研究手段。在核酸序列或蛋白質序列之間進行兩兩比對,比較兩個序列之間的相似區域和保守性位點,尋找二者的相似形、同源性,進而探尋可能的分子進化關系,揭示序列中蘊涵的結構、功能等信息。數據挖掘主要存在以下幾種經典分析模式:關聯模式分析、序列模式分析、分類分析、聚類分析,其中關聯模式分析應用最為廣泛。
(二) OLAP和數據挖掘技術
傳統的針對數據庫的開發工具多為聯機事物處理模式,它主要是面向具體的查詢和統計,有著較為具體的應用目的。然而隨著越來越多數據庫的出現,數據量的迅猛增長,OLTP在數據資源的充分利用、為用戶提供有效支持和幫助等方面,則顯得力不從心。因此,基于數據倉庫的聯機分析處理以及數據挖掘引起了日益廣泛的關注和應用。OLAP是一種自上而下、不斷深入的分析工具。用戶提出問題或假設,OLAP則負責從上而下深入地提取出關于該問題的詳細信息,并以可視化的方式呈現給用戶。DM是一種決策支持過程和挖掘性工具,它主要基于人工智能、機器學習、統計學等技術,高度自動化地對原始數據進行分析,發現隱藏在數據中的模式,做出歸納性和預測性的推理。
(三) 基于生物信息數據倉庫的數據挖掘技術
實現數據挖掘的前提條件是必須具有海量數據,而這恰恰是數據倉庫的基本特點之一,二者緊密結合可以有效解決大量應用中出現的問題。在生物信息學領域,使用數據挖掘技術可以大幅提高研究人員的工作效率,改變原有的預測法;數據挖掘算法還可以結合生物信息專業領域的公式算法,根據研究人員的設想,對數據進行全面高效的分析。
基于數據挖掘等技術發展起來的智能決策技術具備了在生物信息學領域中大展身手的天賦,特別是基于海量數據的數據挖掘和開采技術更具有廣泛的需求和應用背景。另一方面,目前生物信息學的研究方法和發展情況,已經形成了較為完善的智能決策系統,成為數據倉庫和數據開采較為成功的應用案例。另外,現有各種生物信息應用分析軟件從一定程度上講,已經反映并且實現了數據倉庫及數據挖掘的思想和技術。
三、實現生物信息異地多源數據庫的綜合利用
(一) 建立基于Web的生物信息數據倉庫
基于現有的生物信息數據庫,運用數據倉庫思想,利用OLAP和數據挖掘技術,建立生物信息數據倉庫,是一種不需要大幅增加硬件設備以及物理裝置的前提下,實現基于Web平臺的生物信息集成與處理平臺的可行方案。設計一個基于Web的生物信息數據倉庫,其主要結構由五部分組成:外部數據源;基于Web的數據調度、傳輸;數據的變形整合;元數據規則、元數據管理;基于Web的綜合管理平臺。
DWBW以DDBJ/EMBI/GeneBank作為主要數據源,同時以其他主要的生物信息數據庫作為整個數據倉庫的基本數據源。通過分析數據庫結構和數據結構類型,建立DWBW的元數據規則。這樣,基于上述各種數據庫就可以建立起一個基于Web的虛擬數據倉庫,由于不存在一個物理上位于某地的存儲中心來保存這些數據,用戶面對的只是基于網絡的分布式虛擬的數據倉庫。其模型、算法的運行由專用的分析工具服務器來完成,而對于數據的調用和整理都是在源數據庫上進行的,根據不同用戶提交問題的不同,具體分析過程則由分配服務器交給服務器去完成分析,只是最終將結果返回請求分類服務器,顯示給用戶。
DWBW將通過統一的基于Web的頁面與用戶進行交互,在后臺則主要由請求分類服務器、Web服務器及專用分析工具服務器共同完成對問題的提交和分析,實現對數據倉庫元數據規則的理解,然后根據分類的結果,與相關分析工具進行匹配,將問題提交到相應的分析工具服務器進行處理。處理完成后返回給請求分類服務器,進而返回給提交問題的用戶。
(二) DWBW的關鍵技術
生物信息學元數據的抽取。數據的整理和抽取,是開發所有數據倉庫時所遇到的最難解決也是最具挑戰性的問題之一。將不同時期生成的大量歷史數據中的數據結構、字段的定義以及對象之間的關系等一系列的描述信息整理出來,并制定一套通用可行的規范,本身就是一個工作量巨大、難度極高的問題。因此,數據倉庫元數據的抽取整理,成為建立DWBW的關鍵問題。數據抽取、清洗、轉換和裝載過程與一般數據倉庫建立過程中的數據整理不完全相同,其數據具有規范性強,存儲結構相對簡單,轉換、裝載容易等特點。
虛擬生物信息數據倉庫的建立。虛擬生物信息數據倉庫實現對生物信息平臺相關數據的組織和集成,并且將不同主題的數據對象分別存儲到各個數據集市中,同時還將建立起部分有價值數據的在線OLAP數據庫。虛擬數據倉庫采用中間件充當數據中心,提供信息的訪問接口,對存貯在不同數據源的生物信息數據進行存取操作。由于虛擬生物信息數據倉庫一般不是針對實時數據進行分析統計,所以對于時間效率的要求不如一般查詢統計那么高,這就確保了開發處于不同物理位置數據源的虛擬DWBW具有可行性。同時,對于一般性的查詢比對等基本操作,不會影響其工作效率和準確性。
基于Web面向用戶的綜合平臺的開發設計。此平臺主要提供一個用戶操作的平臺,除了集成基因比對、功能預測、序列分析、基因提交等傳統的操作以外,還允許用戶對虛擬數據倉庫中的數據運用數據挖掘技術,提供更多的分析支持工具。
生物信息學的定義范文3
關鍵詞:信息論;哲學;本體論;自我
信息論的創始人申農為解決通訊技術中的信息編碼問題,提出通訊系統的一般模型,發表了《通信的數學理論》《噪聲中的通信》兩篇論文,從而奠定了信息論的理論基礎。他指出“信息論(狹義的)的基本結果,都是針對某些非常特殊的問題的,它們未必切合像心理學、經濟學以及其他一些社會科學領域?!盵1]因此,信息論分為廣義信息論和狹義信息論。狹義信息論即申農早期的研究成果為主,它以編碼理論為中心,主要研究信息系統模型、信息的度量、信息容量、編碼理論及噪聲理論等。廣義信息論又稱信息科學,主要研究以計算機處理為中心的信息處理的基本理論,包括評議、文字的處理、圖像識別、學習理論及其各種應用。維納認為“信息既不是物質,也不是能量,信息就是信息,不懂得它,就不懂得唯物主義。[2]”雖然維納并沒有給出信息的確切定義,但卻第一次將信息科學映射到哲學問題上。
此后,信息科學的發展沖擊了20世紀下半葉以來的哲學思想路線,重新開啟了對哲學形而上問題的探討。雖然從物理角度來說,信息是按照一定的方式排列組合起來的信號序列,它借助于某種介質作為通道來傳遞、加工和貯存。但是隨著現代科學技術的發展,信息科學技術建構起了全新的語言環境、精神環境,“把我們從對事物的直接領悟中順順當當地推到由邏輯間隔隔開的世界中[3]”,使“知識源保持著一種抽象的控制論意義下的距離[4]”,從而消解了現實中的語言涵義。而現代人類依靠網絡空間高速傳播的思想,將世界空間縮小,人們憑借大眾傳播媒介或個人或組織給予的信息來建構起世界的“腦海圖景”,并以此來判斷世界并給予回應。正如“洞穴”隱喻一般,真實移動的“實體”不再真實,而意識、信息構筑的世界更“實際”,真實的世界成為“符號的宇宙”。哲學家海姆認為虛擬現實表現為七大特征:模擬性、交互作用、人工性、沉浸性、遙在、全身沉浸和網絡通信。正統哲學都是基于客觀實在現實性范疇框架內的哲學,客體是意識的容器,在主體和客體之間具有明顯界限,而信息科學技術的發展,“電子化”的語言方式可快捷地掃描人的思想,意識的力量在某種程度上得以強化。由此,使我們不得不重新思考信息科學是否揭示并決定著我們對世界的認知和發問方式。
哲學本以人本意識為主,是自覺之自我的最高意識成就,它依賴于社會的發展而發展。在康德建立了系統完善的形而上學之后,尼采宣布了“上帝已死”,海德格爾對“自我”“存在”的考證也對人類自身發展做了完備的總結,維特根斯坦認為“哲學僅余下的任務是語言分析!”,似乎哲學沒落到只囿于語言這一狹小領域,但信息科學技術的發展為自我、本體等哲學概念提出了重新思考的空間。信息科學在自身運動、發展的進程中,呈現出自身歷史的反映、自身性質的規定、自身發展的種種可能性這三種自在、自為、再生的基本形態,這三種關于事物歷史、現狀、未來的間接存在凝結在一個具有特定結構和狀態的直接存在物中,這種直接存在的結構和狀態被凝結著它的間接存在所規定。也即是說,自我、本體等概念被信息科學尤指信息技術、互聯網這一間接存在所規定。方東美先生認為:“希臘人把時間的體系化成空間的體系,然后再就時間來看,表面上是有過去、現在、未來的實踐連續性,而這個過去、現在、未來,都可以化成現在的影像。換句話說,是把真實現在變成空間化的現在,這樣就便于把過去的影像納入了現在,把未來的影像也以前瞻的方式把它收到現實當中,然后以一個空間化的現在籠罩一切過去現在和未來”[5]。這樣一種“了解時間的不重要,才是智慧之門[6]”,因此,哲學關于“我”、“本體”、“存在”等概念的思考由時間、空間的三維方向轉向一維的趨向。
此外,分析哲學家卡爾納普對語義信息的關注,將申農的信息論引向人類領域,認為由于人的選擇、接受、記憶的選擇性存在,信息本身存在著解讀的很大不確定性和可能性,因此有主觀與客觀、低級與高級、自然與社會信息等之分。生物信息學認為生物信息包括遺傳信息、神經――激素信息、代謝信息和人腦信息等多方面。物理學家T.Stonier在《信息物理學》提出的“信息子”認為“有組織就必然有結構,有結構就必然有信息”。在信息N論中,信息不是具有“粒子性”的能夠構成世界的“本原”,而是具有演繹性的能夠生成世界的“生元”,信息的“生成”特性使世界本體成為一種過程本體,也就成了一個信息集合體。這些在信息論基礎上發展起來眾多交叉學科,如量子信息學、生物信息學、物理信息學等等,他們都試圖從信息主義解釋萬物緣由的本體論論調,暫且不論對錯,但其提供的視角也是一種哲學嘗試。雖然信息科學技術在某種程度上剝離了對生命的人文關懷,使其變得些許冰冷,但對一些哲學概念的分析給飄散在浩浩蕩蕩信息長流中的理論派別提供了一種更深層次、更基礎的思維范式,從而推及對人類、宇宙的認識。
(作者單位:四川省社會科學院研究生院)
參考文獻:
[1]鐘義信.信息科學原理[M].福建人民出版社,1988,26.
[2]N.維納.控制論[M].北京:科學教育出版社,1962,48.
生物信息學的定義范文4
關鍵詞:基因調控網絡;熵互信息;布爾網絡;反向工程
中圖分類號:TP393文獻標識碼:B
文章編號:1004-373X(2008)07-151-03オ
Reconstructing Genetic Regulatory Boolean Network and Dynamic Analysis
WANG Liqin1,2,ZHANG Ling2,LI Jiangeng1
(1.College of Computer Science and Technology,Beijing University of Technology,Beijing,100022,China;
2.Zhangjiakou Vocational College of Technology,Zhangjiakou,075000,China)オ
Abstract:This article first uses the method to establish the gene regulationnetwork model together by mutually the information theory and the Boolean network,and through explains with examples this method,correspondingly may infer many genes with this method to decide some or many genes expression value logical rule,according to the logicalrule establishment gene electric network which obtains,again to genelogic circuit network basis analysis logic circuit network method establishment gene regulation network dynamic transformation,thus regulative relations between analysis gene.
Keywords:genetic regulatory network;mutual information of entropy;Boolean network;opposite direction engineering
1 引 言
基因網絡的研究最初是在20世紀60年代,Rater 描述了控制原核生物的分子基因系統組織的特點。另一項研究是Kauffman通過簡單的邏輯規則研究基因網絡動力學,提出了簡單布爾網絡理論[1]。20世紀90年代實驗數據的增加,更加加速了基因網絡理論的研究。到目前為止已發展了很多研究基因網絡的方法,如隨機模型、布爾網絡、邏輯方法、門限模型以及基于微分方程的方法等[2]。全基因組測序后展現在科學家面前的是浩瀚的DNA序列信息,這就要求人們要“讀懂”他,也就是要了解基因是如何表達的,以及基因的表達是如何受到調控的,并在全基因組水平上系統闡述這些基因的表達調控規律,進而來揭示生命的奧秘。一個基因的表達受其他基因的影響,而這個基因又影響其他基因的表達,這種相互影響相互制約的關系構成了復雜的基因表達調控網絡(gene regulatory networks)。從表達譜數據出發,可以建立基因或蛋白質相互作用的網絡模型,這種方法也稱反向工程(reverse engineering)[3]。全基因組基因表達調控網絡的研究必將促進個性化醫療的發展和重大復雜疾病的預測和治療,并最終揭示出人類生老病死的奧秘。關于基因表達調控網絡目前人們做了很多研究,本文提出用熵互信息的數學理論尋求基因間關系的邏輯函數,有了基因之間的邏輯關系函數,就可以構建基因邏輯電路網絡(gene logic circuit networks),再利用基因邏輯電路網絡與邏輯函數得到基因在不同時間的基因狀態,由得到的基因狀態就可以畫出基因調控網絡的動態轉換圖,可以從基因調控網絡的動態轉換圖中研究網絡的變化,可以把此方法用在生物基因調控網絡的分析和研究中,尋找變異基因網絡與正?;蚓W絡動態變化的差異,試圖找到引起疾病的原因。本文提出一個新觀點,基因網絡可以分為抑制型和非抑制型兩類。提出一個新方法用邏輯電路網絡表示基因調控網絡,把邏輯電路的分析方法用到基因網絡的動態網絡分析中。
2 利用熵確定基因調控布爾網絡邏輯關系
要想構建基因調控布爾網絡,關鍵是找到基因之間的布爾邏輯關系函數,現在關于確定基因調控關系也是后基因時代的一個研究熱點,在這里考慮應用熵的互信息理論去尋找基因之間的邏輯關系函數。首先由基因表達序列(其中基因表達用1表示,基因不表達用0表示)根據下面所定義的公式得到熵與互信息熵,再由得到的熵與互信息熵確定基因之間的邏輯關系。
И
H(X)=-∑PXlog PX,H(Y)=-∑PYlog PY
H(X,Y)=-∑PX,Ylog PX,Y
M(X,Y)=H(X)+H(Y)-H(X,Y)
И
現在考慮三個基因X1,X2,X3У那榭觶利用熵互信息理論找到三個基因的邏輯關系函數,三個基因的基因表達序列(其中基因表達用1表示,基因不表達用0表示)如表1所示。
ケ1 基因表達序列
在表中X1,X2,X3為輸入基因表達,X1′, X2′,X3′為輸出基因表達,可以利用上面所提到的熵互信息公式得到基因X1,X2,X3,X3′的熵和互信息熵。
オ
H(X1)=1.00,H(X2)=1.00,H(X3)=1.00,H(X1,X2)=2.00,H(X2,X3)=2.00,H(X1,X3)=2.00,H(X1,X2,X3)=3.00,H(X3′)=1.00
И
有了基因X1,X2,X3的熵和互信息熵,下面詳細介紹尋找輸入基因X1,X2,X3與輸出基因X3′的邏輯關系過程:
H(X3′,X1)=1.81, M(X3′,X1)=0.19
M(X3′,X1)/H(X3′)=0.19
H(X3′,X2)=1.81, M(X3′,X2)=0.19
M(X3′,X2)/H(X3′)=0.19
H(X3′,X3)=1.81, M(X3′,X3)=0.19
M(X3′,X3)/H(X3′)=0.19
H(X3′,[X1,X2])=2.50, M(X3′,[X1,X2])=0.50
M(X3′,[X1,X2])/H(X3′)=0.50
H(X3′,[X2,X3])=2.50, M(X3′,[X2,X3])=0.50
M(X3′,[X2,X3])/H(X3′)=0.50
H(X3′,[X1,X3])=2.50, M(X3′,[X1,X3])=0.50
M(X3′,[X1,X3])/H(X3′)=0.50
H(X3′,[X1,X2,X3])=3.00
M(X3′,[X1,X2,X3])=1.00
M(X3′,[X1,X2,X3])/H(X3′)=1.00
И
由以上分析可以得到其邏輯關系為:
オ
X3′=(X1 and X2)or(X2 and X3)or(X1 and X3)
И
由同樣的方法可以得到:
И
X1′=X2
X2′=X1 or X3
И
其中:or為或邏輯,and為與邏輯。
上述介紹了用熵互信息理論找到基因之間邏輯關系的方法,通過用此方法編輯軟件可以對多個基因進行處理,找到基因之間的邏輯關系函數。有了基因之間的邏輯關系函數就可以構建基因布爾網絡,從而了解基因之間的關系。
3 基因布爾網絡的分析
基因布爾網絡[4,5]是一個有N個節點(基因),并且對每個節點如果給予i個輸入(用二進制0或1表示)在任意時間t被定義為xi(t),當xi(t)=0時基因沒有表達,xi(t)=1時基因被表達,全部輸入在時間t的表達水平可以用行向量表示x(t)=[x1(t),x2(t),…xn(t)]В任一節點的輸出依賴于所給定的布爾函數及其輸入節點的布爾值。該網絡類似一個被控制的布爾電路網絡所有的節點。同時受輸入和布爾函數決定,然后產生下一個狀態。
對于基因調控的布爾網絡從結構上應該認為可以有兩種:基因網絡分為抑制型和非抑制型兩類。
抑制型 [HTSS]該基因網絡表示為抑制型的(見圖1)。這是一種特殊的基因布爾網絡,每個基因只是單向傳輸的。對于這樣的基因調控網絡,可以用一個簡單的邏輯電路網絡來表示(見圖2),從邏輯電路網絡可以看到該網絡有4個輸入,1個輸出。其中cdk7與cyclinlt是邏輯與,P21/WAF1是一個邏輯非,到最后Rb輸出的是一個邏輯與非,到Rb輸出時網絡被抑制(2000年被Rzhetsky等提出)[6-8]。
圖1 基因調控
非抑制型 [HTSS]該基因網絡是未被抑制的,該基因網絡在時間t+1的狀態是由時間t提供的。假設一個三個基因的未被抑制型的布爾網絡用邏輯電路網絡來表示(見圖3)。其中三個基因滿足的邏輯關系可以用以下的邏輯關系函數式表示:
オ
x1(t+1)=x2(t)
x2(t+1)=x1(t) or x3(t)
x3(t+1)[WB]=(x1(t) and x2(t)) or (x2(t) and x3(t)) or
圖2 邏輯電路網絡
圖3 基因邏輯電路網絡
表2 邏輯真值表
依據真值表里的狀態可以繪制出邏輯狀態轉換圖(見圖4),進而就得到了基因調控網絡的動態轉換的過程。從得到的基因調控網絡的動態轉換的過程可以了解以下知識:
(1) 把系統經歷部分狀態,最后圍繞一個反復出現的狀態周而復始地進行的行為稱為狀態循環,在圖4中010,100就是一個狀態循環。
圖4 基因調控網絡動態轉換
(2)傾向于狀態循環,但又沒有處于循環之中的狀態稱為暫態,如圖4中001,101,011,110都屬于暫態。
(3) 吸引子是系統被吸引并最終固定于某一狀態的性態,在圖4中111就是一個吸引子。
(4) 流向狀態循環吸引子的狀態加上狀態循環合起來稱之為吸引子的吸引盆,在圖4中101到011到吸引子111,110到吸引子111就是一個吸引盆。如果吸引子的吸引盆區域越大,則說明吸引子有足夠的影響力,該吸引盆網絡的穩定性越強。
4 布爾基因調控網絡的進一步研究
根據給出的方法得到布爾基因調控網絡的邏輯關系函數,然后用得到的邏輯關系函數找到基因調控網絡的動態變化過程,根據動態變化找到基因的變化??梢钥吹饺魏我粋€基因發生變化或任何一個狀態發生變化,都會引起整個動態網絡變化??梢园汛朔椒ㄓ糜谏锘蚓W絡的分析,可以利用通過比較正?;蚓W絡動態變化與變異基因網絡動態變化,在基因調控網絡中找到引起疾病的原因。布爾基因調控網絡在確定過程中有時受基因表達的不準確性,導致得到的邏輯關系有問題。邏輯關系出現問題,后邊的邏輯狀態轉換過程有誤,不容易得到準確的結論,對于疾病的研究會帶來不準確性,再者基因調控網絡是一個動態網絡,本來就具有不確定性,所以為了更好地研究基因調控網絡,進一步的研究工作是用概率布爾網絡來解決基因調控網絡的不確定性。
參 考 文 獻
[1]Kauffman S A.The Large-seale Structure and Dynamics of Gene Control Circuits[J].Anensemble Approach.Theor.,44:167-190.
[2]雷耀山,史定華,王翼飛.基因調控網絡的生物信息學研究[J].自然雜志,2004,26(1):7-12.
[3]王正華,王勇獻.后基因組時代生物信息學的新進展[J].國防科技大學學報,2003,25(1):1-6.
[4]張國偉,邵世煌,張穎.布爾基因網絡及其研究[J].東華大學學報:自然科學版,2006,32(2):127-130.
[5]Davidson E.A Genomic Regulation Network for Development[J].Science,2002,295:1 669-1 678.
[6]Shmulevich I,Dougherty E R,Kim S.Probabilistic Boolean Networks:A Rule-based Uncertainty Model for Gene Regulatory Networks[J].Bioinformatics,2002,18:261-274.
[7]Pal R.Generating Boolean Networks with a Pprescribed Attractor Structure[J].Bioinformatics,2005,21:4 021-4 025.
[8]Rzhetsky A,Koike T,Kalachikov S.A Knowledge Model for Analysis and Simulation of Regulatory Networks[J].Bioinformatics,2000,16:1 120-1 128.
作者簡介
生物信息學的定義范文5
在北大校園里的英語角、同鄉會、文學社里,要是有人問起你是哪個系的,“生物系”,一聲嘎巴脆的回答,多半能激起一簇艷羨的眼光和嘖嘖的響聲。多半是因為老師和報紙都這么告訴我們:21世紀是什么的世紀?是生物學的世紀。直到在暑假回家的火車上,聽畢業班的生物師兄大聲調侃自身的命運:“只有兩個選擇:如不出國,那就只能去醬油廠”,滿車廂嘩然,才知道所謂“生物學的那個世紀”離我們遠著呢。
日后目睹在出國的隊伍中,生物系人流又分成最明顯的兩股:去IT,或去商學院。一位生物系同學,顯然更愿意活在19世紀,干脆在美國用英文專心寫起了小說,聲名斐然。
不過,“生物學”的21世紀,才來了8年,多一些耐心吧,在這第九個年頭的1月份大冷天,一位住在瑞士的富翁,準備花35萬美元,向美國的一家叫KNOME的公司購買自己的全基因序列。他成了KNOME的第一個客戶,據說也是全世界第二個花錢買自己基因序列的人。公司承諾他等開春了,就可以捧給他整個的基因序列。
花35萬美元,是買一件看得見、摸得著、可享受的奢侈品,還是買件“生物學”的奢侈品?這位年輕時的專業是醫學化學的瑞士富翁說,他“寧愿把錢花在我的基因組止,而不是賓利汽車或者私人飛機?!彼鴱牧_馬尼亞移民美國,成立了一家抗腫瘤藥物的公司。兩年前,他退休,說自己會每天“關注自己基因組中的那些有著高患病風險的遺傳疾病,就像每天關注股票投資的組合一樣”。如果能有一份自己的完整基因組序列,那再好不過。
眼前,這個生物學的世紀似乎已經拉開帷幕,它順帶著也開始顛覆了奢侈品的定義。開始有更多的公司,向達官顯貴們出售這件“生物學”的奢侈品――基因組測序。就像有人愿意花2000萬美元去趟太空旅行一樣,在先進技術到達蕓蕓眾生之前,總有一些人愿意提前向先進技術敬禮。Churclch博士曾在哈佛主持一間實驗室,在合伙加入KNOME公司之前,就常有一些人,懇求他能不能給自己測一測基因組。這促使了這位曾經正統的生物科學工作者,駛出學術,轉向商業。
但因為“賓利”的價位,正統的生物學界,還是出現了不少的擔憂之音。當基因組測序成了富貴者的特權時,是不是一種新的“基因組精英主義”誕生了?曾經公眾對遺傳學研究的支持和期待是不是變質了?那時,它曾許諾可以讓世上每個人變得更健康,不論貧富。Iames Watson曾因發現DNA雙螺旋結構而獲諾貝爾醫學獎,他也在一家公司的贊助下花150萬美元進行了自己的基因組測序。他也愛賓利車,但在賓利和自己的基因組之間,他也說會選擇后者,因為那些具有較高發病風險的遺傳基因,很可能會傳給下一代。不過,他更期待著:有一天,人人都能買得起“雪佛蘭”價位的基因組,而不是“賓利”價位的基因組。
總有人在“雪佛蘭”價位的基因組到來之前,急切地想認識自己。合伙加入KNOME公司的church博士,這樣讀他們公司名字的:“know-me”。而大多數人讀成了“mome”。有一剎那,那位瑞士富翁也擔心自己會成為負面形象,比如“以自我為中心”、“揮霍錢財”、“愚蠢到家了”,“我到底在干些什么?……在非洲有多少饑餓的兒童需要援助?”不過他還是伸出了自己的胳膊,讓KNOM-E公司抽取自己的血液樣本。
這項35萬美元的服務,內容包括了全基因組測序,之后,由資深遺傳學專象、臨床醫生和生物信息學家組成的隊伍,會提供給他一份全面的分析報告。但是。這報告只能限于目前知識的初步解讀。
生物信息學的定義范文6
關鍵詞 蛋白質組學;雙向電泳技術;植物
中圖分類號 Q75;Q945.7 文獻標識碼 A 文章編號 1007-5739(2012)20-0013-02
研究表明遺傳信息通過基因攜帶,但基因結構的相對穩定性、數量的有限性,與生命現象的多變性、復雜性存在明顯的差異[1]。為此,研究認為在所有生物體的細胞、組織、細胞器中,各種代謝反應、生理功能的維持均由各組成部分的表面、內部的蛋白質來完成。蛋白質組是Wilkin S等在1994年第1次提出的。1997年蛋白質組的定義被其創造者重申為:“蛋白質組指的是一個基因組所表達的蛋白質。”2000年人類基因組序列草圖的完成標志著“后基因組時代”的到來。蛋白質組學(proteomics)的概念最終被定義為“一個基因組、或一個細胞、組織在特定的生理和病理條件下表達的所有蛋白質”。蛋白質組具有特殊性和多樣性,其研究的三大核心技術分別是雙向電泳技術(two-dimensional gel electrophoresis,2-DE)、生物質譜技術和生物信息學[2-3]。其中,2-DE作為蛋白質分離的重要手段,是目前唯一可以在一塊凝膠上同時分離上萬個蛋白質的方法,且分離純度可達90%以上。
1 雙向電泳技術的歷史
雙向電泳技術自誕生以來,一直在不斷的發展、改進。1975年O`Farrell對大腸桿菌、老鼠及幾尼豬蛋白質的研究中首次采用了雙向電泳技術,稱為ISO-DALT(等電點-道爾頓)。其第一向是將載體兩性電解質(CA)添加到丙烯酰胺凝膠中,凝膠聚合后在電場作用下形成連續的pH梯度進行等電聚焦;第二向是聚焦后的凝膠在含有SDS的緩沖液中平衡后,用瓊脂糖包埋到垂直板SDS凝膠的濃縮膠上,形成不連續的SDS梯度凝膠電泳[4]。這種雙向電泳蛋白質由于上樣量低,溶解性較差,可能會造成負性部分堿性蛋白丟失。另外,兩性電解質在凝膠中擴散相對較容易,形成不夠穩定的pH梯度,造成分辨率低,重復性差,此為經典雙向電泳技術。
為克服經典雙向電泳技術中出現的問題,Gorg A 等于1985年研究出固相IPG-DALT(pH梯度-道爾頓)系統雙向電泳技術,該技術以固相pH梯度為基礎,使雙向電泳技術有了質的飛躍。固相pH介質是一類丙烯酰胺化合物,與聚丙烯酰胺共價結合后可形成一定范圍的pH梯度。與傳統的雙向電泳相比,IPG-DALT系統雙向電泳技術具有上樣量大、不產生陰極漂移、重復性較好、pH梯度穩定、分辨率高等優點。目前,IPG-DALT系統雙向電泳技術在各國應用廣泛。
熒光雙向電泳技術(fluorescent two dimensional differ-ential gel electrophoresis,DIGE)在近年出現,是雙向電泳技術的又一次飛躍,是一種對不同樣品間蛋白質差異表達進行系統分析的技術。主要用于大樣品蛋白質的差異鑒定。
2 雙向電泳技術的原理及步驟
2.1 雙向電泳技術的主要原理
雙向電泳技術是目前蛋白質組研究中最常用的蛋白分離平臺,是最高效、最直觀的復雜蛋白質組分離技術。它利用各種蛋白質具有不同的分子量、等電點(pI)分離復雜蛋白質組,分辨率、靈敏度較高。其原理為:首先通過電荷分離蛋白質,利用一向等電聚焦將蛋白質沿pH梯度分離至各自等電點;然后沿垂直的方向通過非連續十二烷基磺酸鈉-聚丙烯酰胺凝膠電泳,根據蛋白質分子量大小差別來達到分離的目的。所得的蛋白雙點是基于電荷分離和分子質量大小分離的正交組合,從而分布于整個二維凝膠圖譜上,每個點代表其中一個或數個蛋白質,而蛋白質的分子量、等電點在樣品中的含量也可顯現出來 。
DIGE的原理是將需要比較的樣品在電泳前用不同的熒光染料進行標記,被差異標記蛋白的等電點和相對分子質量基本不受影響,然后將其混合到一塊膠內進行分離,并用相應波長來檢測不同的熒光標記蛋白,最后用全自動蛋白質表達分析軟件進行分析。它的出現有效地提高了雙向電泳技術的重復性和定量的準確性。
2.2 雙向電泳技術的主要操作步驟
雙向電泳技術的體系較為復雜,通過多次摸索才能找到適合體系。IPG-DALT雙向電泳技術的主要操作步驟如下。
2.2.1 蛋白質的提取。蛋白質提取的質量直接影響雙向電泳試驗最終結果,不同植物、不同組織蛋白應采取不同的提取方法。
2.2.2 蛋白濃度的測定。采用Bradford法測定蛋白質濃度。
2.2.3 第一向IEF電泳。在進行一向等電聚焦前應將相應的蛋白質與水化液加入樣品槽,IPG膠條覆蓋在樣品上,最后覆上甘油。膠條水化時間應不少于12 h。
2.2.4 第二向SDS-PAGE。配制相應的凝膠電泳進行二向SDS-聚丙烯酰胺凝膠電泳。注意:等電聚焦電泳結束后應將其放入平衡液Ⅰ中,緩慢震蕩15 min。第1次平衡結束后,取出膠條,擦干凈背面的液體,然后放入平衡液Ⅱ,緩慢震蕩15 min。凝膠應在前一天晚上配,使其充分凝固;壓膠條時應避免膠條與凝膠之間產生氣泡。
2.2.5 顯色。SDS-PAGE電泳跑完后可用考馬斯法或銀染法染色。銀染法雖然分辨率高,但由于操作方法比較復雜,掌握較困難,且對后續質譜分析等產生影響??捡R斯亮藍法分辨率較低,但操作簡單,應用者比較容易掌握,是一種傳統的蛋白質染色法。綜合考慮,考馬斯亮藍法比較常用。
3 雙向電泳技術在植物蛋白質組學研究中的應用
3.1 雙向電泳技術在玉米蛋白質組學研究中的應用
Von Wiren等通過比較鐵攝取缺陷型、野生型突變體玉米的蛋白質雙向電泳圖譜,從中發現4個與鐵離子跨膜運輸有關的多肽。李冠軍等對干旱脅迫下玉米葉片蛋白質經行了雙向電泳分析,選出在3個時段下的干旱處理中均有誘導表達的3個差異蛋白點,經過對比分析,3個點的數據庫對比結果均達到顯著,最后得出結論,玉米可能通過葉組織的木質化,降低水分的散失量,使細胞膨壓得到維持,從而提高玉米的耐旱性。王彥玲等[4]利用雙向電泳技術對鄭單958及其親本在缺磷條件下進行蛋白質組學分析,得出鄭單958可能在磷脅迫的環境適應方面有雜種優勢。付忠軍等利用雙向電泳技術對親和性轉換前后花絲與花粉差異表達蛋白質經行分析,首先摸索到了適合自己的雙向電泳體系。最后得到了9個在不同親和階段表達差異的蛋白質點。朱畇昊[5]以玉米花粉為材料,建立了相應的玉米花粉雙向電泳體系,然后選擇成熟的花粉和離體萌發1小時花粉經行雙向電泳,得到28個差異顯著的蛋白點。
3.2 雙向電泳技術在水稻、小麥蛋白質組學研究中的應用
王經源[6]對汕優63及其雙親苗期第3葉蛋白質組進行定量比較,得到1 667個以上的蛋白質點。發現有23個蛋白質點在3個品系間存在顯著差異。丁 偉等用雙向電泳對水稻葉片全蛋白經行鑒定,發現與干旱等脅迫相關蛋白,且有4個是首次發現。陳衛衛等對耐高溫性差異明顯的3個品種作為研究材料,經雙向電泳分析及質譜鑒定,得出可能為水稻苗期耐高溫相關的鑒定蛋白。
朱 宏等以普通小麥葉片為試驗材料,通過優化雙向電泳的關鍵步驟,在小麥葉片可溶性蛋白的分析中獲得滿意的雙向電泳圖譜。劉 麗等利用SDS-PAGE、2-DE和MALDI-TOF-MS分析LMW-GS組成,建立了LMW-GS亞基的標準命名系統。孫正娟等以太谷核不育小麥不同時期的幼穗為材料進行雙向電泳,得出的結果表明不同時期表達的與育性相關的蛋白不同。
3.3 其他作物蛋白質組學中雙向電泳技術的應用
Kubis等基于DIGE蛋白質組學,闡明了前蛋白質輸入葉綠體的機制。Sybille在分離制備擬南芥葉綠體時,運用熒光差異凝膠電泳分析突變型、野生型植物葉綠體中蛋白的差異性。通過比對多種TOC易位子亞基的野生型和突變性擬南芥的葉綠體蛋白,探究各種易位子復合物對輸送蛋白類型的特異性。林金科等研究了茶樹芽葉蛋白質提取純化及雙向電泳技術的改進,探索出一種重復性好,清晰度高的蛋白雙向電泳技術體系,并發現一種辨別茶樹蛋白質樣品質量好壞的簡便方法。郭春芳等應用差異蛋白質組學方法分析了鐵觀音茶樹幼苗在聚乙二醇(polyethylene glycol,PEG)脅迫下葉片蛋白質組的變化。
黃華宏等應用雙向電泳蛋白質組學對矮化杉木的突變機理進行研究,得到29個差異蛋白質可能與杉木矮化的突變有關。張小靜等在深入研究塊莖蛋白質發育過程中的差異表達中,建立了馬鈴薯塊莖蛋白質的雙向電泳技術體系,并對與其發育相關蛋白質的進行了分析。
綜上所述,雙向電泳技術在植物發育過程中蛋白質的數量、組成的檢測上應用廣泛,可為研究者提供不同發育階段基因表達和調控的特點。
4 面臨的問題及展望
雙向電泳技術通過研究生物與非生物、植物器官、組織的脅迫蛋白質變化,探討其病理或生理變化,從而對蛋白質組學的發展研究產生了明顯的推動作用。另外,通過與其他蛋白質組技術進行互補、整合,從而進一步拓寬了生命科學研究的途徑[7-8]。目前,關于不同條件下植物蛋白表達譜的研究逐漸增加,使大量與逆境、基因發育、突變、植物與微生物互作的新蛋白被發現,但關于這些蛋白質的功能研究目前比較少。因此,在今后一段時間內,植物蛋白質組學的主要研究方向之一為運用生物化學、功能基因組學、生物信息學等方法證實新蛋白質的功能。
近年來,許多新型技術方法被應用到植物差異蛋白質組學研究中,比如熒光差異雙向電泳、同位素親和標記等。熒光雙向電泳技術現已得到應用,并且已經成為商品化,但其價格仍然很高,還不能成為一種普及性的技術。綜上所述,通過分析雙向電泳技術在植物蛋白質組學研究中的應用現狀,發現植物蛋白質學研究中的主要發展趨勢是技術手段的多樣化、分析層次的多元化,并與其他學科的緊密融合。
5 參考文獻
[1] 蘭彥,錢小紅,王閣,等.蛋白質組分析中蛋白質分步提取方法的建立[J].生物化學與生物物理進展,2001(3):415-418.
[2] 賈宇峰,林秋霞,郭堯君,等.蛋白質雙向電泳圖像分析[J].生物化學與生物物理進展,2001(2):246-250.
[3] 張國慶,廖杰,于力方.雙向電泳技術在蛋白質組研究中的應用[J].標記免疫分析與臨床,2003(3):171-173.
[4] 王彥玲.我國玉米核心種質磷脅迫蛋白質表達差異和基因組SSR分析[D].鄭州:鄭州大學,2010.
[5] 朱畇昊.玉米花粉萌發的比較蛋白質組學研究[D].鄭州:河南農業大學,2010.
[6] 王經源.雜交稻苗期雜種優勢的比較蛋白質組學研究[D].福州:福建農林大學,2008.