前言:中文期刊網精心挑選了藥用植物學的含義范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。
藥用植物學的含義范文1
關鍵詞:藥用植物;代謝組學;功能基因組學
代謝組學是對生物體內代謝物進行大規模分析的一項技術[1],它是系統生物學的重要組成部分(如圖1所示),藥用植物代謝組學主要研究外界因素變化對植物所造成的影響,如氣候變化、營養脅迫、生物脅迫,以及基因的突變和重組等引起的微小變化,是物種表型分析最強有力的工具之一。在現代中藥研究中,代謝組學在藥物有效性和安全性、中藥資源和質量控制研究等方面具有重要理論意義和應用價值。另外,在對模式植物突變體文庫或轉基因文庫進行分析之前,代謝組學往往是首先考慮采用的研究方法之一。目前,國外已有成功利用代謝組學技術對擬南芥突變株進行大規?;蚝Y選的例子,這為與重要性狀相關基因功能的闡明和選育可供商業化利用的轉基因作物奠定了基礎。
圖1系統生物學研究的四個層次略
目前,還有許多經濟作物的全基因組測序計劃尚未完成,由于代謝組學研究并不要求對基因組信息的了解,所以在與這些作物有關的研究領域具有更大的利用價值,這也是其與轉錄組學和蛋白組學研究相比的優勢之一。代謝組學研究涉及與生物技術、分析化學、有機化學、化學計量學和信息學相關的大量知識,Fiehn[2]對代謝組學有關的研究方向進行了分類(見表1)。
1代謝組學研究的技術步驟
代謝組學研究涉及的技術步驟主要包括植物栽培、樣本制備、衍生化、分離純化和數據分析5個方面(見圖2)。
1.1植物栽培
對研究對象進行培育的目的是為了對樣本的穩定性進行控制,相對于微生物和動物而言,植物的人工栽培需要考
表1代謝組學的分類及定義略
慮更多的問題,如中藥材在不同年齡、不同發育階段、不同部位以及光照、水肥、耕作等環境因素的微小差異都可引起生理狀態的變化,而這些非可控及可控雙重因素的影響很難進行精確的控制,從而影響藥用植物代謝組研究的重復性。為了解決以上問題,推薦使用大容量的培養箱[3],定時更換培養箱中栽培對象的位置,以及使用無土栽培技術等,FukusakiE[4]利用無土栽培系統將水和養分直接引入植物根部,并且對供給量進行精確地控制,大大提高了實驗的重復性。
1.2樣本制備
為了獲得穩定的實驗結果,樣本制備需要考慮樣本的生長、取樣的時間和地點、取樣量以及樣本的處理方法等問題,并根據分析對象的分子結構、溶解性、極性等理化性質及其相對含量大小對提取和分離的方法進行選擇,逐一優化試驗方案。MaharjanRP等[5]用6種方法分別對大腸桿菌中代謝產物進行提取,發現用-40℃甲醇進行提取的效果最好?,F階段代謝組學的分析對象主要集中在親水性小分子,尤其是初級代謝產物,氣相色譜質譜聯用(GCMS)和毛細管電泳質譜(CEMS)聯用都是分析親水小分子的重要技術。FiehnO等[6]使用GCMS對擬南芥葉片中的親水小分子進行了分析,發現酒石酸半縮醛、檸蘋酸、別蘇氨酸、羥基乙酸等15種植物代謝物。
1.3衍生化處理
對目標代謝產物的衍生化處理取決于所使用的分析設備,GCMS系統只適合對揮發性成分進行分析,高效液相色譜法(HPLC)一般則使用紫外或熒光標記的方法對樣本進行衍生處理,BlauK[7]對酯化、?;⑼榛?、硅烷化、硼烷化、環化和離子化等衍生方法進行了詳細的說明。然而離子化抑制常使得質譜分析過程中目標代謝產物的離子化效率降低,這主要是由于分離過程中污染物與目標代謝物難以完全分離開所引起的,優化色譜分離時間可有效緩解離子化抑制,然而在實際操作中不可能對上百種代謝產物的分離時間進行優化,利用非放射性同位素稀釋法進行相對定量可以很好的解決該問題。HanDK等[8]應用同位素編碼的親和標記(ICAT),根據經誘導分化的微粒蛋白及其同位素標記物的峰面積比,對該蛋白的相對含量進行分析。ZhangR等[9]發現同位素標記技術也可用于代謝組學的研究,但是卻存在許多困難。活體的同位素標記方法對于同位素的洗脫是一種非常有潛力的技術,目前關于使用34s的研究已有報道[10]。
圖2代謝組學研究技術步驟略
1.4分離和定量
分離是代謝組學研究中的重要步驟,與質譜聯用的色譜和電泳分析技術都是使用紫外或電化學檢測的方法進行定量,其對代謝組數據的分辨率與定量能力都有一定的影響。TomitaM等[11]總結了各種色譜分離法中經常遇到的技術問題,認為毛細管電泳和氣相色譜法由于具有較高的分辨率,已成為代謝組學研究的常規技術手段之一,液相色譜因其適用范圍廣,應用也相當廣泛。
TanakaN等[12]用高效液相色譜對樣品進行分離,認為使用硅膠基質填充毛細管整體柱的高效液相色譜系統具有用量少、靈敏性高、低壓降高速分離等優勢;同時,TolstikovV等[13]也使用硅膠填充的毛細管液相色譜方法對聚戊烯醇類異構體進行了有效分離,獲得了很好的分辨率。TanakaN等[14]發現二維毛細管液相色譜法的分辨率比傳統的高效液相法高10倍。相對于其他色譜方法而言,超臨界流體色譜(SFC)是分離疏水代謝物最具潛力的技術之一,特別適用于分離那些傳統HPLC難以分析的疏水聚合物,BambaT等[15]通過SFC對聚戊烯醇進行分析,證明其具有較好的分離能力。針對質譜中存在的共洗脫現象,HalketJM等[16]發明了一種適用于GCMS的反褶積系統,對共洗脫的代謝產物進行分離與識別。AharoniA等[17]使用傅立葉變換離子回旋共振質譜(FTICRMS)對非目標代謝物進行分析,快速掃描植物突變樣品,獲得了一定量的代謝成分。
與分離一樣,定量能力也是代謝組學研究中的重要因素,其取決于各分析系統的線性范圍。傅立葉轉換核磁共振(FTNMR)、傅立葉紅外光譜(FTIR)以及近場紅外光譜法(NIR)等技術由于敏感性低,重復性受共洗脫現象影響較小也被用于檢測中。近年來,FTNMR技術常被用于植物代謝組的指紋圖譜研究[18],但由于NMR分析需要樣品量較大,分析結果易受污染,GriffinJL[19]發現將統計模式識別與FTNMR相結合可以對代謝物進行全面分析。除FTNMR之外,FTIR通過對有機成分的結構進行常規光譜測定,也可適用于代謝組學的研究,特別是應用于構建代謝組學的指紋圖譜。盡管它不能對代謝物進行全面分析,但對具有特定功能的組分卻有很好的定量效果,對從工業及食品原材料中分離的代謝混合物也可以進行全面分析,目前,已有學者將其成功地應用于擬南芥[20]和番茄[21]代謝產物指紋圖譜的研究中。
1.5數據轉換
為闡明代謝物復雜的線性或非線性關系,需要進行多變量分析,將原始的色譜圖數據轉換為數字化的矩陣數據,通過對色譜峰鑒定和整合從而進行多變量分析。由于環境等因素的干擾,光譜數據需要通過適當的數據加工方法進行校正,包括:①降低噪聲;②校正基線;③提高分辨率;④數據標準化。JonssonP等[22]報道了一種關于GCMS色譜圖數據處理的方法,可以對大量代謝產物樣品進行有效的識別。
2代謝組學中的數據分析方法
2.1主成分分析法(PCA)
主成分分析法,將實測的多個指標用少數幾個潛在的相互獨立的主成分指標線性組合來表示,反映原始測量指標的主要信息。使得分析與評價指標變量時能夠找出主導因素,切斷其他相關因素的干擾,作出更為準確的估量與評價。PCA數據矩陣通常來自于GCMS,LCMS或CEMS,因此將目標代謝產物作為自變量,而相應的代謝產物含量作為因變量,定義與最大特征值方向一致的特征向量為第一主成分,依此類推,PCA便能通過對幾個主要成分的分析,從代謝組中識別出有效信息。主成分分析有助于簡化分析和多維數據的可視化,但是該方法可能導致一部分有用信息的丟失。
2.2層次聚類分析法(HCA)
層次聚類分析法也常用于代謝組學的研究中,它是將n個樣品分類,計算兩兩之間的距離,構成距離矩陣,合并距離最近的兩類為一新類,計算新類與當前各類的距離。再合并、計算,直至只有一類為止。進行層次聚類前首先要計算相似度(similarity),然后使用最短距離法(NearestNeighbor)、最長距離法(FurthestNeighbor)、類間平均鏈鎖法(BetweengroupsLinkage)或類內平均鏈鎖法(WithingroupsLinkage)四種方法計算類與類之間的距離。該方法雖然精確,但計算機數據密集,對大量數據點進行分析時,更適合選用K均值聚類法(KMC)或批次自組織映射圖法(BLSOM),而HCA適合將數據轉換為主成分后使用。2.3自組織映射圖法(SOM)
神經網絡中鄰近的各個神經元通過側向交互作用相互競爭,發展成檢測不同信號的特殊檢測器,這就是自組織特征映射的含義。其基本原理是將多維數據輸入為幾何學節點,相似的數據模式聚成節點,相隔較近的節點組成相鄰的類,從而使多維的數據模式聚成二維節點的自組織映射圖。除PCA和HCA外,SOM同樣也可應用于包括基因組和轉錄組等組學研究中[23]。最初SOM計算時間長,依靠數據輸入順序決定聚類結果,近年來SOM逐漸發展成為不受數據錄入順序影響的批次自組織映射圖法(BLSOM)。由于BLSOM可以對類進行調整,且有明確的分類標準,優化次序優于其他聚類法,已在基因組學和轉錄組學數據分析中得到廣泛的應用。
2.4其他數據采礦方法
除PCA、HCA和SOM外,很多變量分析方法都可用于植物代謝組學的分析。軟獨立建模分類法(SIMCA)是利用主成分模型對未知樣品進行分類和預測,適合對大量樣本進行分析;近鄰分類法(KNN)和K平均值聚類分析法(KMN)也可用于樣品分類;主成分回歸法(PCR)或偏最小二乘回歸法(PLS)在某些情況下也可使用。然而到目前為止由于還沒有建立一個標準的數據分析方法,代謝組學仍然是一門有待完善的學科。
3代謝組學在藥用植物中的實踐
植物藥材來源于藥用植物體,而藥用植物體的形態建成是其體內一系列生理、生化代謝活動的結果。植物代謝活動分為初生代謝和次生代謝,初生代謝在植物生命過程中始終都在發生,其通過光合作用、檸檬酸循環等途徑,為次生代謝的發生提供能量和一些小分子化合物原料。次生代謝往往發生在植物生命過程中的某一階段,其主要生物合成途徑有莽草酸途徑、多酮途徑和甲瓦龍酸途徑等。植物藥材含有的生物堿、胺類、萜類、黃酮類、醌類、皂苷、強心苷等活性物質的絕大多數屬于次生代謝產物,因此探討次生代謝產物在藥用植物體內的合成積累機制及其影響因素,對于提高活性物質含量、保證藥材質量、穩定臨床療效等具有重要意義。孫視等[24]通過對銀杏葉中黃酮類成分積累規律的研究,提出了選擇具有一定環境壓力的次適宜生態環境解決藥用植物栽培中生長和次生產物積累的矛盾。王昆等[25]以人參葉組織為材料,總結了構建人參葉cDNA文庫過程中存在的一些關鍵問題和應采取的對策,為今后關于人參有效成分如人參皂苷的生物合成途徑及其調控的基礎研究提供技術參考和理論指導。最近,美國加利福尼亞大學伯克利分校的Keasling等[26]采用一系列的轉基因調控方法,通過基因工程酵母合成了青蒿素的前體物質——青蒿酸,其產量超過100mg/L,為有效降低抗瘧藥物的成本提供了機遇。經過長期的研究積累,人們對代謝途徑的主干部分(為次生代謝提供底物的初生代謝途徑)已經基本了解,例如酚類的莽草酸途徑,萜類的異戊二烯二磷酸(IPP)途徑等。被子植物中一些相對保守的次生代謝途徑也得到了很好的研究,如黃酮類、木質素的生物合成與調控。然而,對次生代謝最豐富最神奇的部分——特定產物合成與積累的過程,還所知甚少[27]。
4展望
近年來,代謝組學正日益成為研究的熱點,越來越多的人已加入到代謝組學的研究中。隨著代謝組學積累的數據和信息量的增大,其在藥用植物學各個領域的應用價值也與日俱增。它將不僅能對單個代謝物進行全方面的分析,更能尋找其代謝過程中的關鍵基因、通過代謝指紋分析對藥用植物進行快速分類、進一步研究藥用植物有效成分代謝途徑以及環境因子對植物代謝和品質的影響與調控機制。
然而依據傳統中醫藥學和系統生物學的指導思想,目前急待解決的是中藥種質資源的代謝組學研究和中藥體內作用的代謝組學研究。同時,代謝組學在分析平臺技術、方法學手段和應用策略等方面相對于其他組學技術還需要進一步發展和完善,還需要其他學科的配合和介入。相信隨著更有力的成分分析設備的使用及代謝組數據庫的建立,藥用植物代謝組學將對中醫藥學產生深遠的影響。
【參考文獻】
[1]WECKWERTHW.Metabolomicsinsystemsbiology[J].AnnuRevPlantBiol,2003,54:669-689.
[2]FIEHNO.Metabolomics—thelinkbetweengenotypesandphenotypes[J].PlantMolBiol,2002,48:155-171.
[3]TRETHEWEYRN.Metaboliteprofilingasanaidtometabolicengineeringinplants[J].CurrOpinPlantBiol,2004,7:196-201.
[4]FUKUSAKIE,IKEDAT,SUZUMURAD,etal.Afaciletransformationofarabidopsisthalianausingceramicsupportedpropagationsystem[J].JBiosciBioeng,2003,96:503-505.
[5]MAHARJANRP,FERENCIT.Globalmetaboliteanalysis:theinfluenceofextractionmethodologyonmetabolomeprofilesofEscherichiacoli[J].AnalBiochem,2003,313:145-154.
[6]FIEHNO,KOPKAJ,TRETHEWEYRN,etal.Identificationofuncommonplantmetabolitesbasedoncalculationofelementalcompositionsusinggaschromatographyandquadrupolemassspectrometry[J].AnalChe,2000,72:3573-3580.
[7]BLAUK,HALKETJM.Handbookofderivativesforchromatography[M].2nded.JohnWiley&Sons,Chichester,1993.
[8]HANDK,ENGJ,ZHOUH,etal.Quantitativeprofilingofdifferentiationinducedmicrosomalproteinsusingisotopecodedaffinitytagsandmassspectrometry[J].NatBiotechnol,2001,19:9469-9451.
[9]ZHANGR,SIOMACS,WANGS,etal.Fractionationofisotopicallylabeledpeptidesinquantitativeproteomics[J].AnalChem,2001,73:5142-5149.
[10]MOUGOUSJD,LEAVELLMD,SENARATNERH,etal.Discoveryofsulfatedmetabolitesinmycobacteriawithageneticandmassspectrometricapproach[J].ProcNatlAcadSciUSA,2002,99:17037-17042.
[11]TOMITAM,NISHIOKAT.Forefrontofmetabolomicsresearch[M].Tokyo:SpringerVerlagTokyo,2003.
[12]TANAKAN,KOBAYASHIH,ISHIZUKAN,etal.Monolithicsilicacolumnsforhighefficiencychromatographicseparations[J].JChromatogrA,2002,965:35-49.
[13]BAMBAT,FUKUSAKIE,NAKAZAWAY,etal.Rapidandhighresolutionanalysisofgeometricpolyprenolhomologuesbyconnectedoctadecylsilylatedmonolithicsilicacolumnsinhighperformanceliquidchromatography[J].JSepSci,2004,27:293-296.
[14]WIENKOOPS,GLINSKIM,TANAKAN,etal.Linkingproteinfractionationwithmultidimensionalmonolithicreversedphasepeptidechromatography/massspectrometryenhancesproteinidentificationfromcomplexmixtureseveninthepresenceofabundantproteins[J].RapidCommunMassSpectrom,2004,18:643-650.
[15]BAMBAT,FUKUSAKIE,NAKAZAWAY,etal.
Analysisoflongchainpolyprenolsusingsupercriticalfluidchromatographyandmatrixassistedlaserdesorptionionizationtimeofflightmassspectrometry[J].JChromatogrA,2003,995:203-207.
[16]HALKETJM,PRZYBOROWSKAA,STEINSE,etal.Deconvolutiongaschromatography/massspectrometryofurinaryorganicacidspotentialforpatternrecognitionandautomatedidentificationofmetabolicdisorders[J].RapidCommunMassSpectrom,1999,13:279-284.
[17]AHARONIA,RICDEVOSCH,VERHOEVENHA,etal.NontargetedmetabolomeanalysisbyuseofFouriertransformioncyclotronmassspectrometry[J].Omics,2002,6:217-234.
[18]OTTKH,ARANIBARN,SINGHB,etal.Metabolomicclassifiespathwaysaffectedbybioactivecompouds.ArtificialneuralnetworkclassificationofNMRspectraofplantextracts[J].Phytochemistry,2003,62:971-985.
[19]GRIFFINJL.Metabonomics:NMRspectroscopyand
patternrecognitionanalysisofbodyfluidsandtissuesforcharacterisationofxenobiotictoxicityanddiseasediagnosis[J].CurrOpinChemBiol,2003,7:648-654.
[20]GIDMANAE,GOODACREBR,EMMETTCB,etal.Investigatingplantplantinterferencebymetabolicfingerprinting[J].Phytochemistry,2003,63:705-710.
[21]JOHNSONHE,BROADHURSTD,GOODACRER,etal.Metabolic
fingerprintingofsaltstressedtomatoes[J].Phytochemistry,2003,62:919-928.
[22]JONSSONP,GULLBERGJ,NORDSTROMA,etal.AstrategyforidentifyingdifferencesinlargeseriesofmetabolomicsamplesanalyzedbyGC/MS[J].AnalChem,2004,76:1738-1745.
[23]HIRAIMY,YANOM,GOODENOWEDB,etal.IntegrationoftranscriptomicsandmetabolomicsforunderstandingofglobalresponsestonutritionalstressesinArabidopsisthaliana[J].ProcNatlAcadSciUSA,2004,101:10205-10210.
[24]孫視,劉晚茍,潘福生,等.生態條件對銀杏葉黃酮含量積累的影響[J].植物資源與環境,1998,7(3):1-7.
[25]王昆,王穎,鮑永利,等.人參葉cDNA文庫構建中的問題與對策[J].人參研究,2005,17(4):2-4.
藥用植物學的含義范文2
由于語言的變遷、學科的融合和發展等因素的影響,以及長期以來中醫藥學術語缺乏規范化,導致了中醫藥學術語外延寬泛,內涵不清,常出現一詞多義、一義多詞、詞義演變等現象[1]。語言系統的建立可以解決因為概念表述方式不統一和相關信息分散而造成缺失、錯誤等一系列低效檢索結果的發生。中醫藥一體化語言系統(TCMLS)現代部分的構建已初具規模,但中醫古籍部分的語言系統建設卻一直缺如。中醫古籍所含學術內容在整個中醫藥體系中具有根基性的重要地位,以古漢語為表述方式的中醫古籍學術體系有別于現代中醫藥語言體系,兩者決定了中醫古籍語言系統是TCMLS的一個不可或缺的組成部分。筆者在此基礎上進行嘗試,并試圖對實踐過程中遇見之問題勉力探討。
1 背景介紹
TCMLS是以UMLS(一體化醫學語言系統)為參考,以本體論為指導,以中醫藥語言特點及學科體系為依據,以Vocabulary Builder軟件為平臺研制開發的,在UMLS原有語義類型和語義關系的基礎上,根據中醫學的特點設計了126種語義類型和60種語義關系,按學科分為16大類,目前已經完成超過30萬詞條加工。TCMLS是古籍語言系統構建的基礎,在其總目下增加古籍術語一類,暫作為古籍語言系統加工的平臺。
2 存在問題及初步解決方案
2.1 中醫古籍分類體系的構建問題
古籍分類就是按照古籍內容的學科性質分門別類,將之組織(構建)成一個知識體系。其作用在于不僅能夠呈現古籍的基本內容、同一科目有些什么古籍,而且還可以揭示出各個科目所含古籍之間的相互關系。現有的《中國圖書分類法》和《全國中醫圖書聯合目錄》分類法,均不能較好地解決構建中醫古籍語言系統所需要的分類體系。因其或注重學術流派,或關注圖書本身,而對文獻的內容關注較少。語言系統整體框架內古籍部分的分類顯然不能局限于文獻圖書本身,而必須立足于文獻所包含的知識,方能更好地分析把握其含義及相關關系。
在現代中醫藥語言系統分類體系的基礎上,根據古籍的特點進行分類的修訂和完善,預先建立一個能夠滿足中醫古籍語言系統整體架構需求的分類體系比較困難,而且自上而下建立的分類可能遺漏古籍中的部分信息。
有鑒于此,本研究采取先在《內經》、《傷寒論》的章節目錄下進行現有詞條加工的方法,在完成3本詞典1萬余詞條的處理后,根據相應詞條上位詞的提取構建古籍的分類體系的初步輪廓,在此基礎上進行修訂。由下而上根據具體概念的上位詞所反映出的上下位關系而最終建立起古籍分類體系,以期更切合實際,易于被最終用戶理解和接受。
2.2 古籍概念定義問題
2.2.1 定義篩選問題 古籍中的概念定義紛繁復雜,如“下”在《內經詞典》中有多達20個不同的定義,其中“在下”、“向下”、“低處”、“量詞”等解釋,與醫學關系不甚密切,屬于公共領域的含義,這樣的概念定義加工進語言系統非但意義不大,而且會使整個系統變得冗余。所以,采取先篩選出與醫學相關的定義,然后再加工的原則進行概念詞的錄入。
2.2.2 定義取舍問題 依據詞典的解釋相對比較確定,但卻不是古籍語言系統加工的唯一路徑。古代醫學概念語義具有較大的復雜性、多義性,這是對其理解的難點,同時也影響、制約著TCMLS的構建,對概念語義失之辨析,會導致語義網絡的失真、錯誤,影響語言系統的最終應用。如何給內涵和外延都很復雜的古籍概念進行比較明確的定義,是關系到古籍語言系統構建準確性的關鍵問題。參考和借鑒各領域的最新研究成果是目前可行的途徑。
如針灸概念部分可以以“針灸理論文獻通考”項目組的最新研究成果為依托,進行下一步的加工處理。如若沒有現成的研究成果,可以在加工過程中及時咨詢專家意見,以不斷調整完善。
2.3 與原有系統概念的兼容問題
中醫古籍語言系統的構建不但要盡力展現古籍中同一概念術語在不同語境、文本、歷史時期中內涵的演變,建立概念之間的同義、近義以及相關關系,從而避免檢索中可能出現的遺漏或錯檢,而且要最終實現古籍概念術語與現代中醫藥語言系統之間的互通甚至與UMLS的兼容。
古籍概念與現代部分的中醫藥概念完全同名,但是意義卻完全不同。如“根”,在藥用植物學里是植物體生長在土壤中的營養器官,而在古代針灸概念中卻是“井穴”,二者全然不同的含義使我們在加工處理的時候,要進行進一步的區分,以便可以快速搜索到檢索者想要查詢的概念。如在“根”后面用括號的形式標注出所屬學科,可以避免藥用植物學中“根”這個作為類存在的概念與針灸學中的具體概念“根”發生混淆。這是具體加工過程中初步的解決方案。
2.4 古籍概念的加工來源問題
TCMLS的建立最初都是來源于教材、詞典、工具書,因其有比較明確的定義,便于加工處理。這對于中醫藥學現代部分而言比較合適,但古籍的概念比較分散,不是幾本工具書就能涵蓋包容的。所以,古籍語言系統未來的加工范圍要擴展到具體古籍,如《千金方》、《外臺秘要》等,這就需要制定更為詳盡的規則。
如何在古籍文本中獲取領域概念?所謂領域概念,從某種意義上講是領域知識在文本中的外在表現。領域概念的獲取就是從領域文本集合中抽取最能代表該領域的概念集合,這個過程包括從領域文本中抽取術語集合、詞性規范(同義詞處理)以及領域概念的篩選和確定[2]。換言之,我們要加工的概念是否是語義的集合,這樣的遴選就給加工增加了不確定性和難度。具體的規則制定尚有待進一步考量商榷。
2.5 語義類型及語義關系的適配性問題
TCMLS中在進行中醫藥一體化語言系統構建時已經對語義類型和若干語義關系進行增刪改動,如刪減了“練習”、“展示”兩個語義關系,增加了“開竅于”、“與……相表里”、“概念上對應”、“與……類似概念”、“與……相互依存”、“與……相互制約”、“與……相互轉化”等7個語義關系[3],但是還不能完全匹配古籍語言系統的需求。
如“下哺”,應該屬于對發病時間的描述,原有的語義類型中的“醫學天文氣象”和“時間醫學”都不是十分恰當。如“咽為之使……魄門亦為五藏使”中“……使”的語義關系描述在現有的系統中不存在,可以考慮新建。
總之,在加工過程中需要對原有的語義類型及語義關系進行適當的增刪,以期更能滿足古籍的需求。
3 思考與展望
中醫古籍在整個中醫藥學科中的重要地位毋庸置疑,但是,古籍語言系統是否有獨立構建的必要是一個值得商榷的問題。單獨構建一個古籍語言系統可以使其知識自成體系,瀏覽與檢索時比較直觀系統,但現有的TCMLS“中醫基礎理論”類下包含了很多古籍的術語,這將導致古籍系統與現代部分不可避免的重復。反之,如果將古籍語言系統完全嵌入現代語言系統,融合的過程中亦會出現兼容的各種問題,原有的分類結構必須要進行調整修改,原有的與古籍關聯的概念亦要進行修訂,這是一個巨大的工程。如何在兩者之間權衡,是古籍語言系統建設中值得探討的重大問題之一。
如何使TCMLS得到合理充分的應用是語言系統建設過程中一直面臨的問題,結合中醫藥共享平臺和中醫藥共建平臺對搜索功能的支持和利用語言系統作為詞庫的中醫藥領域分詞系統[4]是目前主要的應用范疇。尚在建設初期的古籍語言系統可以參照TCMLS進行應用領域的開發嘗試,建立中醫古籍可以共享重用的本體以及相關的數據挖掘是可以發展的方向之一。
綜上所述,中醫古籍語言系統的構建是一個十分緊迫且困難的重要工作,不但要解決古籍分類,語義類型、語義關系適配,與原有系統的兼容,概念的篩選,定義的刪減等問題,而且還要解決古籍概念的多義性、遷延性、不確定性等問題,后者的解決更需要相關領域研究的支持,方能在未來初現古籍語言系統之端倪。
參考文獻
1 朱建平.中醫術語規范化與中醫現代化國際化[J].中華中醫藥雜志, 2006,21(1):6-8.
2 何 琳.古農學本體的半自動構建及檢索研究[D].南京:南京農業大學, 2007.