前言:中文期刊網精心挑選了元數據范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。
元數據范文1
關鍵詞:元數據 溫州 特色數據庫
中圖分類號:TP311 文獻標識碼:A 文章編號:1007-9416(2013)02-0158-01
特色數據庫是指充分反映本單位在同行中具有文獻和數據資源特色的信息總匯,是圖書館在充分利用自己的館藏特色基礎上建立起來的一種具有本館特色的可供共享的文獻信息資源庫[1]。特色數據庫建設是數字圖書館資源建設的核心和發展方向。隨著信息技術的飛速發展,特別是網絡終端的不斷普及,數字圖書館及其信息急劇增加。為了適應這種快速發展,信息學家們建立了許多適用于不同資源、面向特定領域的元數據方案,如MARC、DC、VRA等。元數據為數字信息提供了數據內容、語義和服務的機制等方面的精確描述,便于人們標識、發現、評估和管理信息資源。
溫州地處浙江東南沿海,是浙南地區的經濟、文化、交通中心,擁有豐富的地域文化資源??萍夹畔⒒睦顺保沟脺刂萁鼛啄甏罅Πl展、建設了許多溫州地域特色數據庫。如:《民俗學文獻與溫州地域特色文化資源數據庫》、《雁蕩山摩崖石刻》、《澤雅造紙》、《龍灣民俗》、《溫州鞋服資訊網》……其中,溫州地區共有21所公共圖書館,具有特色庫的圖書館比例達到了33.3%;溫州地區的高校有19所(不包含獨立學院,如溫州大學城市學院、甌江學院、溫州醫學院仁濟學院),具有特色庫的圖書館比例達到15.8%。
1 溫州地域特色數據庫的資源和元數據現狀
1.1 資源內容豐富多彩
溫州地區各公共圖書館和高校圖書館都從自身服務讀者群的角度,結合地域特色收集整理了包括書目數據(OPAC數據)、圖書、期刊、報紙、學位論文、曲譜、網址、照片、視頻、三維視圖等各種題材的地域文化文獻,從溫州人、溫州歷史、溫州山水、溫州宗教、溫州民俗等多種角度整理、保存了溫州地域文化。集中展示了溫州地域特色數據庫資源的多媒體特性。
1.2 特色數據庫元數據建設
特色數據庫的建設標準在高校系統中,經由CALIS、CADAL等項目及子項目的開展,逐漸形成了一套行之有效并有利于長期發展的一套模式及流程。如《CALIS文獻資源數字加工與標準》、《描述型元數據及其著錄規則》、《CALIS數字對象惟一標志識符命名規范》、OpenURL開放鏈接標準、LDAP標準、Web Services組件封裝規范、Calis United Query and Resultset統一檢索接口規范等。其中溫州大學的《民俗學文化與溫州地域特色文化資源數據庫》參照CALIS標準,遵從以上元數據規范原則建設,最終在資源數據量、元數據格式、統一標識、網頁層級結構等都有較佳表現。而公共圖書館特色數據庫在元數據方面則較為粗糙,這為易獲取和數據深層次分析、利用造成障礙。
2 元數據規范設計的原則
元數據可以劃分為3種比較寬泛的類型:描述性元數據、結構性元數據、管理性元數據,[2]。描述性元數據指用以描述和識別數字對象的特征、分析信息體知識內容的數據。結構性元數據有時也被稱為技術型元數據,是用于確保數字化對象正常發揮功能的技術性信息。它是指相關文件的結構或“標記”,如何組成在一起,如何在各種系統中顯示和等。管理型元數據提供有關數字對象的存儲條件和轉換過程相關的信息。它的目的是滿足管理、決策、保管記錄的需要,有助于檢測、復制和備份數字資源。但是到目前為止,大多數有關元數據的討論仍只是針對描述性元數據。所以,在描述性元數據規范的制定過程中,需充分考慮著錄者、使用者的需求和著錄對象的特性,并在其間做一最佳平衡和組配。
一致性原則:指在元數據設計過程中,應盡量注意保持與現有的國家標準、行業標準或者與其他政府標準、國際標準相一致。
簡單性與準確性原則:簡單性主要指設計的元數據標準在著錄實際應用時應較為簡單,易于掌握,尤其要考慮到著錄人員除編目員外,更多的是相關專業人士,如計算機技術人員在編程時,希望元數據項越簡單越好,圖情專家則更注重如何細致全面的描述數字對象,因此,同時要考慮到簡單化可能導致的不準確,需在二者中作一權衡。
專指度與通用性原則:由于元數據應用的各類資源的各自特性的不同,著錄深度(如書目、內容和插圖等)和廣度(指相關聯的一組文獻作總體著錄)的不同,因此,無法只參照一種元數據標準,需要根據具體的資源實體來確定相應的元數據標準。另一方面,必須考慮元數據標準在一定背景環境下的通用性。
互操作性與易轉換性原則:元數據的互操作原則體現在對異構系統間互操作能力的支持,不僅可以為自己的應用系統所操作,而且可以為其他組織或機構的應用系統所操作;不僅可在不同系統實現在同一元數據標準間的數據的傳輸、交換或轉換,而且不同元數據標準間實現數據的傳輸、交換或轉換。通常在元數據的具體應用上,互操作性往往表現為易轉換性,即在所攜信息損失最小的前提下,可方便地將元數據轉換為其他系統常用的元數據標準。要實現這些功能,在元數據標準設計過程中必須慎重考慮元素語義和元素結構的準確定義,其中語義定義尤為重要[3]。
可擴展性原則:由于數字圖書館將要處理的數字資源非常廣泛,而各類應用背景更為復雜,當時編制的元數據在該階段的描述適用于當時的應用背景。經過技術更新及概念的重定義會導致原有元數據的元素或屬性值不準確或不足,故應允許使用者在不破壞已規定的標準內容(如元素的語義定義)的條件下,擴充一些元素或屬性值。元數據標準中應為這種情況提供指導性原則。
用戶需求原則:制定元數據標準的目的是想讓用戶更好和更充分地理解信息資源,因此用戶需求應作為最高的權衡標準。特別是在結構與格式的設計、元數據項的增加與取舍、語義規則的制定等方面,盡可能地從用戶的角度出發,增加系統與用戶間的交互渠道,為用戶提供多層次的檢索體系。
參考文獻
[1]http:///view/3053788.htm.
元數據范文2
【 關鍵詞 】 數據挖掘;元數據;組預取
Based on Data Mining Exploration Prefetch File Metadata
Tang Yan-qun
( Information Center of Guizhou Economy and Information Technology Commission GuizhouGuiyang 550004)
【 Abstract 】 In the file storage system, improve the overall performance of the file system has to guarantee the reliability and security of documents is important, and in this process, metadata access and file system performance is closely related to performance, in order to further meet the large scale file storage systems need, we must establish the appropriate file metadata prefetching models. Based on the prefetch file-based data mining metadata analysis, in order to meet a lot of access to file data access needs.
【 Keywords 】 data mining; metadata; group prefetching
1 引言
近年來,隨著科學技術的不斷改革和進步,文件存儲系統的性能不斷優化,對于滿足訪問需求起到了較大的幫助作用。但在傳統的文件存儲系統中,元數據與數據本身是屬于同一個文件系統的,在同一個存儲設備上保存著,這樣,隨著訪問量的增加,勢必會導致文件訪問并行性收到影響。對此,通過數據挖掘建立相應的文件元數據預取模型至關重要。
2 元數據訪問概述
元數據一詞較為常見,通常理解為關于數據的數據,其在數據庫管理系統中充分發揮了自身功能,元數據尺寸較小,但其能夠存儲巨大的數量,對于優化數據庫性能具有重要意義。元數據訪問中主要包括緩存技術,主要用于降低文件操作率,對于訪問過的元數據能夠暫時保留,以盡量降低訪問延遲時間,但此種技術的應用會受到元數據頻繁更新的影響,如果緩存空間較小,更新算法效果較差,從而導致緩存技術的系統性能改善不夠顯著,最終影響到元數據訪問。協作式緩存技術,網絡速度的不斷提升,使得協作式緩存技術的應用越來越頻繁,通過對此種技術的應用,可以充分利用元數據服務系統中的空閑內存,從而形成虛擬的內存空間,以實現對元數據的緩存處理,這樣不僅能夠減少磁盤操作次數,同時還能夠提升元數據訪問效率,實現性能改善。
3 元數據訪問流程
元數據在文件系統中占據重要地位,能夠為文件系統提供整體的、系統的元數據服務,而通過元數據的應用,能夠記錄各種文件的詳細信息,從最初在客戶端搜索元數據信息,到最后在協作式緩存中返回,并與本地磁盤相聯系,從而實現元數據系統整體性能的提升。
4 數據挖掘概述
數據挖掘主要是指對數據庫中的已有數據進行分析,并與現有問題進行對比評估,以解決現有問題。換一種說法,數據挖掘也就是發現數據模式的過程,而這個過程的實現通常是自動化或者半自動化的,最為常見的是半自動化,而通過挖掘得出的規則能夠得出經濟優勢。當前,科學技術的廣泛應用對于數據挖掘的研究更加廣泛,種類也越來越多,而根據挖掘對象可以分為空間數據、時間序列數據、多媒體數據及文本數據等。
5 基于數據挖掘的文件元數據預取模型
通過成組預取元數據,能夠有效降低訪問延遲,如果預取組包含了即將被訪問的元數據,則能夠在一定程度上提升Cache的命中率。在實施數據挖掘之前,應當先將不同的元數據請求聯系起來,對應的元數據形成一個模型樹,然后對于元數據中的各個文件信息進行序列分組處理,當出現新的元數據請求時,要用其代替原有的舊數據源請求,并由此形成新的模型樹,生成新的預取模型。
設文件中的元數據請求序列為ABCDEFABEF,設預測窗口的大小為8,根據本模型需求,不設頻率閥值,根據元數據已有的請求需求,將各個節點相連接,形成鏈表L,每個節點都要包含元數據支持度。根據預測窗口的大小進行序列分組,以8個元數據信息作為1組,當預測窗口形成后要向前移動1個單位,并產生分組。最后對這些元數據信息進行冗余處理,得出分組結果:
組1:AB(CADEFA)經過冗余處理后 AB(CDEF);
組2:BC(ADEFAB)經過冗余處理后 BC(ADEF);
組3:CA(DEFABE)經過冗余處理后 CA(DEFB);
組4:AD(EFABEF)經過冗余處理后 AD(EFB);
組5:DE(FABEF)經過冗余處理后 DE(FAB);
組6:EF(ABEF)經過冗余處理后 EF(AB);
組7:FA(BEF)經過冗余處理后 FA(BE);
組8:AB(EF)經過冗余處理后 AB(EF);
組9:BE(F)經過冗余處理后 BE(F);
組10:EF經過冗余處理后 EF。
通過將上述分組中的子集根據長度進行分類,并依此添加到相關節點中,從而形成相應的訪問樹。如果是文件元數據A,根據上述得出的元數據請求序列,可以根據相關信息得出具體的訪問樹。
通過頻繁的訪問信息篩取,可以從中得出相應的規則,并根據各項規則生成相應的預取組,將其放置在相應的節點上后,能夠進行快速預取處理,最終得出相應的元數據信息。通過得出科學合理的元數據信息,能夠從文件元數據預取模型中得出更為可靠的數據信息,以滿足數據挖掘需求,使得元數據訪問性能不斷優化。
6 基于數據挖掘的文件元數據預取研究意義
6.1 元數據管理重要性
對于大規模的文件系統來說,元數據的應用至關重要,而加強元數據管理則具有重要意義,通過分析元數據訪問過程中的各種預取技術,具有較強的可行性,而且能夠進一步改進,從而提升元數據應用可靠性。在本文的研究中,不僅可以利用預取模型進行元數據訪問,同時還能夠對模型進行綜合計算,得出Cache命中率,并得出相應的預測準確度。對于元數據的管理能夠減少計算失誤,提升元數據訪問性能,從而滿足存儲需求。
6.2 提升系統挖掘效率
對于實際應用中的文件系統,需要充分考慮在線訪問的預取情況,針對在線元數據預取情況提出新的計算方法,而新算法的應用充分考慮了挖掘頻發閉項的局限性,由此提出了更為有效的數據挖掘方法,從而使得成組預取成為可能。
6.3 改進元數據訪問預取挖掘系統
對于元數據訪問預取挖掘,主要是根據時間先后進行排序并訪問的,這主要是由于元數據訪問之間不僅存在時間先后關系,同時還存在物理關系,對于數據挖掘的分析,能夠將更加科學、合理的聚類分析方法應用在挖掘過程中,從而得出更為可靠的元數據預取模式。
7 結束語
數據挖掘關乎元數據訪問性能,當前在文件信息系統中,由于信息的存儲量不斷增大,對于元數據訪問性能提出了更高的要求,在數據挖掘的環境下,通過建立文件元數據預取模型,分析提出中的元數據訪問情況,能夠進一步滿足信息系統存儲需求,并不斷由于元數據訪問性能,從而更好地滿足現代化信息存儲發展。
參考文獻
[1] 陳莉,焦李成.Internet/Web數據挖掘研究現狀及最新進展[J].西安電子科技大學學報,2011(01).
[2] 趙欣,陳道蓄,謝立.并行文件系統PARFSNOW++中的協作式緩沖技術研究[J].計算機科學,2010(04).
[3] 張里.基于數據挖掘的網絡入侵檢測系統的研究與設計[D].重慶大學,2012.
[4] 韋升華.基于數據挖掘的入侵檢測技術應用研究[D].重慶大學,2011.
[5] 張嫣.數據挖掘技術在銀行客戶關系管理中的研究和應用[D].中南民族大學,2012.
[6] 李建.數據挖掘技術在電信數據分析中的應用研究及原型實現[D].上海交通大學,2010.
[7] 鄧承剛.關系數據庫對象級別檢索結果相關性排序算法研究[D].大連海事大學,2012.
元數據范文3
元數據是關于數據的數據,在建立信息資源目錄體系的過程中,元數據主要是對信息資源從外部特征進行而非從內部結構進行描述。通俗地講,元數據就是信息資源的標簽或卡片,通過元數據的描述,可以使信息資源的使用者能夠了解數據的內容、特征、作用、獲取方式等信息,能夠對信息資源是否滿足特定的應用需求做出適當的評價,并根據評價的結果決定是否采取進一步的措施來獲取該信息資源。
元數據是信息資源目錄體系建立的基礎,構建一個信息資源目錄體系首要和基礎性的工作就是建立描述各個信息資源的元數據庫,元數據庫中存儲的是描述各種來源、各種類型的信息資源的描述信息。無論用戶以何種方式查詢信息資源目錄,包括以分類目錄的形式進行查詢、或者以多關鍵詞的形式進行查詢,其本質都是對后臺元數據庫的檢索,只是從表現層提供了不同形式的人機查詢接口。根據所描述的信息資源對象的不同,可以建立不同的元數據庫,分別對各類信息資源進行描述。
元數據的組成
為能夠對信息資源進行準確和高效的描述,元數據本身具有自身的邏輯結構。一般來說,元數據本身是層次化、樹狀結構的。處于樹狀結構最底端的葉子節點稱之為元數據元素,包含了元數據元素的節點稱之為元數據實體,當然元數據實體也可以只包含元數據實體。根據實際需求,元數據實體或者元數據元素可以多次出現。例如,信息資源可以有不同的分類,可以按照信息資源的來源進行分類,也可以按照信息資源的不同應用主題進行分類,因此,“信息資源分類”元數據實體就可以出現多次。
元數據一般分三個方面對信息資源進行描述。
一是對信息資源基本內容的描述。包括信息資源的標題、摘要、關鍵詞等基本信息。標題是信息資源的名稱,通過標題使用者能夠初步掌握信息資源的基本范圍。其次,使用者可以通過摘要,了解信息資源的主要內容、用途等各種信息。一般情況下,用戶主要通過摘要作為信息資源適用性評價的主要依據。所以,在信息資源元數據的著錄過程中,摘要的填寫一般都由專業人員完成,只有專業人員才能夠對信息資源的內容有準確的把握和深入的理解,能夠提供有關信息資源內容的更加權威的解釋。根據信息資源對象的不同,描述信息資源基本內容的元數據實體和元數據元素還可以進行有選擇的增加。例如,描述空間信息資源時,可以增加空間參照系、圖示表達等元數據實體,描述科學數據資源時需要增加數據質量等元數據實體。
二是對信息資源的獲取方式進行描述。包括信息資源的分發者信息、信息資源的在線獲取地址信息等。通過提供分發者聯系信息,使用者可以直接聯系信息資源的分發部門,這對于不能直接在網絡上進行數據交換的信息資源獲取非常有效。其次,使用者還可以通過信息資源的在線地址來下載、查詢、瀏覽信息資源。使用者甚至可以提供專門的電子訂單處理系統,并將入口信息加入到元數據內容中,方便使用者進行在線的信息資源訂購。
三是對元數據自身的維護信息進行描述。包括元數據的標識、元數據的維護方、元數據的更新日期、更新頻率等。該類信息主要服務于對元數據內容的自身管理,提高元數據的管理和維護效率。在某些特定的條件下,使用者也可以通過元數據的更新日期、更新頻率等信息判斷元數據與信息資源的一致性程度,進而間接判斷信息資源的適用性。
國內對元數據標準的研究
在信息化時代,信息資源的共享和交換需求是普遍存在的。不同的領域,無論這個領域的范圍是一個部門,或者是由若干不同的業務部門組成的整體,在建立元數據過程中,從實施的角度,必須確定相應的元數據內容規范。由于共享的程度不同、信息資源內容的不同等因素,各領域制定的元數據標準也有很大的不同。迄今為止,國內外已有若干元數據標準的研究項目和成果。
在國內,許多領域都已開展了元數據標準化工作,其中處于較為領先地位的是地理空間信息領域。從上世紀90年代開始,國家和各相關職能部門就開展了一系列地理空間信息相關的政策、標準和實驗系統的研究工作。進入21世紀以來,隨著國家電子政務等一批關鍵信息化項目的啟動,地理元數據標準化工作已逐步實現從研究試驗向實際應用的轉變。
為了促進可持續發展方面的信息共享和交換,科技部“九五”國家重點科技攻關計劃項目“中國可持續發展信息共享示范”(97-925)制定了《中國可持續發展信息元數據》。目前,該標準已經應用于中國可持續發展網運行系統中。
科技部“九五”97-759科技攻關項目“國土資源環境和區域經濟信息系統及國家空間信息基礎設施關鍵技術研究”,經過研究分析美國FGDC元數據標準、ISO元數據標準等,結合我國實際情況,特別是NREDIS重點數據庫群的具體情況,制定出了《NREDIS空間元數據內容標準》。該標準所定義的描述元素覆蓋了空間數據集的各個方面,專門針對空間數據集的歸檔、編目和,適合于空間元數據技術平臺對規范空間元數據內容的實際需要。
國家地理空間信息協調委員會組織國家信息中心等單位在《NREDIS空間元數據內容標準》基礎上,參考國際標準化組織元數據標準(ISO19115)及美國聯邦地理數據委員會元數據標準(FGDC),起草了《國家空間信息基礎設施元數據內容標準》。該標準已經應用于國家空間信息交換中心示范網絡系統,該系統是一個包括是一個分布式的網絡地理空間信息交換系統,所的元數據內容涉及基礎測繪、林業、礦產、土地、地質、海洋、遙感、海南省、地區經濟等多個方面。
國土資源部與科技司安排了國土資源部“九五”科技項目“GIS支持下的國土資源信息研究――國土資源信息元數據研究項目”。該項目由國土資源部信息中心牽頭,組織了國家基礎地理信息中心等單位參加,經過詳細的調研,參考國際標準化組織元數據標準(ISO19115),制定了《國土資源信息核心元數據標準》,該標準的制定符合中國國土資源管理和信息服務實際需要。
國家地質調查局參考FGDC元數據標準、加拿大地質調查元數據標準、《NREDIS空間元數據內容標準》等多個元數據標準,起草了《地質調查元數據內容與格式標準》,該標準適合對各類地質調查數據化信息資源進行簡要描述、數據集與資料編目及信息交換。
為了加強氣象資料共享,進一步促進氣象資料更好地為經濟建設、國防建設、社會發展和人民生活服務,國家氣象局在氣象信息共享標準化方面也做了大量的工作,氣象數據元數據標準就是氣象數據共享工作中的重點工作內容之一。國家氣象局WDC-D暨“中國地球科學數據中心完善與服務-氣象學科部分” 項目參照國際氣象組織的統一元數據標準制定了《氣象元數據格式標準》,該標準已實際應用與國家氣象局的元數據建庫和元數據服務系統的建設中。
為促進中國的科學數據共享,科技部非常重視科學數據共享的元數據標準化工作。根據科學數據共享標準化工作的規劃,科學數據共享工程開展了元數據相關標準(包括元數據標準化基本原則和方法、元數據內容)的研究。
國外元數據的標準化
各國政府都開始把利用信息技術改進傳統管理方式看做是新世紀政府變革的重大機遇和挑戰。由于西方發達國家的信息化基礎比較好,再加上其政治體制的特點,因此美、歐等國和地區的電子政務起步較早、發展較快。其中較為成熟的是美國政府資源索引服務和英國電子政務元數據標準。
美國政府資源索引服務(GILS,Government Information Locater Service) 是一個辨識描述政府信息資源,提供獲得該資源方式的系統。GILS代表“系統”、“元數據”及“服務”等概念。它依據Z39.50建立系統規格書,并設計專屬政府信息的元數據欄位,建立一套指引記錄(類似編目款目),可在網絡環境中檢索并取用,且記錄中可能包含超鏈接,指向實際文件,提供公眾便利獲取政府信息的服務。依照GILS發展指引服務的國家較多,包括美國、加拿大、日本、俄羅斯等國家都相繼采用它作為政府相關資訊的元數據格式。這不僅提高了政府資訊傳播的效率,人民對于政府也增強了了解,而且對于未來各國政府政務信息的交換與共享也提供了方便。
英國電子政務元數據標準(E-GMS ,e-Government Metadata Standard)標準制定了元素、元素精煉、編碼規則,以供政府人員為他們的信息資源創建元數據或設計檢索系統時使用。E-GMS的第一個版本是由簡單的都柏林核心(DC)元素構成。E-GMS在修訂時已近可能吸納DC的元素、元素精煉和編碼規則。它定義了政府公共部門電子政務元數據的結構和規則,政府部門在創建其信息資源的元數據或設計信息系統的檢索系統時都要遵循該標準。E-GMS用于實現數據的互操作,便于公眾找到所需要的政府信息和服務,而無須了解政府部門的組織結構和職能配置。
元數據的互操作與交換
按照不同元數據標準而采集和建立的元數據庫,在更大范圍內的信息資源開發和利用過程中遇到了元數據內容的互操作問題?;ゲ僮鞯谋举|問題實際是語義問題,不同領域的元數據標準的制定都帶有本領域對特定概念的理解和認識,表現在元數據標準上的是元數據實體和元數據元素的“同名異意”以及“異名同意”問題。要解決元數據標準互操作問題,首先,需要明確各標準中元數據實體以及元數據元素的含義; 其次,根據確定的含義建立不同元數據標準的元數據實體和元數據元素映射關系; 最后,在信息系統實現層面,由軟件實現對不同元數據標準的翻譯,對于某些需要整合已有不同標準元數據庫到統一元數據庫的情形,可以由軟件系統進行統一的數據轉換處理。
元數據庫建立后,不可避免要產生元數據導入、導出、元數據交換等需求,在該項活動中,首先需要確定是元數據的格式和編碼。不同的系統可能產生不同的元數據記錄的轉換格式。目前,采用XML作為元數據轉換格式逐漸成為異構元數據庫(系統)間元數據交換的主要形式。
背景資料
為什么要提出信息資源目錄?
人類經濟社會發展歷經農業社會和工業社會,目前,正加速向信息化社會發展。信息化社會是人類經濟社會發展所必經的一個嶄新階段。在此階段,以信息技術為支撐,以信息資源的開發和利用為核心,全面整合人類的各項生活和生產活動,推進人類文明向前邁出一大步。
信息資源是信息化社會的基礎和核心,是重要的生產要素和無形資產。信息資源的內容涉及到人類活動的各個領域和各個層次。在領域上,信息資源的內容包括了科學、教育、文化、衛生、軍事、經濟等各個方面; 在層次上,信息資源的內容包括了反映國家和地區整體活動特征的宏觀社會經濟活動信息,以及表征微觀世界的物質組成信息等。從信息資源的表達形式上,包括了文本、數字、圖像、音頻、視頻等。
目前,隨著信息采集手段的增強以及信息利用層次的提高,整個社會的信息資源的數量正處于加速度的狀態。例如: 圍繞人自身的各種活動,需要各種類型的信息進行支撐,包括人員的基本信息、教育信息、就業信息、醫療信息等,這些散落在各行業、各部門的信息以每個人1MB的數據量進行計算(不計算涉及到個人的多媒體信息),僅中國13億人口的信息將達到1300TB。再以對人類居住的地球的自然環境特征的了解為例,通過向太空發射衛星,在地面設置各種監測站(點),已經形成了超海量數據的獲取能力。在太空,各種類型的衛星,包括氣象衛星、軍事衛星等已經形成了PB級信息,并且隨著新的衛星的發展和衛星影像分辨率的提高,積累的數據量將形成滾雪球的效應。在地面,人類設置了監測水文、地震等各種類型的,數以萬計的不同類型的監測點,近乎實時的進行各種信息的采集。
不斷增長的信息資源數量向信息資源的深度開發和利用提出了新的課題。人類社會區別與其他動物的顯著特點是社會化的分工合作,通過社會分工和專業化的發展,極大地提高了生產效率,同時社會化分工也需要各層次、各行業、各部門進行緊密溝通和協作。社會化分工越細、層次越多,用于溝通和連接的信息量越大,信息溝通的頻率也將加快。尤其在信息化社會,當信息資源作為生產要素參與整個人類的經濟社會活動時,信息資源的共享和交換越來越成為迫切需要解決的問題,通過信息資源的跨行業、跨部門的共享以及信息資源的有序交換,可以增強社會生活各環節之間的聯系。同時,由于信息資源的可重復可拷貝特性,當信息資源實現共享和交換后,信息資源的價值將出現倍增效應。因此,信息資源的共享和交換必將極大地推動社會經濟的發展。
元數據范文4
【摘 要 題】信息資源建設與管理
元數據是“關于數據的數據”或“關于數據的結構化數據”,現在常說的元數據,是特指在標記語言(SGML、HTML、XML)環境下,對網絡信息資源進行描述的解決方案,主要是用于網絡信息資源的發現、存儲、管理和檢索利用。在當前網絡信息呈異常迅猛發展之勢,大量的多樣性的數字化資源,使得信息的利用和查找十分困難。為了解決這一問題,在國外已有了很多的元數據研究項目和成果,建立和運行了一些描述網絡信息資源的元數據模式。元數據的應用,為網絡信息資源的有序組織、適度控制和高效檢索利用,提供了便利的條件。近年來,中文網絡信息資源也在迅速增長,盡快研究和制定中文核心元數據標準,已是非常迫切的了。在制定中文元數據標準時,既要考慮到中文元數據處理的特殊性和中文資源的應用特點,更要從全球的信息大環境出發,分析、研究和借鑒國際上先進的、通用的元數據標準,在盡量保持與國際標準接軌的基礎上,制定符合中文資源應用需要的擴展與應用規范。
1 中文元數據標準應以DC為基本框架
在國際上眾多的元數據方案中,Dublin Core Element Set(都柏林核心元素集,簡稱DC),以其結構簡單、語意互通和可擴展等特性,事實上已成為國際范圍內通用的網絡信息資源描述的元數據標準。DC經過幾次國際會議的研討和修訂,已逐步完善和成熟。所以,制定中文元數據標準應以DC元數據為基本框架。國內在四五年前就已開始了對DC的探討和研究,但至今尚未完全形成依托中文環境的DC元數據標準。當前應進一步加緊深入地對其進行研究和規范,形成中文元數據的一個標準核心集,以適應中文網絡信息資源的發展。中文元數據標準應完全按照DC元數據集來建立,在具體作法上要注意以下一些問題。
(1)完全按照DC元數據的框架結構來制定中文元數據標準。由于網絡信息資源在時空上的廣泛性和開放性,與傳統的文獻著錄的相對封閉性有著很大的不同,因此,中文元數據標準的制定,應強調與國際接軌,保持完整的一致性。也就是說要完全遵循DC元數據的框架結構來構建中文元數據標準,而不應該提出“以DC為主,參考其它元數據標準”來搞中文元數據標準。我們應汲取CNMARC的教訓,避免把中文元數據標準搞成“CNDC”。中文元數據標準應該只是對DC元數據進行本地化和中文化的處理,對它的內涵、外延等用中文予以標準地詮釋,方便使用中文的著錄者和檢索者理解與利用,僅對于著錄和檢索中文信息資源的一些特殊性和應用特點等有限的方面進行規范的規定和定義。
(2)中文元數據標準的制定,應完全保留DC元數據的基本特點。一般地講,內在性、可擴展性、獨立句法結構、可選擇性、可重復性和可修飾性是DC的6大特點,在實踐中集中地表現為DC元數據的簡易性、通用性、兼容性以及靈活的可擴展性,這些特性是DC能夠成為一個國際上通行的元數據標準的原因,也是建議中文元數據標準應完全按DC來制定的理由。因此,在制定中文元數據標準時,要完全保留DC的基本特點,不應有任何的更改。在國內有些使用DC元數據時,將某些元素規定為“不可重復”或“必備”等等,這種做法是不可取的。
(3)應以國際通行的DC修飾限定詞作為中文元數據的規范和擴展的依據,而不應采用其它形式。DC修飾詞提供了對元數據的擴展描述,可以縮小元素的含義范圍,使其更具有專指性,或是對元素進行規范性說明。目前,DC已正式確定了三類修飾:模式體系、語言種類和類型。如為了表達不同的日期,在使用“Data(日期)”這一元素時,可以增添“Created(創建)”、“Valid(有效)”、“Issued(發行)”、“Modified(修改)”等修飾詞。在中文元數據標準中,不應把這些元素的修飾詞解釋為子元素。元素與加了修飾詞的元素沒有主次之分,修飾詞并不改變元素本身的定義。元數據標準中,不應出現子元素的提法。元素的修飾限定和規范,是元數據元素的內在特性,是元素的不同表現形式,絕不能把元素和加了修飾詞的元素看作是元素與子元素的關系,應堅決防止中文元數據標準的MARC化傾向(在MARC中就有的字段、子字段之分)。元素與加了修飾詞的元素或多個附加了修飾詞的元素同時出現,是元數據的元素可重復性的體現。轉貼于
2 中文元數據標準應形成一個完整的體系
中文元數據標準是整個網絡上中文信息資源及中文電子出版物等的著錄和檢索的工具,其應用范圍是很廣泛的。因此,制定中文元數據標準的同時,還應對所涉及的相關的標準、規則和條例等進行研究、修改和制定,并逐步完善其推廣應用機制,使中文元數據標準逐步形成一個完整的體系,更好地服務于日益發展的中文網絡信息資源的開發和應用。與中文元數據標準相配套使用的一系列標準、規則和條例等的制定、修訂,要本著易用性、通用性、國際性和規范化、標準化、自動化的原則進行。這方面的工作主要的有以下一些:
(1)修訂和完善各類中文信息的代碼體系,并盡量與國際通用的代碼一致起來。制定有關中文的“資源類型表”、“格式類型表”、“關聯值列表”等,以規范中文信息資源的著錄和檢索利用。
(2)制定有關中文關鍵詞選詞截詞等規則,以適應中文信息資源的自動化著錄和檢索。制定中文網頁及電子出版物、數據庫等的制作規范和條例。
(3)編制一個簡單易用,能夠適應數字化信息著錄和檢索的“中文信息資源樹形分類表”。目前圖書館界廣泛應用的《中圖法》,其分類體系和類目設置均無法適應網絡時代信息分類的要求。
(4)建立一個像OCLC的CORC項目那樣的中文元數據在線編目系統,免費提供中文網頁或電子出版物的元數據自動生成。還應建立CNMARC與中文元數據的映射表,提供CNMARC數據向中文元數據格式的轉換等服務。
(5)仿照印刷文獻的在版編目(CIP)規定,制定中文網頁和電子出版物的在版元數據著錄規定,以行政手段強制要求所有正式注冊的中文網頁及電子出版物等,必須具備元數據著錄項目,實現中文網絡信息資源的作者著錄,使中文元數據能夠較快地在大范圍內推廣,方便中文資源的高效利用。
元數據范文5
關鍵詞:地理信息元數據 元數據的設計 管理模式
中圖分類號:P2 文獻標識碼:A 文章編號:1672-3791(2013)04(a)-0064-02
隨著“數字地球”,“數字中國”的付諸實施,空間信息飛速擴長,如何有效管理、使用、共享這些異構、多源、海量數據的問題日益突出,地理信息元數據以其描述性、開放性、簡易性而逐漸得到認可[1]。元數據是關于數據與信息資源的數據,即關于數據與數據集的內容、質量、狀況和其它特性信息,是實現數據高效組織、管理、維護、快速檢索、訪問、存取的核心和關鍵技術之一[2]。地理信息元數據是關于地理相關數據和信息資源的描述信息。地理信息數據內容繁雜且數據量龐大,建立地理信息元數據是對其進行管理及共享的有效可行方法[3]。它通過對地理空間數據的內容、質量、數據格式、數據采集時間和其他特征進行描述與說明,幫助人們有效地定位、評價、獲取和使用地理相關數據[4]。
1 地理信息元數據確定的原則
建立元數據集合,是幫助人們理解和使用元數據所描述的數據對象,以實現空間數據的標準化為目的,以實現數據的共享為前提[5]。元數據的選擇和組織必須遵循一定的規則,以全面描述數據對象,并方便用戶使用。地理信息元數據的確定需要遵循以下的原則。
1.1 完整性
元數據設計中需要挑選出一些最重要的元數據,構成核心元數據集。核心元數據是有效描述數據特征的最小元數據數據集合,它應該完整地描述數據集最重要的信息。
1.2 準確性
各個元數據元素應該從某個側面準確地描述數據集合的某些特征。在確定核心元數據內容的時候,需要對相關領域的理論與技術有全面的了解,準確而簡潔地將描述數據集主要特征的數據元素整合起來。
1.3 結構性
地理信息元數據之間具有復雜的聯系,應根據實際其結構聯系進行合理組織,以便對元數據進行修改或擴展時不破壞其整體結構。
1.4 與其它標準的一致性
由于元數據也是其他標準的高度概括,在制定元數據時,應調研相關領域現有的國家標準與國家、行業準則,盡量采用已頒布的標準。
2 地理信息元數據的主要內容
目前,地理信息元數據還沒有一個統一的全球性標準。通常采用以下幾方面的內容。
(1)標識信息。它是唯一標識數據集的元數據信息。通過標識信息,用戶可以對已有的數據集有一個總體的了解,如數據集的名稱、時間、版本、空間范圍、表示方式、空間分辨率、信息類別、數據集的聯系信息、數據集法律和安全限制等。
(2)數據質量信息。它數據集質量的總體評價,包括數據集在數據完整性、邏輯一致性、位置精度,時間精度(時間表示的精確程度、現勢性、有效性)、屬性精度(數據集屬性分類的正確性、屬性值的精度和正確性)等方面的綜述以及說明數據質量的保證措施,以及數據源、數據處理過程、數據志等說明信息。
(3)空間參照系統信息。它是對數據集使用的空間參照系統的說明。
(4)內容信息,描述數據集的主要內容,包括實體和屬性信息。
(5)分發信息,描述有關數據分發者的信息及獲取數據的方法。
(6)核心元數據參考信息。包括核心元數據參考信息,用戶可以了解到核心元數據內容的現勢性等。
3 地理信息元數據的設計
元數據設計過程中,通常根據實際應用的需要,參照已有元數據標準確定元數據體系。近年來,西安市城市建設快速發展,地理信息元數據是空間數據交換的基礎,也是空間數據標準化與規范化的保證。西安市勘察測繪院為了提高生產管理質量,更好的滿足城市發展的需要,在地形圖的生產中也加強了在元數據方面的管理。下面以我院生產為例,簡要說明地理信息元數據的設計。
(1)元數據標準主體組成,如表1所示。
(2)元數據結構。以目前我院地形圖數據的生產管理為例,地形圖元數據結構,如圖1所示。
(3)元數據的錄入。以我院地形圖數據信息錄入為例,如圖2所示。
(4)元數據的更新和維護。元數據隨地圖數據的變化而變化,元數據的更新管理主要通過版本管理來實現,這樣數據管理者可對歷史數據及最新數據進行全面的管理。
(5)元數據的質量保證。元數據的數據質量是數據質量的一個部分,也是數據質量的基礎。在元數據庫建立、更新、維護的全過程中,必須保證元數據質量。擴展的標準要進行一致性測試,元數據操作工具應具備保證質量功能,有條件的應進行質量評價[6]。
4 地理信息元數據的組織與管理模式
4.1 元數據的邏輯組織可采用如下方式
(1)按照元素性質來組織。這是通常的元數據組織方式。由唯一標識一個數據集、說明其空間和時間范圍、狀況、法律限制和保密限定所需的信息的元素構成標識信息子集等。
(2)按照功能來組織。主要方法是將元數據分成描述性元數據、結構性元數據、功能性元數據三類,分類進行組織。
(3)按照重要程度來組織。按照元素使用的頻繁程度或者重要性差異,將元素分成核心元素和一般性元素,其中核心元素是所有類型的數據所共有的。如英國Dublin元數據核心元素模型和澳大利亞、新西蘭元數據核心元素模型都是如此[7]。在區分核心元素與一般元素的基礎上,又對核心元素按照不同的側面進行分類。
4.2 元數據的管理模式
空間數據飛速增長,我們通過建立若干分布的、相對獨立的元數據倉儲,它們分別對應于不同的部門或地區,然后通過元數據交換標準實現信息共享和分布異構系統的集成[8]。從業務需求來看,元數據管理系統用于存儲、管理和共享各種元數據,一個良好的系統應具備集成性、可擴展性、可制定性和開放性等基本特征[9]。鑒于MOF和XMI的特點和發展經驗,我們基于MOF和XMI設計了空間元數據的管理模式,如圖3所示。
5 結語
隨著計算機技術和GIS技術的發展,已經積累了大量的地理信息數據,要實現數據的管理和共享就必須依賴于空間數據和屬性數據以外的一種特殊數據。地理信息元數據能夠幫助生產單位有效的維護和管理數據,提供有關數據生產單位的各種有關信息,供用戶查詢,幫助用戶了解數據,提供有關信息,以便用戶處理和轉換有用數據,采用元數據也可以便于數據的共享。我們在生產管理中,應根據相應的規范,并且結合自身的生產需求做好元數據的錄入,管理工作。通過我院元數據在基礎地理信息系統中的建立與運行,說明元數據的功能是穩定的,應用起來也比較方便,能夠在城市基礎地理信息系統中發揮重要的作用。我們將進一步改進與完善工作細節,開發研究元數據擴展的必要性和擴展的基本方法,更好的提高工作效率,使地理信息元數據在地理信息領域的應用中擁有更為廣闊的前景[10]。
參考文獻
[1] 周新忠,余木良,陶亮,等.關于地理空間元數據技術發展趨勢的理論探討[J].測繪科學,2007(2):172-175.
[2] 趙汗青,郭剛.地理空間信息元數據模型[J].測繪通報,2002(z1):19-23.
[3] 滕連澤,劉洪斌,武偉,等.地理空間元數據管理的研究[J].農業網絡信息,2005(8):39-41.
[4] 沈體雁,程承旗.地理元數據技術系統的設計與實現[J].武漢測繪科技大學學報,1999(4):326-330.
[5] 牛曉琳,季民,趙志剛,等.基于元數據管理的數據共享研究[J].船舶電子工程,2006(1):71-74.
[6] 祝方雄.城市地理信息系統中元數據標準的研究[J].城市勘測,2001(3):37-41.
[7] 羅英偉,邢彭齡.基于XML的地理信息元數據系統[J].計算機學報,2005(7):1205-1212.
[8] 王繼周,李成名,林宗堅,等.面向共享的空間元數據管理框架研究與設計[J].國土資源遙感,2003(3):67-70.
元數據范文6
摘 要:當前基于聯邦數據庫方向的多媒體聯邦數據庫系統已經取得較大發展。然而.在大多數項目研究中,很少有項目將重點放在元模型的研究上。反過來說,標準數據庫系統(關系,對象關系.面向對象)沒有定義了一種多媒體和聯邦特點的元數據模型。在這篇文章中,提出了一種多媒體聯邦數據庫的元數據結構的規范。這種規范的結構是基于一種新的面向對象的元模型.而這種元模型是支持多媒體類型和聯邦元數據的。通過使用這種元模型,聯邦多媒體的管理者和用戶能夠準確的確定出數據是如何構成的,以及操作類型是如何允許實現的。
關鍵詞:聯邦數據庫:元數據:多媒體
中圖分類號:TP311 文獻標識碼:A 文章編號:1009―3044(2007)01―10035-03
1 引言
許多應用需要存取未名結構的數據庫,初始目標是確定數據庫的實體以及他們之前存取或修改數據的關系。在這種聯邦數據庫的領域中,作為全局管理者或工程師經常需要使用各種不同類型的軟件系統,構成一種或多種全局模式。這種數據庫存取的類屬性形式相當于是一種映射,這種映射表明了動態結構和調用請求的可能性。
EGTV(基于視頻媒體的全局有效事務)的目標是通過普通的元模型界面將媒體集合成大量多媒體數據庫系統。這項研究的貢獻在于為聯邦多媒體提供了一種元模型的規范,這種規范的執行不僅被映射到對象數據庫管理組(ODMG),而且還被映射到對象關系的元數據模型中。此外,這種規范的重點在于如何采用元數據來集成大型多媒體系統。
在EGTV項目中,可以通過分布結構的形式為多媒體提供一種高效的數據存儲系統。但是它無法采取一種簡單的集中化數據存儲形式。因此EGTV項目的一種解決方案是使用標準的面向對象和對象關系的聯邦數據庫來存儲大容量的多媒體數據。使用聯邦結構的好處是能夠集成大量的可以橫跨多個數據庫的多媒體,以及可以通過創建本地存儲多媒體數據的對象視圖來定義全局模式。通過分散地數據庫站點來增加系統的整體存儲容量。這種聯邦結構能夠定義私有多媒體數據庫,這種數據庫能夠在將來被應用為全局模式。而這種聯邦的好處是,通過單一的聯邦模式,許多用戶能夠瀏覽大量的多媒體數據。
2 EGTV系統結構
在本節中提出了一種系統結構,這種系統結構是在聯邦數據庫中通過各種不同的多媒體數據源來構成一種全局模式。它依據聯邦數據庫系統的標準結構,通過一些必須的修改來進行多媒體數據的處理。
如圖1所示的結構可以分為五層,每一層都可以以數據庫模式被定義。這種模式可以通過層與層之間的處理器來創建與操作。通過以下幾個方面,我們可以看出這種結構與普通的五層結構是不相同的。首先,多媒體數據存儲在數據庫層;其次,EGTV元模型定義了一種規范模式,并且通過使用兩個不同的處理器(查詢處理器和轉換處理器)與數據庫層進行相互作用;最后,表面層將通過CORBA和XML的界面形式給客戶機提供聯邦模式人口。
數據庫層:在這一層,聯邦結構系統的所有數據都存儲在ODMG數據庫或對象關系數據庫中。數據庫作為數據和多媒體對象的物理存儲器來使用,但是它也可以以封裝的形式來存儲私有多媒體數據。
規范層:規范層通常來說包含數據和元數據兩部分。規范模式將會在EGTV元模型中體現。這一層定義了數據庫模式,也可作為局部數據存取的入口。從圖1的結構圖中,可以看出用戶通過查詢處理器或轉換處理器在數據庫層與規范層之間進行數據存取。
視圖層:視圖模式是規范模式的子集,并被共享在其他數據庫之內。它以對象視圖的形式來表述。
聯邦層:多種視網模式通過綜合處理器可以綜合成聯邦模式。在EGTV模式下,聯邦層存儲的模式為聯邦元數據形式,它可為全局查詢提供一個存取點。
表面層:表面層的作用是轉換聯邦模式以及為客戶機存取提供可相配的子系統。從圖1中可以看出,表面層通過XML和CORBA兩種界面可與聯邦數據庫進行數據存取。
轉換處理器:轉換處理器將本地數據庫的數據和元數據轉換成標準的聯邦類型。
查詢處理器:查詢處理器通過規范層模式將被提交的查詢轉換到本地數據庫。在EGTV模式下得到的查詢結果將以編碼的形式返回到規范層。
過濾處理器:過濾處理器可以通過過濾和調整存儲在規范層中的元數據創建視圖子模式。
綜合處理器:綜合處理器可創建一種連接,它可將多重視圖模式與聯邦模式相連接。
CORBA界面:聯邦系統的客戶機可以使用CORBA界面對聯邦模式的數據存取進行程序設計。
XML界面:XML界面為聯邦模式下的數據存取提供了一個通用的查詢方式。
3 EGTV元模型規范
3.1定義命名范圍
每一個數據庫實體都必須在它作用范圍內擁有一個唯一的名稱。例如:在數據庫模式中,類名稱是唯一的,因此其屬性名稱也是唯一的。因為每一個元類都為其包含的元素提供了命名范圍.所以元模型中的命名范圍和包含關系是緊密聯系的。如圖2所示.在元類與元類之問,元模型定義了一個單一的包含,范圍的關系。
在圖2中,sys_MetaObject是為元模型所有要素一個抽象描述,它定義了幾個通用屬性:name、meta Type、virtualLevel、com―ment。元模型sys MetaObject派生了sys_Property、sys_Parameter、sys_lnheritance三個元類,其他的元類(sys_Type、sys_Operation、sys-schema)則是由元類sys_ScopedO biect派生出來的,而元類sys_ScopedObject又是由元模型sys_MetaObject派生出來的。
3.2定義類型
在數據庫中所定義的類型必須以從元類sys―ScopedObiect派生出的元類的類型作為依據。如圖3所示,所有的數據類型將在元數據類層所體現。元類sys_Type是數據庫中所有類型的一個抽象描述,從它可以派生特殊的元類。我們的元模型通過允許可以使元類sys_Type更快地操作,然而ODMG元模型只允許用戶通過定義類來完成操作。
元類sys Tvpe作為系統和用戶定義類型的規范。我們使用系統類型去定義類屬性的類型或操作參數的類型,但是不能用系統類型去定義自含數據庫對象。
3.3定義屬性
從圖1中可看出.元類svs_Property是從元模型sys_MetaOb-iect中直接派生出來的。而在圖4中可以看出,類的成員是由元類sys Attribute所指定的,它的每一個屬性都可以通過使用isStatic特性和isConstant特性被定義成Static和constant。我們可以用系 統類型或類類型去定義屬性,每一個屬性都只有一種類型,但是同樣一種類型可以用于多個屬性。從圖4中,可以看出,at-tribute_type是元類sys_Attribute和元類sys_Type兩者之間的關系,而元類sys Type其實是真個元模型中所有類型的一個超類。
3.4定義繼承
繼承是面向對象程序設計的一個重要特征,它通過繼承原有類派生出子類,進而構造出更為復雜的數據類型。利用繼承,可以來創建一個具有公共屬性的類,然后根據需要創建具有特有屬性的新類以適用于不同的情況。繼承是在原有父類基礎上添加程序代碼建立新類,而這個新類既能運行自己定義的方法.也可以運行父類中定義的方法,從而達到代碼復用的目的。如圖5所示.參數positionNumber就是一個基類的多重繼承定義。
3.5定義操作
我們可以用系統類型和類去定義操作。指定操作的系統類型是類型定義的一部分,但是不能被用戶修改。元類sys_Operation是數據庫中所定義的所有操作的抽象描述,它是從元類sys_ScopedObject中派生出來的。如圖6所示,可以采用opera-torKind特性將操作符定義為一元操作符和二元操作符.若給方法增加static或virtual修飾符,sys_Method的特性methodKind就可以被指定。
3.6定義模式
模式可以作為類和對象視圖的頂層容器?;陬惡鸵晥D的對象能夠在數據庫模式下被記錄。從圖1可以看出,元類sys_Schema是從元類sys_SeopedObject派生出來的,而從圖7中可以看出,元類sys_Schema又派生了兩個元類:sys_Databas.eSchema和sys_SubSchema
3.7定義視圖
sys_SubSchema是一種特殊的“模式”,它的作用是提出對象視圖。它包含基類和虛類,每一個子模式都隸屬于數據庫模式。視圖在子模式下提出的是可行的,但是在僅僅在虛類下提出是不行。對象視圖為面向對象數據庫模型重載了模式功能,這樣就可以適用于不同的聯邦模式數據庫。
3.8元一元數據層
在某些抽象層內,每一個元數據模型都可以描述數據庫模式的結構。我們的元數據模型可以專門用來支持多媒體元數據。在圖8中給出了元一元數據模型的規范,我們可以看出元一元數據模型對整個系統是非常有益的,因為它允許我們指定一個新的元模型,還可以在已有的基礎上增加新的元類。
4 元模型的映射
EGTV元模型的規范的執行不僅被映射到對象數據庫管理組(ODMG),而且還被映射到對象關系的元數據模型中。由于有部分EGTV元模型功能沒被映射到ODMG和對象關系規范中.因此映射并不包含全部EGTV元模型功能.例如定義多媒體類型和創建對象視圖。ODMG和對象關系元模型必須具有擴展性,可以隨時支持新的EGTV元模型功能。
4.1 EGTV到ODMG的映射
EGTV元模型是基于ODMG元模型規范的,因此兩種元模型可以共享相似的面向對象平臺。對于兩種元模型的相似定義的元類,映射的實現是相對簡單的,但是對于多媒體類型或對于對象視圖來說,映射的實現是比較復雜的。這一節主要解釋了映射的規則,在表1中給出了EGTV主要的元類以及它們對于ODMG元模型的映射。
4.1.1模式映射
元類sys_Database模式定義了數據庫模式屬性,包括為所有模式要素定義的根命名范圍。它被映射到元類d_Module中,這樣在ODMG元模型中就會產生一個等效的類。由于每一個數據庫模式都在sys_DatabaseSchema中被指定。因此通過映射就會在ODMG元模型中創建一個d_Module實例。在例1中就說明了這種模式映射。
例1:ODMG模式映射
Map sys_DatabaseSchema:=d_Module,d_Extension
{attribute:
isFederated:=d_Extension.isFederated
databaseTvpe:=d Extension.databaseType
relationship:
containedIn:=d_Module.definedIn
containedObjects:=d_Module.defines}
4.1.2類映射
兩種元模型都通過單一的元類表示了數據庫類。在例2中就說明了這種類的映射。
例2:ODMG類映射
Map sys_CLASS:=d_Class,d_Extension
{attribute:
isAbstract:=d_Extension.isAbstract
relationship:
containedln:=d―Class.definedIn
containedObiects:=d Class.defines
inheritsTo:=d Class.inherits
derivesFrom:=d Class.derives}
4.1.3屬性映射
EGTV的類sys_Attribute定義的每一種屬性都映射到了ODMG元類d_Attribute中。sys_Attribute中的所有屬性和關系都被映射到相應的d_Attribute的屬性和關系中。
4.1.4繼承映射
繼承映射是從元類sys_Inheritance映射到ODMG所定義的類d_Inheritance中。所有的元類sys_Inheritance的屬性都被映射到類d Inheritance中。
4.1.5關系映射
EGTV中的元類sys_Relationship將映射到ODMG的元類d_Relationship中。在例3中就說明了這種類的映射。
例3:ODMG關系映射
Map sys_Relationship:=d_Relationship,d_Extension{attribute:
cardinality:=d_Relationship.cardinality
accessKind:=d_Relationship.accessKind
isUnique:=d_Extension.isUnique
isOrdered:=d_Extension.isOrdered
relationship:
containedln:=d_Relationship.definedln
traversal:=d_Relationship.traversalI
4.1.6數據類型映射
在EGTV模型和ODMG模型中原始的數據類型和集合數據類型以相同的方式被實現。在表2中可以看出。sys PrimitiveTvD£被映射到d_Primitiverrype中,而sys_CollectionType則被映射到d_Collection_Type中。在EGTV元模型中定義了多媒體類型,但在ODMG中卻沒有與此相對應的類型。此外.多媒體類型能夠定義一種行為方式,這種行為方式是不支持ODMG元模型類型的。
4.1.7對象視圖映射
對象視圖包含一個或多個虛擬類,它可以被當前工作的視網子模式所表示。EGTV元模型是支持對象視圖和虛擬類的.但ODMG元模型是不支持對象視圖的,所以ODMG只能通過擴展本身才能支持對象視圖的映射。由于篇幅限制,這里就不討論對象視圖的映射規則。
4.2 EGTV到對象關系的映射
由于對象關系數據庫還未擁有一個標準的元模型,因此在這篇文章中,我們采用OracLe元模型作為我們的元模型。對象關系模式可以通過一系列的關系表存儲關系和對象關系元數據。EGTV元類與Oracle模型倉庫的映射如表3所示。
5 結束語