醫療健康大數據分類及問題

前言:尋找寫作靈感?中文期刊網用心挑選的醫療健康大數據分類及問題,希望能為您的閱讀和創作帶來靈感,歡迎大家閱讀并分享。

醫療健康大數據分類及問題

[摘要]%根據數據來源將醫療健康大數據分為四類:臨床大數據、健康大數據、生物大數據和運營大數據??偨Y其內容與特點,提出醫療健康大數據研究需要在開發集成和分析工具、整合個人健康記錄與電子健康檔案、平衡隱私保護與信息共享之間的矛盾、完善醫療衛生信息標準體系等方面予以提升和改進。

[關鍵詞]%醫療健康大數據;電子健康檔案;個人健康記錄;生物醫學信息

醫療健康大數據面向健康人群、患者、醫生、醫療機構、政府、藥械企業、保險公司等主體,以需求為導向,在臨床科研、公共衛生、行業治理、管理決策、惠民服務、產業發展等方面影響著整個醫療行業的變革。醫療健康大數據促進了醫療數據挖掘和知識發現的研究,不同來源的異構數據量巨大,語義和數據集成已經成為醫療數據分析研究中不可避免的問題,需對各類數據進行多方面的整合,如社會經濟、生活方式、行為、臨床、生理、細胞學以及疾病機制等數據;同時,需要將生物醫學研究部門的研究數據向社會透明公開,消除數據隱私和監管限制。醫療健康大數據研究涉及計算機科學、數據科學、系統工程、機械工程、電子工程、人文因素、社會科學、醫學和其他健康服務學科,需要研究人員跨界合作。

1醫療健康大數據分類

醫療健康大數據是人類與醫療及生命健康相關的活動過程中產生的數據集合。根據健康活動的來源,醫療健康大數據可以分為:臨床大數據、健康大數據、生物大數據、運營大數據。

1.1臨床大數據

臨床醫療的主要目標是關注個人身體健康狀況,臨床數據主要包含電子健康檔案、生物醫學影像和信號、自發性報告系統等數據。電子健康檔案(electronichealthrecords)是在一定時期內健康服務人員用來管理、存儲、共享醫院門診和住院處、精神衛生中心、基層醫療機構、藥物處方等異構醫療數據,并進行分析的個人終身健康檔案。電子健康檔案涵蓋了與患者相關的所有關鍵臨床信息,如人口統計學信息、以往病史、進展說明、問題、藥物、生命體征、實驗室數據、免疫接種、放射學報告、醫師觀察、收費信息和保險信息等。電子病歷是指以信息化為媒介,用電子化方式來保存、管理、輸出、傳送患者醫療記錄和健康信息的方式,是建立電子健康檔案的基礎和重要組成部分[1]。電子病歷可以滿足多個醫生同一時間查看患者病歷,可以作為參考資料,將循證指南并入日常的臨床實踐中。電子健康檔案可以讓醫生更好地了解患者按ICD、HL7-CDA等標準分類的結構化數據或text、pdf等格式的非結構化數據,同時可以記錄和跟蹤患者健康數據并對其加密,從而確保數據的隱私和安全。生物醫學影像和信號提供由皮膚、骨骼以及生物活動產生的電信號或磁信號,產出解剖結構的高質量圖像,包括磁共振成像、計算機斷層掃描、正電子發射斷層掃描、超聲波、心電圖、腦電圖、神經電圖、肌電圖、胃電圖、心音圖等。生物醫學影像和信號屬于非結構化臨床數據,數據庫利用信號處理技術自動按病理分類,彌補了人工分類的局限性[2]。自發性報告系統通常用于上市后的藥物安全性監測。目前一些研究使用了FDA不良反應報告系統的數據來監測藥物不良反應,效果良好。然而不良反應報告生成需要耗費較大的工作量,且自發性報告系統在報告不足的情況下反饋較差,許多健康群體不了解或不具備足夠的信息來提供報告,因此可能無法及時發現很多藥物的不良反應[3]。

1.2健康大數據

健康大數據包括對個人健康產生影響的生活方式、環境和行為等方面的數據。當前創新型數字化健康設備和應用不斷進步,提供了個人健康數據用于個人醫護的獨特環境:一方面健康大數據使患者在自我健康管理中扮演更積極的角色;另一方面極大地增強了醫生對患者生活的臨床洞察力。健康大數據主要可以分為個人健康記錄、社交媒體健康數據和潛在的健康數據。個人健康記錄(PersonalHealthRecords,PHRs)主要包括個人自我追蹤設備、可穿戴設備等采集的連續的健康數據。個人健康記錄可以用來跟蹤正在進行的治療或監測,了解個體通過專業健康服務人員開展的健康狀況管理情況;同時還包含病人自我管理的健康數據,如食物追蹤、日常活動、血壓檢測等。個人健康記錄設備能捕捉到較長時間范圍內多個臨床數據點,改善臨床設置的限制,是臨床個人健康數據的有力補充,醫生可依據健康監測數據及時驗證和調整診療方案。在遠程醫療中,身體活動數據等自我追蹤數據在識別潛在患者等研究中具有開發潛力[4]。社交媒體數據是健康群體提供的在其它任何來源中都無法獲得的健康數據,包括電子郵件、社交工具、短信等溝通工具產生的健康數據。除傳統社交媒體外,越來越多特定的醫療健康類社交媒體網站為健康群體提供接收信息和情感支持的平臺。近年來,許多研究工作都利用這些數據來提取藥物不良反應監測等信息,一些研究也開始利用社交媒體平臺來開展健康干預。潛在的健康數據主要包括與個人健康相關的社會經濟學、依從性、環境、生活方式的風險因素等信息[5],如親屬關系、購買行為數據、第三方支付數據等。潛在的個人健康信息與系統導向的生物醫學研究聯系起來,可以為生物醫學研究和個體醫療之間提供持續、跨領域的溝通[6]。

1.3生物大數據

生物大數據是指從生物醫學實驗室、臨床領域和公共衛生領域獲得的基因組、轉錄組學、實驗胚胎學、代謝組學等研究數據,有助于理解遺傳標記與疾病之間的因果關系,將傳統的“一刀切”治療方法轉變為基于基因組數據的定制治療,已成為一種新興的疾病預防和治療手段。近年來,用于高通量分子分析的整合、管理和探索工具在臨床背景下蓬勃發展[7],與電子健康檔案、健康大數據的互相整合,使開發動態個人健康預測模型成為可能,通過考慮個人生物學背景,有助于實現真正的個性化與精準化醫療,促進臨床實踐與生物醫學專業研究之間的相互作用。

1.4運營大數據

運營大數據是指各類醫療機構、社保中心、商業醫療保險機構、藥企、藥店等運營產生的數據,包括不同病種治療成本與報銷數據,成本核算數據,醫藥、耗材、器械采購與管理數據,藥品研發數據、產品流通數據等[8]。運營大數據可以有效降低醫療費用,有助于醫院精細化運營及成本有效控制,支持保險精確定價;在管理決策方面,可以使決策者多角度掌握醫療機構運營情況,為科學管理提供有力支持。

2問題與展望

2.1開發健康數據集成和分析工具

當前從臨床、健康和生物大數據固有模式中移出數據的成本較高。不同的醫院類型,如教學醫院、社區醫院的臨床環境不同,由于醫學領域本身復雜,設計各類醫療機構信息系統的障礙在于如何得出適用于復雜環境的一致、高效的流程。醫藥行業變量數據過多且因病人而異,信息系統需足夠靈活以適用不同的需求。而不同的系統供應商數據模型不同,數據庫極其復雜、內含許多嵌入式邏輯,供應商一般不會公開自身數據模型,因而移出不同系統的數據具有較大挑戰,相關研究工作多限于特定健康服務提供者提供的數據。因此,需融合云計算、大數據、物聯網、移動互聯網、虛擬現實等信息技術,開發健康數據集成和分析工具,將不同系統數據安全移出專有的數據模型,并高度集成以患者為基礎的數據模型。目前,一些機構應用新的技術和軟件提高健康數據的實用性,并實現了實時的數據結構化與集成分析。如OHDSI提供了通用數據模型以標準化來自不同機構的醫療數據,并開發了系列軟件進行病人隊列篩選、分析變量提取、數據質量分析和統計模型分析,已在多個研究方面證明了基于通用數據模型的共享數據參與臨床大數據分析的可行性[9]。

2.2整合個人健康記錄與電子健康檔案

目前,許多移動健康應用程序和產品都是獨立的,不能整合在一起。PHRs的主要問題是如何使這些數據進入臨床應用環境,將其并入患者電子健康檔案中。為了將自我追蹤等設備得到的個人健康數據真正融入患者治療中,電子健康檔案系統需更具互操作性。目前馬約診所通過第三方,如蘋果的HealthKit授權患者將手機的健康數據發送給醫生。在此過程中,應確保以事實為基礎的健康服務應用程序克服限制,不完全受市場主體利益的影響,通過參考政策和建立平臺來支持健康應用和個人健康記錄/電子健康檔案的整合;由專門機構審核應用程序設備,保證其數據的合理性和可靠性。

2.3平衡隱私保護與信息共享之間的矛盾

生物大數據可提供可靠的個人遺傳學依據,但個人基因組測序等技術面臨一系列法律與倫理困擾,特別是隱私問題。臨床、健康大數據也會涉及個人健康狀況、診療方法、使用藥物等敏感信息,保護隱私仍是醫療健康大數據時代數據共享的核心問題。美國《健康保險轉接及責任法案》對隱私登記事務予以控制,歐盟出臺《一般數據保護條例》對健康數據、許可和科學研究進行了精準闡述,但多數與健康相關的規定,如需要最終知情授權,潛在阻礙了健康數據的收集和分享。隨著對數據需求的不斷增加,健康大數據時代需平衡隱私保護與信息共享之間的矛盾,既要保護個人隱私,也應有開放數據和數據共享模式的集體思維。需要用創新的方法來保護個人隱私與數據,鼓勵信息原作者共享信息,并允許研究人員在個人知情和同意的情況下獲得隱私數據。同時,設計和調整隱私政策,目前國內涉及數據共享的法規尚未形成體系,應建立相關法律保障,明確數據存儲、共享的范圍和邊界,以及要承擔的責任。

2.4完善醫療衛生信息標準體系

ICD、DICOM、SNOMED、HL7等衛生信息標準側重于保證信息標準化和互操作性,沒有考慮數據質量以及如何跨數據源管理患者身份信息[10],其中手術操作的術語集標準化程度最低,會導致重復記錄。另外,隨著醫療機構內部分歧的增多,上述標準的一致性與互融性亟需改進,如LOINC與SNOMED之間缺乏互補;許多組織都認識到通用標準術語的必要性,開發了自身術語與基準,卻導致醫療組織之間數據不能相互融合、難以集成。應在完善補充現有標準的基礎上,盡快建立健康信息標準規范體系,強化標準規范的應用管理。為了能無歧義地使用和解釋信息,在數據標準化過程中,需關注數據的概念、代碼、值域等屬性的標準化。在信息內容標準化過程中,需解決識別和定義臨床概念的問題,如采用相同的方法收集、傳送關于血壓或不良反應的數據。

作者:楊朝暉 王心 徐香蘭

亚洲精品一二三区-久久