當前位置: 華文頭條 > 健康

醫療衛生資訊基礎知識解析

2024-03-11健康

作為醫療行業的產品經理,需要對醫療相關知識有一定的了解。本文對醫療衛生資訊基礎知識進行了解析,希望對你有所幫助。

一、醫療衛生資訊標準認知

1. 基礎介紹

標準是透過標準化活動,按照規定的程式經協商一致制定,為各種活動或其結果提供規則、指南或特性,供共同使用和重復使用的檔。

2. 標準類別

在標準體系模型中,按照標準的適用範圍或級別,可以分為國家標準、行業標準、地方標準、企業標準。其中在GB/T 20000.1-2014中對規範檔進行了相關說明,指規範用於規定產品、過程或服務應滿足的技術要求的檔,可以是標準的一個部份或標準以外的其他標準化檔。標準檔類別分為:國家標準、行業標準、地方標準、團體標準與規範性檔,具體介紹如下:

3. 標準分類

目前,國內沒有醫療健康資訊標準的分類規範,國外不同的標準組織對醫療健康資訊標準的分類方式也不一樣。

在2009年原國家衛生部衛生資訊標準化專業委員會提出資訊標準體系架構圖上,將衛生資訊標準分類為:

基礎類標準、數據類標準、技術類標準、安全類標準、管理類標準,這也是目前國內通常參照的衛生資訊標準分類,具體介紹如下:

  • 基礎類標準:資訊模型、醫學術語、標識、體系框架;
  • 數據類標準:數據元與後設資料、分類與編碼、數據集、共享文件規範;
  • 技術類標準:功能規範、技術規範、傳輸與交換;
  • 安全類標準:資訊保安、私密保護;
  • 管理類標準:建設指南、測試評價、運維管理、監理驗收。
  • 結合資訊標準體系架構與實際標準的釋出情況,目前後設資料服務中資訊標準檔的分為12類,具體介紹如下:

    醫療衛生資訊標準分類圖

    4. 標準性質

    【標準化法】第二條規定:國家標準分為強制性標準、推薦性標準,行業標準、地方標準是推薦性標準。【行業標準管理辦法】第四條規定:行業標準分為強制性標準和推薦性標準,相關標識如下:國家標準:GB為強制性標準,GB/T為推薦性標準,GB/Z為指導性標準。衛生行業標準:WS為強制性標準,WS/T為推薦性標準。

    5. 標準狀態

    標準狀態分為現行、廢止。

    二、醫療衛生資訊標準之數據元

    1. 數據元概念

    數據元概念(data element concept DEC)是能以一個數據元的形式表示的概念,其描述與任何特定表示法無關。一個數據元概念由物件類和特性組成。如下圖左側:

    2. 數據元組成

    數據元是一組內容規定定義、標識、表示和允許值的數據單元。數據單元是資訊的基本單位,例如住院病案首頁中的病案號、姓名、入院診斷、主要診斷等都是基本的數據單元,為數據單元賦予內容就稱為數據元。

    數據元的目的是建立標準化的數據表達、采集、儲存和傳輸格式,以實作數據的正確表達和理解。

    在一定語境下,構建一個語意正確、獨立且無歧義的特定概念語意的資訊單元,同時可理解為數據的基本單元。數據元是衛生資訊的最基本的結構化(標準)單元,每一項醫療衛生業務資訊都可由若幹數據元組成,例如一張標準格式的病案首頁就由100多個數據元組成。圍繞一定業務主題形成的數據元集合稱為數據集,數據元的實際套用通常是以基本數據集的形式實作的。

    一個數據元由數據元概念和表示組成,其中表示描述數據的形式,包括值域、數據類別、表示類(可選的),必要時還包括計量單位。如下圖右側:

    範例一:數據概念+值域;

    【數據元】黃疸部位程式碼表

    【數據概念】黃疸部位,黃疸是物件詞,部位是特性詞。

    【值域】程式碼表是表示詞。

    範例二:數據概念+計量單位;

    【數據元】兒童體檢年齡(月)。

    【數據概念】兒童體檢,兒童是物件詞,體檢是特性詞。

    【值域】年齡(月)是表示詞。

    3. 數據元基本模型

    數據元的基本模型是由數據元概念和數據元兩部份組成。

    4. 數據元概念與數據元關系

    一個數據元由數據元概念和表示組成。

    一個數元概念對應多個數據元。

    5. 物件

    物件類是可以對其界限和含義進行明確的標識,且特性和行為遵循相同規則的觀念、抽象概念或現實世界中事物的集合。

    它是我們希望采集和儲存數據的事物。物件類是概念,在物件導向的模型中與類相對應,在實體-關系模型中與實體對應,

    例如,患者、醫生、衛生機構等。物件類可能是一般概念。當物件類所對應的物件集有兩個或多個元素時,就是一般概念。患者、醫生、衛生機構等都是一般概念物件類也可以是個別概念。

    當物件類對應的物件集僅有一個元素時,就是個別概念,例如「北京市醫療機構」就是個別概念。

    6. 特性

    特性是一個物件類的所有成員所共有的特征。它用來區別和描述物件,是物件類的特征,但不一定是本質特征,它們構成物件類的內涵。特性也是概念,對應於物件導向模型或實體-關系模型中的內容。

    例如身高、體重、血壓、脈搏、血型等。特性也可是一般概念或個別概念。作為個別概念的例子有:病床總數或醫療收入。

    衛生健康資訊數據元是衛生這一特定領域的數據元,它的概念和結構遵循通用數據元的概念和結構,但具有自身的特點。醫藥衛生領域包括基礎醫學、臨床醫學、公共衛生、中醫藥學等多個專業,其數據元的表現形式復雜,例如數碼人體、醫學影像、基因圖譜、中醫經絡等,除具有通用數據元的內容外,還具有其鮮明的領域特殊性。

    7. 數據類別與表示符

    8. 數據元值的表示格式中字元含義描述規則

    9. 數據元值的表示格式中字元長度描述規則

    套用範例:

    範例1:S字元型

    AN10 固定為10個字元(相當於5個漢字)長度的字元。

    AN..10 可變長度,最大為10個字元長度的字元。

    AN4..10 可變長度,最小為4個最大為10個字元長度的字元。

    AN..20X3可變長度,最多3行每行最大長度為20個字元長度的字元。

    範例2:N數碼型

    N4固定長度為4位元的數碼。

    N..4最大長度為4位元的數碼。

    N6,2最大長度為6位的十進制小數格式(包括小數點),小數點後保留2位數碼。

    範例3:T日期時間型

    T8采YYYYMMDD格式(8位元定長)顯示年月日。

    T15采用YYYYMMDDThhmmss格式(15位定長)表示日時分秒。時分秒之前加大寫字母「T。

    如2010年1月5日8時10分9秒為20100105T081009。

    資料參考:

    WS/T 303-2023 衛生健康資訊數據元標準化規則

    WS/T 363.2-2023 衛生健康資訊數據元目錄 第2部份:標識

    三、醫療健康資訊標準之值域

    1. 值域基本模型

    值域的基本模型由概念域和值域兩部份組成,一個概念域對應多個值域。

    2. 值域

    值域(vale domain,VD)是允許值的集合。一個允許值是某個值和該值的值含義的組合。該關聯含義稱為值含義。值域是一個或多個數據元有效值的集合,用於在資訊系統和數據交換中確認數據的有效性。它也是描述一個數據元的後設資料的必要構成部份。特別是,值域是數據元所表示的數據內容、形式和結構的指南。

    值域有兩種(非互斥的)子類別:

    可列舉值域:由允許值列表規定的值域;

    一個可列舉值域是包含了它的所有值及值含義的一個列表,例如:患者血型類別程式碼。

    不可列舉值域:由描述規定的值域。

    一個不可列舉值域是由一個描述來規定。不可列舉值域的描述須準確描述屬於該值域的允許值。例如,「傳染病死亡率」數據元的值域是大於等於0且小於等於1的實數。

    描述數據有時需要計量單位。例如描述血壓的值域記錄時,為了準確理解值含義,需要使用計量單位moHg或kPa: 年齡值域記錄的計量單位可使用年、月、周、日:血糖值域記錄的計量單位可以是mg/d或mmol/L。所以,計量單位與值域關聯。

    3. 概念域

    概念的外延構成了概念域,一個概念域是一個值含義集合。一個概念域的內涵是它的值含義。概念域也有兩種(非互斥的)子類別:

    一可列舉概念域:由值含義列表規定的概念域:一不可列舉概念域:由描述規定的概念域。可列舉概念域的值含義可以明確地列舉。該類別概念域對應於可列舉類別的值域,例如:

    不可列舉概念域的值含義由「不可列舉概念域描述規則」來表述。該規則描述了不可列舉值域中允許值的含義。這種類別的概念域對應於不可列舉類別的值域,例如:

    如果一個計量單位的任何量可以轉化為另一種計量單位下等同的量,則這些計量單位彼此之間是等價的。所有等價的計量單位被認為具有相同的維。例如,長度計量單位(米,厘米等)具有相同的維,年齡計量單位(年、月、周、日) 具有相同的維。所以,維與概念域關聯。

    四、醫療衛生資訊標準之數據集

    在衛生領域資訊化的快速發展過程中,積累了大量來自於不同系統、不同機構的異構數據資源。伴隨著對這些數據資源進行整合與交流的需求不斷增長,數據集這一數據組織方式得到了套用和推廣。

    1. 數據集

    具有一定主題,可以標識並被電腦處理的數據集合,旨在為相關業務數據的登記提供一套術語規範、定義明確、語意語境無歧義的標準,數據元是衛生資訊的最基本的結構化(標準)單元,每一項醫療衛生業務資訊都可由若幹數據元組成,例如一張標準格式的病案首頁就由100多個數據元組成。圍繞一定業務主題形成的數據元集合稱為數據集,數據元的實際套用通常是以基本數據集的形式實作的。

    主題:圍繞著某一項特定任務或活動進行數據規劃和設計時,對其內容進行的系統歸納和描述。通常數據集主題應具有劃分性和層級性。劃分性是指主題間可透過不同的命名,將相同內容的主題歸並在一起形成相同的類,將不同內容的主題區分開形成不同的類;層級性是指主題可被劃分成若幹子主題或子子主題。

    可標識:指能透過規範的名稱和識別元等對數據集進行標記,以供辨識。標識與名稱的取值需要透過具體的命名或編碼規則來規範。

    能被電腦處理:指可以透過電腦技術(軟硬件、網絡),對數據集內容進行釋出、交換、管理和算機系統中以數值、日期、字元、影像等不同的類別表達。

    數據集合:指由按照數據元所形成的若幹數據記錄所構成的集合。例如,病案首頁數據集由主索引、基本資訊、診斷資訊、入出院資訊、手術資訊、費用資訊等不同數據組成。

    2. 衛生健康資訊數據集

    衛生健康資訊數據集是在衛生健康領域,為滿足政府衛生決策、業務處理、科學研究、資訊釋出與績效評價等需求,按照數據集概念設計、歸納、整合的主題資訊集合。衛生健康領域的數據集主要可以

    歸納為三個方面:

    1. 資訊釋出類統計數據集:如中國衛生健康統計年鑒中衛生機構設定及規模、衛生人員資源的地區分布、衛生經費的籌集及分配等數據集,各類衛生機構的統計月報、年報,以及滿足某一專項統計需求透過統計收集、歸納、整理、報告形成的數據集。例如:衛生統計指標。
    2. 業務系統建設類的基本數據集:包括醫療服務、公共衛生、藥品供應、醫療保障、衛生管理等領域為了滿足業務資訊系統規範化建設和領域內部以及領域間數據交換與共享需求,設計歸納的各個子系統(或者功能模組)所包含的最小數據元素的集合。如:兒童出生登記、個人健康檔案、住院病人入出轉、居民死亡登記報告電子病歷基本數據集 、疾病管理基本數據集等數據集。
    3. 為滿足特定目的收集整理制作的數據集:包括透過調查、觀察、監測、檢測、試驗、實驗等方式獲取的滿足科學研究、業務咨詢或衛生服務決策等需求的數據集。如:近年來國家投入建設的國家人口健康科學數據集、衛生服務調查數據集、疾病及危險因素調查等內容的數據集。

    五、醫療衛生資訊標準之指標集、統計指標、分類方案

    1. 指標集

    指標集有一組統計指標組成,目的是衡量特定部門或地區提供、改善服務的情況。

    例如,【全國醫院上報數據統計分析指標集 (試行)】目的是為加強醫院上報數據的分析和套用;

    【病案管理質素控制指標(2021年版)】、腫瘤專業質素控制指標(2023年版)等,目的是為進一步加強醫療質素管理,規範臨床診療行為,促進醫療服務的標準化、同質化。

    2. 衛生統計指標

    衛生統計指標(indicators of health statistics ,IHS)是反映一定時期、一定地區居民健康狀況、健康影響因素、公共衛生服務、醫療服務、藥品與材料供應保障、醫療保障、衛生資源和計劃生育的統計指標。透過對衛生統計指標值的分析,可以:

  • 了解人群的健康狀況、衛生系統績效及健康影響因素的現狀;
  • 可以監測人群健康整體目標的實作行程,為衛生健康政策制定和資源分配等提供支持;
  • 為公共衛生政策制定和實施有效的疾病防控措施提供依據;
  • 對衛生幹預效果進行評估。
  • 3. 分類方案

    分類方案是根據物件具有的共同特征將物件進行排列或劃分成組的描述性資訊。分類方案是一般是一種官方術語系統,得到國家或國際機構的認可和認可,用於對數據進行分類。

    如疾病分類與程式碼、手術/操作分類與程式碼、職業分類與程式碼等。分類方案項是分類方案的內容項,它可以是分類或本體中的一個節點,敘詞表中的一個術語等。

    值域是資訊層面的數據,分類方案業務層面的數據。通常情況下,分類方案為值域提供相關業務參考,是值域的一個組成部份。但某種情況下,分類方案可以直接被數據元所使用。如分類方案「疾病分類與程式碼(ICD-10)「等分類系統得到行業的一致認同與使用。如數據元「疾病診斷程式碼」可以直接連線到分類方案「疾病分類與程式碼」。

    六、醫療衛生資訊標準之後設資料

    1. 數據元的後設資料總體模型

    數據元的後設資料總體模型由概念層和表示層兩個部份組成。概念層包括數據元概念類和概念域類。這兩種類都表示概念。表示層包括數據元類和值域類。這兩種類都表示數據值的容器。

    數據元的後設資料總體模型

    可以給出4個類(數據元、多個數據元、值域、數據元概念)的若幹基本事實:

  • 一個數據元是一個數據元概念和一個值域的結合體;
  • 多個數據元可以共享相同數據元概念,這意味著一個數據元概念可以用多個不同方式表示。例如,患者入院時間是一個數據元概念,它可以有多個表示方法,例如用YYYYMMDD表示患者入院的年月日,如果需表示小時和分,則用YYYYMMDDhhmm表示。「患者性別程式碼-英文全稱」、「患者性別程式碼-1位字母程式碼」共享同一個數據元概念患者性別。
  • 多個數據元可以共享相同的表示,這意味著一個值域可以被不同數據元重復利用。例如,「住院病人結算費用-元(人民幣)」和「門急診就診費用-元(人民幣)」數據元共享相同的值域「費用-元(人民幣)」。
  • 值域不是必然與一個數據元關聯,可以單獨管理:
  • 不同值域所有允許值所對應的值含義都相同時,這些值域在概念上是等價的,因此,對應相同的概念域。例如,前述關於性別的值域:性別程式碼-1位數碼、性別程式碼-英文全稱及性別程式碼-1位字母程式碼的允許值所對應的值含義相同,均表示「男性、女性、未知的性別、未說明的性別」。所以這些值域對應同一個概念域「性別」。
  • 不同值域部份允許值所對應的值含義相同時,這些值域在概念上是相關的,因此,在包含有其各自概念域的概念體系中共享一個由共同的值含義構成的概念域。例如,性別程式碼-符號的允許值是「♂和♀」,分別表示「男性和女性」。無其他符號表示「未知的性別」和「未說明的性別」,那麽性別程式碼-符號與性別程式碼-1位數碼、性別程式碼-英文全稱及性別程式碼-1位字母程式碼值域在概念上相關,共享由共同的值含義「男性和女性」構成的概念域「性別」。
  • 一個數據元概念僅與一個概念域相關,因此共享相同數據元概念的所有數據元共享概念上相關的表示。例如,「新生兒體重-N5,2(千克)」和「新生兒體重-N4(克)」是兩個不同的數據元,共享一個數據元概念新生兒體重。兩個數據元的表示在概念上是相關的,共享概念域「體重」。千克和克都是重量的計量單位,稱具有相同的維度。因此計量單位與值域相關,維度與概念域相關。
  • 許多數據元概念可以共享相同的概念域。例如,患者體重和新生兒體重是兩個不同的數據元概念,共享一個概念域「體重」。
  • 2. 後設資料概念

    後設資料(Metadata)是描述其它數據的數據(data about other data),或者說是用於提供某種資源的有關資訊的結構數據。後設資料是描述資訊資源或數據等物件的數據,其使用目的在於:辨識資源;評價資源;追蹤資源在使用過程中的變化;實作簡單高效地管理大量網絡化數據;實作資訊資源的有效發現、尋找、一體化組織和對使用資源的有效管理。對後設資料不了解的可看這邊書【後設資料:用數據的數據管理你的世界】[美]謝菲·波梅蘭茨。

    3. 後設資料管理模型

    後設資料管理是領域內數據類標準的數碼化呈現,可提升醫療數據的準確性、一致性和互操作性。這對醫療健康數據,數據的治理至關重要。所有在設計醫療健康相關產品的數據就要有這個思維,也要這也去實施。

    本文由 @牙周炎先生 原創釋出於人人都是產品經理。未經作者特許,禁止轉載。

    題圖來自Unsplash,基於CC0協定。

    該文觀點僅代表作者本人,人人都是產品經理平台僅提供資訊儲存空間服務。