Re: [新聞] 憂醫療雲洩個資 民團要求嚴管
其實不大想在某些版面回,不過這邊大家比較專業理性所以...
※ 引述《wylee ()》之銘言:
: http://goo.gl/h4dYz(中央社記者陳清芳台北24日電)
: 行政院國科會發展「醫療雲端運算系統」,
: 遭質疑侵害隱私權。民間團體今天在衛生署全民健保監理會上要求從嚴把關
: 及取得民眾授權同意,否則不排除對政府提起團體訴訟。
: 健保監理委員會上午舉行例會,有勞工團體代表指出,勞工團體保險的費率一致,
: 某公司員工團保的保費卻無端被提高,懷疑員工醫療資料被保險公司掌握,
: 擔心未來「醫療雲」一旦發生個資外洩,廣大民眾受害。
: 民間監督健保聯盟發言人滕西華指出,政府有意將全台2300萬人完整醫療資訊的醫療雲,
: 發展出30種不同的商業營運模式,政府也許認為只要將資料庫與個人姓名身分「去聯結」
: ,就是「白雲」,可是在民間社團眼中卻是「烏雲」。
: 滕西華認為,以往有些學者的原住民基因研究雖未指明,但特定族群卻呼之欲出,
: 衍生族群歧視等弊端,殷鑑不遠。健保等醫療資料庫一旦與學術單位乃至保險公司、
: 國際藥廠等單位連上線,就算沒有指名道姓,民眾個人身分還是攤在陽光下。
: 民間健保監督聯盟、消費者文教基金會和勞工團體等健保監理委員會代表,在會中正式提
: 案,要求應對健保醫療資料庫設置國家級的倫理審查委員會,規定每一筆健保資料被使用
: 前,都必須取得當事人的書面同意。
: 滕西華和消基會代表主張,衛生署和健保局應比照國外做法,依個人資料保護法等相關法
: 令,明文規範健保資料庫的可應用範圍,一旦學術研究有成而取得專利、上市後,
: 也該有回饋全民的機制。
NHIRD 網站
http://nhird.nhri.org.tw
首先,申請資料者無論學術或非學術,都須提報研究計畫書供審查,
且申請的資料都並非完整資料庫。
因為我只接觸過學術申請的資料庫,所以以下以該資料庫說明之,
資料來源是我以前某個 proposal 的原文。
全民健康保險研究資料庫
本研究之資料來源為國家衛生研究院提供之全民健康保險研究資料庫2000年承保抽樣歸人
檔(LHID2000),為自2000年承保資料檔中隨機抽選100萬人資料檔,擷取各年度所有就醫
資料後以每五萬人為一年度之就醫資料為一單位。
其抽樣母群體以中央健康保險局所提供的2000年承保資料檔保險對象,由全民健保開辦至
1999年12月底止共5,806萬筆保險對象累積性之歷史資料,經去除重複的身分證字號後約
有2,372萬筆資料,再由此母群體亂數抽選100萬人資料檔並利用保險對象之身分證字號以
每五萬人為一組共20組,與健保資料庫之歷年就醫資料進行串連,所串接之資料包含:門
診處方及治療明細檔(CD)、門診處方醫令明細檔(OO)、住院醫療費用清單明細檔(DD)、住
院醫療費用醫令明細檔(DO)、特約藥局處方及調劑明細檔(GD)、特約藥局處方調劑醫令明
細檔(GO)。本研究之資料為此20組所發行的四組之第二與第四組資料檔,分別包含1996至
2004年之資料檔,其中1996年僅提供CD、DD、GD等檔。
上文的部分都還是原始抽樣檔的產生方式,亦即身分證字號等個資欄位,
在交付申請單位後是「已經加密過的」。
簡單來說,就是把截至 1999 年底的兩千三百多萬筆無重複的「投保人」資料,
亂數抽出一百萬人後以每五萬人為一組,跟接下來各年度的其他資料檔串,
例如門診處方就是看醫生開給他什麼藥,住院醫療費用可以看他接受那些治療等等。
至於資料檔長什麼樣呢?
買到的光碟打開裡面就是一大堆的 dat 檔,看你要怎麼轉,
總之轉好看是丟進資料庫或變成 txt 檔後,就要開始切欄位。
因為原始資料長得像這樣 (隨便舉例):
23134781217837827429431032240325803851931843050349503
要看譯碼簿才知道第幾到第幾欄位是年齡,或醫令代碼。
切好資料如果以後還打算做後續研究,可能會設計一下資料庫,
把這些資料丟進 SQL 裡面,再弄個介面出來下查詢。
(如果這邊有醫資領域的就能體會,設計這個關連到查詢效率以及邏輯)
以上工作都完成,才是研究的開始。
好,所以滕西華這次提的問題,是該注意但是老實說,
他們關注的點根本不是問題點。
因為如果要找到該筆資料的當事人同意,這動作反而才麻煩,
本來國衛院抽樣完大家拿到的資料都不知道是誰就算了,
妳現在要國衛院抽這一百萬人出來的時候要經過他們同意,
那光是處理這段就沒完沒了,不管是要給予利益還是詢問他是否同意,
必定要耗費大量的人力物力財力,然後最後的結果其實是跟本來一樣的。
實務上,研究者大多希望能夠按照自己想要的資料內容去抽樣,
但先撇開特定主題檔不談,當我們把全部資料庫整理好還原回去之後,
往往下一個查詢等半天跑完,一看發現某病症才兩三千筆資料,
而且最麻煩的在於這兩三千筆資料是資料庫內說她有該病症,
或者我們依據他們所接受到的處方藥物來推斷該病患有某病症,
可是有時候看病或申報,醫師或醫院會合併診斷代碼,
這會導致資料實證上的困難,所以可信度其實比實際臨床抽樣低。
更不用說如果要交叉看兩種病症或某病跟某幾種藥物的條件查詢,
跑出來能夠用得結果可能寥寥數百人。
再說個玩笑話,某次我們查子宮頸癌,跑完還發現有幾十個男性有得,
到底他們是資料登記錯誤,還是本來是女性後來變性,根本無從得知。
總之,結論就是 NHIRD 在學術界拿來寫寫論文還可以,
早幾年唬爛國際上的學者,他們還會驚為天人我們怎麼有辦法,
能夠短時間內量產那麼多數據龐大的論文。
但實際上最近 defense 的時候要佐證自己抽樣方法,已經常常會被挑毛病。
(聽過不知道幾個案例,英文或統計不夠好的解釋不出來被期刊編輯打槍了... )
藥廠或某些利益團體要是真能從這些資料獲得什麼有價值的資料,
我是抱持著存疑態度,畢竟直接去醫院找醫師合作拿臨床資料,
搞不好還比較方便一些。
未來如果要上雲端,前面要處理的問題還有很多,
光是電子病歷的部份現在衛生署就一個頭兩個大,
看看那精美的爛攤子「電子病歷聯合辦公室」就知道...。
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 114.34.131.165
※ 編輯: Clementtang 來自: 114.34.131.165 (02/25 22:38)
→
02/25 22:48, , 1F
02/25 22:48, 1F
推
02/26 02:42, , 2F
02/26 02:42, 2F
推
02/27 12:32, , 3F
02/27 12:32, 3F
→
02/27 13:36, , 4F
02/27 13:36, 4F
討論串 (同標題文章)
完整討論串 (本文為第 1 之 4 篇):
Cloud 近期熱門文章
PTT數位生活區 即時熱門文章