您的位置:久久首頁> 新聞> 展會會議 >概況

人工智能時(shí)代醫(yī)學(xué)大數(shù)據(jù)庫的重要性

發(fā)布時(shí)間: 2017-06-06 11:15:41      來源:新浪網(wǎng)

用手機(jī)掃描二維碼在手機(jī)上繼續(xù)觀看

什么是自體免疫性肝炎
手機(jī)查看
導(dǎo)

人工智能時(shí)代,醫(yī)療大數(shù)據(jù)方面也有所更新,醫(yī)療數(shù)據(jù)庫如何為行業(yè)提供更好服務(wù),值得探究。6月3日下午,2017北京常春藤醫(yī)學(xué)高端人才聯(lián)盟健康產(chǎn)業(yè)論壇火熱進(jìn)行中。本次論壇的議題是“醫(yī)療

 人工智能時(shí)代,醫(yī)療大數(shù)據(jù)方面也有所更新,醫(yī)療數(shù)據(jù)庫如何為行業(yè)提供更好服務(wù),值得探究。6月3日下午,2017北京常春藤醫(yī)學(xué)高端人才聯(lián)盟健康產(chǎn)業(yè)論壇火熱進(jìn)行中。本次論壇的議題是“醫(yī)療大數(shù)據(jù)的現(xiàn)在和未來”,中國臨床腫瘤學(xué)會(CSCO)臨床數(shù)據(jù)專業(yè)委員會委員、新嶼信息科技(上海)有限公司CEO王學(xué)興先生在論壇上對科研數(shù)據(jù)中心建設(shè)進(jìn)行講解。

以下為發(fā)言原文(有刪減):

發(fā)言人:王學(xué)興中國臨床腫瘤學(xué)會[CSCO]臨床數(shù)據(jù)專業(yè)委員會委員、新嶼信息科技(上海)有限公司CEO

首先非常感謝有這樣一個(gè)機(jī)會。我曾經(jīng)也是一名外科醫(yī)生,后來一直專注于做腫瘤大數(shù)據(jù)的應(yīng)用,所以今天借這個(gè)機(jī)會,從科室的角度,或者是從臨床醫(yī)生的角度,分享科研數(shù)據(jù)中心建設(shè)的心得。

早期我們用一套數(shù)據(jù)庫的時(shí)候,更多的功能是用在做搜索,但是在精準(zhǔn)醫(yī)療的背景下,我們怎么把這個(gè)數(shù)據(jù)庫的功能再擴(kuò)大一下,成為做科研和探索的工具呢?在精準(zhǔn)醫(yī)學(xué)或者大數(shù)據(jù)任務(wù)的背景下,對醫(yī)生來講,它的財(cái)富除了知識或者技能以外,那么顯然最重要的就是數(shù)據(jù)。以前我也是外科醫(yī)生出身,所以經(jīng)常覺得,手術(shù)水平很高,覺得自己就可以獨(dú)行天下。但是在今天人工智能的環(huán)境下,數(shù)據(jù)可能是比技能更重要的東西。那么我們在整個(gè)行醫(yī)的生涯中,其實(shí)除了去學(xué)習(xí)知識技能以外,也應(yīng)該從今天開始去積累數(shù)據(jù),這才是我們最寶貴的財(cái)富。

整個(gè)醫(yī)療數(shù)據(jù)的分析維度,可以簡單地分為四個(gè)層次,第一國家或者政府在講的行業(yè)大數(shù)據(jù),從衛(wèi)計(jì)委的大數(shù)據(jù)去看整個(gè)國家疾病的發(fā)病率等,這是一個(gè)傳統(tǒng)意義上的大數(shù)據(jù)。而我們從一個(gè)群體的數(shù)據(jù)去分析,更多的是偏向于科研分析。還有站在個(gè)人的基礎(chǔ)上,對一個(gè)人進(jìn)行醫(yī)療數(shù)據(jù)的個(gè)體化項(xiàng)目,對他提供更精準(zhǔn)的治療指導(dǎo)意見。第四在微觀層面上,隨著現(xiàn)在GS、基因數(shù)據(jù)的出現(xiàn),微觀層面進(jìn)行數(shù)據(jù)分析。其實(shí)明碼生物科技首席技術(shù)官孫宏業(yè)介紹的平臺無非是把臨床數(shù)據(jù)和基因大數(shù)據(jù)以及一些環(huán)境數(shù)據(jù)、基因數(shù)據(jù)整合一起,做管理分析。

我會著重于臨床大數(shù)據(jù)的分享,因?yàn)榕R床數(shù)據(jù)是每一個(gè)病人最重要的數(shù)據(jù)來源之一,很多資料寫在系統(tǒng)里面,或者最早的時(shí)候?qū)懺诓±锩妫@些數(shù)據(jù)在今天仍然沒有被最大化的利用起來,這本身就是一個(gè)寶庫。另外涉及到患者數(shù)據(jù)的整合時(shí),我們把臨床大數(shù)據(jù)和基因大數(shù)據(jù)以及一些環(huán)境大數(shù)據(jù)做數(shù)據(jù)分析。把所有的數(shù)據(jù)整合在一起,這樣的數(shù)據(jù)產(chǎn)生才有價(jià)值??赡苣壳暗男畔⑹潜桓盍训?,也是我們常說的在醫(yī)療行業(yè)信息孤島現(xiàn)象非常嚴(yán)重,那首先我們也要去解決這樣的問題,從臨床數(shù)據(jù)的角度出發(fā),進(jìn)行統(tǒng)一的編碼存儲。如果信息數(shù)據(jù)只是臨時(shí)的堆在一起,編碼不統(tǒng)一的話,那么這些數(shù)據(jù)的利用價(jià)值就大大降低了。從臨床出身的人往往會習(xí)慣性的用臨床思維來思考數(shù)據(jù),那么怎么樣用數(shù)據(jù)思維來看待手里的每一份數(shù)據(jù)呢?第一,我想給大家講的數(shù)據(jù)及價(jià)值。

數(shù)據(jù)是最重要的帶有價(jià)值的資產(chǎn),做過科研的人都有對于科研數(shù)據(jù)處理的困惑,“一題一庫”即做一個(gè)臨床研究課題的時(shí)候,都會建立一個(gè)數(shù)據(jù)庫,但如果要做多個(gè)課題,就要做多個(gè)庫,尤其像腫瘤,分類標(biāo)注。從做研究的流程來講,醫(yī)生都知道病例是一手?jǐn)?shù)據(jù)源,然后把數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,最終完成一篇篇的論文或者研究成果。

{page}

從目前中國的現(xiàn)狀來看,臨床的病例基本上記錄在ERP或者S系統(tǒng)里,甚至少量的醫(yī)院還記錄在紙質(zhì)的病例上,這些數(shù)據(jù)結(jié)構(gòu)我們把它稱為是半結(jié)構(gòu)化的病例數(shù)據(jù)。比如說住院病歷首頁只看到處方的遺囑系統(tǒng),化驗(yàn)系統(tǒng)都已經(jīng)做到了結(jié)構(gòu)化,但是臨床研究比較重要的病史病重程度,以及藥物的不良反應(yīng)等都習(xí)慣性的記錄在病史中。我們需要對它進(jìn)行一個(gè)重新的處理,而且病例的內(nèi)容模版化最好的Ctrl+v、Ctrl+c的操作,現(xiàn)在也有很多的錯(cuò)誤發(fā)現(xiàn),有些男性病例里面還寫著子宮附件,女性病例里還寫著前列腺檢查無異常,這都是Ctrl+v、Ctrl+c出來的,現(xiàn)在給這種黑色系統(tǒng)數(shù)據(jù)標(biāo)準(zhǔn)化,國家也在不斷的強(qiáng)化。

對于數(shù)據(jù)存儲的現(xiàn)狀來說,大家的格式就更多樣。數(shù)據(jù)質(zhì)量差異會非常大,而且目前臨床上做科研數(shù)據(jù)整理的管理人員,我們觀察到流動性還是非常大的,所以導(dǎo)致往往一個(gè)科室科研性的數(shù)據(jù)庫,數(shù)據(jù)處理差異也很大。還有一個(gè)數(shù)據(jù)可重復(fù)利用度往往的也不是特別高,最后到知識專業(yè)環(huán)節(jié)有些統(tǒng)計(jì)方法,或者說有些醫(yī)生為了寫文章往往會有選擇性的去相信一些病例,得出一個(gè)P<0.01差異,然后就寫在文章上,沒意識到病已經(jīng)作了選擇性的篩選了。還有第三塊也會魚龍混雜,這是我們在數(shù)據(jù)處理的臨床研究過程中中國存在的一些現(xiàn)象。

實(shí)際上要建一個(gè)數(shù)據(jù)庫要去考慮兩個(gè)大的因素,第一怎么樣去解決臨床科研要求的數(shù)據(jù)標(biāo)準(zhǔn)。另外怎么樣滿足我自身領(lǐng)域里面的研究領(lǐng)域里的專業(yè)標(biāo)準(zhǔn)和專業(yè)的術(shù)語,把這兩個(gè)結(jié)合起來,一個(gè)是數(shù)據(jù)標(biāo)準(zhǔn),一個(gè)是專業(yè)標(biāo)準(zhǔn),結(jié)合起來形成的這個(gè)數(shù)據(jù)模型,這個(gè)數(shù)據(jù)庫的結(jié)構(gòu)就是能滿足我們未來科研臨床研究的科研數(shù)據(jù)的標(biāo)準(zhǔn)模型,這樣的話,能滿足每一個(gè)領(lǐng)域里的科研,同時(shí)也能滿足監(jiān)管成員的一些要求。這樣的話我們除了做一些臨床實(shí)驗(yàn)以外,這個(gè)庫也會支持我們自己的非注冊類的以及觀察性的研究,增值試點(diǎn)研究都可以來實(shí)現(xiàn)。而不需要今天一個(gè)課題一個(gè)庫。

我們要?jiǎng)?chuàng)造數(shù)據(jù)的話盡量帶數(shù)據(jù)源,如果我們還是習(xí)慣用CRF表的方式去存儲數(shù)據(jù)的話,其實(shí)你已經(jīng)在使用假設(shè)條件了,那么你的研究方向是什么?所以如果要進(jìn)行某一個(gè)增值試點(diǎn)研究的話,盡量不要帶一些假設(shè)條件,只要把這個(gè)病例的數(shù)據(jù)原原本本拆開放在那里就可以了。

另外數(shù)據(jù)是用來積累自己的科研財(cái)富的。我想分析一下大數(shù)據(jù)的一些特點(diǎn),第一個(gè)數(shù)據(jù)源比較大,而且在持續(xù)增長,因?yàn)椴∪藭丛床粩嗟倪M(jìn)來,第二個(gè)是病例的整體結(jié)構(gòu)是比較復(fù)雜,而且包含了很多的語意,每一份病例是醫(yī)生受過專業(yè)訓(xùn)練之后書寫的,它不是像我們?nèi)粘I畹淖匀徽Z言,它的文字之間有很多語意在里面,很多的醫(yī)學(xué)邏輯在里面。第三個(gè)特點(diǎn)是個(gè)體差異比較大,第四個(gè)數(shù)據(jù)定義和數(shù)據(jù)標(biāo)準(zhǔn)變化很快。剛才我談的一些醫(yī)學(xué)標(biāo)準(zhǔn)每年都在變,第五個(gè)信息不同現(xiàn)象比較嚴(yán)重,現(xiàn)在醫(yī)院跟醫(yī)院之間的信息共享還是比較難的,如果說對這些數(shù)據(jù)進(jìn)行處理的話,現(xiàn)在基本上是XML的格式文檔,如果對這些數(shù)據(jù)進(jìn)行處理最好的整理方法,當(dāng)然是人工智能語音識別加數(shù)據(jù)化安全,但是這樣做在今天的計(jì)算代價(jià)還是比較高的。第二個(gè)如果我們?nèi)プ鲆粋€(gè)結(jié)構(gòu)化的關(guān)系性數(shù)據(jù)庫,它能滿足我們預(yù)定好的或者日常的研究需求,但是使用結(jié)構(gòu)化數(shù)據(jù)存儲會把大量的語音關(guān)系丟掉,因?yàn)橛?jì)算機(jī)并不知道兩個(gè)詞之間的是什么關(guān)系。

最后跟大家分享大數(shù)據(jù)的隱私和安全問題。數(shù)據(jù)的一個(gè)特性是有去無回的,因?yàn)樗梢粤愠杀镜膹?fù)制,你再也拿不回來。我可以拿到數(shù)據(jù)做任何其他科研的工作,所以我們跟很多專家也包括做一些或者技術(shù)上來解決這個(gè)問題,我們怎么樣在保護(hù)數(shù)據(jù)和醫(yī)學(xué)科研之間達(dá)到一個(gè)平衡,前提就是數(shù)據(jù)的分級分層,我們有一個(gè)數(shù)據(jù)分級分層的框架,現(xiàn)在也正在研發(fā)中,我們想在今年九月份公布這樣一個(gè)標(biāo)準(zhǔn)化的體系和分享的機(jī)制。就是把每一份病人的數(shù)據(jù)通過人工智能拆成隱私信息、描述性事件和分類分解的數(shù)據(jù)分解出去,我們稱之為PBCI模型。不同的數(shù)據(jù)層級你可以去規(guī)范不同的分享和協(xié)作的權(quán)限。我舉一個(gè)例子,很多人擔(dān)憂數(shù)據(jù)共享出去有去無回,其實(shí)他擔(dān)憂的是第三層數(shù)據(jù),這份基礎(chǔ)數(shù)據(jù)分享出去以后,我就沒辦法掌控了,隱私系統(tǒng)是不管誰都不能共享的不能分享的,基礎(chǔ)性描述性的事件其實(shí)是產(chǎn)生其他任何分類分級描述性事件的源頭,都想把這份數(shù)據(jù)傳到自己手里,我們可以從分析性數(shù)據(jù)的共享開始,或者分類分級的數(shù)據(jù)共享開始,如果雙方建立足夠的信任,也可以把描述性事件也做分享,這些分類分級的這樣的分享,另外一個(gè)利益的分享機(jī)制,我們當(dāng)中也是這個(gè)建議,誰發(fā)起了一個(gè)課題,他就是通信作者,誰貢獻(xiàn)了病例被采納的多就是第一作者依次排序。當(dāng)初在討論中很多人都比較認(rèn)同這個(gè)機(jī)制,因?yàn)橄鄬Ρ容^公平的兼顧大家的利益,另外一個(gè)我們其實(shí)也在跟國家信息部溝通,做到不能多次的利用,來約束大家對這些共享數(shù)據(jù)的使用范圍。

標(biāo)簽閱讀: 醫(yī)學(xué) 數(shù)據(jù) 人工智能

分享到:

相關(guān)閱讀

首例多中心5G遠(yuǎn)程手術(shù)完成   標(biāo)志人工智能應(yīng)用達(dá)到了新高度
首例多中心5G遠(yuǎn)程手術(shù)完成 標(biāo)志人工智能應(yīng)用達(dá)到了新高度
人工智能用于手術(shù)的成功,這也是大家一直關(guān)注的,要是遇到突發(fā)情況應(yīng)該怎么辦?昨天,北京積水潭醫(yī)院院長田偉在本院通過遠(yuǎn)程系統(tǒng)控制平臺與嘉興市第二醫(yī)院和煙臺市煙臺山醫(yī)院同時(shí)連接,成功完成 [詳細(xì)]
2019-06-28 11:18:15
首個(gè)AI合成女主播上崗  人工智能與新聞采編深度融合
首個(gè)AI合成女主播上崗 人工智能與新聞采編深度融合
女主播是AI合成,全球首位AI合成女主播今天正式上崗了。新華社聯(lián)合搜狗公司近日在京發(fā)布全新升級的站立式AI合成主播,并推出全球首個(gè)AI合成女主播。這是繼去年雙方聯(lián)合發(fā)布全球首個(gè)合成 [詳細(xì)]
2019-03-05 13:05:03
人工智能可“讀懂”病歷   未來是無限的可能
人工智能可“讀懂”病歷 未來是無限的可能
人工智能涉及的領(lǐng)域是多方位的,據(jù)新華社電人工智能不僅能夠“看圖”識別影像,還能“識字”即讀懂病歷中的文本信息。北京時(shí)間12日零時(shí)14分,這項(xiàng)有關(guān)自然語言處理(NLP)技術(shù)基于文本型 [詳細(xì)]
2019-02-12 16:35:28
人工智能會成為優(yōu)秀的天氣預(yù)報(bào)員嗎?  AI已成天氣預(yù)報(bào)研究熱門
人工智能會成為優(yōu)秀的天氣預(yù)報(bào)員嗎? AI已成天氣預(yù)報(bào)研究熱門
天氣預(yù)報(bào)也應(yīng)用了AI,近日,一則人工智能或能提前一周預(yù)測臺風(fēng)的消息引發(fā)關(guān)注。報(bào)道稱,日本海洋研究機(jī)構(gòu)和九州大學(xué)的研究小組利用人工智能深度學(xué)習(xí)技術(shù),開發(fā)了從全球云系統(tǒng)分辨率模型(NI [詳細(xì)]
2019-02-11 13:52:07
人工智能可助快速發(fā)現(xiàn)兒童心理問題  優(yōu)于常用的家長調(diào)查問卷法
人工智能可助快速發(fā)現(xiàn)兒童心理問題 優(yōu)于常用的家長調(diào)查問卷法
孩子的心理健康成長,對孩子是最重要的。統(tǒng)計(jì)顯示高達(dá)20%的兒童會出現(xiàn)焦慮和抑郁,但這些心理問題往往很難被及時(shí)發(fā)現(xiàn),以致錯(cuò)過最佳干預(yù)時(shí)機(jī)。美國研究人員利用人工智能技術(shù)開發(fā)出一種兒童行 [詳細(xì)]
2019-01-22 10:23:41
人工智能看臉識疾病   獨(dú)立實(shí)驗(yàn)勝過臨床專家
人工智能看臉識疾病 獨(dú)立實(shí)驗(yàn)勝過臨床專家
人工智能的時(shí)代,已經(jīng)有了更多的體現(xiàn)。約有8%的世界人口受到遺傳綜合征的困擾,此類患者往往具有可識別的面部特征。然而,遺傳綜合征的診斷過程卻出奇陳舊,大多數(shù)時(shí)候需要醫(yī)生手工測量面部特 [詳細(xì)]
2019-01-09 10:30:37
開啟人工智能體檢時(shí)代,愛康集團(tuán)有人“管”的體檢2.0戰(zhàn)略升級
開啟人工智能體檢時(shí)代,愛康集團(tuán)有人“管”的體檢2.0戰(zhàn)略升級
2018年12月11日,愛康集團(tuán)有人“管”的體檢2.0戰(zhàn)略升級發(fā)布會在廣州四季酒店舉行。愛康集團(tuán)創(chuàng)始人、董事長兼CEO張黎剛表示,將通過人工智能賦能傳統(tǒng)體檢,把更多創(chuàng)新科技應(yīng)用在 [詳細(xì)]
2018-12-13 18:08:37
RSNA 2018趨勢匯總:人工智能在放射醫(yī)療中全面開花
RSNA 2018趨勢匯總:人工智能在放射醫(yī)療中全面開花
日前,第 104 屆北美放射年會(RSNA)在美國芝加哥落下帷幕。作為放射領(lǐng)域的國際盛宴,RSNA 云集了全球頂尖的科學(xué)家和醫(yī)療行業(yè)從業(yè)者。 [詳細(xì)]
2018-12-05 16:02:57
微醫(yī):人工智能、VR助力“互聯(lián)網(wǎng)+”醫(yī)療新科技
微醫(yī):人工智能、VR助力“互聯(lián)網(wǎng)+”醫(yī)療新科技
11月6日,第五屆世界互聯(lián)網(wǎng)大會“互聯(lián)網(wǎng)之光”博覽會將在浙江烏鎮(zhèn)開幕。本屆博覽會以“國際、創(chuàng)新、未來、領(lǐng)先、融合”為定位,將繼續(xù)聚焦世界互聯(lián)網(wǎng)最新發(fā)展趨勢和前沿技術(shù)動態(tài),展示和發(fā)布 [詳細(xì)]
2018-11-06 11:10:06
“大數(shù)據(jù)與人工智能基地”成立發(fā)布會在京舉辦
“大數(shù)據(jù)與人工智能基地”成立發(fā)布會在京舉辦
為貫徹落實(shí)國家中醫(yī)藥管理局《關(guān)于推進(jìn)中醫(yī)藥健康服務(wù)與互聯(lián)網(wǎng)融合發(fā)展的指導(dǎo)意見》,積極探索中醫(yī)藥與互聯(lián)網(wǎng)融合的新模式,利用現(xiàn)代互聯(lián)網(wǎng)技術(shù)傳承發(fā)展中醫(yī)藥事業(yè)。 [詳細(xì)]
2018-09-19 15:31:56