大數據科研分析平臺是以人工智能技術(shù)為核心驅動(dòng)、以院內外真實(shí)診療數據為基礎支撐的創(chuàng )新型臨床-科研一站式服務(wù)體系。通過(guò)對疾病數據的自動(dòng)整合、處理,可輔助醫生快速建立覆蓋多病種、全變量的高質(zhì)量專(zhuān)病數據庫;并在此基礎上,利用相應算法模型,快速實(shí)現對數據的深度挖掘和多維分析,提升科研效率及質(zhì)量,促進(jìn)成果轉化,實(shí)現臨床-科研協(xié)同發(fā)展。
在實(shí)驗設計階段,基于大數據資源中心,進(jìn)行文獻學(xué)習與數據回顧,并通過(guò)薈萃分析及深度學(xué)習技術(shù),幫助提出問(wèn)題、形成假設。
基于醫院數據中心及基因組學(xué)、eCRF表及患者隨訪(fǎng)等院外數據,形成科研數據集市;支持多種形式、多個(gè)維度的數據檢索,檢索結果秒級返回,檢索效率是手工的上千倍,且召回率高于人工數倍。
3.輔助數據處理
通過(guò)自然語(yǔ)言處理、數據歸一等大數據技術(shù),實(shí)現對大量多源異構數據的整合、清洗及后結構化處理,形成系統可識別、可利用的信息。
4.輔助統計分析
平臺通過(guò)接入R語(yǔ)言,集成多種醫學(xué)統計模型,實(shí)現按科研需求靈活選擇統計方式,有效解決研究過(guò)程中階段性數據統計分析費時(shí)、繁瑣問(wèn)題,優(yōu)化實(shí)驗方案。
5.輔助總結評價(jià)
利用大數據科研分析平臺,可以對不同樣本進(jìn)行多次驗證,根據結果找出最真實(shí)的科學(xué)證據,減少實(shí)驗偏倚,提高實(shí)驗質(zhì)量。
特點(diǎn)
1.多級數據分層模型
針對臨床數據復雜的分級結構,特別是病歷文書(shū)、檢查報告等,研發(fā)出了“多級數據分層模型”,用于深度挖掘各層次數據,把數據的顆粒度做到極致,并建立其層次關(guān)系,從而能支撐復雜關(guān)聯(lián)性分析等深度的科研應用研究。
2.專(zhuān)病庫
大數據臨床科研平臺專(zhuān)病庫是以專(zhuān)科疾病為中心,整合患者在院期間的各類(lèi)臨床診療資料(包括病歷文書(shū)、檢驗檢查、醫囑用藥、手麻、護理等)以及患者隨訪(fǎng)數據、生物樣本數據、組學(xué)研究數據或公開(kāi)發(fā)布的環(huán)境質(zhì)量數據,并對海量數據進(jìn)行多維度分析。利用可視化功能,醫生能夠發(fā)現過(guò)去難以發(fā)掘的臨床問(wèn)題,找出科研的新思路。
3.數據智能質(zhì)控
針對大數據資源庫每個(gè)數據項,實(shí)現實(shí)時(shí)多級的質(zhì)量監控,包括資源的完整度、異常數據點(diǎn)、異常數據類(lèi)型以及數據分布情況等,并可針對不規范數據進(jìn)行溯源分析,追溯到原始病歷文書(shū),發(fā)現書(shū)寫(xiě)誤差。
4.數據深度挖掘
在數據深度挖掘能力方面,平臺提供病種分析,包括影響因素分析、預測分析、干預分析三大核心主題的分析研究。
此外,提供在線(xiàn)統計模型工具,現已整合醫學(xué)上常用的統計算法40余種,包括獨立樣本T檢驗、卡方檢驗、回歸分析等。操作設計完全結合醫學(xué)專(zhuān)業(yè)特點(diǎn)以及科學(xué)研究思路,將大部分數據處理和量化過(guò)程轉由后臺直接完成,省去人工處理數據的復雜度,提高科研效率。
5.數據導出
平臺可針對數據的分類(lèi)模型,定制每種分類(lèi)數據的導出模式,基于關(guān)鍵事件處理、復雜邏輯計算、自動(dòng)行列轉換、智能標準化值域輸出等新技術(shù)。替代統計學(xué)處理之前大量的手工數據處理工作,為醫生在階段性統計階段節省大量時(shí)間。