過去,醫(yī)療行業(yè)的研究人員需要手動收集和分析大量數(shù)據(jù)來預(yù)測和治療疾病。面對復(fù)雜的數(shù)據(jù)信息,相關(guān)的數(shù)據(jù)分析工作極具挑戰(zhàn)性。隨著人工智能的發(fā)展,醫(yī)生在就診時根據(jù)實(shí)驗(yàn)室檢測結(jié)果、家族史、臨床試驗(yàn)數(shù)據(jù)和其他生命統(tǒng)計數(shù)據(jù)獲得實(shí)時分析報告將成為現(xiàn)實(shí)。本文以人工智能在重癥醫(yī)學(xué)中的應(yīng)用為例,描述了如何利用DarwinML來輔助醫(yī)療行業(yè)的數(shù)據(jù)科學(xué)家進(jìn)行自動建模。數(shù)據(jù)融合數(shù)據(jù)提取平臺該平臺幫助醫(yī)學(xué)數(shù)據(jù)科學(xué)家將原始數(shù)據(jù)自動轉(zhuǎn)換為模型可以使用的特征數(shù)據(jù)。該功能以數(shù)據(jù)流的形式實(shí)現(xiàn),研究人員可以通過修改參數(shù)和拖動節(jié)點(diǎn)靈活改變特征提取過程。下圖是一個數(shù)據(jù)流圖。DarwinMLStudio自動建模平臺從數(shù)據(jù)導(dǎo)入和清理開始。DarwinML可以自動建模并給出模型的多向評價結(jié)果。數(shù)據(jù)科學(xué)家只需要關(guān)注模型的評估結(jié)果。根據(jù)研究目標(biāo),研究者將返回調(diào)整初始數(shù)據(jù)清理方案和模型設(shè)置,多次建立模型,并選擇滿足研究需要的最終模型。DarwinML自動建模平臺的整個過程如下:1)數(shù)據(jù)清理:平衡樣本分布,填充缺失值,消除特征的異常值,數(shù)字化文本特征。2)模型設(shè)計:根據(jù)研究人員的數(shù)據(jù)特征和參數(shù)設(shè)置,在搜索空間中自動構(gòu)建最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu)。網(wǎng)絡(luò)結(jié)構(gòu)將在平臺中顯示如下。3)超級參數(shù)調(diào)整:為最佳網(wǎng)絡(luò)結(jié)構(gòu)和數(shù)據(jù)特征提供匹配的最佳超級參數(shù)組合,如下圖所示“超級參數(shù)”欄中的XGBClassifiler的學(xué)習(xí)速率和嵌套參數(shù)。4)模型訓(xùn)練:使用最優(yōu)網(wǎng)絡(luò)和超級參數(shù)的組合來實(shí)際訓(xùn)練模型。5)模型評價:給出了召回率、精度和AUC等基本指標(biāo)值,從模型角度給出了重要欄目的分析結(jié)果,從樣本角度給出了單個樣本的重要特征分析。同時,DarwinML自動建模平臺也支持只使用一些需要的功能。例如,我們可以導(dǎo)入一組新患者的檢查數(shù)據(jù),使用上次訓(xùn)練的模型,并且只評估模型,從而預(yù)測這組新患者的患病概率。病例:中嚴(yán)重感染綜合征(也稱為敗血癥)的預(yù)后研究根據(jù)其早期檢查指標(biāo),我們使用DarwinML對重癥監(jiān)護(hù)病房(ICU)中的患者進(jìn)行嚴(yán)重感染綜合征(也稱為敗血癥)的警告
電商動態(tài)
面向醫(yī)療行業(yè)數(shù)據(jù)科學(xué)家的人工智能解決方案:自動建模平臺
瀏覽:163 時間:2023-9-12