本發明屬于臨床預測模型構建,涉及一種預測模型構建方法,尤其涉及一種陰道分娩并發癥風險預測模型構建方法、系統、電子設備及存儲介質。
背景技術:
1、臨床預測模型作為風險與獲益評估的量化工具,其中預后模型被廣泛運用于疾病并發癥的預測。并發癥風險預測模型是通過分析并發癥相關風險因素數據,量化評估患者在某種疾病或治療過程中發生并發癥的風險。現階段國內外關于并發癥預測模型的研究主要集中在糖尿病并發癥、外科術后并發癥等領域,如骨盆髖部骨折術后并發癥、胸腔鏡肺癌根治術后并發癥、結直腸癌術后并發癥等。
2、目前,尚未有關于陰道分娩常見并發癥發生風險的綜合預測模型,難以實現對陰道分娩常見并發癥的早期識別和干預的重要臨床價值。而涉及到陰道分娩常見并發癥相關的風險預測模型主要僅針對單一的并發癥,如產后出血風險預測模型、產科裂傷風險預測模型等。關于各種陰道分娩單一并發癥風險的評估工具數量較多,評估質量及效果參差不齊,臨床使用率較低。考慮原因為陰道分娩并發癥風險預測模型的構建大多基于回顧性隊列研究且部分研究樣本僅局限于某一類特定人群,缺少嚴格的內部及外部驗證過程,模型預測性能有待進一步提高。
3、有鑒于此,如今迫切需要設計一種新的臨床預測模型構建方式,以便克服現有臨床預測模型構建方式存在的上述至少部分缺陷。
技術實現思路
1、本發明提供一種陰道分娩并發癥風險預測模型構建方法、系統、電子設備及存儲介質,可更加全面地預測多種陰道分娩常見并發癥的發生情況,根據不同孕產婦特征數據,客觀、快速、有效地作出并發癥發生風險預測評估。
2、為解決上述技術問題,根據本發明的一個方面,采用如下技術方案:
3、一種陰道分娩并發癥風險預測模型構建方法,所述陰道分娩并發癥風險預測模型構建方法包括:
4、步驟s1、獲取孕產婦特征數據;
5、步驟s2、獲取孕產婦特征數據的風險指標;
6、步驟s3、將設定孕產婦特征數據分為訓練數據集及測試數據集,供建模使用;
7、步驟s4、利用步驟s3獲取的數據集,將劃分的數據集以隨機森林模型的方式進行建模。
8、作為本發明的一種實施方式,所述步驟s4包括:
9、樣本選取步驟,從設定數據庫中選擇樣本數據;
10、數據預處理步驟,對所述樣本選擇單元選擇的樣本數據進行預處理;
11、特征選擇步驟,選擇特征數據;選擇的特征數據包括產前數據(孕產婦一般情況、婦產專科既往史、本次妊娠情況),產時數據(本次產程信息、新生兒情況、分娩時產婦情況)以及產后數據(陰道分娩常見并發癥發生情況);
12、變量選擇步驟,選擇變量數據;分別采用logi?st?ic回歸及lasso回歸,得出對預測結果影響最為顯著的變量,最終確定最佳預測變量變量組合;
13、建模步驟,建立數學模型;根據最佳預測變量組合進行數學建模;
14、超參數調優步驟,采用網格參數搜索方法,循環迭代遍歷所有可能的參數組合來進行參數組合調優;
15、變量重要性排序步驟,分別采用預測平均精確度減少值和平均基尼指數減少值對隨機森林模型中變量進行重要性排序;
16、模型預測效能評價步驟,通過模型的預測準確率、靈敏度、特異度評價模型總體預測表現;從模型的區分度、校準度以及臨床實用性三個方面進行模型預測效果評價。
17、作為本發明的一種實施方式,步驟s4中,進行超參數調優,隨機森林建模時參數范圍假定為:決策樹數量(ntree)=c(100,200,300,400,500);節點劃分特征數(mtry)=c(2,3,4,5)。最終得出最佳模型參數配置為:決策樹數量(ntree)=200、節點劃分特征數(mtry)=4,此時訓練出的模型預測性能最優。
18、作為本發明的一種實施方式,所述方法進一步包括:
19、步驟s5、對步驟s3獲取的數據集進行變量重要性分析;
20、分別采用預測平均精確度減少值和平均基尼指數減少值對隨機森林模型中變量重要性進行排序;
21、步驟s6、對模型進行預測效能評價;
22、通過模型的預測準確率、靈敏度、特異度評價模型總體預測表現;從模型的區分度、校準度以及臨床實用性三個方面進行模型預測效果評價。
23、根據本發明的另一個方面,采用如下技術方案:一種陰道分娩并發癥風險預測模型構建系統,所述陰道分娩并發癥風險預測模型構建系統包括:
24、特征數據獲取模塊,用以獲取孕產婦特征數據;
25、風險指標獲取模塊,用以獲取孕產婦特征數據的風險指標;
26、數據集分配模塊,用以將設定孕產婦特征數據分為訓練數據集及測試數據集,用以供建模使用;
27、預測模型構建模塊,用以將劃分的數據集以隨機森林模型的方式進行建模,構建陰道分娩并發癥風險預測模型。
28、作為本發明的一種實施方式,所述預測模型構建模塊包括:
29、樣本選取單元,用以從設定數據庫中選擇樣本數據;
30、數據預處理單元,用以對所述樣本選擇單元選擇的樣本數據進行預處理;
31、特征選擇單元,用以選擇特征數據;選擇的特征數據包括產前數據(孕產婦一般情況、婦產專科既往史、本次妊娠情況),產時數據(本次產程信息、新生兒情況、分娩時產婦情況)以及產后數據(陰道分娩常見并發癥發生情況);
32、變量選擇單元,用以選擇變量數據;分別采用logi?st?ic回歸及lasso回歸,得出對預測結果影響最為顯著的變量,最終確定最佳預測變量變量組合;
33、建模單元,用以建立數學模型,根據最佳預測變量組合進行數學建模;
34、超參數調優單元,用以采用網格參數搜索方法,循環迭代遍歷所有可能的參數組合來進行參數組合調優。
35、作為本發明的一種實施方式,所述陰道分娩并發癥風險預測系統進一步包括:
36、變量重要性排序模塊,用以分別采用預測平均精確度減少值和平均基尼指數減少值對隨機森林模型中變量進行重要性排序;
37、模型預測效能評價模塊,用以通過模型的預測準確率、靈敏度、特異度評價模型總體預測表現;從模型的區分度、校準度以及臨床實用性三個方面進行模型預測效果評價。
38、作為本發明的一種實施方式,所述預測模型構建模塊進行超參數調優,隨機森林建模時參數范圍假定為:決策樹數量(ntree)=c(100,200,300,400,500);節點劃分特征數(mtry)=c(2,3,4,5)。最終得出最佳模型參數配置為:決策樹數量(ntree)=200、節點劃分特征數(mtry)=4,此時訓練出的模型預測性能最優。
39、根據本發明的又一個方面,采用如下技術方案:一種電子設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執行所述計算機程序時實現上述方法的步驟。
40、根據本發明的又一個方面,采用如下技術方案:一種存儲介質,其上存儲有計算機程序指令,該計算機程序指令被處理器執行時實現上述方法的步驟。
41、本發明的有益效果在于:本發明提出的陰道分娩并發癥風險預測模型構建方法、系統、電子設備及存儲介質,可更加全面地預測多種陰道分娩常見并發癥的發生情況,根據不同孕產婦特征數據,客觀、快速、有效地作出并發癥發生風險預測評估。
42、通過應用本發明陰道分娩常見并發癥發生風險預測模型能夠對孕產婦多種常見陰道分娩并發癥的發生進行量化估算,以指導針對性干預方案的制定,積極改善孕產婦分娩安全情況,提高其產后生活質量,對高風險孕產婦進行早期識別和及時采取預防干預具有重要意義。
43、本發明針對三類常見的陰道分娩并發癥(產科裂傷、產后出血、胎盤胎膜滯留不伴出血),權衡綜合性發生風險因素進行數據分析,能夠預測多種陰道分娩常見并發癥的發生。通過更全面地對發生陰道分娩常見并發癥的風險因素進行評估,更大范圍地覆蓋了存在風險因素的陰道分娩人群,有助于實現對陰道分娩常見并發癥的早期識別和干預,以保障孕產婦的分娩安全。
44、本發明引入了人工智能領域的機器學習算法,基于隨機森林算法構建陰道分娩常見并發癥發生風險預測模型,該模型區別于以logi?st?ic回歸算法為核心的傳統風險預測模型,能更好地呈現出陰道分娩并發癥風險的預測性能,從而實現對陰道分娩常見并發癥發生情況更準確的預測。
45、本本發明在對陰道分娩常見并發癥風險因素探索分析的基礎上,明確界定相關風險因素,采用隨機森林算法構建陰道分娩常見并發癥風險預測綜合模型,有助于為制定系統規范的陰道分娩常見并發癥防治方案提供科學手段。