智慧醫療與照護概念組

參賽團隊名稱:駿馬AI醫療

解決方案:

本專案的目標是:基於OpenVINO實踐醫療領域的聯邦式學習&分散式協同推理架構。

本案例啟動了4個引擎,來支撐聯邦式機器學習,包括 1個Intel CPU、2個NCS和一個耐能KL520。展現出OpenVINO架構的異質性分散式協同推理綜效。

本專案整合了5個ML模型,由於醫療領域資料難以集中,所以採取聯邦式學習模式來整合這些模型。包括:

  1. 心電圖ECG模型:這是CNN+Classifier模型,運行於NCS2。
  2. 血鐵沉積Hemo模型:這是RNN+Regression模型,運行於NCS2。
  3. GWAS降維分類模型(包含兩個子模型):
  • Stacked AE(簡稱SAE)模型運行於NCS2。
  • Classifier運行於耐能KL520。
  1. UI語音識別模型:這是MFCC+Classifier模型,運行於CPU。

成果影片介紹:

提案動機與技術構想

在醫療產業中,由於其資料的分散性以及諸如個資法的規範,傳統單一的整合模型,一起優化、推論的模式變得窒礙難行。於是,本專案採取聯邦式學習(Federated Learning ),分散於各地以OpenVINO進行各自優化,再聯合起來進行協同推理。

例如,在本專案裡的基因組關聯分析(GWAS, Genome-wide association studies)應用中,其目的是要從全體基因組中探索其中數以百萬計的SNPs(基因變異特徵),歸納出它們與特定疾病的關聯性。除了剛才所述的資料的分散性因素之外,由於基因數據中的高維數,要計算所有可能的SNP各種組合,使得這種高通量(High-Throughput)計算上變得更加困難。這通稱為:維度災難(Curse of Dimensionality)。這個名詞,最早是由理察·貝爾曼(Richard E. Bellman)在考慮優化問題時首次提出來的術語,用來描述當計算空間維度增加時,分析高維空間(如數千維以上)時,會遇到各種不可測奇怪现象。

於是,採用DL(Deep Learning)方法,對大量、複雜和非結構化的資料,抽象為潛藏空間的表示,該潛藏空間的表示形式能夠捕獲GWAS中SNP之間的上位性(Epistatic)效應。其中最具功效的是Stacked AE(簡稱SAE)模型。它是由多個AE(Autoencoder)逐層堆疊以產生堆疊式自動編碼器,能夠有效地化解上述的維度災難。在本專案裡,就運用OpenVINO和NCS來實踐這項Stacked AE模型,如下圖所示。

首先,基於聯邦式學習,實現跨部門開發,在A部門使用原始資料訓練Stacked AE模型,並輸出Embedded code傳送到B部門裡繼續訓練Classifier模型。然後,兩個模型分別在NCS和耐能KL520推理。如下圖所示。

一旦基於聯邦式學習,訓練好個模型之後,就能充分發揮OpenVINO的高度整合性和彈性,依據業務上的需求而做創新性組合。例如,可以把本專案的5個模型匯合於一台PC上,也能很流暢、和諧的協同推理。如下圖所示。

1 則留言

發佈留言

Your email address will not be published. Required fields are marked *

Post comment