【AI創意無法擋】OpenVNIO創意應用案例探討（下）

Posted By 陸向陽 on 10 月 5, 2021 in Edge AI應用案例, Edge AI開發地圖, Intel, Maker Project, OpenVINO, OpenVINO專欄, OpenVINO應用, 案例研究 | 0 comments

作者：陸向陽

《Intel^® DevCup x OpenVINO™ Toolkit》AI創意競賽首獎30萬，正如火如荼徵件中（2021/10/31 23:59截止報名）！

上一篇觀察了Grand Prize的5個得獎作品後，本文則來觀察三個開發者精選獎（Developer Choice Prize），同時也挑選兩個早鳥獎（Early Submission Prize）作品來探討一下。

6. 抓逃票系統（Realtime Fare Evasion Detection From Video Using OpenVINO）

偵測逃票者與逃票姿態。（圖片來源：hackster.io）

無論國內外總有一些缺德者在車站逃票搭乘讓運輸公司蒙受損失，以紐約市交通局自身統計為例一年即損失達2.15億美元，地鐵佔9600萬，公車佔1.19億，且為成長趨勢。

而且，現行抓逃票是以人工方式收集數據與抽查，數據不全然精準，人工抽查過程也可能帶偏見（被質疑只挑找黑人或看起來是窮人），因此這個提案改用攝影機拍攝，而後以深度學習技術辨識是否逃票，分析方式運用CNN、LSTM演算，也用及OpenVINO Pre-trained模型（Open Model Zoo）中已經預先訓練好的MobileNet SSD偵測器，姿態推估方面也同樣取自OpenVINO的模型。

此提案中也帶入成本概念，概估每一套抓逃票系統約300美元，一個地鐵站裝設五套，472個站約要60萬美元，每一套以樹莓派為主體，搭配Intel NCS 2與OpenVINO所構成。

7. 說書問答機（Teachable Machine）

說書問答機（Teachable Machine）透過攝影機拍攝書頁內容（可以是一段故事，或維基百科文章等），把內容轉化成文字，然後人們可以問書上的問題，問題透過麥克風轉成文字，問答機就會依據原先以轉化成的內容，回應發問的人，可視為一種學習服務機。

硬體方面使用樹莓派與樹莓官方的攝影機，人工智慧加速器為Intel NCS 2，聲音辨識方面則用Seeed ReSpeaker 2，另外搭配2組功率3瓦的喇叭。

機器學習方面用及三個模型。一是Tesseract OCS（基於LSTM），用於OCR辨識，把書頁內容轉成文字，該模型已可以識別100多種語言文字，也可以持續擴充訓練其他語言文字；二是DeepSpeech（TensorFlow Lite模型），用來把語音轉成文字；三是BERT，用來推論人們發話的問題應該對應到哪一段的回答。最後，最合適的回答文字會透過Festival軟體轉成語音發聲。

8. 從X光片偵測新冠肺炎（COVID-19 Detection from X-Ray Using OpenVINO）

透過X光片偵測有無COVID-19。（圖片來源：hackster.io）

這個提案的痛點幾乎不用說明了，全球已超過3,120萬人感染COVID-19，但檢查方式不能很精準，此提案嘗試用胸腔X光片影像辨識的方式提高準確度，目標為90%，但提案者必須聲明在先，這不是COVID-19官方的測試模型，目前為教育學習性的試驗。除了偵測COVID-19外，也期望透過微幅調整數據而能檢查出胸腔的其他疾病。

此提案使用Mendeley數據集，數據集內為COVID-19相關醫療影像，如X光片影像、CT斷層掃描影像，其中無COVID-19的影像約5,500張，有的為4,044張。演算法方面使用具有dropout與flattening的CNN以及MaxPooling層，目前訓練成果以955張圖片進行測試，其推論準確度達92%，花費時間9.34秒。推論過程中也運用OpenVINO技術獲得1.2倍的加速效果。

提案者也提出未來規劃，期望能建構一個線上平台，讓醫生直接上傳X光片影像後，就可以自動透過手機告知用戶推論結果。