|

請問您是否忘了把命令中「中文字」的部份改成您Windows中的真正路徑名稱了呢?或者你是使用2020或2021版本的OpenVINO造成不相容的問題? 由於這篇文章年代較久了,OpenVINO已進展到2021.4 LTS版本了,舊的範例可能無法對應新的版本,建議您可參考下列兩個網址的範例 https://docs.openvinotoolkit.org/latest/omz_demos_instance_segmentation_demo_python.html https://docs.openvinotoolkit.org/latest/omz_demos_segmentation_demo_python.html 如果這兩個範例仍不容易理解,那也可以參考我在Github上開源的幾個範例,這些範例可直接在Google Colab上直接執行OpenVINO及範例,很方便學習。 其中Colab_OpenVINO_Sound_Segmentation.ipynb較為接近此篇文章的用法。 https://github.com/OmniXRI/Colab_DevCloud_OpenVINO_Samples

一般資料集會分為訓練集、驗證集及測試集,60000筆只拿了50000筆來訓練及驗證,所以一個Epoch才會只有50000。 若你只出現1250,建議你檢查一下關於訓練相關的設定值。 另外我最近有寫一篇新的Yolov4自定義資料集物件偵測文章可參考一下。 https://omnixri.blogspot.com/2021/05/google-colabyolov4-tiny.html ps. mnist是影像分類不是物件偵測。

訓練若已收歛,或說LOSS已低過某過數值,就會停止。資料集過少,的確有可能產生過擬合現象,提早結束。但實際狀況仍需以錯誤訊息為主。

在影像辨識中最重要的是建立良好的已標註資料集,不管是影像分類還是物件偵測,如果一般人看到一張照片都分不出來是那個分類,那就不要為難電腦了,因為在標註上肯定會出狀況。 一般要有好的辨識結果模型雖很重要,但大部份問題還是會出在資料集及標註,若資料集大小太小(只有幾百張)或分類極不平均時,通常不會得到太好的成果。 如果反過來從網路上收集大家拍過的八景照片,或許能更明確指出分類重點為何,同時也被清楚標註,那資料集一多,才有討論模型辨識能力的空間。

資料集越多越好,且要多樣性(不同視點、光照等),通常要數千張才會有較理想訓練結果。 有時沒這麼多(只有數十張)可採資料擴增(Data Augmentation)或改以遷移學習(Transfer Learning)方式處理,但和本範例方式做法不同,須另外參考其它人的文章。 另外訓練時一定要一起訓練,目前常見的模型多半都不支援分成多個部份訓練後再組合。

Please wait...