作者:高煥堂
AI產業化的致勝三力:專家直覺知識力、AI建模師創新力及數據運算力。此三力幫助到AI產業進步(即AI產業化),AI能才壯大幫助各行業(產業AI化):
- 專家直覺知識力 — 建立各行業的知識圖譜,支持Graph AI。
- AI建模師創新力 — 培育〈科技+美學〉跨領域人才。
- 大數據運算力 — 強化 Edge AI 晶片生態鏈,開發Edge AI 作業系統軟體。
全球AI產業發展的轉折點
從兩家近年來火爆的機構來看,一個就是剛剛發佈ChatGPT的OpenAI,另一個是去年開源了Stable Diffusion的Stability AI。有意思的是OpenAI300多人的團隊大部分不是電腦博士,而Stability AI一百多人裡只有一名博士,相比很多科技巨頭他們似乎並沒有特別明顯的優勢。
這些資訊透露了什麼呢?其意味了:AI商業化之路,從演算法創新,踏上了模型創新階段。其模型創新,即是模型的組合設計&創新。也就是把一群不會飛的模型,以新的形式巧妙組合起來,竟然飛上天,傲遊天際。
- 2020年之前,AI模型 = AI演算法。
- 2020年之後,AI建模逐漸踏上〈組合創新〉,而非〈演算法創新〉。
這個轉折點很重要。例如著名的Apple公司,重點不在演算法原創,而在於把一群不會飛的模型,巧妙組合起來,竟然飛上天。其中,演算法創新,比較需要依賴數學、計算機博士,而科技性創新組合,需要跨領域的「科技美學」人才。
台灣AI產業生態的成功要素
台灣AI產業園(生態園區),其發展的關鍵成功要素是:Container(容器)。就如同長榮海運生態的Container是貨櫃(或稱為:集裝箱)。再如,華碩PC&Server生態的Container是硬體MB(主機板:Mother Board)和軟體OS。還有,台積電半導體生態的Container是IC晶片。以及耐能公司Edge AI生態的Container是AI加速晶片。
一個產業園區,涵蓋人、事、時、地、物、金流等各種要素,其中在<物>層面的Container(容器),是生態演化、繁榮壯大的關鍵性元素。沒有它,整個生態就缺乏蓬勃演化(Evolution)的生命力。沒有它,整個生態就缺乏力與美的組合。
那麼,如何尋找台灣AI產業生態的Container呢? 那就先從長榮海運貨櫃,來認識一下Continer的特徵,有三項特徵:
- 外型簡單一致。
- 內涵複雜多變。
- 無限重複組合。
在自然界的生態演化物種,也處處可見這種Container。例如,這朵花的花蕊,就是Container:外型很一致,內含各不相同,又重複組合成為一朵花。
像這圖像裡的樹葉,還有像人體的細胞等,俯拾可見。這就是一般所謂的:自然界有機次序(Organic Order)。
在最具爆發力的工業設計中,你常常可以發現其傑作具有其特色:「簡單造形、內涵不同、無限重複」。貨櫃(集裝箱)就是典型的單純造形,它兼具了「簡單造形、內涵不同、無限重複」三項特質。更重要的是:它帶來無比巨大的商業潛力和暴利商機。
例如,台灣最大船運公司就是從貨櫃起家的。長榮海運公司總裁張榮發先生在其回憶錄上寫道:
「為了配合貨櫃化運輸時代的來臨,海運事業的整體運作型態也產生了重大的轉變,無論在海上運送、碼頭作業以及陸運轉接上,都有革命性的改變。陸上拖車運輸業應時而興,扮演極為重要的角色,以貨櫃拖車配合貨櫃船運輸,具有簡化包裝、防止竊盜、加速貨物搬運及便利關務檢驗等優點,使貨櫃運輸作業更加靈活。為了能確實掌握海上及陸上的運送服務品質和效率,就率先於1973年9月成立了長榮運輸公司。」
只要擁有上述三項特質的工業設計品,都會具有無現活力和巨大商業潛能。
在許多革命性轉折裡,經常出現貨櫃(Container)的身影。貨櫃是創造「序中有亂」的利器,是承先(包容既有之繁雜)和啟後(創造新的序)的有效手段。貨櫃的外表簡單有序,能疊得很高,而且井然有序(Order)。貨櫃的內部是空的,用來容納多樣化而繁雜的物品;這種情形稱為:序中有亂(變化)。序中有亂的巨大威力,改變了整個運輸產業,也改變了人們的生活。
一樣地,當今的AI模型結構目前仍處於〈大模型架構〉,相當於1970年代的〈IBM 大型電腦〉架構。後來,到1990年代才進入台積電的IC架構時代。於是,從Container的視角,可以清晰看出臺灣AI產業(生態)發展的康莊大道:培育AI建模師,基於Container設計出形形色色、百花齊放的AI模型元件,然後重複組合出各種創新產品和應用。
那麼,在AI產業生態中,這種貨櫃(Container)的身影是什麼呢? 答案很可能是:潛藏空間(Latent Space)。例如,2023年初紅透半天邊的ChatGPT,非常依賴潛藏空間(即貨櫃身影)。例如:
AI建模師的角色與人才培養
AI建模師的職責:組合模型、訓練模型。亦即把一群不會飛的模型巧妙組合起來,訓練它然後飛上天際。如果這個創新組合架構是一個有機體,它將會綻放生命力,不僅生生不息,且無盡繁榮。台灣如果沒有積極培育優秀〈AI建模師〉,很可能是未來10年AIGC潮流下的大輸家!
至於AI建模師的職責是什麼呢? 我們來問問ChatGPT,聽聽它的解說:
Q1:AI建模師的職責是什麼?
ChatGTP回答:
AI建模師(AI Modeler)是負責創建和開發 AI 模型的專業人員。他們的一些主要職責和職能包括:
- 數據準備:AI建模師必須通過清理、轉換和規範化來為 AI 模型準備數據,以確保它適合訓練。
- 模型選擇:基於要解決的問題和可用數據,AI建模師必須選擇合適的 AI 模型架構和演算法來使用。
- 模型訓練:AI建模師使用準備好的數據訓練 AI 模型以優化其性能。
- 模型評估:AI建模師使用準確性、精確度、召回率和 F1 分數等指標評估 AI 模型的性能,以確定其有效性。
- 模型部署:AI建模師將經過訓練的 AI 模型部署到生產環境中,確保它可以用於對現實世界進行預測。
- 模型維護:AI建模師負責根據需要維護和更新 AI 模型,以確保其持續性能。
- 技術專長:AI建模師必須具有強大的技術背景和 AI、機器學習和深度學習方面的專業知識,才能開發有效的 AI 模型。
總而言之,AI 建模師在 AI 系統的開發和部署中發揮著關鍵作用,並負責確保其性能和準確性。
接下來想想:如何培養AI建模師? 我們繼續問ChatGPT,聽它的解說:
Q2:如何培養AI建模師呢?
ChatGTP回答:
教育 AI 建模師沒有千篇一律的答案,因為所需的培訓和技能可能因 AI 的特定領域和應用而有很大差異。但是,可以採取一些通用步驟來培訓 AI 建模人員:
- 基礎知識:人工智慧建模者應該對數學、統計學和計算機科學有紮實的理解,包括線性代數、微積分、概率和演算法。
- 編程技能:AI 建模者應至少精通一種編程語言,例如 Python,並具有使用 TensorFlow 和 PyTorch 等機器學習和深度學習庫和框架的經驗。
- 數據操作和分析:AI 建模人員應該具有處理大型數據集、清理和轉換數據以及使用統計技術分析和解釋數據的經驗。
- 機器學習概念:AI 建模者應該對監督和非監督學習有很好的理解,包括決策樹、隨機森林、k 最近鄰和神經網絡。
- 深度學習概念:對於那些對深度學習感興趣的人,重要的是要很好地理解卷積神經網絡 (CNN)、循環神經網絡(RNN) 和生成對抗網絡 (GAN)。
- 道德和責任:AI 建模者應該意識到 AI 的道德和社會影響,並能夠做出將這些考慮在內的決策。
- 真實世界的經驗:AI 建模者應該有處理真實世界項目和將模型部署到生產中的經驗,因為這將幫助他們理解創建和部署 AI 系統所涉及的實際挑戰。
以上這些只是 AI 建模者應該具備的一些關鍵技能和知識領域。所需的具體技能和知識可能會有所不同,具體取決於正在開發的 AI 模型的類型及其使用的應用程式。
小結
當我們培養了AI建模師,而全球AI產業也持續演化,則這些AI建模師,結合有機生態的Container商業&設計思維,就成為優秀的AI產業生態的建築師了。
(責任編輯:謝嘉洵。)
- LoRA微調三步驟:以大語言模型MT5為例 - 2024/05/02
- 為什麼Gemma採取Decoder-Only Transformer架構呢? - 2024/04/08
- 如何從0訓練企業自用Gemma模型 - 2024/04/03