台灣AI實力再現：AIEC首度公布語言模型在地化評測結果

Posted By MakerPRO編輯部 on 10 月 20, 2025 in Gemini, 新聞稿 | 0 comments

隨著人工智慧（AI）技術在全球迅速擴張，如何確保AI系統的可靠性與在地適應性，成為各國關注的重點。在台灣，由數位發展部旗下數位產業署攜手國家資通安全研究院與工業技術研究院，共同設立的「AI產品與系統評測中心」（Artificial Intelligence Evaluation Center，簡稱AIEC），近期首度公布了語言模型的基準評測結果，為我國AI的本土化發展與第三方驗證奠定了重要基礎。

本土模型表現亮眼

本次評測涵蓋42項語言模型，橫跨小型（13B以下）與大型（13B以上）兩大規模。值得關注的是，由台灣本土研發的TAIDE（Gemma-3-TAIDE-12B）在小型模型中脫穎而出，超越了所使用的原基礎模型Google（Gemma-3-12B-it），展現出台灣在AI研發上的深厚實力。

另一方面，在大型模型中，OpenAI的GPT-5整體表現最佳，而Google的Gemini 2.5 Flash則在「台灣價值觀」評測中表現尤為出色，顯示其對台灣主流社會價值有相對精準的理解與回應能力。

在地化語料的重要性

AIEC的分析也發現，部分中國開發的語言模型在「台灣價值觀」評測項目中表現不俗，研判可能與其採用「蒸餾技術」有關，即以歐美基礎模型輸出作為訓練資料。相對而言，若歐美模型未使用台灣繁體中文語料進行訓練，其在本地化價值觀的理解上表現普遍較弱，凸顯建立在地語料庫的重要性。

本次評測不僅依語言模型規模進行系統性檢測，還納入了多項指標，包括「高中學測國文科」、「高中學測社會科」以及「台灣價值觀」測試。此舉呼應國際AI主權與在地化趨勢，也將成為未來建構本土模型或調校國際模型的核心參考。

數位發展部表示，台灣正積極推動主權AI語料庫建設，提供涵蓋繁體中文在地語境與本土價值的資料，確保AI發展符合社會文化與價值觀。AIEC亦將廣泛徵求各界專家提供評測題目，經審查後納入未來評測題庫，使評測更加完整且具前瞻性。

建立國內完整評測體系

AIEC成立的長遠目標，是建立完整的國內AI產品與系統評測體系。中心將提供從安全性、安全韌性、準確性、透明性到隱私與資安等十項核心評測服務，並參考國際規範如NIST、ISO及歐盟AI標準，持續研發本土化評測工具，並與國際方法接軌，以提升台灣AI產品的全球市場競爭力。透過這樣的努力，台灣不僅能確保AI技術的安全與可靠，也能彰顯本土AI研發的實力與信任度。