AI模型誰最「聰明」？IQ 排行榜比一比

Posted By MakerPRO編輯部 on 10 月 1, 2025 in 技術新訊, 特寫 | 0 comments

在過去，談到人工智慧的「聰明程度」，我們往往依賴機器學習基準數據集、學術比賽或某些特定任務的表現。智商（IQ）測驗──特別是 Mensa 的測驗──長期以來被視為人類智力的某種「標準尺」，當 AI 與這種人類專屬的考試相遇，故事就變得有趣起來了。

TrackingAI（trackingai.org）是一個由美國記者 Maxim Lott 發起的專案網站。它每天都在持續測試不同的人工智慧模型，從政治偏見、知識題庫，到如今最受矚目的 Mensa 挪威智商測驗。不同於一般實驗室中的封閉研究，這裡的數據是公開的、即時的，每個人都能看到 AI 模型的分數如何浮動。

網站的核心做法很直接：它將 Mensa Norway 的題目轉換成 AI 能理解的形式，然後把這份「智商考卷」交給不同的模型作答。最後，它把正確率轉換成對應的人類 IQ 分數。於是，我們得以看到一份全球少見的「AI 智商排行榜」。

source

把圖像題變成文字：AI 的「翻譯版」測驗

Mensa 挪威智商測驗以圖形推理著稱，那些矩陣題、形狀規律題，往往需要人類的空間想像力與抽象推理。然而，大多數 AI 模型的強項仍是語言。於是，TrackingAI 採取了一個折衷方法：將圖像題「口述化」。

例如，一道典型的人類題目可能是一個 3×3 的方格，裡面有不同方向與顏色的圖案，要找出缺漏的最後一格。當這樣的題目交給 AI 時，系統會將其翻譯成文字描述，告訴模型每一格的內容，再列出選項，讓 AI 選擇 A、B、C 或 D。

有趣的是，這種「文字化」過程不僅讓 AI 得以參加比賽，也同時凸顯了一個現象：人工智慧在語言推理上的長處，反而讓它在這些翻譯後的題目中比人類更有優勢。畢竟，對模型來說，處理文字規則比直接解讀圖像更自然。

拒答、重試與分數計算

當然，AI 不是每次都順利作答。TrackingAI 制定了規則：若模型拒絕答題，系統會重複送出問題，最多十次。只要最後能得到一個答案，就會記錄在成績中。若最終仍拒答，則會被視為失敗。

每一題的正確率會統計起來，再映射到人類 IQ 的分布標準。例如，一個模型若正確率達到人類前 2% 的水準，它的 IQ 分數大約就落在 130 分上下，屬於「天才級」。為了避免偶然性，TrackingAI 會取模型最近七次測驗的平均，作為當下的「官方分數」。

這樣的設計，使得網站不僅是一份靜態報告，而像是一個「即時排名」。人們可以看到模型在不同時間的起伏，彷彿在觀看一場 AI 的長跑比賽。

最新榜單：AI 與人類的差距

那麼，目前的結果如何？截至 2025 年 9 月底，TrackingAI 公開的 Mensa Norway 測驗排行榜顯示，Grok-4 模型高居榜首，8-9月智商分數平均為 123 分，已靠近「天才級」範圍（>130）。換算成人類的語境，這意味著它的推理表現超過了大部分的人類。

緊隨其後的是 OpenAI GPT 5 Pro （得分 118 分），接近高智商人群的門檻。再往下是Claude 4 Opus（118分）、 Gemini 2.5 Pro和OpenAI GPT 5 Thinking（同為116分），也都超過一般人類的平均智商（大多數人會落在 85–115 之間）。

值得注意的是，並非所有模型都能在這份考試中表現突出，只要是強調Vision的模型，表現分數反而落在 90 分以下。換言之，純語言模型在這個比賽中佔據了優勢。

當 AI 得分「超過人類」時

當 OpenAI o3 被測出 IQ 高達 135 時，媒體爭相以「AI 智商超越人類」為標題。然而，這樣的說法雖然吸引眼球，卻值得細究。

首先，Mensa 題目僅僅測量人類智力的一部分：抽象推理與圖形邏輯。它並不涵蓋情感智慧、常識判斷、創造力或價值觀。AI 在這些範疇仍然存在明顯的不足。

其次，AI 有可能「見過題目」。大型語言模型的訓練資料極其龐大，難以保證其中完全沒有出現過類似的 Mensa 題庫。如果 AI 只是「記憶」而非「推理」，那麼分數就失去了原本的意義。

最後，這份測驗採用了「文字化」的描述，這在某種程度上反而弱化了題目的圖像特性。人類在閱讀這種「翻譯版」題目時會覺得拗口，但對 AI 來說卻是最舒適的形式。可以說，這場考試的規則天然偏向於模型的優勢。

結語

當我們看到AI模型的IQ高分時，固然會對 AI 的進步感到驚嘆，但智商分數並不能完全等同於「智慧」。真正的智能，還包含情境理解、創造力、價值觀與倫理判斷。而在這些領域，人類依舊佔據著無可取代的地位。

或許，與其糾結於「AI 的 IQ 是否超過人類」，更值得思考的是：當 AI 能在某些智力維度上接近甚至超越人類時，我們該如何重新劃定彼此的角色？人類要如何在這場智慧的競賽中，不僅保持優勢，更確保科技能被用在正確的方向？

（責任編輯：歐敏銓）

About
Latest Posts

MakerPRO編輯部

MakerPRO.cc為華人圈最專注於Maker創新創業、物聯網及共享經濟報導及共筆發表的專業媒體，不論是趨勢分析與評論，或創新實作文章，在華文創新創業媒體領域都具有重要的影響力。

Latest posts by MakerPRO編輯部 (see all)

2026 機器人VLA模型 Sim2Real模擬器大點兵 - 2025/12/29
奠定台灣AI治理與產業發展基石　《人工智慧基本法》三讀通過　 - 2025/12/25
AI正重塑世界！從四大面向探索2026年資通訊產業趨勢 - 2025/12/23

訂閱MakerPRO知識充電報

與40000位開發者一同掌握科技創新的技術資訊！