|

AI模型誰最「聰明」?IQ 排行榜比一比

   

在過去,談到人工智慧的「聰明程度」,我們往往依賴機器學習基準數據集、學術比賽或某些特定任務的表現。智商(IQ)測驗──特別是 Mensa 的測驗──長期以來被視為人類智力的某種「標準尺」,當 AI 與這種人類專屬的考試相遇,故事就變得有趣起來了。

TrackingAI(trackingai.org)是一個由美國記者 Maxim Lott 發起的專案網站。它每天都在持續測試不同的人工智慧模型,從政治偏見、知識題庫,到如今最受矚目的 Mensa 挪威智商測驗。不同於一般實驗室中的封閉研究,這裡的數據是公開的、即時的,每個人都能看到 AI 模型的分數如何浮動。

網站的核心做法很直接:它將 Mensa Norway 的題目轉換成 AI 能理解的形式,然後把這份「智商考卷」交給不同的模型作答。最後,它把正確率轉換成對應的人類 IQ 分數。於是,我們得以看到一份全球少見的「AI 智商排行榜」。

把圖像題變成文字:AI 的「翻譯版」測驗

Mensa 挪威智商測驗以圖形推理著稱,那些矩陣題、形狀規律題,往往需要人類的空間想像力與抽象推理。然而,大多數 AI 模型的強項仍是語言。於是,TrackingAI 採取了一個折衷方法:將圖像題「口述化」。

例如,一道典型的人類題目可能是一個 3×3 的方格,裡面有不同方向與顏色的圖案,要找出缺漏的最後一格。當這樣的題目交給 AI 時,系統會將其翻譯成文字描述,告訴模型每一格的內容,再列出選項,讓 AI 選擇 A、B、C 或 D。

有趣的是,這種「文字化」過程不僅讓 AI 得以參加比賽,也同時凸顯了一個現象:人工智慧在語言推理上的長處,反而讓它在這些翻譯後的題目中比人類更有優勢。畢竟,對模型來說,處理文字規則比直接解讀圖像更自然。

拒答、重試與分數計算

當然,AI 不是每次都順利作答。TrackingAI 制定了規則:若模型拒絕答題,系統會重複送出問題,最多十次。只要最後能得到一個答案,就會記錄在成績中。若最終仍拒答,則會被視為失敗。

每一題的正確率會統計起來,再映射到人類 IQ 的分布標準。例如,一個模型若正確率達到人類前 2% 的水準,它的 IQ 分數大約就落在 130 分上下,屬於「天才級」。為了避免偶然性,TrackingAI 會取模型最近七次測驗的平均,作為當下的「官方分數」。

這樣的設計,使得網站不僅是一份靜態報告,而像是一個「即時排名」。人們可以看到模型在不同時間的起伏,彷彿在觀看一場 AI 的長跑比賽。

最新榜單:AI 與人類的差距

那麼,目前的結果如何?截至 2025 年 9 月底,TrackingAI 公開的 Mensa Norway 測驗排行榜顯示,Grok-4 模型高居榜首,8-9月智商分數平均為 123 分,已靠近「天才級」範圍(>130)。換算成人類的語境,這意味著它的推理表現超過了大部分的人類。

緊隨其後的是 OpenAI GPT 5 Pro (得分 118 分),接近高智商人群的門檻。再往下是Claude 4 Opus(118分)、 Gemini 2.5 Pro和OpenAI GPT 5 Thinking(同為116分),也都超過一般人類的平均智商(大多數人會落在 85–115 之間)。

值得注意的是,並非所有模型都能在這份考試中表現突出,只要是強調Vision的模型,表現分數反而落在 90 分以下。換言之,純語言模型在這個比賽中佔據了優勢。

當 AI 得分「超過人類」時

當 OpenAI o3 被測出 IQ 高達 135 時,媒體爭相以「AI 智商超越人類」為標題。然而,這樣的說法雖然吸引眼球,卻值得細究。

首先,Mensa 題目僅僅測量人類智力的一部分:抽象推理與圖形邏輯。它並不涵蓋情感智慧、常識判斷、創造力或價值觀。AI 在這些範疇仍然存在明顯的不足。

其次,AI 有可能「見過題目」。大型語言模型的訓練資料極其龐大,難以保證其中完全沒有出現過類似的 Mensa 題庫。如果 AI 只是「記憶」而非「推理」,那麼分數就失去了原本的意義。

最後,這份測驗採用了「文字化」的描述,這在某種程度上反而弱化了題目的圖像特性。人類在閱讀這種「翻譯版」題目時會覺得拗口,但對 AI 來說卻是最舒適的形式。可以說,這場考試的規則天然偏向於模型的優勢。

結語

當我們看到AI模型的IQ高分時,固然會對 AI 的進步感到驚嘆,但智商分數並不能完全等同於「智慧」。真正的智能,還包含情境理解、創造力、價值觀與倫理判斷。而在這些領域,人類依舊佔據著無可取代的地位。

或許,與其糾結於「AI 的 IQ 是否超過人類」,更值得思考的是:當 AI 能在某些智力維度上接近甚至超越人類時,我們該如何重新劃定彼此的角色?人類要如何在這場智慧的競賽中,不僅保持優勢,更確保科技能被用在正確的方向?

(責任編輯:歐敏銓)

MakerPRO編輯部

訂閱MakerPRO知識充電報

與40000位開發者一同掌握科技創新的技術資訊!

Author: MakerPRO編輯部

MakerPRO.cc為華人圈最專注於Maker創新創業、物聯網及共享經濟報導及共筆發表的專業媒體,不論是趨勢分析與評論,或創新實作文章,在華文創新創業媒體領域都具有重要的影響力。

Share This Post On

Submit a Comment

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *