作者:高煥堂
當今AI仰賴於大資料的相關性(Correlation),雖然,相關性並不一定表示其具有因果關係(Correlation does not imply causation),因為當今的AI對於因果關係的探索能力,仍極其有限,非常依賴人類(具有溯因性推理習慣者)來補足。
人類具有溯因性推理習慣者,就是通稱的創新者,如諸葛亮等,其擅長於溯因推理(Abductive reasoning):從果追溯其真實的因,而如果AI能夠掌握更高階的因果關係,就可望降低其不確定性的行為、大幅提升可解釋性、可信賴度,以及創造性思維能力。
這就是目前AI專家們努力的方向,也就是AI將邁向革命性的大未來,所以,有人稱之為:因果革命。也就是讓AI除了大資料相關性之外,能提升探索和掌握因果性的能力。
於此建議您可以參閱這本2019年的暢銷書(圖1),在這本書裡將因果關係分為三個階層:觀察、行動和想像(圖2),AI的大未來就是讓AI能充分掌握深層的因果性,也就是這本書裡所說的:高階因果關係。

圖1

圖2
從上圖-2中,可以看到了,當今AI所掌握的相關性,仍屬於低階(第1階)的因果關係,與人類相比仍有極大的距離。AI的大未來,將是逐漸提升到第2階、第3階。屆時,AI具備了想像、假設和反思的能力。
三種類型的AI
過去20年,AI在 辨識(分類)、和預測,兩方面表現令人類驚奇。就像算命仙,辨識出您的本命、預測出您的〈時&運〉了。若時來運転,就努力擴大行動,趨吉迎福。若時運不濟,就凡事小心慎行,冬藏春迎,蓄銳待發。這階段的AI,通稱為:識別型AI。
在大數據時代裡,人眼可看、手中能掌握的資料很有限、視野小,人為優化只能獲得局部最優解(Local optimum)。於是,就需要AI生成來幫忙,以人為找出的局部最佳解為條件(基礎),輸入給AI (如Conditional GAN模型),讓它來協助生成全域最佳解(Global optimum)。這階段的AI,通稱為:生成型AI。
上一小節裡,已經談到了,在AI能夠來幫助檢驗人類決策者的假設,降低決策風險,促進企業的成長茁壯。於是,AI 有三種:識別型AI、生成型AI、決策型AI。
- 識別型AI:對事物或現象,洞察其特徵(Feature),而進行歸類(識別)。
- 生成型AI:學習目標事物或現象的資料分佈(Distribution),生成新資料,呈現逼真的事物。
- 決策型AI:由<生成型AI>提供方案,由<識別型AI>評估風險,然後挑選風險最低、勝率最高的方案,並採取行動。所以決策型AI的關鍵因數是:風險。
決策型AI的3項特點
從商業決策而觀之,商業環境是善變的,而且存在競爭者刻意唱反調,使得看似最佳獲利方案,卻可能是最賠錢的。
於是,決策型AI的第一項特點是:
需要把環境或敵方的可能方案(的特徵)輸入到AI模型裡。
<<孫子兵法>>說:勝兵先勝而後求戰;敗兵先戰而後求勝。
於是,決策型AI的第二項特點是:
幫忙做<先勝>的評估。也就是<不敗>的評估,也就是評估風險。
例如,當今股市領域,最著名的投資決策者是巴菲特。他的投資決策都基於兩條原則,第1條原則是:不賠錢(先不敗、先勝);而第2條原則是:永遠不忘記。
從成吉思汗與神鷹的故事,可協助我們領會到,如果決策型AI扮演神鷹的角色,既符合AI的特性,又非常具有價值。
當AI(神鷹)發現決策者思緒不夠完美時,可以給予畫龍點睛的效果。更具價值在於:當AI(神鷹)發現決策者的決定是錯的,而且行動是災難性的,AI立即提出嚴重警告。
於是,決策型AI的第三項特點是:
把<決策型AI>做在決策點與行動點之間。
例如,成吉思汗拿著杯子去盛裝那滴下來的山泉水,正當他將裝滿了水的水杯湊近口邊,準備一飲而盡之際,在天空中飛翔的神鷹突然飛撲下來,「嗖」的一聲,就把成吉思汗手中的杯子踢翻了,水都灑到地上了。
神鷹在決策者的<決策時間點>與<行動時間點>之間的數秒鐘內,即時納入當下的決策,做出智慧的推論,採取保護主人的行動,而且刻不容緩(圖-3)。
過去,許多人把AI做到<決策時間點>之前,提供給決策者參考,是OK的,只是這樣的作法,只是把AI做成為BI(商業智慧)或大資料分析的延伸,其價值並非最高的。
把AI做在策者的<決策時間點>與<行動時間點>之間,我稱為:AI神鷹。
把AI做在策者的<決策時間點>之前,我稱為:AI獵狗。
AI獵狗作用於人類的<決策前>;而AI神鷹作用於<決策後>,這兩項AI成為人類決策者的最佳夥伴。
對於基層經理人(決策)而言,AI獵狗可以發揮很大的輔助效果,對於高層總裁(決策)而言,AI神鷹可以發揮關鍵性的效益,所以成吉思汗出行時,隨身攜帶神鷹,而不是獵狗。
獵狗看利益,神鷹看風險,兩者協同合作,帶給人類趨吉避凶效果,讓企業勢如破竹,如成吉思汗一般,建立地球史上最大版圖的帝國。
AI天生具有〈考古〉和當下〈探索〉的強大能力,也就是AI出生就具有獵狗的天份,能極靈敏地嗅出利益機會(如那裡有兔子),也就是一般統稱的〈預測(Predict)〉能力,這種極靈敏能力既可以用來嗅出〈利益〉,也可以用來嗅出〈危險〉。
於是,將一群擅於嗅出風險的AI獵狗們,巧妙組合成為一個團隊,就成為一隻〈AI神鷹〉了。
以划拳比賽為例
這是一個做給小學生玩的AI遊戲,讓小朋友與Zenbo機器人玩<剪刀、石頭、布>的劃拳比賽(圖4 & 5)。

圖4

圖5
比賽一開始,請先開啟Zenbo的<AI劃拳遊戲>,如(圖4)。Zenbo會說出:「我們一起來玩剪刀、石頭、布。當我喊<剪刀、石頭、布>,我們就同時出拳喔,準備好了嗎?」。請您回答:「好了」。Zenbo就出現下述畫面(圖6 & 圖7),同時Zenbo也說出:「開始出拳喔,剪刀、石頭、布」。

圖6

圖7
這時請您出拳,要用口說出來。例如說出:「布」。此刻Zenbo先已決定它的出拳,瞬間已聽到您說出的話(<布>),就顯示出來:

圖8
同時,Zenbo就很高興地說出:「哈哈哈,我贏了」。然後繼續下一回合的比賽。
AI模型的架構設計
我們共有3個模型:RnnPredict、DecisionRiskModel、VoiceClassifier。第1個模型(RnnPredict)是基於RNN的模型,它從比賽的歷史資料中,探索對方出拳的規律(圖9)。

圖9
第2個模型(DecisionRiskModel)是基於對方出拳的規律,加上己方的決策,進行風險(Risk)評估(圖10)。

圖10
第3個模型(VoiceClassifier)是監視、辨別對方當下出拳的行為,而計算出勝負(圖11)。

圖11
在這劃拳遊戲裡,AI必須在看到對方出拳之前,預先作最好的決策。所以第2個模型的執行時間,是比第3個模型還要早。這第2個模型是依賴第1個模型所探索的到的對方出拳規律。
AI模型的學習(訓練)流程
訓練RnnPredict模型
這RnnPredict模型會從比賽的經驗中找出對手的出拳規律。例如,當A與您比賽100回合,它會記錄比賽的過程。
RnnPredict模型會觀察您出拳的各種習慣性。例如,它會從這100次的出拳紀錄(資料)中萃取您連續出拳相同時,接著您會習慣性選擇出什麼拳呢? 於是,它萃取出來了(圖12)。

圖12
接著,按下<AI尋找規律>,RnnPredict模型就展開機器學習,並且以神經網路的權重來記錄它找出來的規律,然後他也輸出所找到的規律(圖13)。

圖13
從上圖裡AI輸出的結果看來,AI的卻發現了您的出拳習慣:幾乎沒有連續三次出一樣的拳。例如,從上圖的第1列,您前兩次都出<石頭>,AI就估算出您這次將出拳的可能性是:出<布>、<剪刀>、<石頭>的可能性,分別為:(0.75, 0.25, 0)。
訓練DecisionRiskModel模型
這是一個分類模型(屬於識別型AI)。剛才AI基於過往的大資料,發現一項規律:您連續兩回合出招一樣時,其後(第3招)出招,幾乎不會與前兩回相同。例如,前兩回合,您都出<剪刀>,這一回合,您幾乎不會繼續出<剪刀>。
所以,您只會出<石頭>或<布>了。此時,如果AI出石頭,就它就穩輸了(風險高);反之如果AI出<布>,它就穩不輸了(風險低);同理如果AI出剪刀,就輸贏各一半(風險中等)。前兩回,如果您出其他招(不連續出同一招)時,都全部看成<中等風險>。
於是,AI只要善用它所發現的規則,在出拳瞬間自我評估它出招的風險,確保它不會掉入高風險的賽局裡,它(AI)的贏面就大增了。現在就來把上述的贏家規律輸入到Excel表格裡(圖14)。

圖14
按下<訓練>,就開始訓練DecisionRiskModel分類模型,它是用來評估各種出拳方案的風險評估。
例如,輸入值[1,1,0],表示對方連續兩次出<剪刀>,而AI決定出<石頭>,此時評估出來:風險高,於是AI決定改變出拳的選擇,若改為出<布>,就輸入[1,1,2],此時評估風險低,就是好策略了。
結語
本文說明瞭決策型AI的特色,並以劃拳比賽為例,說明其架構。包括3個AI模型:第一個是RnnPredict模型,負責探索對方的出拳規律(知彼)。第二個是DecisionRiskModel模型,負責評估決策風險(知己)。第三個是VoiceClassifier模型是典型的語音辨識模型。
雖然本範例裡是由三模型組合起來,與人們競賽,但是它們也可以在商業環境裡,協助人類決策者進行優越的商業決策。
(責任編輯:謝涵如)
- LoRA微調三步驟:以大語言模型MT5為例 - 2024/05/02
- 為什麼Gemma採取Decoder-Only Transformer架構呢? - 2024/04/08
- 如何從0訓練企業自用Gemma模型 - 2024/04/03
訂閱MakerPRO知識充電報
與40000位開發者一同掌握科技創新的技術資訊!