耐能(Kneron)宣佈取得了一項技術突破──借助 DeepSeek-R1 論文中提到的尖端訓練技巧,成功讓Kneron自研的LLM模型掌握了「思維鏈推理」(Chain-of-Thought Reasoning)和「自我反思」(Reflection)的能力,並已部署在KNEO300和KNEO330離線式GPT伺服器,為企業提供更智慧精準的AI解決方案。Kneron智慧決策系統已實際部署於醫療、金融等多個應用場景。
Kneron表示,在傳統的 AI 對話系統中,模型往往直接給出答案,但很多時候,這些答案缺乏邏輯推導,容易出現前後矛盾或不夠嚴謹的情況。而「思維鏈推理」讓AI學會像人類一樣,逐步拆解問題,形成清晰的推理步驟透過充分理解複雜問題,提供更可靠、專業的答案。更重要的是,Kneron的AI還具備了「自我反思」能力,也就是在回答複雜問題時,可以回顧自己的推理過程,檢查是否有邏輯錯誤,並在發現問題後主動調整答案。這種能力在數學計算、金融分析、醫療診斷等領域尤其重要,因為這些場景需要AI不僅提供答案,還要保證答案的正確性和推理過程的嚴謹性。
![圖一: 原始模型對推理性問題回答並不理想](https://makerpro.cc/wp-content/uploads/2025/02/圖片1-1024x453.png)
圖一: 原始模型對推理性問題回答並不理想
![圖二:經訓練提升後, KneronLLM-R1可以有一個推理思考的過程,透過思考輸出更正確的答案](https://makerpro.cc/wp-content/uploads/2025/02/圖片2-1024x455.png)
圖二:經訓練提升後, KneronLLM-R1可以有一個推理思考的過程,透過思考輸出更正確的答案
Kneron解釋,此次技術突破的核心在於借鏡了DeepSeek-R1論文中提出的強化學習(Reinforcement Learning,RL)和蒸餾(Distillation)等技術,並加以融合,使Kneron AI在訓練過程中逐步學會推理和反思。其關鍵步驟包括:
- 高品質資料整理與冷啟動訓練
參考DeepSeek-R1的方法,Kneron透過構建高品質思維鏈資料,精心篩選多輪推理範例,進行冷啟動訓練。這一階段提高了模型的可讀性和穩定性,使 AI 具備基本推理能力。 - 拒絕取樣 + 蒸餾
Kneron 採用拒絕取樣(Rejection Sampling),篩選出最佳推理路徑,並結合知識蒸餾(Knowledge Distillation),將Deepseek-r1及o1等大模型的推理能力遷移到輕量級模型,使Kneron AI既具備強大的推理能力,又能在KNEO300和KNEO330上高效率運做。 - 強化學習最佳化推理能力
訓練後期,Kneron採用類似於DeepSeek-R1的強化學習策略,在訓練過程中讓AI透過自對比和獎勵機制學習最佳推理路徑。模型會生成多個不同的推理鏈,並根據準確性和邏輯一致性進行最佳化。 - 語言一致性與長文本優化
由於 AI 需要適應不同場景,Kneron 還借鑒 DeepSeek-R1 在語言優化方面的方法,引入語言一致性獎勵,確保模型在複雜推理過程中保持邏輯清晰,避免回答混亂或前後矛盾。
最終,Kneron 成功將這一強化版AI部署在KNEO300和KNEO330離線式GPT伺服器上,讓更多企業和開發者可以直接使用具備推理能力的AI,為他們的業務賦能。Kneron表示已經在以下產業應用場景中實現部署:
1. 醫療問卷 AI 助手
在醫療產業,醫生和醫院需要收集大量的患者資訊,進行健康評估。Kneron 的 AI 助手可在問卷填寫過程中進行推理,根據患者的回答動態調整問題,並分析可能的健康風險,提高診斷效率。
2. 金融衍生品定價 AI
金融衍生品定價涉及複雜數學計算和市場分析。Kneron AI 結合「思維鏈推理」技術,精準解析結構與條款,融合金融數學模型,智慧推導定價策略,為金融機構提供高效、精準的投資最佳化與風險管控方案。
3. 金融資料分析助手
金融業的資料繁多且複雜,傳統的 AI 只能提供簡單的報表分析,而Kneron的AI能夠基於資料推理找出資料中的異常,幫助財務人員和分析師做出更高維度的分析。
4. 企業資料智慧客服
許多企業客服需要處理大量的內部文件和客戶問題,Kneron AI可自動讀取、理解企業文件,並提供準確的回答,降低企業客服成本,同時提升客戶體驗。
5. 會議記要AI助手
Kneron AI可幫助企業自動生成高品質的會議記要,不僅記錄內容,還能分析會議重點,條列核心觀點,幫助企業提升會議效率。
- 借鏡DeepSeek-R1訓練框架 耐能實現輕量級大語言模型 - 2025/02/10
- 看到DeepSeek就愣住了? 還有上百萬個AI模型等著你! - 2025/02/07
- TrendForce:DeepSeek崛起凸顯AI產業將更注重高成本效益 - 2025/02/04