|

【Computex 2026】Skymizer首款內建自家LPU的實體晶片亮相

   

以編譯器與執行環境技術起家、並由軟體公司轉型為聚焦AI推論加速應用的矽智財(IP)供應商Skymizer (臺灣發展軟體科技),繼2024年推出EdgeThought系列語言處理單元(Language Processing Unit,LPU)IP、2025 年於台北國際電腦展(COMPUTEX) 前發表新一代 HyperThought LPU LISA 3.0語言指令集架構後,今年COMPUTEX開展前夕,又進一步將多年累積的軟硬體協同設計能力落實為實體晶片,正式推出首款基於HyperThought平台的地端AI推論加速晶片HTX301。

Skymizer管理團隊與合作夥伴共同出席發表會。(攝影:Judith Cheng)

Skymizer管理團隊與合作夥伴共同出席HTX301晶片發表會。(攝影:Judith Cheng)

Skymizer將HTX301定位為全球首款專為地端AI推論打造的decode-first(解碼優先)晶片。不同於過去大型語言模型推論多半以雲端GPU機櫃為部署前提,HTX301試圖將原本高成本、高功耗且架構複雜的推論工作負載,收斂到企業可自行部署、管理與擴充的PCIe加速卡上,讓大型模型能在企業自有機房、邊緣伺服器,甚至特定桌上型系統中執行。

從IP走向實體晶片 以成熟製程突顯軟體定義效能

在HTX301發表會開場,Skymizer董事長賴俊豪也特別展示HTX301的工程版實體板卡,強調這項產品對公司技術路線的意義。他表示,Skymizer發表首款AI推論加速IP產品時即透露公司正在開發自有IC,雖然時程較原先規劃延後約半年,但如今終於以實體晶片與工程板卡形式呈現。他指出,HTX301看似結構簡單,但Skymizer希望證明「簡單也可以很強大」。

Skymizer展示HTX301實體晶片與板卡 (攝影:Judith Cheng)

Skymizer展示HTX301實體晶片與板卡 (攝影:Judith Cheng)

賴俊豪進一步說明,HTX301採用28奈米成熟製程,這在市場普遍認為AI推論晶片至少需要6奈米等先進製程的背景下,起初並不容易被外界理解。不過他強調,Skymizer原本就是以軟體與編譯器技術起家的公司,因此HTX301並非單純依賴硬體堆疊效能,而是透過軟體、指令集與編譯器基礎來定義並發揮效能。他表示,這顆晶片採用標準BGA封裝與標準DDR記憶體,不需要HBM或CoWoS等複雜且高成本的先進封裝技術,正是希望以成熟製程、標準封裝與軟體最佳化,降低企業導入大型模型推論的門檻。

在產品配置上,賴俊豪指出,標準PCIe卡可容納多組晶片與記憶體,而Skymizer後續量產板將朝更高密度、8晶片(8-set)的配置推進,單張卡最高可達512GB記憶體容量,支援接近1兆參數等級的大型模型。他形容,單張卡即可執行超大模型推論,對企業而言是一項重要突破,因為過去若要執行大型模型,多半必須依賴雲端服務,不僅面臨持續性的訂閱或token費用,也會涉及資料安全與機密外流疑慮。

賴俊豪也以企業內部AI應用為例指出,許多使用者已開始透過AI協助文件處理、程式撰寫,甚至RTL設計等工作,但若涉及硬體設計或公司機密資料,企業通常不希望將資料送上雲端。他認為,HTX301這類可由企業自主掌控的地端AI推論加速卡,可讓企業在自有機房,甚至特定桌上型系統中部署大型模型,不必擔心資料上傳外洩,也能避免雲端服務常見的用量限制。他並強調,HTX301採用簡化系統設計,不需要複雜冷卻架構,只需風扇即可散熱,因此具備低成本、低功耗與低維護的部署優勢。

推論成本轉向Decode 地端部署成為企業AI新課題

從產品定位來看,HTX301並非單純追求更高峰值算力,而是針對大型語言模型推論階段的實際瓶頸重新設計。Skymizer行銷長暨執行副總魏國章指出,過去十年AI產業焦點多半集中在模型訓練,但接下來真正定義AI經濟性的將是推論,且不只是晶片層需要改變,從矽晶片、指令集、編譯器到執行環境,整個技術堆疊都必須針對推論重新最佳化。

魏國章表示,Skymizer在三年多前轉型時,就已經確立「不做訓練、專注推論」的方向,而在推論過程中,最關鍵的成本與負載正逐步集中到decode階段。他進一步說明,無論是產生文字、執行函式呼叫,或是在AI Agent流程中進行任務編排,背後都高度仰賴decode能力;隨著AI應用從聊天機器人走向Agent工作流程,包含多個Agent協作、並行執行與工具呼叫,decode負載也會進一步放大。換言之,Skymizer主張的decode-first並不是單一硬體賣點,而是對AI工作負載演變的回應。

這也呼應HTX301希望解決的另一個市場痛點:大型模型推論正從雲端走向企業資料所在之處。魏國章指出,對政府、軍事、法務、金融、醫療與製造等場域而言,資料主權已經不是可以妥協的選項;企業若要讓AI處理內部文件、研發資料、程式碼或營運流程,就必須思考模型推論能否在自有環境中執行。因此,Skymizer認為,未來推論基礎設施不只是「更快的GPU」,而是要讓AI運算真正落在建築、車輛、工廠、醫院等資料產生與使用的現場。

單卡支援DeepSeek-R1 從記憶體容量切入大型模型部署

在HTX301的產品規格上,Skymizer強調「先放得下,再跑得快」的設計思維。根據簡報資料,HTX301-8S單張PCIe加速卡可搭載512GB統一DRAM,足以容納4-bit量化後的DeepSeek-R1 671B模型,並保留KV-cache使用空間;在單一使用者聊天機器人工作負載下,目標可達每秒20個token以上的互動式服務水準。相較於將模型拆散到多張加速卡或多台伺服器上,Skymizer希望以單卡大容量記憶體降低跨卡通訊與系統整合複雜度。

HTX301產品線也將依部署規模提供不同配置:1-set版本搭載64GB記憶體、功耗約39W,適合邊緣伺服器或較小型AI Box;4-set版本提升至256GB記憶體、功耗約168W;8-set版本則達到512GB記憶體、功耗約325W,可面向大型模型與企業級推論場景。這種由小到大的配置設計,讓企業可依模型大小、機箱空間與功耗條件選擇導入方式,而不必一開始就投入完整GPU機櫃。

此外魏國章指出,對Skymizer而言,HTX301是HyperThought平台的第一顆參考設計晶片,重點在於證明這套架構可行,接下來真正要面對的是擴大規模,而他強調HTX301是HyperThought IP多年研發的具體成果,可從Edge端單一裝置出發,延伸到企業地端部署,再串接成Mini Data Center規模的推論叢集,讓台灣方案在全球企業AI市場中具備從晶片底層到系統規模的完整路徑。

 LISA v4鎖定線性擴充 讓加速晶片真正轉化為吞吐量

除了HTX301晶片,Skymizer也同步揭示後續LISA v4與下一代晶片規劃。Skymizer技術長唐文力指出,隨著地端AI推論需求升高,未來許多中大型企業可能不只需要單一加速卡,而會進一步建置中小型資料中心等級的AI基礎設施,依內部使用人數、模型規模與應用負載配置專屬推論機櫃。在這樣的架構下,真正的挑戰不只是提高單顆晶片效能,而是讓系統在增加晶片數量後,能夠把新增硬體資源有效轉化為推論吞吐量。

唐文力表示,下一代地端AI推論平台的核心關鍵是擴充,而且必須是線性。從Skymizer揭示的技術路線來看,每顆晶片內含64個核心,系統可依部署需求串接不同數量的晶片;在12奈米製程下,初步規劃可串接16顆晶片,形成1,024個核心的推論配置;未來推進至6奈米製程時,則可擴展至64顆晶片、共4,096個核心。換言之,企業需要多少算力與頻寬,系統就應能透過增加晶片與核心規模,近似線性地向上擴充。

這也是LISA v4將資料移動與互連能力納入指令集設計的原因。根據Skymizer規劃,LISA v4會讓晶片對晶片、裸晶對裸晶之間的資料傳輸成為指令集的一部分,並將send、receive、broadcast等動作設計為原生指令;同時搭配針對Transformer資料流調校的晶片上網路架構,讓通訊盡可能與運算重疊。透過編譯器與微架構協同設計,Skymizer希望大幅降低大型語言模型在張量平行運算中對跨晶片頻寬的依賴,使系統不必完全仰賴昂貴或極端高頻寬的互連技術,也能支援更大規模的模型部署。

唐文力也透露,Skymizer正與合作夥伴推進下一代12奈米與6奈米晶片。雖然這些製程並非目前市場上最前沿的2奈米或3奈米節點,但Skymizer的策略並不是單純追逐製程微縮,而是透過可量產、成本結構較具彈性的技術組合,搭配指令集、編譯器、記憶體與互連架構最佳化,在效能、功耗與部署成本之間取得平衡。這也延續HTX301的核心邏輯:以軟硬體協同設計建立可商用、可擴充,且更貼近企業實際導入條件的地端AI推論平台。

從晶片到平台 Skymizer鎖定企業級地端AI生態

Skymizer在此次發表中也清楚界定自身角色:不是單純販售成品加速卡的硬體廠商,而是地端AI推論平台賦能者。魏國章說明,Skymizer提供兩條產品路徑:其一是HyperThought平台IP授權,讓合作夥伴自行打造晶片;其二是HTX301白牌加速器方案,由合作夥伴以自有品牌導入市場。這樣的模式有助於Skymizer擴大IP生態系,也讓系統廠、伺服器廠或垂直應用服務商能更快推出地端AI推論解決方案。

同時,Skymizer也透過與資策會合作,把HTX301從單一晶片產品推向實際場域驗證。雙方將結合資策會的快接中介層與異質資源調度技術,使多組異質運算節點可依工作負載進行負載平衡與橫向擴充,首波示範案例則鎖定新北捷運知識管理地端應用。此外Skymizer也在發表會上展示AI Agent在智慧家庭、智慧車輛控制等情境的應用範例。

Skymizer在發表會現場展示AI Agent在智慧家庭、智慧車輛等場景的應用實例。(攝影:Judith Cheng)

Skymizer在發表會現場展示AI Agent在智慧家庭、智慧車輛等場景的應用實例。(攝影:Judith Cheng)

隨著AI應用從雲端問答服務走向企業內部流程、AI Agent系統與產業現場控制,推論基礎設施的競爭也正在從單一晶片規格,擴大為資料主權、成本結構、系統整合與部署彈性的競爭。HTX301能否在實際商用場景中證明其效能、穩定性與生態系支援,仍有待後續合作夥伴與客戶導入驗證;但對Skymizer而言,這次產品發表已代表其從編譯器軟體、AI推論IP,進一步跨入實體晶片與企業級地端AI平台的重要一步。

Skymizer也會在COMPUTEX TAIPEI期間於展場(攤位 R0923、台北南港展覽館2館4樓)的「AI Computing & System Integration Solution Section」區域展示HTX301晶片與 HyperThought在AI Agent、智慧家庭與智慧車輛情境的應用,有興趣的參觀者別錯過!

 

Judith Cheng

訂閱MakerPRO知識充電報

與40000位開發者一同掌握科技創新的技術資訊!

Author: Judith Cheng

20年經驗半導體/電子技術領域長期觀察員與報導者,見證科技社群持續成長茁壯、Maker/工程師們以創新改變世界!

Share This Post On

Submit a Comment

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *