【高煥堂】專欄
高煥堂,現任教於銘傳大學、長庚大學智慧醫療研究所學程。專長領域是AI生成藝術、人機協同決策等。業界知名的<神櫻AI團隊>的指導老師。
為什麼Gemma採取Decoder-Only Transformer架構呢?
本篇文章會說明Gemma為何會採取Decoder-Only Transformer架構,並針對Decoder-Only Transformer架構進行介紹。
如何從0訓練企業自用Gemma模型
Gemma模型是Text到Text的大型語言模型,非常適合各種文本生成任務。其有多種使用途徑,包括使用新資料來微調Gemma模型、拿Gemma開源程式碼,而從頭開始訓練它,本文將介紹如何從0訓練企業自用Gemma模型。
運用BF16與NHWC技術實現進階版LLM微調訓練最佳化
本文要來介紹如何利用BF16半精度浮點數以及將影像資料設為NHWC格式兩項技術,來最佳化大型AI模型的訓練速度與記憶體節省,並延續以
拿大模型程式碼來訓練自用小模型:以AI寫(畫)書法為例
本文會拿Diffusion來學習及創作書法字體,也就是俗稱的:寫書法。雖然Diffusion也能學習依循標準筆順,來逐筆寫出字形。為了從簡單範例出發,本文先讓Diffusion來學習程生成整個字形,而不是逐一生成各筆劃。
從CLIP應用領會潛藏空間(Latent space)的魅力
本文將從商店櫃檯的產品推薦應用來說明:我們可以拿CLIP的原始程式碼,搭配商家自有產品圖像(Image)和圖像敘述文句(Text),來訓練出企業自用的CLIP小模型,同時也領會其幕後潛藏空間(Latent space)的運作及其效果。
活用IPEX和Intel GPU加速大型語言模型訓練效率
以IPEX (Intel-Extension-for-PyTorch)搭配Intel硬體產品,可提供最佳化功能大幅提升運作效能。例如透過PyTorch的
利用Intel平台提升LLM微調與訓練效率:ResNet50+LoRA範例
本文將說明如何善用英特爾(Intel)所研發的新產品和相關技術,來提升AI模型的訓練效率,以便提供更優質的推論功能。為了循序漸進介紹上述的新產品及其相關的使用技術,本文先從大家熟悉ResNet50圖像分類模型做為起步範例,並搭配LoRA來進行外掛訓練,以便從這簡單範例中充分理解如何活用上述的創新產品及相關技術。
闡述Stable Diffusion繪圖AI的架構知識 (上): 細說Encoder
SD(Stable Diffusion)是當今頂級的Text-to-Image的繪畫技術,本文將介紹其中的重要觀念:負責嵌入的模型(Encoder)及負責生成的核心模型(Decoder) 。
從認知學理解ChatGPT魅力的來源(三)
AI「看到」人類沒看到的,它能擴大人類的思維空間。即使ChatGPT回答您的「文案」,也是在表達它所看到的更大空間,給您一些建議,來引導您(人類)去「做出」您沒意料到的更棒的新東西。
從認知學理解ChatGPT魅力的來源(二)
人類專家如何傳授直覺性知識給AI模型呢? 最基本的做法就是:貼分類標簽,也就是做標注(Labeling)。這意味了,在訓練階段必須採取「監督式學習」模式。
從認知學理解ChatGPT魅力的來源(一)
當今AI所仰賴大數據的相關性,只是低階的因果關係而已。由於,當今的AI對於因果關係的探索能力,還是非常有限的,仍然非常依賴人類(具有溯因性推理習慣者)來補足。
AI建模師(Model Architect)的角色及其培育(三)
藉助AI潮流,一方面以AI晶片來連結到半導體IC產業;另一方面則以AIGC來連結到文創&美學設計行業,逐漸融合出更多科技美學跨領域人才。
AI建模師(Model Architect)的角色及其培育(二)
近幾年,知識圖譜在工業界聲勢日隆,在這種語境下,我們也稱知識圖譜為業務圖譜。GNN 本身是一種深度模型,與推薦系統結合之後,多層 GNN 模型可以更好地捕捉使用者與商品之間的高階協同關係。
AI建模師(Model Architect)的角色及其培育(一)
AI建模師的職責:組合模型、訓練模型。亦即把一群不會飛的模型巧妙組合起來,訓練它然後飛上天際。台灣如果沒有積極培育優秀「AI建模師」,很可能是未來10年AIGC潮流下的大輸家!
【AI建模師手冊】GAN如何從作品中學習專家創作(上)
AI生成(如AIGC),就是 AI 學會設計出自己的作品。AI 裡的眾多模型之中,GAN 是箇中高手,最擅長從人類的藝術作品中學習到藝術家的風格等。
【人工智慧趨勢】決策型AI起步走!
經由訓練使AI如人類一般擁有溯因性推理習慣,並輔助人類進行決策思考,是目前AI專家們努力的方向,也是AI將邁向革命性的大未來,本文將介紹決策型AI的特色,並以劃拳比賽為例,說明其架構。
【建設台灣 AIGC 素材平台】如何建設校園的「R 素材」整合平台
本文提出一個新觀點:我們只要把眼光從原來的「內容」,逐漸轉移聚焦到其「素材」層級,就能給予台灣肥沃的 IT 產業帶來豐沛的水分。一方面,打開台灣廠商企業、學校院所、政府部門的菁英人士的心扉,以便迎接 AIGC 幸運草種子雨。
【AI生程藝術之路】PaddlePaddle的3D點雲GAN模型(上)
最近紅遍網路,號稱超越人類藝術家的AI繪圖,其原理究竟是什麼?又該如何訓練出一個能畫圖的AI模型呢?本文將針對3D點雲GAN模型進行介紹與教學。