|

【從零到一】AI生成技術如何提升設計和創作的效率和品質

   

作者:林允涵

人工智慧正在改變你的工作方式!

自從2016 AlphaGo擊敗了李世石之後,「人工智慧」這個詞彙對於大眾已經都不陌生了。教育部和創客的社群也從3~4年前開始將人工智慧、深度學習、視覺辨識等概念推廣出去,讓更多的學生和大眾都能夠對這些科技的潛力有所瞭解。但大多數人的理解多為以下兩個類別:視覺辨識(如車牌偵測、人流體溫測量)以及推薦演算法(Netflix、Youtube)。但其實有另外一個人工智慧的領域發展的極為快速,而且或許對於大家的日常工作,尤其是創作者有著更強烈的影響,那就是「AI生成」。

AI生成 (AI Generator)

這是一個非常概括的類別,其中包含許多不同的技術(Diffusion, GAN, Transformer)以及呈現方式。但共通點是只要使用者提供輸入(input),機器就能夠產出相對應的輸出(output)。AI生成的技術可以用於翻譯、文章撰寫/摘要、影像生成(text to image)等等…etc。大家最常用的google服務也包含這些技術。Google翻譯自從2017就是利用Transformer的技術進行翻譯;Gmail從2018推出Smart compose的功能,利用前文內容來預測你後面要打的內容,讓你更快完成email。

既然4年前AI生成就能夠幫你寫email,4年後的今天AI生成可以做到什麼程度呢?這篇文章會介紹兩個Open AI在9月以及12月推出的兩個公開服務:DALL-E 2以及ChatGPT。

DALL-E 2

建立於2021年發表的DALL·E,DALL-E 2在2022年4月發表,2022年9月底開放讓大家使用。它能夠透過文字生成逼真、高畫質的影像。而且文字說明不只能對影像中的內容進行非常詳盡的敘述,更可以對於風格、構圖等抽象性的概念作描述,讓DALL-E 2除了可以產出逼真的照片,還可以模仿知名畫家作畫、繪製似顏繪等更多有趣的應用。

自從發表至今已經被許多創作者用來幫助創意發想,甚至可以直接生成Youtube首圖跟插圖創作:

ChatGPT

建立在Open AI於2020發表的GPT-3基礎上,增加了Reinforcement Learning from Human Feedback (RFHL)的概念,讓模型能夠提供更自然的對話語句。幾個ChatGPT突破的應用在於:(一)能夠問更進一步的資訊釐清問題;(二)拒絕不合法或不當請求;(三)可以延續前後問題做連貫性的回覆。這些進步都讓ChatGPT更能夠作為許多日常情境下的實用工作工具,可以幫你撰寫email、debug、查資料等,大幅減少瑣碎的時間,已經比過去我們所說的Siri或Hey Google更能做到個人助理的角色。

來源:OpenAi

善用這個工具來幫助你創作

DALLE-2在設計發想的應用

以我們為例,不務正業工作室設計產品/作品,並記錄製作過程分享給大家。過去在創意發想時,普遍最常用的是Pinterest。Pinterest讓我們可以參考過去不同的設計來收集靈感,但Pinterest只能看到別人已經做過的東西,這個查詢的過程也容易侷限創意發想。而DALLE-2解決了這個問題,它能夠根據我們提供的關鍵字或敘述,來產出各種千奇百怪的設計。雖然有時會產出很不合理的設計,但創意發想的過程不就是該如此嗎?

中文效果也很好喔!

ChatGPT在創作說明上的應用

文章及影片標題總是我們最苦惱的環節,要怎麼清楚敘述內容又能夠吸引別人點進來觀看呢?這時候ChatGPT就能夠發揮它強大的功能!它不只可以生成出不同選項給你,也可以指定一些關鍵字或進階的引導跟建議。像是這篇文章的標題就是Ai生成出來的喔!

而且不僅限於此,我們常常在影片中要解釋機械概念時,常常無法找到簡單易懂的說法,這時ChatGPT也可以幫助到我們喔(但還是要過濾一下答案就是了)

結語

每次這些新的Ai工具推出,新聞媒體在探討的總是工具會不會讓專業的人失業。但身為已經投入在這些領域的人,無論未來到底會不會被這些工具替代,我們現在只能盡可能的學習並善用工具。不只讓我們目前的工作效率跟品質提升,也更有可能讓我們成為未來能夠應用工具的人,而非被工具取代的人。

noviceworkshop
noviceworkshop

Author: noviceworkshop

不務正業工作室,透過拍攝影片紀錄創作過程並提供開源設計,讓更多人對於自造運動產生興趣並開始自己動手實現自己的想法。

Share This Post On

Submit a Comment

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *