圖像生成式AI的生存指南-以Stable Diffusion為例

by Nick
0 comment

感謝深智數位出版社的邀約!目前已經將相關內容集結成冊出書,拓展了其中的內容,朔造了一個能夠完全理解圖像生成式AI的框架,期許能以輕鬆幽默的方式讓大家了解圖像生成式AI相關的知識,並能夠藉由這樣的認知玩轉Stable Diffusion相關的擴散模型生成工具。

以整體的時間來說,這本書我花了大約半年時間才完稿,扣掉鐵人賽的準備與賽程的2個月時間,還花了4個月在撰稿上面,鐵人賽的內容大約有3萬字左右,但書籍完稿有8萬字(其實寫6萬字就足以出書了,但我覺得內容要夠完整才能放出來),代表內容增加為至少2倍,為了力求內容完善,這是必要的成本,雖然持續燒肝3個月其實並不容易(凌晨3~4點睡,一週至少5天),完稿的那一剎那差點沒激動到把筆電摔出窗外(咦

圖像生成式AI的發展現況

淺談圖像生成式AI的發展近況

Stability AI約在2月底發佈了Stable Diffusion 3的相關消息,並依序在3月公開論文;4月初開放了關於Stable Diffusion 3的API,最近又開放了Discord上使用Stable Diffusion 3 API的權限。

流派種類

目前主要有三大流派,分別是:文生圖、圖像描述、圖文匹配,這些視覺領域的流派都能透過提示詞去強化其性能。

SD的發展現況

目前SD發展的概況可以簡述為:SD -> SD XL -> SD XL Turbo -> SSD-1B -> Stable Cascade -> Stable Diffusion 3。其中Stable Diffusion 3具有生成輸入的提示詞內容能力。

這本書能帶給我什麼

讀者閱讀完本書後,應會具有以下收穫:

  1. 了解圖像生成式AI的前世今生
  2. 了解擴散模型諸如SD相關的原理及應用
  3. 學會實操SD並應用在實際案例中
  4. 認知目前圖像生成式AI的發展方向
  5. 一次總覽圖像生成式AI的當代研究

購書連結

實體書連結:https://reurl.cc/KeMXdp

電子書連結:https://reurl.cc/ezXZlb

其他通路請Google搜尋:圖像生成式AI的生存指南-以Stable Diffusion為例。

期待在書中與你相見~