跳轉至內容

AI 藝術生成手冊/訓練/資料集

來自華夏公益教科書,開放的書籍,開放的世界

訓練型別

[編輯 | 編輯原始碼]

在開始訓練之前,首先考慮您想要使用的概念。

根據有限的研究,Dreambooth 似乎能夠執行四種類型的訓練。

(i) 向模型引入全新的概念

根據現有的 Stable Diffusion 版本,雖然 SD 模型能夠生成各種型別的影像,但是 SD 模型無法生成一些東西,例如眼球。


(ii) 向現有概念新增資料集,但建立單獨的“標記”

這是“男性”/“女性”現有概念的更常見路線,但您想新增自己面部資料集,以建立一個更類似於您自己的外觀到資料集影像中。

(iii) 微調現有概念

一個已經存在的概念,但由於 CLIP 的限制/有限的影像資料集,它可能無法正常生成。

例如,關於人馬的新概念(基本上是半人半馬)。

(iv) 強制現有概念學習不同的概念

例如,您可能強制現有的關鍵字“bank”與銀行密切相關,就像將您的錢存入“bank”一樣,但指的是河岸。這種做法強烈不鼓勵,因為許多與該關鍵字相關的概念是相關的,並且可能會導致“模型崩潰”。

影像來源

[編輯 | 編輯原始碼]

當您想要訓練您找到的影像模型時,可以選擇各種免費照片。

以下是您可以使用的免費庫存照片網站列表。

維基共享資源 (https://commons.wikimedia.org/wiki/Main_Page)*

Unsplash (https://unsplash.com/)

Pexels (https://www.pexels.com/)

Pixabay (https://pixabay.com/)

Flickr 創意共享 ( https://www.flickr.com/creativecommons/ )

FreeImages ( https://www.freeimages.com/ )

公共領域圖片 (https://www.publicdomainpictures.net/)

Game Art for Glitch ( https://www.glitchthegame.com/public-domain-game-art/)

Josh Game Asset ( https://gameassets.joshmoody.org/)

影像質量

[編輯 | 編輯原始碼]

您可能從許多 Dreambooth 教程中聽到很多關於資料集必須有質量的資訊。AI 藝術生成模型生成的輸出影像質量與用於訓練模型的輸入影像質量直接相關。如果用於訓練模型的輸入影像質量低下,包含噪聲或偽像,或者構圖不良,則生成的輸出影像也會出現類似問題。


影像應具有以下屬性。

(a) 多樣但一致 -

這是一個建立用於訓練物件/風格的多樣資料集的示例,但確保主體(在本例中是犀牛)始終是訓練主體的中心。

<注意,這僅供參考,您的特定用例可能與這裡陳述的內容不同:>

構圖

活動

照明


媒介型別

注意:儘可能,請不要包含具有以下特徵的影像進行訓練。

(i) 在同一圖片中有多個主體(儘管是相同的主體)

(ii) 具有明顯但共同的特徵(如果您用 1 只角進行訓練,確保所有影像資料集理想情況下都具有 1 只角)

(b) 噪聲或壓縮偽像等

(c) 模糊或解析度不足

華夏公益教科書