AI 藝術生成手冊/訓練/資料集
在開始訓練之前,首先考慮您想要使用的概念。
根據有限的研究,Dreambooth 似乎能夠執行四種類型的訓練。
(i) 向模型引入全新的概念
根據現有的 Stable Diffusion 版本,雖然 SD 模型能夠生成各種型別的影像,但是 SD 模型無法生成一些東西,例如眼球。
(ii) 向現有概念新增資料集,但建立單獨的“標記”
這是“男性”/“女性”現有概念的更常見路線,但您想新增自己面部資料集,以建立一個更類似於您自己的外觀到資料集影像中。
(iii) 微調現有概念
一個已經存在的概念,但由於 CLIP 的限制/有限的影像資料集,它可能無法正常生成。
例如,關於人馬的新概念(基本上是半人半馬)。
例如,您可能強制現有的關鍵字“bank”與銀行密切相關,就像將您的錢存入“bank”一樣,但指的是河岸。這種做法強烈不鼓勵,因為許多與該關鍵字相關的概念是相關的,並且可能會導致“模型崩潰”。
當您想要訓練您找到的影像模型時,可以選擇各種免費照片。
以下是您可以使用的免費庫存照片網站列表。
維基共享資源 (https://commons.wikimedia.org/wiki/Main_Page)*
Unsplash (https://unsplash.com/)
Pexels (https://www.pexels.com/)
Pixabay (https://pixabay.com/)
Flickr 創意共享 ( https://www.flickr.com/creativecommons/ )
FreeImages ( https://www.freeimages.com/ )
公共領域圖片 (https://www.publicdomainpictures.net/)
Game Art for Glitch ( https://www.glitchthegame.com/public-domain-game-art/)
Josh Game Asset ( https://gameassets.joshmoody.org/)
您可能從許多 Dreambooth 教程中聽到很多關於資料集必須有質量的資訊。AI 藝術生成模型生成的輸出影像質量與用於訓練模型的輸入影像質量直接相關。如果用於訓練模型的輸入影像質量低下,包含噪聲或偽像,或者構圖不良,則生成的輸出影像也會出現類似問題。
影像應具有以下屬性。
(a) 多樣但一致 -
這是一個建立用於訓練物件/風格的多樣資料集的示例,但確保主體(在本例中是犀牛)始終是訓練主體的中心。
<注意,這僅供參考,您的特定用例可能與這裡陳述的內容不同:>
構圖
-
特寫鏡頭
-
高角度拍攝
-
後方拍攝
-
低角度拍攝
活動
-
吃草
-
在水中游泳
-
飲水
-
交配
-
睡覺
-
躺下
照明
-
夜晚
-
在陰影下
-
剪影
-
清晨陽光
-
下午陽光
媒介型別
-
黑白電影劇照
-
洞穴壁畫
-
犀牛郵票
-
壁畫
-
織物圖案
-
燈籠
-
藝術雕像
-
蠟筆畫
注意:儘可能,請不要包含具有以下特徵的影像進行訓練。
(i) 在同一圖片中有多個主體(儘管是相同的主體)
(ii) 具有明顯但共同的特徵(如果您用 1 只角進行訓練,確保所有影像資料集理想情況下都具有 1 只角)
(b) 噪聲或壓縮偽像等
(c) 模糊或解析度不足