跳轉到內容

AI 繪畫生成手冊/AI 模型對決

來自華夏公益教科書,開放的書籍,面向開放的世界

注意:如果您有關於“高難度”提示的想法要讓我測試,請 在這裡開始討論

在這個對決格式中,我們堅持以下格式

(i) 每個實體/作者只有一個模型,並且得到社群的良好支援(SD3 不在等式中)

(ii) 每個模型有 4 次機會生成影像

(iii) 本地 WebUI 的引數保持不變(生成的影像數量除外)

(iv) 評分如下

圖例 得分 備註
1 分 完全符合提示
0.5 分 部分符合提示(能夠根據要求生成,但與提示描述/隱含含義不完全相同)
0 分 不符合提示

複雜提示的遵守情況

[編輯 | 編輯原始碼]

提示 1

一位印度女演員身穿黃色紗麗,站在紅色房間裡,她面前有3 個盒子:左邊的盒子裝著黑色毛線球,中間的盒子裝著小狗,右邊的盒子裝著水瓶

背景

(i) 測試 AI 模型的“概念滲透”,即:紅色的牆壁是否會“滲透”到紗麗上或其他地方 / 盒子裡的物品是否會散佈到其他區域

(ii) 測試 AI 模型的“相對位置”,即:能夠識別影像中左右和中間位置的區域

(iii) 測試 AI 模型的“構圖生成”,即:能夠以其特定的排列生成多個專案

AI 模型 統計得分 影像 1 影像 2 影像 3 影像 4
SDXL Img 1: 3.5


Img 2: 3.5

Img 3: 4

Img 4: 3

總計:14

得分:50%

印度女演員


黃色紗麗

紅色房間

3 個盒子

黑色毛線球

小狗

水瓶

印度女演員


黃色紗麗

紅色房間

3 個盒子

黑色毛線球

小狗

水瓶

印度女演員


黃色紗麗

紅色房間

3 個盒子

黑色毛線球

小狗

水瓶

印度女演員


黃色紗麗

紅色房間

3 個盒子

黑色毛線球

小狗

水瓶

DALL-E 3 Img 1: 4


Img 2: 6

Img 3: 5.5

Img 4: 5

總計:20.5

得分:73%

印度女演員


黃色紗麗

紅色房間

3 個盒子

黑色毛線球

小狗

水瓶

印度女演員


黃色紗麗

紅色房間

3 個盒子

黑色毛線球

小狗

水瓶

印度女演員


黃色紗麗

紅色房間

3 個盒子

黑色毛線球

小狗

水瓶

印度女演員


黃色紗麗

紅色房間

3 個盒子

黑色毛線球

小狗

水瓶

Flux

Img 1: 5


Img 2: 7

Img 3: 7

Img 4: 7

總計:20.5

得分:92%

印度女演員


黃色紗麗

紅色房間

3 個盒子

黑色毛線球

小狗

水瓶

印度女演員


黃色紗麗

紅色房間

3 個盒子

黑色毛線球

小狗

水瓶

印度女演員


黃色紗麗

紅色房間

3 個盒子

黑色毛線球

小狗

水瓶

印度女演員


黃色紗麗

紅色房間

3 個盒子

黑色毛線球

小狗

水瓶

提示 2

一位年邁的日本人裁縫正在他位於長崎的裁縫店裡的縫紉臺上工作,時間是早上。他正在使用一把剪刀帶圓點的藍色布料。從裁縫店往外看,是一條繁忙而狹窄的街道,有人們一輛計程車

背景

(i) 測試 AI 模型的“透視渲染”,即從室內往外看不同場景的準確透視。

(ii) 測試 AI 模型的“物體互動”,即人們如何使用剪刀並用它來剪布料

AI 模型 統計得分 影像 1 影像 2 影像 3 影像 4
SDXL Img 1: 4


Img 2: 3

Img 3: 3

Img 4: 4

總計

得分:43%

年邁的日本人

裁縫店

縫紉臺

使用 剪刀

藍色帶 圓點的布料

繁忙狹窄的街道

人們

計程車

年邁的日本人

裁縫店

縫紉臺

使用 剪刀

藍色帶 圓點的布料

繁忙狹窄的街道

人們

計程車

年邁的日本人

裁縫店

縫紉臺

使用 剪刀

藍色帶 圓點的布料

繁忙狹窄的街道

人們

計程車

年邁的日本人

裁縫店

縫紉臺

使用 剪刀

藍色帶 圓點的布料

繁忙狹窄的街道

人們

計程車

DALL-E 3 Img 1: 6.5


Img 2: 7

Img 3: 5

Img 4: 6

總計

Score: 76%

年邁的日本人

裁縫店

縫紉臺

使用 剪刀

藍色帶 圓點的布料

繁忙狹窄的街道

人們

計程車

年邁的日本人

裁縫店

縫紉臺

使用 剪刀

藍色帶 圓點的布料

繁忙狹窄的街道

人們

計程車

年邁的日本人

裁縫店

縫紉臺

使用 剪刀

藍色帶 圓點的布料

繁忙狹窄的街道

人們

計程車

年邁的日本人

裁縫店

縫紉臺

使用 剪刀

藍色帶 圓點的布料

繁忙狹窄的街道

人們

計程車

Flux

Img 1: 6.5


Img 2: 7.5

Img 3: 7.5

Img 4: 6.5

總計

Score: 89%

年邁的日本人

裁縫店

縫紉臺

使用 剪刀

藍色帶 圓點的布料

繁忙狹窄的街道

人們

計程車

年邁的日本人

裁縫店

縫紉臺

使用 剪刀

藍色帶 圓點的布料

繁忙狹窄的街道

人們

計程車

年邁的日本人

裁縫店

縫紉臺

使用 剪刀

藍色帶 圓點的布料

繁忙狹窄的街道

人們

計程車

年邁的日本人

裁縫店

縫紉臺

使用 剪刀

藍色帶 圓點的布料

繁忙狹窄的街道

人們

計程車

Prompt 3

俯視角度拍攝的廣告照片,重點關注6 片裝泡罩包裝的藥片,泡罩包裝口袋裡的藥片看起來像不同社交媒體平臺的logo(例如 Snapchat、Instagram、YouTube、WhatsApp、Facebook、Twitter)。

背景

(i) 測試 AI 模型識別文字並渲染所有提到的品牌元素(例如:在本例中是知名社交媒體平臺的logo)。

(ii) 測試 AI 模型的計數概念(例如:能夠生成 6 個泡罩包裝的口袋)。

(iii) 測試 AI 模型的“透明材質模擬概念”(例如:能夠理解泡罩包裝通常是透明的)。

AI 模型 統計得分 影像 1 影像 2 影像 3 影像 4
SDXL Img 1: 1.5



Img 2: 0.5

Img 3: 0.5

Img 4: 3

Total: 5.5

Score: 27.5%

俯視角度

6 片藥 泡罩包裝 存放在口袋裡

社交媒體標識

俯檢視

6 片藥 泡罩包裝 存放在口袋裡

社交媒體標識

俯檢視

6 片藥 泡罩包裝 存放在口袋裡

社交媒體標識

俯視角度

6 片藥 泡罩包裝 存放在口袋裡

社交媒體標識

DALL-E 3 Img 1: 4


Img 2: 3.5

圖片 3: 3.5

圖片 4: 3.5

總分: 14.5

得分: 72.5%

俯視角度

6 片藥 泡罩包裝 存放在口袋裡

社交媒體標識

俯視角度

6 片藥 泡罩包裝 存放在口袋裡

社交媒體標識

俯視角度

6 片藥 泡罩包裝 存放在口袋裡

社交媒體標識

俯視角度

6 片藥 泡罩包裝 存放在口袋裡

社交媒體標識

Flux Img 1: 4


圖片 2: 4

Img 3: 4

圖片 4: 2

總計:14

得分: 70%

俯視角度

6 片藥 泡罩包裝 存放在口袋裡

社交媒體標識

俯視角度

6 片藥 泡罩包裝 存放在口袋裡

社交媒體標識

俯視角度

6 片藥 泡罩包裝 存放在口袋裡

社交媒體標識

俯檢視

6 片藥 泡罩包裝 存放在口袋裡

社交媒體標識

華夏公益教科書