注意:如果您有關於“高難度”提示的想法要讓我測試,請 在這裡開始討論。
在這個對決格式中,我們堅持以下格式
(i) 每個實體/作者只有一個模型,並且得到社群的良好支援(SD3 不在等式中)
(ii) 每個模型有 4 次機會生成影像
(iii) 本地 WebUI 的引數保持不變(生成的影像數量除外)
(iv) 評分如下
| 圖例 |
得分 |
備註 |
|
1 分 |
完全符合提示 |
|
0.5 分 |
部分符合提示(能夠根據要求生成,但與提示描述/隱含含義不完全相同) |
|
0 分 |
不符合提示 |
提示 1
一位印度女演員身穿黃色紗麗,站在紅色房間裡,她面前有3 個盒子:左邊的盒子裝著黑色毛線球,中間的盒子裝著小狗,右邊的盒子裝著水瓶
背景
(i) 測試 AI 模型的“概念滲透”,即:紅色的牆壁是否會“滲透”到紗麗上或其他地方 / 盒子裡的物品是否會散佈到其他區域
(ii) 測試 AI 模型的“相對位置”,即:能夠識別影像中左右和中間位置的區域
(iii) 測試 AI 模型的“構圖生成”,即:能夠以其特定的排列生成多個專案
| AI 模型 |
統計得分 |
影像 1 |
影像 2 |
影像 3 |
影像 4 |
| SDXL
|
Img 1: 3.5 Img 2: 3.5
Img 3: 4 Img 4: 3 總計:14 得分:50%
|
|
|
|
|
印度女演員
黃色紗麗
紅色房間
3 個盒子
黑色毛線球
小狗
水瓶
|
印度女演員
黃色紗麗
紅色房間
3 個盒子
黑色毛線球
小狗
水瓶
|
印度女演員
黃色紗麗
紅色房間
3 個盒子
黑色毛線球
小狗
水瓶
|
印度女演員
黃色紗麗
紅色房間
3 個盒子
黑色毛線球
小狗
水瓶
|
| DALL-E 3
|
Img 1: 4 Img 2: 6
Img 3: 5.5 Img 4: 5 總計:20.5 得分:73%
|
|
|
|
|
印度女演員
黃色紗麗
紅色房間
3 個盒子
黑色毛線球
小狗
水瓶
|
印度女演員
黃色紗麗
紅色房間
3 個盒子
黑色毛線球
小狗
水瓶
|
印度女演員
黃色紗麗
紅色房間
3 個盒子
黑色毛線球
小狗
水瓶
|
印度女演員
黃色紗麗
紅色房間
3 個盒子
黑色毛線球
小狗
水瓶
|
| Flux
|
Img 1: 5 Img 2: 7
Img 3: 7 Img 4: 7 總計:20.5 得分:92%
|
|
|
|
|
印度女演員
黃色紗麗
紅色房間
3 個盒子
黑色毛線球
小狗
水瓶
|
印度女演員
黃色紗麗
紅色房間
3 個盒子
黑色毛線球
小狗
水瓶
|
印度女演員
黃色紗麗
紅色房間
3 個盒子
黑色毛線球
小狗
水瓶
|
印度女演員
黃色紗麗
紅色房間
3 個盒子
黑色毛線球
小狗
水瓶
|
提示 2
一位年邁的日本人裁縫正在他位於長崎的裁縫店裡的縫紉臺上工作,時間是早上。他正在使用一把剪刀剪帶圓點的藍色布料。從裁縫店往外看,是一條繁忙而狹窄的街道,有人們和一輛計程車。
背景
(i) 測試 AI 模型的“透視渲染”,即從室內往外看不同場景的準確透視。
(ii) 測試 AI 模型的“物體互動”,即人們如何使用剪刀並用它來剪布料
| AI 模型 |
統計得分 |
影像 1 |
影像 2 |
影像 3 |
影像 4 |
| SDXL
|
Img 1: 4 Img 2: 3
Img 3: 3 Img 4: 4 總計 得分:43%
|
|
|
|
|
年邁的日本人
裁縫店
縫紉臺  使用 剪刀  藍色帶 圓點的布料  繁忙狹窄的街道
人們
計程車
|
年邁的日本人
裁縫店
縫紉臺  使用 剪刀  藍色帶 圓點的布料  繁忙狹窄的街道
人們
計程車
|
年邁的日本人
裁縫店
縫紉臺  使用 剪刀  藍色帶 圓點的布料  繁忙狹窄的街道
人們
計程車
|
年邁的日本人
裁縫店
縫紉臺  使用 剪刀  藍色帶 圓點的布料  繁忙狹窄的街道
人們
計程車
|
| DALL-E 3
|
Img 1: 6.5 Img 2: 7
Img 3: 5 Img 4: 6 總計 Score: 76%
|
|
|
|
|
年邁的日本人
裁縫店
縫紉臺  使用 剪刀  藍色帶 圓點的布料  繁忙狹窄的街道
人們
計程車
|
年邁的日本人
裁縫店
縫紉臺  使用 剪刀  藍色帶 圓點的布料  繁忙狹窄的街道
人們
計程車
|
年邁的日本人
裁縫店
縫紉臺  使用 剪刀  藍色帶 圓點的布料  繁忙狹窄的街道
人們
計程車
|
年邁的日本人
裁縫店
縫紉臺  使用 剪刀  藍色帶 圓點的布料  繁忙狹窄的街道
人們
計程車
|
| Flux
|
Img 1: 6.5 Img 2: 7.5
Img 3: 7.5 Img 4: 6.5 總計 Score: 89%
|
|
|
|
|
年邁的日本人
裁縫店
縫紉臺  使用 剪刀  藍色帶 圓點的布料  繁忙狹窄的街道
人們
計程車
|
年邁的日本人
裁縫店
縫紉臺  使用 剪刀  藍色帶 圓點的布料  繁忙狹窄的街道
人們
計程車
|
年邁的日本人
裁縫店
縫紉臺  使用 剪刀  藍色帶 圓點的布料  繁忙狹窄的街道
人們
計程車
|
年邁的日本人
裁縫店
縫紉臺  使用 剪刀  藍色帶 圓點的布料  繁忙狹窄的街道
人們
計程車
|
Prompt 3
俯視角度拍攝的廣告照片,重點關注6 片裝泡罩包裝的藥片,泡罩包裝口袋裡的藥片看起來像不同社交媒體平臺的logo(例如 Snapchat、Instagram、YouTube、WhatsApp、Facebook、Twitter)。
背景
(i) 測試 AI 模型識別文字並渲染所有提到的品牌元素(例如:在本例中是知名社交媒體平臺的logo)。
(ii) 測試 AI 模型的計數概念(例如:能夠生成 6 個泡罩包裝的口袋)。
(iii) 測試 AI 模型的“透明材質模擬概念”(例如:能夠理解泡罩包裝通常是透明的)。