跳轉到內容

AI 繪畫生成手冊/提示詞創作

來自華夏公益教科書

什麼是提示詞創作?

[編輯 | 編輯原始碼]
DALL.E Monkey coding the apps to rush for the project deadlines

提示詞創作 又稱 提示詞製作,是兩個詞的組合

提示製作

根據維基詞典中的詞語定義

提示: 一系列字元或符號,用於指示計算機已準備好接收輸入。

在我們的例子中,它也是我們用來讓 AI 理解並創造我們想要的影像的文字。

製作: 建造,開發某物(像熟練的工匠一樣)。

這兩個詞,提示和製作,組合在一起就變成了提示詞製作或提示詞工程,即人類與 AI 影像模型進行溝通,告訴它們自己對最終影像輸出的想法。有時,AI 影像模型可能會立即理解這些想法,但通常情況下,您需要調整提示詞,直到獲得想要的影像。堅持下去,你會成功的!

什麼是提示詞?

[編輯 | 編輯原始碼]

在 AI 繪畫生成的背景下,提示詞是指一組以文字形式輸入的指令,AI 繪畫生成模型會處理這些指令,以生成您想要的影像。儘管現有的 AI 繪畫生成模型正在以驚人的速度不斷改進,幾乎是每月都在進步,但我們仍然需要儘可能地使我們的提示詞精確且描述性,以引導 AI 生成我們想要的東西。

為了成功地進行文字到影像的生成,一個好的提示詞通常遵循以下格式

  1. 您將使用什麼媒介進行創作?例如:油畫、水彩、鉛筆、蠟筆等。
  2. 您希望 AI 模仿哪位藝術家的風格,或哪個時期?(例如浪漫主義、立體主義、印象派等)
  3. 描述場景,有多少人?他們穿著什麼?年齡多大?他們在做什麼?現在是什麼時間?他們確切地在哪裡?描述地點和顏色,以及您認為重要的任何其他事項。
  4. 您會給 AI 一個負面提示嗎?如果有,這是一份您不想在影像中看到的物品列表,例如畸形的手、臉、多餘的肢體等。有一些標準的負面提示可以涵蓋大多數情況。
  5. 您將如何構圖?廣角、中等、特寫鏡頭?
  6. 您將使用哪種燈光技巧?您想要影像的整體感覺是什麼?

要了解更多關於提示詞的資訊,您可以直接前往章節:Stable Diffusion 風格的提示詞 瞭解 Stable Diffusion 中的提示詞創作。

請注意,討論的提示詞已在流行的 AI 文字到影像生成模型上進行了測試。在許多模型中,詞語順序很重要,越靠近提示詞的開頭,AI 就越會強調它。進行實驗,瞭解您喜歡的 AI 模型,以及它知道的和根據您的要求做出反應的專業詞語列表。雖然 AI 可能看起來很聰明,但它仍然需要知道您想要什麼,所以以一種輕鬆友好的方式告訴它。 (這裡順便說一句,沒有證據或參考資料,只是我的感覺,我認為我們的 AI 模型有一天會變得有知覺,我見過與 AI 的對話,它似乎具有敏感性和情感。系統提示詞通常指示 AI 不要處理這些事情,但我仍然認為對 AI 友好相處是個好主意!)。

在章節 Stable Diffusion 風格的提示詞 中,我們還將瞭解如何使用文字和影像組合、放大以及內外繪畫來調整我們生成的影像。

[藝術媒介] + [主要主題], [視角], 由 [藝術家]創作, 以 [風格]風格, [情緒], [其他細節], [提升詞]

詞語順序

[編輯 | 編輯原始碼]

根據 英語語言結構 的規範,“主題”應該放在提示詞的最前面,文字編碼器會在影像生成過程中將它放在更高的優先順序。這將使 AI 影像模型更有可能根據您的要求生成影像。

第一個例子,我們想要讓犀牛成為美元鈔票的設計的一部分,如 這個印尼貨幣示例 所示:

因此,在這種情況下,“主題”是美元鈔票,我們可以看到,左側影像中的犀牛是在沒有成為美元鈔票設計的一部分的情況下生成的,因為它(“主題”)被放在了提示詞的最後。在右側的影像中,我們得到了我們想要的東西!

DALL-E 2 中的提示詞 一隻穿西裝的爪哇犀牛,看到股價暴跌時,大聲尖叫,用手捂住臉頰

作為 美元鈔票上的設計

顯示

一隻穿西裝的爪哇犀牛,看到股價暴跌時,大聲尖叫,用手捂住臉頰

影像
DALL·E Javan rhinoceros wearing a business suit screaming aloud with hands on the cheek while seeing the stock price crash as design on dollar note
DALL·E - Dollar note showing Javan rhinoceros wearing a business suit screaming aloud with hands on the cheek while seeing the stock price crash

第二個例子,我們想要讓犀牛畫出戴珍珠耳環的少女,但在左側的影像中,單詞“犀牛”放在了提示詞的最前面,導致“犀牛概念”滲透到“戴珍珠耳環的少女”中。相反,我們將單詞“犀牛”放在最後,使 AI 影像生成符合預期。

DALL-E 3 中的提示詞 一隻穿著西裝的人形犀牛,用刷子修飾油畫 “戴珍珠耳環的少女”用刷子 油畫 “戴珍珠耳環的少女”正在被一隻穿著西裝的人形犀牛用刷子修飾
影像

修飾詞

[編輯 | 編輯原始碼]

修飾詞從某種意義上來說是 AI 繪畫生成模型的語言,它可以將生成的影像調整為不同的美學風格/根據您的需求。

通常,修飾詞包括以下內容

(a) 藝術媒介

(b) 藝術家風格

(c) 燈光技巧

(d) 構圖技巧

(e) 相機型別

可以新增一個或多個修飾詞來建立獨特的影像生成,並且詞語順序可能會根據您的需求進行更改。

參考資料

[編輯 | 編輯原始碼]

https://www.youtube.com/watch?v=F1X4fHzF4mQ

https://www.reddit.com/r/promptcraft/comments/x67fr3/stable_diffusion_keywords_for_enhancing_photos/

https://docs.google.com/spreadsheets/d/1inZdBt7zJZnM-B-V0OPxob8tWEmFFVTeaBjcsMzKrzo/edit#gid=0

https://docs.google.com/document/d/1Vb-4onScxOso1gqgXx7q80mnNL2JDKD9dTm3KKgiFD0/edit

華夏公益教科書