保姆级教程来了！AI绘画提示词原理揭秘

为了让你快速上手从 0 到 1 的绘图流程，在这篇文章中，我们将重点讲解 Prompt 提示词。

1、解析提示词的概念

在深入讲解之前，我们首先来了解一些基本概念，以便更好地学习和理解。

提示词，也就是 Prompt，主要是指用户输入的文本或图像信息，其目的是为了引导模型根据特定需求生成相应的作品。简单来说，就是用来告诉 AI 我们想要创作什么样的图片，这可以被理解为一种与 AI 沟通的特定格式的语言。

在之前的文章中，我们介绍了 SD 的「文生图」和「图生图」两种功能。

「文生图」主要通过文字与 AI 模型沟通，而这就需要使用到我们的提示词。

「图生图」则是通过图片来传递信息给 AI 模型，这里同样会用到提示词。

提示词在 AI 绘图中的应用范围非常广泛，包括但不限于图片的主题、风格、场景、人物特征、服装特点和其他额外参数等。

有时候为了生成一幅图片，我们可能需要用到十几行的提示词。事实上，许多提示词都是固定和规律的。

描述越详细，提示词就越长，AI 模型就能更精确地输出与我们需求一致的作品。

2、分类与书写提示词

那么，我们该如何书写提示词呢？

书写提示词其实没有严格的限制，不管你输入什么，AI 都会尝试为你生成一幅图片。但如果你想让 AI 更准确地理解你的需求，那么掌握基本的语法和规则是非常必要的。

以 SD 为例，在「文生图」操作中，你会看到输入「正向提示词」和「反向提示词」的区域。

首先，提示词仅支持英文输入。如果你的英语水平尚可，你可以直接输入英文；否则，你可以借助翻译工具。

其次，提示词应以词组为基本单位，各个词组之间用英文逗号「,」分隔。

例如，如果你想要 AI 为你生成「一个又高又瘦的女生和一杯又浓又香的咖啡」的图片，你可以将其拆分为以下词组：「女生, 高, 瘦, 咖啡, 浓, 香」。

这样，AI 就能更好地理解你想要生成什么样的图片，甚至比口头描述更加精准。

根据以上提示词，你可以尝试直接生成图片。可能结果会符合你的期望，但也可能会出现一些奇怪的效果。这是因为 AI 在处理时具有一定的「随机性」，每次生成的图片都不会完全相同。

例如，「一个又高又瘦的女生，和一杯又浓又香的咖啡」这个描述其实非常抽象和简短。这个女孩是学生还是上班族？时间是白天还是夜晚？场景是在咖啡店还是在家里？这些都是 AI 无法从简短的描述中得知的信息。

因此，如果提示词过于抽象和笼统，AI 就只能根据自己的理解随机生成一幅图片。

实际上，一个完整的提示词通常是通过不断与 AI 调试、逐步细化和微调而成的。

那么在提示词的基础上我们还需要添加哪些内容呢？

我们可以将其简单概括为以下几大类，以方便你在微调关键词和补充细节时，能够迅速找到合适的词组，从而快速生成你想要的作品。

主要包括五类：人物特征提示词、环境提示词、场景提示词、视角提示词、画质提示词。

例如，我们可以将前面的提示词进一步细化和补充，形成一组标准化的提示词，以便更好地引导 AI 生成高质量的图片。参考如下：

1 girl, high, thin, coffee, thick, fragrant,

white dress, blonde hair, long hair, smiling, beautiful, happy, outdoor, day, sunlight, blue sky, close-up,

best quality, ultra detailed, masterpiece, 8k, extremely detailed CG unity 8k wallpaper,

painting, illustration, anime, game cg,

这种标准化的提示词可以使我们的图像更加细致和丰富。

使用这些标准化提示词后，是否感觉图像的质感和细节更加丰富了？

至此，我们实际上已经很清楚地了解了如何从零开始编写提示词。提示词的结构已经为你清晰地划分出来。

如果想要让AI更准确地理解提示词，内容应该既丰富又有明确的标准。

另外，我还为你提供了一个如何书写提示词的模板。点击下方链接并关注我们的公众号后，在后台回复「提示词模板」即可获得。

提示词的词组化结构在微调时非常方便，不需要重新组织整个语句，只需直接修改对应的词组即可，图像也会根据这些修改进行相应的变化。

3、提示词权重与负面提示词介绍

你可能已经注意到，我们的提示词中有些是带有特定的符号，如 ( ) 或 { } 。这些符号代表什么含义呢？这正是本节要讲的「提示词权重」。

在现实场景中，当你在书写描述时，可能会有多个描述词组。例如，你可能描述了头发的长度（long hair）、衣服的颜色（white dress）以及面部表情（smiling）。但AI可能并不总是能够准确地识别所有的描述。

对于这种情况，我们可以通过调整权重来强调某个词组的重要性，使其在图像中更加突出。增加权重主要有两种方法：一种是使用括号，另一种是使用数字权重。

经过权重调整后的图像，是否感觉加权的提示词更加突出了？

当你发现某些描述没有被AI准确地反映在图像中时，你就可以考虑「增加提示词权重」来强调它们的重要性。

但是，请注意不要将权重设置得过高，这可能导致图像内容严重失真。

一般来说，提示词权重的安全范围为0.5至1.5。如果某个词组的权重超出这个范围，生成的图像可能会出现扭曲。

至于「负面提示词」，它主要用于指定我们不希望在图像中出现的元素。反向提示词可以为空，但通常，为了标准化图片，我们会选择加入一些常见的词组。

为了更方便地输入提示词，我们推荐使用如下插件：

插件地址:

https://github.com/Physton/sd-webui-prompt-all-in-one.git

安装该插件后，你将在提示词页面看到新增的功能。

4、AI 绘图必备提示词工具

许多在线工具可以帮助你编写提示词。例如：

– https://ai.dawnmark.cn/- https://civitai.com/images- https://openart.ai/discovery

这些工具的使用方法非常简单，你只需选择相应的参数和风格，然后复制生成的提示词到SD中。

5、AI 绘图工具:ChatGPT DALL·E 3与 Midjourney比较

在 AI 绘图领域，ChatGPT 的 DALL·E 3 和 Midjourney 无疑是两大巨头。而对于很多用户来说，了解它们之间的不同可能会影响其选择。以下是两者的详细比较。

1. 功能性与易用性：

– ChatGPT 的 DALL·E 3：DALL·E 3 的最大优势在于其与 ChatGPT 的无缝集成。用户只需通过文本聊天框提供指示，即可生成所需的图像。这种自然语言处理方式使得使用起来非常直观和简单，无需复杂的界面和操作。

– Midjourney：虽然 Midjourney 也为用户提供了直观的界面，但其更偏向于专业用户，可能需要更多的学习和适应。

2. 图像质量与创意性：

– ChatGPT 的 DALL·E 3：DALL·E 3 生成的图像细节丰富，能够准确捕捉到用户的意图并将其转化为有趣的图像创意。它的技术使其在理解复杂的描述和生成相应图像方面表现出色。

– Midjourney：Midjourney 在艺术效果和专业质量方面表现出众，更适用于需要高水平审美和专业领域的场景。

3. 适用领域：

– ChatGPT 的 DALL·E 3：由于其易用性和广泛的应用范围，DALL·E 3 更适合日常用户和非专业人士，例如内容创作者、博主和设计爱好者。

– Midjourney：由于其艺术性和专业性，Midjourney 更适合设计师、艺术家和专业团队使用，特别是在需要高质量输出的项目中。

4. 开放性与集成：

– ChatGPT 的 DALL·E 3：由于是 OpenAI 的产品，DALL·E 3 有可能与 OpenAI 的其他产品进行集成，这为未来的发展和扩展提供了更多的可能性。

– Midjourney：作为一个独立的平台，Midjourney 在与其他系统集成时可能需要更多的工作和调整。

总结，选择 ChatGPT 的 DALL·E 3 还是 Midjourney 主要取决于个人或团队的需求。对于那些需要快速、简单的图像生成的人，DALL·E 3 可能是更好的选择。而对于那些追求专业质量和艺术效果的人，Midjourney 可能更具吸引力。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

相关文章

发表回复 取消回复

发表回复取消回复