Stable Diffusion如何生成高质量的图-prompt写法介绍

2023-07-17 11:12:12

Stable Diffusion

Stable Diffusion是一个开源的图像生成AI系统,由Anthropic公司开发。它基于 Transformer模型架构,可以通过文字描述生成高质量的图像。
Stable Diffusion的主要特点包括:

  • 强大的图像生成能力。它可以根据文本描述生成非常逼真的图像,包括人物、风景、动物等各种主题。
  • 对文本的理解能力强。它可以捕捉文本描述的关键信息,转换为视觉上的表现。
  • 生成图像分辨率高。它可以生成512x512甚至1024x1024像素的高分辨率图像。
  • 开源且易于使用。它建立在开源框架PyTorch等基础上,可以轻松地在GPU及普通电脑上运行。
  • 训练数据量大。它的训练数据集包含大量高质量图像,这是它强大能力的重要基础。
  • 结果多样化。每次输入相同提示,它都可以生成略有不同的结果,增加了结果的多样性。
  • 控制能力强。用户可以通过调整文字提示、超参数等方式控制生成结果。

Stable Diffusion是一种潜在扩散模型(Latent Diffusion Model),能够从文本描述中生成详细的图像。它还可以用于图像修复、图像绘制、文本到图像和图像到图像等任务。简单地说,我们只要给出想要的图片的文字描述在提Stable Diffusion就能生成符合你要求的逼真的图像。Stable Diffusion作为新兴的AI生成模型,拥有强大的图像生成能力,是目前最先进的开源生成模型之一,值得关注。它的出现将推动创作界发生革命性的变化。

使用

尝试下效果

prompt:beautiful girl,bikini,sea,beach,sunshine

生成的效果如下:
在这里插入图片描述

效果不太好,我们来学习下prompt如何编写,再看看改善效果。

prompt的编写技巧

prompt 和 negative prompt

在这里插入图片描述

描述语分为正向/负向描述,它们也叫tag(标签)或prompt(提示词)
正面提示词:相比Midjourney,SD需要写得更精准和细致,描述少就给AI更多自由发挥空间。
负面提示词:不想让SD生成的内容。
正向:masterpiece, best quality, 画质词,画面描述。
反向:根据画面产出加不想出现的画面。

Prompt格式

第一段:画质tag,画风tag
第二段:画面主体,主体强调,主体细节概括(主体可以是人、事、物、景)画面核心内容
第三段:画面场景细节,或人物细节,embedding tag。画面细节内容
第二段一般提供人数,人物主要特征,主要动作(一般置于人物之前),物体主要特征,主景或景色框架等

Prompt规则细节

  1. 提示词的顺序决定了权重的大小,越靠前的词汇权重越大,会对图像生成产生更直接的影响。
  2. 生成图片分辨率越大,需要的提示词量也越多,否则不同的提示词会产生不一致的效果,相互干扰。
  3. 使用括号可以精确调整单个词的权重值,提高或降低其对图像生成的影响程度。常用的权重调整范围建议控制在0.25到1.5之间,避免超出这个范围带来负面效果。
    方法如下:
    (word) - 将权重提高 1.1 倍
    ((word)) - 将权重提高 1.21 倍(= 1.1 * 1.1)
    [word] - 将权重降低至原先的 90.91%
    (word:1.5) - 将权重提高 1.5 倍
    (word:0.25) - 将权重减少为原先的 25%
    请注意,权重值最好不要超过 1.5

优化

根据上面的规则我们来改下下prompt

A beautiful young girl standing in the shallow seawater on a sunny tropical beach. She has long wavy blonde hair flowing in the ocean breeze. She's wearing a red floral bikini which compliments her tanned skin tone. Her fit athletic body is perfectly framed in this scene. She has a bright, energetic smile on her face as she's enjoying the warm ocean water washing over her feet. The background is a picturesque tropical beach scene with white sand, palm trees, and turquoise blue water sparkling in the bright sunlight stretching out to the horizon. This is a perfect summer beach day. The overall color tone is vibrant and cheerful. The girl looks natural, elegant, and carefree. This is a high quality, photorealistic image.

报错

“Unsafe content found”

继续优化

"A cheerful young woman smiling and having fun at the beach. She has long, dark brown hair blowing casually in the tropical breeze. She's dressed appropriately in a blue floral one-piece swimsuit. Posing happily on the shore, with one hand up to her forehead to shade her eyes. Behind her is a beautiful scenic view of bright turquoise waves gently lapping against the sandy shore. In the background, the wide open clear blue sky meets the ocean horizon. Palm trees and green vegetation dot the landscape. The sunlight is bright and warm. This is a high quality, idyllic summer beach scene."

主要修改的点包括:

  1. 使用积极正面词语 como “cheerful”,“having fun”,“happily”,移除可能引起歧义的词汇。
  2. 将比基尼改为更保守的连体泳衣。
  3. 去掉只描写女孩的语句,加上与海滩景色的衔接。
  4. 增加阳光、植被等宁静自然的元素。
  5. 使用专业的视觉描述词语如“idyllic”,“scenic”等。
  6. 强调图像质量要高,内容要正面积极。
  7. 避免可能引起歧义或联想的表达。

看效果
在这里插入图片描述
很明显,改善很明显…… 哈哈哈哈哈哈哈 (如果被吓到实在不好意思,我也有点看恐怖片的感觉)

上面这些图是因为我Guidance Scale的参数设置太低了。

Guidance Scale

Stable Diffusion 模型中的 Guidance Scale 参数是调整文本提示(Text Prompt)对图像生成影响力的一个重要超参数。
Guidance Scale 参数的主要作用是:

  1. 控制文本提示的重要性:
  • 参数值越高,文本提示的影响就越大,生成图片会越关注文本提示的要求。
  • 参数值越低,文本提示影响减弱,生成图片会更具原创性和多样性。
  1. 平衡文本提示和训练数据:
  • 参数值越高,依赖文本提示的信息更多,训练数据的影响被压制。
  • 参数值越低,训练数据的信息起主导作用,文本提示只起辅助影响。
  1. 调节生成图片质量:
  • 适当的Guidance Scale可以帮助生成更高质量的图片。
  • 参数过大或过小,都可能导致生成图片质量下降。
    通常Guidance Scale的取值范围在1-20之间。默认值是7,这是一个比较平衡的设置。使用时可以通过调整这个参数,来实现对生成图片的精细控制。
    Guidance Scale直接影响文本提示的作用强度,是Stable Diffusion中非常重要的一个生成控制超参数。

我们来调整下Guidance Scale参数
在这里插入图片描述

改后的效果如图(我实在不知道怎么修改CSDN才不违规了,一个连体泳衣都违规,其他平台都正常显示,只能马赛克了):

在这里插入图片描述

在这里插入图片描述

总结

想要用Stable Diffusion生成高质量的图片,避免生成低质量的“烂图片”,可以注意以下几点:

  1. 使用合理的提示词(Prompt)
  • 提示词要简洁明确,避免歧义。important信息前置。
  • 添加合适的描述词帮助生成细节。如大小,颜色,质感等。
  • 使用正确的英文语法和拼写。
  • 避免使用负面和敏感词汇。
  1. 调整超参数
  • 适当调高 Guidance Scale,加强提示词影响力。
  • 调整 Steps(迭代次数)不要过少,一般100-200。
  • 调试不同的 Sampler,如DDIM较平滑。
  1. 使用高质量训练数据
  • 大型模型效果更好,如Stable Diffusion v2。
  • 尝试不同主题的训练数据,匹配生成目标。
  1. 生成分辨率不要过低
  • 分辨率过低会造成图片质量下降。
  • 一般选择512x512 或更高分辨率。
  1. 复核和选择图片
  • 生成多张样本图片,挑选效果最佳的。
  • 检查合理性,删除离题图像。
    通过以上方法,可以最大程度地避免Stable Diffusion生成不理想的低质量图片。但过程中也需要一定的试错尝试,以找到最佳设置。
更多推荐

AIGC数据处理与存储解决方案

针对在AIGC的场景下,如何解决在AIGC训练过程中数据的存储和数据处理的问题,杨冠军从三个方面进行介绍与解读:一是AIGC对存储提的新需求;二是介绍腾讯云可以给用户提供的整体存储解决方案;三是腾讯云提供的整体数据处理方案。AIGC的新需求:模型训练与应用推理的述求我国每年产生的数据量呈现非常大的增长趋势,这个前提还是

【JavaSE笔记】继承与多态(万字详解)

一、前言在Java的核心概念中,继承和多态无疑是重要的一环。它们都是Java以及其他许多面向对象编程语言的基石,为我们提供了强大的工具来创建模块化,可重用和易于维护的代码。继承让我们可以创建新的类,通过继承现有类的属性和方法,来复用代码并添加或覆盖特定的行为。这为我们提供了一种强大的方式来组织和结构化我们的代码,使我们

【活动总结】0730-COC深圳社区AI●CMeetup第4期——畅谈AI+智能制造与机器人的现状与未来

【活动总结】0730-COC深圳社区AI●CMeetup第4期——畅谈AI+智能制造与机器人的现状与未来在过去的半年里,AI相关技术取得了革命性突破,CSDNCMeet策划推出系列研讨会,深度探讨技术更新后的开发实践。然而,更重要的是如何对AI实践应用,如何在最大程度上发挥AI的产业价值,提升生产效率。因此,AIMee

白鲸开源 X SelectDB 金融大数据联合解决方案公布!从源头解决大数据开发挑战

业务挑战与痛点随着互联网技术的发展、云计算技术的成熟、人工智能技术的兴起和数字化经济的崛起,数据已成为企业的核心资产。在金融行业中,数字化已成为了支撑各类业务场景的核心力量,包括个人理财、企业融资、股票交易、保险理赔、贷款服务、支付结算、投资咨询、资产管理等等。然而,在基于大数据分析与处理技术的业务建设中,当下的金融企

微信小程序——事件监听

微信小程序是一种轻量级的应用程序,它在移动设备上提供了丰富的用户体验。在开发微信小程序时,事件监听是一项重要的技术,它允许开发者捕捉和处理用户的各种操作。本文将介绍微信小程序事件监听的概念、用法和一些实用示例。1.什么是事件监听?事件监听是一种编程技术,通过在应用程序中注册监听器来捕捉和处理特定事件的发生^1。在微信小

Java手写Prim算法和Prim算法应用拓展案例

Java手写Prim算法和Prim算法应用拓展案例1.算法思维导图以下是使用Mermanid代码表示的Prim算法实现原理:#mermaid-svg-W6cUKRD3qrphQAun{font-family:"trebuchetms",verdana,arial,sans-serif;font-size:16px;fi

IP代理安全吗?如何防止IP被限制访问?

你是否遇到过可以正常上网,但访问某个网站却被禁止?注册某个网站账号,却被封号?那都是因为IP出现问题!您的IP地址透露很多关于您的信息,包括您的位置和互联网活动。在本文中,我们将一起了解IP地址,网站如何利用它来跟踪您,以及与IP代理如何帮助您更好的推进业务。什么是IP地址?IP地址是互联网协议地址(InternetP

hive 中正则表表达式使用

一概念概念:正则表达式(RegularExpression),又称规则表达式,是记录文本规则的代码。通常被用来检索、替换那些符合某个模式(规则)的文本。特性:最初是由Unix中的工具软件(例如sed和grep)普及开的,现在许多程序设计语言都支持利用正则表达式。常见缩写:正则表达式在代码中,通常缩写成regex、reg

etcd实现大规模服务治理应用实战

导读:服务治理目前越来越被企业建设所重视,特别现在云原生,微服务等各种技术被更多的企业所应用,本文内容是百度小程序团队基于大模型服务治理实战经验的一些总结,同时结合当前较火的分布式开源kv产品etcd,不仅会深入剖析ectd两大核心技术Raft与boltdb的实现原理,也会披露服务治理真实实践的经验,希望帮助大家在服务

怒刷LeetCode的第8天(Java版)

目录第一题题目来源题目内容解决方法方法一:双指针和排序​编辑第二题题目来源题目内容解决方法方法一:双指针方法二:递归方法三:快慢指针方法四:栈第三题题目来源题目内容解决方法方法一:栈方法二:字符串替换方法三:链表方法四:栈和正则表达式第一题题目来源18.四数之和-力扣(LeetCode)题目内容解决方法方法一:双指针和

设计模式之抽象工厂

抽象工厂模式结构图抽象工厂模式,提供一个创建一系列相关或相互依赖对象的接口,而无需指定它们具体的类工厂方法模式,定义一个用于创建对象的接口,让子类决定实例化哪一个类。抽象工厂模式是围绕一个超级工厂创建其他工厂。该超级工程又称为其他工厂的工厂。这种类型的设计模式属于创建型模式,它提供了一种创建对象的最佳方式产品族:一个工

热文推荐