type
status
date
slug
summary
tags
category
icon
password
通过Stable Diffusion 给电商图片换脸,使用Openpose、Canny模型控制原图的内容,使用图生图的蒙版重绘达到不破坏原图的情况下换脸。 相对来说,肯定不如直接去拍摄自然和多样,但是对于一些快时尚产品,还是一个不错的思路,并且,只要肯花时间,再加上AI发展的速度,这个办法将越来越可行。
搭建Stable Diffusion WebUI环境
这一步,我就不多说了。大部分人都会使用SD。
如果没有使用过SD的朋友。如果你电脑显卡内存大于8G,并且在RTX30系显卡以上。
推荐使用:秋叶大佬的整合包,在本地搭建,这个基本上除了交电费以外全部免费。
如果你的电脑不是很好,推荐使用线上的方式,推荐两个平台。
这个平台实际上就是国内的C站,可以发布模型,可以在线生成。每天赠送300积分,差不多生成一张图使用3-8个积分(具体根据尺寸和使用到的插件)。并且有一部分的功能需要收费,例如面部修复,他只支持1个修复通道,也就是修复了面部,没办法修复手。
作为测试平台还是很不错的,有时候我们没有这么大的把握,就先用这个平台测试参数。
使用liblib平台其他用户发布的模型,一定要看一下商业授权的范围,避免侵权。如果没有合适的,可以在C站下载模型,上传到liblib设置仅自己可见即可。
这个也是秋叶大佬推荐的在线平台。这个平台就是租用算力,正常收费。3090显卡一个小时1.9的价格。相对来说价格比较划算,使用起来也比较灵活。不用的时候可以随时关闭。不会再收费。
但目前来说,如果我们是用来工作。还是推荐本地部署,效率上会有很大提升。
下载大模型
大模型这里就推荐使用欧美、真实摄影的、女性的大模型。
这个很好找,到https://civitai.com/下载自己需要的Checkpoint,同时也可以找找自己喜欢的Lora。这里Lora的作用只是可以帮助你生成出来的图片做微调。比如长相、整体色调等等。
具体SD设置
首先我们使用图生图功能。在大模型选择我们找好的大模型。
正向提示词:可以根据需求,会有很多预设。可以自行选择,但是像是真实、照片风格等提示词是必须要加的。
反向提示词:主要添加一些错误的比例等等会导致图像出现错误的词,这里也可以根据一次次生成出来的图片,如果你不需要什么就把相对应的词加入反向提示词。例如:帽子、墨镜等等。
然后我们使用重绘蒙版的功能
将衣服使用PS工具扣出来,并添加黑色,并保存成JPG,上传。(切记蒙版图片尺寸必须和原图的尺寸和位置保持一致。)
这里有几个点需要关注一下。
1、蒙版蒙主的内容
填充:指的是根据提示词将重绘的区域重绘。
原图:指的是参考原图和提示词重绘需要重绘的区域。
这里如果我们使用了Openpose和Canny来控制重绘区域的内容,我们可以使用填充。这样出来的图片和我们原来的图片就大不一样。但是基本上还是会参考原始图像模特动作来重绘。
2、采样方式
这里建议去根据下载的大模型,他们都会有推荐的采样方式,这里直接照抄即可。
其他的设置我不做解释,如果需要了解,可以去搜索一下,有很多大佬做相关教程。(有很多我自己也没搞懂😂)
提示词引导系数 的值就是生成出来的图,与提示词的相关程度。
重绘幅度 也是同样的道理,这两个值建议第一次生成就默认或根据大模型作者的建议设置,然后根据出图再做调整
ADetailer是一个非常好用的面部修复工具,因为AI生成的问题,可能出来的图片,会出现比例不对的脸,所以这个插件非常好用,我们直接启动该插件,并在单元1 使用Face_yolov8s模型对面部修复。
如果你需要修复手部,就启动单元2,并使用Hand_yolov8s模型
下一步就是设置ControlNet的设置
这里我们需要两个控制器,一个是Openpose,这个主要是控制生成的新图像与我们原图的模特动作一致,并且四肢的方向位置等等都一致。不要出现多个手多个脚的情况。
第二个控制器就是Canny硬边缘。因为我们生产的是衣服图片,我们不希望出来的新图片,衣服多个领子,多个袖子之类的情况发生,所以我们需要canny来帮我们先绘制一个边缘线条,当新生成的图片,就会严格按照新原来的边缘线条进行绘制。
OK以上所有相关区域就设置完了,然后我们最终生成的图片就长这样
如果各位对我的教程有什么疑问或者建议可以给我留言,这是一个与电商摄影AI生成相关的内容,后续我也会继续对这个领域研究,因为我认为AI替代一些事情是迟早的事情。即便不会替代也会提高我们工作的效率。如果后续再有相关的教程我会在这个Blog发布。