ChatGPT 之后,再玩玩 Stable-Diffusion
前些天体验的 ChatGPT 主要用来进行文本方面的处理,那么图片生成有没有这样的 AI 工具 呢?答案是肯定的。
例如:和菜头公众号的题图和文章中的插图大多都是使用 Stable-Diffusion 的 AI 图形生成工具创作的。顺着 Stable-Diffusion 搜索了下相关资料,发现 AI 创作图片的工具也有不少:
- Disco Diffusion:是发布于 Google Colab 平台的一款利用人工智能深度学习进行数字艺术创作的工具,它是基于 MIT 许可协议的开源工具,可以在 Google Drive 直接运行,也可以部署到本地运行;
- Midjourney:是 Disco Diffusion 的原作者 Somnai 的作品,对 Disco Diffusion 进行了改进,平均 1 分钟能出图;
- DALL-E 2:OpenAI 推出 DALL·E 2, DALL-E 2 实现了更高分辨率和更低延迟;
- Stable-Diffusion:由 http://stability.ai/ 推出,在 2022 年 8 月 10 号开源了,10 几秒就能出图,算是比较快的了。
本文就以 Stable-Diffusion 为例,谈谈我的使用体验。Stable-Diffusion 作为一个开源工具,使用的方式有多种:
1、基于开源的工具提供了实现,比如官方提供的 https://beta.dreamstudio.ai/dream;,也可以使用 https://huggingface.co/spaces/camenduru/webui
2、本地部署;
3、调用 API 。
官网注册账号
打开 https://beta.dreamstudio.ai/ ,直接选择使用 Google 账号进行注册,你也可以选择自己的方式。
相比较 ChatGPT ,dreamstudio 的注册要方便很多,注册成功后登录界面如下:
dreamstudio 是收费的,成功注册后会赠送 100 个 credits ,每次生成图片,会消耗一些 credits,消耗的多少跟设置有关,默认设置会产生 4 张 512 * 512 的图,消耗 0.8 个 credits 。
配置信息如下:
- Widht:图片宽度;
- Height:图片高度;
- Cfg Scale:一个阈值,越高生成的图片越接近你的描述,越低,AI 发挥空间越大,保持默认就好;
- Steps:生成图片用的步骤数,越大生成越慢;
- Number of Images:一次生成的图片数量,默认为 4,也可以改为 1,改成 1 后,生成一次只要 0.2 credits。
在上图中最下面的文本框中输入提示文本,点击 Dream 按钮便可生成。
huggingface
直接在浏览器输入:https://huggingface.co/spaces/camenduru/webui 便可使用,可以不用注册登录,缺点就是需要排队,相当于就是多人在同时使用这个服务,如果排队的人较多,生成的时间会比较长。
本地化部署
本地化部署对机器的配置要求比较高,内存和显存都不能太低。
在 GitHub 上有一个仓库 https://github.com/AUTOMATIC1111/stable-diffusion-webui 介绍了 stable-diffusion 怎样离线部署使用,提供了 Windows、Liunx、Mac 等多种方式。
如果你使用的是 Mac ,可以参考:https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/Installation-on-Apple-Silicon
如果你使用的是 Windows ,觉得安装步骤比较繁琐,还有人做了一键安装和启动的项目放在 Github 上,地址如下:
https://github.com/EmpireMediaScience/A1111-Web-UI-Installer
提示语
AI 生成图片的关键在于提示语,就像使用 ChatGPT ,一个好的问题是关键。提示语不会写的话可以先参考,在下面网站中可以搜索相关的图片,查看提示语:
https://lexica.art/
https://www.krea.ai/
https://laion-aesthetic.datasette.io/laion-aesthetic-6pls/images
先多看看那些精美有创意的图片都是什么样的提示词生成的,看多了,再尝试自己去修改、调整。
相关阅读