这款AI修图开源后,又多少行业面临失业,聪明人靠它在抖音再就业搞钱-轻识

DragGAN

超傻瓜PhotoShop，正如她的名字一样，拖拽（Drag）生成对抗网络（GAN），什么叫生成对抗网络你不用去管它，至于拖拽嘛，看图（A picture is worth a thousand words）。

这款软件非常直观易懂

图片上点击两下：红色、蓝色
在Drag栏选择：点击开始
画面红色位置自动移动到蓝色位置

日出再看一遍，好的，时间到倒流。

顺带分享一个真正可以看2次日出的方法：

在太阳完全升到地平线以上时，立即蹲下，就能体验太阳与地平线再次离开地平线，175cm亲测有效，身高越高效果越佳。

上图中，太阳被拖拽后生成的照片不太和谐，这是因为训练集合不足导致的。DragGAN针对人物和动物进行了最多内容的训练，接下来的几个例子更加令人惊叹。

除了能够模拟各种变装模特，DragGAN还可以生成各种姿势的图像。不仅可以拉长或缩短衣服，甚至还能调整衣服的长度。这是否意味着DragGAN可以一键脱衣呢？

大头照修图？刘海不满意、眼睛没有神、笑容不自然都不用担心，借助DragGAN修图就可以搞定。

Stable Diffusion Vs DragGAN

Stable Diffusion 和 DragGAN 的差别在于一个是开盲盒、一个所想及所得。

Stable Diffusion可以帮助非艺术专业人员入职绘画。传统的绘画需要很长时间的学习和实践，而且需要具备一定的艺术天赋和技能。但是，利用Stable Diffusion生成的图像可以作为非专业人员学习和实践绘画的素材。通过对这些高质量的图像进行观察、分析和模仿，非专业人员可以逐渐掌握绘画的基本技能和风格，进而提高自己的绘画水平。

Stable Diffusion的优势在于其天马行空的创造力，但是需要注意的是，同样的提示词可能会根据不同的模型生成出截然不同的内容。虽然Stable Diffusion拥有区域重新绘制的功能，但有时候也会遇到无法改变的限制，这时候如何选择合适的提示词就显得尤为重要了。很多人会在抖音直播间、淘宝等平台购买提示词，这些提示词被称之为 "20元一套魔法书" ，因为它们能够帮助人们轻松地创作出高质量的内容。

我曾经使用过很多绘画软件，发现不同的软件提示词库也各不相同，甚至有些敏感词还会被过滤。我记得有一次，我想用一个词来形容黑人，但是我的词汇量不够，只知道"black human"和"negro"这两个词。然而，系统却将我的提示词标为红色，提醒我删掉（因为最后提示词要展示出来给其他用户参考）。于是，我开始在Google上搜索如何不冒犯黑人群体的方式来称呼他们。

我相信很多人也有过和我类似的经历，有同样经历的举个手。

反观DragGAN，一个所想及所得，使得生成图像过程变得简单高效。

它合成符合用户需求的视觉内容通常需要对生成物体的姿势、形状、表情和布局具备灵活精确的可控性。现有的方法通过手动注释的训练数据或先前的3D模型获得生成对抗网络（GANs）的可控性，这些方法通常缺乏灵活性、精度和通用性。在这项工作中，我们研究了一种强大但很少被探索的控制GANs的方式，即以用户交互的方式“拖动”图像中的任何点以精确地达到目标点，如图1所示。

为了实现这一点，DragGAN由两个主要组件组成，包括：

1 基于特征的运动监督，驱动手柄点向目标位置移动
2 一种新的点跟踪方法，利用辨别式GAN特征来不断定位手柄点的位置。

通过DragGAN，任何人都可以通过精确控制像素位置来扭曲图像，从而操纵动物、汽车、人类、景观等各种类别的姿势、形状、表情和布局。由于这些操作是在GAN的学习生成图像流形上进行的，它们往往可以产生逼真的输出，即使在具有挑战性的场景下，如幻觉遮挡内容和变形的形状始终遵循对象的刚性。定性和定量比较都表明，DragGAN在图像操作和点跟踪任务上优于先前的方法。我们还展示了通过GAN反演对真实图像进行操作的能力。

DragGAN搞钱思路

DragGAN即将开源，目前有体验版本。

1、开源后可以搭建DranGAN网站收费创作。

缺点：不要以为开源后搭建网站很简单，他对显卡的要求可不低。

2、降低原创图片再创作难度。

上问说了Stable Diffusion的各种魔法提示词和盲盒式生成图片，有很大的变动性。
使用DragGAN前可先到各种图片网站批量下载精美图片，再简单的拖拽即可生成没有版权的图片。

缺点：我想不出。

本地部署

下载并安装Miniconda
https://docs.conda.io/en/latest/miniconda.html
打开 Anaconda Powershell Prompt (miniconda3)
输入指令，创建 draggan环境

conda create -n draggan python=3.7

提示是否继续的时候输入 y 即可继续。
输入conda activate draggan，激活环境
安装 PyTorch（指令二选1，适合windows系统）

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117

conda install pytorch torchvision torchaudio pytorch-cuda=11.7 -c pytorch -c nvidia

CPU运行指令（无显卡用户使用）

pip3 install torch torchvision torchaudio

7.安装 DragGAN

pip install draggan

8.运行 DragGAN

python -m draggan.web

python -m draggan.web --device cpu （无显卡命令）

🔹 官方安装教程：
https://zeqiang-lai.github.io/blog/posts/ai/drag_gan/

🔹 Colab安装程序
https://huggingface.co/spaces/radames/UserControllableLT-Latent-Transformer

🔹 Huggingface Demo
https://github.com/camenduru/DragGAN-colab

DragGAN作者简介

Xingang Pan（潘新钢）

南洋理工大学计算机科学与工程学院MMLab@NTU的助理教授。在加入NTU之前，曾在Max Planck信息学研究所担任博士后研究员，由Christian Theobalt教授指导。于2021年在香港中文大学多媒体实验室获得博士学位，导师为唐小强教授。在博士期间，与罗平教授和罗翔宇教授保持密切合作。于2016年获得清华大学的学士学位。

作者官方网页：
https://xingangpan.github.io/

ChatGPT镜像链接

广告时间，对于使用原版ChatGPT有难度的读者，ChatGPT国内镜像是你不错得选择，

关注公众号，发送 ChatGPT镜像获取镜像连接。