推荐几个好玩的AI算法,太逗了!
2022 年的 CVPR 论文在月初就放榜了,共有 2067 篇论文被接收。
今天,给大家介绍几个,其中刚刚开源的几个好玩算法。
DualStyleGAN
高分辨率的肖像风格迁移算法DualStyleGAN
。
给定一张真人图片A
:

再给一张图片B
,就是要变换的风格:

算法会将图片A
根据图片B
的风格进行风格迁移,生成图片C
:

这个效果还不错吧?
这样我们就可以根据自己喜欢的动漫角色,对自己的肖像进行风格迁移了。
一起看下更多的算法效果:




第一列原始图像,第二列参考的风格,第三列算法生成的效果。
这个算法,可以应用到一些有头像需求的场景,提供用户一些可选的漫画风格,生成自己喜欢的肖像。
DualStyleGAN
算法刚刚开源,已获得近300
的star。

项目地址:
https://github.com/williamyang1991/DualStyleGAN
算法运行官方提供了三种方法。
没有任何编程基础的小伙伴,可以体验 Web 网页。

https://huggingface.co/spaces/hysts/DualStyleGAN
上传图片即可体验。
另外两种就是 Colab 环境和本地搭建。
Colab 不需要自己安装一些第三方依赖,有“梯子”可以直接打开运行。
https://colab.research.google.com/github/williamyang1991/DualStyleGAN/blob/master/notebooks/inference_playground.ipynb
想本地测试的小伙伴也可以本地部署,官方提供了 Conda 的环境,直接创建一个虚拟环境即可。
conda env create -f ./environment/dualstylegan_env.yaml
详细的内容,各位小伙伴直接看README
吧。
最后再放一组惊艳的效果。

RQ-VAE Transformer
经常看我文章的小伙伴,应该看过我写的 NÜWA(女娲)、DALL-E 算法。
今天要介绍的算法RQ-VAE Transformer
在文字转图片任务上效果更好。
任务就是根据一段文字描述,生成对应描述的图片。
比如:
A cheeseburger in front of a mountain range covered with snow.
雪山前的芝士汉堡。

算法根据我们的文字描述,生成对应的图片。
再比如:
a cherry blossom tree on the blue ocean.
蓝色海洋上盛开的樱花树。

算法主要分为两个阶段:RQ-VAE 和 RQ-Transformer。

前者负责编码,后者负责生成。
算法也是刚刚开源:

项目地址:
https://github.com/kakaobrain/rq-vae-transformer
本项目只支持本地环境,第三方库可以直接根据requirements
进行安装。
pip install -r requirements.txt
大家可以去体验下,有些效果挺有意思。

VFD
DeepFake 换脸技术越来越多。
换脸的图片和视频都太逼真了,有时候肉眼很难判断。
VFD
通过技术手段,可以帮助我们分析图片的真假。

它也是 2022 年的 CVPR,刚刚开源。
至于效果,大家就自行测试吧。
项目地址:
https://github.com/xaCheng1996/VFD
絮叨
从 2022 年的 CVPR 来看,3D 重建相关的,还有 Transformer 的内容,一直挺多。
后面看情况再分享一些 3D 重建的吧。
本文有用的话,来个赞喽~
推荐阅读:
入门: 最全的零基础学Python的问题 | 零基础学了8个月的Python | 实战项目 |学Python就是这条捷径
干货:爬取豆瓣短评,电影《后来的我们》 | 38年NBA最佳球员分析 | 从万众期待到口碑扑街!唐探3令人失望 | 笑看新倚天屠龙记 | 灯谜答题王 |用Python做个海量小姐姐素描图 |碟中谍这么火,我用机器学习做个迷你推荐系统电影
趣味:弹球游戏 | 九宫格 | 漂亮的花 | 两百行Python《天天酷跑》游戏!
AI: 会做诗的机器人 | 给图片上色 | 预测收入 | 碟中谍这么火,我用机器学习做个迷你推荐系统电影
小工具: Pdf转Word,轻松搞定表格和水印! | 一键把html网页保存为pdf!| 再见PDF提取收费! | 用90行代码打造最强PDF转换器,word、PPT、excel、markdown、html一键转换 | 制作一款钉钉低价机票提示器! |60行代码做了一个语音壁纸切换器天天看小姐姐!|
年度爆款文案
点阅读原文,看原创200个趣味案例!