AI识图能有多野？-轻识

这个世界，网友们总有办法在科技产品里找到欢乐。

比如，很久以来他们就发现百度识图、搜狗识图等工具能搜出惊人结果。

看看这两个“大发现”感受一下。

百度搜图认为PS5游戏机是四方形钻石彩色马桶。

百度识图认为某部日漫是赵本山小品。

是不是感觉匪夷所思？

一时间，你找不到两者的联系；几小时后，又觉得它们好像也有些关联（PS5的配色确实有点儿神似马桶）。

最后，你会心一笑，明白AI早已看透了一切。

这时候，识图工具调皮的一面清晰展现在世人面前。

01.

识图工具一般情况下是能够准确运行的。

当你往百度、搜狗的搜索栏里上传一张图片，它们迅速解开你的疑惑，告诉你这是什么花，什么树。

为此人们对它大加赞赏。

后来把它们用到动物识别上时，人们才明白过来，复制粘贴并不那么容易。

有网友用百度识图扫描了大熊猫的图片，结果软件把大熊猫识别成哈士奇。

其实问题很严重。

试想一下，大熊猫体制内的待遇被取消，它无法好吃懒做了，那还愿意当国宝吗？

这事搁谁谁也不乐意。

开心的唯有哈士奇，它将接受更多的万千宠爱。

狗狗占便宜也不是一次两次了。

某相机的AI照相把猫看作了狗。

换个角度也是如此。换个姿势也是如此。

换个品牌的手机也是如此。

视觉世界的复杂性由此清晰可见，一张图片中通常有百万个像素点，对于AI来说就存在大量会被像素修改而影响的特征，人类看不到，但是AI可能被干扰。

科学研究的结论也往往是积累经验，慢慢克服。

可这也带来一个问题。

既然猫狗之间的识别区分会成为难题，那么为什么更多的是把猫当狗，而不是把狗当猫。

要知道，后者的情况少之又少。

甚至比把猫咪识别成大熊猫的情况还少。

一言以蔽之，在AI的视角下，狗狗成了最大赢家，猫咪成了最大输家。

当然，识图工具也在制造动物界的其他矛盾。

在物种之间张冠李戴，算是一种地地道道的“body shame”了。

其实这还不是羞耻的。

有人在浴室里发现了一只虫子，爬行速度缓慢，可惜不知道它的学名。

于是，他用起了识图工具。

没想到，搜狗识图把虫子图识别成色情图片，并遮挡了它的肉体。

可想而知，这种生硬打码的方式让虫子特别难堪。

化用本山大叔在小品里的台词就是：

“丢不丢人啊，丢不丢虫啊，同行怎么看它？蚂蚱怎么看它？螳螂怎么看？蛐蛐怎么看？今后在文艺界怎么混？”

与之同等级伤害的，估计要算把人当做狗了。

02.

从植物识别到动物识别，AI迈了一步，但这步并不轻松。

而从动物识别再跨越至人物识别，挑战更多，这就意味着AI的表现更狂野。

如果说，AI把漂亮姐姐识别成朱一龙，把美丽女士识别成马云，算有些夸张了。

那么，把小女孩悲伤表情识别成杨颖，真的算非常离谱了。

我们很难找到其中的共同点的。

就像洋葱和塑料假花两个事物，你我又能从中看透什么呢？

而且这也不是单次的意外，有人用网页版刷出来的效果是这样，有人用百度App扫出来的效果也是如此。

那么我们就有理由怀疑，她们本质上都让人感到欲哭无泪，所以AI将她们捆绑在一起。

同样，把马保国识别成李小龙，算是调侃手法了。

同样，还有将赞多识别成小栗旬的。

还有将女演员识别成男演员任嘉伦的。

没有统一的标准，没有基本的规律，奇葩的识别效果呈现出来的一刻，人们无不捧腹大笑。

只要心放得够宽，便能迎接一大波的梦幻联动场面。

表情包、懒羊羊与韩国明星的三元联动。

嫪毐与西方绘画艺术的二元联动。

没有人的想象力能在这样的场面上把持得住。

试图去解开其中的逻辑关联，不啻去破解数学难题。

何苦呢？

而且，这还没完。

把狗狗当做杨幂，又是怎么回事？

或许是表情包的应用更容易让明星们增加粉丝数量。

所以如何营造更广泛的传播机制成了明星们关注的重要话题。

毕竟人的力量是有限的，智能机器的力量却是无穷尽的，于是，连语文课本封面被AI看成是蔡徐坤了。

到这个时候，之前很多关于智能识图的科学研究显得不太可靠了。

它们可以解读出猫狗识别的常见问题，却没有给这些问题提供答案上的启发。

我们只能寄希望于人为解读了，哪怕是过度解读。

比如，因为参加过《奔跑吧，兄弟》，因为对曼联足球队情有独钟，因为参加了很多运动公益活动，所以大数据下，“鹿晗”可能与“跑”标签存在关联。

但是直接将塑胶跑道认作是鹿晗本人，怎么看都有背后的推手在。

一个是物，一个是人，相隔了不少的物理界限。

或许只能说互联网帮助突破了想象的边界。

互联网深入千家万户后，粉丝期待自家明星在互联网上格外出圈，永不掉落出热榜。

他们频繁操作，为明星刷出流量来，因此那些图在AI看来有了一个标签，大量堆积的话，图就成为了明星本人。

哲学上来说，不过是明星的再次物化罢了。

如果是这样的逻辑的话，我们完全可以相信，在未来更强盛的流量明星机制下：

一张白纸可能暗示了某位一尘不染形象的明星；

一颗牛肉丸可能会被认作是某位扎过丸子头发型的明星；

一些圆圆圈圈的画可能被识别成会打球踢球的明星。

想想都有些刺激。

那么真的会这样吗？

03.

我试了试。

语文课文封面就是语文课文封面，马保国就是马保国，狗狗表情包就是表情包。

并没有大规模出现上述诡异场面。

即使测测新图也是如此。

从电视剧的截图，从比赛的抓拍里，AI都能将人物识别出来。

这时候，科技作为人身体的延长的功能就淋漓尽致地展现了出来。

因为人的身体是有局限性的，比如人眼辨认有时候不那么精准。

像雷军这样的老板，甚至能难倒一些新闻媒体工作者，让他们以为是周鸿祎。

但在AI的眼里，那就是分分钟的事。

而且，我能用多种方式识别出来。

估计是现在的技术越来越精确的原因。

上文的一些图能那么奇葩和搞笑，很大程度上是因为几年前的技术并不怎么完善，随着时间的沉淀，它们才越来越先进。

当然在我使用的过程中同样出现了一些小插曲。

比如人物识别里出现了土猪品种推荐。

比如“压力不大的从业者”下面的面相分析是“工作表现奋斗努力，吃苦耐劳，能成大事”。

虽然里面不乏幽默和讽刺，但总归在相关性上比之前好太多了。

对于普通人来说，实在不想遇到那么悬疑和烧脑的问题了。

另一方面，也说明科技应用到生活上的水平越来越高了。

04.

识图的作用有时候就是不容小觑的。

2019年6月，贵州“孤儿院儿童疑被性侵”的消息在网络中流传，说幼儿园孤儿院被重金贿赂，发生性侵幼儿的事情。

由于非常对互联网热度的胃口，导致许多人没怎么了解事情真相之前就进行了转发。

但并不是所有网友们听风就是雨，他们使用AI识图工具进行鉴别，几秒钟就找到了相似图。

原来热点新闻里的图是从网上盗用的。

果不其然，经调查，这就是谣言。

在这个过程中，令人感到欣喜的是，由于AI识图的便利性，不少普通网友随手就识破了谣言。

这一招也被很多人用来打击抄袭。

他们用AI识图保护原创。

这一招也被很多人用来识别对象出轨与否。

好让自己远离人渣。

这一招也被很多人用来抵御杀猪盘的侵害。

小红书等网站上已经形成了防诈骗教程，帮助更多人保护自己。

所有这些维护自己利益的方式都很快捷、高效。

虽说科技是中性的，但当你遭到伤害的时候，它们无形之中帮你保留住一丝丝的温暖。

也许这算是科技的一种风度。

05.

2018年，刘慈欣获得克拉克想象力贡献社会奖，演讲中，他说：

“周围的世界变得越来越像科幻小说了，这种进程还在飞快地加速，未来像盛夏的大雨，在我们还不及撑开伞时就扑面而来。”

其实想想，如果未来真像大雨一样扑面而来，会是一件很爽的事情。

往短了想一想，像上面那些很夸张的AI搜索结果会避免，毕竟最严重的搜图事故，往往都是由AI缺乏经验造成的。

往长了想一想，等各种AI技术完全成熟以后，可能未来生活形式与知识获取方式会发生质的改变，要知道现在应用设计为了各种现实限制而做了很多妥协。

那么，到时候会不会街上皆是AR穿戴设备，你随便戴上一个就可以开启识物的模式？

再进一步，会不会你手指点点某物，眼前就能出现它的各种信息？

无论如何，都将完全改变我们现在的知识信息获取格局。

你我推开秘门，目睹的就是新世界。

十年前，用计算机来区分猫和狗被认为几乎不可能。

而如今，视觉识别的准确率已超99%。

再进一步看来。

十年前，基本还没有手机互联网。

三十年前，互联网是个稀缺的东西；

一百年前，电灯没法为千家万户所高频使用；

一百五十年前，还没有汽车，马车往往是当时最便捷的交通工具了。

科技，作为第一生产力的科技正在改变这一切，将使许多人的人生更加便捷和智能。

至少自动驾驶的刹车刹得更可靠一些，至少癌症检测更精准一些。

更远的未来，曾经科幻片里的场景也能实现，或者，打个响指，飞来一块机器，就可以载人出行，对人进行体检，为人准备三餐，等等。

无论如何，未来在变得越来越好，更多的可能在向我们热情地招手。

而我们所能做的，开开心心，快快乐乐，多活几年，最好活个上百岁，以便看看七八十年后，人类文明可以进展到什么地步。

要真正发展AI技术，半导体芯片的研发可少不了，所以半导体基金也是个新的投资方向（Apple友情提醒：投资有风险入市需谨慎）。

点击阅读原文，或者长按下方二维码了解

↓戳这里，立即上车