AI识图能有多野?爱泡研究所共 3703字,需浏览 8分钟 ·2021-10-23 17:48 这个世界,网友们总有办法在科技产品里找到欢乐。比如,很久以来他们就发现百度识图、搜狗识图等工具能搜出惊人结果。看看这两个“大发现”感受一下。百度搜图认为PS5游戏机是四方形钻石彩色马桶。百度识图认为某部日漫是赵本山小品。是不是感觉匪夷所思?一时间,你找不到两者的联系;几小时后,又觉得它们好像也有些关联(PS5的配色确实有点儿神似马桶)。最后,你会心一笑,明白AI早已看透了一切。这时候,识图工具调皮的一面清晰展现在世人面前。01.识图工具一般情况下是能够准确运行的。当你往百度、搜狗的搜索栏里上传一张图片,它们迅速解开你的疑惑,告诉你这是什么花,什么树。为此人们对它大加赞赏。后来把它们用到动物识别上时,人们才明白过来,复制粘贴并不那么容易。有网友用百度识图扫描了大熊猫的图片,结果软件把大熊猫识别成哈士奇。其实问题很严重。试想一下,大熊猫体制内的待遇被取消,它无法好吃懒做了,那还愿意当国宝吗?这事搁谁谁也不乐意。开心的唯有哈士奇,它将接受更多的万千宠爱。狗狗占便宜也不是一次两次了。某相机的AI照相把猫看作了狗。换个角度也是如此。换个姿势也是如此。换个品牌的手机也是如此。视觉世界的复杂性由此清晰可见,一张图片中通常有百万个像素点,对于AI来说就存在大量会被像素修改而影响的特征,人类看不到,但是AI可能被干扰。科学研究的结论也往往是积累经验,慢慢克服。可这也带来一个问题。既然猫狗之间的识别区分会成为难题,那么为什么更多的是把猫当狗,而不是把狗当猫。要知道,后者的情况少之又少。甚至比把猫咪识别成大熊猫的情况还少。一言以蔽之,在AI的视角下,狗狗成了最大赢家,猫咪成了最大输家。当然,识图工具也在制造动物界的其他矛盾。在物种之间张冠李戴,算是一种地地道道的“body shame”了。其实这还不是羞耻的。有人在浴室里发现了一只虫子,爬行速度缓慢,可惜不知道它的学名。于是,他用起了识图工具。没想到,搜狗识图把虫子图识别成色情图片,并遮挡了它的肉体。可想而知,这种生硬打码的方式让虫子特别难堪。化用本山大叔在小品里的台词就是:“丢不丢人啊,丢不丢虫啊,同行怎么看它?蚂蚱怎么看它?螳螂怎么看?蛐蛐怎么看?今后在文艺界怎么混?”与之同等级伤害的,估计要算把人当做狗了。02.从植物识别到动物识别,AI迈了一步,但这步并不轻松。而从动物识别再跨越至人物识别,挑战更多,这就意味着AI的表现更狂野。如果说,AI把漂亮姐姐识别成朱一龙,把美丽女士识别成马云,算有些夸张了。那么,把小女孩悲伤表情识别成杨颖,真的算非常离谱了。我们很难找到其中的共同点的。就像洋葱和塑料假花两个事物,你我又能从中看透什么呢?而且这也不是单次的意外,有人用网页版刷出来的效果是这样,有人用百度App扫出来的效果也是如此。那么我们就有理由怀疑,她们本质上都让人感到欲哭无泪,所以AI将她们捆绑在一起。同样,把马保国识别成李小龙,算是调侃手法了。同样,还有将赞多识别成小栗旬的。还有将女演员识别成男演员任嘉伦的。没有统一的标准,没有基本的规律,奇葩的识别效果呈现出来的一刻,人们无不捧腹大笑。只要心放得够宽,便能迎接一大波的梦幻联动场面。表情包、懒羊羊与韩国明星的三元联动。嫪毐与西方绘画艺术的二元联动。没有人的想象力能在这样的场面上把持得住。试图去解开其中的逻辑关联,不啻去破解数学难题。何苦呢?而且,这还没完。把狗狗当做杨幂,又是怎么回事?或许是表情包的应用更容易让明星们增加粉丝数量。所以如何营造更广泛的传播机制成了明星们关注的重要话题。毕竟人的力量是有限的,智能机器的力量却是无穷尽的,于是,连语文课本封面被AI看成是蔡徐坤了。到这个时候,之前很多关于智能识图的科学研究显得不太可靠了。它们可以解读出猫狗识别的常见问题,却没有给这些问题提供答案上的启发。我们只能寄希望于人为解读了,哪怕是过度解读。比如,因为参加过《奔跑吧,兄弟》,因为对曼联足球队情有独钟,因为参加了很多运动公益活动,所以大数据下,“鹿晗”可能与“跑”标签存在关联。但是直接将塑胶跑道认作是鹿晗本人,怎么看都有背后的推手在。一个是物,一个是人,相隔了不少的物理界限。或许只能说互联网帮助突破了想象的边界。互联网深入千家万户后,粉丝期待自家明星在互联网上格外出圈,永不掉落出热榜。他们频繁操作,为明星刷出流量来,因此那些图在AI看来有了一个标签,大量堆积的话,图就成为了明星本人。哲学上来说,不过是明星的再次物化罢了。 如果是这样的逻辑的话,我们完全可以相信,在未来更强盛的流量明星机制下:一张白纸可能暗示了某位一尘不染形象的明星;一颗牛肉丸可能会被认作是某位扎过丸子头发型的明星;一些圆圆圈圈的画可能被识别成会打球踢球的明星。想想都有些刺激。那么真的会这样吗?03.我试了试。语文课文封面就是语文课文封面,马保国就是马保国,狗狗表情包就是表情包。并没有大规模出现上述诡异场面。即使测测新图也是如此。从电视剧的截图,从比赛的抓拍里,AI都能将人物识别出来。这时候,科技作为人身体的延长的功能就淋漓尽致地展现了出来。因为人的身体是有局限性的,比如人眼辨认有时候不那么精准。像雷军这样的老板,甚至能难倒一些新闻媒体工作者,让他们以为是周鸿祎。但在AI的眼里,那就是分分钟的事。而且,我能用多种方式识别出来。估计是现在的技术越来越精确的原因。上文的一些图能那么奇葩和搞笑,很大程度上是因为几年前的技术并不怎么完善,随着时间的沉淀,它们才越来越先进。当然在我使用的过程中同样出现了一些小插曲。比如人物识别里出现了土猪品种推荐。比如“压力不大的从业者”下面的面相分析是“工作表现奋斗努力,吃苦耐劳,能成大事”。虽然里面不乏幽默和讽刺,但总归在相关性上比之前好太多了。对于普通人来说,实在不想遇到那么悬疑和烧脑的问题了。另一方面,也说明科技应用到生活上的水平越来越高了。04.识图的作用有时候就是不容小觑的。2019年6月,贵州“孤儿院儿童疑被性侵”的消息在网络中流传,说幼儿园孤儿院被重金贿赂,发生性侵幼儿的事情。由于非常对互联网热度的胃口,导致许多人没怎么了解事情真相之前就进行了转发。但并不是所有网友们听风就是雨,他们使用AI识图工具进行鉴别,几秒钟就找到了相似图。原来热点新闻里的图是从网上盗用的。果不其然,经调查,这就是谣言。在这个过程中,令人感到欣喜的是,由于AI识图的便利性,不少普通网友随手就识破了谣言。这一招也被很多人用来打击抄袭。他们用AI识图保护原创。这一招也被很多人用来识别对象出轨与否。好让自己远离人渣。这一招也被很多人用来抵御杀猪盘的侵害。小红书等网站上已经形成了防诈骗教程,帮助更多人保护自己。所有这些维护自己利益的方式都很快捷、高效。虽说科技是中性的,但当你遭到伤害的时候,它们无形之中帮你保留住一丝丝的温暖。也许这算是科技的一种风度。05.2018年,刘慈欣获得克拉克想象力贡献社会奖,演讲中,他说: “周围的世界变得越来越像科幻小说了,这种进程还在飞快地加速,未来像盛夏的大雨,在我们还不及撑开伞时就扑面而来。”其实想想,如果未来真像大雨一样扑面而来,会是一件很爽的事情。往短了想一想,像上面那些很夸张的AI搜索结果会避免,毕竟最严重的搜图事故,往往都是由AI缺乏经验造成的。往长了想一想,等各种AI技术完全成熟以后,可能未来生活形式与知识获取方式会发生质的改变,要知道现在应用设计为了各种现实限制而做了很多妥协。那么,到时候会不会街上皆是AR穿戴设备,你随便戴上一个就可以开启识物的模式?再进一步,会不会你手指点点某物,眼前就能出现它的各种信息?无论如何,都将完全改变我们现在的知识信息获取格局。你我推开秘门,目睹的就是新世界。十年前,用计算机来区分猫和狗被认为几乎不可能。而如今,视觉识别的准确率已超99%。再进一步看来。十年前,基本还没有手机互联网。三十年前,互联网是个稀缺的东西;一百年前,电灯没法为千家万户所高频使用;一百五十年前,还没有汽车,马车往往是当时最便捷的交通工具了。科技,作为第一生产力的科技正在改变这一切,将使许多人的人生更加便捷和智能。至少自动驾驶的刹车刹得更可靠一些,至少癌症检测更精准一些。更远的未来,曾经科幻片里的场景也能实现,或者,打个响指,飞来一块机器,就可以载人出行,对人进行体检,为人准备三餐,等等。无论如何,未来在变得越来越好,更多的可能在向我们热情地招手。而我们所能做的,开开心心,快快乐乐,多活几年,最好活个上百岁,以便看看七八十年后,人类文明可以进展到什么地步。要真正发展AI技术,半导体芯片的研发可少不了,所以半导体基金也是个新的投资方向(Apple友情提醒:投资有风险 入市需谨慎)。点击阅读原文,或者长按下方二维码了解↓戳这里,立即上车 浏览 42点赞 评论 收藏 分享 手机扫一扫分享分享 举报 评论图片表情视频评价全部评论推荐 电子电路识图 : 电子电路识图 电子电路识图 : 电子电路识图 0创业能有多艰辛?程序员客栈0电子电路识图 : 电子电路识图 本书是《实用电子技术培训读本》之一,主要介绍了电子电路识图基本知识、常用电路图图形符号和文字符号、基百度识图百度识图0开塞露广告能有多硬核?!运营大叔0动态识图动态识图0动态识图动态识图0程序员的水平能有多低?程序员cxuan0果野多河南新升食品有限公司,成立于2006年,生产基地位于河南省武陟县,仟分品牌运营中心设立在郑州。 公司宇多野宇多野0点赞 评论 收藏 分享 手机扫一扫分享分享 举报