一段涉及百度的AI秘史
全文4171字,阅读约需8分钟
作者 | Decode
来源 | 品玩
ID:pinwancool
题图 | APE图库
2013 年 3 月,Google 花费 4400 万美元收购了多伦多大学的一家初创公司 DNNResearch。
这家公司在当时不仅没有任何产品,也压根没有生产产品的计划。它只有三位员工:当时已经六十余岁的多伦多大学计算机系教授 Geoffrey Hinton,和他的两个学生 Alex Krizhevsky 和 IIya Sutskever。有人调侃,Google 花费数千万美元,只是买到了几篇论文。
但之后科技行业的发展证明了 Google 的眼光。深度学习从边缘学科一跃成为显学,而这一学派的开山祖师正是 Geoffrey Hinton。因为在深度学习上的突出贡献,他在 2018 年获得了图灵奖。Hinton成了AI领域举足轻重的人物,中国互联网也习惯于为他“封神”,称呼他为“AI教父”、“深度学习之父”等。而Google因为有了Hinton,成为AI技术最出色的公司之一。
但这场收购的细节鲜少被外界了解。事实上,Google 并不是最初“发现”Hinton的公司,最早意识到Hinton和他在深度学习上的研究价值的,其实是一家中国公司——百度。
在3月16日发布的一本新书《Genius Makers: The Mavericks Who Brought AI to Google, Facebook, and the World》(天才制造者:那些将 AI 带到 Google、Facebook 和全世界的特立独行者,下称《天才制造者》)中,《连线》杂志资深撰稿人 Cade Metz 揭开了这一段鲜为人知的“秘史”。
百度与Hinton曾接近达成协议
Cade Metz通过大量采访,还原了2012 年Hinton主导的一场拍卖。当年12 月,在美国内华达州边界的太浩湖旁,举办了每年一届的 NIPS。NIPS 全称 Neural Information Processing Systems(神经信息处理系统),是 AI 领域的顶级会议。
2012 年那一届 NIPS,对多伦多大学教授 Hinton 和他两个学生来说,意义尤为不同。他们在会议酒店的房间里,举办了一次线上拍卖会。美国科技巨头 Google 和微软,中国科技巨头百度以及英国的 AI 初创公司 DeepMind,用竞拍的方式争夺 Hinton 刚刚成立的、没有任何产品的小公司 DNNResearch。
(Geoffrey Hinton 和他的学生 Alex Krizhevsky 及 IIya Sutskever)
这些公司中,百度其实是最早接触 Hinton 的公司。
2012 年秋天,Hinton 和学生们发表了一篇长达 9 页的论文《ImageNet Classification with Deep Convolutional Neural Networks》。这篇论文提到的 Alexnet 引入了全新的深层结构和 dropout 方法,在 ImageNet 图像识别大赛中,将错误率从 25% 以上提升到了 15%,获得了第一名。
那一年的 ImageNet 比赛,Google 也在数据集上做了内部测试,也用了深度学习方法,但识别精度比 Hinton 团队差了很多。Google 拥有大多数团队无法企及的硬件和数据资源,但却输给了一个学界的团队。这让工业界感到吃惊,大大促进了深度学习的传播。
这个事情在今天来看,也是一个AI技术发展的历史性转折时刻。但当时还只有很少人意识到它的意义。而就在论文发出没几天,Hinton 收到了一封来自一名中国AI研究者的电子邮件。
这封邮件的署名为余凯。余凯2015年离开百度创办了AI芯片公司地平线,现为地平线CEO。
余凯比 Hinton 小 30 岁,两人最早在加拿大一个学术研讨会上认识。2012 年 4 月,余凯离开美国 NEC 研究院,回到中国加入百度,领导新成立的百度多媒体部。这一年,百度开始大规模采购和建立 GPU 运算集群,开发了世界上第一个支持 GPU&CPU 的并行深度学习平台。
同年 9 月,百度当时的首席科学家威廉·张离职,这家搜索巨头开始寻找更能面向未来研究的首席科学家。10 月,余凯向李彦宏介绍深度学习方面的进展,并且推荐了 Hinton。
(余凯)
当时 Hinton 远没有今天知名,但百度决策很快,李彦宏安排当时负责百度战略投资的副总裁汤和松与 Hinton 取得联系,并直接提出邀约。百度提出的方案是,出价 1200 万美元聘请 Hinton 及其学生,合约期三年。双方进展很快。
但在眼看要达成协议前,Hinton 的那两名学生“拦住”了 Hinton,在他们的建议下,Hinton意识到,与招聘“三个新员工”相比,百度和其他公司显然更可能为收购一家公司付出更可观的资金。
Hinton 问百度,自己可否评估一下其他邀约。而原本已经接近谈成的百度,同意了。
“当百度同意后,Hinton彻底颠覆了局面。”《天才制造者》的书中写到。Hinton 立刻创建了只有他和那两名学生的初创公司——DNNresearch。
据《天才制造者》的记录,Hinton 当时特意询问了一位多伦多的律师,如何能让一家只有三名员工、没有产品、几乎没有历史的初创公司的价值最大化。律师给了他两个选择:聘请专业谈判代表,但会有激怒买家的风险。或者,进行一次拍卖。
Hinton 选择了后者,于是,共有四家公司加入了竞拍:最先找到Hinton且本已接近拿下的百度,以及在百度之后也开始给Hinton家频繁打电话的Google和微软,以及一家当时刚刚成立两年的伦敦初创公司—— DeepMind。这家公司后来被 Google 所收购,研发出大名鼎鼎的 AlphaGo。
作为最早接触Hinton,以及百度在那次投标中的代表人,余凯看到事情变成百度和多家美国公司的竞争后,已经预感到了最终结局。
出价最高的百度没有赢得竞拍
Hinton 和学生们在酒店房间里“举办”了拍卖会——它通过 Gmail 进行,四家公司的高管远程出价,从加利福尼到伦敦再到北京。Hinton将每个竞拍者的身份隐藏了起来,他们相互不知道对方是谁。
微软首先对这种竞拍方式提出疑问,他们不喜欢用 Gmail 来竞拍,认为 Google 可能会偷偷读取邮件。Hinton 和学生们商量过后,依然采用这种方式,他们“相当确信 Google 不会读取 Gmail”。
Hinton 对Google的好感已经很明显。
Google 对深度学习的兴趣,很大程度也受到Hinton的影响。2006 年Hinton 发表了论文《A fast learning algorithm for deep belief nets》(深度信念网络的一种快速学习算法)。这篇论文发表之前,没有人知道怎么训练深度神经网络,因此这个领域鲜有人问津。该论文提出了一种训练深度网络的方法,对每一层网络先进行预训练,然后再微调,网络的学习速度大幅提高。
这篇论文成为开启深度学习热潮的一个因素,Google等公司开始注意到深度学习。另一个重要的因素是算力。2009 年,计算机的算力发展到足以挖掘庞大的数据库,神经网络在语言和图像识别方面,开始胜过基于逻辑的传统计算机。
Google也在那时开始投资AI。2010 年,当时还是斯坦福大学教授的吴恩达与 Google 里颇具声望的高级研究员 Jeff Dean 一起,建立一个名为 Project Marvin(以著名的 AI 先驱马文・明斯基命名)的项目,以研究神经网络。后来,一些 Google 工程师开始用 Google Brain 称呼 Project Marvin。
这个项目成果之一,是大型深度学习软件平台 DistBelief。包括 Google 搜索、Google 地图 和 YouTube 在内的 50 多个团队,利用 DistBelief 来改进产品。
2012 年,Google X 宣布建立了一个包含 16000 个计算机处理器的神经网络,并在 YouTube 上部署。这个神经网络通过学习 YouTube 上大量包含猫的、未标记的视频,识别出了“猫”这种生物。
这在当时是一个重要突破。“在训练中我们从来没有告诉过神经网络, 这是一只猫。”Jeff Dean 说,“它基本上发明了猫的概念。”
Google在这次拍卖中也势在必得。Hinton设计的拍卖规则很简单。每次竞价后,四家公司有一个小时将购买价格提高至少100万美元。这一个小时从最新竞价的邮件上的时间戳开始。一个小时结束后,如果没有人提出新的竞价,拍卖就结束了。
Hinton 每天会为下一轮竞价设定一个时间,到了指定的时间,他和学生聚集在他的房间里,看着笔记本电脑上出现的竞价。数字开始飞快攀升。
DeepMind用公司股票而非现金竞拍,因此很快就退出了。这似乎也预示了它在之后被Google收购的结局。而在价格飙到2000万美元时,微软也退出了。但它随后又回来了一次,然后再次退出。
事实上,微软在此之前已经邀请Hinton担任过顾问。
微软对深度学习的研究,依托雷德蒙德研究院展开。2009 年 11 月至 12 月期间,当时在研究院里关注深度学习的华裔科学家邓力,邀请 Hinton 为雷德蒙德研究院进行咨询,研究如何将深度学习方法应用于语音特征编码和语音识别问题。
(邓力)
此前的语音识别模型一直处于非常令人沮丧的“局部最优”状态,准确率很难大幅提升。在读过 Hinton 2006 年发表的两篇开创性的论文后,邓力产生了将深度学习引入语音识别的想法。
在 Hinton 为微软咨询期间,他和邓力一同开发了深层信念网络的方法 “食谱” 及在语音特征提取上的应用。这种方法使得大规模语音识别系统的错误率大幅减少,2011 年微软公布这一成果时,业界大为惊叹。
而邓力就是代表微软在那次拍卖中出价的那个人。
也就是说,在这个决定后来AI领域很多事情走向的历史性时刻,三个主要的直接竞价操作者中有两人是华人。
看着飞升的金额,Hinton和他的学生们不停争论他们更愿意加入哪家公司。
《天才制造者》中甚至记录了一段“迷信”的对话。一天午后,当他们望向窗外时,两架飞机从相反方向飞过,在天空中留下的烟道,就像一个巨大的X,正好在一组山峰之上。他们思索着这可能意味着什么,然后才想起 Google 的总部就在一个叫山景城的地方。“这是不是意味着我们应该加入 Google?”Hinton问道,“还是说我们不应该?”
在2200万美元左右时,Hinton暂时中止了拍卖,与其中一个竞拍者进行讨论,半小时后,微软又退出了。
最后剩下百度和Google。
随着时间推移,两家公司依然在抬高价格。余凯处理了百度最初的竞拍,但当价格达到2400万美元时,百度的一位高管从北京接手,并且愿意给出更高的价格:2500万美元、3000万美元、3500万美元。
Hinton将竞价窗口从一个小时缩短到30分钟。竞价迅速攀升到4000万美元、4100万美元、4200万美元、4300万美元。“这感觉就像我们在拍电影一样。”他说。一天晚上,接近午夜时分,当价格达到4400万美元时,他又暂停了竞价。《天才制造者》中这样记载。
第二天,在竞标恢复前约30分钟,Hinton发了一封邮件,说开始时间会推迟。大约一个小时后,他又发了一封:
拍卖结束了。
事实上,在前一天晚上的某个时刻,Hinton已经决定将他的公司卖给Google。他给百度的邮件中说,公司发送的任何其他信息都会转发给他的新雇主,不过他没有说那是谁。
《天才制造者》中写到,Hinton 后来承认,这是他一直想要的。因为对他来说,为他的研究找到合适的归宿,比获得最高竞标价格更重要。
《天才制造者》也写到,余凯猜到 Hinton 最终会在 Google,或者至少是另一家美国公司工作。毕竟他的背部不好,无法前往中国。他在十几岁时受了背伤,到五十多岁时,已经无法坐下,否则会有椎间盘滑落风险。他不得不一直站着办公,出远门也不坐飞机,因为飞机起飞降落时不允许站起来。
尽管如此,余凯还是很满意百度在竞标者中占据了一席之地。书中写道,他相信,这段经历帮助他的上级看到了他眼中的世界。通过把美国竞争对手逼到极限,百度高层已经意识到深度学习在未来几年的重要性。
Hinton 的拍卖和 NIPS 会议结束后,余凯登上了前往北京的飞机。在那里,他遇到了邓力。
他们在飞机上挑选了相邻的座位。由于竞拍者一直保持匿名,两人都不太清楚谁参与了拍卖。因为受到雇主的约束,所以都不能透露自己参与拍卖的情况。他们试图在不泄露自己秘密的情况下,了解对方所知道的事情。
“拍卖就像一把起跑枪”。《天才制造者》的书中这样写到,它把这次拍卖定义为“一场全球新的军备竞赛的开始”。在那次竞拍结束后的返程飞机上,余凯和邓力两人都知道,新的竞争已经开始了,他们的公司将不得不回应 Google 的大动作。
本文由品玩授权亿欧发布,申请文章授权请联系原出处。