斯坦福数据挖掘教程(第3版)
本书由斯坦福大学“Web挖掘”课程的内容总结而成,主要关注极大规模数据的挖掘。书中包括分布式文件系统、相似性搜索、搜索引擎技术、频繁项集挖掘、聚类算法、广告管理及推荐系统、社会网络图挖掘和大规模机器学习等主要内容。第3 版新增了决策树、神经网络和深度学习等内容。几乎每节都有对应的习题,以此来巩固所讲解的内容。读者还可以从网上获取相关拓展资料。
1.本书第一作者Jure Leskovec为当今AI领域最知名的学者之一,在图神经网络领域取得了了不起的研究进展
2.本书第三作者Jeffrey Ullman是2020年图灵奖得主,第二作者是他的得意弟子
3.本书由国内知名NLP专家王斌、Jure实验室AI专家王达侃担纲翻译
4.本书被誉为“数据挖掘全景式入门参考书”,源自斯坦福大学公开课“CS246:海量数据挖掘”“CS224W:图机器学习”和“CS341:...
本书由斯坦福大学“Web挖掘”课程的内容总结而成,主要关注极大规模数据的挖掘。书中包括分布式文件系统、相似性搜索、搜索引擎技术、频繁项集挖掘、聚类算法、广告管理及推荐系统、社会网络图挖掘和大规模机器学习等主要内容。第3 版新增了决策树、神经网络和深度学习等内容。几乎每节都有对应的习题,以此来巩固所讲解的内容。读者还可以从网上获取相关拓展资料。
1.本书第一作者Jure Leskovec为当今AI领域最知名的学者之一,在图神经网络领域取得了了不起的研究进展
2.本书第三作者Jeffrey Ullman是2020年图灵奖得主,第二作者是他的得意弟子
3.本书由国内知名NLP专家王斌、Jure实验室AI专家王达侃担纲翻译
4.本书被誉为“数据挖掘全景式入门参考书”,源自斯坦福大学公开课“CS246:海量数据挖掘”“CS224W:图机器学习”和“CS341:项目实战课”
5.书中以海量数据挖掘和机器学习为重点,全面分析并实现了各种常用的数据挖掘算法,同时介绍了目前Web应用的许多重要话题
6.在第2版《大数据 互联网大规模数据挖掘与分布式处理(第2版)》基础上,第3版内容新增一章,专门探讨神经网络和深度学习,并扩充了社会网络分析和决策树的相关内容
7.本书配套资源丰富,包括开源英文原书PDF、PPT、视频讲解
尤雷·莱斯科夫(Jure Leskovec)
Pinterest公司首席科学家,斯坦福大学计算机科学系副教授,研究方向为大型社交和信息网络的数据挖掘。Jure是当今最知名的AI专家之一,他在图神经网络等多个研究领域取得了重大进展。他的研究成果获得了很多奖项,如Microsoft Research Faculty Fellowship、Alfred P. Sloan Fellowship和Okawa Foundation Fellowship,还获得了很多最佳论文奖,同时也被《纽约时报》《华尔街日报》《华盛顿邮报》《连线》及NBC、CBC等流行的社会媒体刊载。他还创建了斯坦福网络分析平台(SNAP)。
阿南德·拉贾拉曼(Anand Rajaraman)
数据库和Web技术领域领军者,硅谷连续创业者和风险投资人,斯坦福大学计算机科学系助理教授。自1996...
尤雷·莱斯科夫(Jure Leskovec)
Pinterest公司首席科学家,斯坦福大学计算机科学系副教授,研究方向为大型社交和信息网络的数据挖掘。Jure是当今最知名的AI专家之一,他在图神经网络等多个研究领域取得了重大进展。他的研究成果获得了很多奖项,如Microsoft Research Faculty Fellowship、Alfred P. Sloan Fellowship和Okawa Foundation Fellowship,还获得了很多最佳论文奖,同时也被《纽约时报》《华尔街日报》《华盛顿邮报》《连线》及NBC、CBC等流行的社会媒体刊载。他还创建了斯坦福网络分析平台(SNAP)。
阿南德·拉贾拉曼(Anand Rajaraman)
数据库和Web技术领域领军者,硅谷连续创业者和风险投资人,斯坦福大学计算机科学系助理教授。自1996年起创立过多家公司,这些公司先后被亚马逊、谷歌和沃尔玛集团收购,而他本人历任亚马逊技术总监、沃尔玛负责全球电子商务业务的副总裁。之后创立了风投公司Milliways Ventures和Rocketship VC,投资过Facebook、Lyft等众多公司。作为学者,他主要研究数据库系统、Web和社交媒体,他的研究论文在学术会议上获得了多个奖项,他在2012年被Fast Company杂志列入“商界最具创造力100人”。
杰弗里·大卫·厄尔曼(Jeffrey David Ullman)
计算机科学家,美国国家工程院院士,2020年图灵奖得主。早年在贝尔实验室工作,之后任教于普林斯顿大学,十年后加入斯坦福大学直至退休,一生的科研、著书和育人成果卓著。他是ACM会员,曾获SIGMOD创新奖、高德纳奖、冯诺依曼奖等多项科研大奖;合著有“龙书”《编译原理》、数据库名著《数据库系统实现》等多部经典著作;培养的多名学生已成为数据库领域的专家,其中包括谷歌联合创始人Sergey Brin,本书第二作者也是他的得意弟子。目前担任Gradiance公司CEO。
【译者简介】
王斌博士
小米AI实验室主任,NLP首席科学家。中国中文信息学会理事,《中文信息学报》编委。加入小米公司之前,是中科院研究员、博导及中科院大学教授。译有《信息检索导论》《大数据:互联网大规模数据挖掘与分布式处理》和《机器学习实战》等书。
王达侃
优刻得AI部门负责人,曾任WeWork Research & Applied Science中国区负责人,并曾在LinkedIn、Twitter和微软亚洲研究院负责AI以及大数据方向的研发工作。硕士毕业于美国斯坦福大学计算机系,本科毕业于上海交通大学ACM班。