如何用谷歌技术分析川普家族关系?
共 3008字,需浏览 7分钟
·
2020-08-26 22:50
本文为知识图谱领域相关文章,共计3个部分:
知识图谱的起源 知识图谱的现状 知识图谱的应用场景
1 知识图谱的起源
我最早了解到知识图谱的起源就是Google,知识图谱是2012年加入Google搜索,2012年5月16日正式发布,但什么时候开始有了知识图谱的构思和开始研发的并没有对外公布,也没有去追究这件事情,因为没啥意义。
那么在Google,知识图谱解决了什么问题呢?
我们都知道Google是一个搜索公司,那么在Google,知识图谱是Google的一个知识库,其使用语义检索[1]从多种来源收集信息,以提高Google搜索的质量。
那么知识图谱怎么就提高了搜索的质量呢?
我们经常使用搜索引擎的方式就是关键字搜索。当使用一个句子进行搜索的时候,搜索引擎还是会把这个句子进行词的切割然后再进行搜索。
使用关键字搜索的时候就面临了一个问题:每当搜索完结果时,我们总是需要跳转到其他页面,浏览信息后再进行数据的汇总
。
那么知识图谱就解决了分散的信息结构化的问题,使得我们搜索后可以一目了然的看到我们想要的关键信息。
注意:即使在今天,也不是所有的信息都能够很好的结构化,目前在人物关系的处理上是比较优秀的。
比如我们搜索了:特朗普
在搜索引擎的左侧展示了特朗普相关的新闻,而在搜索引擎的右侧就帮助我们汇聚了来自于不同网站的信息,信息中展示了特朗普家庭关系、个人属性。
这就解释了知识图谱在搜索引擎中的部分应用场景,这个场景就解决了信息的汇聚问题,我们不用再跳转到其他页面上去浏览信息并且进行数据汇总的工作了。
2 知识图谱的现状
目前国内工业界的知识图谱的应用普及并不是非常的广泛,大部分的圈外人士[2]对于知识图谱的理解也仅仅认为它是人工智能的一个应用方向。
目前应用的比较深入的公司还是那些大厂,比如百度、阿里、腾讯等比较知名的互联网公司都有专门从事知识图谱项目开发的部门,甚至就叫知识图谱部。
但很多的中小规模公司还不知道如何落地。甚至于很多公司的应用步骤仅仅是
梳理业务 构建图关系 选用图数据库(一般是Neo4j) 自动生成Cypher 返回查询结果
这样非常粗糙的使用方法(甚至于部分大公司都在这样用,这里就不点名了,你知道有就好,我把这个字弄的小一点)。
目前知识图谱工程师的从业者并不多,但市场需求却很大。但企业有时也把握不好知识图谱工程师所应该具备的技术,这一点从招聘要求上就可以看出来。总之目前现状是我们都知道这个东西有用,大家都想用,但不知道咋用
。
网上大量的文章去讲解知识图谱的实现步骤基本上就三步:
知识抽取:讲一下结构化、半结构化、非结构化数据中如何获取知识 数据融合:讲一下不同数据源获取的知识进行融合构建数据之间的关联 知识应用:讲点知识谱图相关的算法,比如路径查找、中心度、社区发现等
你会发现,你读了这些文章,意思也都明白,但是还是不知道怎么用。读了这篇文章后,其实也还是不知道怎么用,因为这涉及到工程及算法的综合落地,不是三言两语可以讲清楚的。我会讲一节公开课,免费的,跟你以聊天的方式聊聊落地的话题。
3 知识图谱的应用场景
知识图谱的应用场景很多,除了上边我们提到过的搜索场景外,我们再来看一看有哪些应用场景。
3.1 互联网金融
有同学之前来过贪心学院[3]上过知识图谱的公开课,可能了解过这是一个我最擅长的场景,因为这个场景中,我和我的团队是国内落地非常早的一个场景。
在互联网金融场景中,知识图谱可被应用于实时风控和风控策略优化等多个业务环节,全面覆盖了贷前、贷中和贷后。
上边提到过的社区发现算法可应用于发现团伙欺诈,做过金融的同学都知道,对于一个金融机构最大的欺诈风险恰恰来源于团伙欺诈,而个体风险更多来源于逾期风险
3.2 电商
国内的电商公司以阿里巴巴为代表,京东、拼多多等也有很重的市场份额,但技术方面以阿里巴巴为首,谁赞成谁反对?
如果你反对,那么也反对无效。阿里搜索推荐部正在使用电商知识图谱AliCoCo[4]为广大用户提供着更加便捷和人性化的商品服务,在文章中详细的讲解了AliCoCo的四个部分:
电商概念层(E-commerce Concepts) 原子概念层(Primitive Concepts) 分类体系(Taxonomy) 商品层 (Items)
如果你正在做知识图谱的项目可以去阅读了解一下,如果还没有做,但想做暂时不建议阅读,毕竟是一篇文章,不是体系化的知识,可以起到启发的作用,但起不到系统学习的作用。
3.3 在线教育
疫情,使得在线教育的发展进入了快速崛起期,别的公司不了解,但贪心学院正在落地知识图谱技术在在线教育场景的应用,正在为打造科技类在线教育公司而努力。
贪心学院打造教育知识图谱,构建了底层原子性的知识网络,为用户提供个性化的教育场景。
3.4 公安
我在网上找了一张图片,下图这样的相信你看到这张图片一下就能反应出来我们经常在电影中看到的警察破案时,在墙上钉上了各种人物的照片,用笔画了他们之间的关系,这样能够帮助他们梳理出更清晰的破案线索,分析作案动机。
其实并不是只有电影中这样做,在真实的公安系统中,也存在知识图谱技术的应用,这个场景里主要也是构建了人与人之间的关系,其目的就是刚刚说过的为破案提供线索、梳理关系、分析动机,进而还原真相。
3.5 互联网公司
比如天眼查、企查查等公司,使用知识图谱技术构建了公司、人物、股权等实体之间的关系,为个人和企业提供了一个深入了解各企业状况的一个渠道。
除了以上场景其实知识图谱还在下边的场景中默默的发挥着作用:
医疗领域 法律领域 证券领域 ......
不知道你是不是正在从事上边的任一行业中,以上内容为知识图谱的泛泛而谈,我会准备一次公开课,目的是想跟大家探讨一下知识图谱在各公司的应用场景,推进知识图谱在各行业中的落地,把我的经验和大家的经验一起交流。
如果你是后端开发工程师,建议你过来听一听,因为这会打开你的视角,为你后续的职业发展提供一条崭新的道路。
如果你是知识图谱算法工程师,建议你过来听一听,因为通过本次公开课你会明白你应该跟知识图谱的算法在整个项目和工程中的位置,能够让你纵览全局。
如果你是大数据工程师,建议你过来听一听,很多AI方向的应用离不开大数据的支持,大数据跟知识图谱之间到底有哪些关系,除此之外你还会了解更多大数据的应用都有哪些方向,它不仅仅是数据仓库的建设和数据平台的搭建。
以上3个岗位是跟知识图谱比较近的岗位,在工业落地时工作交集比较多的,如果其他岗位的同学,想要了解到底什么是知识图谱也可以过来交流一下。我会以我曾经是如何落地知识图谱项目的全流程来讲解我是如何应用知识图谱的。
扫描下方二维码,一起来交流吧。
???
参考资料
语义检索: https://zh.wikipedia.org/wiki/%E8%AF%AD%E4%B9%89%E6%A3%80%E7%B4%A2
[2]圈外人士: 还未从事知识图谱工程师的技术人员
[3]贪心学院: https://www.greedyai.com
[4]AliCoCo: https://developer.aliyun.com/article/754652