转载声明:文章来源https://zhuanlan.zhihu.com/p/344889712
人工智能技术分为感知智能和认知智能两类,当前历史阶段,人工智能还处于感知智能阶段,人工智能擅长分类和识别,但不擅长推理、分析等认知智能所包含的能力。知识图谱被称为新一代人工智能的基础设施,基于知识图谱可实现各种上层的知识应用,使机器具备推理、预测、分析等能力,对于想提供更佳用户体验和服务的产品经理来讲,了解和学习知识图谱十分必要。本篇谈谈产品经理如何入门知识图谱。
获取知识的痛点
大众通常获取知识有多种渠道来源,而且日常存在获取知识效率的问题。
拿产品经理学习知识图谱知识来讲,可以在诸如简书、知乎、DataFun阅读知识图谱文章,也可以阅读《知识图谱》相关图书,还可以向朋友请教知识图谱的实践。但由于知识图谱技术栈比较长,知识点较多,往往抓不住重点,导致入门就花费大量时间,效率是比较低的。
再拿日常办公获取内部或外部相关信息为例,有海量页面,但需要花费大量时间一个个甄别,哪个是真正需要的。
可见在获取知识方面,存在由于信息分散而导致获取效率低下的问题。
假设做市场调研,研究市场规模或发展情况,可以一键查到答案,而非拿到一堆网页再一个个浏览和互相印证,那么前者的解决方案,就可以大大提升知识获取效率。
解决以上问题的关键就是知识图谱,2012年知识图谱被谷歌引入推荐引擎中,可以根据查询关键词一键生成答案,大大提升了用户的体验和搜索效率,成功引领了技术风潮,被国内搜索引擎厂商争相效仿,也拉开了知识图谱应用的序幕。
知识图谱是什么
维基百科给知识图谱的定义是「谷歌公司用来支持从语义角度组织网络数据,从而提供智能搜索服务的知识库」。定义比较抽象,需要层层剥离。
首先需要理解什么是知识,知识是人类认知实践的成果,分为经验知识和系统科学理论。一条条结构化的知识构成知识库。
语义角度组织网络数据,则是相对于传统web链接方式组织数据方式。传统搜索引擎通过网页之间的链接组织网页之间关系,并通过关键词匹配展示哪些网页,本身并不需要对网页内容做理解,更多是从统计学角度提供搜索服务。而从语义角度组织网络数据,就需要从语义角度出发, 将网页中内容提取出语义形成一条条知识,并以语义网络形式存储知识。
到了应用层搜索的服务,搜索引擎能够从语义层理解用户意图,并将最终结果直接展示给用户,而非一堆网页,大大改善了搜索体验。
知识的表示
知识图谱中一条条知识通常表示为(实体,关系,实体)或(实体,关系,属性)。如(姚明,妻子,叶莉),(姚明,性别,男)。即知识图谱描述了实体与实体之间的关系和实体与属性之间的关系。这种表示方式既对机器友好,也便于人的理解。不同知识之间形成关联,构成知识图谱。
上例中是一个最小化知识图谱案例。谢霆锋、张柏芝、王菲为三个实体,每个实体与其他实体形成关系,每个实体自身也有一些属性。实体与实体、实体与属性之间关系,共同构成知识图谱。
从这个角度来讲,知识是认知和需要存储的内容,图谱则是如何存储知识的载体,数据库则是具体存储的实现。也即知识图谱是在数据库系统上,利用图谱这种抽象载体,表示知识这种认知内容。
知识图谱的构建
以上对知识图谱解决问题、定义及表示做了描述,在实际落地知识图谱中,则需要考虑知识图谱如何构建的问题。通常知识图谱的构建分为:知识图谱体系的构建、知识获取、知识融合、知识存储、知识推理。
知识图谱体系的构建也叫知识建模,顾名思义就是就是搭建一个抽象的框架,用于后续数据实例的填充。具体来讲,就是要定义清楚有哪些类别知识图谱,每个类别下有哪些实体、属性,并且定义清楚实体与实体,实体与属性之间的相互关系。这个阶段是需要业务人员和产品经理核心做的工作,也即通过定义需求明确所需的知识模型。
知识获取则是在知识建模的基础上,根据业务需要和知识模型框架,在结构化、半结构化、非结构化数据中,获取实体与实体、实体与属性的具体数据。在非结构化数据处理中,需要用到实体识别、实体消歧、关系提取等步骤。此阶段也需要产品经理深度参与,获得知识图谱可用的数据。
知识融合则是对不同来源、不同语言、不同结构的知识图谱做融合,从而对已有知识图谱做能力增强。
经过以上步骤,知识图谱初步构建完成,接下来则是对知识图谱做存储,通常有两种存储方式:按三元组方式一条条存储在数据库、采用图数据库做存储。
知识推理则是要解决已有知识图谱实体或属性缺失的问题, 通过推理手段补齐缺失。当然在实际的上层应用中,也可以直接应用推理能力获取结果。
知识图谱的应用
经过上面知识图谱构建和存储完成后,就可以将知识图谱应用在具体业务上了。常见的应用有搜索、问答机器人(本质也是搜索)、推荐、推理等,其本质都是利用已经构建好的知识库,快速查询生成精准的结果,从而带给终端用户更为高效便捷的体验。
通过以上内容,产品经理可以对知识图谱有个大致入门了解,如需进一步学习和深入,可入手《知识图谱》(赵军版)更为成体系的详细学习知识图谱各个知识点,加速知识图谱落地应用进程。
帖子还没人回复快来抢沙发