1、如何进行图谱构建呢?
构建挑战
知识图谱是真实世界的语义表示,其基本组成单位是“实体-关系-实体”,“实体-属性-属性值”的三元组(Triplet),实体之间通过关系相互联结,从而构成语义网络。图谱构建中会面临较大的挑战,但构建之后,可在数据分析、推荐计算、可解释性等多个场景中展现出丰富的应用价值。
其中,构建挑战包括:
Schema 难定义。目前尚无统一成熟的本体构建流程,且特定领域本体定义通常需专家参与;
数据类型异构。通常情况下,一个知识图谱构建中面对的数据源不会是单一类型,面对结构各异的数据,知识转模及挖掘的难度较高;
依赖专业知识。领域知识图谱通常依赖较强的专业知识,例如车型对应的维修方法,涉及机械、电工、材料、力学等多个领域知识,且此类关系对于准确度的要求较高,需要保证知识足够正确;
数据质量无保证。挖掘或抽取信息需要知识融合或人工校验,才能作为知识助力下游应用。
构建后将获得的收益:
知识图谱统一知识表示。通过整合多源异构数据,形成统一视图;
语义信息丰富。通过关系推理可以发现新关系边,获得更丰富的语义信息;
可解释性强。显式的推理路径对比深度学习结果具有更强的解释性;
高质量且能不断积累。根据业务场景设计合理的知识存储方案,实现知识更新和累积。
架构设计
技术架构主要分为构建层、存储层及应用层三大层,架构图如下: