[经验]

KGB知识图谱基于传统知识工程的突破分析

张宝

2019-10-22 15:25:56

3123 知识图谱

知识图谱本质上是一种大规模的语义网络。从2012年谷歌提出知识图谱，知识图谱一直在快速发展，其应用也不再局限于“语义网络”范畴。

现如今的知识图谱在实际应用中，主要作为大数据时代的知识工程出现。和传统的知识图谱工程相比，其使用效果主要是受到其数据规模的影响。大数据时代，受益于海量数据、强大的计算能力和群智计算，知识图谱能够自动构建大规模、高质量的知识库，从知识规模的量带来质的改变。

互联网时代的数据分析存在一些特有特点：1. 数据规模巨大，个体之间差异带来了巨大的差异性数据 2. 数据的精度不高，数据分析需要大量数据

在对这种互联网海量差异性数据进行处理时，传统的知识图谱工程弊端也凸显出来。传统知识库构建主要依靠人工构建、代价高昂、规模有限，投入极大且效率不高。同时，传统知识图谱不具有深度知识结构，无法解决专业的业务问题。互联网时代急需自动化、智能化构建行业知识图谱的工具，将专业领域知识赋予机器，让机器代替业务人员从事简单知识工作，实现重复性、基础性劳动的智能化过程，进而适应互联网时代的大规模开放应用的需求。

在发挥处理海量差异性数据优势方面，KGB知识图谱功能很好的发挥了大数据时代的知识图谱构建优势，能够实现以下几种功能：

1. 文档解析： KGB知识图谱引擎，可轻松解析多种格式与版本文档：TXT、DOC、EXCEL、PPT、PDF、XML等。尤其是PDF文件，可直接解析输出为word格式文件，保留文件中表格与文字格式等重要信息。对于图片信息，OCR可自动识别并抽取图片中的文字信息。

2. 知识抽取：KGB知识图谱引擎，可从结构化表格与非结构化文本中自适应识别并抽取关键知识（主体、客体、时间、地点、金额、条款等），准确率高达90%，实现知识的快速生成。

3. 知识关联：KGB知识图谱引擎深入挖掘知识关联，将一个个知识实体链接为具有完整意义的知识事实。并具有强大的知识推理能力，推理出暗含的知识与结论，丰富知识图谱。

4. 知识较验：KGB知识图谱加工厂能够对知识质量智能校验，包括对多种知识错误与冲突进行自动智能核查与修正，更有知识工程师进行知识精准校验，保证知识图谱的准确性。

在实现对专业性较强的数据进行处理方面，KGB知识图谱兼具以下特色：

1、跨领域可扩展：知识图谱加工厂具有通用的图谱构建引擎。知识抽取、知识关联与质量核查过程不依赖特定业务知识，结合用户知识图谱构建的需求，可以快速构建用户领域知识图谱。

2、知识质量智能核查：知识图谱加工厂实现对多种知识错误与冲突的智能核查与校验，并对知识库进行实时自动更新，保证知识图谱准确性。

3、人机结合的服务：知识图谱加工场人机构成：90%机器+10%的人工，只需要提供语料，就可以快速得到对应的知识图谱构建成果。