互联网时代的数据分析存在一些特有特点:1. 数据规模巨大,个体之间差异带来了巨大的差异性数据 2. 数据的精度不高,数据分析需要大量数据
在对这种互联网海量差异性数据进行处理时,传统的知识图谱工程弊端也凸显出来。传统知识库构建主要依靠人工构建、代价高昂、规模有限,投入极大且效率不高。同时,传统知识图谱不具有深度知识结构,无法解决专业的业务问题。互联网时代急需自动化、智能化构建行业知识图谱的工具 ,将专业领域知识赋予机器,让机器代替业务人员从事简单知识工作,实现重复性、基础性劳动的智能化过程,进而适应互联网时代的大规模开放应用的需求。
在发挥处理海量差异性数据优势方面,KGB知识图谱功能很好的发挥了大数据时代的知识图谱构建优势,能够实现以下几种功能:
1. 文档解析: KGB知识图谱引擎,可轻松解析多种格式与版本文档:TXT、DOC、EXCEL、PPT、PDF、XML等。尤其是PDF文件,可直接解析输出为word格式文件,保留文件中表格与文字格式等重要信息。对于图片信息,OCR可自动识别并抽取图片中的文字信息。
2. 知识抽取:KGB知识图谱引擎,可从结构化表格与非结构化文本中自适应识别并抽取关键知识(主体、客体、时间、地点、金额、条款等),准确率高达90%,实现知识的快速生成。
3. 知识关联:KGB知识图谱引擎深入挖掘知识关联,将一个个知识实体链接为具有完整意义的知识事实。并具有强大的知识推理能力,推理出暗含的知识与结论,丰富知识图谱。
4. 知识较验:KGB知识图谱加工厂能够对知识质量智能校验,包括对多种知识错误与冲突进行自动智能核查与修正,更有知识工程师进行知识精准校验,保证知识图谱的准确性。
在实现对专业性较强的数据进行处理方面,KGB知识图谱兼具以下特色:
1、跨领域可扩展:知识图谱加工厂具有通用的图谱构建引擎。知识抽取、知识关联与质量核查过程不依赖特定业务知识,结合用户知识图谱构建的需求,可以快速构建用户领域知识图谱。
2、知识质量智能核查:知识图谱加工厂实现对多种知识错误与冲突的智能核查与校验,并对知识库进行实时自动更新,保证知识图谱准确性。
3、人机结合的服务:知识图谱加工场人机构成:90%机器+10%的人工,只需要提供语料,就可以快速得到对应的知识图谱构建成果。