发 帖  
经验: 积分:378
主管 苏州树云网络科技有限公司
江苏省 苏州市 技术支持
  • 发布了帖子 2019-8-7 11:47

    0

    主管 苏州树云网络科技有限公司
    本篇分享一个hanlp分词工具应用的案例,简单来说就是做一图库,让商家轻松方便的配置商品的图片,最好是可以一键完成配置的。先看一下效果图吧: 商品单个推荐效果:匹配度高的放在最前面这个想法很好,那怎么实现 ...
    来源:嵌入式技术论坛 标签: pyhanlp
  • 发布了帖子 2019-7-31 13:11

    0

    主管 苏州树云网络科技有限公司
    人名识别在HanLP中,基于角色标注识别了中国人名。首先系统利用隐马尔可夫模型标注每个词语的角色,之后利用最大模式匹配法对角色序列进行匹配,匹配上模式的即为人名。理论指导文章为:《基于角色标注的中国人名自 ...
    来源:嵌入式技术论坛 标签: hanlp
  • 发布了帖子 2019-7-17 10:39

    0

    主管 苏州树云网络科技有限公司
    Python调用hanlp的方法此前有分享过,本篇文章分享自“逍遥自在017”的博客,个别处有修改,阅读时请注意!1.首先安装jpype首先各种坑,jdk和python 版本位数必须一致,我用的是JPype1-py3 版本号0.5.5.2 、1.6jdk和 ...
  • 发布了帖子 2019-7-1 11:34

    0

    主管 苏州树云网络科技有限公司
    摘要:elasticsearch是使用比较广泛的分布式搜索引擎,es提供了一个的单字分词工具,还有一个分词插件ik使用比较广泛,hanlp是一个自然语言处理包,能更好的根据上下文的语义,人名,地名,组织机构名等来切分词Elas ...
  • 发布了帖子 2019-5-24 10:54

    0

    主管 苏州树云网络科技有限公司
    一、说明博主的配置1:window102:myeclipse3:jdk1.8备注:文章分享自贾继康的博客,博客使用的hanlp是1.6.8的版本。大家可以去下载最新的1.7版本了,也比较推荐使用最新的这个版本!二、资源获取 1、hanlp jar包获 ...
    来源:综合技术交流 标签: hanlp
  • 发布了帖子 2019-4-30 09:38

    0

    主管 苏州树云网络科技有限公司
    1.  整体思路第一步:先将中文文本进行分词,这里使用的HanLP-汉语言处理包进行中文文本分词。第二步:使用停用词表,去除分好的词中的停用词。2.  中文文本分词环境配置使用的HanLP-汉语言处理 ...
    来源:综合技术交流 标签: Java
  • 发布了帖子 2019-4-24 10:05

    0

    主管 苏州树云网络科技有限公司
    ·支持中文分词(N-最短路分词、CRF分词、索引分词、用户自定义词典、词性标注),命名实体识别(中国人名、音译人名、日本人名、地名、实体机构名识别),关键词提取,自动摘要,短语提取,拼音转换,简繁转换,文 ...
    来源:机器人论坛 标签: 自然语言
  • 发布了帖子 2019-4-22 15:53

    0

    主管 苏州树云网络科技有限公司
    基于 HanLP 的 Elasticsearch 中文分词插件,核心功能: 兼容 ES 5.x-7.x;内置词典,无需额外配置即可使用;支持用户自定义词典;支持远程词典热更新(待开发);内置多种分词模式,适合不同场景;拼音过滤器(待开 ...
    来源:机器人论坛 标签: hanlp 过滤器
  • 发布了帖子 2019-4-8 14:57

    0

    主管 苏州树云网络科技有限公司
    `上周就关于《结构化感知机标注框架的内容》已经分享了一篇《分词工具Hanlp基于感知机的中文分词框架》,本篇接上一篇内容,继续分享词性标注与命名实体识别框架的内容。词性标注训练词性标注是分词后紧接着的一个任 ...
  • 发布了帖子 2019-4-3 11:28

    0

    主管 苏州树云网络科技有限公司
    结构化感知机标注框架是一套利用感知机做序列标注任务,并且应用到中文分词、词性标注与命名实体识别这三个问题的完整在线学习框架,该框架利用1个算法解决3个问题,时自治同意的系统,同时三个任务顺序渐进,构成 ...
    来源:嵌入式技术论坛 标签: 中文分词
  • 发布了帖子 2019-3-22 09:56

    0

    主管 苏州树云网络科技有限公司
    `Hanlp1.7版本在去年下半年的时候就随大快的DKH1.6版本同时发布了,截至目前1.7大版本也更新到了1.7.1了。本篇分别就1.7.0和1.7.1中新增的功能做一个简单的汇总介绍。HanLP 是由一系列模型与算法组成的 Java 工具包 ...
    来源:嵌入式技术论坛 标签: hanlp java
  • 发布了帖子 2019-3-18 15:25

    1

    主管 苏州树云网络科技有限公司
    我们在使用hanlp词典进行分词的时候,难免会出现分词不准确的情况,原因是由于内置词典中并没有收录当前的这个词,也就是我们所说的未登录词,只要把这个词加入到内置词典中就可以解决类似问题,如何操作,下面我们 ...
  • 发布了帖子 2019-3-15 11:18

    0

    主管 苏州树云网络科技有限公司
    使用过hanlp的都知道hanlp中有许多词典,它们的格式都是非常相似的,形式都是文本文档,随时可以修改。本篇文章详细介绍了hanlp中的词典格式,以满足用户自定义的需要。基本格式词典分为词频词性词典和词频词典。1、 ...
  • 发布了帖子 2019-3-13 13:27

    0

    主管 苏州树云网络科技有限公司
    词图 词图指的是句子中所有词可能构成的图。如果一个词A的下一个词可能是B的话,那么A和B之间具有一条路径E(A,B)。一个词可能有多个后续,同时也可能有多个前驱,它们构成的图我称作词图。需要稀疏2维矩阵模型,以 ...
    来源:嵌入式技术论坛 标签: hanlp
  • 发布了帖子 2019-3-11 15:38

    0

    主管 苏州树云网络科技有限公司
    新发布1.7.0版本的hanlp自然语言处理工具包差不多已经有半年时间了,最近也是一直在整理这个新版本hanlp分词工具的相关内容。不过按照当前的整理进度,还需要一段时间再给大家详细分享整理的内容。昨天正好看到的这 ...
    来源:嵌入式技术论坛 标签: hanlp SPARK
ta 的专栏
关闭

站长推荐 上一条 /9 下一条

返回顶部