发 帖  
经验: 积分:47
经理 苏州时代技术有限公司
江苏省 苏州市 设计开发工程
  • 0

    经理
    1.首先安装jpype 首先各种坑,jdk和python 版本位数必须一致,我用的是JPype1-py3 版本号0.5.5.2 、1.6jdk和Python3.5,win7 64位下亲测没问题。 否则死翘翘,有可能虚拟机都无法启动: # -*- coding:utf-8 -*- impo ...
  • 1

    经理
    HanLP由3部分组成:类库hanlp.jar包、模型data包、配置文件hanlp.properties,请前往项目主页下载最新版。对于非portable版,下载后,你需要编辑配置文件第一行的root指向data的父目录,方法: 1.解压hanlp-1.3.1-re ...
    来源:ARM技术论坛
  • 2

    经理
    在之前的实验中得到了不在词向量里的词与分词结果,结果有500多个词不在词向量里,解决方案就是重新分词,或再追加训练这些词到词向量里。但后者相对麻烦且目前样本量不大。我跟据词向量的作者[6]所使用的分词工具来 ...
    来源:ARM技术论坛
  • 0

    经理
    N-最短路径 是中科院分词工具NLPIR进行分词用到的一个重要算法,张华平、刘群老师在论文《基于N-最短路径方法的中文词语粗分模型》中做了比较详细的介绍。该算法算法基本思想很简单,就是给定一待处理字串,根据词典 ...
    来源:ARM技术论坛
  • 0

    经理
    如何在一段文本之中提取出相应的关键词呢? 之前我有想过用机器学习的方法来进行词法分析,但是在项目中测试时正确率不够。于是这时候便有了 HanLP-汉语言处理包 来进行提取关键词的想法。 下载:.jar .propertie ...
    来源:ARM技术论坛
  • 0

    经理
    最近一直比较忙,好多私信也没时间回复。以后要完全从CV转NLP,所以博客内容可能要作调整了。 Hanlp是最近学习的一个自然语言处理包,本篇文章将一些使用过程之中遇到的bug放到这里做一个备忘记录,有时间一并联系 ...
    来源:ARM技术论坛
  • 0

    经理
    项目结构 该项目中,.jar和data文件夹和.properties需要从官网/github下载,data文件夹下载 项目配置 修改hanlp.properties: #/Test/src/hanlp.properties: #本配置文件中的路径的根目录 #root=E:/SourceCode/ec ...
    来源:ARM技术论坛
  • 0

    经理
    最近一直比较忙,好多私信也没时间回复。以后要完全从CV转NLP,所以博客内容可能要作调整了。 Hanlp是最近学习的一个自然语言处理包,本篇文章将一些使用过程之中遇到的bug放到这里做一个备忘记录,有时间一并联系 ...
    来源:ARM技术论坛
  • 1

    经理
    HanLP是由一系列模型与算法组成的Java工具包,目标是促进自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。         HanLP能提 ...
    来源:ARM技术论坛
ta 的专栏
关闭

站长推荐 上一条 /9 下一条

返回顶部