python分词工具使用

几款好用的分词工具,如 jieba, hanlp, synonyms
参见

  • 准确实用,7个优秀的开源中文分词库推荐
  • synonyms:中文近义词工具包

hanlp

官网:http://hanlp.com

安装

  1. pip install pyhanlp
  2. 若报错“缺少VC++组件”,则需要在 https://www.lfd.uci.edu/~gohlke/pythonlibs/ 网站找到JPype1-0.6.2-cp36-cp36m-win_amd64.whl ,点击下载,当下载地址输入pip install JPype1-0.6.3-cp36-cp36m-win_amd64.whl,再重复上一步。
    【python的java胶水(jpype1)】
  3. 若报错“No JVM shared library file (jvm.dll) found”,需要安装JDK
    【NLP第2课:中文分词利器 jieba 和 HanLP】【JDK下载】
  4. 通过hanlp --version获取hanlp路径,将hanlp-release.zip解压的文件和data放入路径中,并修改hanlp.properties的绝对路径 。
    【hanlp-release.zip下载】

参考资料

  • 通过Java调用hanlp:自然语言处理之hanlp,Python调用与构建
  • 官网:自然语言处理工具包HanLP的Python接口
  • 情感分析:pyhanlp 文本分类与情感分析

情感分析

自然语言情感分析之jieba分词

本文链接:https://my.lmcjl.com/post/2522.html

展开阅读全文

4 评论

留下您的评论.