欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

哈工大NLP处理工具pyltp安装历程

程序员文章站 2022-06-01 09:29:53
...
   这个pyltp的安装可谓艰辛,pyltp是哈工大的自然语言处理包,用于分词,词性标注,依存句法分析等工作,是目前国内最好的解析器之一。
   但是其分词等方法和模型是由C++代码编写,所以使用python调用的时候需要有VC库,也就是需要下载Visio studio,版本在2008以上,然而pyltp的版本以及之后需要下载的分词等模型版本,以及VS版本,都要一致。
   本人下载的是目前最新pyltp版本1.9版本,使用pip下载即可,之前必须安装vs,我从2008版本还是试起,直到2015版本才下载成功,不然会报错:cant find vcvarcall.bat,这个在路径C:\Program Files (x86)\Microsoft Visual Studio 14.0\VC下。有时候下载完后没有自动添加,需要手动添加环境变量。下载成功后,开始下载ltp_data模型文件。地址https://pan.baidu.com/share/link?shareid=1988562907&uk=2738088569#list/path=%2F(下载完毕后放置目录随意,使用的时候是需要手动指定目录的),0.1.9版本必须匹配3.4版本的模型,不然会报错:与C++签名不符合。
    现在pyltp就安装成功了,输入测试代码

# -*- coding: utf-8 -*-
from pyltp import SentenceSplitter
def sentence_splitter(sentence='这是一句测试分句的代码'):
    sents = SentenceSplitter.split(sentence) 
    print '\n'.join(sents)
#测试分句子
sentence_splitter()

成功~~
相关标签: python