pyhanlp环境搭建
# Pyhanlp安装说明
# 一. 前提补充
- **Java8(jdk1.8)**运行环境
- conda环境
# 1. Conda环境
# 1.1 什么的Conda环境?
- 许多同学搞不明白什么是Conda环境,其实很简单,你可以把它理解成一个"虚拟机",这个"虚拟机"可以创建许多个Python虚拟环境,与本地Python的环境不干扰,彼此虚拟环境也互相不干扰,且可随时切换。
- 避免和本地的Python环境发生冲突,因为Python的很多库对Python的版本要求很高,各库的版本也要求不同。
# 实际用途
当你需要用Python写一个web项目,你需要搭建一个Django或者是Flask的Python环境
当你去网上一搜,你得到了这样一个表
突然发现,自己电脑的Python版本是3.9,为了安装Django你又得把Python重装为3.8才能安装Django
然后你一重装,你之前学openCV的Python环境又没了,当你做完这个Django项目,老板又叫你写个openCV的项目,你岂不是又得傻乎乎的去装openCV的环境吗?
# 1.2 Conda下载
这是国内清华源镜像,找到对应电脑系统版本下载,下载速度较快
Anaconda和Miniconda的区别
- Anaconda是比较全面的conda环境,内置图形化操作界面,自带了许多Python的库
- Miniconda则是比较轻量级的conda环境,从名字上就能看出来是"mini"版本的Anaconda,功能和自带的库自然比Anaconda少,但是conda环境是和Anaconda一样的,如果只需要配置一个conda环境则只需要安装Miniconda更节省资源
-
至于它的安装教程下面会讲到
# 二. Windows安装方法(方法1有conda的安装和jdk的配置以及pycharm的环境配置,方法2,3就不过多解释)
# 1. 方法1
# 1.1 Windows配置conda环境
- Anaconda和Miniconda安装其一即可
# 1.1.1 windows下安装Anaconda
- 下载方式请往上看"Conda环境"
- 双击exe安装程序
- 一路"next",最好选择"Just Me",windows的用户权限管理做的不太友好,如果选择"All User" ,Anaconda有时候则需要管理员权限(root权限)才能执行使用功能,windows用户如果只有一个账户,则那个账户则默认是系统的最高管理者,即为"root"
- 这里就默认安装目录
- 一定要把上面的选项勾选,Anaconda在安装的时候可以把环境变量自动配置好,环境变量很重要,因为conda基本上都是在cmd命令行下使用,需要windows环境的支持,当然你也可以使用Anaconda的图形化界面,或者你任性可以不勾选,自己手动去配置(/擦汗),然后点击Install装载。
- 装载完成后一路"next"安装完成,这两项可以不用勾选,如果勾选了点击Finish会自动打开Anaconda的使用说明和介绍,不用理会。
安装成功测试,打开cmd 输入
conda -V
1- 出现conda版本号即为安装成功,我这里是conda 4.10.3
# 1.1.2 windows下安装Miniconda
- 方法基本上和Anaconda的安装一样,步骤和操作都是一样的。
# 1.2 Windows配置Java运行环境
# 1.2.1 jdk和jre区别
jdk是java的开发工具,jre是java的运行时环境
jdk包含jre和jvm以及java的核心类库,所以说一般我们实际开发java程序只需要配置一个jdk就够了
jre里面只有java的类库和jvm
jdk和jre都有jvm,那jvm是什么呢?jvm其实就是java的虚拟机,用来把java代码编译成class字节码文件,字节码文件可以在任意操作系统上使用。所以java就具有可移植性特点
# 1.2.2 jdk安装与配置
- 为了运行java代码其实只用安装jre就行了,但是jdk的工具包更全面,为了防止Pyhanlp调不到包,这里就安装jdk1.8,因为1.8版本更稳定
# (1) jdk下载
因为不知道从什么时候开始Oracle官网就需要注册登陆才能下载了,这里我已经下载好放在百度云盘上,提取密码2031,当然去网上自己找也行。
# (2) jdk安装
双击运行
- 一直点击下一步安装在系统盘的位置就行
安装完成后,迫不及待打开cmd输入
java -version
1
找不到文件,是因为我们还没有配置java环境变量,所以我们需要配置环境变量
# (3) jdk环境变量配置
找到java安装的目录,如果在安装的时候是默认的目录,则一般都在系统盘c盘的Program Files目录下,有个Java文件夹,以我的电脑为例,完整路径为C:\Program Files\Java
找到后打开,存在一个jdk和jre,因为之前说过jdk就包含jre
先把这个文件目录放一边,待会需要用到
桌面找到**"我的电脑"右键点击,找到"属性"**

- 点击"高级系统设置"
- 点击"环境变量"
- 我们只用关心"系统变量",用户变量权利没有系统的高
- 在系统变量里面新建一个名为"JAVA_HOME"的系统变量,变量值为步骤1中的java安装目录下jdk的地址
- 回到刚刚打开的Java安装目录,先点进jdk,然后把地址值赋值下来
- 粘贴到新建的"JAVA_HOME"的变量值,然后点击确定
- 在找到系统变量下的"Path",双击编辑
在右上角点击新建,新建两个变量"%JAVA_HOME%\bin"和"%JAVA_HOME%\jre\bin",然后确认保存
注意,一定要一直点确认来关闭所有窗口,不然会配置失败
配置成功测试,打开cmd输入
java -version
1
- 出现jdk版本号 说明配置成功。
# 1.3 正式安装Pyhanlp
根据图灵书社《自然语言处理入门》
书上说执行这行命令即可
pip install pyhanlp
1
- 报错了,原来pyhanlp不支持Python3.9的环境,我们查看一下当前Python版本,直接命令行输入python,看到果然是3.9的版本
所以我们需要降级输入命令,执行
conda install python==3.8
1
下载安装进度条走完后,我们再输入python查看Python版本
已成功降级到3.8
我们重新输入
pip install pyhanlp
1 执行
- 于是我们又遇到了这种情况,简单来解读一下,Microsoft Visual C++14.0。。。is required 被需要
- 好嘛,那咱又去下载安装 Visual C++14.0
- 安装,既然它说他缺什么什么c++咱就把Python和c++都勾上
一共8个G,等它下载吧!
等待下载'一年'后,下载完成再次输入pip install pyhanlp执行
安装成功!
测试安装命令行直接输入hanlp,正在下载中文词库,说明配置完成了
# 1.4 pycharm配置环境
- 以上操作都顺利完成后,打开pycharm
- 选择右下角的环境设置,选择Add Interpreter(添加环境)
选择Conda Environment 然后再选择 Existing environment ,即意思就是 选择添加conda环境,从已有的conda环境中选择
就选择我们刚才的"pyhanlp-learn-env",然后点击ok完成配置
如果Existing environment中没有conda环境选择,则打开命令行输入conda activate激活一下环境,在进入Pycharm里选择
至此,方法一算是安装完成,此方法算是经典的"曲线救国",选择去下载8个G大小的c++库来应对,属实是无可奈何的情况下才使用
# 2. 方法2
此方法是根据官网的教程,实时更新。
打开官网
下翻找到官网的安装教程
打开cmd 先创建一个用来学习pyhanlp的Python虚拟环境,输入命令
这里的pyhanlp-learn-env是虚拟环境的名字,可以按照个人喜好命名
conda create -n pyhanlp-learn-env
1查看创建的conda环境,再输入命令
conda env list
1base即是本机的Python虚拟环境,pyhanlp-learn-env即是刚才创建的Python虚拟环境
切换conda虚拟环境,cmd中继续输入,激活/切换 名为pyhanlp-learn-env 的conda环境
conda ativate pyhanlp-learn-env
1
输入执行完会发现cmd命令行前面会出现"(pyhanlp-learn-env)"就说明你现在正在pyhanlp-learn-env这个Python环境下
然后我们再把官网的命令复制下来,这里我打在这里
conda install -c conda-forge openjdk python=3.8 jpype1=0.7.0 -y
1复制到刚才的命令行执行,等待一会即可
下载完成后输入
pip install pyhanlp
1
- Successfully,安装完成!
- 此方法和方法一不同之处在于,方法二是使用conda创建了一个干净的环境,在用官方的命令一键安装pyhanlp所依赖的所有库,完成安装,不需要下载什么c++以及8个G的c++依赖库
# 3. 方法3
- 此方法可以说是一键式的傻瓜操作,
- 打开pyhanlp官网的github
- 看到这个文件
会使用conda的应该知道这个.yml是conda环境的打包环境,就是说在pyhanlp官网已经把pyhanlp的运行环境打包好了,我们只需要单独下载这个文件用conda运行就相当于把官网推荐的conda Python环境搬到我们电脑上了。
所以我们下载这个文件
我选择使用git工具下载,不会用git的同学可以直接下载zip,因为github暂时还不支持只单独下载一个文件,必须下载整个文件,其实这个文件夹就包含了书上的源码,可能还要比书上要好一点,因为官网的是最新版本的。
下载完成后,在当前文件夹打开cmd
在命令行输入
conda env create -f environment.yml 即使用conda运行这个文件,创建一个名字为pyhanlp-env的新环境
1
2至于为什么会是"pyhanlp-env"这个环境呢,你可以打开environment.yml看一看
- 运行命令
- 等待加载完成
测试安装是否完成
输入
conda env list
1- 查看conda的所有环境,运行完刚才的文件,就为我们创建了一个"pyhanlp-env"的conda环境
- 再输入
conda activate pyhanlp-env
1- 从base环境切换为pyhanlp-env
- 此时就别再傻乎乎的pip install pyhanlp了!!!,这个环境里面所有的库都配置好了,无需我们再手动去安装
测试
- 打开pycharm切换pycharm运行环境(方法1讲过如何切换,这里不过多解释)等待载入完成
- 打开book目录下的任意一个文件运行
- 会自动为我们下载词库
- 下载完成后
- 配置完成!
方法3只需要下载运行一个conda环境,所有的都为我们配置好了,非常简单!