pyhanlp环境搭建
# Pyhanlp安装说明
# 一. 前提补充
- **Java8(jdk1.8)**运行环境
- conda环境
# 1. Conda环境
# 1.1 什么的Conda环境?
- 许多同学搞不明白什么是Conda环境,其实很简单,你可以把它理解成一个"虚拟机",这个"虚拟机"可以创建许多个Python虚拟环境,与本地Python的环境不干扰,彼此虚拟环境也互相不干扰,且可随时切换。
- 避免和本地的Python环境发生冲突,因为Python的很多库对Python的版本要求很高,各库的版本也要求不同。

# 实际用途
- 当你需要用Python写一个web项目,你需要搭建一个Django或者是Flask的Python环境 
- 当你去网上一搜,你得到了这样一个表 

- 突然发现,自己电脑的Python版本是3.9,为了安装Django你又得把Python重装为3.8才能安装Django 
- 然后你一重装,你之前学openCV的Python环境又没了,当你做完这个Django项目,老板又叫你写个openCV的项目,你岂不是又得傻乎乎的去装openCV的环境吗? 
# 1.2 Conda下载
- 这是国内清华源镜像,找到对应电脑系统版本下载,下载速度较快 
- Anaconda和Miniconda的区别 - Anaconda是比较全面的conda环境,内置图形化操作界面,自带了许多Python的库
- Miniconda则是比较轻量级的conda环境,从名字上就能看出来是"mini"版本的Anaconda,功能和自带的库自然比Anaconda少,但是conda环境是和Anaconda一样的,如果只需要配置一个conda环境则只需要安装Miniconda更节省资源
 
-  至于它的安装教程下面会讲到 
# 二. Windows安装方法(方法1有conda的安装和jdk的配置以及pycharm的环境配置,方法2,3就不过多解释)
# 1. 方法1
# 1.1 Windows配置conda环境
- Anaconda和Miniconda安装其一即可
# 1.1.1 windows下安装Anaconda
- 下载方式请往上看"Conda环境"

- 双击exe安装程序

- 一路"next",最好选择"Just Me",windows的用户权限管理做的不太友好,如果选择"All User" ,Anaconda有时候则需要管理员权限(root权限)才能执行使用功能,windows用户如果只有一个账户,则那个账户则默认是系统的最高管理者,即为"root"

- 这里就默认安装目录

- 一定要把上面的选项勾选,Anaconda在安装的时候可以把环境变量自动配置好,环境变量很重要,因为conda基本上都是在cmd命令行下使用,需要windows环境的支持,当然你也可以使用Anaconda的图形化界面,或者你任性可以不勾选,自己手动去配置(/擦汗),然后点击Install装载。

- 装载完成后一路"next"安装完成,这两项可以不用勾选,如果勾选了点击Finish会自动打开Anaconda的使用说明和介绍,不用理会。

- 安装成功测试,打开cmd 输入 
- conda -V1- 出现conda版本号即为安装成功,我这里是conda 4.10.3
  
# 1.1.2 windows下安装Miniconda
- 方法基本上和Anaconda的安装一样,步骤和操作都是一样的。
# 1.2 Windows配置Java运行环境
# 1.2.1 jdk和jre区别
- jdk是java的开发工具,jre是java的运行时环境 
- jdk包含jre和jvm以及java的核心类库,所以说一般我们实际开发java程序只需要配置一个jdk就够了 
- jre里面只有java的类库和jvm 
- jdk和jre都有jvm,那jvm是什么呢?jvm其实就是java的虚拟机,用来把java代码编译成class字节码文件,字节码文件可以在任意操作系统上使用。所以java就具有可移植性特点  
# 1.2.2 jdk安装与配置
- 为了运行java代码其实只用安装jre就行了,但是jdk的工具包更全面,为了防止Pyhanlp调不到包,这里就安装jdk1.8,因为1.8版本更稳定
# (1) jdk下载
因为不知道从什么时候开始Oracle官网就需要注册登陆才能下载了,这里我已经下载好放在百度云盘上,提取密码2031,当然去网上自己找也行。
# (2) jdk安装
双击运行

- 一直点击下一步安装在系统盘的位置就行



- 安装完成后,迫不及待打开cmd输入 
- java -version1

找不到文件,是因为我们还没有配置java环境变量,所以我们需要配置环境变量
# (3) jdk环境变量配置
- 找到java安装的目录,如果在安装的时候是默认的目录,则一般都在系统盘c盘的Program Files目录下,有个Java文件夹,以我的电脑为例,完整路径为C:\Program Files\Java 
- 找到后打开,存在一个jdk和jre,因为之前说过jdk就包含jre 

- 先把这个文件目录放一边,待会需要用到 
- 桌面找到**"我的电脑"右键点击,找到"属性"** 
 
 - 点击"高级系统设置"

- 点击"环境变量"

- 我们只用关心"系统变量",用户变量权利没有系统的高

- 在系统变量里面新建一个名为"JAVA_HOME"的系统变量,变量值为步骤1中的java安装目录下jdk的地址

- 回到刚刚打开的Java安装目录,先点进jdk,然后把地址值赋值下来

- 粘贴到新建的"JAVA_HOME"的变量值,然后点击确定

- 在找到系统变量下的"Path",双击编辑

- 在右上角点击新建,新建两个变量"%JAVA_HOME%\bin"和"%JAVA_HOME%\jre\bin",然后确认保存 
- 注意,一定要一直点确认来关闭所有窗口,不然会配置失败 

- 配置成功测试,打开cmd输入 
- java -version1

- 出现jdk版本号 说明配置成功。
# 1.3 正式安装Pyhanlp
- 根据图灵书社《自然语言处理入门》 
- 书上说执行这行命令即可 
- pip install pyhanlp1

- 报错了,原来pyhanlp不支持Python3.9的环境,我们查看一下当前Python版本,直接命令行输入python,看到果然是3.9的版本

- 所以我们需要降级输入命令,执行 
- conda install python==3.81

- 下载安装进度条走完后,我们再输入python查看Python版本 
 
- 已成功降级到3.8 
- 我们重新输入 
- pip install pyhanlp1
-  执行 

- 于是我们又遇到了这种情况,简单来解读一下,Microsoft Visual C++14.0。。。is required 被需要
- 好嘛,那咱又去下载安装 Visual C++14.0

- 安装,既然它说他缺什么什么c++咱就把Python和c++都勾上


- 一共8个G,等它下载吧! 
- 等待下载'一年'后,下载完成再次输入pip install pyhanlp执行 
 
- 安装成功! 
- 测试安装命令行直接输入hanlp,正在下载中文词库,说明配置完成了 
 
# 1.4 pycharm配置环境
- 以上操作都顺利完成后,打开pycharm
- 选择右下角的环境设置,选择Add Interpreter(添加环境)

- 选择Conda Environment 然后再选择 Existing environment ,即意思就是 选择添加conda环境,从已有的conda环境中选择 
- 就选择我们刚才的"pyhanlp-learn-env",然后点击ok完成配置 
- 如果Existing environment中没有conda环境选择,则打开命令行输入conda activate激活一下环境,在进入Pycharm里选择  
- 至此,方法一算是安装完成,此方法算是经典的"曲线救国",选择去下载8个G大小的c++库来应对,属实是无可奈何的情况下才使用 
# 2. 方法2
- 此方法是根据官网的教程,实时更新。 
- 打开官网 
 
- 下翻找到官网的安装教程 
 
- 打开cmd 先创建一个用来学习pyhanlp的Python虚拟环境,输入命令 
- 这里的pyhanlp-learn-env是虚拟环境的名字,可以按照个人喜好命名 
- conda create -n pyhanlp-learn-env1
 
- 查看创建的conda环境,再输入命令 
- conda env list1
 
- base即是本机的Python虚拟环境,pyhanlp-learn-env即是刚才创建的Python虚拟环境 
- 切换conda虚拟环境,cmd中继续输入,激活/切换 名为pyhanlp-learn-env 的conda环境 
- conda ativate pyhanlp-learn-env1

- 输入执行完会发现cmd命令行前面会出现"(pyhanlp-learn-env)"就说明你现在正在pyhanlp-learn-env这个Python环境下 
- 然后我们再把官网的命令复制下来,这里我打在这里 
- conda install -c conda-forge openjdk python=3.8 jpype1=0.7.0 -y1
- 复制到刚才的命令行执行,等待一会即可 

- 下载完成后输入 
- pip install pyhanlp1

- Successfully,安装完成!
- 此方法和方法一不同之处在于,方法二是使用conda创建了一个干净的环境,在用官方的命令一键安装pyhanlp所依赖的所有库,完成安装,不需要下载什么c++以及8个G的c++依赖库
# 3. 方法3
- 此方法可以说是一键式的傻瓜操作,
- 打开pyhanlp官网的github

- 看到这个文件

- 会使用conda的应该知道这个.yml是conda环境的打包环境,就是说在pyhanlp官网已经把pyhanlp的运行环境打包好了,我们只需要单独下载这个文件用conda运行就相当于把官网推荐的conda Python环境搬到我们电脑上了。 
- 所以我们下载这个文件 

- 我选择使用git工具下载,不会用git的同学可以直接下载zip,因为github暂时还不支持只单独下载一个文件,必须下载整个文件,其实这个文件夹就包含了书上的源码,可能还要比书上要好一点,因为官网的是最新版本的。 
- 下载完成后,在当前文件夹打开cmd 

- 在命令行输入 
- conda env create -f environment.yml 即使用conda运行这个文件,创建一个名字为pyhanlp-env的新环境1
 2
- 至于为什么会是"pyhanlp-env"这个环境呢,你可以打开environment.yml看一看 

- 运行命令

- 等待加载完成

- 测试安装是否完成 
- 输入 - conda env list1- 查看conda的所有环境,运行完刚才的文件,就为我们创建了一个"pyhanlp-env"的conda环境
  - 再输入
 - conda activate pyhanlp-env1- 从base环境切换为pyhanlp-env
  - 此时就别再傻乎乎的pip install pyhanlp了!!!,这个环境里面所有的库都配置好了,无需我们再手动去安装
 
- 测试 - 打开pycharm切换pycharm运行环境(方法1讲过如何切换,这里不过多解释)等待载入完成
  - 打开book目录下的任意一个文件运行
  - 会自动为我们下载词库
- 下载完成后
 
- 配置完成!
 
- 方法3只需要下载运行一个conda环境,所有的都为我们配置好了,非常简单! 
