目录

pyhanlp环境搭建

# Pyhanlp安装说明

# 一. 前提补充

  • **Java8(jdk1.8)**运行环境
  • conda环境

# 1. Conda环境

# 1.1 什么的Conda环境?

  • 许多同学搞不明白什么是Conda环境,其实很简单,你可以把它理解成一个"虚拟机",这个"虚拟机"可以创建许多个Python虚拟环境,与本地Python的环境不干扰,彼此虚拟环境也互相不干扰,且可随时切换。
  • 避免和本地的Python环境发生冲突,因为Python的很多库对Python的版本要求很高,各库的版本也要求不同。

无标题

# 实际用途

  • 当你需要用Python写一个web项目,你需要搭建一个Django或者是Flask的Python环境

  • 当你去网上一搜,你得到了这样一个表

image-20220302194640172

  • 突然发现,自己电脑的Python版本是3.9,为了安装Django你又得把Python重装为3.8才能安装Django

  • 然后你一重装,你之前学openCV的Python环境又没了,当你做完这个Django项目,老板又叫你写个openCV的项目,你岂不是又得傻乎乎的去装openCV的环境吗?

# 1.2 Conda下载

  • 这是国内清华源镜像,找到对应电脑系统版本下载,下载速度较快

  • Anaconda和Miniconda的区别

    • Anaconda是比较全面的conda环境,内置图形化操作界面,自带了许多Python的库
    • Miniconda则是比较轻量级的conda环境,从名字上就能看出来是"mini"版本的Anaconda,功能和自带的库自然比Anaconda少,但是conda环境是和Anaconda一样的,如果只需要配置一个conda环境则只需要安装Miniconda更节省资源
  • Anaconda (opens new window)

  • Miniconda (opens new window)

    至于它的安装教程下面会讲到

# 二. Windows安装方法(方法1有conda的安装和jdk的配置以及pycharm的环境配置,方法2,3就不过多解释)

# 1. 方法1

# 1.1 Windows配置conda环境

  • Anaconda和Miniconda安装其一即可
# 1.1.1 windows下安装Anaconda
  • 下载方式请往上看"Conda环境"

image-20220303142529229

  • 双击exe安装程序

image-20220303142619214

  • 一路"next",最好选择"Just Me",windows的用户权限管理做的不太友好,如果选择"All User" ,Anaconda有时候则需要管理员权限(root权限)才能执行使用功能,windows用户如果只有一个账户,则那个账户则默认是系统的最高管理者,即为"root"

image-20220303142732772

  • 这里就默认安装目录

image-20220303143327536

  • 一定要把上面的选项勾选,Anaconda在安装的时候可以把环境变量自动配置好,环境变量很重要,因为conda基本上都是在cmd命令行下使用,需要windows环境的支持,当然你也可以使用Anaconda的图形化界面,或者你任性可以不勾选,自己手动去配置(/擦汗),然后点击Install装载。

image-20220303143749034

  • 装载完成后一路"next"安装完成,这两项可以不用勾选,如果勾选了点击Finish会自动打开Anaconda的使用说明和介绍,不用理会。

image-20220303144325320

  • 安装成功测试,打开cmd 输入

  • conda -V
    
    1
    • 出现conda版本号即为安装成功,我这里是conda 4.10.3

    image-20220303144735122

# 1.1.2 windows下安装Miniconda
  • 方法基本上和Anaconda的安装一样,步骤和操作都是一样的。

# 1.2 Windows配置Java运行环境

# 1.2.1 jdk和jre区别
  • jdk是java的开发工具,jre是java的运行时环境

  • jdk包含jre和jvm以及java的核心类库,所以说一般我们实际开发java程序只需要配置一个jdk就够了

  • jre里面只有java的类库和jvm

  • jdk和jre都有jvm,那jvm是什么呢?jvm其实就是java的虚拟机,用来把java代码编译成class字节码文件,字节码文件可以在任意操作系统上使用。所以java就具有可移植性特点

    image-20220303151118309

# 1.2.2 jdk安装与配置
  • 为了运行java代码其实只用安装jre就行了,但是jdk的工具包更全面,为了防止Pyhanlp调不到包,这里就安装jdk1.8,因为1.8版本更稳定
# (1) jdk下载

因为不知道从什么时候开始Oracle官网就需要注册登陆才能下载了,这里我已经下载好放在百度云盘上,提取密码2031,当然去网上自己找也行。

# (2) jdk安装

双击运行

image-20220303153515888

  • 一直点击下一步安装在系统盘的位置就行

image-20220303153613524

image-20220303153803409

image-20220303153833096

  • 安装完成后,迫不及待打开cmd输入

  • java -version
    
    1

image-20220303154130997

找不到文件,是因为我们还没有配置java环境变量,所以我们需要配置环境变量

# (3) jdk环境变量配置
  • 找到java安装的目录,如果在安装的时候是默认的目录,则一般都在系统盘c盘的Program Files目录下,有个Java文件夹,以我的电脑为例,完整路径为C:\Program Files\Java

  • 找到后打开,存在一个jdk和jre,因为之前说过jdk就包含jre

image-20220303154550256

  • 先把这个文件目录放一边,待会需要用到

  • 桌面找到**"我的电脑"右键点击,找到"属性"**

img=100x100
  • 点击"高级系统设置"

image-20220303160050301

  • 点击"环境变量"

image-20220303160219972

  • 我们只用关心"系统变量",用户变量权利没有系统的高

image-20220303160445755

  • 在系统变量里面新建一个名为"JAVA_HOME"的系统变量,变量值为步骤1中的java安装目录下jdk的地址

image-20220303160805829

  • 回到刚刚打开的Java安装目录,先点进jdk,然后把地址值赋值下来

image-20220303161103024

  • 粘贴到新建的"JAVA_HOME"的变量值,然后点击确定

image-20220303161213495

  • 在找到系统变量下的"Path",双击编辑

image-20220303161419208

  • 在右上角点击新建,新建两个变量"%JAVA_HOME%\bin"和"%JAVA_HOME%\jre\bin",然后确认保存

  • 注意,一定要一直点确认来关闭所有窗口,不然会配置失败

image-20220303161526314

  • 配置成功测试,打开cmd输入

  • java -version
    
    1

image-20220303162624978

  • 出现jdk版本号 说明配置成功。

# 1.3 正式安装Pyhanlp

  • 根据图灵书社《自然语言处理入门》

  • 书上说执行这行命令即可

  • pip install pyhanlp
    
    1

image-20220303171146083

  • 报错了,原来pyhanlp不支持Python3.9的环境,我们查看一下当前Python版本,直接命令行输入python,看到果然是3.9的版本

image-20220303171303484

  • 所以我们需要降级输入命令,执行

  • conda install python==3.8
    
    1

image-20220303171705550

  • 下载安装进度条走完后,我们再输入python查看Python版本

  • image-20220303171806386

  • 已成功降级到3.8

  • 我们重新输入

  • pip install pyhanlp
    
    1
  • ​ 执行

image-20220303172118061

  • 于是我们又遇到了这种情况,简单来解读一下,Microsoft Visual C++14.0。。。is required 被需要
  • 好嘛,那咱又去下载安装 Visual C++14.0

image-20220303172812445

  • 安装,既然它说他缺什么什么c++咱就把Python和c++都勾上

image-20220303172853380

image-20220303173005921

  • 一共8个G,等它下载吧!

  • 等待下载'一年'后,下载完成再次输入pip install pyhanlp执行

  • image-20220303174432545

  • 安装成功!

  • 测试安装命令行直接输入hanlp,正在下载中文词库,说明配置完成了

  • image-20220303174611490

# 1.4 pycharm配置环境

  • 以上操作都顺利完成后,打开pycharm
  • 选择右下角的环境设置,选择Add Interpreter(添加环境)

image-20220303175353155

  • 选择Conda Environment 然后再选择 Existing environment ,即意思就是 选择添加conda环境,从已有的conda环境中选择

  • 就选择我们刚才的"pyhanlp-learn-env",然后点击ok完成配置

  • 如果Existing environment中没有conda环境选择,则打开命令行输入conda activate激活一下环境,在进入Pycharm里选择

    image-20220303175807473

  • 至此,方法一算是安装完成,此方法算是经典的"曲线救国",选择去下载8个G大小的c++库来应对,属实是无可奈何的情况下才使用

# 2. 方法2

  • 此方法是根据官网的教程,实时更新。

  • Pyhanlp的github官网

  • 打开官网

  • image-20220303163522830

  • 下翻找到官网的安装教程

  • image-20220303163656746

  • 打开cmd 先创建一个用来学习pyhanlp的Python虚拟环境,输入命令

  • 这里的pyhanlp-learn-env是虚拟环境的名字,可以按照个人喜好命名

  • conda create -n pyhanlp-learn-env
    
    1
  • image-20220303164705856

  • 查看创建的conda环境,再输入命令

  • conda env list
    
    1
  • image-20220303164844116

  • base即是本机的Python虚拟环境,pyhanlp-learn-env即是刚才创建的Python虚拟环境

  • 切换conda虚拟环境,cmd中继续输入,激活/切换 名为pyhanlp-learn-env 的conda环境

  • conda ativate pyhanlp-learn-env 
    
    1

image-20220303165432044

  • 输入执行完会发现cmd命令行前面会出现"(pyhanlp-learn-env)"就说明你现在正在pyhanlp-learn-env这个Python环境下

  • 然后我们再把官网的命令复制下来,这里我打在这里

  • conda install -c conda-forge openjdk python=3.8 jpype1=0.7.0 -y
    
    1
  • 复制到刚才的命令行执行,等待一会即可

image-20220303165920971

  • 下载完成后输入

  • pip install pyhanlp
    
    1

image-20220303184320888

  • Successfully,安装完成!
  • 此方法和方法一不同之处在于,方法二是使用conda创建了一个干净的环境,在用官方的命令一键安装pyhanlp所依赖的所有库,完成安装,不需要下载什么c++以及8个G的c++依赖库

# 3. 方法3

  • 此方法可以说是一键式的傻瓜操作
  • 打开pyhanlp官网的github

image-20220303184807352

  • 看到这个文件

image-20220303185117343

  • 会使用conda的应该知道这个.yml是conda环境的打包环境,就是说在pyhanlp官网已经把pyhanlp的运行环境打包好了,我们只需要单独下载这个文件用conda运行就相当于把官网推荐的conda Python环境搬到我们电脑上了。

  • 所以我们下载这个文件

image-20220303190005933

  • 我选择使用git工具下载,不会用git的同学可以直接下载zip,因为github暂时还不支持只单独下载一个文件,必须下载整个文件,其实这个文件夹就包含了书上的源码,可能还要比书上要好一点,因为官网的是最新版本的。

  • 下载完成后,在当前文件夹打开cmd

image-20220303190654685

  • 在命令行输入

  • conda env create -f environment.yml
    即使用conda运行这个文件,创建一个名字为pyhanlp-env的新环境
    
    1
    2
  • 至于为什么会是"pyhanlp-env"这个环境呢,你可以打开environment.yml看一看

image-20220303191424374

  • 运行命令

image-20220303190945856

  • 等待加载完成

image-20220303191005920

  • 测试安装是否完成

  • 输入

    conda env list 
    
    1
    • 查看conda的所有环境,运行完刚才的文件,就为我们创建了一个"pyhanlp-env"的conda环境

    image-20220303191504199

    • 再输入
    conda activate pyhanlp-env
    
    1
    • 从base环境切换为pyhanlp-env

    image-20220303191655845

    • 此时就别再傻乎乎的pip install pyhanlp了!!!,这个环境里面所有的库都配置好了,无需我们再手动去安装
  • 测试

    • 打开pycharm切换pycharm运行环境(方法1讲过如何切换,这里不过多解释)等待载入完成

    image-20220303192226538

    • 打开book目录下的任意一个文件运行

    image-20220303192327408

    • 会自动为我们下载词库
    • 下载完成后
    • image-20220303192926381
    • 配置完成!
  • 方法3只需要下载运行一个conda环境,所有的都为我们配置好了,非常简单!

# 三. Linux安装方法

# 待写

# 四. Mac安装方法

# 待写

上次更新: 2023/09/05 17:45:42
最近更新
01
关于我
07-14
02
科学上网
11-15
03
OSS+CDN
09-23
更多文章>
极昼青春
买辣椒也用券