在网上直接下载别人打包好的全部文件,500多MB,解压之后2.3G,还是不小的,要是直接用 nltk.download() 下到用户文件夹下,还是占用不少C盘空间的。

下好并解压之后,需要让 nltk 能找到我的包(G盘),默认的路径可以按照下面的方法查看:

from nltk import data
data.find('.')
# 返回结果如下
# ...
# LookupError: 
# **********************************************************************
#   Resource  not found.
#   Please use the NLTK Downloader to obtain the resource:
#
#   >>> import nltk
#   >>> nltk.download('')
#  
#   Attempted to load ./
#
#   Searched in:
#     - 'C:\\Users\\hustle/nltk_data'
#     - 'E:\\Anaconda3\\envs\\NLP\\nltk_data'
#     - 'E:\\Anaconda3\\envs\\NLP\\share\\nltk_data'
#     - 'E:\\Anaconda3\\envs\\NLP\\lib\\nltk_data'
#     - 'C:\\Users\\hustle\\AppData\\Roaming\\nltk_data'
#     - 'C:\\nltk_data'
#     - 'D:\\nltk_data'
#     - 'E:\\nltk_data'
# **********************************************************************

可以看到G盘并不在寻找之列,需要手动添加

我看有些人说给win10添加环境路径不好用,就直接用下面的方法吧

from nltk import data
data.path.append(r"G:\nltk_data")

亲测好用

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐