nltk.download()下载失败

编程入门 行业动态 更新时间:2024-10-18 16:54:53

今天准备理解一下 TF-IDF,于是下载安装nltk包,但是import word_tokenize后使用word_tokenize进行分词,报错:
LookupError:


Resource [93mpunkt[0m not found.
Please use the NLTK Downloader to obtain the resource:
nltk.download(‘punkt’)
Attempted to load [93mtokenizers/punkt/english.pickle[0m
Searched in:
- ‘C:\Users\Administrator/nltk_data’
- ‘D:\Python3.6\nltk_data’
- ‘D:\Python3.6\share\nltk_data’
- ‘D:\Python3.6\lib\nltk_data’
- ‘C:\Users\Administrator\AppData\Roaming\nltk_data’
- ‘C:\nltk_data’
- ‘D:\nltk_data’
- ‘E:\nltk_data’
- ‘’


意思应该是需要 nltk.download(‘punkt’),于是在Python中运行:
import nltk
nltk.download(‘punkt’)
报错:无法连接。
又试: nltk.download(),but:

好吧,佛了。
于是,,,去官网直接下载:https://github/nltk/nltk_data

下载packages就好。
放入之前报错中的:
- ‘C:\Users\Administrator/nltk_data’
- ‘D:\Python3.6\nltk_data’
- ‘D:\Python3.6\share\nltk_data’
- ‘D:\Python3.6\lib\nltk_data’
- ‘C:\Users\Administrator\AppData\Roaming\nltk_data’
- ‘C:\nltk_data’
- ‘D:\nltk_data’
- ‘E:\nltk_data’
- ‘’
任一文件夹下就OK,这里需将 packages 重命名成 nltk_data。
然后,,
找到 nltk-data 中 punkt 所在目录:

这里要进入 punkt.zip 将 punkt 文件拖出来,与 punkt.zip 同级,然后 punkt.zip 就可以删掉啦,于是才大功告成,呼~
再试一下 word_tokenize,木问题啦!
我想,后续如果要用到其他数据文件,类似punkt的处理。

更多推荐

nltk.download()下载失败

本文发布于:2023-06-14 07:14:00,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1450321.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:nltk   download

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!