解决nltk download('punkt')连接尝试失败

编程入门 行业动态 更新时间:2024-10-22 17:27:52

解决nltk download(‘punkt’)连接尝试失败

原文链接:https://blog.csdn/weixin_44633882/article/details/104494276

1. 尝试下载

import nltk
nltk.download()
>d punkt

这种方法在第二步就会抛出“连接尝试失败”,一方面因为nltk文件很大,另一方面当前的网络不太稳定。

2. 解决方法

不能直接下载,那只好看看它要下载什么文件,存到什么地方。然后我们自己去下载,放到指定的目录下。

运行需要的nltk分词代码

import nltk
nltk.word_tokenize("A pivot is the pin or the central point on which something balances or turns")

会抛出异常

Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "C:\Applications\Anaconda3\lib\site-packages\nltk\tokenize\__init__.py", line 144, in word_tokenize
  ...
  File "C:\Applications\Anaconda3\lib\site-packages\nltk\data.py", line 701, in find
    raise LookupError(resource_not_found)
LookupError:
**********************************************************************
  Resource punkt not found.
  Please use the NLTK Downloader to obtain the resource:

  >>> import nltk
  >>> nltk.download('punkt')

  For more information see: https://www.nltk.org/data.html

  Attempted to load tokenizers/punkt/english.pickle

  Searched in:
    - 'C:\\Users\\11244/nltk_data'
    - 'C:\\Applications\\Anaconda3\\nltk_data'
    - 'C:\\Applications\\Anaconda3\\share\\nltk_data'
    - 'C:\\Applications\\Anaconda3\\lib\\nltk_data'
    - 'C:\\Users\\11244\\AppData\\Roaming\\nltk_data'
    - 'C:\\nltk_data'
    - 'D:\\nltk_data'
    - 'E:\\nltk_data'
    - ''
**********************************************************************

我们可以看到,尝试加载了tokenizers/punkt/english.pickle文件,但没有找到。系统会从'C:\\Users\\11244/nltk_data'这几个路径下进行搜索。

OK,我们知道了需要什么文件,应该将这个文件放到哪里。从哪里下载呢?

访问nltk_data,可以选择直接download下来需要的包,再按刚才的路径放好。大概14分钟才能下好吧。

github最近网不稳定,我们来找到另一个下载地址,而非github的下载地址。

拉到右边

从这里下载更快(●’◡’●),推荐放到迅雷!

下载好了punkt.zip文件,我选择放到C:\\Applications\\Anaconda3\\share\\nltk_data目录下,完成解压。

λ python
Python 3.6.5 |Anaconda, Inc.| (default, Mar 29 2018, 13:32:41) [MSC v.1900 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> import nltk
>>> nltk.word_tokenize("A pivot is the pin or the central point on which something balances or turns")
['A', 'pivot', 'is', 'the', 'pin', 'or', 'the', 'central', 'point', 'on', 'which', 'something', 'balances', 'or', 'turns']

3. 小结

因为我在github上需要使用的项目,仅要求我下载nltk库中的punkt,所以我就这么下载了。

希望也能帮助到其他人!

参考

  1. https://blog.csdn/qq_43376013/article/details/102883773
  2. https://blog.csdn/weixin_44574186/article/details/90748946
  3. https://wwwblogs/zrmw/p/10869325.html

更多推荐

解决nltk download('punkt')连接尝试失败

本文发布于:2023-06-14 07:13:00,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1450358.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:nltk   download   punkt

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!