Stanza斯坦福自然语言处理 Python 库

联合创作 · 2023-09-25 21:40

Stanza 是斯坦福 NLP 组的官方 Python NLP(自然语言处理) 库。它支持在 60 多种语言上运行各种准确的自然语言处理工具,并支持从 Python 访问 Java Stanford CoreNLP 软

安装

pip

Stanza 支持 Python 3.6 或更高版本。建议通过 Python 包管理器 pip 安装 Stanza 

pip install stanza

如果当前安装了以前的版本stanza,请使用:

pip install stanza -U

Anaconda

要通过 Anaconda 安装 Stanza,请使用以下 conda 命令:

conda install -c stanfordnlp stanza

请注意,目前已通过 Anaconda 安装 Stanza 不适用于 Python 3.8。对于 Python 3.8,请使用 pip 安装。

从源代码

也可以从这个 git 仓库的源代码安装:

git clone https://github.com/stanfordnlp/stanza.git
cd stanza
pip install -e .

运行 Stanza

要运行您的第一个 Stanza 管道,只需在您的 Python 交互式解释器中执行以下步骤:

>>> import stanza
>>> stanza.download('en')       # This downloads the English models for the neural pipeline
>>> nlp = stanza.Pipeline('en') # This sets up a default neural pipeline in English
>>> doc = nlp("Barack Obama was born in Hawaii.  He was elected president in 2008.")
>>> doc.sentences[0].print_dependencies()

如果遇到requests.exceptions.ConnectionError,请尝试使用代理:

>>> import stanza
>>> proxies = {'http': 'http://ip:port', 'https': 'http://ip:port'}
>>> stanza.download('en', proxies=proxies)  # This downloads the English models for the neural pipeline
>>> nlp = stanza.Pipeline('en')             # This sets up a default neural pipeline in English
>>> doc = nlp("Barack Obama was born in Hawaii.  He was elected president in 2008.")
>>> doc.sentences[0].print_dependencies()
浏览 6
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报