Stanza斯坦福自然语言处理 Python 库
Stanza 是斯坦福 NLP 组的官方 Python NLP(自然语言处理) 库。它支持在 60 多种语言上运行各种准确的自然语言处理工具,并支持从 Python 访问 Java Stanford CoreNLP 软
安装
pip
Stanza 支持 Python 3.6 或更高版本。建议通过 Python 包管理器 pip 安装 Stanza
pip install stanza
如果当前安装了以前的版本stanza
,请使用:
pip install stanza -U
Anaconda
要通过 Anaconda 安装 Stanza,请使用以下 conda 命令:
conda install -c stanfordnlp stanza
请注意,目前已通过 Anaconda 安装 Stanza 不适用于 Python 3.8。对于 Python 3.8,请使用 pip 安装。
从源代码
也可以从这个 git 仓库的源代码安装:
git clone https://github.com/stanfordnlp/stanza.git cd stanza pip install -e .
运行 Stanza
要运行您的第一个 Stanza 管道,只需在您的 Python 交互式解释器中执行以下步骤:
>>> import stanza >>> stanza.download('en') # This downloads the English models for the neural pipeline >>> nlp = stanza.Pipeline('en') # This sets up a default neural pipeline in English >>> doc = nlp("Barack Obama was born in Hawaii. He was elected president in 2008.") >>> doc.sentences[0].print_dependencies()
如果遇到requests.exceptions.ConnectionError
,请尝试使用代理:
>>> import stanza >>> proxies = {'http': 'http://ip:port', 'https': 'http://ip:port'} >>> stanza.download('en', proxies=proxies) # This downloads the English models for the neural pipeline >>> nlp = stanza.Pipeline('en') # This sets up a default neural pipeline in English >>> doc = nlp("Barack Obama was born in Hawaii. He was elected president in 2008.") >>> doc.sentences[0].print_dependencies()
评论