盘点30个顶级Python库

大数据DT

共 3107字,需浏览 7分钟

 ·

2022-04-26 07:59

导读:今天我们来盘点一下有哪些用于深度学习、自然语言处理和计算机视觉的顶级Python库。


作者:Matthew Mayo

编译:Mika

来源:CDA数据分析师(ID:cdacdacda)



我们尽力将每个库按预期的使用情况进行归类,希望这能对大家有所帮助。


显然,现在并不是所有的自然语言处理和计算机视觉工作都是使用深度学习技术进行的,但随着趋势朝着这种技术的方向发展。


所有包含的库都有对应的Github代码仓库,我们还列出每个库的在Github上的收藏(Stars) ,提交(Commits ),贡献者(Contributors)的数据,这在一定程度上反映了库的流行度和使用情况。


接着让我们分别来看看由KDnuggets工作人员整理的用于深度学习、自然语言处理和计算机视觉的30个顶级Python库。



01 深度学习


1. TensorFlow


  • 收藏: 149000, 提交: 97741, 贡献者: 2754


TensorFlow是一个用于机器学习的端到端开源平台。它有一个全面的、灵活的工具、库和社区资源的生态系统,让研究人员推动机器学习的最先进技术,让开发人员轻松建立和部署机器学习驱动的应用程序。


2. Keras


  • 收藏: 50000, 提交: 5349, 贡献者:864


Keras是一个用Python编写的深度学习API,运行在机器学习平台TensorFlow的基础上。


3. PyTorch


  • 收藏: 43200, 提交: 30696, 贡献者:1619


Python中的张量和动态神经网络,具有强大的GPU加速能力


4. fastai


  • 收藏: 19800, 提交: 1450, 贡献者: 607


fastai使用现代最佳实践简化了快速、准确的神经网络训练。


5. PyTorch Lightning


  • 收藏: 9600, 提交: 3594, 贡献者:317


用于高性能人工智能研究的轻量级PyTorch封装。


6. JAX


  • 收藏: 10000, 提交: 5708, 贡献者:221


Python+NumPy程序的可组合转换:区分、矢量化、JIT到GPU/TPU等


7. MXNet


  • 收藏: 19100, 提交: 11387, 贡献者: 839


轻量级、便携、灵活的分布式、移动式深度学习,具有动态、突变意识的数据流调度器;适用于Python、R、Julia、Scala、Go、Javascript等。


8. Ignite 


  • 收藏: 3100, 提交: 747, 贡献者: 112


帮助PyTorch中的神经网络灵活透明地进行训练和评估的高级库。



02 自然语言处理(NLP)


9. FastText


  • 收藏: 21700, 提交: 379, 贡献者:47


FastText是一个用于高效学习单词表示法和句子分类的库。


10. spaCy


  • 收藏: 17400, 提交: 11628, 贡献者: 482


使用Python和Cython的强大自然语言处理。


11. gensim


  • 收藏: 11200, 提交: 4024, 贡献者: 361


用于主题建模、文档索引和大型语料库相似度检索的Python库。目标受众是自然语言处理和信息检索社区。


12. NLTK


  • 收藏:9300,提交:13990,贡献者:319


开源的Python模块、数据集和教程,支持自然语言处理方面的研究和开发。


13. Datasets  (Huggingface开发)


  • 收藏:4300,提交:568,贡献者:64


在PyTorch、TensorFlow、NumPy和Pandas中为自然语言处理等提供快速、高效、开放的数据集和评估指标。


14. Tokenizers(Huggingface开发)


  • 收藏:3800,提交:1252,贡献者:30


为研究和生产而优化的最先进快速标记器


15. Transformers(Huggingface开发)


  • 收藏:3500,提交:5480,贡献者:585


用于Pytorch和TensorFlow 2.0的最先进的自然语言处理。


16. Stanza


  • 收藏:4800,提交:1514,贡献者:19


用于许多人类语言的斯坦福自然语言Python官方库


17. TextBlob


  • 收藏:7300,提交:542,贡献者:24


简单、Python式的、具有文本处理——情绪分析、词性标注、名词短语提取、翻译等等功能。


18. PyTorch NLP


  • 收藏:1800人,提交:442人,贡献者:15人


用于PyTorch自然语言处理的基本工具


19. Textacy


  • 收藏:1500人,提交:1324人,贡献者:23人


用于执行各种自然语言处理任务的Python库,建立在高性能spaCy库的基础上。


20. Finetune


  • 收藏: 626, 提交: 1405, 贡献者: 13


允许用户利用最先进的预训练的自然语言处理模型来完成各种下游任务。


21. TextHero


  • 收藏: 1900, 提交: 266, 贡献者: 17


从头开始,数量用于文本预处理、表示和可视化。


22. Spark NLP


  • 收藏: 1700, 提交: 4363, 贡献者:50


Spark NLP是一个建立在Apache Spark ML之上的自然语言处理库。


23. GluonNLP


  • 收藏: 2200, 提交: 712, 贡献者: 72


GluonNLP是一个工具包,可以轻松实现文本预处理、数据集加载和神经模型构建,帮助你加快自然语言处理(NLP)研究。



03 计算机视觉


24. Pillow


  • 收藏:7800,提交:10799,贡献者:303


Pillow是很不错的Python成像库分叉。


25. OpenCV


  • 收藏:49600,提交:29453,贡献者:1234


开源计算机视觉库


26. scikit-image


  • 收藏:4000,提交:12352,贡献者:403


Python中的图像处理


27. Mahotas


  • 收藏:644人,提交:1273人,贡献者:25人


快速计算机视觉算法库(为了提高速度,全部用C++实现),在numpy数组上运行。


28. Simple-CV


  • 收藏:2400人,提交:2625人,贡献者:69人


开源机器视觉框架,使用OpenCV和Python编程语言。


29. GluonCV


  • 收藏:4300,提交:774,贡献者:101


提供了计算机视觉中最先进的(SOTA)深度学习模型的实现。


30. Torchvision


  • 收藏:7500,提交:1286,贡献者:334


软件包包括流行的数据集、模型架构和用于计算机视觉的常见图像转换。



结语


以上就是30个你值得了解的用于深度学习、自然语言处理和计算机视觉的顶级Python库,希望能对你有所帮助。


参考链接:

https://www.kdnuggets.com/2020/11/top-python-libraries-deep-learning-natural-language-processing-computer-vision.html



延伸阅读👇


延伸阅读《利用Python进行数据分析》


干货直达👇


更多精彩👇

在公众号对话框输入以下关键词
查看更多优质内容!

读书 | 书单 | 干货 | 讲明白 | 神操作 | 手把手
大数据 | 云计算 | 数据库 | Python | 爬虫 | 可视化
AI | 人工智能 | 机器学习 | 深度学习 | NLP
5G | 中台 | 用户画像 数学 | 算法 数字孪生

据统计,99%的大咖都关注了这个公众号

👇

浏览 7
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报