Python 潮流周刊#39:Rust 开发的性能超快的打包工具

Python猫

共 8148字,需浏览 17分钟

 ·

2024-04-11 02:21

请给“ Python猫 ”加星标 ,以免错过文章推送

5158d8662b83b8e362c2f3c84453ce04.webp

你好,我是猫哥。这里每周分享优质的 Python、AI 及通用技术内容,大部分为英文。本周刊开源,欢迎投稿[1]。另有电报频道[2]作为副刊,补充发布更加丰富的资讯,欢迎关注。

🦄文章&教程

1、uv:Rust 开发的 Python 打包工具[3]

Ruff 所属团队用 Rust 开发的一个利器:Python 的包解析与安装器uv !它被设计为 pippip-tools 的直接替代品,不使用缓存时比它们快 8-10 倍。也可通过 uv venv 用作虚拟环境管理器,比 python -m venv 快 80 倍,比virtualenv 快 7 倍。

dac608816f9fd909666d3d99f02474af.webp解析和安装Trio库的性能对比

2、Rye:愿景延续[4]

Rye 是 Flask 作者在去年 4 月发布的 Python 打包和项目管理工具,作者在文章中总结了它已实现的功能(下载 Python、管理虚拟环境、构建和发布包、linting 和格式化、依赖管理等) ,介绍了自己的设计想法。(附1:作者的 16 分钟教程视频 Rye: a Hassle-Free Python Experience[5])(附2:上一则分享的 uv 团队已接管了 Rye,将来会融合成一个。Rye Grows With UV[6])

3、为什么越来越多用 Rust 开发的库?[7]

Rust 正在逐步取代 C 语言成为 Python 的高性能后端支撑。文章介绍了 Rust 相比 C 的优势所在,介绍了用 Rust 开发的一些知名的 Python 库。

4、80 行 Python 实现一个搜索引擎[8]

这篇文章略微标题党了,但是文章介绍的内容很完整:基于 RSS 的异步爬虫、倒排索引、搜索排名、基于 FastAPI 的 Web 网页。可以学习搜索引擎的工作原理,学习从数据获取、数据解析、开放接口、到网页呈现的项目开发流程。

5、如何计算 Python 中的 CPU 指令数?[9]

你知道执行 Python 的 print("Hello") 大约需要多少个 CPU 指令么?答案是 17000。导入 seaborn 则需要大约 20 亿个。作者开发了 Cirron[10] 库以计算 CPU 指令数、分支未命中数及代码的时间损耗等指标。

6、Python 复用装饰器代码[11]

有多个装饰器要加在不同的函数上,而且相同的装饰器可能有不同传参,如何复用这些装饰器?问题初看可能不好理解,文章中有直观示例和解决过程,可以加深你对装饰器的理解和掌握高阶运用。

7、像专业人士一样处理 Asyncio 任务[12]

如何理解 Asyncio 中的 Task 对象?Asyncio 协程的工作原理是什么?如何等待一个任务,又如何等待多个或一组任务?文章介绍了 Asyncio 的工作原理以及任务处理相关的函数用法。

8、使用 textwrap 模块操作字符串[13]

文章介绍了 textwrap 库的几个主要功能,例如 shorten() 裁剪字符串长度、wrap() 将字符串等宽分割、dedent() 处理字符串缩进等。

9、总结 Python 版本间的主要变更点[14]

Python 的一些新特性是在什么版本引入的?作者为了方便,梳理了一些重要语法和标准库的变更记录,同时也指出了每个版本终止维护的时间(例如 Python 3.8 将在今年 10 月 EOL)。(附:这个网站[15]可以查看 Python 及很多项目的 EOL 时间)

10、将 Postgres 作为队列使用[16]

直接将数据库作为队列使用,性能会不会很受影响?作者测试的结果是影响很小。具体该如何实现将 Postgres 作为队列使用?如何处理锁和事务、任务重试、处理任务超时等问题?

11、我在所有 Django 项目中都用的 20 个包[17]

Django 框架适用于构建复杂的 Web 项目,作者介绍了自己常用的 20 软件包,在 Django 自身的核心功能之外,提供了更丰富的功能。

12、Python 元类的真实案例[18]

Python 中的元类是什么?为什么要学习元类?这个高级特性并不常用,但值得学习了解。文章介绍了元类的工作原理,并用现实例子演示它的强大用途。

13、一万亿行气象数据的编程挑战[19]

一个编程挑战项目:有 100,000 个文件,每个文件 1000 万行,计算每个气象站的最低、平均和最高温度。数据存储在 S3 上,总大小 2.5 TB。作者给出了自己的实现(运行 8.5 分钟),以及优化成本的方案。

🎁Python潮流周刊🎁每 30 期为一季,第一季的精华内容已整理成一篇,方便你随时查看。在线访问地址:Python 潮流周刊第一季精华合集(1~30)[20]

🐿️项目&资源

1、uv:性能极快的 Python 包安装和解析器[21]

用 Rust 开发的速度极快的 Python 包安装器和解析器。Ruff 团队作品。可直接替换 pippip-toolsvirtualenv 常用命令。(star 6.6K)

2、sqlite-web:基于 Web 的 SQLite 数据库工具[22]

基于 Flask 开发的 Web 端 SQLite 管理工具,可视化管理数据库、数据表、数据项和索引等,支持 JSON 和 CSV 格式文件的导入导出。(star 2.6K)

3、celery-exporter:导出 Celery 指标用于 Prometheus[23]

实时获取 Celery 的任务状态、工作线程、活动任务数等监控指标,遵循 Prometheus 导出器最佳实践,并利用 Celery-mixin 提供了 Grafana 仪表板及 Prometheus 告警功能。

4、pyupgrade:自动升级 Python 较新版本的语法 [24]

一个强力的工具和 pre-commit 钩子,可以自动删除冗余写法、用新语法重写过时的代码、用更优雅的写法重构代码,等等。项目文档中给出了很多例子,推荐阅读。(star 3.2K)

      
      # 两个重写成字典推导式的示例
-dict((a, b) for a, b in y)
+{a: b for a, b in y}
-dict([(a, b) for a, b in y])
+{a: b for a, b in y}

5、ollama-python:Ollama Python 库[25]

支持 Python 3.8+,简单快速集成 Llama 2、Code Llama、mistral、gemma 等大语言模型,可自定义客户端,还可创建异步客户端。

6、web2pdf:将网页转换为 PDF 的 CLI[26]

一个命令行工具,可将网页转换为格式精美的 pdf。支持批量转换、自定义样式、附加 CSS、复杂布局、页码、目录和分页符等功能。

7、natural-sql:文本生成 SQL 的大语言模型[27]

NaturalSQL-7B 是拥有超高准确性的文本生成 SQL 大模型,在 SQL-Eval 基准测试中领先 GPT-3.5-turbo 和 claude-2,也领先于同数据规模的 sqlcoder-7b。

8、rawdog:在 CLI 中自动生成并执行 Python 脚本[28]

Rawdog(具有确定性输出生成的递归增强)是 RAG(检索增强生成)的一种新颖替代方案,可以自己运行脚本并获取输出作为上下文,然后再次调用自己。演示视频的例子很惊艳。(star 1.6K)

9、UFO:基于 UI 与 Windows 系统交互的 AI 代理[29]

微软新推出的 AI 代理框架,可无缝跨多应用操作,完成用户的复杂任务。使用 GPT-Vision 的多模态功能来理解应用 UI,使用 Windows UI 自动化控件交互。(star 1.9K)

7a409a945f2b7d1ca2e67bca65af91a3.webp基于不同素材自动编写并发送邮件

10、toolong:查看、跟踪、合并和搜索日志文件(以及 JSONL)的终端应用[30]

在命令行终端快速查看日志文件,支持实时尾随、语法高亮、快捷搜索、自动检测时间戳合并日志等功能,支持 JSONL 文件,可自动打开 .bz 和 .bz2 文件。(star 2K)

11、Owl:在本地运行的个人可穿戴 AI[31]

在可穿戴设备上搭载 AI,倾听和观察你生活中发生的一切。支持 ESP 平台、Sony Spresense 或 Apple Watch 等硬件,支持本地和在线模型,多模态采集,说话人验证等。

12、hyperdiv:用 Python 构建响应式 Web UI[32]

一个用 Python 快速开发响应式 UI 应用的框架,具有内置组件、简洁的即时模式语法和少量的工具样板。支持 Shoelace 组件,支持 Markdown,集成 Chart.js 图表,支持读写浏览器缓存,支持表单验证等。

13、fabric:使用 AI 增强人类[33]

这个项目旨在使每个人能将 AI 用于解决日常问题。它的方法是将问题拆解成很多独立组件,使用结构化的清晰提示让 AI 完成任务。(star 5.6K)

🐢播客&视频

1、Meta 喜欢 Python[34]

Meta 官方的一期播客节目,讨论了开发团队对最新 Python 版本的贡献,包括允许自定义 JIT(如 Cinder)的新钩子、永生对象、对类型系统的改进、更快的推导式等等。Meta 对 Python 社区的贡献确实很足哦~(附:谷歌、微软、Meta?谁才是 Python 最大的金主?[35])

2、Talk Python To Me #449:使用 FastUI 构建 UI[36]

FastUI 是一个 Web 界面开发框架,可使用 React 构建响应式 Web 应用,而无需编写任何 JavaScript 或接触 npm。这期播客的嘉宾是该框架的作者。

🐼欢迎订阅

  • 微信公众号[37]:除更新周刊外,还发布其它原创作品,并转载一些优质文章。(可加好友,可加读者交流群)
  • 博客[38] 及 RSS[39]:我的独立博客,上面有历年原创/翻译的技术文章,以及从 2009 年以来的一些随笔。
  • 邮件[40] 及 RSS[41]:在 Substack 上开通的频道,满足你通过邮件阅读时事通讯的诉求。
  • Github[42]:你可以获取本周刊的 Markdown 源文件,做任何想做的事!
  • Telegram[43]:除了发布周刊的通知外,我将它视为一个“副刊”,补充发布更加丰富的资讯。
  • Twitter[44]:我的关注列表里有大量 Python 相关的开发者与组织的账号。
参考资料 [1]

投稿: https://github.com/chinesehuazhou/python-weekly

[2]

电报频道: https://t.me/pythontrendingweekly

[3]

uv:Rust 开发的 Python 打包工具: https://astral.sh/blog/uv

[4]

Rye:愿景延续: https://lucumr.pocoo.org/2024/2/4/rye-a-vision/

[5]

Rye: a Hassle-Free Python Experience: https://www.youtube.com/watch?v=q99TYA7LnuA

[6]

Rye Grows With UV: https://lucumr.pocoo.org/2024/2/15/rye-grows-with-uv/

[7]

为什么越来越多用 Rust 开发的库?: https://baincapitalventures.com/insight/why-more-python-developers-are-using-rust-for-building-libraries/

[8]

80 行 Python 实现一个搜索引擎: https://www.alexmolas.com/2024/02/05/a-search-engine-in-80-lines.html

[9]

如何计算 Python 中的 CPU 指令数?: https://blog.mattstuchlik.com/2024/02/08/counting-cpu-instructions-in-python.html

[10]

Cirron: https://github.com/s7nfo/Cirron

[11]

Python 复用装饰器代码: https://www.kawabangga.com/posts/5757

[12]

像专业人士一样处理 Asyncio 任务: https://jacobpadilla.com/articles/handling-asyncio-tasks

[13]

使用 textwrap 模块操作字符串: https://martinheinz.dev/blog/108

[14]

总结 Python 版本间的主要变更点: https://www.nicholashairs.com/posts/major-changes-between-python-versions/

[15]

网站: https://endoflife.date/python

[16]

将 Postgres 作为队列使用: https://leontrolski.github.io/postgres-as-queue.html

[17]

我在所有 Django 项目中都用的 20 个包: https://learndjango.com/tutorials/20-django-packages-i-use-every-project

[18]

Python 元类的真实案例: https://dev.to/anbagu/real-case-of-python-metaclass-application-2pj8

[19]

一万亿行气象数据的编程挑战: https://blog.coiled.io/blog/1trc.html

[20]

Python 潮流周刊第一季精华合集(1~30): https://pythoncat.top/posts/2023-12-11-weekly

[21]

uv:性能极快的 Python 包安装和解析器: https://github.com/astral-sh/uv

[22]

sqlite-web:基于 Web 的 SQLite 数据库工具: https://github.com/coleifer/sqlite-web

[23]

celery-exporter:导出 Celery 指标用于 Prometheus: https://github.com/danihodovic/celery-exporter

[24]

pyupgrade:自动升级 Python 较新版本的语法 : https://github.com/asottile/pyupgrade

[25]

ollama-python:Ollama Python 库: https://github.com/ollama/ollama-python

[26]

web2pdf:将网页转换为 PDF 的 CLI: https://github.com/dvcoolarun/web2pdf

[27]

natural-sql:文本生成 SQL 的大语言模型: https://github.com/cfahlgren1/natural-sql

[28]

rawdog:在 CLI 中自动生成并执行 Python 脚本: https://github.com/AbanteAI/rawdog

[29]

UFO:基于 UI 与 Windows 系统交互的 AI 代理: https://github.com/microsoft/UFO

[30]

toolong:查看、跟踪、合并和搜索日志文件(以及 JSONL)的终端应用: https://github.com/Textualize/toolong

[31]

Owl:在本地运行的个人可穿戴 AI: https://github.com/OwlAIProject/Owl

[32]

hyperdiv:用 Python 构建响应式 Web UI: https://github.com/hyperdiv/hyperdiv

[33]

fabric:使用 AI 增强人类: https://github.com/danielmiessler/fabric

[34]

Meta 喜欢 Python: https://engineering.fb.com/2024/02/12/developer-tools/meta-loves-python/

[35]

谷歌、微软、Meta?谁才是 Python 最大的金主?: https://pythoncat.top/posts/2022-11-21-sponsors

[36]

Talk Python To Me #449:使用 FastUI 构建 UI: https://talkpython.fm/episodes/show/449/building-uis-in-python-with-fastui

[37]

微信公众号: https://qinglite-1253448069.cos.ap-shanghai.myqcloud.com/web/e60bd68bc8457412c2aa53620ba674452ec756f7

[38]

博客: https://pythoncat.top

[39]

RSS: https://pythoncat.top/rss.xml

[40]

邮件: https://pythoncat.substack.com

[41]

RSS: https://pythoncat.substack.com/feed

[42]

Github: https://github.com/chinesehuazhou/python-weekly

[43]

Telegram: https://t.me/pythontrendingweekly

[44]

Twitter: https://twitter.com/chinesehuazhou

82d6b42ed16c738f0fd2a17a2065ed7f.webp 如果你觉得本文有帮助 请慷慨 分享 点赞 ,感谢啦
浏览 15
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报