像对象一样对待数据
入门教程、案例源码、学习资料、读者群
请访问: python666.cn
咱们编程教室有不少同学,学完了基础课程,掌握了一定的编程能力,开始做项目了。然后很可能遇到一个问题:管理数据。课程里有讲过用文件保存数据,还有 pickle、csv 等模块辅助。但对于稍微复杂一点的数据,往往不够方便。成熟的解决方案就是使用数据库。
估计每个刚刚使用数据库的人都会被坑得遍体鳞伤。对于一个刚刚学会 Python 不久的开发新手来说,使用数据库的 SQL 语句几乎相当于再学一种新的语言。虽然 sqlite、pymysql 等模块提供了与数据的连接,但仍然需要自己去拼接 SQL 语句。Python 语法和 SQL 语法、各种引号、百分号、转义字符混杂在一起的酸爽,用过的人都忘不了。
所以实际开发中,如无特殊需求,一般不会直接写 SQL,而是用更为方便的 ORM(对象关系映射,Object Relational Mapping)。顾名思义,就是将关系型数据库与 Python 中的对象关联起来,提供了一种操作数据的简便方式,相当于对数据库加了一层更友好的接口。
目前 Python 中比较流行的 ORM 解决方案有三种:
Django ORM。使用方便,但很难脱离 Django 单独使用。
SQLAlchemy。功能强大,成熟可扩展,但学习门槛较高。
peewee。轻量,可扩展,易学习,但功能有限。
对于偏初级的小型项目,通常用不到很复杂的功能,这时候 peewee 或许是最好的选择。今天我们就来重点介绍下 peewee 这个 Python ORM 库。
> 安装
pip install peewee
> 连接数据库
以 SQLite 为例:
import peewee
db = peewee.SqliteDatabase('people.db')
db.connect()
people.db 是 SQLite 的数据库文件,如果不存在会自己新建。
如果是 MySQL,要稍微复杂点,需再提供地址、用户名、密码等信息,并且必须先手动建好库:
db = peewee.MySQLDatabase('people', host='127.0.0.1', user='root', passwd='', charset='utf8', port=3306)
特别要记住的一点是,代码进行完所有数据库操作后,要主动关闭数据库:
db.close()
> 创建数据类型
既然是与对象关联,自然需要以面向对象的方式定义数据结构。我们假定一个表示人的类型 Person,包含姓名 name 和生日 birthday 两个字段:
class Person(peewee.Model):
class Meta:
database = db
name = peewee.CharField()
birthday = peewee.DateField()
Person.create_table()
如果是用过 Django 的同学,对这个 Model 应该非常熟悉了。要注意的就是,需要在 Meta 里定义 database 为前面创建的数据库。然后使用相应的 Field 类型定义字段即可。
> 新增数据对象
from datetime import date
# 方法1
uncle_bob = Person(name='Bob', birthday=date(1960, 1, 15))
uncle_bob.save()
# 方法2
Person.create(name='Crossin', birthday=date(1985, 5, 5))
直接创建数据对象,需要调用 save
方法保存到数据库中。而使用 create
方法创建则不用。
> 查找数据对象
bob = Person.get(Person.name == 'Bob')
print(bob.name, bob.birthday)
# 获取所有数据
for person in Person.select():
print(person.name)
注意这里的查找条件写法,这与 Django 是不同的。查找还可以用 where
语句,这里不做演示,可以参考官方文档。
> 修改数据对象
对于上一步找到的 bob 变量:
bob.name = 'Robert'
bob.save()
直接向属性赋值,修改完记得要 save
。
> 删除数据对象
bob.delete_instance()
顺便说句,一般不建议在数据库里删除数据,因为数据删了就不好找回来了,而且可能还会引发关联数据的报错。通常是增加一个 is_deleted
字段标记已删除的内容。(所以,不要以为在网上把发布过的内容删掉就真的不存在了)
> 创建关联数据
在程序中,经常会有一些具有关联关系的数据。比如我们再创建一个宠物类 Pet,每个宠物有名字 name 和主人 owner。owner 对应的就是我们前面创建的 Person 类:
class Pet(peewee.Model):
class Meta:
database = db
owner = peewee.ForeignKeyField(Person, backref='pets')
name = peewee.CharField()
这样一来,我们就可以很方便的通过宠物找到它的主人:
bob_kitty = Pet.create(owner=bob, name='Kitty')
bob_fido = Pet.create(owner=bob, name='Fido')
print(bob_kitty.owner.name)
也可以找到一个人养的所有宠物:
for pet in bob.pets:
print(pet.name)
以上就是 peewee 的基本操作,如果你了解面向对象,应该不难理解。这些例子取自其官方文档的快速上手 Quickstart。虽然没有像 Requests 那样贴心地提供中文版,但也同样足够人性化。
地址:http://docs.peewee-orm.com/en/latest/peewee/quickstart.html
> 自动生成代码
peewee 提供了一个功能,可以从已有的数据库反向生成数据模型代码。以 SQLite 为例:
python -m pwiz -e sqlite people.db > db.py
在你的数据库文件所在路径下执行这条命令,就可以在 db.py 中自动生成代码。
自动生成的代码
在我们先前的案例中,有一些就使用了 peewee。比如 Python 高频词汇表(关键字:单词)和押韵检索工具(关键字:押韵)。在本公众号(Crossin的编程教室)里回复相应关键字可查看文章及代码。
最后提一下,除了使用 ORM 外,对于数据存储还有一种解决方案,就是使用非关系型数据库,比如 mongodb。尽管坑也不少,但对于简单的数据存储来说,它有个巨大的优势就是同 Python 内置的 dict、list 等类型兼容良好,可以直接存取,让你甚至感觉不到有数据库的存在,也根本无需关心 SQL 语句。爬虫实战课程中的部分案例,就选择了 mongodb 作为数据存储方案。
本书从 Python 和 Excel 结合使用的角度讲解处理分析数据的思路、方法与实战应用。不论是希望从事数据分析岗位的学习者,还是其他职业的办公人员,都可以通过本书的学习掌握 Python 分析数据的技能。书中创新性地将 ChatGPT 引入到教学当中,用 ChatGPT 答疑并提供实训代码,并介绍了使用 ChatGPT 辅助学习的一些实用技巧,给学习者带来全新的学习方式。
公众号的读者朋友们购买后可在后台联系我,加入读者交流群,Crossin会为你开启陪读模式,解答你在阅读本书时的一切疑问。
_往期文章推荐_