Faker 都能造哪些数据

Python绿色通道

共 6825字,需浏览 14分钟

 ·

2022-05-12 23:43

↑ 关注 + 星标 ,每天学Python新技能

后台回复【大礼包】送你Python自学大礼包

我们在测试过程中,会使用一些测试数据,测试数据有时候来自数据库里的脱敏数据,有时候需要自己造。自己造一些简单的文本还好,一些复杂的,比如身份证号,信用卡号,街道地址可就麻烦了。

好在 Python 有个 faker (pip install faker)库,可以帮我们造一些测试数据:

>>> from faker import Faker
>>> fake = Faker(locale='zh_CN')
>>> fake.name()
'贺平'
>>> fake.address()
'青海省秀兰县沙湾宁德路G座 507201'
>>> fake.ssn()
'371203199110016966'
>>> fake.company()
'巨奥科技有限公司'
>>>

今天就来盘点一下,这个 faker 库可以造哪些数据:

0、支持哪些国家的语言

ar_EG - Arabic (Egypt)        阿拉伯语 - 埃及
ar_PS - Arabic (Palestine)    阿拉伯语 - 巴勒斯坦
ar_SA - Arabic (Saudi Arabia)    阿拉伯语 - 沙特阿拉伯
bg_BG - Bulgarian        保加利亚语 - 保加利亚
cs_CZ - Czech               捷克语 - 捷克
de_DE - German            德语 - 德国
dk_DK - Danish            丹麦语 - 丹麦
el_GR - Greek            希腊语 - 希腊
en_AU - English (Australia)    英语 - 澳大利亚
en_CA - English (Canada)    英语 -  加拿大
en_GB - English (Great Britain)    英语 - 英国
en_US - English (United States)   英语 -  美国
es_ES - Spanish (Spain)        西班牙语 - 西班牙
es_MX - Spanish (Mexico)        西班牙语- 墨西哥
et_EE - Estonian            爱沙尼亚语 - 爱沙尼亚
fa_IR - Persian (Iran)        波斯语 - 伊朗
fi_FI - Finnish        芬兰语 - 芬兰
fr_FR - French         法语 - 法国
hi_IN - Hindi            印地语 - 印度
hr_HR - Croatian    克罗地亚语 - 克罗地亚
hu_HU - Hungarian    匈牙利语 - 匈牙利
hy_AM - Armenian 亚美尼亚语 - 亚美尼亚
it_IT - Italian       意大利语 -  意大利
ja_JP - Japanese    日语 - 日本
ko_KR - Korean    朝鲜语 - 韩国
ka_GE - Georgian (Georgia)  格鲁吉亚语 - 格鲁吉亚
lt_LT - Lithuanian    立陶宛语 - 立陶宛
lv_LV - Latvian    拉脱维亚语 - 拉脱维亚
ne_NP - Nepali    尼泊尔语 - 尼泊尔
nl_NL - Dutch (Netherlands)    德语 - 荷兰
no_NO - Norwegian    挪威语 - 挪威
pl_PL - Polish    波兰语 - 波兰
pt_BR - Portuguese (Brazil)    葡萄牙语  - 巴西
pt_PT - Portuguese (Portugal)    葡萄牙语 - 葡萄牙
ru_RU - Russian    俄语 - 俄国
sl_SI - Slovene   斯诺文尼亚语 - 斯诺文尼亚
sv_SE - Swedish    瑞典语 - 瑞典 
tr_TR - Turkish         土耳其语 - 土耳其
uk_UA - Ukrainian    乌克兰语 - 乌克兰
zh_CN - Chinese (China)    (简体中文)
zh_TW - Chinese (Taiwan)  (繁体中文)

1、基础信息类

ssn():生成身份证号
bs():随机公司服务名
company():随机公司名(长)
company_prefix():随机公司名(短)
company_suffix():公司性质
credit_card_expire():随机信用卡到期日
credit_card_full():生成完整信用卡信息
credit_card_number():信用卡号
credit_card_provider():信用卡类型
credit_card_security_code():信用卡安全码
job():随机职位
first_name_female():女性名
first_name_male():男性名
last_name_female():女姓
last_name_male():男姓
name():随机生成全名
name_female():男性全名
name_male():女性全名
phone_number():随机生成手机号
phonenumber_prefix():随机生成手机号段

2、网络、邮箱相关

domain_name():生成域名
domain_word():域词(即,不包含后缀)
ipv4():随机IP4地址
ipv6():随机IP6地址
mac_address():随机MAC地址
tld():网址域名后缀(.com,.net.cn,等等,不包括.)
uri():随机URI地址
uri_extension():网址文件后缀
uri_page():网址文件(不包含后缀)
uri_path():网址文件路径(不包含文件名)
url():随机URL地址
user_name():随机用户名
image_url():随机URL地址
ascii_company_email():随机ASCII公司邮箱名
ascii_email():随机ASCII邮箱:
company_email():
email():
safe_email():安全邮箱

3、浏览器相关

chrome():随机生成Chrome的浏览器user_agent信息
firefox():随机生成FireFox的浏览器user_agent信息
internet_explorer():随机生成IE的浏览器user_agent信息
opera():随机生成Opera的浏览器user_agent信息
safari():随机生成Safari的浏览器user_agent信息
linux_platform_token():随机Linux信息
user_agent():随机user_agent信息

4、数字、文本、加密相关

numerify():三位随机数字
random_digit():0~9随机数
random_digit_not_null():1~9的随机数
random_int():随机数字,默认0~9999,可以通过设置min,max来设置
random_number():随机数字,参数digits设置生成的数字位数
pyfloat():
left_digits=5 #生成的整数位数, right_digits=2 #生成的小数位数, positive=True #是否只有正数
pyint():随机Int数字(参考random_int()参数)
pydecimal():随机Decimal数字(参考pyfloat参数)

pystr():随机字符串
random_element():随机字母
random_letter():随机字母
paragraph():随机生成一个段落
paragraphs():随机生成多个段落
sentence():随机生成一句话
sentences():随机生成多句话,与段落类似
text():随机生成一篇文章
word():随机生成词语
words():随机生成多个词语,用法与段落,句子,类似
binary():随机生成二进制编码
boolean():True/False
language_code():随机生成两位语言编码
locale():随机生成语言/国际 信息
md5():随机生成MD5
null_boolean():NULL/True/False
password():随机生成密码,可选参数:length:密码长度;special_chars:是否能使用特殊字符;digits:是否包含数字;upper_case:是否包含大写字母;lower_case:是否包含小写字母
sha1():随机SHA1
sha256():随机SHA256
uuid4():随机UUID

5、时间、日期类

date():随机日期
date_between():随机生成指定范围内日期,参数:start_date,end_date
date_between_dates():随机生成指定范围内日期,用法同上
date_object():随机生产从1970-1-1到指定日期的随机日期。
date_time():随机生成指定时间(1970年1月1日至今)
date_time_ad():生成公元1年到现在的随机时间
date_time_between():用法同dates
future_date():未来日期
future_datetime():未来时间
month():随机月份
month_name():随机月份(英文)
past_date():随机生成已经过去的日期
past_datetime():随机生成已经过去的时间
time():随机24小时时间
timedelta():随机获取时间差
time_object():随机24小时时间,time对象
time_series():随机TimeSeries对象
timezone():随机时区
unix_time():随机Unix时间
year():随机年份

6、地理信息

fake.city_suffix():市,县
fake.country():国家
fake.country_code():国家编码
fake.district():区
fake.geo_coordinate():地理坐标
fake.latitude():地理坐标(纬度)
fake.longitude():地理坐标(经度)
fake.postcode():邮编
fake.province():省份
fake.address():详细地址
fake.street_address():街道地址
fake.street_name():街道名
fake.street_suffix():街、路

7、其他一些组合数据

profile():随机生成档案信息
simple_profile():随机生成简单档案信息
pyiterable()
pylist()
pyset()
pystruct()
pytuple()
pydict()

比如说 profile() 生成的档案信息,可以用于用户信息接口的调试。

>>> from faker import Faker
>>> fake = Faker(locale='zh_CN')
>>> fake.profile()
{'job''软件工程师''company''四通网络有限公司''ssn''530923198408240969''residence''四川省淑华市蓟州通辽路e座 413191''current_location': (Decimal('-13.0327845'), Decimal('57.720440')), 'blood_group''AB+''website': ['http://jing.com/''https://xiuyingtang.net/''http://www.fangchao.cn/''https://xiuyingyang.cn/'], 'username''csun''name''袁琴''sex''F''address''河北省武汉县璧山西安街t座 698036''mail''jli@gmail.com''birthdate': date(19801018)}
>>>

还可以生成 Python 相关的对象:

from faker import Faker
fake = Faker(locale='zh_CN')
print('生成Python字典: {}'.format(fake.pydict(
    nb_elements=10, variable_nb_elements=True)))  # Python字典
print('生成Python可迭代对象:{}.'.format(fake.pyiterable(
    nb_elements=10, variable_nb_elements=True)))   # Python可迭代对象
print('生成Python结构:{}'.format(fake.pystruct(count=1)))  # Python结构

输出信息

生成Python字典: {'作者': 8955, '之后''pDuOmPTKZxtqyLxACLtp''是一''jmMdjwfWPERLIKuPlDyU''以后': Decimal('8836111404629.58'), '大小''yanqiu@taokang.net''目前''https://qiang.cn/privacy/''虽然': 18168987.5715}
生成Python可迭代对象:[9754, 'IaULZqbQggrGMstzOnlP''pJTARLmleQIeuOBTFUaL', 9159, 'kZqbMcPEpzRJMluKxJqT''MQIJDTOVvdzntgqswzhs', -6756.3, Decimal('137479403784.9'), 'https://06.cn/faq.htm', Decimal('-250.54314'), Decimal('-58189569317050.8'), datetime(1974, 10, 13, 15, 57, 52), datetime(2003, 4, 11, 6, 3, 6)].
生成Python结构:(['xRUPMkjaKCdOudIAagOi'], {'联系''GgqCNRIqnftahozxLoLn'}, {'今天': {0: Decimal('1062112341879.0'), 1: ['VujNTFJgcszUwNhMDOBt', Decimal('-25806285371463.0'), 9444727347789.0], 2: {0: 56297119409.0, 1: 267856.25, 2: ['RouhuObYaDdHIXkWQjqI', 45685678.720959]}}})

当然了,还有不少没有列举完,可以在 Python 解释器中输入 dir(fake),看 Faker 库都可以 fake 哪些数据,目前 Faker 支持近 300 种数据,此外还支持自己进行扩展。

8、自定义 Faker 数据类型

如果以上数据不方便测试,我们还可以自定义:

>>> from faker import Faker
>>> from faker.providers import BaseProvider
>>>
>>> # 创建自定义 Provider
>>> class CustomProvider(BaseProvider):
...     def customize_type(self):
...         return '这是我自定义的数据'
...
>>> fake = Faker()
>>> fake.add_provider(CustomProvider)
>>>
>>> fake.customize_type
0x7fe1935fb5e0>>
>>> fake.customize_type()
'这是我自定义的数据'

最后的话

本文梳理了 Faker 库可以造的常见数据,建议收藏,以后用的时候方便查找。好了,今天的分享就到这里,觉得有帮助,还请点赞、转发、关注。




  1. Python一键替换证件照背景,还用去照相馆?

  2. PyCharm为什么这么牛?





浏览 29
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报