PyGWalker:Python 中最好的数据分析库
共 1778字,需浏览 4分钟
·
2024-06-04 08:13
↓推荐关注↓
你在 Jupyter Notebook 中有一堆数据需要分析和可视化。PyGWalker 就像一个神奇的工具,使这一过程变得超级简单。
它将你的数据转换成一种特殊的表格,你可以像使用 Tableau 一样与之交互。
你也可以直观地探索数据,随意操作,发现模式和见解,而不会迷失在复杂的代码中。
PyGWalker 简化了一切,让你能够快速、轻松地分析和理解数据。
官方:https://github.com/Kanaries/pygwalker
使用方法
通过 pip 安装 PyGWalker 库
!pip install pygwalker -q
要在 Jupyter Notebook 中开始使用 PyGWalker,你需要导入两个必要的库:pandas 和 pygwalker。
import pandas as pd
import pygwalker as pyg
import pandas as pd
这一行允许你以表格格式处理数据,而 import pygwalker as pyg
则引入了 PyGWalker 库。
导入后,你可以将 PyGWalker 无缝集成到现有工作流程中。
例如,你可以使用 pandas 加载数据
df = pd.read_csv('my_data.csv')
然后,你可以通过传递数据框作为参数,创建一个名为 “gwalker” 的 PyGWalker 实例,例如:
gwalker = pyg.walk(df)
当你执行提供的命令时,代码单元格下方将出现一个新的输出。这个输出将包含一个交互式用户界面。
该界面提供了多种拖放功能,你可以利用这些功能来分析和探索数据。它提供了一种方便且交互式的方式与数据进行交互,使你能够执行数据可视化、探索关系等任务。
使用 PyGWalker,你现在拥有一个类似于 Tableau 的用户界面,可以分析和可视化数据。
PyGWalker 提供了更改标记类型的灵活性,使你能够创建不同的图表。例如,你可以通过选择所需的变量并选择折线标记类型,轻松切换到折线图。
你还可以通过创建并排视图来比较不同的度量。通过将多个度量添加到行或列中,你可以轻松地并排分析和比较它们。
你可以根据特定的类别或特征将数据组织成不同的部分。这有助于你单独分析和比较数据的不同子集。
PyGWalker 允许你以表格格式查看数据并自定义分析类型和语义类型。你可以轻松地以结构化方式可视化数据,并根据你的具体需求调整数据的分析和解释方式。
你还可以将数据探索结果保存到本地文件。
PyGWalker 是一个功能多样的库,提供了众多功能。探索这个强大的工具可以提升你的数据分析和可视化技能。
- EOF -
星球服务
知识星球是一个面向 全体学生和在职人员 的技术交流平台,旨在为大家提供社招/校招准备攻略、面试题库、面试经验、学习路线、求职答疑、项目实战案例、内推机会等内容,帮你快速成长、告别迷茫。
涉及Python,数据分析,数据挖掘,机器学习,深度学习,大数据,搜光推、自然语言处理、计算机视觉、web 开发、大模型、多模态、Langchain、扩散模型、知识图谱等方向。
我们会不定期开展知识星球立减优惠活动,加入星球前可以添加城哥微信:dkl88191,咨询详情。
技术学习资料如下,星球成员可免费获取2个,非星球成员,添加城哥微信:dkl88191,可以单独购买。