pandas数据处理与分析
pandas是一个强大的数据处理与分析工具集!
本书梳理了pandas中常用的函数,将函数之间的逻辑关系总结为“基础知识+4类操作+4类数据”的模块结构,展示了数据处理的宏观体系,并针对数据分析中“怎么分析”“怎么处理”“怎么加速”3个核心问题给出解决方案。
※编辑推荐:
本书结合大量代码讲解理论知识,并通过“练一练”和章末的“习题”等形式提供高质量的练习,帮助读者理解、强化和拓展所学知识。
本书不需要读者掌握数据科学或数据分析的先验知识,适合具有一定Python编程基础、想要使用pandas进行数据处理与分析的数据科学领域的从业者或研究人员阅读。
※内容简介:
本书以Python中的pandas库为主线,介绍各类数据处理与分析方法。
本书共包含13章,第一部分介绍NumPy和pandas的基本内容;第二部分介绍pandas库中的4类操作,包括索引、...
pandas是一个强大的数据处理与分析工具集!
本书梳理了pandas中常用的函数,将函数之间的逻辑关系总结为“基础知识+4类操作+4类数据”的模块结构,展示了数据处理的宏观体系,并针对数据分析中“怎么分析”“怎么处理”“怎么加速”3个核心问题给出解决方案。
※编辑推荐:
本书结合大量代码讲解理论知识,并通过“练一练”和章末的“习题”等形式提供高质量的练习,帮助读者理解、强化和拓展所学知识。
本书不需要读者掌握数据科学或数据分析的先验知识,适合具有一定Python编程基础、想要使用pandas进行数据处理与分析的数据科学领域的从业者或研究人员阅读。
※内容简介:
本书以Python中的pandas库为主线,介绍各类数据处理与分析方法。
本书共包含13章,第一部分介绍NumPy和pandas的基本内容;第二部分介绍pandas库中的4类操作,包括索引、分组、变形和连接;第三部分介绍基于pandas库的4类数据,包括缺失数据、文本数据、分类数据和时间序列数据,并介绍这4类数据的处理方法;第四部分介绍数据观测、特征工程和性能优化的相关内容。本书以丰富的练习为特色,每章的最后一节为习题,同时每章包含许多即时性的练习(练一练)。读者可通过这些练习将对数据科学的宏观认识运用到实践中。
耿远昊,威斯康星大学麦迪逊分校统计学硕士在读,Datawhale成员,“Joyful Pandas”开源项目作者。pandas贡献者,活跃于pandas开源社区,主要贡献涉及漏洞修复、功能实现与性能优化等方面,对pandas在数据处理与分析中的应用有丰富经验。