译者序

本书是一本最基础、最实用的Python数据整理学习资料。它从简单的数据结构实现开始,逐步深入到复杂的数据管理系统操作,可供数据整理入门级到中高级的读者学习,是一本可以陪伴你成长的好书。本书在每章都安排了大量的练习以帮助读者全方位地理解并掌握相关概念。除此之外,本书还组织了很多活动和实例以进一步综合运用相关工具和技术。

全书共分为9章。第1章详细介绍了数据整理的重要性,明确了Python数据整理工作中的重点,并介绍了Python的基本数据结构及其实现;第2章是本书的基础,阐述了Python中的高级数据结构和操作系统的文件操作功能;第3章着重描述了Python中NumPy、pandas和Matplotlib三个基本库的基础知识;第4章深入分析了pandas DataFrame的相关知识;第5章介绍了应用于现实生活的网络抓取的数据整理技术;第6章提出现实生活中发生的数据问题,并学习如何解决这些问题;第7章学习如何从网页、XML文件和API中收集数据;第8章解释了数据库的概念(包括数据库的创建、操作和控制),以及如何将表格转换为pandas DataFrame;第9章将前面所学的知识应用到实际数据集中,并对其不同方面进行研究。

翻译工作的分工如下:马羚负责前言、目录和第1~3章的翻译;姚成柱负责第4~6章的翻译;吕晓峰负责第7、8章的翻译;邓力负责第9章的翻译;张振负责附录和全书图表的翻译以及后期的校稿工作。马羚负责全书的统筹协调,并对全书进行了最后的统稿。

由于本书内容丰富,包含的细节多,加上译者水平有限,书中难免有不当和疏漏之处,敬请读者提出宝贵意见。

译者

2019年12月