Python数据科学手册(Python Data Science Handbook)是由美国加州大学伯克利分校教授Jake VanderPlas编写的一本关于Python在数据科学领域的应用的书籍。Python数据科学手册电子版详细介绍了如何使用Python进行数据处理、可视化和机器学习等方面的内容,Python数据科学导论完整版是一本非常适合数据科学从业者和学习者的实用书籍。
Python数据科学手册电子版内容概览
本书每一章都重点介绍一到两个程序包或工具,它们是Python数据科学的基础。
IPython和Jupyter(第1章)
这两个程序包为许多使用Python的数据科学家提供了计算环境。
NumPy(第2章)
这个程序库提供了ndarray对象,可以用Python高效地存储和操作大型数组。
Pandas(第3章)
这个程序库提供了DataFrame对象,可以用Python高效地存储和操作带标签的/列式数据。
Matplotlib(第4章)
这个程序库为Python提供了许多数据可视化功能。
Scikit-Learn(第5章)
这个程序库为最重要的机器学习算法提供了高效整洁的Python版实现。
Python数据科学(PyData)世界里当然不只有这五个程序包;
相反,情况是日新月异的。
因此,我在每章结尾都列举了用Python实现的其他有趣的图书、项目和程序包的参考资料。
不过这五个程序包是目前在Python数据科学领域中完成大部分工作的基础,即使生态系统在不断成长,我仍然觉得它们五个非常重要。
Python数据科学手册电子版排版约定
黑体
表示新术语或重点强调的内容。
等宽字体(constant width)
表示程序片段,以及正文中出现的变量、函数名、数据库、数据类型、环境变量、语句和关键字等。
加粗等宽字体(constant width bold)
表示应该由用户输入的命令或其他文本。
等宽斜体(constant width italic)
表示应该由用户输入的值或根据上下文确定的值替换的文本。
∨ 展开