1.2.2 强大高效的第三方库
日常生活工作中所需要处理的数据通常是以一维、二维及多维(三维及以上)的形式存储,如在一张Excel表格中存储的数据通常是一维(只包括一行或一列数据)或二维(多行多列数据),这不可避免地涉及大量的矩阵运算、存储等操作,若通过Python编程直接实现矩阵中的各种运算、存储等操作不仅需要扎实的线性代数基础,还会在编程上耗费大量时间,编程所实现的方法也可能运行效率低下,对于用户非常不友好,但这些问题可以通过Python第三方库来解决。
Python第三方库可以类比为一座图书馆,人们已经在图书馆中放入了大量的图书,可以直接使用这些图书学习大量知识。回到Python语言当中理解,图书馆中的书就是人们已经写好的代码文件,这些代码完成了各种复杂的功能,我们只需学会调用这些代码就能实现这些复杂的功能,例如要对一列房价数据从小到大排序,某个第三方库中已经写好了实现排序的代码,那么直接调用这个库里的代码就能实现排序,不需要再自己从头开始编程实现排序功能。
Python众多全面、强大而又高效的科学计算库已经为用户提供了大量科学计算的方法,读者只需拥有Python编程基础并且熟练掌握这些库的常用方法就可以对庞大的矩阵数据进行一系列复杂的操作,能够对数据进行科学计算就已经跨出了数据分析的一大步。
本书涉及的科学计算常用库如表1-3所示。
表1-3 本书涉及的科学计算常用库
当然,Python中每个第三方库中蕴含的知识量可能非常丰富,作为学习者不太可能精通一个库里的所有内容,读者可以从不同渠道学习库里的知识,但通常一个第三方库会提供一个官方的教程文档,类似于字典,有生僻字可以通过字典查找这个字的读音、含义等,当我们对一些库里的知识遗忘或者不清楚怎么操作时就可以通过查找官方教程文档来帮助我们,并且重复多遍地阅读教程文档是掌握这个第三方库内容的最直接的方法。
可能有部分读者会产生疑问,是不是有了官方手册就不用学这些库里的知识了呢?想要实现一个功能当场查找文档不就可以了?尽管这个手册能够帮助我们实现功能,但正如学习英文,认识26个英文字母就不用背单词了吗?这是一个非常大的误区,我们不一定能掌握某个第三方库的全部内容,但常用的方法、方式、技巧是必须熟练掌握的,当然读者可能会遇到需要使用从未接触过的第三方库的情况,若已有学习其他第三方库的经验,并有扎实的Python基础,读者很快就能举一反三,自行掌握这些从未遇到过的知识。
一本书无法列举Python数据分析所涉及的全部知识,知识更新的速度也很快,因此,笔者更希望读者能通过本书掌握扎实的理论基础和代码编写能力,碰到新知识有能力自行学习掌握。