深入大型数据集:并行与分布化Python代码
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

总结

■ map语句是一个将数据序列(比如一个列表或者一个tuple中的数据)转换为其他类型数据序列的很好方法。

■ 当我们遇到一个for循环时,应该寻找机会用一个map函数来替换该循环。

■ 因为map函数只是为转换定义了规则,而不是执行实际的转换,所以它可以很好地与并行技术相结合,从而加快代码的执行速度。

■ 我们可以使用map函数获取维基百科或者Web上的数据(只要我们知道想要抓取的URL或者需要调用的API)。

■ 因为map函数会创建一些指令,而不会立即对它们求值,所以它并不能很好地处理有状态对象,特别是在并行执行时更是如此。