日常生活中每天都在产生数据,这些原始数据存在数据不完整、数据不一致、数据异常等情况,严重影响数据的质量,甚至可能导致利用上的偏差,因此数据预处理技术应运而生。本章首先概述数据预处理,让读者对其有一个整体的认识;然后介绍Python数据预处理的开发工具与运行环境;最后结合中文分词的实战案例,让读者了解数据预处理的工作流程。