数据化运营:系统方法与实践案例
上QQ阅读APP看书,第一时间看更新

1.4 数据运营应掌握的技能

“工欲善其事,必先利其器”,日常工作中数据运营人员主要对接运营、客服、BD等部门人员的数据提取、分析、挖掘方面的需求,需要掌握以下几方面的技能:Excel、SQL、Python、PPT以及业务理解能力。

1. Excel数据处理与绘图

Excel的重要性不言而喻,日常数据处理、分析、作图、数据透视、报表管理模板都离不开Excel。其中,需要熟练运用数据透视表和常用函数。

数据透视表:可以快速完成对待分析数据的汇总、筛选、排序等功能,如图1-5所示。

图1-5 数据透视表处理数据

常用函数:熟练掌握Excel的函数不仅有利于日常处理数据,同样有利于快速搭建数据管理报表。常用的函数包括关联匹配类函数、计算类函数和逻辑运算类函数。

(1)关联匹配类函数

❑VLOOKUP(查找目标,查找范围,查找范围中包含返回值列号,精确匹配或模糊匹配):用于按行查找表或区域中的内容。

❑INDEX(单元格区域,选择数组中某行,选择数组中某列[可选]):用于返回表格或区域中的值或值的引用。

❑MATCH(待匹配的值,查找区域):用于在单元格区域中搜索某项,然后返回该项在单元格区域中的相对位置。

❑OFFSET(单元格引用,左上角单元格引用的向上或向下行数,左上角单元格引用的从左到右的列数,需要返回的引用的行高,需要返回的引用的列宽):从给定引用中返回引用偏移量。

(2)计算类函数

❑SUM(要相加的第一个数字,要相加的第二个数字):求参数的和。

❑COUNT(单元格引用区域):计算参数列表中数字个数。

❑MAX(单元格引用区域):返回参数列表中最大值。

❑MIN(单元格引用区域):返回参数列表中最小值。

❑RAND():返回0和1之间的一个随机数。

❑ROUND(要四舍五入的数字,要进行四舍五入的位数):将数字按指定位数舍入。

(3)逻辑运算类函数

❑IF(要判断逻辑,结果为真返回值,结果为假返回值):指定要执行的逻辑检测。

❑IFERROR(检查是否存在错误,公式计算错误时返回值):如果公式计算错误,则返回指定的值,否则返回公式结果。

❑AND(逻辑条件1,逻辑条件2[可选]):如果所有参数均为TRUE,则返回TRUE,常用于扩展执行逻辑测试的其他函数调用。

熟练掌握上面几个常用函数可以满足日常工作中的大部分需求。

2. SQL类语言

数据运营人员对数据进行分析时需要从数据仓库中提取。无论是PostgreSQL、Hive SQL、impala还是MySQL,它们的SQL语法是相通的。熟练掌握SQL语言对于数据提取、数据建模、数据分析是非常有帮助的。

3. Python语言

Python在数据运营中的应用非常广泛,爬取竞品数据、自动化任务脚本、数据建模与分析都离不开对Python语言的熟练运用。由于本书不是讲解Python语言的书籍,在这里只提出做好数据分析需要掌握的一些Python工具。

❑Pandas:一款针对数据处理和分析的工具包,其中实现了大量便于数据读写、清洗、填充以及分析的功能。可以帮助数据挖掘人员节省大量用于数据预处理工作的代码。

❑NumPy:除了提供一些高级的数学运算机制以外,还具备非常高效的向量和矩阵运算功能。这些功能对于机器学习的计算任务尤为重要。

❑SciPy:是在NumPy的基础上构建的,更为强大,应用领域也更为广泛的科学计算工具。包含的功能有最优化、线性代数、积分、插值、拟合、常微分方程求解、快速傅里叶变换、信号处理和图像处理等。SciPy的安装依赖于NumPy。

❑Scikit-learn:著名的机器学习库(http://scikit-learn.org/stable/),它封装了大量经典以及最新的机器学习模型,接口封装非常完善,几乎所有机器学习算法的输入输出部分格式都一致。网站首页截图如图1-6所示。

图1-6 Scikit-Learn主页

4. PPT制作能力

在数据分析完成后,如何制作PPT将分析结论形象、具体地展现出来,直观地将信息传递给需求方或管理者,是数据分析师必须要掌握的技能。

5.业务理解能力

数据运营本身就是从业务中来,再指导到业务中去。无论是简单提取业务数据,结合业务的经营分析,还是用户画像建模,对业务的理解始终贯穿其中。数据运营人员需要学习业务逻辑、业务背景和业务知识,这样提交的分析报告或做出的解决方案才能真正回答出业务方需要的答案。