Excel与Power BI数据分析从新手到高手
上QQ阅读APP看书,第一时间看更新

3.2 修复格式不规范的数据

无论是用户手动输入的数据,还是从其他程序中导入的数据,都可能存在不规范的格式,导致这些数据无法被Excel识别为正确的数据类型,直接影响后期的数据计算和处理。利用Excel提供的一些功能,可以快速修复格式不规范的数据。

3.2.1 使用分列功能拆分复杂数据

在将由其他程序导出的数据导入Excel后,一些数据的格式可能不符合Excel格式规范。如图3-21所示,在B列中包含了商品名称和类别名称,它们之间以“&”符号分隔,为了便于单独处理商品名称和类别名称,需要将B列中的内容拆分为两列,使商品名称和类别名称各占一列。使用Excel中的“分列”功能可以轻松完成这项工作。

图3-21 商品名称和类别名称混合在一起

拆分商品名称和类别名称的操作步骤如下:

(1)右击C列的列标,在弹出的菜单中选择“插入”命令,在B、C两列之间插入一个空列,如图3-22所示。执行该操作是因为将B列内容分为两列后,其中的一列将会覆盖现有的C列,为了避免出现这种情况,需要提前插入一个空列。

(2)选择要拆分的数据区域,本例为B2:B11,然后在功能区的“数据”选项卡中单击“分列”按钮,如图3-23所示。

(3)打开“文本分列向导”对话框,选中“分隔符号”单选按钮,然后单击“下一步”按钮,如图3-24所示。

(4)显示如图3-25所示的选项,选中“其他”复选框,并在右侧的文本框中输入“&”,然后单击“下一步”按钮。

图3-22 选择“插入”命令

图3-23 单击“分列”按钮

图3-24 选中“分隔符号”单选按钮

图3-25 指定分隔符号

(5)显示如图3-26所示的选项,在“目标区域”中指定分列后数据区域的左上角位置,然后单击“完成”按钮,即可将B列数据拆分为两列。用户可以为拆分后的两列数据设置合适的列标题,如图3-27所示。

图3-26 指定分列后数据区域的左上角位置

图3-27 数据拆分后的效果

3.2.2 更正使用小数点分隔的日期

在输入日期时,有些用户习惯使用小数点分隔日期中的年、月、日,这种格式的日期只是从外表上看上去像日期,实际上并不是真正的日期,而只是普通的文本,因此无法参与日期的相关计算和处理,如图3-28所示。

使用“替换”功能可以快速更正不规范的日期格式,操作步骤如下:

(1)选择日期所在的单元格区域,本例为A2:A11。然后在功能区的“开始”选项卡中单击“查找和选择”按钮,在弹出的菜单中选择“替换”命令。

(2)打开“查找和替换”对话框中的“替换”选项卡,在“查找内容”文本框中输入“.”,在“替换为”文本框中输入“/”或“-”,然后单击“全部替换”按钮,如图3-29所示。

图3-28 使用小数点分隔年月日的日期

图3-29 设置“替换”选项

(3)显示替换成功的提示信息,如图3-30所示,单击“确定”按钮,然后单击“关闭”按钮。更正格式后的日期如图3-31所示。

图3-30 替换成功的提示信息

图3-31 更正格式后的日期

3.2.3 转换不正确的数据类型

有时由于输入有误或从外部导入等原因,导致数据的类型不正确而影响后续操作,例如无法正确对数据进行计算或统计分析。Excel允许用户在特定的数据类型之间进行转换,最常见的情况是文本型数字与数值之间、逻辑值与数值之间的转换。

1.文本型数字与数值之间的转换

将文本型数字转换为数值有以下两种方法:

· 如果在单元格中以文本格式输入数字,该单元格的左上角会显示一个绿色三角。单击这个单元格将显示按钮,单击该按钮,在弹出的菜单中选择“转换为数字”命令,如图3-32所示。

· 通过四则运算或函数可以将文本型数字转换为数值。

图3-32 选择“转换为数字”命令

以下任意一个公式都可以将A1单元格中的文本型数字转换为数值:

     =A1*1
     =A1/1
     =A1+0
     =A1-0
     =--A1
     =VALUE(A1)

提示:关于公式和函数的更多内容,请参考第4章。

如果要将数值转换为文本型数字,可以使用“&”符号将数值和一个空字符连接起来。下面的公式将A1单元格中的数值转换为文本型数字,一对半角双引号中不包含任何内容。

     =A1&""

提示:“&”是Excel中的一个运算符,用于将两部分内容连接为一个整体。关于该符号和其他运算符的更多内容,请参考第4章。

2.逻辑值与数值之间的转换

将逻辑值转换为数值与将文本型数字转换为数值的方法类似,对逻辑值TRUE或FALSE执行乘1、除1、加0、减0的四则运算即可完成数据类型的转换。在条件判断中,任何非0的数字等价于逻辑值TRUE,0等价于逻辑值FALSE。

逻辑值与数值或逻辑值之间都可以进行四则运算,此时的逻辑值TRUE等价于1,逻辑值FALSE等价于0。下面说明了逻辑值TRUE和FALSE在四则运算中的计算方式,“*”在Excel公式中表示乘法。

     TRUE*6=6
     FALSE*6=0
     TRUE+6=7
     FALSE+6=6
     TRUE*FALSE=0