Excel与Power BI数据分析从新手到高手
上QQ阅读APP看书,第一时间看更新

2.2 导入数据

虽然用户可以在Excel中方便快速地输入数据,但是在很多情况下,要分析的数据是由其他程序创建的。为了在Excel中处理和分析这些数据,用户需要将它们导入Excel中。Excel支持导入多种类型的数据,例如文本文件、Access数据库、SQL Server数据库以及OLAP多维数据集等来源的数据。本节以导入文本文件和Access数据库为例,介绍在Excel中导入其他程序数据的方法,还将介绍使用Microsoft Query将外部数据导入Excel的方法。

2.2.1 导入文本文件中的数据

文本文件是一种跨平台的通用文件格式,适合在不同的操作系统和程序之间交换数据,用户可以很容易地将文本文件中的数据导入到Excel中。如图2-24所示,要在Excel中导入的文本文件有5列数据,各列之间以制表符进行分隔。

将该文本文件中的数据导入Excel中的操作步骤如下:

(1)新建或打开要导入数据的Excel工作簿,在功能区的“数据”选项卡中单击“从文本/CSV”按钮,如图2-25所示。

图2-24 以制表符分隔的数据

图2-25 单击“从文本/CSV”按钮

提示:如果使用Excel 2019之前的Excel版本,则需要单击“数据”选项卡中的“自文本”按钮。

(2)打开“导入数据”对话框,双击要导入的文本文件,本例为“商品销售明细.txt”,如图2-26所示。

图2-26 双击要导入的文本文件

提示:“.txt”是文件的扩展名,用于标识文件的类型。图2-26中的文件名没有显示扩展名,是因为在操作系统中通过设置将文件的扩展名隐藏了起来。

(3)打开如图2-27所示的对话框,由于文本文件中的各列数据之间使用制表符分隔,因此应该在“分隔符”下拉列表中选择“制表符”。实际上在打开该对话框时,Excel会自动检测文本文件中数据的格式,并设置合适的选项。确认无误后单击“加载”按钮。

图2-27 设置与数据格式相匹配的选项

提示:如果使用的是Excel 2019之前的Excel版本,打开的将是“文本导入向导”对话框,按照向导提示进行操作即可。

(4)Excel将在当前工作簿中新建一个工作表,并将所选文本文件中的数据以“表格”形式导入到该工作表中,如图2-28所示。以后可以右击数据区域中的任意一个单元格,在弹出的菜单中选择“刷新”命令刷新Excel中的数据,以便与文本文件中的数据保持同步,如图2-29所示。

图2-28 以“表格”形式导入数据

图2-29 刷新数据以便与数据源保持同步

提示:“表格”是Excel提供的一种动态管理数据的功能,它可以自动扩展数据区域,还可以在不输入公式的情况下自动完成求和、计算极值和平均值等常规运算。如果需要,可以将表格转换为普通的单元格区域。

2.2.2 导入Access数据库中的数据

Access与Excel同为微软公司Office组件中的成员,但是Access是专为处理大量错综复杂的数据而设计的一个关系数据库程序。在Access数据库中,数据存储在一个或多个表中,这些表具有严格定义的结构,在表中可以存储文本、数字、图片、声音和视频等多种类型的内容。为了简化单个表包含庞大数据的复杂程度,通常将相关数据分散存储在多个表中,然后为这些表建立关系,从而为相关数据建立关联,以便可以从多个表中提取所需的信息。

Excel允许用户导入Access数据库中的数据,操作方法与导入文本文件数据类似。如图2-30所示为要在Excel中导入的Access数据库中的数据,将该数据导入Excel的操作步骤如下:

图2-30 要导入的Access数据

(1)新建或打开要导入数据的工作簿,在功能区的“数据”选项卡中单击“获取数据”按钮,然后在弹出的菜单中选择“自数据库”|“从Microsoft Access数据库”命令,如图2-31所示。

图2-31 选择“从Microsoft Access数据库”命令

提示:如果使用的是Excel 2019之前的Excel版本,则需要单击“数据”选项卡中的“自Access”按钮。

(2)打开“导入数据”对话框,双击要导入的Access数据库文件,本例为“商品销售管理系统.accdb”,.accdb是Access文件的扩展名。

(3)打开如图2-32所示的对话框,选择要导入的表,本例为“商品销售明细”,然后单击“加载”按钮。

图2-32 选择要导入的Access数据库中的表

提示:用户可以同时导入Access文件中的多个表,选中“选择多项”复选框,然后选择要导入的每个表左侧的复选框,即可同时选中这些表。

注意:如果使用的是Excel 2019之前的Excel版本,打开的将是“选择表格”对话框和“导入数据”对话框,选择要导入的Access表和放置表的位置即可。

(4)Excel将在当前工作簿中新建一个工作表,并将所选Access表中的数据以“表格”形式导入该工作表中,如图2-33所示。

图2-33 以“表格”形式导入数据

2.2.3 使用Microsoft Query导入数据

使用Microsoft Query可以将外部程序创建的数据导入到Excel中,包括文本文件、Excel、Access、FoxPro、dBASE、Oracle、Paradox、SQL Server和SQL Server OLAP Services等。使用Microsoft Query导入数据时,需要先创建一个数据源,它包含连接到外部数据的连接配置信息,以后从同一个数据库中导入数据时,可以重复使用这个数据源,而不必重新设置所需的连接信息。

在将数据最终导入Excel之前,可以先在Microsoft Query中筛选出符合条件的数据,也可以按指定的顺序排列数据,还可以选择只导入所需的列而非所有列。“查询向导”是Microsoft Query中的一个功能,使用该向导可以让数据的导入操作变得更简单。

下面使用Microsoft Query从2.2.2节所用的Access数据库,将“商品销售明细”表中销量大于300的销售数据导入Excel中,操作步骤如下:

(1)新建或打开要导入数据的工作簿,在功能区的“数据”选项卡中单击“获取数据”按钮,然后在弹出的菜单中选择“自其他源”|“自Microsoft Query”命令,如图2-34所示。

图2-34 选择“自Microsoft Query”命令

(2)打开“选择数据源”对话框,在“数据库”选项卡中选择“MS Access Database”,然后单击“确定”按钮,如图2-35所示。

(3)打开“选择数据库”对话框,通过“驱动器”和“目录”两项设置,可以定位到Access数据库所在的文件夹,然后在左侧的列表框中选择位于该文件夹中要导入的Access数据库,最后单击“确定”按钮,如图2-36所示。

提示:如果在“数据库”选项卡中没有“MS Access Database”,则需要选择“<新数据源>”创建新的数据源。

(4)打开“查询向导-选择列”对话框,在左侧的列表框中显示了Access数据库的所有表,选择要导入的表,然后单击中间的“>”按钮,将该表添加到右侧的列表框中,如图2-37所示。

图2-35 选择用于连接Access数据库的数据源

图2-36 选择包含要导入数据的Access数据库

图2-37 选择要导入的表和列

(5)单击“+”将展开表中包含的列,选择所需的列并单击“>”按钮,将选中的列表添加到右侧的列表框中。如图2-38所示,商品销售明细表中共有5列,当前添加了所有列,可以使用按钮调整它们的排列顺序,设置后单击“下一步”按钮。

图2-38 添加指定的列并调整各列的顺序

(6)显示如图2-39所示的选项,在此处可以筛选数据。本例要导入的是销量大于300的销售数据,因此需要在“待筛选的列”列表框中选择“销量”,然后将右侧的“销量”选项中的两项依次设置为“大于”和“300”,设置后单击“下一步”按钮。

图2-39 筛选符合条件的数据

(7)显示如图2-40所示的选项,在此处可以排序数据,本例将数据按照销量降序排列,设置后单击“下一步”按钮。

图2-40 设置数据的排序方式

(8)显示如图2-41所示的选项,选中“将数据返回Microsoft Excel”单选按钮,然后单击“完成”按钮。

图2-41 选择数据导入的位置

提示:用户可以单击“保存查询”按钮保存当前正在设置的数据源,便于以后重复使用。

(9)打开“导入数据”对话框,选择将数据导入Excel后的显示方式,本例选中“表”单选按钮,如图2-42所示。单击“确定”按钮,即可将销量大于300的数据导入Excel中,并按照销量从大到小进行排列,如图2-43所示。

图2-42 选择导入数据后的显示方式

图2-43 只导入销量大于300的数据