大数据分析:R基础及应用
上QQ阅读APP看书,第一时间看更新

3.3 R的包

3.3.1 包的获取

CRAN上面发布了5000多个软件包,资源在哪?怎么使用呢?现在告诉读者怎么才能找到自己研究需要的包。

(1)在R官网单击CRAN,选择离自己距离近的镜像网,也可以直接单击网址http://cran.rstudio.com/,进入图3.13所示页面。

图3.13 R的资源获取界面

(2)在左侧导航条第一部分CRAN下可以单击Task Views链接查看任务视图,如图3.14所示。

图3.14 R的包界面

Task Views里面按照学科领域分门别类,现有的学科分类如表3.3所示。

表3.3 R应用领域

(3)单击相关学科,进入到该学科类别,以计量经济学(Econometrics)为例,如图3.15所示。

图3.15 计量经济学的包文件示例

页面给出的这个计量经济学系列的包中大致包括以下几个主题。

●Linear regression models:线性回归模型。

●Micro econometrics:微观经济学。

●Further regression models:其他的回归模型。

●Basic time series infrastructure:基本的时间序列架构。

●Time series modeling:时间序列模型。

每个主题都进行了简单的介绍,包括各个主题下有些什么软件包,以及该软件包的功能。页面按照字母表顺序列出了该学科相关的所有Packages,还给出了相关的CRAN Task View,如果在这个Task View找不到,可以去相关的Task View继续找。有了导航就能轻松地找到需要的软件包了。

3.3.2 包的安装

找到需要的软件包Name以后就开始下载安装软件包。有以下几种方法可以进行安装:

(1)网页软件包名,以plm(Linear Models for Panel Data)面板数据的线性模型软件包为例(如图3.16所示)来进行说明。

图3.16 包的信息

上面有作者及软件包的一些相关信息,选择Windows进行下载。

如果使用R,选择“程序包”→“从本地zip文件安装程序包”命令,然后选择下载好的压缩包即可进行安装,如图3.17所示。

图3.17 本地程序包的安装

如果在RStudio里面进行安装,选择Tools→Install Packages命令,如图3.18所示。

图3.18 RStudio包的菜单选择

弹出图3.19所示窗口,在Install from下拉列表中选择Package Archive File选项,然后选取之前下载的压缩包即可完成安装。

图3.19 RStudio包的安装界面

(2)知道自己需要下载安装的Packages的name,可以直接在软件中完成下载安装。

如果使用R,可以选择“程序包”→“安装程序包”命令进行安装,如图3.20所示。

图3.20 R平台的包安装界面

选择后会弹出清单,清单是按照字母表顺序排列的,选择plm选项,单击“确定”按钮即可完成安装,如图3.21所示。

图3.21 R平台的包名称选择

如果使用RStudio,可以单击右下方小窗口的Packages,如图3.22所示。

图3.22 显示RStudio中已经安装好的包

显示的是已经安装好的软件包,单击Update按钮可以实现对已经安装Packages的升级。单击Install按钮会弹出图3.23所示窗口。

图3.23 RStudio包的安装界面

在Install from下拉列表中选择Repository(CRAN,CRANextra)选项,表示从网上下载需要安装的软件包,安装路径Library是默认的。在Rackages(separate maltiple with space or comma)文本框中输入需要下载安装的Packages的名称plm,单击Install按钮就可以进行安装了。安装好的Packages会进入软件包库Library里面,并且自动显示在已安装的条目下。

(3)无论R还是RStudio都可以用命令实现安装,语句如下:

install.packages("plm")

建议读者先在官网了解软件包的功能,然后再在软件中直接进行下载安装。

3.3.3 包的加载

Packages安装好以后要加载才能使用,没有加载的话软件包中的函数是无法调用的。R开启后自带的标准包已经加载好,可以直接使用,比如base、datasets、graphics等。不带任何参数的library()打开当前系统中所有包介绍信息

>library()

如果要使用其他软件包,可以使用命令语句library()进行加载,使用以后将它从内存释放,例如:

#加载MASS软件包
>library(MASS) 
#卸载MASS软件包
>detach("package:MASS", unload=TRUE)

如果使用RStudio,可以用更加快捷的方式进行Packages的加载,如图3.24所示。RStudio右下方小窗口的Packages选项,菜单中显示了已经安装好的软件包,选中该软件包可以实现加载,取消选中可以使软件包从内存中释放。

图3.24 通过界面操作加载包

每个library都有许多数据,可以使用data()查看library中的数据。例如,调出数据Titanic。

> data(Titanic)
> Titanic

运行结果:

,, Age = Child, Survived = No
      Sex
Class  Male Female
  1st    0    0
  2nd    0    0
  3rd   35   17
  Crew   0    0

,, Age = Adult, Survived = No
      Sex
Class  Male  Female
  1st   118    4
  2nd   154   13
  3rd   387   89
  Crew  670    3

,, Age = Child, Survived = Yes
      Sex
Class  Male  Female
  1st    5    1
  2nd   11   13
  3rd   13   14
  Crew   0    0

,, Age = Adult, Survived = Yes
      Sex
Class  Male  Female
  1st    57   140
  2nd    14    80
  3rd    75    76
  Crew  192    20

3.3.4 包的使用

成功载入包后便可以调用包中相应的函数及数据集。R包一般都包含了相应的数据集及示例代码,方便用户了解该包的功能及使用。包中函数描述及数据集的信息包含在帮助系统中,可以运用help()查看包的功能及包中函数和数据集的使用等具体细节。