大数据数学基础(R语言描述)
上QQ阅读APP看书,第一时间看更新

1.2 数学与R语言

R语言是由新西兰奥克兰大学的Ross Ihaka与Robert Gentleman一起开发的一种面向对象的编程语言,是免费开源、能够有效用于统计计算和绘图的语言和环境。它是一套完整的数据处理、计算和制图软件系统,是一套开源的数据分析解决方案,由一个庞大且活跃的全球性研究型社区维护。其具有以下几点优势。

(1)可运行于多种平台之上,包括Windows、UNIX、Mac OS X和Linux等。

(2)在保证语法简单的同时,兼顾了程序设计语言的逻辑与自然的语言风格。

(3)拥有数目众多的程序包,能够轻松满足数据分析、数据挖掘、机器学习等领域的需求。

(4)可以通过程序包调用如Python、Java、C、C+…+等语言,同时还提供了Google、Twitter、微博等的API接口。

R语言提供了各种数学计算、统计计算的函数,能够灵活地进行数据分析。常用于数学计算和统计计算的程序包(packages)有base、stats,它们可以完成大部分数学计算工作。此外,还可以使用rootSolve、Ryacas、Deriv、prettyR、EnvStats、class、klaR、MASS等程序包辅助完成数学计算工作。

1.2.1 base

base程序包是R语言的基础包,其包含了R语言的基本功能,如算术、输入/输出、基本编程支持等。base程序包中常用于数学计算的函数及说明如表1-1所示。

表1-1 base程序包中常用于数学计算的函数及说明

1.2.2 stats

stats程序包是R语言的统计包,具有统计计算和生成随机数的功能。stats程序包中常用于统计计算的函数及说明如表1-2所示。

表1-2 stats程序包中常用于统计计算的函数及说明