R语言医学多元统计分析
上QQ阅读APP看书,第一时间看更新

第2章 多元数据可视化

图形是进行数据探索的重要工具,可以直观地反映数据的分布情况以及各变量之间的相关关系。当变量较少时,常用的图形有直方图、箱线图、条形图、散点图等。这些图形在变量个数不超过3个的情况下是简单、有效的。由于受到二维平面的限制,多变量的图形展示方法比较有限。20世纪70年代以来,统计学家陆续提出了一些多变量的图示方法,用以描述多元数据的统计特性,使图形直观、简洁的优点延伸到多元数据的分析中。本章介绍常用的多变量图示法的基本思想和作图方法。

本章的绘图示例将使用第1章表1-2中的数据,为此我们先读入数据:

>cirr<-read.csv('cirrhosis.csv')#读入数据并存为数据框cirr
>names(cirr)#查看数据框cirr中的变量名
[1]"sex""agegrp""FIB""lnPT""PTA""lnCHE"
>bio<-cirr[,3:6]#将数据框cirr的后4列存为对象bio