1.2.3 R包的获取与安装

这一小节,我们来介绍R中可大大拓展你的分析技能的利器——R包。

1.什么是R包,为什么要安装?

所谓R包,就是一个把R函数、数据、预编译代码以一种定义完善的格式组织在一起的集合(见图1-27)。

picture

图1-27 RStudio中的R包

R在安装时会自带一系列默认包(包括base,datasets,stats,methods,graphics等),它们提供了很多功能丰富的函数与数据,大家可以自行调出学习,命令search(  )可以告诉你工作空间里已有哪些包可直接使用。当然,如果需要装备更多、更厉害的拓展技能,就需要安装新包来实现了。

2.怎样安装包?

一般的安装做法有两种:一种是通过CRAN服务器安装;另一种是从Github下载安装,可作为第一种的补充。

第一种方法最常用。在RStudio中有两种方法实现:一种是直接通过命令装包:install.packages("package_name" );另一种是选中如图1-25所示的右下方界面中的Packages后,点击Install,就会弹出如图1-28所示的方框,直接在其中输入包的名称即可。

picture

图1-28 RStudio安装R包

另外,细心的读者可能会发现这里竟然不能选择镜像!对,RStudio默认采用的是Global镜像,如果想换成本地镜像,可以点击“Tools→Global Options”,打开Options界面(见图1-29),在Packages选项卡中更换镜像。

picture

图1-29 RStudio更换镜像

第二种方法:通过Github安装。前面介绍过Github网站,新手建好包一般会先放在那里接受群众“检阅”,因此就有了一个下载新包的渠道——Github。一个R包在Github上的呈现如图1- 30所示。

picture

图1-30 Github上的R包

这些包并不需要从网站下载再装进R,R里有一些方便与Github交互的包如devtools,其中的install_github(  )函数就专为从Github安装包设计。下面以一个R包praise为例,它的安装语句如下:

picture

需要注意的是,用此函数安装包时需在前面加上它的作者在Github上的用户名,此处praise包的作者用户名是gaborcsardi。

另外,一个包只要安装一次就可永久使用。当遇到包的作者进行了更新时,通过命令update.packages(  ) 即可迅速检查并更新已经安装的包。RStudio中右下部分有一键更新包按钮。

3.安装完就能直接用?

安装好了包,只是把它放在本地硬盘里,用时需要打开才能调用它的函数。打开的方式很简单,选用以下函数之一即可完成。

picture

4.如何用好一个包?

(1)寻找可用的包。对于包的选择,首先可以通过谷歌进行搜索,确定什么样的包符合你的要求;其次向大家介绍一个按照任务归类方法及包的地方:http://cran.r-project.org/web/views/(见图1-31),可以在其中寻找与你的研究相近的主题。

picture

图1-31 网页展示

(2)在各种可用的包中如何选择? Crantastic网站(http:// www.crantastic.org/popcon)中有各种包的使用热度排名,可以作为参考。

(3)选择好合适的包后,如何使用呢?可以通过R中的帮助功能,即通过RStudio右下角界面的搜索框(见图1-32)。

picture

图1-32 RStudio函数文档界面

另外,输入命令help(package="package_name")也会自动打开文档界面,里面既有对此包技能的整体描述、使用指南等文档,又有包内所含的函数列表。对于具体函数用法,直接点击函数名即可(见图1-33)。

picture

图1-33 ggplot2包帮助展示

(4)函数文档很长,从哪里看起呢?一般来说,从两个地方切入更方便:一是先读Description和Usage(见图1-34),整体了解函数基本功能及参数设置;二是帮助文档最后附带的Examples(见图1-35),把它复制粘贴进编辑器,反复运行体会每个参数的含义。当然,如果需要更深入透彻地理解函数,就要弄懂术语,理解其中每个参数的用法,这是高手的进阶之路。

picture

图1-34 帮助文档中的Description和Usage

picture

图1-35 帮助文档中的Examples