深入浅出R语言数据分析
上QQ阅读APP看书,第一时间看更新

2.1 RData数据

RData是R语言的文件对象,可以储存R语言中的各种数据结构,包括向量数据框、列表等。在R语言中生成的各种结果都是R对象,都可以通过RData文件格式进行储存,储存的方式是通过save函数进行存储。

这里使用R语言自带的iris数据集做演示,在演示中将数据储存为RData格式,并且加载储存好的RData数据。其中,ls( )函数用于查看工作环境中存在哪些变量,首先使用save( )函数将iris储存成iris.RData数据集,然后通过load( )函数对数据进行加载。Save( )函数的第一个参数是需要存储的对象,第二个参数是存储文件的路径;load( )函数的第一个参数是文件读取的路径。

使用ls( )函数查看工作环境中有哪些数据,然后使用save( )函数对iris数据进行储存:

存储的文件名为iris.RData,然后清理数据框,这时工作环境没有任何数据。RData格式的数据可以通过load( )函数进行加载。

可以看到,工作环境中又出现了iris数据集,这说明数据加载成功了。

上文将一个数据集储存为RData数据格式,但是在现实的数据分析问题中,需要处理的数据集会有很多,当多个数据集需要储存的时候,方法之一是将每一个数据集储存成一个RData文件,但是,这并不是一个好的方式。一个好的方式是将多个数据集同时储存为RData文件,实现的方式是将需要储存的多个数据集名称传递到save( ),这样就将多个数据集同时储存为一个RData文件。下面构建了一个新的数据集iris1,然后同时存储iris1和iris:

使用Rstudio,可以用鼠标单击的方法实现数据存储。如果想要保存工作空间中的所有数据集,只需要单击保存按钮,如图2.1所示。

图2.1 数据保存

单击保存按钮之后,输入想要保存的变量名字,然后单击确认按钮即可。