• 首页 首页 icon
  • 工具库 工具库 icon
    • IP查询 IP查询 icon
  • 内容库 内容库 icon
    • 快讯库 快讯库 icon
    • 精品库 精品库 icon
    • 问答库 问答库 icon
  • 更多 更多 icon
    • 服务条款 服务条款 icon

R语言和数据—上篇幅长,全

武飞扬头像
咬口大葱
帮助4

内容过长但详细,分三篇写,总结分享也供日后参考回顾

一、什么是R语言

R是免费的,是一个全面的统计研究平台,提供了各式各样的数据分析技术,R拥有顶尖的绘图功能

二、R语言优点和缺点

优点

1、有效的数据处理和保存机制

2、拥有一整套数组和矩阵的操作运算符

3、一系列连贯而又完整的数据分析中间工具。图形统计可以对数据直接进行分析和显示,可用于多种图形设备

4、一种相当完善、简洁和高效的程序设计语言

5、R语言是彻底面向对象的统计编程语言

6、R语言和其它编程语言、数据库之间有很好的接口

7、R语言是自由软件,可以放心大胆地使用,但其功能却不比任何其它同类软件差

8、R语言具有丰富的网上资源

缺点

1、不够规范,不容易上手,需要付出大量学习成本

2、扩展包不稳定

3、扩展包多,有很多重复功能,需要很多时间找自己需要的包

三、R软件的安装

1、登陆R官网 R: The R Project for Statistical Computing (r-project.org)

2、点击

学新通

3、选个离自己近的站点,我选的中国科技大学

学新通

4、选择版本

学新通

5、这个是二进制版本的R基础软件

学新通

6、就可以下载了

学新通

7、下载完成一直下一步安装即可

四、R软件的运行和设置

桌面双击图标,进入,一般32位的都有一个图标,64位的有俩,进去里面可以看到菜单,其他选项的内容都可以在控制台输入命令完成。窗口是最重要的部分,所有的工作都主要在这个窗口完成的

学新通

不管是什么系统,R语言都有三种运行方式:交互式、R脚本、R工作空间,打开R默认就是交互式的,可以通过写字板打开配置文件

学新通

我们可以在配置文件里自定义,加上First里放些自己常用的函数,Last里放点清理操作

学新通

五、Rstudio及基本操作

Rstudio是一款第三方开发的非常好用的R语言集成环境,软件把R控制台,绘图窗口、帮助窗口集成到一个界面下,还能补齐代码。必须先安装R软件,因为Rstudio是个集成环境不包括R软件,打开界面可以看到四个窗口

学新通
  1. 设定工作目录:很重要,所有输入和输出文件的默认位置,包括读取和写入数据等

  1. getwd()显示当前目录,setwd()修改目录

  1. 工作目录设置完就可以开始操作了,无需对变量进行声明

  1. 赋值运算符 ->/<-/<<-

  1. ls()列出变量,str()列出具体内容,ls.str()组合

  1. 删除工作空间不需要的变量可以是一个或多个rm(),删除之后无法恢复,没有回收站的功能,如果想删除所有的变量需要调用list函数,rm(list=ls())

  1. history()列出历史记录,()里可以写数字代表行数

  1. 清屏ctrl L

  1. save.image()保存工作空间

  1. q()退出

六、R包的安装

可以根据官网的Task Views浏览R包,可以根据自己研究的方向到自己需要的类目去寻找自己需要的R包,学R包比学R还难,R包很多就好像手机APP,网址:The Comprehensive R Archive Network (r-project.org),再点击Task Views右边就可以看到各种各样的R包

学新通

安装R包的方式有两种,第一种联网在线安装,第二种代码安装,推荐第一种。安装包的函数install.packages(),括号里放入需要的R包,首次使用这个函数不加参数会提示选择镜像站点,我选择了一个比较近的,选择完后会弹出这个站点里的R包,R中使用字符串都需要加上引号,要是不输入引号就会把你输入的东西当做R的对象来处理,程序找不到这个对象就会报错。

联网在线安装

学新通

通过函数我们安装一下R包

学新通

有的时候镜像站点无法访问了,需要修改默认的镜像站点,我们可以修改Rprofile.set这个文件,修改里面的set a CRAN选项,默认是自动选择,要是选择不了,可以添加一个国内比较方便的站点

学新通

使用.libPaths()函数可以显示库的位置,在线安装会默认把R包安装到这个目录下

学新通

输入函数library()可以看到R包

学新通

使用代码安装

一些服务器为了安全无法访问网络采用代码安装的方式,要去R的官网或者镜像站点去下载源代码,需要注意依赖关系问题,如果提前知道依赖关系就要将依赖包一起下载上传到服务器,我们试着去安装一个包

学新通
学新通
学新通

这个包需要依赖plotrix这个包,我们将这两个包都下载下来

学新通

输入指令可以看到两个包,然后我们用R CMD INSTALL --help查看一下帮助信息

学新通

因为我们不能安装到R默认的库文件目录,所以需要通过这个选项指定包的安装目录

学新通

我们在当前目录下创建一个lib目录不需要解压缩

学新通

直接使用R CMD INSTALL接下载的包就可以开始安装

学新通

本地安装完R包使用时同样需要library进行加载,还需要将刚才创建的lib目录添加到系统的R_LIBS文件中,使用export

学新通

使用函数格式如下可以安装多个R包,使用update.packages()可以更新R包

学新通

七、R包的使用

R包分类

R软件本身包括:base、datasets、utils、grDevices、graphics、stats、methodes、splines、stats4、tcltk提供了种类繁多的默认函数和数据集。我们在使用的时候可以看到我们需要调用的函数属于哪个包,与R基础功能相关的函数就在base包中,datasets包用来存放R内置的数据集,grDevices与绘图设备选择相关的函数都在这个包中,graphics包是基于base图形的R函数,R默认绘图函数都放在这个包中。stats中用来存放与统计相关的函数,utils包是R语言工具函数,methodes包是R对象的一

般对应方法和类,splines,stats4,tcltk都是基础包

学新通

R包加载与删除

R包其实是函数数据预编译代码以一种定义完善的格式组成的集合,计算机上存储包的目录成为库叫library,函数.libPaths()能够显示库所在的位置,函数library()不加任何参数可以显示库中有哪些软件包,如果想使用R包可以使用library函数首先载入包,或者使用require(),这个时候就不需要引号了

学新通

下面两个函数可以看包的帮助文档,文档非常详细,有些R包比R本身还要复杂,这里面有用户指导手册、代码展示、实例展示、还有这个包的相关消息等,使用ls("package:vcd")看R包中包含的函数,使用data(package="vcd")可以列出R包中包含的所有数据集,使用完一个包之后想移除加载的包就detach("package=vcd"),如果想再使用就要重新加载,想删除已安装的包使用remove.packages("vcd")就从硬盘上彻底删除了

学新通

R包的批量移植

使用installed.packages()函数,列出当前函数已安装的R包,使用下标访问数据框的第一列,将所有R包的名字保存在同一个文件中,将这个文件移到另一台设备上,可以使用下标选择第一列保存成一个文件,然后在需要移植的设备使用load函数打开这个文件,存到另外一个变量R.pack中,我们可以使用一个for循环

学新通
学新通
学新通

八、R软件如何获取帮助

R软件在安装的时候会同时安装帮助文档,如果有图形化窗口,我们可以之间点击帮助选项,也可以在控制台终端中使用help函数,在R软件会调用浏览器打开,在Rstudio中会使用帮助窗口打开。要是查看某个函数的功能可以help()括号放函数的名字,也可以?后面接函数,这种更常用。想快速了解参数可以使用args(),example()函数可以查询实例,R还内置了demo函数,会列出R的一些案例图,必须先用library函数载用之后才能用help函数,也有一种方法使用??加函数,不用加载包也可以 简介、教程文档可以通过vignette()查看,不过不是所有都有文档,help.search("helpmap")进行本地搜索,也可以简写成??helpmap,apropos()列出所有包含关键字的内容,有的时候文档太老了就可以用网络搜索RsiteSearch(),看各种博客,查搜索引擎也可以(R seek)

九、Excel与R

Excel也是非常优秀的数据分析工具,两者最大的不同就是R软件不能使用鼠标,在R中都要使用代码完成,敲代码更适合批量化自动化,R一般用于大数据

十、R中内置数据集

数据集存储在R中的datasets包中,默认已经加载了这个包,这些数据都是真收集于真实的数据,有很多经典的数据集,也有许多很古老的数据,都是西方的。data()列出数据集,直接输入数据集的名字就可以使用数据集,这些数据集的名字都是内置的,我们给变量命名的时候最好不要重复了,不然就会被置换掉,不过影响不大,我们重新data()函数加载一下这个数据集就可以了

学新通

这篇好文章是转载于:学新通技术网

  • 版权申明: 本站部分内容来自互联网,仅供学习及演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,请提供相关证据及您的身份证明,我们将在收到邮件后48小时内删除。
  • 本站站名: 学新通技术网
  • 本文地址: /boutique/detail/tanhgbjiea
系列文章
更多 icon
同类精品
更多 icon
继续加载