【教程】R语言处理Excel文件 | 产品经理的私房菜让工作更简单

【教程】R语言处理Excel文件

小姜君红糖姜膏

excel

Microsoft Excel是使用最广泛的电子表格程序,其存储数据在 .xls 或 .xlsx 格式。R能够直接使用一些 excel 特定的软件包,来从文件中读取数据。很少有这样的包 – XLConnect,XLSX,GDATA等。我们将使用XLSX包。 – R语言也可以使用该软件包写入 Excel 文件。

安装XLSX包

可以使用下面的命令在R控制台来安装“XLSX”包。 它可能会要求安装一些额外的软件包此程序包依赖。按照所需的软件包名称的相同的命令来安装额外的软件包。

install.packages("xlsx")

验证并载入“XLSX”包

使用以下命令来验证并加载“XLSX”包。

# Verify the package is installed.
any(grepl("xlsx",installed.packages()))

# Load the library into R workspace.
library("xlsx")

当脚本运行,我们得到如下输出。

[1] TRUE
Loading required package: rJava
Loading required package: methods
Loading required package: xlsxjars

输入为XLSX文件

打开Microsoft Excel中。复制并粘贴以下数据到名为工作表Sheet1工作表中。

id	name      salary    start_date	dept
1	Rick	  623.3	    1/1/2012	IT
2	Dan	  515.2	    9/23/2013	Operations
3	Michelle  611	    11/15/2014	IT
4	Ryan	  729	    5/11/2014	HR
5	Gary	  843.25    3/27/2015	Finance
6	Nina	  578       5/21/2013	IT
7	Simon	  632.8	    7/30/2013	Operations
8	Guru	  722.5	    6/17/2014	Finance

下面的数据也复制并粘贴到另一个工作表,并重新命名该工作表为:“city”。

name	 city
Rick	 Seattle
Dan	 Tampa
Michelle Chicago
Ryan	 Seattle
Gary	 Houston
Nina	 Boston
Simon	 Mumbai
Guru	 Dallas

Excel 文件保存为“input.xlsx”。应该将其保存在R工作空间的当前工作目录。

读取Excel文件

所述 input.xlsx 通过使用 read.xlsx()函数来读取,如下所示。结果被存为数据帧。

# Read the first worksheet in the file input.xlsx.
data <- read.xlsx("input.xlsx", sheetIndex = 1)
print(data)

当我们上面的代码执行时,它产生以下结果:

  id     name salary start_date       dept
1  1     Rick 623.30 2012-01-01         IT
2  2      Dan 515.20 2013-09-23 Operations
3  3 Michelle 611.00 2014-11-15         IT
4  4     Ryan 729.00 2014-05-11         HR
5 NA     Gary 843.25 2015-03-27    Finance
6  6     Nina 578.00 2013-05-21         IT
7  7    Simon 632.80 2013-07-30 Operations
8  8     Guru 722.50 2014-06-17    Finance

未经允许不得转载:产品经理的私房菜 » 【教程】R语言处理Excel文件

赞 (0) 评论 (0) 分享 ()
Design by Zooper