如何让R语言读写SQL的数据
什么是R语言?
R语言是开源的统计分析工具,目前有着良好的应用前景,在许多领域与专业的分析工具相比有过之而无比及,但是要求使用的人员具备一定的编程基础,因此门槛相对较高一些,详细的介绍可以浏览R语言的国内官网()
那么如何让R语言能够读写SQL Server里的数据呢?
一、 安装RODBC库
1、进入R语言的GUI界面(RGUI.EXE),在菜单栏选择“程序包/安装程序包”(如图)
3、在ODBC数据源管理器里将需要的数据库添加进去,这里笔者使用的是SQL Server2008,驱动程序选择Native Client10.0
3、在R语言窗口输入连接语句
> library(RODBC)
**这里是载入RODBC库
> channel<-odbcConnect(“MyTest”,uid=”ripley”,case=”tolower”)
**连接刚才添加进数据源的“MyTest”数据库
**ch <- odbcConnect(“some dsn “, uid = “user “, pwd = “**** “)
**表示用户名为user,密码是****,如果没有设置,可以直接忽略
> data(USArrests)
**将“USArrests”表写进数据库里(这个表是R自带的)
> sqlSave(channel,USArrests,rownames = “state”,addPK = TRUE)
**将数据流保存,这时候打开SQL Server就可以看到新建的USArrests表了
> rm(USArrests)
> sqlTables(channel)
**给出数据库中的表
> sqlFetch(channel,”USArrests”,rownames = “state”)
**输出USArrests表中的内容
> sqlQuery(channel,”select * from USArrests”)
**调用SELECT查询语句并返回结果(如图)
> sqlDrop(channel,”USArrests”)
**删除表
> odbcClose(channel)
**最后要记得关闭连接
附带一个例子: 连接数据库,筛选数据,导出为CSV。
补充一个示例:R读取Excel数据,并根据某个字段的值进行拆分。
数据文件 data1104
代码:
library(RODBC)
alldata <- odbcConnectExcel2007(“D:\\data1104.xlsx”)
sqlTables(alldata);#display spreadsheet
mydata <- sqlFetch(alldata,”Sheet1″); # get the first sheet
head(mydata)
l1 <- unique(mydata$本地网)
for (i in 1:length(l1)) {
tempdata <- subset(mydata,mydata$本地网==l1[i]);
write.csv(tempdata,paste(“d:/” , l1[i] , “.csv”, sep = “”))
}
运行后你会看到数据已经被拆分成很多独立的csv文件了。
感觉用R处理基础数据还是比较麻烦的