R

R语言手册

4

xsmile 发布于 2017-08-12

from http://www.cnblogs.com/einyboy/p/3182589.html 在R的官方教程里是这么给R下注解的:一个数据分析和图形显示的程序设计环境(A system for data analysis and visualization which i...

阅读(106)评论(0)赞 (0)

R中快速读取csv文件: read_csv对比fread

xsmile 发布于 2017-06-20

原文 http://www.jianshu.com/p/c45829f708ff 作者 dingdingxia 今天看到有人提问用readr::read_csv()读csv文件时把所有character型的变量读成factor型,HY大牛提供了一个方法用dplyr包的mutate...

阅读(668)评论(0)赞 (0)

R语言之Apriori算法应用

3

xsmile 发布于 2017-05-14

from http://www.cnblogs.com/dm-cc/p/5737147.html 一. 概念 关联分析用于发现隐藏在大型数据集中的有意义的联系。所发现的联系可以用关联规则(association rule)或频繁项集的形式表示。 项集:在关联分析中,包含0个或多个...

阅读(950)评论(0)赞 (6)

信用卡评分模型(R语言)

18

xsmile 发布于 2017-05-09

from http://blog.csdn.net/csqazwsxedc/article/details/51225156 信用卡评分 2016年1月10日 一、数据准备 1、 问题的准备 •            目标:要完成一个评分卡,通过预测某人在未来两年内将会经历财务危...

阅读(2323)评论(0)赞 (9)

偏最小二乘法介绍及应用

1

xsmile 发布于 2017-04-30

本文由一起大数据网整理,转载请保留原文链接。 为了更好的理解PLS,推荐大家先学习回归分析、典型相关分析和主成分分析相关知识内容(这些内容在SPSS视频教程里都有)。 第一部分:概念与诊断(来自百度百科) 偏最小二乘法,它通过最小化误差的平方和找到一组数据的最佳函数匹配。 用最简...

阅读(1137)评论(0)赞 (4)

R语言与正态性检验

xsmile 发布于 2017-01-19

from http://www.cnblogs.com/xmdata-analysis/p/4670841.html 1.Kolmogorov-Smirnov正态性检验 Kolmogorov-Smirnov是比较一个频率分布f(x)与理论分布g(x)或者两个观测值分布的检验方法,...

阅读(1619)评论(0)赞 (0)

决策树算法介绍及应用

16

xsmile 发布于 2017-01-12

from http://www.ibm.com/developerworks/cn/analytics/library/ba-1507-decisiontree-algorithm/index.html 机器学习概念 机器学习 (Machine Learning) 是近 20 多...

阅读(1447)评论(0)赞 (3)

需求预测我喜欢用ARIMA模型

25

xsmile 发布于 2017-01-09

本文结构: 时间序列分析? 什么是ARIMA? ARIMA数学模型? input,output 是什么? 怎么用?-代码实例 常见问题? 时间序列分析? 时间序列,就是按时间顺序排列的,随时间变化的数据序列。 生活中各领域各行业太多时间序列的数据了,销售额,顾客数,访问量,股价,...

阅读(1583)评论(0)赞 (1)

最近邻算法(KNN)

xsmile 发布于 2016-12-22

from http://blog.163.com/jiangfeng_data/blog/static/20641403820125141026440/   K最近邻(k-Nearest Neighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学...

阅读(966)评论(0)赞 (2)

R语言Data Frame数据框常用操作

xsmile 发布于 2016-12-04

Data Frame一般被翻译为数据框,感觉就像是R中的表,由行和列组成,与Matrix不同的是,每个列可以是不同的数据类型,而Matrix是必须相同的。 Data Frame每一列有列名,每一行也可以指定行名。如果不指定行名,那么就是从1开始自增的Sequence来标识每一行。...

阅读(1479)评论(0)赞 (2)

用R来做时间序列

xsmile 发布于 2016-12-04

from http://blog.sina.com.cn/s/blog_6bb07f830100xh0y.html 第一部分:怎么将数组转化为时间序列? ts(x, start=1,frequency=4) # 将x转化为时间序列model 通常状况下,当frequency=4,...

阅读(1193)评论(0)赞 (2)

R语言:文本(字符串)处理与正则表达式

xsmile 发布于 2016-12-03

来自 http://blog.sina.com.cn/s/blog_69ffa1f90101sie9.html 处理文本是每一种计算机语言都应该具备的功能,但不是每一种语言都侧重于处理文本。R语言是统计的语言,处理文本不是它的强项,perl语言这方面的功能比R不知要强多少倍。幸运...

阅读(641)评论(0)赞 (0)

数据帮:地图可视化REmap包-remapH函数及实例

1

金小贝 发布于 2016-11-03

原创:金小贝  QQ交流:675229288 remapH( )函数主要功能是制作热力效果图,与remapC( )只能根据已经分好的行政区域显示不同热力不一样,remapH( )函数可以实现以任意点为中心,通过颜色渐变、泛化达到热力效果,理论上使用和展现相对更加灵活。但是通过实际...

阅读(1949)评论(4)赞 (1)

R语言可视化与highchart

10

xsmile 发布于 2016-10-22

R语言可视化与highchart 晓哥、python哥;微信15523802291 2016年10月21日 认识highchart Make your data come alive Make it easy for developers to set up interactiv...

阅读(2094)评论(0)赞 (3)

R学习日记——时间序列分析之ARIMA模型预测

9

xsmile 发布于 2016-10-12

来自 http://blog.sina.com.cn/s/blog_70f632090101bnd8.html 今天学习ARIMA预测时间序列。  指数平滑法对于预测来说是非常有帮助的,而且它对时间序列上面连续的值之间相关性没有要求。但是,如果你想使用指数平滑法计算出预测区间, ...

阅读(1901)评论(2)赞 (3)

使用R语言进行异常检测

13

xsmile 发布于 2016-10-12

来自 http://youhaolin.blog.163.com/blog/static/224494120201422110628586/ 本文结合R语言,展示了异常检测的案例,主要内容如下: (1)单变量的异常检测 (2)使用LOF(local outlier factor,...

阅读(2367)评论(0)赞 (4)

数据帮:地图可视化REmap包-remapC函数及实例

2

金小贝 发布于 2016-09-12

原创:金小贝  QQ交流:675229288 remapC( )函数是REmap包核心函数之一,主要完成全国分省热力图,或者某省市分地区的热力图应用目的相对单一,所以原始数据准备及参数设置相对简单。 通过help发现remapC( )函数的参数还是很丰富的(可参考remap函数的...

阅读(1622)评论(0)赞 (6)