一起大数据

24小时更新:3篇     一周更新:7篇最新发布

SAS

获取数据集的观测值个数

xsmile 发布于 2016-09-27

来自 http://bbs.pinggu.org/thread-1540523-1-1.html 使用数据步: 最简单的是使用end选项 data _null_; set test end=last; if last then put _n_; run; 或者是使用nobs选项 ...

阅读(9)评论(0)赞 (0)

SAS

SAS HotFix安装方法

6

xsmile 发布于 2016-09-26

SAS 9.4 HotFix安装 SAS越来越大,在更新过程中,发现的问题日益增多,为方便管理,SAS运用一些小软件方便大家更新,下面详细说明。 首先说明的是,SAS的默认安装路径为C盘,本人的SAS装在了D盘, 1,在SAS安装文a件夹D:\Program Files\SASH...

阅读(16)评论(1)赞 (0)

SAS

SAS EM无法创建项目问题解决办法

3

xsmile 发布于 2016-09-26

  写在前言 一个小问题难倒很多人,最近论坛上经常有人问为什么sid中包含EM模块,但是无法创建项目,无法登录服务器,或者windows身份验证失败,尝试了各种各样的办法,甚至将SAS软件重装很多遍,费时费力。这里提供一个简单的解决方案,供大家参考。 问题解析 由于安装...

阅读(9)评论(1)赞 (0)

资讯

Logistic回归及其在Python中的一个实现

10

张龙祥 发布于 2016-09-25

一、回归分析的不足 我们大家对回归分析很清楚,但是有这样一类变量,它们的因变量不是连续型变量,而是分类变量。比如这件商品是买还是不买;某个病人是否已经痊愈。这种现象是经常出现的。 我们以这件商品买和不买来进行讨论。用“1”来表示“买”,用“0”来表示“不买”。在这里,我们记“买”...

阅读(69)评论(0)赞 (2)

SAS

sas提高处理大数据效率的一些实用技巧

xsmile 发布于 2016-09-23

来自: 人大经济论坛 以下是自己总结的一些方法,欢迎拍砖,添砖加瓦。 1.测试代码的时候,可以从大数据集中抽取一部分数据来进行测试,而不比直接在大文件上全部进行测试。抽取数据这个有好多种方法常用的如使用obs=option选项,proc surveyselect进行分层抽样,利用...

阅读(64)评论(0)赞 (1)

SAS

SAS中建立和管理索引

xsmile 发布于 2016-09-23

来自 http://blog.163.com/shen_960124/blog/static/6073098420136161844551/ 对比正常情况下的顺序访问,索引可以为以下操作提供观测的直接访问:   访问较少于总体的子集(WHERE)   返回已排序的观测(BY)  ...

阅读(33)评论(0)赞 (0)

SAS

SAS 中使用 Compress 函数

xsmile 发布于 2016-09-14

SAS 中使用 Compress 函数删除或保留字符串中特定字符 http://blog.sina.com.cn/s/blog_6bc061630100qixy.html SAS 中的 compress() 函数主要用来删除字符串中的特定字符,不少 SAS 用户都以为这个函数只是...

阅读(126)评论(0)赞 (0)

R

数据帮:地图可视化REmap包-remapC函数及实例

2

金小贝 发布于 2016-09-12

原创:金小贝  QQ交流:675229288 remapC( )函数是REmap包核心函数之一,主要完成全国分省热力图,或者某省市分地区的热力图应用目的相对单一,所以原始数据准备及参数设置相对简单。 通过help发现remapC( )函数的参数还是很丰富的(可参考remap函数的...

阅读(168)评论(0)赞 (2)

SAS

利用SAS代码实现决策树模型

xsmile 发布于 2016-09-01

转自 http://blog.sina.com.cn/s/blog_7ed6001f0102vop7.html SAS EM模块中的模型都可以用SAS代码实现,决策树模型在SAS系统中对应的过程为Proc split或Proc hpsplit,两者基本一样,后者效率更高,但在SA...

阅读(273)评论(0)赞 (1)

R

数据帮:R实现地理位置与经纬度相互转换

1

金小贝 发布于 2016-08-30

原创:金小贝  QQ交流:675229288        实际业务中,特别是基于LBS的服务中,后台存储了很多经纬度数据,比如车辆行驶轨迹、快餐配送地址、上门按摩地址等,所以需要批量地理位置与经纬度的相互转换,一方面满足业务分布可视化的实现,另一方面满足实际地址的统计分析,两方...

阅读(394)评论(0)赞 (2)

数据挖掘

TF-IDF与余弦相似性的应用

19

xsmile 发布于 2016-08-29

一 自动提取关键词 作者: 阮一峰 这个标题看上去好像很复杂,其实我要谈的是一个很简单的问题。 有一篇很长的文章,我要用计算机提取它的关键词(Automatic Keyphrase extraction),完全不加以人工干预,请问怎样才能正确做到? 这个问题涉及到数据挖掘、文本处...

阅读(179)评论(0)赞 (0)

数据分析

一位电商数据分析师的经验总结

xsmile 发布于 2016-08-23

来自 http://zhoulili1987619126.lofter.com/post/1cc8f7a3_5611361 08年毕业,不知不觉的混进了电子商务行业,又不知不觉的做了三年数据分析,恰好又赶上了互联网电子商务行业发展最快的几年,也算是不错吧,毕竟感觉前途还是很光明的...

阅读(464)评论(0)赞 (10)

R

时间序列分析—(ARIMA模型)

16

xsmile 发布于 2016-08-23

来自 http://blog.163.com/zhoulili1987619@126/blog/static/353082012015516103746884/ 指数平滑法对于预测涞水是非常有帮助的,而且它对时间序列上面连续的值之间相关性咩有要求。但是,如果你想使用指数平滑法计算...

阅读(355)评论(0)赞 (1)

R

数据帮:地图可视化REmap包-remapB函数及实例

9

金小贝 发布于 2016-08-18

原创:金小贝  QQ交流:675229288 remapB( )函数是REmap包核心函数之一,直接调取百度地图,可进行缩放、退拽,可查看全国及省市地图。与remap( )函数一样可实现流向地图及形成地图,还可以绘制车辆线路图。除了使用百度地图为背景层以外,其参数更加灵活,自主个...

阅读(404)评论(0)赞 (3)

数据挖掘

集成学习方法

2

xsmile 发布于 2016-08-18

集成学习是机器学习算法中非常强大的工具,有人把它称为机器学习中的“屠龙刀”,非常万能且有效,在各大机器学习、数据挖掘竞赛中使用非常广泛。它的思想非常简单,集合多个模型的能力,达到“三个臭皮匠,赛过诸葛亮”的效果。集成学习中概念是很容易理解的,但是好像没有同一的术语,很多书本上写得...

阅读(458)评论(0)赞 (1)