数据分析

Adative-lasso+灰色预测(R)

from http://blog.csdn.net/csqazwsxedc/article/details/52250232 最近在看特征的选择,看到lasso对特征选择不错,下面直接上干货 数据为广州统计年检2015年数据 目标: 1) ...

R实现灰色预测

原文链接:http://www.cnblogs.com/homewch/p/5783073.html 1.简介   预测就是借助于对过去的探讨去推测、了解未来。灰色预测通过原始数据的处理和灰色模型的建立,发现、掌握系统发展规律,对系统的未来...

官方说明文档|手把手教你在R中Prophet

本使用说明教程主要翻译整理自 Prophet 的官方说明文档 教程中使用的数据集可在 Prophet 的 github 主页 中的 examples 文件夹 内下载得到。 Prophet 是 Facebook 推出的开源大规模预测工具,可以...

主成分和因子的区别

from 百度文库 每每谈起主成分和因子有啥区别,楼主总是有种心里大概明白,但就是说不清的感觉,终于看到一篇帖子,从十个方面阐述了两者的区别,留作纪念,同时也发给大家做个参考: 1.原理不同: 主成分分析(Principal compone...

如何入门数据分析&数据挖掘?

from http://www.cnblogs.com/charlotte77/p/5340336.html 作者 Charlotte77 授权一起大数据网转发。 1.数据分析和数据挖掘联系和区别 联系:都是搞数据的 区别:数据分析偏统计,...

主成分分析与因子分析及SPSS实现

from http://blog.sina.com.cn/s/blog_44befaf60102uzhy.html 王江源的博客 一、主成分分析 (1)问题提出 在问题研究中,为了不遗漏和准确起见,往往会面面俱到,取得大量的指标来进行分析。...

SPSS学习笔记之——二项Logistic回归分析

from http://blog.sina.com.cn/s/blog_44befaf601015pqu.html 王江源的博客 一、 概述 Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分...

SPSS学习笔记之——协方差分析

from http://blog.sina.com.cn/s/blog_44befaf601015kfi.html#cmt_2825090 王江源的博客 1、分析原理 协方差分析是回归分析与方差分析的结合。在作两组和多组均数之间的比较前,用...

SPSS学习笔记之——多因素方差分析

来自 http://blog.sina.com.cn/s/blog_44befaf601015jtr.html 王江源的博客 问题: 对小白鼠喂以三种不同的营养素,目的是了解不同营养素增重的效果。采用随机区组设计方法,以窝别作为划分区组的特...

SPSS数据分析—多重线性回归

来自 博客园 只有一个自变量和因变量的线性回归称为简单线性回归,但是实际上,这样单纯的关系在现实世界中几乎不存在,万事万物都是互相联系的,一个问题的产生必定多种因素共同作用的结果。 对于有多个自变量和一个因变量的线性回归称为多重线性回归,有...

SPSS数据分析—多维尺度分析

来自 博客园 在市场研究中,有一种分析是研究消费者态度或偏好,收集的数据是某些对象的评分数据,这些评分数据可以看做是对象间相似性或差异性的表现,也就是一种距离,距离近的差异性小,距离远的差异性大。而我们的分析目的也是想查看这些对象间的差异性...

另一种确定kmeans中k值的思路——Gmeans

from http://blog.sina.com.cn/s/blog_7103b28a0102w805.html G-means的思路为:检测一个质心所含的数据看上去是否是高斯的,如果不是就分裂这个簇。G-means能很好地处理stret...

在R语言中进行局部多项式回归拟合(LOESS)

原文  http://xccds1977.blogspot.com/2011/12/rloess.html 局部多项式回归拟合是对两维散点图进行平滑的常用方法,它结合了传统线性回归的简洁性和非线性回归的灵活性。当要估计某个响应变量值时,先从...

用scikit-learn和pandas学习线性回归

from http://www.cnblogs.com/pinard/p/6016029.html by 刘建平Pinard 十年码农,对数学统计学,数据挖掘,机器学习,大数据平台,大数据平台应用开发,大数据可视化感兴趣。 对于想深入了解线...

R语言之Apriori算法应用

from http://www.cnblogs.com/dm-cc/p/5737147.html 一. 概念 关联分析用于发现隐藏在大型数据集中的有意义的联系。所发现的联系可以用关联规则(association rule)或频繁项集的形式表...

信用卡评分模型(R语言)

from http://blog.csdn.net/csqazwsxedc/article/details/51225156 信用卡评分 2016年1月10日 一、数据准备 1、 问题的准备 •            目标:要完成一个评分卡...

偏最小二乘法介绍及应用

本文由一起大数据网整理,转载请保留原文链接。 为了更好的理解PLS,推荐大家先学习回归分析、典型相关分析和主成分分析相关知识内容(这些内容在SPSS视频教程里都有)。 第一部分:概念与诊断(来自百度百科) 偏最小二乘法,它通过最小化误差的平...