数据分析

用python分析消费者行为

python主要使用pandas进行分析, 数据是CDNow网站的用户购买明细。一共有用户ID,购买日期,购买数量,购买金额四个字段。我们通过案例数据完成一份基础的数据分析报告 数据获取可以可以通过百度网盘, https://pan.bai...

数据分析常用的100个指标和术语

版权声明:本文为CSDN博主「小晓酱手记」的原创文章,遵循 CC 4.0 BY 版权协议,转载请附上原文出处链接及本声明。 原文:https://blog.csdn.net/sinat_26811377/article/details/10...

数据仓库实践杂谈-(五)-ETL

[目录] 第一章:概述 第二章:整体数据分层 第三章:整体实现框架 第四章:元数据 第五章:ETL 第六章:数据校验 第七章:数据标准化 第八章:去重 第九章:增量/全量 第十章:拉链处理 第十一章:分布式处理增量 第十二章:列式存储 第十...

数据仓库实践杂谈(六)-数据校验

[目录] 第一章:概述 第二章:整体数据分层 第三章:整体实现框架 第四章:元数据 第五章:ETL 第六章:数据校验 第七章:数据标准化 第八章:去重 第九章:增量/全量 第十章:拉链处理 第十一章:分布式处理增量 第十二章:列式存储 第十...

交互式数据分析工具 Scriptis

Scriptis是一款支持在线写SQL、Pyspark、HiveQL等脚本,提交给Linkis执行的数据分析Web工具,且支持UDF、函数、资源管控和智能诊断等企业级特性。 核心特点: 脚本编辑:多语言、自动补全、语法高亮、SQL语法纠错;...

Python 数据分析基础小结

from https://www.cnblogs.com/WoLykos/p/9582920.html 一、数据读取 1、读写数据库数据 读取函数: pandas.read_sql_table(table_name, con, schema...

数据可视化不完全指南(上)

数据集犹如世界历史状态的快照,能帮助我们捕捉不断变化的事物,而数据可视化则是将复杂数据以简单的形式展示给用户的良好手段(或媒介)。结合个人书中所学与实际工作所学,对数据可视化过程做了一些总结形成本文供各位看客”消遣”...

Gibbs Sampling(吉布斯采样)

from https://blog.csdn.net/wang_yi_wen/article/details/17319905 摘要:Gibbs Sampling利用条件概率产生符合分布的样本,用于估计分布的期望,边缘分布;是一种在无法精确...

Adative-lasso+灰色预测(R)

from http://blog.csdn.net/csqazwsxedc/article/details/52250232 最近在看特征的选择,看到lasso对特征选择不错,下面直接上干货 数据为广州统计年检2015年数据 目标: 1) ...

R实现灰色预测

原文链接:http://www.cnblogs.com/homewch/p/5783073.html 1.简介   预测就是借助于对过去的探讨去推测、了解未来。灰色预测通过原始数据的处理和灰色模型的建立,发现、掌握系统发展规律,对系统的未来...

官方说明文档|手把手教你在R中Prophet

本使用说明教程主要翻译整理自 Prophet 的官方说明文档 教程中使用的数据集可在 Prophet 的 github 主页 中的 examples 文件夹 内下载得到。 Prophet 是 Facebook 推出的开源大规模预测工具,可以...

主成分和因子的区别

from 百度文库 每每谈起主成分和因子有啥区别,楼主总是有种心里大概明白,但就是说不清的感觉,终于看到一篇帖子,从十个方面阐述了两者的区别,留作纪念,同时也发给大家做个参考: 1.原理不同: 主成分分析(Principal compone...

如何入门数据分析&数据挖掘?

from http://www.cnblogs.com/charlotte77/p/5340336.html 作者 Charlotte77 授权一起大数据网转发。 1.数据分析和数据挖掘联系和区别 联系:都是搞数据的 区别:数据分析偏统计,...

主成分分析与因子分析及SPSS实现

from http://blog.sina.com.cn/s/blog_44befaf60102uzhy.html 王江源的博客 一、主成分分析 (1)问题提出 在问题研究中,为了不遗漏和准确起见,往往会面面俱到,取得大量的指标来进行分析。...

SPSS学习笔记之——二项Logistic回归分析

from http://blog.sina.com.cn/s/blog_44befaf601015pqu.html 王江源的博客 一、 概述 Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分...

SPSS学习笔记之——协方差分析

from http://blog.sina.com.cn/s/blog_44befaf601015kfi.html#cmt_2825090 王江源的博客 1、分析原理 协方差分析是回归分析与方差分析的结合。在作两组和多组均数之间的比较前,用...

SPSS学习笔记之——多因素方差分析

来自 http://blog.sina.com.cn/s/blog_44befaf601015jtr.html 王江源的博客 问题: 对小白鼠喂以三种不同的营养素,目的是了解不同营养素增重的效果。采用随机区组设计方法,以窝别作为划分区组的特...

SPSS数据分析—多重线性回归

来自 博客园 只有一个自变量和因变量的线性回归称为简单线性回归,但是实际上,这样单纯的关系在现实世界中几乎不存在,万事万物都是互相联系的,一个问题的产生必定多种因素共同作用的结果。 对于有多个自变量和一个因变量的线性回归称为多重线性回归,有...