一起大数据

最新发布 第2页

SPSS

主成分分析与因子分析及SPSS实现

from http://blog.sina.com.cn/s/blog_44befaf60102uzhy.html 王江源的博客 一、主成分分析 (1)问题提出 在问题研究中,为了不遗漏和准确起见,往往会面面俱到,取得大量的指标来进行分析。...

SPSS

SPSS学习笔记之——二项Logistic回归分析

from http://blog.sina.com.cn/s/blog_44befaf601015pqu.html 王江源的博客 一、 概述 Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分...

SPSS

SPSS学习笔记之——协方差分析

from http://blog.sina.com.cn/s/blog_44befaf601015kfi.html#cmt_2825090 王江源的博客 1、分析原理 协方差分析是回归分析与方差分析的结合。在作两组和多组均数之间的比较前,用...

SPSS

SPSS学习笔记之——多因素方差分析

来自 http://blog.sina.com.cn/s/blog_44befaf601015jtr.html 王江源的博客 问题: 对小白鼠喂以三种不同的营养素,目的是了解不同营养素增重的效果。采用随机区组设计方法,以窝别作为划分区组的特...

资讯

基于五种机器算法的信用风险评估

原文地址: https://mp.weixin.qq.com/s/sE7i4grdtY4WQMX—0Lk6g 作者:数据取经团-白云飞 基于五种机器算法的信用风险评估是一个系列文章,从互金数据出发,经过数据预处理,特征工程,建立机器学习模型...

Python

生成对抗网络(GAN)之MNIST数据生成

本文原作者天雨粟,原文载于作者的知乎专栏——机器不学习,一起大数据网经授权发布。 前言 GAN从2014年诞生以来发展的是相当火热,比较著名的GAN的应用有Pix2Pix、CycleGAN等。本篇文章主要是让初学者通过代码了解GAN的结构和...

动态

自我代码提升之K近邻算法

原文地址:http://mp.weixin.qq.com/s/Wj2MOPGvJJIkRrz1bsqbCw 作者:数据取经团-王嘉琪 在机器学习和数据挖掘常用的方法中,常规的建模思路是输入给定的训练数据集(类别标签已知),通过一系列的训练建...

SPSS

SPSS数据分析—多重线性回归

来自 博客园 只有一个自变量和因变量的线性回归称为简单线性回归,但是实际上,这样单纯的关系在现实世界中几乎不存在,万事万物都是互相联系的,一个问题的产生必定多种因素共同作用的结果。 对于有多个自变量和一个因变量的线性回归称为多重线性回归,有...

SPSS

SPSS数据分析—多维尺度分析

来自 博客园 在市场研究中,有一种分析是研究消费者态度或偏好,收集的数据是某些对象的评分数据,这些评分数据可以看做是对象间相似性或差异性的表现,也就是一种距离,距离近的差异性小,距离远的差异性大。而我们的分析目的也是想查看这些对象间的差异性...

资讯

数据可视化入门篇

原文地址: https://mp.weixin.qq.com/s/e2tv85r3JLmy_8g_doaSuA 作者:数据取经团-张俊红 本篇要点: 01、数据可视化是什么 02、数据可视化的一般流程 03、常见的数据种类 04、通过可视化...

资讯

自我代码提升之逻辑回归

作者:数据取经团-王嘉琪 对于数据挖掘或是机器学习等算法的学习,用代码将之实现是次、动理论到实践的有效途径,而目前在数据科学应用领域,很多成熟的工具(诸如python的sklearn模块或是各种各样的R包),为我们的学习和工作提供了便利。但...

数据挖掘

SMOTE

from http://blog.sina.com.cn/s/blog_7103b28a0102wpqm.html 这是应对非均衡训练数据集的一种方法。 针对非均衡训练数据,可以采用的方法包括:1)对多数类进行欠采样,去除一些样本使样本数目...

数据挖掘

随机森林进行特征重要性度量的详细说明

来自 宋兵乙的博客 特征选择方法中,有一种方法是利用随机森林,进行特征的重要性度量,选择重要性较高的特征。下面对如何计算重要性进行说明。 1 特征重要性​度量 计算某个特征X的重要性时,具体步骤如下: 1)对每一颗决策树,选择相应的袋外数据...