标签:聚类分析

SAS

如何使用K-MEANS聚类算法解决分类问题

9

xsmile 发布于 2016-08-02

K-means算法是很典型的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。 对于聚类问题,我们事先并不知道给定的一个训练数据集到底具有哪些类别的标签,只是先行...

阅读(1437)评论(0)赞 (2)

数据挖掘

数据挖掘(聚类分析)

xsmile 发布于 2016-03-25

概况: 数据挖掘对聚类算法的要求:可伸缩性(在小数据集上算法优,同样要求在大数据集上算法优)、处理不同类型数据的能力、发现任意形状簇的能力、输入参数的领域知识最小化、处理噪声数据的能力、对输入数据顺序的敏感、可解释性和可用性、基于约束的聚类、处理高维数据的能力。 聚类方法的分类:...

阅读(1598)评论(0)赞 (2)

SAS

SAS中的聚类分析方法总结

4

xsmile 发布于 2016-01-26

      说起聚类分析,相信很多人并不陌生。这篇原创博客我想简单说一下我所理解的聚类分析,欢迎各位高手不吝赐教和拍砖。    按照正常的思路,我大概会说如下几个问题: 1.     什么是聚类分析? 2.     聚类分析有什么用? 3.     聚类分析怎么做? 下面我将分聚...

阅读(1683)评论(0)赞 (2)

SAS

使用SAS进行简单的聚类分析讲解

xsmile 发布于 2016-01-23

聚类分析的目的是把分类对象按一定的规则分成若干类,这些类不是事先给定的,而是根据数据的特征确定的,对类的数目和类的结构不必作任何的假定。在同一类里的这些对象在某种意义上倾向于彼此相似,而在不同类里的对象倾向于彼此不相似。 聚类分析根据分类对象不同分为Q型聚类分析和R型聚类分析。Q...

阅读(1404)评论(0)赞 (0)

R

大数据分析之——k-means聚类中的坑

5

xsmile 发布于 2015-12-17

来自 http://blog.sciencenet.cn/blog-556556-860647.html 使用k-means进行聚类,常常被假定为数据是球状的,似乎是非球状数据就不灵了。 下面构造一个数据,看看非球状数据长什么样子: library(dplyr) library(...

阅读(1276)评论(0)赞 (1)

R

R聚类分析学习

21

xsmile 发布于 2015-12-17

学习交流数据分析、挖掘可以加QQ群 76354029 本贴主要为2015年12月19号晚上8点半的分享交流准备。 内容: 理论、应用、练习 理论: 什么是聚类分析? 聚类分析属于探索性的数据分析方法。通常,我们利用聚类分析将看似无序的对象进行分组、归类,以达到更好地理解研究对象的...

阅读(2381)评论(0)赞 (2)

R

R语言的三种聚类方法

1

xsmile 发布于 2015-12-17

一、层次聚类 1)距离和相似系数 r语言中使用dist(x, method = “euclidean”,diag = FALSE, upper = FALSE, p = 2) 来计算距离。其中x是样本矩阵或者数据框。method表示计算哪种距离。metho...

阅读(1999)评论(0)赞 (0)

Python

K-means算法及文本聚类实践

4

xsmile 发布于 2015-07-08

K-Means是常用的聚类算法,与其他聚类算法相比,其时间复杂度低,聚类的效果也还不错,这里简单介绍一下k-means算法,下图是一个手写体数据集聚类的结果。 基本思想 k-means算法需要事先指定簇的个数k,算法开始随机选择k个记录点作为中心点,然后遍历整个数据集的各条记录,...

阅读(1860)评论(0)赞 (2)

数据挖掘

聚类分析在用户分类中的应用

3

xsmile 发布于 2015-07-02

来自 http://uedc.163.com/3287.html 什么是聚类分析? 聚类分析属于探索性的数据分析方法。通常,我们利用聚类分析将看似无序的对象进行分组、归类,以达到更好地理解研究对象的目的。聚类结果要求组内对象相似性较高,组间对象相似性较低。在用户研究中,很多问题可...

阅读(1030)评论(0)赞 (1)

SAS

聚类分析

106

xsmile 发布于 2015-07-02

来自网络 聚类分析和判别分析有相似的作用,都是起到分类的作用。但是,判别分析是已知分 类然后总结出判别规则,是一种有指导的学习;而聚类分析则是有了一批样本,不知道它们 的分类,甚至连分成几类也不知道,希望用某种方法把观测进行合理的分类,使得同一类的 观测比较接近,不同类的观测相差...

阅读(1676)评论(0)赞 (1)