标签:关联规则

数据挖掘

机器学习常见算法分类汇总

16

xsmile 发布于 2016-11-19

原文出处:IT经理网 机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。本文为您总结一下常见的机器学习算法,以供您在工作和学习中参考。 机器学习的算法很多。很多时候困惑人们都是,很多算法是一类算法,而有些算法又是从其他算法中延伸出来...

阅读(574)评论(0)赞 (3)

R

关联规则:R与SAS的比较

xsmile 发布于 2016-07-21

来自 http://cos.name/2013/02/association-rules-with-r-and-sas/ 啤酒和尿布的故事是关联分析方法最经典的案例,而用于关联分析的Apriori算法更是十大数据挖掘算法之一(http://www.cs.uvm.edu/~icdm...

阅读(1153)评论(0)赞 (7)

Modeler

多角度看数据挖掘经典案例-购物篮分析

5

xsmile 发布于 2015-11-26

关联分析是数据挖掘体系中重要的组成部分之一,其代表性的案例即为“购物篮分析”。我们以数据挖掘软件Clementine自带的一个购物篮分析的数据为例,从多个方面来探讨这一方面的内容。 关联分析要解决的主要问题是:一群用户购买了很多产品之后,哪些产品同时购买的几率比较高?买了A产品的...

阅读(1708)评论(0)赞 (0)

R

基于R语言的关联规则分析项目

3

xsmile 发布于 2015-11-25

来自 网络 作者 关东煮 摘要 抱着成为一名优秀的数据分析师/数据挖掘师的理想,我们组成了一个数据分析团队。 在完成两周的关联规则自主学习后,我们开展了为期半个月的团队第一个合作分析项目——消费者购买情况的关联分析。 项目的数据来自于团队成员贡献的某公司2013年至2014年客户...

阅读(2732)评论(2)赞 (0)

R

R语言关联规则可视化:扩展包arulesViz的介绍

10

xsmile 发布于 2015-11-25

来自 http://www.klshu.com/1202.html 关联规则挖掘是一种流行的数据挖掘方法,在R语言中为扩展包arules。然而,挖掘关联规则往往导致非常多的规则,使分析师需要通过查询所有的规则才能发现有趣的规则。通过手动筛选大量的规则集是费时费力。在本文中,我们基...

阅读(1553)评论(0)赞 (0)

数据挖掘

Apriori算法

2

xsmile 发布于 2015-10-07

Apriori 算法是数据挖掘中一种挖掘关联规则的频繁项集算法。其核心是基于两阶段频集思想的递推算法。 先来了解下关联规则挖掘: 发现事务数据库,关系数据 ,  或其它信息库中项或数据对象集合间的频繁模式。关联,相关,或因果关系结构。 频繁模式:在数据库中频繁出现的模式 ( 项集...

阅读(1693)评论(0)赞 (0)

数据挖掘

数据挖掘算法之-关联规则挖掘(Association Rule)

xsmile 发布于 2015-10-01

在数据挖掘的知识模式中,关联规则模式是比较重要的一种。关联规则的概念由Agrawal、Imielinski、Swami 提出,是数据中一种简单但很实用的规则。关联规则模式属于描述型模式,发现关联规则的算法属于无监督学习的方法。 一、关联规则的定义和属性 考察一些涉及许多物品的事务...

阅读(944)评论(0)赞 (0)

数据挖掘

关联规则的常用算法

5

xsmile 发布于 2015-09-18

来自刘思喆@贝吉塔行星 关联规则(association rules)是一种广泛使用的模式识别方法,比如在购物篮分析(Market basket Analysis),网络连接分析(Web link),基因分析。我们常常提到的购物篮分析,它的典型的应用场景就是要找出被一起购买的商品...

阅读(2562)评论(0)赞 (2)

数据挖掘

用modeler做关联分析

xsmile 发布于 2015-07-04

来自 7月2号 2群(112961316)的分享 数据挖掘典型应用:关联分析 一、背景 不管是在线上还是线下,对于商家而言,有两个很重要的指标对于扩大销售规模是很重要的:第一,提高顾客重复购买次数;第二,提高客户订单中的Basket size(即购物篮件数)。而第二个指标提高Ba...

阅读(1266)评论(0)赞 (0)

数据挖掘

数据挖掘系列(5)使用mahout做海量数据关联规则挖掘

xsmile 发布于 2015-05-26

来源:www.cnblogs.com/fengfenggirl 上一篇介绍了用开源数据挖掘软件weka做关联规则挖掘,weka方便实用,但不能处理大数据集,因为内存放不下,给它再多的时间也是无用,因此需要进行分布式计算,mahout是一个基于hadoop的分布式数据挖掘开源项目(...

阅读(1106)评论(0)赞 (0)

数据挖掘

数据挖掘系列(3)–关联规则评价

6

xsmile 发布于 2015-05-20

来源:www.cnblogs.com/fengfenggirl 前面我们讨论的关联规则都是用支持度和自信度来评价的,如果一个规则的自信度高,我们就说它是一条强规则,但是自信度和支持度有时候并不能度量规则的实际意义和业务关注的兴趣点。 一个误导我们的强规则 看这样一个例子,我们分析...

阅读(936)评论(0)赞 (0)

数据挖掘

数据挖掘系列(2)–关联规则FpGrowth算法

12

xsmile 发布于 2015-05-19

来源:www.cnblogs.com/fengfenggirl Aprori算法利用频繁集的两个特性,过滤了很多无关的集合,效率提高不少,但是我们发现Apriori算法是一个候选消除算法,每一次消除都需要扫描一次所有数据记录,造成整个算法在面临大数据集时显得无能为力。今天我们介绍...

阅读(934)评论(0)赞 (1)

数据挖掘

数据挖掘系列(1)关联规则挖掘基本概念与Aprior算法

2

xsmile 发布于 2015-05-19

来源:www.cnblogs.com/fengfenggirl 我计划整理数据挖掘的基本概念和算法,包括关联规则挖掘、分类、聚类的常用算法,敬请期待。今天讲的是关联规则挖掘的最基本的知识。 关联规则挖掘在电商、零售、大气物理、生物医学已经有了广泛的应用,本篇文章将介绍一些基本知识...

阅读(1065)评论(0)赞 (0)