标签:数据挖掘

机器学习

机器学习中用来防止过拟合的方法有哪些?

本文作者fly qq微信公众号qRobotics,机器人学博士生 原文:机器学习中用来防止过拟合的方法有哪些? 给《机器视觉与应用》课程出大作业的时候,正好涉及到这方面内容,所以简单整理了一下(参考 Hinton 的课程)。按照之前的套路写...

机器学习

评分卡上线后如何进行评分卡的监测

作者授权转发,原文地址:https://blog.csdn.net/lll1528238733/article/details/78356803 版权声明:本文为博主原创文章,未经博主允许不得转载。 有一段时间没来写博了,一直忙我司申请评分...

机器学习

信用标准评分卡模型开发及实现

作者授权转发,原文地址:https://blog.csdn.net/lll1528238733/article/details/76602006 版权声明:本文为博主原创文章,未经博主允许不得转载。 一、信用风险评级模型的类型 信用风险计量...

Python

python调参神器hyperopt

from https://blog.csdn.net/qq_34139222/article/details/60322995   Hyperopt库为python中的模型选择和参数优化提供了算法和并行方案。机器学习常见的模型有K...

Python

揭秘Kaggle神器xgboost

from https://blog.csdn.net/qunnie_yi/article/details/80129857 在 Kaggle 的很多比赛中,我们可以看到很多 winner 喜欢用 xgboost,而且获得非常好的表现,今天就...

R

R训练Random Forest并转pmml

from https://blog.csdn.net/c1481118216/article/details/74202786 PMML 关于pmml 请查看博客: http://blog.csdn.net/c1481118216/arti...

R

R语言 | 关联规则

from https://blog.csdn.net/gjwang1983/article/details/45015203 1.概念 1.1 引论 关联规则(AssociationRules)是无监督的机器学习方法,用于知识发现,而非预测...

机器学习

随机森林和GBDT的区别

  一,随机森林 随机森林是一个用随机方式建立的,包含多个决策树的集成分类器。其输出的类别由各个树投票而定(如果是回归树则取平均)。假设样本总数为n,每个样本的特征数为a,则随机森林的生成过程如下: 从原始样本中采用有放回抽样的方...

机器学习

教你如何最快入门用户画像

转自 http://www.cnblogs.com/ModifyRong/p/7800318.html 大家可能经常会听到用户画像这个词,但是具体在做的时候又会觉得无从下手,或者认为只是常规的标签统计,这往往是一个误区。本人在某互联网企业从...

机器学习

SCIKIT-LEARN与GBDT使用案例

安装 SCIKIT-LEARN是一个基于python/numpy/scipy的机器学习库 windows下最简单的安装方式是使用winpython进行安装 WinPython地址 GBDT使用 这段代码展示了一个简单的GBDT调用过程 数据...

机器学习

kaggle 欺诈信用卡预测——Smote+LR

from:https://zhuanlan.zhihu.com/p/30461746 本项目需解决的问题 本项目通过利用信用卡的历史交易数据,进行机器学习,构建信用卡反欺诈预测模型,提前发现客户信用卡被盗刷的事件。 建模思路 项目背景 数据...

机器学习

协同过滤推荐算法的原理及实现

原文地址:http://blog.csdn.net/huagong_adu/article/details/7362908 一、协同过滤算法的原理及实现 二、基于物品的协同过滤算法详解 一、协同过滤算法的原理及实现 协同过滤推荐算法是诞生最...