机器学习

  • ARIMA模型原理以及代码实现案例

    一、时间序列分析 北京每年每个月旅客的人数,上海飞往北京每年的游客人数等类似这种顾客数、访问量、股价等都是时间序列数据。这些数据会随着时间变化而变化。时间序列数据的特点是数据会随时…

    2022年6月1日 0
  • 集成模型方法

    作者 | Salma Elshahawy, MSc.编译 | VK 来源 | Towards Data Science 介绍 我们之前讨论了一些利用机器学习(ML)模型预测能力的常…

    2022年5月31日 0
  • 太棒了!8 个开源自动化机器学习框架,轻松搞定机器学习!

    自动化机器学习(AutoML)可以帮助机器学习管道中的某些关键组件实现自动化。其中机器学习管道包括数据理解、数据工程、特征工程、模型训练、超参数调整、模型监控等。 在这篇文章中,我…

    2022年5月31日 0
  • Pandas教程 | 超好用的Groupby用法详解

    在日常的数据分析中,经常需要将数据根据某个(多个)字段划分为不同的群体(group)进行分析,如电商领域将全国的总销售额根据省份进行划分,分析各省销售额的变化情况,社交领域将用户根…

    2022年5月24日 0
  • 十种聚类算法的完整Python操作示例

    聚类或聚类分析是无监督学习问题。它通常被用作数据分析技术,用于发现数据中的有趣模式,例如基于其行为的客户群。有许多聚类算法可供选择,对于所有情况,没有单一的最佳聚类算法。相反,最好…

    2022年5月23日 0
  • EXCEL规划求解的简明教程

    在知乎上查了查EXCEL规划求解的文章,的确有一些很好的应用实例,但我就有点纳闷了,EXCEL的规划求解模块难道不是用来求解运筹学问题的专业工具吗?怎么没有一篇文章提及这一点呢? …

    2022年5月18日 0
  • 用Python进行系统聚类分析

    在进行机器学习时,我们往往要对数据进行聚类分析,聚类,说白了就是把相似的样品点/数据点进行归类,相似度高的样品点会放在一起,这样一个样本就会被分成几类。而聚类分析也有很多种方法,比…

    2022年5月17日 0
  • GDBT模型、XGBoost和LightGBM之间的区别与联系

    GBDT提升树与XGBoost树 相比于经典的GBDT,xgboost做了一些改进,从而在效果和性能上有明显的提升,在这里,通过整理了一些资料,总结了一下: 第一,GBDT将目标函…

    2022年5月14日 0
  • 决策树 – Decision tree

    什么是决策树? 决策树学习的 3 个步骤 3 种典型的决策树算法 决策树的优缺点 决策树是一种逻辑简单的机器学习算法,它是一种树形结构,所以叫决策树。 本文将介绍决策树的基本概念、…

    2022年5月14日 0
  • 随机森林 – Random forest

    什么是随机森林? 构造随机森林的 4 个步骤 随机森林的优缺点 随机森林 4 种实现方法对比测试 随机森林的 4 个应用方向 随机森林是一种由决策树构成的集成算法,他在很多情况下都…

    2022年5月6日 0
  • 推荐系统中的Embedding

    本次讨论的问题目录有: 什么是Embedding? 推荐系统为什么需要Embedding? 推荐系统代码中如何用数据生成Embedding? 推荐系统代码中的Embedding技术…

    2022年3月29日 0
  • 基于SAS EM快速开发信用评分卡

    作者:彭碧辉 现任广州数驰信息科技有限公司技术总监,负责金融领域数据分析解决方案与实施。 一直懒于写作,没有把自己的知识点给大家分享,多谢朋友和同事提点,把自己在SAS领域的学习研…

    2022年3月24日 0
  • 如何利用SAS EM建立决策树?

    背景:利用SAS EM建立决策树,制定差异化的运营策略。 前期准备:在SAS中准备好数据集,对缺失值进行预设和处理,设定目标变量,导入SAS EM,新建逻辑库和流程。 1. 数据探…

    2022年3月24日 0
  • 推荐系统老司机的十条经验

    一年一度的ACM Recsys会议在9月份已经胜利闭幕,留下一堆slides和tutorials等着我们去学习。 翻看今年的各种分享,其中老司机Xavier Amatriain(曾…

    2022年3月21日 0
  • 10 种 Python 聚类算法完整操作示例

    聚类或聚类分析是无监督学习问题。它通常被用作数据分析技术,用于发现数据中的有趣模式,例如基于其行为的客户群。有许多聚类算法可供选择,对于所有情况,没有单一的最佳聚类算法。相反,最好…

    2022年3月18日 0
  • pycaret模型分析

    1、解释模型 解释复杂模型在机器学习中至关重要。 模型可解释性通过分析模型真正认为的重要内容来帮助调试模型。 在PyCaret中解释模型就像编写interpret_model一样简…

    2022年3月13日 0
  • Xgbfi特征重要性分析(xgboost扩展)

    Xgbfi 用于训练好的xgboost模型分析对应特征的重要性,当然你也可以使用fmap来观察 What is Xgbfi? Xgbfi is a XGBoost model du…

    2022年3月10日 0
  • Python—KNN分类算法(详解)

    1. 概述 KNN 可以说是最简单的分类算法之一,同时,它也是最常用的分类算法之一。注意:KNN 算法是有监督学习中的分类算法,它看起来和另一个机器学习算法 K-means 有点像…

    2022年3月7日 0
  • 提高数据分析能力,你不得不看的33本书

    数据分析是一门专业且跨越多个领域的学科,需要我们同时具备数据能力、业务能力,还有基本的数据思维方法。除了平时在网上搜集相关资料学习以外,如果希望短时间内高效的掌握数据分析的知识并运…

    2022年2月17日 0
  • 在大数据上使用PySpark进行K-Means

    如果你不熟悉K Means聚类,建议阅读下面的文章。本文主要研究数据并行和聚类,大数据上的K-Means聚类。 https://towardsdatascience.com/uns…

    2022年2月16日 0

联系我们

在线咨询:点击这里给我发消息

邮件:23683716@qq.com

跳至工具栏