一起大数据

最新发布

数据分析

数据可视化不完全指南(上)

数据集犹如世界历史状态的快照,能帮助我们捕捉不断变化的事物,而数据可视化则是将复杂数据以简单的形式展示给用户的良好手段(或媒介)。结合个人书中所学与实际工作所学,对数据可视化过程做了一些总结形成本文供各位看客”消遣”...

数据挖掘

246 页《统计机器学习与凸优化》教程

统计机器学习(Statistical Machine Learning)是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科。凸优化(convex optimization)是指一种比较特殊的优化,是指求取最小值的目...

SQL

数据库SQL 基础命令目录

from https://blog.csdn.net/weixin_42329277/article/details/80767690 ————————–【数据库SQL基础】————————– 查找基础指令 作用 命令 例 打印去重 dis...

数据挖掘

大白话解析模拟退火算法

一. 爬山算法 ( Hill Climbing ) 介绍模拟退火前,先介绍爬山算法。爬山算法是一种简单的贪心搜索算法,该算法每次从当前解的临近解空间中选择一个最优解作为当前解,直到达到一个局部最优解。 爬山算法实现很简单,其主要缺点是会陷入...

数据分析

Gibbs Sampling(吉布斯采样)

from https://blog.csdn.net/wang_yi_wen/article/details/17319905 摘要:Gibbs Sampling利用条件概率产生符合分布的样本,用于估计分布的期望,边缘分布;是一种在无法精确...

数据挖掘

入门级攻略:机器学习 VS. 深度学习

from https://zhuanlan.zhihu.com/p/26769864 摘要: 本文以浅显易懂的语言介绍了机器学习和深度学习的定义及应用,以及在源数据要求,硬件支持,特征工程、问题解决方式、执行时间及可解释性等方面的区别,对于...

Python

python调参神器hyperopt

from https://blog.csdn.net/qq_34139222/article/details/60322995   Hyperopt库为python中的模型选择和参数优化提供了算法和并行方案。机器学习常见的模型有K...

SAS

免费云端版SAS,随时随地写代码,你值得拥有!

如果既没有购买SAS,也不愿意下载大学版,甚至连安装都懒得弄,我们还有什么办法可以用SAS吗?这不是痴人说梦吧?不是,确实有啊,那就是SODA,一个免费云端版的SAS,只要有网络,我们就可以随时随地SAS。 SODA(SAS®OnDeman...

R

R语言–数据抽样的实现

来自 https://blog.csdn.net/u014460433/article/details/52756752  这里主要介绍简单随机抽样、分层抽样、整群抽样三种基本抽样方法。 用到的软件包及函数 软件包 函数 函数意义 base...

Python

揭秘Kaggle神器xgboost

from https://blog.csdn.net/qunnie_yi/article/details/80129857 在 Kaggle 的很多比赛中,我们可以看到很多 winner 喜欢用 xgboost,而且获得非常好的表现,今天就...

R

R训练Random Forest并转pmml

from https://blog.csdn.net/c1481118216/article/details/74202786 PMML 关于pmml 请查看博客: http://blog.csdn.net/c1481118216/arti...

SAS

如何用 SAS/EM 导出 PMML 文件?

来自 http://blog.sina.com.cn/s/blog_8db50cf70101hkzy.html 1) 启动 PMML 生成选项 SAS/EM 默认情况下不支持PMML,想要生成PMML文档,必须手动打开PMML 生成选项。 ...