xsmile

  • from https://zhuanlan.zhihu.com/p/30221526

    基于Iris数据集的机器学习实践

    Iris数据集简介

    iris数据集由Fisher, 1936收集整理,Iris也称安德森鸢尾花卉数据集,英文全称是Anderson’s […]

  • from https://zhuanlan.zhihu.com/p/30221355

    导言

    机器学习是目前炙手可热的一门交叉学科,致力于研究通过计算的手段,利用经验来改善系统自身的性能,目前已经有相当成熟的应用场景。Tableau是致力于帮助人们查看并理解数据的一款可视化分析软件。本文使用Iris鸢尾花数据集,探讨了如何使用Python语言,将机器学习算法模型集成到Tableau的可视化分析报表中,并 […]

  • SPSS […]

  • 版权声明:本文为博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。

    原文链接:htt […]

  • 做数据分析前需要先看一下数据的概况,有一个很好用的工具pandas_profiling可以快速预览数据只用一行代码,即可快速显示数据概况import pandas as pdimport pandas_profilingdf = pd.read_csv(‘churn.csv’)# windows pycharm执行代码,执行完在浏览器打开example.htmlif __name__ == ‘__main__’:    pfr = pandas_profiling.ProfileReport(df)    pfr.to_file(“./example.html”)# 在jupyter执行代码,只用下边的一行即可# pfr = pandas_profiling.ProfileReport(d…[阅读更多]

  • 在做深入的分析或者挖掘之前总是要做很多描述统计的工作,不知道有没有比较好的包可以快速完成这部分的内容,谢谢。

  • from https://www.cnblogs.com/bonelee/p/9577432.html

    简单使用
    代码如下
    这是官网的quickstart的内容,csv文件也可以下到,这个入门以后后面调试加入其它参数就很简单了.
    import pandas as pd
    import numpy as np
    from fbprophet import Prophet
    import matplotlib.pyp […]

  • 环境是win10 64位,python 3.6.1查看了其他博客的安装方式,安装了pystan。 但是在安装fbprophet的时候,碰到了问题。 1. 直接pip 安装,出现错误。python运行直接中断。 2. 从github上下载后,解压后,通过python setup.py install. 结果也是python运行直接出错。后来查看了https://github.com/facebook/prophet上安装方法。 最简单的conda安装成功了! 命令如下: conda install -c conda-forge fbprophet——-…[阅读更多]

  • pystan安装好了,pip install fbprophet,总是报错,怎么办呢?谢谢。 

  • xsmile 撰写了一篇新博客文章:GBDT+LR算法进行特征扩增 5个月 之前

  • from https://blog.csdn.net/huacha__/article/details/81057150#%E7%94%A8python%E5%AE%9E%E7%8E%B0LightGBM%E7%AE%97%E6%B3%95
    前言
    LightGBM是个快速的,分布式的,高性能的基于决策树算法的梯度提升框架。可用于排序,分类,回归以及很多其他的机器学习任务中。

    在竞赛题中,我们知道XGBoost算法非 […]

  • xsmile 撰写了一篇新博客文章:MySQL 存储过程 5个月, 2周 之前

    from https://www.runoob.com/w3cnote/mysql-stored-procedure.html

    MySQL 5.0 版本开始支持存储过程。
    存储过程(Stored Procedure)是一种在数据库中存储复杂程序,以便外部程序调 […]

  • from http://www.woshipm.com/data-analysis/917862.html
    玩转会员数据分析系列文章主要针对数据分析给大家普及一些基础知识以及在工作中经常会用到的数据分析方法和概念,帮助大家一起成长。
    因为我们知道,在整个产品经理的职业生涯中,如果你不想永远是一个只画画原型,写写文档的职场菜鸟,就一定需要掌握数据分析的概念和方法,你需要知道在管理产品的不同阶段需要使用哪些数据分析的方法来论 […]

  • 一、为什么会有假设检验的两类错误?由于假设检验是根据有限的样本信息对总体作推断,不论做出哪种推断结论(拒绝原假设H0和不拒绝原假设H0),都由可能因为抽样等原因发生错误。二、假设检验的两类错误1. 第I类错误实际情况和H0一致,仅由于抽样误差拒绝H0,导致推断结论错误,称为第I类错误,假阳性。犯第I类错误的概率可以用α来控制,一般常取0.05或0.01。当α=0.05,表示:如果H0成立,按照同样的方法在原假设H0规定的总体中重复抽样,那么在100次检验结论中平均可以有5次拒绝H0(即假阳性,犯第I类错误)。2. 第II类错误实际情况和H1一致,仅由于抽样误…[阅读更多]

  • from https://www.cnblogs.com/xuyulin/p/5…   Read more»

  • xsmile posted a new topic "SQL总结"6个月, 1周 之前

    from https://blog.csdn.net/qq_38735934/a…   Read more»

  • from https://www.cnblogs.com/jasonfreak/p/5441512.html
    目录
    1 描述性统计是什么?
    2 使用NumPy和SciPy进行数值分析
    2.1 基本概念
    2.2 中心位置(均值、中位数、众数)
    2.3 发散程度(极差,方差、标准差、变异系数)
    2.4 偏差程度(z-分数)
    2.5 相关程度(协方差,相关系数)
    2.6 回顾
    3 使用Matplotl […]

  • 作者:saltriver
    原文:https://blog.csdn.net/saltriver/article/details/52194918

    蒙特卡洛方法(Monte Carlo method,也有翻译成“蒙特卡罗方法”)是以概率 […]

  • 作者:朱曦炽
    链接:https://www.jianshu.com/p/cb7145e4c4bd

    中心极限定理是统计学中比较重要的一个定理。 本文将通过实际模拟数据的形式,形象地展示中心极限定理是什么,是如何发挥作用的。
    什么是中心极限定理(Central […]

  • 参考:https://zhidao.baidu.com/question/262780155.html1.类型:“Where”是一个约束声明,在查询数据库的结果返回之前对数据库中的查询条件进行约束,即在结果返回之前起作用,且where后面不能使用“聚合函数”;“Having”是一个过滤声明,所谓过滤是在查询数据库的结果返回之后进行过滤,即在结果返回之后起作用,并且having后面可以使用“聚合函数”。2.使用的角度:where后面之所以不能使用聚合函数是因为where的执行顺序在聚合函数之前,如下面这个sql语句:select  sum(score) from student  group by student.sex where sum(student.age)>100;having…[阅读更多]

  • 读取更多