xsmile

  • xsmile 撰写了一篇新博客文章:GBDT+LR算法进行特征扩增 1周 之前

  • from https://blog.csdn.net/huacha__/article/details/81057150#%E7%94%A8python%E5%AE%9E%E7%8E%B0LightGBM%E7%AE%97%E6%B3%95
    前言
    LightGBM是个快速的,分布式的,高性能的基于决策树算法的梯度提升框架。可用于排序,分类,回归以及很多其他的机器学习任务中。

    在竞赛题中,我们知道XGBoost算法非 […]

  • xsmile 撰写了一篇新博客文章:MySQL 存储过程 3周, 1天 之前

    from https://www.runoob.com/w3cnote/mysql-stored-procedure.html

    MySQL 5.0 版本开始支持存储过程。
    存储过程(Stored Procedure)是一种在数据库中存储复杂程序,以便外部程序调 […]

  • from http://www.woshipm.com/data-analysis/917862.html
    玩转会员数据分析系列文章主要针对数据分析给大家普及一些基础知识以及在工作中经常会用到的数据分析方法和概念,帮助大家一起成长。
    因为我们知道,在整个产品经理的职业生涯中,如果你不想永远是一个只画画原型,写写文档的职场菜鸟,就一定需要掌握数据分析的概念和方法,你需要知道在管理产品的不同阶段需要使用哪些数据分析的方法来论 […]

  • 一、为什么会有假设检验的两类错误?由于假设检验是根据有限的样本信息对总体作推断,不论做出哪种推断结论(拒绝原假设H0和不拒绝原假设H0),都由可能因为抽样等原因发生错误。二、假设检验的两类错误1. 第I类错误实际情况和H0一致,仅由于抽样误差拒绝H0,导致推断结论错误,称为第I类错误,假阳性。犯第I类错误的概率可以用α来控制,一般常取0.05或0.01。当α=0.05,表示:如果H0成立,按照同样的方法在原假设H0规定的总体中重复抽样,那么在100次检验结论中平均可以有5次拒绝H0(即假阳性,犯第I类错误)。2. 第II类错误实际情况和H1一致,仅由于抽样误…[阅读更多]

  • from https://www.cnblogs.com/xuyulin/p/5…   Read more»

  • xsmile posted a new topic "SQL总结"1个月, 2周 之前

    from https://blog.csdn.net/qq_38735934/a…   Read more»

  • from https://www.cnblogs.com/jasonfreak/p/5441512.html
    目录
    1 描述性统计是什么?
    2 使用NumPy和SciPy进行数值分析
    2.1 基本概念
    2.2 中心位置(均值、中位数、众数)
    2.3 发散程度(极差,方差、标准差、变异系数)
    2.4 偏差程度(z-分数)
    2.5 相关程度(协方差,相关系数)
    2.6 回顾
    3 使用Matplotl […]

  • 作者:saltriver
    原文:https://blog.csdn.net/saltriver/article/details/52194918

    蒙特卡洛方法(Monte Carlo method,也有翻译成“蒙特卡罗方法”)是以概率 […]

  • 作者:朱曦炽
    链接:https://www.jianshu.com/p/cb7145e4c4bd

    中心极限定理是统计学中比较重要的一个定理。 本文将通过实际模拟数据的形式,形象地展示中心极限定理是什么,是如何发挥作用的。
    什么是中心极限定理(Central […]

  • 参考:https://zhidao.baidu.com/question/262780155.html1.类型:“Where”是一个约束声明,在查询数据库的结果返回之前对数据库中的查询条件进行约束,即在结果返回之前起作用,且where后面不能使用“聚合函数”;“Having”是一个过滤声明,所谓过滤是在查询数据库的结果返回之后进行过滤,即在结果返回之后起作用,并且having后面可以使用“聚合函数”。2.使用的角度:where后面之所以不能使用聚合函数是因为where的执行顺序在聚合函数之前,如下面这个sql语句:select  sum(score) from student  group by student.sex where sum(student.age)>100;having…[阅读更多]

  • 主键和外键参考https://www.cnblogs.com/buptlyn/p/4555206.html1 什么是主键 外键 学生表(学号,姓名,性别,班级)     学号是一个主键 课程表(课程号,课程名,学分)    课程号是一个主键 成绩表(学号,课程号,成绩)     学…[阅读更多]

  • 需要分组汇总的时候需要用到group by ,比如统计男女的人数,就需要group by gender。

  • 写的顺序:select … from… where…. group by… having… order by.. limit [offset,] (rows)执行顺序:from… where…group by… having…. select … order by… limit

  • 执行顺序可以参考:https://www.cnblogs.com/rollenholt/p/3776923.htmlMySQL的语句一共分为11步,如下图所标注的那样,最先执行的总是FROM操作,最后执行的是LIMIT操作。其中每一个操作都会产生一张虚拟的表,这个虚拟的表作为一个处理的输入,只是这些虚拟的表对用户来说是透明的,但是只有最后一个虚拟的表才会被作为结果返回。如果没有在语句中指定某一个子句,那么将会跳过相应的步骤。下面我们来具体分析一下查询处理的每一个阶段

    1. FORM: 对FROM的左边的表和右边的表计算笛卡尔积。产生虚表VT1
    2. ON: 对虚表VT1进行ON筛选,只有那些符合<join-condition>的行才会被记录在虚表VT2中。
    3. JOIN: 如果指定了OUTER JOIN(比如le…

    [阅读更多]

  • 1. select的执行顺序,比如很复杂的语句,有group by和order by的时候例如有个语句:select name, sum(sales)from storegroup by (name)order by name 2. 表连接的几个要怎么区分?(left \right\inner join ,union ,union all) 内部连接和外部连接的区别?3. 什么时候用group by ?4. 主键和外来键有什么区别,具体应在哪些情况下使用?(主键是唯一的,但是为什么又说主键可以包含一个或多个列)5. having和where有什么区别,应用场景是什么样的? 

  • 参考 HiveQL与SQL区别1、Hive不支持等值连接 •SQL中对两表内联可…   Read more»

  • 目前SQL很熟练,没有用过hive,请教下,谢谢。

  • xsmile 撰写了一篇新博客文章:Power BI架构 你选对了吗? 2个月 之前

    原文:https://www.jianshu.com/p/94768017a456

    最近我有幸听到了国内BI大神老金的Power BI架构的现场讲解,一个字:牛B!废话不多说,直接上干货。

    大神 […]

  • 读取更多