数据处理

  • 数据仓库实践杂谈-(五)-ETL

    [目录] 第一章:概述 第二章:整体数据分层 第三章:整体实现框架 第四章:元数据 第五章:ETL 第六章:数据校验 第七章:数据标准化 第八章:去重 第九章:增量/全量 第十章:…

    2019年12月12日 0
  • SPSS常用基础操作—连续变量离散化

    首先说一下什么是离散化以及连续变量离散化的必要性。 离散化是把无限空间中无限的个体映射到有限的空间中去,通俗点讲就是把连续型数据切分为若干“段”,也称bin,离散化在数据分析中特别…

    2017年1月20日 0
  • SPSS常用基础操作—变量分组

    有时我们需要对数据资料按照某个规则进行归组,如 在上述资料中,想按照年龄进行分组,30岁以下为组1,30-40岁为组2,40岁以上为组3 有两种方法可以实现: 1.使用计算变量功能…

    2017年1月20日 0
  • sas提高处理大数据效率的一些实用技巧

    来自: 人大经济论坛 以下是自己总结的一些方法,欢迎拍砖,添砖加瓦。 1.测试代码的时候,可以从大数据集中抽取一部分数据来进行测试,而不比直接在大文件上全部进行测试。抽取数据这个有…

    2016年9月23日 0
  • 数据清理data Cleaning技术大全及SAS实现

    来自 http://blog.sina.com.cn/s/blog_5d3b177c0100esmx.html 1 简介 数据清理是数据准备一个很重要的环节,什么是数据清理呢?数据…

    2016年8月1日 0
  • 【R】有助于提高数据处理效率的7个包

    来自数据工匠 http://datartisan.com/article/detail/67.html 引言 数据处理是建立预测模型时不可避免的一步。一个稳健的预测模型不是仅仅依靠…

    2016年1月25日 0

联系我们

在线咨询:点击这里给我发消息

邮件:23683716@qq.com

跳至工具栏