前置知识 编程语言 至少应该掌握一门编程语言,计算机专业的同学大…
分类: 大数据
关于数仓基础知识的超全概括
作者 汪仔4623 面对大数据的多样性,在存储和处理这些大数据时…
大数据研究报告,华为数据治理经验报告!
大数据研究报告,华为数据治理经验报告! 企业只有建立了完整的数据…
用于大数据的存储层 Delta Lake
Delta Lake 是一个存储层,为 Apache Spark…
pySpark DataFrame入门
DataFrame是一种不可变的分布式数据集,这种数据被组织成指…
用户画像的流程
用户画像将产品设计的焦点放在目标用户的动机和行为上,从而避免产品…
20 分钟自动搭建大数据平台
下载镜像 docker pull cloudera/quicks…
数据仓库实践杂谈-(五)-ETL
[目录] 第一章:概述 第二章:整体数据分层 第三章:整体实现框…
数据仓库实践杂谈(六)-数据校验
[目录] 第一章:概述 第二章:整体数据分层 第三章:整体实现框…
数据仓库实践杂谈-(四)-元数据
[目录] 第一章:概述 第二章:整体数据分层 第三章:整体实现框…
数据仓库实践杂谈-(三)-整体实现框架
[目录] 第一章:概述 第二章:整体数据分层 第三章:整体实现框…
数据仓库实践杂谈-(二)-数据分层
[目录] 第一章:概述 第二章:整体数据分层 第三章:整体实现框…
数据仓库实践杂谈-(一)-概述
[目录] 第一章:概述 第二章:整体数据分层 第三章:整体实现框…
pyspark的使用和操作(基础整理)
from https://blog.csdn.net/cymy0…
大数据分析界的“神兽”Apache Kylin有多牛?
本文作者:李栋,来自Kyligence公司,也是Apache K…
SQL for ElasticSearch—Crate.io简介
from http://lxw1234.com/archives…
采用ubuntu系统来安装tensorflow
from http://www.cnblogs.com/ljy2…
大规模机器学习:将数据科学引入生产系统架构的典型模式
from 网络 文作者 Mikio Braun 是 Zaland…
关于机器学习的领悟与反思
作者介绍 张志华 北京大学数学学院教授,北京大数据研究院高级…
大数据时代的 9 大Key-Value存储数据库
from http://www.iteye.com/news/2…