一起大数据

最新发布

数据分析

交互式数据分析工具 Scriptis

Scriptis是一款支持在线写SQL、Pyspark、HiveQL等脚本,提交给Linkis执行的数据分析Web工具,且支持UDF、函数、资源管控和智能诊断等企业级特性。 核心特点: 脚本编辑:多语言、自动补全、语法高亮、SQL语法纠错;...

大数据

数据仓库实践杂谈-(四)-元数据

[目录] 第一章:概述 第二章:整体数据分层 第三章:整体实现框架 第四章:元数据 第五章:ETL 第六章:数据校验 第七章:数据标准化 第八章:去重 第九章:增量/全量 第十章:拉链处理 第十一章:分布式处理增量 第十二章:列式存储 第十...

大数据

数据仓库实践杂谈-(三)-整体实现框架

[目录] 第一章:概述 第二章:整体数据分层 第三章:整体实现框架 第四章:元数据 第五章:ETL 第六章:数据校验 第七章:数据标准化 第八章:去重 第九章:增量/全量 第十章:拉链处理 第十一章:分布式处理增量 第十二章:列式存储 第十...

大数据

数据仓库实践杂谈-(二)-数据分层

[目录] 第一章:概述 第二章:整体数据分层 第三章:整体实现框架 第四章:元数据 第五章:ETL 第六章:数据校验 第七章:数据标准化 第八章:去重 第九章:增量/全量 第十章:拉链处理 第十一章:分布式处理增量 第十二章:列式存储 第十...

Python

向Excel说再见,神级编辑器统一表格与Python

很多开发者说自从有了 Python/Pandas,Excel 都不怎么用了,用它来处理与可视化表格非常快速。但是这样还是有一大缺陷,操作不是可视化的表格,因此对技能要求更高一点。近日,开发者构建了名为 Grid studio 的开源项目,它...

大数据

数据仓库实践杂谈-(一)-概述

[目录] 第一章:概述 第二章:整体数据分层 第三章:整体实现框架 第四章:元数据 第五章:ETL 第六章:数据校验 第七章:数据标准化 第八章:去重 第九章:增量/全量 第十章:拉链处理 第十一章:分布式处理增量 第十二章:列式存储 第十...

数据可视化

Tableau高级使用技巧之组与集

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 本文链接:https://blog.csdn.net/qq_40819816/article/details/89785184 Tab...

数据可视化

Tableau高级使用技巧之表计算

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 本文链接:https://blog.csdn.net/qq_40819816/article/details/89811579 Tab...

Python

Tableau集成Python机器学习实践(中)

from https://zhuanlan.zhihu.com/p/30221526 基于Iris数据集的机器学习实践 Iris数据集简介 iris数据集由Fisher, 1936收集整理,Iris也称安德森鸢尾花卉数据集,英文全称是And...

数据可视化

Tableau集成Python机器学习实践(上)

from https://zhuanlan.zhihu.com/p/30221355 导言 机器学习是目前炙手可热的一门交叉学科,致力于研究通过计算的手段,利用经验来改善系统自身的性能,目前已经有相当成熟的应用场景。Tableau是致力于帮...

Modeler

SPSS Modeler常用函数简介

SPSS Modeler软件包含多种功能丰富的函数,几乎涵盖了我们日常工作的各种需要,主要有信息函数、转换函数、比较函数、逻辑函数、数值函数、三角函数、概率函数、位元整数运算、随机函数、字符串函数、日期和时间函数、序列函数、全局函数、空值和...