大数据

第2页

从机器学习谈起

来自 http://www.cnblogs.com/subconscious/p/4107357.html     在本篇文章中,我将对机器学习做个概要的介绍。本文的目的是能让即便完全不了解机器学习的人也能了解机器学习,并且上手相...

TensorFlow深度学习,一篇文章就够了

作者: 陈迪豪,就职小米科技,深度学习工程师,TensorFlow代码提交者。 TensorFlow深度学习框架 Google不仅是大数据和云计算的领导者,在机器学习和深度学习上也有很好的实践和积累,在2015年年底开源了内部使用的深度学习...

面试干货!21个必知数据科学面试题和答案

最近KDnuggets上发的“20个问题来分辨真假数据科学家”这篇文章非常热门,获得了一月的阅读量排行首位。 但是这些问题并没有提供答案,所以KDnuggets的小编们聚在一起写出了这些问题的答案。我还加了一个特别提问——第21问,是20个...

大数据产品-腾讯信鸽之手游流失预测

        背景         随着游戏市场竞争的日趋激烈,越来越多的游戏运营服务选择借助大数据挖掘出更多更细的用户群来进行精细化,个性化运营,从而更好的抓住用户,获得更大的收益。在游戏运营中,无论是流失挽留,还是拉新,以及付费用户预...

四两拨千斤:借助Spark GraphX将QQ千亿关系链计算提速20倍

腾讯QQ有着国内最大的关系链,而共同好友数,属于社交网络分析的基本指标之一,是其它复杂指标的基础。借助Spark GraphX,我们用寥寥100行核心代码,在高配置的TDW-Spark集群上,只花了2个半小时,便完成了原来需要2天的全量共同...

腾讯推荐—让您的系统瞬间个性化

腾讯推荐 “腾讯推荐”是腾讯大数据近期大力打造的开放服务平台,旨在集业务接入、数据上报、算法计算、实时推荐和效果监控于一体,对外提供全自动实时精准推荐服务。 腾讯推荐官网: tuijian.qq.com 推荐是什么? 文章中提到的推荐均是指...

微信公众号广告点击率预估效果优化

来自 腾讯大数据 1.背景? 点击率预估(pCTR)是广告投放过程中的一个重要环节,精准的点击率预估对于广告投放系统收益最大化具有重要意义。pCTR的优化主要有算法优化,系统改进,特征探索等几种途径。2015年下半年微信公众号位置,在引入了...

面向高维度的机器学习计算框架-Angel

来自腾讯大数据 简介   为支持超大维度机器学习模型运算,腾讯数据平台部与香港科技大学合作开发了面向机器学习的分布式计算框架——Angel 1.0。 Angel是使用Java语言开发的专有机器学习计算系统,用户可以像用Spark,...

三款大数据工具比拼,谁才是真正的王者

来自 http://tech.it168.com/a2016/0707/2772/000002772570.shtml 【IT168 翻译】业内有这样一种说法,SQL虽然在大数据分析领域久经考验,但是无奈长江后浪推前浪,和炙手可热的Hado...

开源跨平台的Postgresql桌面客户端:SQL Tabs

SQL Tabs是一个开源跨平台的Postgresql桌面客户端。 1、数据库浏览器 2、富脚本输出 3、从查询结果生成图表 4、Markdown渲染 5、白天和黑夜主题 6、经典和vim编辑模式 官方网站:http://www.sqlta...

一张图看懂MADlib能干什么

作者 德哥@Digoal  原文 http://blog.163.com/digoal@126/blog/static/163877040201510119148173/ MADlib最初是由pivotal的一些数据科学家贡献的开源数据挖掘...

hive函数参考手册

转自:http://www.cnblogs.com/end/archive/2012/06/18/2553682.html 原文见:https://cwiki.apache.org/confluence/display/Hive/Langu...

“忘掉大数据”之“建模术”:数据挖掘要还原用户的生活场景

万物皆数据,数据藏大道。教你Know那些有趣、有用、有逼格的Data! 继续“术”篇,希望能更贴近实操。 “术”篇将包含数据收集、数据管理、建模、网站分析、个性化推荐、场景应用、数据升温理论等,这些都是笔者擅长的领域,在长期的实践过程中,形...

“忘掉大数据”之“法”:大数据修炼要五讲四美

万物皆有道,何为数据道;一切皆有法,何为数据法? 在“道”篇里面,笔者认为数据是人类对世界的观测,人们运用数据通过模型产生新的数据,影响人或者人工智能体的行动,继而观测,源源不断产生数据,循环往复,生生不息,推动人类社会进步。       ...

忘掉大数据——万物皆数据,数据藏大道

作为公众号的开篇之作,自然以“忘掉大数据”为题,这既是我的主张也是十年实战大数据的感悟。作为道家行者,凡事喜欢探究本原,试图务实一些还原大数据的真相。   为什么要忘掉大数据?   是不是大数据无用?恰恰相反,大数据太有...

大数据方向实习生到底该做些什么?

来源:挖数 大数据方向实习生到底该做些什么? 最近逃离学校在某大数据公司实习,虽然我不认为大数据像现在很多人说的那么邪乎,但是我认为互联网时代所带来的大量数据是很有价值的。所以便在这个公司做实习生,已经一个多星期了,都是做一些简单的搜索,排...

大众点评的实时计算

王新春:大众点评网数据平台资深工程师,负责点评实时计算平台相关工作,推动流式计算和实时计算在点评的应用和推广,一直致力于大数据和分布式系统的研究和应用。目前主要从事NoSQL、实时分布式系统的研究与开发。著有《Storm技术内幕与大数据实践...