炼数成金 大数据Hadoop
订阅

Hadoop

Hadoop之父Doug Cutting:AI将为Hadoop社群的未来带来挑战
Hadoop之父Doug Cutting:AI将为Hadoop社群的未来带来挑战
随着数据量愈加庞大,想要有更高效率的处理方式,就需要有新的工具出现,Hadoop 就是其中的代表。Hadoop技术不仅开启了大数据时代,更成为孕育大数据技术的摇篮,至今发展也超过十个年头。起初,Doug Cutting 希望以 ...
5分钟让你了解 ZooKeeper 的原理
5分钟让你了解 ZooKeeper 的原理
ZooKeeper 是一个开源的分布式协调服务,由雅虎创建,是 Google Chubby 的开源实现。分布式应用程序可以基于 ZooKeeper 实现诸如数据发布/订阅、负载均衡、命名服务、分布式协调/通知、集群管理、Master 选举、分布 ...
大数据公司Cloudera上市首日涨20% 市值23亿美元
大数据公司Cloudera上市首日涨20% 市值23亿美元
4月29日消息 据外媒(TechCrunch)报道,在以每股15美元的定价上市后,企业大数据公司Cloudera股价一日上涨超20%至18.09美元。这一价格也超出了此前公司12到14美元的预期范围。大涨幅令新投资者欣喜,但可能令一些公 ...
Cloudera将于4月底登陆纽交所,基于Hadoop的商业公司前景何在
Cloudera将于4月底登陆纽交所,基于Hadoop的商业公司前景何在
当地时间2017年3月31日,Cloudera,这家建立在开源项目Hadoop之上的商业公司终于公布了其备受期待的IPO备案,在公布的文件中,曾经大力支持它的英特尔也成为了其最大的股东。这将是继Snapchat之外,今年又一个备受瞩 ...
阿里 HBase 超详实践总结:一文读懂大数据时代的结构化存储
阿里 HBase 超详实践总结:一文读懂大数据时代的结构化存储
HBase 是一个开源的非关系型分布式数据库(NoSQL),基于谷歌的 BigTable 建模,是一个高可靠性、高性能、高伸缩的分布式存储系统,使用 HBase 技术可在廉价 PC Server 上搭建起大规模结构化存储集群。HBase 最初是以 ...
ZooKeeper 原理及其在 Hadoop 和 HBase 中的应用
ZooKeeper 原理及其在 Hadoop 和 HBase 中的应用
ZooKeeper是一个开源的分布式协调服务,由雅虎创建,是Google Chubby的开源实现。分布式应用程序可以基于ZooKeeper实现诸如数据发布/订阅、负载均衡、命名服务、分布式协调/通知、集群管理、Master选举、分布式锁和 ...
到2021年,Hadoop大数据分析市场产值将达406.9亿美元
到2021年,Hadoop大数据分析市场产值将达406.9亿美元
据市场研究咨询公司MarketsandMarkets新发布的一份市场研究报告声称,Hadoop大数据市场产值预计会从2016年的67.1亿美元猛增至2021年的406.9亿美元,2016年至2021年的年复合增长率(CAGR)将高达43.4%。这份报告名为 ...
Hadoop namenode高可用性分析:QJM核心源代码解读
Hadoop namenode高可用性分析:QJM核心源代码解读
HDFS namenode 在接受写操作时会记录日志,最早 HDFS 日志写本地,每次重启或出现故障后重启,通过本地镜像文件+操作日志,就能还原到宕机之前的状态,不会出现数据不一致。如果要做高可用 (HA),日志写在单个机器 ...
优步在Hadoop上做增量处理的案例
优步在Hadoop上做增量处理的案例
优步的任务是提供“对每个人来说,在任何地方都可以获得像自来水一样可靠的出行服务”。为了履行这一承诺,优步依赖于在每个层面做出数据驱动的决策。大部分的决策都得益于更快的数据处理。例如,使用数据来理解一个 ...
Hadoop十年 推动数据驱动型分析快速发展
Hadoop十年 推动数据驱动型分析快速发展
Hadoop迎来了10周年的生日。关于Hadoop,有很多大事件依然历历在目:Hadoop成为Apache的子项目并获得命名,第一版Hadoop代码发布,第一批用户部署了该代码。为了纪念这些事件,大数据供应商的高管们为该分布式处理框 ...
想要从大数据中获益?请先做好Hadoop管理
想要从大数据中获益?请先做好Hadoop管理
Hadoop管理正在成为大数据用户和供应商首先考虑的分部署处理框架,它在企业的业务运营中中扮演着越来越重要角色。Comcast公司的IT团队在对Hadoop数据湖泊进行性能管理时,考虑的十分周全。数据湖泊是一个大量信息的 ...
顶级Hadoop发行版的四个对比因素
顶级Hadoop发行版的四个对比因素
虽然软件组件构成的Hadoop生态系统堆栈是开源技术,但是采用付费订阅使用其供应商的商业Hadoop平台会为企业带来许多好处。例如,订阅可以提供技术支持和培训,以及访问那些不提供给开源社区的企业功能。而供应商的Ha ...
如何在Hadoop 2.0上实现深度学习?
如何在Hadoop 2.0上实现深度学习?
位于波士顿的数据科学团队正在利用前沿的工具和算法,通过对用户数据的分析来优化业务行为。 数据科学很大程度上依赖机器算法,它能帮助我们发现数据的特征。要想洞察互联网般规模的数据还是很有挑战的,因此能够大 ...
如何保证Hadoop数据湖不变成“数据洪水”
如何保证Hadoop数据湖不变成“数据洪水”
数据湖的提出距今已经有了几年时间了,特别是在当今时代中,基于Hadoop建立的数据湖在大数据处理中占有的位置越来越重要。但是如何保证数据湖不像南方水灾一样泛滥,依然是一个耐人寻味的话题。数据湖已满,如何防泛 ...
Strata+Hadoop World 北京首届会议
Strata+Hadoop World 北京首届会议
Strata +Hadoop World 即将于8月3-6号在北京举行。Strata+Hadoop World 是“不容错过”的数据盛会,是全球最顶尖的数据系列会议——聚焦在大数据、机器学习、普适计算和分析学以及大数据可以带来的商机。Strata+ Ha ...

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

社区热帖

     

    GMT+8, 2018-12-13 09:18 , Processed in 0.100518 second(s), 16 queries .