炼数成金 大数据Hadoop
订阅

Hadoop

图文并茂:5分钟了解Hadoop
图文并茂:5分钟了解Hadoop
原文链接:http://www.bigdata-startups.com/BigData-startup/what-is-hadoop-and-five-reasons-organisations-use-hadoop-infographic/Hadoop原是Hadoop开发者的孩子给自己的大象玩具起的名字。因为原有的数据存储和 ...
Hadoop 2.2.0编译安装
Hadoop 2.2.0编译安装
添加用户及无密码访问 添加用户 adduser hadoop 设置密码 passwd hadoop 添加到sudo用户组 chmod +w /etc/sudoers echo '%hadoop ALL=(ALL) NOPASSWD: ALL' /etc/sudoers chmod -w /etc/sudoers su hadoop ...
Hadoop之父Doug Cutting
Hadoop之父Doug Cutting
生活中,可能所有人都间接用过他的作品,他是Lucene、Nutch 、Hadoop等项目的发起人。是他,把高深莫测的搜索技术形成产品,贡献给普罗大众;还是他,打造了目前在云计算和大数据领域里如日中天的Hadoop。他是某种意 ...
应该在什么时候使用Hadoop
应该在什么时候使用Hadoop
有人问我,“你在大数据和Hadoop方面有多少经验?”我告诉他们,我一直在使用Hadoop,但是我处理的数据集很少有大于几个TB的。他们又问我,“你能使用Hadoop做简单的分组和统计吗?”我说当然可以,我只是告诉他们我 ...
Hadoop遭遇瓶颈的七大危险信号
Hadoop遭遇瓶颈的七大危险信号
大多数企业大数据应用案例尚处于实验和试点阶段,对于少数首次在生产环境部署Hadoop系统的用户来说,最常遇到的就是扩展问题,此类问题往往导致企业因噎废食,终止大数据应用项目。部署和扩展Hadoop系统是一件高度复 ...
前雅虎CTO:Hadoop扩展过程中的7个危险信号
前雅虎CTO:Hadoop扩展过程中的7个危险信号
本文作者Raymie Stata是Hadoop即服务公司Altiscale的创始人兼CEO,也是雅虎前任CTO,协助雅虎完成开源策略,并参与Apache Hadoop项目的发起。Hadoop的扩展和运维是非常复杂的过程,在其具体的实施过程中隐藏着潜在的 ...
Talend为Hadoop更新开源大数据平台,性能大幅提高
Talend为Hadoop更新开源大数据平台,性能大幅提高
开源大数据供应商 Talend 已经推出了自己的数据集成平台5.5 版本。超快的速度是这个新版本的突出功能,它可以将Hadoop 的性能在原有基础上增加45%。公司几乎视Talend5.5版的大数据平台为“传输所有Hadoop分布上的最高 ...
360度透视Hadoop,大数据技术、案例及相关应用
360度透视Hadoop,大数据技术、案例及相关应用
你想了解大数据,却对生涩的术语毫不知情?你想了解大数据的市场和应用,却又没有好的案例和解说?别担心,这本来自Wikibon社区的小书想要帮你。是的,这是一本小书而不是一篇文章,因为它详实细致的让你从一个完全不 ...
角逐Hadoop市场,Cloudera与Hortonworks竞争白热化
角逐Hadoop市场,Cloudera与Hortonworks竞争白热化
近日,Hortonworks与数据应用平台开发商Concurrent正式建立了同盟关系,而作为Hortonworks强力竞争对手的 Cloudera,为了争夺更多的Hadoop市场份额也开展了一系列计划,面对未来8亿1300万美元的市场,双方致力于在渠 ...
最新版本的Hive 0.13发布,增加ACID特性
最新版本的Hive 0.13发布,增加ACID特性
近日发布的Hive 0.13中采用了ACID语义的事务机制,在分区层保证事务原子性、一致性和持久性,并通过开启ZooKeeper或内存中的锁机制保证事务隔离性。数据 流摄取、缓慢变化维、数据重述这些新的用例在新版本中成为了可 ...
Hadoop集群环境下的网络架构的设计与优化
Hadoop集群环境下的网络架构的设计与优化
  大数据时代,研究大数据的IT 厂商把研究重心放在优化大数据系统软件架构、优化业务逻辑、优化数据分析算法、优化节点性能等方向,而忽略了大数据环境基础设置中网络环节的评估和优化。本文介绍了思科公司在Hadoo ...
Teradata:Hadoop虽大有裨益 但开源市场仍欠稳
Teradata:Hadoop虽大有裨益 但开源市场仍欠稳
一些金融分析师们对Teradata公司在IT市场上的持续发展能力提出了质疑。虽然这部分客户确实将Hadoop提上了议事日程,但如果拥有数十年历史的数据仓库供应商都认为难度很大、客户们往往只会选择放弃。 “更重要的是破除 ...
Sahara顺利毕业,将加速OpenStack与Hadoop的融合
Sahara顺利毕业,将加速OpenStack与Hadoop的融合
OpenStack Sahara(旧称:Savanna)项目的负责人Sergey Lukjanov昨天正式宣布,Sahara从OpenStack孵化项目顺利毕业,将从OpenStack下一版本Juno开始作为OpenStack 核心项目之一。Sahara是在2013年由领先的Apache Had ...
切勿妄谈Hadoop,以及4个数据管道打造实践
切勿妄谈Hadoop,以及4个数据管道打造实践
Hadoop只是运行某个通用计算的工具,正因为如此,在使用过程中你会受限于多种规则,比如所有计算都必须按照一个map、一个group by、一个aggregate或者这种计算序列来写。这种束缚就像穿上一层紧身衣,但是正因为Hado ...
Hadoop导航:版本、生态圈及MapReduce模型
Hadoop导航:版本、生态圈及MapReduce模型
Hadoop版本和生态圈 1. Hadoop版本 (1) Apache Hadoop版本介绍 Apache的开源项目开发流程: 主干分支:新功能都是在主干分支(trunk)上开发。 特性独有分支:很多新特性稳定性很差,或者不完善,在这些分支的独 ...

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

社区热帖

     

    GMT+8, 2020-4-1 21:49 , Processed in 0.122319 second(s), 16 queries .