炼数成金 大数据Hadoop
订阅

Hadoop

高薪必备:Hadoop求职者的6大攻略
高薪必备:Hadoop求职者的6大攻略
开源Apache Hadoop项目一直是个热门,这对于具备Hadoop及相关技能的IT求职者来说是个好消息。 Matt Andrieux是旧金山Riviera Partners公司技术招聘部门负责人,他告诉我们对Hadoop及相关技能的需求在过去几年中呈直线 ...
利用Hadoop Streaming处理二进制格式文件
利用Hadoop Streaming处理二进制格式文件
Hadoop Streaming是Hadoop提供的多语言编程工具,用户可以使用自己擅长的编程语言(比如python、php或C#等)编写Mapper和 Reducer处理文本数据。Hadoop Streaming自带了一些配置参数可友好地支持多字段文本数据的处理 ...
Cloudera正通过Oryx为Hadoop重建机器学习机制
Cloudera正通过Oryx为Hadoop重建机器学习机制
Hadoop软件供应商Cloudera去年收购了一家总部位于伦敦的新兴企业Myrrix——但在此之后无论是买家还是卖家在机器学习技术方面都开始归于沉寂。不过无论如何,Myrrix公司的技术方案加上其创始人Sean Owen可能已经足以值 ...
腾讯大规模Hadoop集群实践
腾讯大规模Hadoop集群实践
TDW(Tencent distributed Data Warehouse,腾讯分布式数据仓库)基于开源软件Hadoop和Hive进行构建,打破了传统数据仓库不能线性扩展、可控性差的局限,并且根据腾讯数据量大、计算复杂等特定情况进行了大量优化和改 ...
Hortonworks联手Red Hat,构建更强大的Hadoop
Hortonworks联手Red Hat,构建更强大的Hadoop
Hortonworks宣布与Red Hat建立战略伙伴关系。Red Hat一直是开源社区的顶级贡献人,有良好的企业形象和销售渠道,Hortonworks无疑是看重了这一点,Red Hat要进一步的发展也需要有Hadoop的支持,双方可谓各取所需。
从Hadoop 说起 六个真实的大数据应用案例
从Hadoop 说起 六个真实的大数据应用案例
案例主要关注三个问题:数据从哪里来?数据如何存储?数据如何计算? 1. Last.fm 1.1 背景 创建于2002年,提供网络电台和网络音乐服务的社交网络。每个月有2500万人使用Last.fm,产生大量数据。现在有了中文版http:/ ...
盘点Hadoop生态圈:13个让大象飞起来的开源工具
盘点Hadoop生态圈:13个让大象飞起来的开源工具
借助Google的三大论文,Hadoop打开了低成本海量数据处理之门;同时,借助了开源运动,Hadoop生态圈得以迅速成熟,也催生了处理各种业务及数据的工具,这里带大家回顾2013年让大象飞起来的13种工具。
数据控使用Hadoop的三种最常用方式
数据控使用Hadoop的三种最常用方式
就在几周前,Apache Hadoop 2.0正式发布,这是 Hadoop领域巨大的里程碑,因为它开启了史无前例的数据存储方式革命。Hadoop保留它典型的“大数据”基础技术,但它是否适合当下数据库及数据仓 库的使用方式?又是否有一 ...
2014的12个大数据趋势:Hadoop继续升温,R将进入主流
2014的12个大数据趋势:Hadoop继续升温,R将进入主流
2013,“大数据”无疑是IT界最火的词汇之一。MapReduce、Storm、Impala以及Spark,大数据领域开源技术林立。翻过2013,走进2014,大数据领域又会向着什么样的方向发展,这里我们看数位行业高管带来的12条预测。
圣诞首发 Hadoop 管理工具 HTools
圣诞首发 Hadoop 管理工具 HTools
HTools是一款专业的Hadoop管 理工具,不管您是非专业IT人士,还是多年经验的技术人员,本工具都会为您提供优质的管理服务和轻松的操作过程, 释放无谓的工作压力,提高Hadoop的管理水平。我们以最权威的专家为您量身 ...
对Hadoop目前使用情况的调查和采访
对Hadoop目前使用情况的调查和采访
本文原作者: Boris Lublinsky我们正生活在“大数据”的时代。在当今这个技术驱动的世界,计算能力、电子设备和Internet的可达性正在日益增长,同时比以往任何时候更多的 数据正在被传输和收集。组织正在以惊人的速 ...
Hadoop大数据分析获本地R语言支持
Hadoop大数据分析获本地R语言支持
随着大家对大数据分析越来越感兴趣,软件供应商Revolution Analytics改进了其R语言统计功能旗舰产品,使它能够与Hadoop数据处理平台运行。 这个新的Revolution R Enterprise 7(RRE 7)还能够使R在Teradata数据库内运行 ...
英特尔已为Hadoop开启CPU加密机制
英特尔已为Hadoop开启CPU加密机制
芯片巨头英特尔正在加倍努力以捍卫其宝贵的数据中心领地——具体方式为开发其自有技术以推动数据管理与分析技术——例如Hadoop——的实现。 为了确保至强芯片能够在数据中心管理员们的考量之下成为运行大型Hadoop集群 ...
Hadoop 2.0带来的大数据技术需求
Hadoop 2.0带来的大数据技术需求
Apache软件基金会最近发布了Hadoop 2,这个最新版本的开源平台具有高扩展性和分布式计算等特点。Hadoop 2包含了一些新功能,比如重新设计的资源管理器YARN。Apache宣称YARN是一款能够同时运行多个大数据应用的高扩展 ...
访谈韩冀中:浅谈Hadoop实战
访谈韩冀中:浅谈Hadoop实战
人物简介:韩冀中 博士,中国科学院计算技术研究所副研究员,研究生导师,长期从事并行分布式计算领域的科研工作。国内早期的Hadoop使用者之一,有丰富的相关应用开发经验。 研究方向: 大规模数据处理、并行程序调试 ...

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

社区热帖

     

    GMT+8, 2018-12-13 09:19 , Processed in 0.101399 second(s), 18 queries .