开源 - Hadoop

从大数据中提取商业智能
互联网中充斥着海量的数据。这些数据中,许多为非结构化数据,许多不经过分析就毫无意义。 通过为跨越大数据解决方案堆栈范围的开源项目(包括 Linux*、Java*、Hadoop*、HBase* 等等)做出贡献,英特尔正在帮助各企业将大数据转换为出色的商业智能。 英特尔的辛勤工作—分析、测试和优化 Hadoop 的性能方面—已经带来了参考架构、调试指南和最佳实践推荐,有助于您设计和部署 Hadoop 集群。 此外,通过利用可靠的开源性能指标评测和调试工具(如 HiBench 和 HiTune),您可以毫不费力地从这些集群中获得最高的性能。

大数据革命正在进行中。 加入我们。

了解更多信息

媒体

IT 就业市场中关键的大数据、云知识
随着全球信息的爆炸式增长和云计算的崛起,迫切需要精通分析和大数据的 IT 专业人员。

与 Hadoop*、MapReduce 相关的收入预计会出现爆炸性增长: IDC
大规模数据分析—以 Hadoop 为核心—是一个快速增长的行业。预计到 2016 年,市场规模将超过 8 亿美元。

让 Hadoop* 成为企业数据生态系统的一部分
依靠商业智能、分析、性能管理和数据仓库的企业日益采用 Hadoop 作为一款解决方案。

Hadoop* 成为大数据设备机器中的关键要素
随着越来越多的公司利用 Hadoop 来处理大数据,对即将发布的 2.0 版本的预期出现增长。

NASA 谈论大数据,Hadoop*
2012 年 Hadoop 峰会的最新消息:NASA 科学家 Chris Mattmann 谈论一些即将发布的大数据应用,以及这些应用如何应对业务挑战。

资源

针对英特尔® 架构优化 Java* 和 Apache Hadoop*
系统管理员可借助现有的英特尔技术(如英特尔® 固态硬盘和英特尔® 以太网万兆服务器适配器),提高 Apache Hadoop 集群的性能。 不过,由于 Apache Hadoop 基于 Java,因此提高性能最有效的方式之一是优化 Java 本身,以充分利用英特尔架构增强特性。

大数据技术助力获得近实时结果
了解如何利用 Apache Hadoop* 软件的英特尔® 分发版平衡工作负载和基础设施计算资源,从而获得惊人的性能,大幅节省成本和提高效率。

大数据解决方案简介
了解如何以最低的复杂性,从您的 Hadoop 集群中获得最高性能。 了解英特尔如何通过与开源社区和大数据生态系统合作,帮助前瞻性企业驾驭大数据,做出更加明智的业务决策。

管理复杂的计算环境: 基于英特尔® 架构的开源令超级计算广为普及
PSSC Labs 将高性能 Linux 组件与业经验证的基于英特尔至强处理器的平台相结合,创造出满足顶级高性能计算要求的极具竞争力的解决方案。

您准备好迎接大数据了吗?
如本解决方案简介中所述,大数据可让您的业务更加智能、运行更快和更具竞争力。

Hadoop* 入门: 规划指南
这一面向 IT 经理的实用指南能够为规划和实施大数据分析项目提供信息。

面向 Apache Hadoop* 的英特尔® Cloud Builders 指南
本指南介绍了用于实施云计算基础设施的参考架构,并提供了有关规划和部署的信息。

HiBench: 一款典型、全面的 Hadoop* 性能指标评测套件
此性能指标评测套件是综合性微性能指标评测与实际应用的结合,支持定量评估和测量 Hadoop 部署。

HiTune: 基于数据流的大数据云性能分析
本技术白皮书提供了一种利用 Hadoop* 性能分析器 HiTune 来分析大数据云部署的性能的一般方法。

大数据: 充分利用颠覆性资产
本报告由经济学家信息部提供,探索了数据管理问题,并提供了几个有关各公司如何充分利用自大数据中获取的智能的例子。

财富 1000 强客户利用 SoftNet 的交钥匙解决方案,加深、加速了对大数据的分析
SoftNet 提供的高级数据分析解决方案通过在英特尔® 架构平台上运行 Hadoop*,能够大规模处理大数据工作负载。

利用高级分析能力实现英特尔业务转型的路线图
通过有效利用商业智能,可提高洞察力、决策能力和业务周转速度。

优化 Hadoop* 部署
实施 Hadoop 环境的最佳实践,包括设计一款能够提高工作效率,并同时满足能效要求和降低总体拥有成本的解决方案堆栈。

视频

Apache Hadoop* 软件的英特尔® 分发版
借助 Apache Hadoop* 软件的英特尔® 分发版(唯一一款从芯片级开始进行设计的 Hadoop 分发版软件),确保您能够充分利用硬件,驾驭大数据浪潮。

智能能源分析: Pecan Street 使用英特尔分发版
了解德克萨斯州高级计算中心 (TACC) 如何利用 Apache Hadoop* 软件的英特尔® 分发版来收集、分析和显示德克萨斯州奥斯汀 Pecan Street 项目的数十亿行数据。

大数据 101: 大数据如何产生巨大影响力
本视频简单介绍了大数据,并提供了有关各公司如何通过分析获得竞争优势和商业智能的洞察。

Pecan Street Inc. 利用英特尔架构服务器推动了智能电网技术的发展
通过分析来自德克萨斯州奥斯汀各大楼的海量数据,Pecan Street Inc. 提供了有关如何在利用 Hadoop* 扩展其方法时,充分利用智能技术的洞察。

如何从情感分析中掘金
通过在英特尔® 服务器上运行 Apache Hadoop*,可经济高效地从社交网络中掘取宝贵的情感分析数据。

Hadoop* 网络研讨会: 经济高效型 10GBASE-T 的构建指南
在本网络研讨会中,Arista 的 Mark Berly 和英特尔的 Matt Eszenyi 探讨了 Hadoop* 的优势,强调了大数据部署中计算、网络和存储的平衡。

基因组数据分析推动了科学的发展
得益于运行在英特尔® 至强® 处理器之上的 Apache Hadoop*,进行基因组测序数据分析的成本得以大幅降低。

构建分析工作台的定格动画视频剪辑
简短的瞬时摄影视频描绘了 EMC Greenplum 如何构建 1000 节点 Apache Hadoop* 集群。

有关英特尔和大数据的视频、信息和图片(Videoinfograph)
借助统计数据和示例,本视频调查了大数据对业务的影响。

链接

大数据分析案例: 消费者能源管理
Pecan Streets 利用数据驱动型分析能力为消费者增权益能。

英特尔 IT 中心: 英特尔开启大数据智能时代
了解大数据分析如何带来新颖的见解。

大数据、大愿景、小预算: 克莱姆森大学的云计算
IT 的选择平衡了数据驱动型计算的愿景和预算日益缩减的现实。

Facebook 如何保持 100 PB 的 Hadoop* 数据在线
Facebook 之所以能够快速访问海量数据,其中的诀窍在于 Facebook 采用双节点、高可用性框架 AvatarNode 代替了 Hadoop 的 NameNode 服务。

您是否梦想过构建 1 个 1000 节点的 Hadoop* 集群?
 通过与英特尔合作,EMC 最近投入使用了 1 个被称为“分析工作台 (Analytics Workbench)”、采用 2000 个英特尔至强处理器的 1000 节点 Hadoop 集群。

有关编译器优化的更完整信息,请参阅优化通知