Фильтры

Блоги

英特尔Hadoop发行版

附件是英特尔Hadoop发行版的介绍白皮书,供参考。 英特尔Hadoop发行版
Автор: BRUCE C. (Blackbelt) Последнее обновление: 03.07.2019 - 20:08
Блоги

基于万兆位以太网的Hadoop集群

Hadoop广泛的被互联网企业使用,附件就是一份基于万兆位以太网的Hadoop集群的白皮书,供参考。 基于万兆位以太网的Hadoop集群
Автор: BRUCE C. (Blackbelt) Последнее обновление: 03.07.2019 - 20:08
Блоги

mahout 0.5 基于 hadoop 的 CF 代码分析

mahout的taste框架是协同过滤算法的实现。它支持DataModel,如文件、数据库、NoSQL存储等,也支持hadoop的MapReduce。这里主要分析mahout0.5中的基于MR的实现。

Автор: Последнее обновление: 24.01.2019 - 16:00
Article

开源 - OpenStack

OpenStack
Автор: Последнее обновление: 13.07.2018 - 14:32
Article

Hadoop 0.22.0 及其 RAID 部署

        使用0.20.X系列版本的Hadoop快有一年时间了,主要集中在HDFS上。期间自己参与了部署Hadoop集群(1 Server + 20 PC),也参与了分析HDFS的源码。

Автор: Последнее обновление: 24.01.2019 - 16:00
Блоги

ubuntu 中安装 hadoop 记录

Hadoop 版本:hadoop-1.2.1-bin.tar

Jdk 版本:jdk-6u30-linux-i586

Автор: Последнее обновление: 24.01.2019 - 16:00
Article

大数据: 请认真对待

本文最初发表在InformationWeek上

Автор: Shen Zhou (Intel) Последнее обновление: 05.07.2019 - 14:15
Блоги

Hadoop RPC机制+源码分析

 一、RPC基本原理

Автор: Последнее обновление: 03.07.2019 - 20:08
Article

在 Cloudera Hadoop* 分发版上为 DICOM* 图像编制索引

This paper show how to replicate the proof point, to index DICOM images for storage, management, and retrieval on a Cloudera Hadoop* cluster, using open source software components.
Автор: Последнее обновление: 22.02.2019 - 16:10
Блоги

按照使用案例开始使用 Tachyon

In-memory computing has become an irreversible trend in big data technology, for which the wide popularity of Spark provides a good evidence. Meanwhile, memory storage and management for large data sets are still posing challenges. Out of numerous solutions, Tachyon, a memory-centric distributed storage, well solves the problems faced by many application scenarios. For example, it avoids severe...
Автор: Последнее обновление: 07.06.2019 - 16:00