Blog

2011.01.20

「Hadoop徹底入門」が出ます

Tag

preferred

MacBook Air 11インチ欲しい!、太田です。

1/27に、執筆に関わらせて頂いた「Hadoop徹底入門」という本が、翔泳社さんから出版されます。

Hadoop徹底入門

OSS分散フレームワーク「Hadoop」の、日本語では初めてとなる書き下ろし本になります。執筆はNTTデータでHadoopのお仕事をされている、下垣さん、猿田さん、藤井さん、濱野さん、そして私になります。また、翔泳社の石川さんには非常にお世話になりました。

目次はこのブログの最後に掲載させて頂きました(詳細はこちら)。Hadoopとは何か?といった説明に始まり、Hadoopの周辺プロダクト(Hive, Pig, HBase, Thrift)も詳しくカバーされています。

Hadoopに関して現在日本語で読める大きな情報源として有名なのは、オライリーさんから出版されている「Hadoop」本になります。

本書はこの本と補完関係に有ると思っています。オライリーさんのHadoop本は、どちらかと言えばHadoop上でMapReduceアプリケーションを開発する為の内容になっていますが、本書はどちらかというとシステムの環境構築、運用、監視、可用性の確保等といった内容がメインになっています。

「Hadoop」という単語が気になっていらっしゃる方、実際に使い始めようとしているがつまづいている方、「Hadoop」を既に使いこなしている方、等、全ての方に手に取って頂ければと思います!

1 Hadoop ってなんだろう?
  1.1 Hadoop とは
  1.2 Hadoop の概要
  1.3 Hadoop の適用領域
  1.4 Hadoop の構成と処理概要
  1.5 Hadoop の適用事例

2 Hadoop の導入
  2.1 Hadoop インストールの準備
  2.2 コミュニティ版Hadoop のインストール
  2.3 コミュニティ版Hadoop の起動と停止
  2.4 MapReduce 実行による動作確認
  2.5 Cloudera’s Distribution for Hadoop(CDH)の導入

3 Hadoop 分散ファイルシステムHDFS
  3.1 Hadoop におけるファイルシステム
  3.2 HDFS の仕組み
  3.3 HDFS のオペレーションョン
  3.4 ファイル操作
  3.5 ログ管理
  3.6 WebUI による管理
  3.7 ラックアウェアネスの設定方法

4 Hadoop MapReduce フレームワーク
  4.1 MapReduce フレームワークの基礎知識
  4.2 MapReduce フレームワークの構成
  4.3 JobTracker の役割
  4.4 TaskTracker の役割
  4.5 MapReduce フレームワークの連携動作/監視
  4.6 MapReduce フレームワークのオペレーション
  4.7 コマンドラインベースのMapReduce 管理
  4.8 WebUI による管理

5 MapReduce プログラミング入門
  5.1 MapReduce フレームワーク
  5.2 Java によるMapReduce プログラムの作成方法
  5.3 ワードカウントサンプルアプリケーション
  5.4 MapReduce プログラム実行全体の流れ
  5.5 Hadoop I/O API
  5.6 Hadoop MapReduce フレームワークAPI
  5.7 MapReduce プログラムのテスト/デバッグ手法

6 SQL 的インターフェイスHive
  6.1 Hive 概略
  6.2 Hive とHadoop
  6.3 HiveQL
  6.4 インストール
  6.5 Hive の設定

7 環境構築の効率化
  7.1 Hadoop 環境の効率的な構築
  7.2 kickstart によるHadoop 環境構築
  7.3 Puppet によるHadoop 環境設定

8 運用監視とシステムの可視化
  8.1 Hadoop クラスタの運用監視
  8.2 Hadoop で実現できる監視
  8.3 Ganglia によるHadoop 環境の可視化

9 可用性の向上
  9.1 クラスタシステムの可用性
  9.2 スレーブノードの故障による影響
  9.3 マスターノードの故障による影響
  9.4 HA クラスタによるマスターノードの冗長化
  9.5 HDFS メタデータのチェックポイントとバックアップ

10 性能向上のためのチューニング
  10.1 Map 処理とReduce 処理に関するチューニング
  10.2 MapReduce フレームワークのチューニング
  10.3 その他チューニング

11 Hadoop に関連するプロダクト
  11.1 分散型データベースHBase
  11.2 Pig
  11.3 Thrift

Tag

  • Twitter
  • Facebook