- 著者 : 猿田浩輔(著) 土橋昌(著) 吉田耕陽(著)
- 出版社名 : 翔泳社
- シリーズ名等 : NEXT ONE
- 発行日 : 2015年10月
- ISBN : 9784798142661
- Apache Sparkは多数のコンピュータを並列で動かして高速処理を実現する技術です。大量データのバッチ処理や機械学習など、ビッグデータの分野での活用が期待されるOSS(Open Source Software)です。
Apache SparkはUCバークレイで提唱されたRDD(Resilient Distributed Dataset)というデータモデルを採用し、メモリを上手に活用した効率的な処理を実現します。これにより、並列分散処理において高いパフォーマンスが期待できます。また、分散処理フレームワークHadoopとの高い親和性を有しており、YARNやHDFSなどのHadoopシステムの枠組が利用できます。
本書はApache Sparkの概要からRDDによる処理の仕組み、導入やアプリケーション開発までを解説します。また、「SQLインターフェイス」「機械学習」「ストリーム処理」「グラフ」などApache Spark周辺のライブラリの活用についても説明します。
話題のApache Sparkの仕組みとその利用方法を理解することにより、データ処理の新しい潮流を知ることができます。※本データはこの商品が発売された時点の情報です。
閉じる
閉じる
閉じる
再入荷リクエストが完了しました。
リクエストした商品が再入荷された場合、
メールでお知らせします。
閉じる
再入荷リクエスト
リクエストした商品が再入荷された場合、
メールでお知らせします。
上記期間を経過しても商品が再入荷されない場合、設定は自動的に解除されます。(上記期間を経過するか、商品が再入荷されるまで設定は解除できません)