Hadoopとは

Hadoopは、ビッグデータを保存、処理するための分散型データ管理プラットフォームまたはオープンソースソフトウェアフレームワークです。カットダウン分散型オペレーティング・システムと表現される場合があります。膨大な量のデータを管理、処理し、何千台ものコモディティコンピュータからなる大規模なクラスタにまでリニアに拡張できるように設計されています。もともとはYahoo!のために開発されましたが、現在はApache Software Foundationから無料で公開されています。しかし、使用するためには広範囲なプログラミングの知識が必要となります。