はじめてのHDInsight

HDInsightの作成

1.ストレージの作成

最初にHDInsight用のストレージを作成します。普通に作成すればOKです。

2.HDInsightの作成

次にHDInsightを作成します。クラス名、クラスターサイズは適切に設定し、ストレージアカウントは先ほど作成したアカウントを指定します。

以上で構築作業は終わりで、10分ぐらいで使えるようになります。本当に簡単です。

HDInsight Studioで動作確認

1.HDInsightへの接続

最初にHDInsightに接続するための情報を設定します。

ほとんどはHDInsight作成時に指定した値なので問題ないと思いますが、Certificate Friendly NameはAzureの管理証明書になります。しかも、ローカルコンピュータにインストールされていて、そのフレンドり名を指定する必要があります。Azure上にアップロードした管理証明書をローカルコンピュータにインストールして利用する必要があります。mmcで管理コンソールを起動し証明書のスナップインを追加すれば以下のようなツールが上がってきます。ここでインストールされている証明書がわかります。どの管理証明書がインストールされているかわからない場合はAzureのポータルで確認できます。


2.HDFSエクスプローラ

正しい値を設定してConnectするとHDFSエクスプローラが起動します。フォルダーノードをクリックすると該当フォルダを展開・ファイルを表示します。

初期状態でもいくつかサンプルのデータなどが入っています。Hive用のデータもあります。

3.HIVEの実行

MenuのJOB−Hiveを選択するとHive実行用の画面が起動されます。"show tables;"テーブル一覧を表示させてみます。

問題無く実行できましたでしょうか?

まとめ

今回はHDInsightを作成してHDInsight Studioを使ってHiveを実行してみました。hadoopの利用は手が出せないと思っていた方いかがでしょうか?
見ての通り本当に簡単に構築利用できますのでどんなものか試す価値はあると思います。