Squirrel SQL Client からHDFS データに連携
HDFS に接続し、Squirrel SQL Client でクエリを実行します。
古川えりか
コンテンツスペシャリスト
最終更新日:2022-10-03
CData
こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。
CData JDBC Driver for HDFS を使用して、Squirrel SQL Client などのツールでHDFS へのクエリを実行できます。この記事では、JDBC data source for HDFS を作成し、クエリを実行します。
JDBC Driver for HDFS を追加する
以下のステップに従ってドライバーJAR を追加します。
- Squirrel SQL で[Windows]->[View Drivers]と進みます。
- プラスアイコンをクリックし、[Add Driver]ウィザードを開きます。
- [Name]ボックスで、CData JDBC Driver for HDFS のようなドライバーのわかりやすい名前を入力します。
- [Example URL]ボックスで、jdbc:hdfs: と入力します。
- [Extra Class Path]タブで[Add]をクリックします。
- 表示される[file explorer]ダイアログで、インストールディレクトリのlib サブフォルダにあるドライバーのJAR ファイルを選択します。
- [List Drivers]をクリックして[Class Name]メニューにドライバーのクラス名(cdata.jdbc.hdfs.HDFSDriver) を入力します。
接続プロパティを定義する
以下のステップに従って、接続プロパティをドライバーエイリアスに保存します。
- [Windows]->[View Aliases]と進みます。
- エイリアスが一覧表示されているペインで、プラスアイコンをクリックします。
表示される[Add Alias]ウィザードで、JDBC ドライバーには以下のフィールドが要求されます。
- Name:CData HDFS Source のようなエイリアスの名前を入力します。
- Driver:CData JDBC Driver for HDFS を選択します。
- URL:jdbc:hdfs: と入力します。
- User Name:ユーザー名を入力すると、JDBC URL に追加されます。
- 追加のプロパティを定義する場合は、[Properties]をクリックします。
- 表示されるダイアログの[Driver properties]タブで、[Use driver properties]のチェックボックスを選択します。
- [Specify]カラムで必要な接続プロパティのチェックボックスを選択します。
HDFS 接続プロパティの取得・設定方法
HDFS への認証には、次の接続プロパティを設定します。
- Host:HDFS インスタンスのホストに設定してください。
- Port: HDFS インスタンスのポートに設定してください。デフォルトのポートは"50070" です。
以下は一般的な接続文字列です。
jdbc:hdfs:Host=sandbox-hdp.hortonworks.com;Port=50070;Path=/user/root;User=root;
- [OK]をクリックし、表示されるダイアログで[connect]をクリックして接続を確認します。
スキーマを検出しHDFS データをクエリする
メタデータが読み込まれると、HDFS データソースの新しいタブが表示されます。[Objects]サブタブでは、使用可能なテーブルやビューなどのスキーマ情報を見つけることができます。
テーブルデータを表示するには[Objects]タブでテーブルを選択します。その後、テーブルデータが[Content]タブのグリッドに読み込まれます。
SQL クエリを実行するには、[SQL]タブにクエリを入力し、[Run SQL](ランナーアイコン)をクリックします。例:
SELECT FileId, ChildrenNum FROM Files WHERE FileId = '119116'
関連コンテンツ