各製品の資料を入手。
詳細はこちら →CData
こんにちは!テクニカルディレクターの桑島です。
Denodo Platform は、エンタープライズデータベースのデータを一元管理するデータ仮想化製品です。CData JDBC Driver for HDFS と組み合わせると、Denodo ユーザーはリアルタイムHDFS のデータと他のエンタープライズデータソースを連携できるようになります。この記事では、Denodo Virtual DataPort Administrator でHDFS の仮想データソースを作成する手順を紹介します。
最適化されたデータ処理が組み込まれたCData JDBC Driver は、リアルタイムHDFS のデータを扱う上で比類のないパフォーマンスを提供します。HDFS にSQL クエリを発行すると、ドライバーはフィルタや集計などのサポートされているSQL 操作をHDFS に直接渡し、サポートされていない操作(主にSQL 関数とJOIN 操作)は組み込みSQL エンジンを利用してクライアント側で処理します。組み込みの動的メタデータクエリを使用すると、ネイティブデータ型を使ってHDFS のデータを操作および分析できます。
Denodo からリアルタイムHDFS のデータに接続するには、JDBC Driver のJAR ファイルをDenodo の外部ライブラリディレクトリにコピーし、Virtual DataPort Administration Tool から新しいJDBC データソースを作成する必要があります。
Database URI:必要な接続プロパティを使用してJDBC のURL に設定。例えば次のようになります。
jdbc:hdfs:Host=sandbox-hdp.hortonworks.com;Port=50070;Path=/user/root;User=root;
Database URI の作成については以下を参照してください。
JDBC URL の作成の補助として、HDFS JDBC Driver に組み込まれている接続文字列デザイナーが使用できます。JAR ファイルをダブルクリックするか、コマンドラインからjar ファイルを実行します。
java -jar cdata.jdbc.hdfs.jar
接続プロパティを入力し、接続文字列をクリップボードにコピーします。
HDFS への認証には、次の接続プロパティを設定します。
データソースを作成したら、Denodo Platform で使用するHDFS のデータの基本ビューを作成できます。
SELECT * FROM cdata_hdfs_files CONTEXT ('i18n'='us_est', 'cache_wait_for_load'='true')
基本ビューを作成すると、Denodo Platform の他のデータソースと同様にリアルタイムHDFS のデータを操作できるようになります。例えば、Denodo Data Catalog でHDFS にクエリを実行できます。
CData JDBC Driver for HDFS の30日の無償評価版をダウンロードして、Denodo Platform でリアルタイムHDFS のデータの操作をはじめましょう!ご不明な点があれば、サポートチームにお問い合わせください。