こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。
APOS Live Data Gateway(LDG)は、SAP Analytics Cloud をはじめとするSAP ソリューションのリアルタイムデータ接続やデータソースオプションの拡張を実現する、データ連携およびデータ変換ソリューションです。CData コネクタと組み合わせると、ユーザーはリアルタイムHDFS のデータのセマンティックレイヤービューを構築し、リレーショナルデータベースを扱うのと同じようにHDFS のリアルタイム分析を行うことができます。
最適化されたデータ処理が組み込まれたCData コネクタは、リアルタイムHDFS のデータを扱う上で比類のないパフォーマンスを提供します。HDFS に複雑なSQL クエリを発行すると、ドライバーはフィルタや集計などのサポートされているSQL 操作をHDFS に直接プッシュし、サポートされていない操作(主にSQL 関数とJOIN 操作)は組み込みSQL エンジンを利用してクライアント側で処理します。
組み込みの動的メタデータクエリを使用すると、ネイティブデータ型を使ってHDFS のデータを操作および分析できます。
コネクタファイルのダウンロードおよびインストール
APOS Live Data Gateway を経由してHDFS のデータにアクセスするには、APOS からコネクタファイルをダウンロードしてLive Data Gateway をホストするマシンにインストールする必要があります。APOS の担当者から必要なファイルが届きます。
- CData DLL ファイル(System.Data.CData.HDFS.dll)をAPOS Live Data Gateway のインストールディレクトリ(デフォルトではC:\Program Files\Live Data Gateway\Admin\)にインストールします。
- CData JAR ファイル(cdata.jdbc.hdfs.jar)をインストールディレクトリ(デフォルトではC:\Program Files\Live Data Gateway\Admin\ConnectionTest_lib\)のConnectionTest_lib フォルダにインストールします。
- CData JAR ファイル(cdata.jdbc.hdfs.jar)をWeb UI インストールディレクトリ(例:C:\LDG_WebUI\lib\)のlib フォルダにインストールします。
HDFS 接続文字列の設定
APOS Live Data Gateway からHDFS への接続を確立する前に、HDFS のJDBC 接続文字列を構築する必要があります。
組み込みの接続文字列デザイナー
JDBC 接続文字列作成の補助として、HDFS JDBC Driver に組み込まれている接続文字列デザイナーが使用できます。JAR ファイルをダブルクリックするか、コマンドラインからjar ファイルを実行します。
java -jar cdata.jdbc.hdfs.jar
接続プロパティを入力し、接続文字列をクリップボードにコピーします。
HDFS 接続プロパティの取得・設定方法
HDFS への認証には、次の接続プロパティを設定します。
- Host:HDFS インスタンスのホストに設定してください。
- Port: HDFS インスタンスのポートに設定してください。デフォルトのポートは"50070" です。
接続文字列は以下のようになります。
jdbc:HDFS:Host=sandbox-hdp.hortonworks.com;Port=50070;Path=/user/root;User=root;
HDFS への接続とセマンティックレイヤービューの作成
コネクタファイルのインストールと接続文字列の設定が完了したら、Live Data Gateway Admin ツールでHDFS に接続し、Live Data Gateway Web UI でセマンティックレイヤービューを構築していきましょう。
HDFS への接続を構成
- APOS Live Data Gateway Manager にログインします。
- まだAPOS LDG のライセンスファイルを更新していない場合は、更新してください。
- 「File」->「Configurations」をクリックします。
- License の「...」メニューをクリックします。
- APOS チームで CData Connector ライセンスを含むライセンスファイルを選択します。
- APOS Live Data Gateway Manager で、「Add」をクリックします。
- APOS Live Data Gateway のConnection タブで、接続を設定します。
- Data Source を「Database」に設定します。
- Database を「CData Drivers」に設定します。
- Database CData Drivers を「HDFS」に設定します。
- Connection String を、以下の例のような先に構築した接続文字列に設定します。
jdbc:HDFS:Host=sandbox-hdp.hortonworks.com;Port=50070;Path=/user/root;User=root;
- Driver Class を「cdata.jdbc.hdfs.HDFSDriver」(デフォルト設定)に設定します。
- 「Test Connection」をクリックします。
- 「Save」をクリックします。
- 接続に固有の接頭辞を付けます(例:"hdfs")。
- 新しく作成した接続をハイライトし、「File」->「Approve Users For Web UI」をクリックします。
- ビューを作成する適切なDB ユーザーを承認し、「Save」をクリックします。
これで、Live Data Gateway Web UI でセマンティックレイヤービューを構築する準備が整いました。
セマンティックレイヤービューを作成
- ブラウザで、APOS Live Data Gateway Portal に移動します。
- Connection(例:"hdfs")を選択します。
- 「Login」をクリックします。
- 接続後、「Semantic Layer」をクリックし、新しいセマンティックレイヤービューを作成します。
- 「New Semantic Layer View」をクリックします。
- Semantic Layer View Prefix およびSemantic Layer View Name を設定します。
- 「Step 2」をクリックします。
- ビューに追加したいテーブルとカラムを選択します。
- 「Step 3」をクリックします。
- 利用可能なテーブルのカラムでMeasure を選択します。
- 「Step 5」をクリックします(「Extra Dimensions」ステップはスキップします)。
- 任意のVariable Prompt を追加します。
- 「Step 6」をクリックします。
- 任意のTable Join を定義します。
- 「Review」をクリックします。
- セマンティックレイヤービューを確認し、「Save」をクリックします。
セマンティックレイヤービューを作成できたので、APOS Live Data Gateway を経由してHDFS のデータにアクセスする準備が整い、SAP Analytics Cloud や他のSAP ソリューションからHDFS のデータへのリアルタイムデータ接続が可能になりました。
詳細と無料トライアル
APOS Live Data Gateway でリアルタイムHDFS のデータを扱うための詳細は、APOS Systems - APOS Solutions - Request Evaluation Software で評価用ソフトウェアをリクエストするか、[email protected] にメールでお問い合わせください。