各製品の資料を入手。
詳細はこちら →CData
こんにちは!テクニカルディレクターの桑島です。
Denodo Platform は、エンタープライズデータベースのデータを一元管理するデータ仮想化製品です。CData JDBC Driver for Parquet と組み合わせると、Denodo ユーザーはリアルタイムParquet のデータと他のエンタープライズデータソースを連携できるようになります。この記事では、Denodo Virtual DataPort Administrator でParquet の仮想データソースを作成する手順を紹介します。
最適化されたデータ処理が組み込まれたCData JDBC Driver は、リアルタイムParquet のデータを扱う上で比類のないパフォーマンスを提供します。Parquet にSQL クエリを発行すると、ドライバーはフィルタや集計などのサポートされているSQL 操作をParquet に直接渡し、サポートされていない操作(主にSQL 関数とJOIN 操作)は組み込みSQL エンジンを利用してクライアント側で処理します。組み込みの動的メタデータクエリを使用すると、ネイティブデータ型を使ってParquet のデータを操作および分析できます。
Denodo からリアルタイムParquet のデータに接続するには、JDBC Driver のJAR ファイルをDenodo の外部ライブラリディレクトリにコピーし、Virtual DataPort Administration Tool から新しいJDBC データソースを作成する必要があります。
Database URI:必要な接続プロパティを使用してJDBC のURL に設定。例えば次のようになります。
jdbc:parquet:URI=C:/folder/table.parquet;
Database URI の作成については以下を参照してください。
JDBC URL の作成の補助として、Parquet JDBC Driver に組み込まれている接続文字列デザイナーが使用できます。JAR ファイルをダブルクリックするか、コマンドラインからjar ファイルを実行します。
java -jar cdata.jdbc.parquet.jar
接続プロパティを入力し、接続文字列をクリップボードにコピーします。
ローカルのParquet ファイルに接続するには、URI 接続プロパティをParquet ファイルへのパスに設定してください。
データソースを作成したら、Denodo Platform で使用するParquet のデータの基本ビューを作成できます。
SELECT * FROM cdata_parquet_sampletable_1 CONTEXT ('i18n'='us_est', 'cache_wait_for_load'='true')
基本ビューを作成すると、Denodo Platform の他のデータソースと同様にリアルタイムParquet のデータを操作できるようになります。例えば、Denodo Data Catalog でParquet にクエリを実行できます。
CData JDBC Driver for Parquet の30日の無償評価版をダウンロードして、Denodo Platform でリアルタイムParquet のデータの操作をはじめましょう!ご不明な点があれば、サポートチームにお問い合わせください。