各製品の資料を入手。
詳細はこちら →CData
こんにちは!ウェブ担当の加藤です。マーケ関連のデータ分析や整備もやっています。
Informatica は、データを転送・変換するための強力で立派な手段を提供します。CData JDBC Driver for Parquet を利用することで、Informatica の強力なデータ転送および操作機能とシームレスに統合される、業界で実証済みの標準に基づくドライバーにアクセスできます。このチュートリアルでは、Informatica PowerCenter でParquet を転送および参照する方法を示します。
ドライバーをInformatica PowerCenter サーバーに展開するために、インストールディレクトリのlib サブフォルダにあるCData JAR および.lic ファイルを次のフォルダにコピーします。Informatica-installation-directory\services\shared\jars\thirdparty.
Developer ツールでParquet を使用するには、インストールディレクトリのlib サブフォルダにあるCData JAR および.lic ファイルを次のフォルダにコピーする必要があります。
以下のステップに従って、Informatica Developer に接続します。
cdata.jdbc.parquet.ParquetDriver
ローカルのParquet ファイルに接続するには、URI 接続プロパティをParquet ファイルへのパスに設定してください。
JDBC URL の構成については、Parquet JDBC Driver に組み込まれている接続文字列デザイナを使用してください。JAR ファイルのダブルクリック、またはコマンドラインからJAR ファイルを実行します。
java -jar cdata.jdbc.parquet.jar
接続プロパティを入力し、接続文字列をクリップボードにコピーします。
以下は一般的な接続文字列です。
jdbc:parquet:URI=C:/folder/table.parquet;
ドライバーJAR をクラスパスに追加してJDBC 接続を作成すると、Informatica のParquet エンティティにアクセスできるようになります。以下のステップに従ってParquet に接続し、Parquet テーブルを参照します。
以下より、[Data Viewer]でParquet テーブルを参照できるようになります。テーブルの[node]を右クリックし、[Open]をクリックします。[Data Viewer]で[Run]をクリックします。
以下のステップに従って、プロジェクトにParquet テーブルを追加します。
以下のステップに従って、マッピングにParquet ソースを追加します。
以下のステップに従って、Parquet カラムをフラットファイルにマッピングします。
Parquet を転送するために、ワークスペースで右クリックし、[Run Mapping]をクリックします。