各製品の資料を入手。
詳細はこちら →CData
こんにちは!ウェブ担当の加藤です。マーケ関連のデータ分析や整備もやっています。
Informatica は、データを転送・変換するための強力で立派な手段を提供します。CData JDBC Driver for HDFS を利用することで、Informatica の強力なデータ転送および操作機能とシームレスに統合される、業界で実証済みの標準に基づくドライバーにアクセスできます。このチュートリアルでは、Informatica PowerCenter でHDFS を転送および参照する方法を示します。
ドライバーをInformatica PowerCenter サーバーに展開するために、インストールディレクトリのlib サブフォルダにあるCData JAR および.lic ファイルを次のフォルダにコピーします。Informatica-installation-directory\services\shared\jars\thirdparty.
Developer ツールでHDFS を使用するには、インストールディレクトリのlib サブフォルダにあるCData JAR および.lic ファイルを次のフォルダにコピーする必要があります。
以下のステップに従って、Informatica Developer に接続します。
cdata.jdbc.hdfs.HDFSDriver
HDFS への認証には、次の接続プロパティを設定します。
JDBC URL の構成については、HDFS JDBC Driver に組み込まれている接続文字列デザイナを使用してください。JAR ファイルのダブルクリック、またはコマンドラインからJAR ファイルを実行します。
java -jar cdata.jdbc.hdfs.jar
接続プロパティを入力し、接続文字列をクリップボードにコピーします。
以下は一般的な接続文字列です。
jdbc:hdfs:Host=sandbox-hdp.hortonworks.com;Port=50070;Path=/user/root;User=root;
ドライバーJAR をクラスパスに追加してJDBC 接続を作成すると、Informatica のHDFS エンティティにアクセスできるようになります。以下のステップに従ってHDFS に接続し、HDFS テーブルを参照します。
以下より、[Data Viewer]でHDFS テーブルを参照できるようになります。テーブルの[node]を右クリックし、[Open]をクリックします。[Data Viewer]で[Run]をクリックします。
以下のステップに従って、プロジェクトにHDFS テーブルを追加します。
以下のステップに従って、マッピングにHDFS ソースを追加します。
以下のステップに従って、HDFS カラムをフラットファイルにマッピングします。
HDFS を転送するために、ワークスペースで右クリックし、[Run Mapping]をクリックします。