Impala データに連携しTalend からデータに接続
Impala をTalend Open Studio の標準コンポーネントおよびデータソース設定ウィザードに統合。
古川えりか
コンテンツスペシャリスト
最終更新日:2022-09-15
CData
こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。
この記事では、Talend で簡単にCData JDBC Driver for ApacheImpala をワークフローに統合してImpala データ連携する方法を説明します。ここではCData JDBC Driver for ApacheImpala を使ってTalend でImpala をジョブフローに転送します。
JDBC データソースとしてTalend でImpala に接続
下記の手順に従って、Impala にJDBC 接続を確立します:
- Impala を新しいデータベース接続を追加:新しく接続を追加するには、[Metadata]ノードを展開し[Db Connections]ノードを右クリックして[Create Connection]をクリックします。
- ウィザードが表示されたら、接続に名前を入力します。
次のページで、[DB Type]メニューから[Generic JDBC]を選択してJDBC URL を入力します。
Apache Impala に接続するには、Server、Port、およびProtocolVersion を設定してください。オプションでデフォルトのDatabase
を指定することもできます。
NOSASL、LDAP、またはKerberos といった別の方法で接続するには、オンラインのヘルプドキュメントを参照してください。
以下は一般的なJDBC URL です:
jdbc:apacheimpala:Server=127.0.0.1;Port=21050;
- インストールディレクトリの[lib]サブフォルダ内にあるcdata.jdbc.apacheimpala.jar ファイルへのパスを入力します。
- 接続を右クリックして[Retrieve Schema]をクリックします。
- デフォルトオプションで[Next]をクリックしインポートしたいテーブルを選択します。
- デフォルトオプションでウィザードを終了します。
Customers テーブルをフラットファイルに出力
下記の手順に従って、Customers テーブルをフラットファイル出力コンポーネントに転送します:
- [Table Schemas]ノードで、テーブルをワークスペース内にドラッグします。
- ダイアログが表示されたら[tJDBCInput]コンポーネントを選択します。
- 次に、[tFileOutputDelimited]コンポーネントをPalette の[Business Intelligence]タブからワークスペース内にドラッグします。
- Customers tJDBCInput コンポーネントを右クリックしてベクタを出力ファイルにドラッグします。
プロジェクトを実行してデータを転送します。
関連コンテンツ