Google Data Catalog データに連携しTalend からデータに接続
Google Data Catalog をTalend Open Studio の標準コンポーネントおよびデータソース設定ウィザードに統合。
古川えりか
コンテンツスペシャリスト
最終更新日:2022-09-15
CData
こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。
この記事では、Talend で簡単にCData JDBC Driver for GoogleDataCatalog をワークフローに統合してGoogle Data Catalog データ連携する方法を説明します。ここではCData JDBC Driver for GoogleDataCatalog を使ってTalend でGoogle Data Catalog をジョブフローに転送します。
JDBC データソースとしてTalend でGoogle Data Catalog に接続
下記の手順に従って、Google Data Catalog にJDBC 接続を確立します:
- Google Data Catalog を新しいデータベース接続を追加:新しく接続を追加するには、[Metadata]ノードを展開し[Db Connections]ノードを右クリックして[Create Connection]をクリックします。
- ウィザードが表示されたら、接続に名前を入力します。
次のページで、[DB Type]メニューから[Generic JDBC]を選択してJDBC URL を入力します。
Google Data Catalog 接続プロパティの取得・設定方法
認証プロパティを追加する前に、次の接続プロパティを設定してください。
- OrganizationId:接続するGoogle Cloud Platform の組織リソースに関連付けられたID。これはGCP コンソールに移動して確認してください。
「プロジェクト」ドロップダウンメニューを開き、リストから組織へのリンクをクリックします。このページから組織ID を取得できます。
- ProjectId:接続するGCP のプロジェクトリソースに関連付けられたID。GCP
コンソールのダッシュボードに移動し、「プロジェクトを選択」のメニューからお好みのプロジェクトを選択して確認してください。プロジェクトID は、「プロジェクト情報」項目に表示されます。
Google Data Catalog への認証
CData 製品は、認証にユーザーアカウント、サービスアカウント、およびGCP インスタンスアカウントの使用をサポートします。
OAuth の設定方法については、ヘルプドキュメントの「OAuth」セクションを参照してください。
以下は一般的なJDBC URL です:
jdbc:googledatacatalog:ProjectId=YourProjectId;
- インストールディレクトリの[lib]サブフォルダ内にあるcdata.jdbc.googledatacatalog.jar ファイルへのパスを入力します。
- 接続を右クリックして[Retrieve Schema]をクリックします。
- デフォルトオプションで[Next]をクリックしインポートしたいテーブルを選択します。
- デフォルトオプションでウィザードを終了します。
Schemas テーブルをフラットファイルに出力
下記の手順に従って、Schemas テーブルをフラットファイル出力コンポーネントに転送します:
- [Table Schemas]ノードで、テーブルをワークスペース内にドラッグします。
- ダイアログが表示されたら[tJDBCInput]コンポーネントを選択します。
- 次に、[tFileOutputDelimited]コンポーネントをPalette の[Business Intelligence]タブからワークスペース内にドラッグします。
- Schemas tJDBCInput コンポーネントを右クリックしてベクタを出力ファイルにドラッグします。
プロジェクトを実行してデータを転送します。
関連コンテンツ