各製品の資料を入手。
詳細はこちら →こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。
Informatica はデータを転送、変換するための強力で洗練された手段です。CData ODBC Driver for ApacheHive は、Informatica の強力なデータ転送・変換機能とシームレスに連携可能な、業界で実証済みの標準ドライバです。このチュートリアルでは、Informatica PowerCenter でHive のデータを転送および参照する方法を説明します。
CData ODBC ドライバは、以下のような特徴を持ったリアルタイムデータ連携ソリューションです。
CData ODBC ドライバでは、1.データソースとしてHive の接続を設定、2.Informatica 側でODBC Driver との接続を設定、という2つのステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。
まずは、本記事右側のサイドバーからApacheHive ODBC Driver の無償トライアルをダウンロード・インストールしてください。30日間無償で、製品版の全機能が使用できます。
Hive への接続に関する情報と、Windows およびLinux 環境でのDSN の設定手順を以下で説明します。
Apache Hive への接続を確立するには以下を指定します。
接続プロパティが未設定の場合は、まずODBC DSN(データソース名)で設定します。ドライバーのインストールの最後にアドミニストレーターが開きます。Microsoft ODBC データソースアドミニストレーターを使ってODBC DSN を作成および設定できます。
CData ODBC Driver for ApacheHive をLinux 環境にインストールする場合、ドライバーのインストールによってDSN が事前に定義されます。DSN を変更するには、システムデータソースファイル(/etc/odbc.ini)を編集し、必要な接続プロパティを定義します。
[CData ApacheHive Source]
Driver = CData ODBC Driver for ApacheHive
Description = My Description
Server = 127.0.0.1
Port = 10000
TransportMode = BINARY
これらの構成ファイルの使用方法については、オンラインのヘルプドキュメントを参照してください。
「オブジェクトエクスプローラー」からリンクテーブルを作成してライブCustomers データにアクセスする方法は、次のとおりです。
下記の手順に従って、Informatica PowerCenter のHive に接続します。
jdbc:apachehive:Server=127.0.0.1;Port=10000;TransportMode=BINARY;
を入力します。
注意:Linux オペレーティングシステムで作業している場合は、「Driver Manager for Linux」プロパティをunixODBC 2.3.x に設定します。
Hive へのODBC 接続を作成したら、Informatica でHive エンティティにアクセスできるようになります。下記の手順に従って、Customers エンティティをプロジェクトに追加します。
これで、Data Viewer でテーブルをブラウズできます。テーブル用ノードを右クリックし「Open」をクリックします。「Data Viewer」ビューで「Run」をクリックします。
下記の手順に従って、Hive ソースをマッピングに追加します。
以下のステップに従って、Hive カラムをフラットファイルにマッピングします。
Hive のデータを転送するには、ワークスペース内で右クリックして「Run Mapping」をクリックします。
このようにCData ODBC ドライバと併用することで、270を超えるSaaS、NoSQL データをコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。
CData ODBC ドライバは日本のユーザー向けに、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。