製品をチェック

Apache Hive Driver の30日間無償トライアルをダウンロード

 30日間の無償トライアルへ

製品の詳細

Apache Hive アイコン Apache Hive JDBC Driver 相談したい

Apache Hive 互換ディストリビューション連携のパワフルなJava アプリケーションを素早く作成して配布。

Hive のデータをBoomi AtomSphere で連携利用する方法:CData JDBC Driver

CData JDBC ドライバを使って、データ統合サービス(iPaaS)のBoomi で Hive のデータ をノーコードで連携。

桑島義行
テクニカルディレクター

最終更新日:2022-05-18
hive ロゴ

CData

jdbc ロゴ画像
Boomi ロゴ

こんにちは!テクニカルディレクターの桑島です。

Boomi AtomSphere https://boomi.com/は、Boomi 社が提供する、 シングルインスタンス、マルチテナントアーキテクチャを特徴としているデータ統合サービス(iPaaS)です。データ統合機能だけでなく、マスターデータのハブ機能、EDI、APIManagement、WorkFlow といったビジネスユースに必要なデータ連携のすべてを実現する機能をシングルプラットフォームで提供しています。

この記事では、Boomi AtomSphere のオンプレミスAtom deployment 機能を使って、CData JDBC ドライバ経由でHive のデータにアクセスする方法を紹介します。CData Drivers を使うことで、RDB のようにBoomi 内でHive のデータを扱うことができるようになります。

Boomi のon-Premise Atom depleyment の作成

on-Premise Atom deployment (右上の青部分)を利用する構成としました。この機能を利用することでOn-Premise 側に配置したCData JDBC ドライバ経由でのSaaS 連携を実現します。

  • ブラウザからBoomi Atom のManage > Atom Management のタブを開きます。
  • +New > Atom を開きます。
  • Atom Setup ダイアログが開くので、ブラウザを開いているマシンのOS(本例ではWindows10Pro 64bit)のSetup ファイルをダウンロードします。
  • Boomi on-premise Atom
  • ダウンロードした「atom_install64.exe」を実行するとインストーラが起動します。
  • Setup Wizard を進めます。
  • ブラウザからBoomi Atom へのログインする時のUser・Password をセットして、Atom Name はデフォルトのまま、次に進みます。
  • on-Premise Atom deployment のインストールディレクトリ(デフォルト)を指定して次に進みます。
  • Setup Wizard を終了(Finish)します。
  • ブラウザからBoomi Atom のManage > Atom Management のタブを開いて、上記で作成したon-Premise Atom Deployment が起動していることを確認します。なお、Windows マシンの場合、サービスからも起動を確認できます。on-Premise Atom deployment の作成は以上です。
  • オンプレミスAtom のインストールを確認

Boomi on-Premise Atom deployment モジュールへのJDBC ドライバの配置

次に別途ダウンロード・インストールしたCData JDBC Driver for ApacheHive をBoomi on-premise Atom モジュールに配置していきます。

    JDBC Drivers ファイルをCData 製品のインストールフォルダからon-Premise Atom deployment インストールパス配下のパスにコピーします。
  • cdata.jdbc.apachehive.jar
  • cdata.jdbc.apachehive.lic (試用版では.lic ファイルは不要)
  • コピー元:C:\Program Files\CData\CData JDBC Driver for ApacheHive 2019J\lib
  • コピー先:C:\Boomi AtomSphere\Atom - 10.211.55.9\lib

コピーしたらBoomi Atom をブラウザからリスタート(Restart Atom)してください。作成したon-Premise Atom deployment のInstalledLibraries にJDBCの.jar ファイルが表示されれば成功です。

JDBC Driver のon-premise Atom への配置

Hive のConnectionの作成

Boomi Atom からHive のデータソースに接続するためのConnection を作成します。

  • Welcom 画面の「Component > Connetion」を選択するとCreate Component ウィザードが開きます。
  • Hive への接続用のConnection 設定として以下の値をセットします。
    • Type: Connection
    • Component Name: ConnectionCDataApacheHive
    • Folder: 任意のパス
    • Connector: Database
  • Hive のデータ Connection 作成1
  • そしてJDBC Driver の接続設定を行います。

    Apache Hive への接続を確立するには以下を指定します。

    • Server:HiveServer2 をホストするサーバーのホスト名またはIP アドレスに設定。
    • Port:HiveServer2 インスタンスへの接続用のポートに設定。
    • TransportMode:Hive サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
    • AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。
    • CData 製品においてTLS/SSL を有効化するには、UseSSL をTrue に設定します
    • Driver Type: Custom
    • Class Name: cdata.jdbc.apachehive.ApacheHiveDriver
    • User Name: 本来であれば不要ですが、空のままだと後の手順でバリデーションエラーが発生するので適当な値をセットします
    • Password: 本来であれば不要ですが、空のままだと後の手順でバリデーションエラーが発生するので適当な値をセットします
    • Connection URL: jdbc:apachehive:Server=127.0.0.1;Port=10000;TransportMode=BINARY;
  • Hive のデータ Connection 作成2
  • Connection の値を設定したら接続テストを行います。右上のTest Connection ボタンをクリックします。実行するAtom を選択する画面が表示されるので、上記手順で作成したon-Premise Atom deployment を選択します。
  • テスト接続が成功することを確認してFinish ボタンでウィザードを閉じます。
  • 作成した Hive のデータ への接続Connection を保存(Save)します。

Boomi Atom でのHive のデータ Profile の作成

次にProfile を設定していきます。ProfileとはSQL(SELECT/INSERT/UPDATE/DELETE)実行時のフィールド定義です。

  • Hive のデータ のテーブルをSELECT するProfile を作成していきます。
    • Type: Profle
    • Component Name: ProfileCDataApacheHive
    • Folder: 任意のパス
    • Connector: Database
  • Hive のデータ Profile の作成1
  • 二つのパラメータに、Display Name: デフォルト, Type: Select と値をセットしたら右上のImportボタンをクリックします。
  • Hive のデータ Profile の作成2
  • Database Import Wizardが開くので、以下のパラメータをセットして次に進みます。
    • Browse in: 上記手順で作成したon-Premise Atom deployment
    • Connection: 上記手順で作成した接続Connection
  • Hive のデータ Profile の作成3
  • Hive のデータ 内のオブジェクトがテーブル一覧として表示されます。取得するテーブルにチェックをオンにして次に進みます。
  • Hive のデータ Profile のテーブル選択
  • テーブル内のカラム一覧が表示されます。使用する項目のチェックをオンにして次に進みます。
  • Hive のデータ Profile のカラム選択
  • Import ウィザードが完了します。
  • DataElements のField アイコンをクリックすると選択テーブル内のカラムが定義されていることを確認できます。また、SQL Script には取得時のSQL(SELECT)が表示されています。作成したProfile を保存します。
  • Hive のデータ Profile の確認
  • これでHive のデータ がBoom Atom で利用できるProfile として登録されました。

Boomi AtomSphere でのHive のデータ の利用

あとは、設定されたProfile はRDB と同じようにBoomi Atom 内で利用することができます。カラムにマッピングを行うこともできます。

Hive のデータ Profile をBoomi 内でマッピング

このようにCData JDBC ドライバをアップロードすることで、簡単にBoomi AtomSphere でHive のデータ データをノーコードで連携し、使うことが可能です。

是非、CData JDBC Driver for ApacheHive 30日の無償評価版 をダウンロードして、お試しください。

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。