製品をチェック

Apache Hive ODBC Driver の30日間無償トライアルをダウンロード

 30日間の無償トライアルへ

製品の詳細

Apache Hive アイコン Apache Hive ODBC Driver 相談したい

Hive ODBC Driver は、ODBC 接続をサポートする任意のアプリケーションからApache Hive データに直接接続できるパワフルなツールです。

ドライバーはSQL をHiveQL にマッピングして、標準SQL-92 で直接Apache Hive にアクセスできます。

Hive のデータをSQL Server に連携して利用する4つの方法を比較

ODBC Driver、SQL Gateway、SSIS Components、Sync を通したSQL Server とHive の連携について、それぞれの特徴を解説します。

古川えりか
コンテンツスペシャリスト

最終更新日:2021-09-27

こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。

この記事では、SQL Server でHive データを使うというシナリオにフォーカスして実現方法やメリット&デメリットを解説します。

1. ODBC Driver からCACHE クエリでHive のデータをSQL Server に同期

一番簡単な方法として、CData ODBC Driver for ApacheHive でCACHE クエリを実行する方法があります。CData ODBC ドライバはCACHE をサポートしており、メタデータのみのキャッシュから明示的にデータを含むCACHE を発行可能です。

詳細はこちら: Hive のデータをPowerShell script でSQL Server にレプリケートする方法

ODBC Driver for ApacheHive のDSN 設定でCACHE 設定を行います。以下のようにCACHE SELECT というSQL を発行することで、選択したテーブルのデータをコピーできます。

CACHE SELECT * FROM テーブル名
  • 設定の簡単さ:★★

  • 環境の簡単さ:★★★

  • ライセンスコスト:★★★

  • リアルタイム性:★

  • 連携はHive → SQL Server の片方向のみ

  • 柔軟性:★★

簡単な.NET デスクトップアプリでCACHE クエリを定期的に発行することもできますし、記事のようにPowerShell からスクリプトで実行することもできます。PowerShell ですとWindows マシンからアプリのデプロイなどをしなくても使えますし、定期実行ができるのでお手軽です。

必要なCData 製品のライセンスはODBC Driver 1本のみなので、低価格でHive → SQL Server の実装が可能です。とはいえバッチ連携ですので、リアルタイムなHive データを扱えない点は少し残念です。またSQL やPowerShell スクリプトを書いたり、バッチ処理を行うアプリを作成する必要があります。

CData では、Hive PowerShell Cmdlets も提供しています。Cmdlets を使えば、中継用のアプリケーションを作成せずにPowerShell だけでHive からSQL Server にデータをコピーすることが可能です。PowerShell Cmdlets については こちらを参照してください。

2. SQL Gateway でSQL Server のリンクサーバーとしてHive のデータにアクセス

SQL Server には、リンクサーバーという他のDB をSQL Server から呼び出せる統合機能があります。CData ODBC Driver for ApacheHive に付属しているSQL Gateway を使えば、Hive のデータをSQL Server のリンクサーバーとして扱うことができます。Hive のデータがSQL Server 保存されるわけではありませんが、SQL Server のインターフェースでHive のデータをSQL を使って呼び出すことができます。

設定方法はこちら:Hive データにSQL Server のリンクサーバーとして接続

通常のODBC Driver for ApacheHive のDSN 設定の後にSQL Gateway を立ち上げ、Hive DSN をSQL Server のサービスとして設定します。SQL Server Management Studio でこのサービスをリンクサーバーとして登録すると、SQL クエリでHive データをリンクサーバー経由で使用することができます。 複数の.NET クライアントアプリからのHive のデータ参照や、SQL Server データとのJOIN などに最適です。

SELECT * from リンクサーバー名.CData Hive Source Sys(ODBC DSN 名).Hive.テーブル名
  • 設定の簡単さ:★

  • 環境の簡単さ:★

  • ライセンスコスト:★★

  • リアルタイム性:★★★

  • 連携はHive → SQL Server および、SQL Server → Hive の双方向が可能

  • 柔軟性:★★

SQL Server のリンクサーバーに慣れ親しんだ方には一番使いやすい利用方法です。常に最新のHive データをリアルタイムにクエリできる点も優れています。SQL Server 側からSQL で双方向連携(書き込みを含む)できる点が大変便利です。

手間としてはSQL Gateway をホスティングして稼働させなければならない点があります。またSQL Gateway は、ODBC Driver for ApacheHive のサーバーライセンスに同梱されています。

そして、SQL Server のリンクサーバーを使えば、SQL Server → Hive の方向の連携も可能になります。SQL Server 側のストアドプロシージャでHive へのSQL Server データの書き込みができます。

3. SSIS でkintone データをSQL Server にインポート

SQL Server ユーザーの中には、データ統合・ワークフローにSSIS(SQL Server Integration Services)を使っている方も多いのではないでしょうか。CData では、SSIS 向けにHive への連携が可能なSSIS Components for ApacheHive を提供しています。

技術記事: SSIS を使ってHive のデータをSQL Server にインポート

  • 設定の簡単さ:★★

  • 環境の簡単さ:★★

  • ライセンスコスト:★★

  • リアルタイム性:★★

  • 連携はHive → SQL Server および、SQL Server → Hive の双方向が可能

  • 柔軟性:★★★

SSIS ユーザーであれば、Hive Components さえあれば、簡単にSQL Server へのインポートフローを組むことができます。コンポーネントもドライバーと同程度の価格でありリーズナブルです。

SSIS 以外でもすでにETL / EAI ツールをお持ちであれば、CData Drivers をETL / EAI ツールで使うだけで簡単にデータ連携が可能です。

4. CData Sync でHive のデータをSQL Server に反復同期

最後はCData Sync というSaaS データをRDB に同期する専用のアプリケーションを使う方法です。CData Sync はサーバーアプリケーションになっており、ブラウザコンソールからノーコードで3ステップで同期ジョブが設定できます。

定期実行や細かいレプリケーションの項目設定までをGUI 操作だけで実行可能です。

設定方法はこちら:SQL Server にHive のデータを連携・統合する方法

  • 設定の簡単さ:★★★

  • 環境の簡単さ:★★

  • ライセンスコスト:★

  • リアルタイム性:★

  • 連携はHive → SQL Server の片方向のみ

  • 柔軟性:★★★

DB への同期専用のノーコードツールであり、使いやすさや拡張性は高いです。サーバーツールですので、価格は#2 と同程度になります。

無償トライアルでHive をSQL Server に連携

Hive → SQL Server の連携の4つの実装方法を紹介しました。利用の規模や技術的な制約によっていろいろな方法があります。ぜひ、自分のケースに合った連携方法を選んでください。 記事で紹介した4つの方法の実行に必要な製品は以下になります。どの製品も30日間の無償トライアルが利用できますので、ぜひお試しください。

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。