製品をチェック

Apache Hive ODBC Driver の30日間無償トライアルをダウンロード

 30日間の無償トライアルへ

製品の詳細

Apache Hive アイコン Apache Hive ODBC Driver 相談したい

Hive ODBC Driver は、ODBC 接続をサポートする任意のアプリケーションからApache Hive データに直接接続できるパワフルなツールです。

ドライバーはSQL をHiveQL にマッピングして、標準SQL-92 で直接Apache Hive にアクセスできます。

PowerPivot でHive のデータを連携して取得し分析

この記事では、PowerPivot からCData ODBC Driver を使う方法を説明します。「Table Import Wizard」を使ってHive のデータをロードします。インポートに使うクエリをビジュアルに作成、あるいはドライバーがサポートするSQL を使って作成できます。

古川えりか
コンテンツスペシャリスト

最終更新日:2022-02-13

こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。

ODBC プロトコルは多くのBI および帳票ツールで多様なデータベースのデータにアクセスするために使われています。CData ODBC Drive を使って、簡単にHive をデータ連携できます。この記事では、CData Driver for ApacheHive を使ってPowerPivot にデータをインポートします。

CData ODBC ドライバとは?

CData ODBC ドライバは、以下のような特徴を持ったリアルタイムデータ連携ソリューションです。

  1. Hive をはじめとする、CRM、MA、会計ツールなど多様なカテゴリの270種類以上のSaaS / オンプレミスデータソースに対応
  2. 多様なアプリケーション、ツールにHive のデータを連携
  3. ノーコードでの手軽な接続設定
  4. 標準 SQL での柔軟なデータ読み込み・書き込み

CData ODBC ドライバでは、1.データソースとしてHive の接続を設定、2.PowerPivot 側でODBC Driver との接続を設定、という2つのステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。

CData ODBC ドライバのインストールとHive への接続設定

まずは、本記事右側のサイドバーからApacheHive ODBC Driver の無償トライアルをダウンロード・インストールしてください。30日間無償で、製品版の全機能が使用できます。

  1. 接続プロパティが未設定の場合には、DSN(データソース名)の設定を行います。Microsoft ODBC データソースアドミニストレーターを使ってODBC DSN を作成および設定できます。

    未指定の場合は、初めにODBC DSN (data source name) で接続プロパティを指定します。ドライバーのインストールの最後にアドミニストレーターが開きます。Microsoft ODBC Data Source Administrator を使用して、ODBC DSN を作成および構成できます。

    Apache Hive への接続を確立するには以下を指定します。

    • Server:HiveServer2 をホストするサーバーのホスト名またはIP アドレスに設定。
    • Port:HiveServer2 インスタンスへの接続用のポートに設定。
    • TransportMode:Hive サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
    • AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。
    • CData 製品においてTLS/SSL を有効化するには、UseSSL をTrue に設定します

    Microsoft ODBC データソースアドミニストレーターで必要なプロパティを設定する方法は、ヘルプドキュメントの「はじめに」を参照してください。

  2. Excel で[PowerPivot]タブの[管理]アイコンをクリックしてPowerPivot を開きます。
  3. [外部データソースの取り込み]から[その他のソース]ボタンをクリックします。

    The Get External Data from Other Data Sources option in the PowerPivot window.
  4. OLEDB/ODBC ソースオプションを選択して、[次へ]をクリックします。The option to import from an OLEDB/ODBC data source in the Table Import Wizard.
  5. [ビルド]をクリックして[データリンクプロパティ]ダイアログを開きます。このダイアログでは、DSN に基づいて自動的に接続文字列がビルドされます。
  6. [プロバイダー]タブで[Microsoft OLEDB Provider for ODBC Drivers]オプションを選択します。
  7. [接続]タブで[データソース名を使用する]オプションを選択して、メニューからHive DSN を選択します。CData Hive Source DSN はインストール時に作成されます。 The Data Link Properties dialog, where the DSN is selected in the Table Import Wizard. (Salesforce is shown.)

Hive のデータをインポート

下記の手順に従って、ウィザードを使ってHive のテーブルからデータをロードします。Hive のカラムをウィザードを使って選択、フィルタ、およびソートすると、PowerPivot は実行されるクエリを生成します。

  1. [テーブルのインポートウィザード]でDSN を選択してから、[テーブルとビューの一覧から選択し、インポートするデータを選択する]オプションを選択すると、Hive で利用できるテーブルとビューのリストを見ることができます。The list of available tables. (Salesforce is shown.)
  2. [プレビューとフィルター]をクリックして特定のカラムを選択、データをソート、およびフィルタをカラム値に基づいて視覚的にビルドします。 The data preview with an interface to filter and sort the results to be imported. (Salesforce is shown.)

カスタムクエリインポート

インポートするテーブルを選ぶ以外に、特定のカラムをインポートするクエリの指定やフィルタの定義もできます。ドライバーは元になるHive API に相当する、シンプルで直観的なSQL ダイアレクトをサポートします。

  1. [テーブルのインポートウィザード]でDSN を選択してから、[インポートするデータを指定するクエリを記述する]オプションを選択してクエリを書きます。Step two of the Table Import Wizard: Choose How to Import the Data.
  2. [SQL ステートメント]ボックスにクエリを入れます。[検証]をクリックしてクエリステートメントが有効かどうかを確認します。[デザイン]をクリックして結果をプレビューし、インポートする前にクエリを直します。

    WHERE 句を使ってフィルタライテリアクを指定できます。利用可能なSQL 機能の例については、ヘルプドキュメントの「サポートされるSQL」を参照してください。

    The query to be used to import the data. (Salesforce is shown.)
  3. ウィザードを終了して選んだクエリでデータをインポートします。 The imported data.

Hive からPowerPivot へのデータ連携には、ぜひCData ODBC ドライバをご利用ください

このようにCData ODBC ドライバと併用することで、270を超えるSaaS、NoSQL データをコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。

CData ODBC ドライバは日本のユーザー向けに、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。