こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。
Microsoft Query を使うことで、Excel からデータベースやファイル、外部データソースにアクセスしてデータをインポート、更新できます。CData ODBC Driver for ADLS はMicrosoft Query の連携先を拡張して、270種類以上のCRM、ERP、MA、会計ツールなどのデータソースへのアクセスを実現します。
この記事では、Microsoft Query を使ってAzure Data Lake Storage データをスプレッドシートにインポートする方法をご紹介します。
CData ODBC ドライバとは?
CData ODBC ドライバは、以下のような特徴を持った製品です。
- Azure Data Lake Storage をはじめとする、CRM、MA、会計ツールなど多様なカテゴリの270種類以上のSaaS / オンプレデータソースに対応
- Excel やMicrosoft Query をはじめとする多様な帳票・BI ツールにAzure Data Lake Storage データを連携
- ノーコードでの手軽な接続設定
- 標準SQL での柔軟なデータ読み込み・書き込み
CData ODBC ドライバでは、1.データソースとしてAzure Data Lake Storage の接続を設定、2.Microsoft Query でODBC Driver との接続を設定、という2つのステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。
Azure Data Lake Storage への接続を設定
まずは、本記事右側のサイドバーからADLS ODBC Driver の無償トライアルをダウンロード・インストールしてください。30日間無償で、製品版の全機能が使用できます。
ODBC ドライバーのインストール完了時にODBC DSN 設定画面が立ち上がります。または、Microsoft ODBC データソースアドミニストレーターを使ってDSN を作成および設定できます。
Azure Data Lake Storage 接続プロパティの取得・設定方法
Azure Data Lake Storage Gen 2 への接続
Gen 2 Data Lake Storage アカウントに接続するには、以下のプロパティを設定します。
- Account:ストレージアカウントの名前。
- FileSystem:このアカウントに使用されるファイルシステム名。例えば、Azure Blob コンテナの名前。
- Directory(オプション):レプリケートされたファイルが保存される場所へのパス。パスが指定されない場合、ファイルはルートディレクトリに保存されます。
Azure Data Lake Storage Gen 2 への認証
本製品は、次の4つの認証方法をサポートします:アクセスキーの使用、共有アクセス署名の使用、Azure Active Directory OAuth(AzureAD)、Managed Service Identity(AzureMSI)。
アクセスキー
アクセスキーを使用して接続するには、はじめにADLS Gen2 ストレージアカウントで利用可能なアクセスキーを取得する必要があります。
Azure ポータルで:
- ADLS Gen2 ストレージアカウントにアクセスします。
- 設定でアクセスキーを選択します。
- 利用可能なアクセスキーの1つの値をAccessKey 接続プロパティにコピーします。
接続の準備ができたら、次のプロパティを設定します。
- AuthScheme:AccessKey。
- AccessKey:先にAzure ポータルで取得したアクセスキーの値。
共有アクセス署名(SAS)
共有アクセス署名を使用して接続するには、はじめにAzure Storage Explorer ツールを使用して署名を生成する必要があります。
接続の準備ができたら、次のプロパティを設定します。
- AuthScheme:SAS。
- SharedAccessSignature:先に生成した共有アクセス署名の値。
AzureAD、AzureMSI での認証方法については、ヘルプドキュメントの「Azure Data Lake Storage Gen 2
への認証」セクションを参照してください。
Microsoft ODBC データソースアドミニストレーターで必要なプロパティを設定する方法の詳細は、ヘルプドキュメントの「はじめに」を参照してください。
Excel で[データ]タブを開き[その他のデータソースから]->[Microsoft Query から]を選びます。
マシンにインストールされているMicrosoft Office のバージョンに合わせて、32 bit CData Azure Data Lake Storage Source または64 bit CData Azure Data Lake Storage Source x64 DSN を選びます。Query Wizard を使うオプションを選択し、クエリを作成/編集します。
Query Wizard で、スプレッドシートにインポートしたいテーブルのノードを展開します。インポートしたいカラムを選択し、矢印をクリックしてクエリに追加します。あるいはテーブル名を選択して、テーブルにあるすべてのカラムを追加します。
[Filter Data]ページではクライテリアを指定できます。例えば、日付の範囲を設定して結果を絞れます。
クエリでパラメータを使いたい場合は、Microsoft Query でクエリを編集するオプションを選択します。
クエリにパラメータを設定するには、SQL を直接修正する必要があります。その場合は、[Query Editor]の[SQL]ボタンをクリックします。フィルタクライテリアを事前に設定している場合は、クエリ内にWHERE 句が存在します。
パラメータを使うには、WHERE 句のフィールド値にワイルドカード文字として "?" を使います。例えばResources をインポートしている場合は、"Type=?" を設定できます。
SQL ステートメントの編集が終わったら[SQL]ダイアログを閉じます。パラメータ値を入力するように促されますが、次のステップでセルを選択して値を入れることになるので、このダイアログではボックスは空のままにしておきます。
Microsoft Query を閉じます。[Import Data]ダイアログが表示されます。結果をインポートするセルを入力します。
[Import Data]ダイアログを閉じます。パラメータ値を入力するように促されます。パラメータボックスの隣にあるボタンをクリックしてセルを選択します。値が変更されたらスプレッドシートを自動的にリフレッシュするオプションを選択します。
データはこれでExcel にインポートされました。セルB1の値を変更すると、データは指定した検索クライテリアによってフィルタされます。
おわりに
このようにCData ODBC ドライバと併用することで、270を超えるSaaS、NoSQL データをMicrosoft Query からコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。
日本のユーザー向けにCData ODBC ドライバは、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。