こんにちは!ウェブ担当の加藤です。マーケ関連のデータ分析や整備もやっています。
Klipfolio は、チームやクライアント向けのリアルタイムダッシュボードを構築するための、オンラインダッシュボードプラットフォームです。CData Connect Server と組み合わせると、ビジュアライゼーションやレポートなどのためにGoogle Data Catalog データにアクセスできます。この記事では、Connect Server でGoogle Data Catalog の仮想データベースを作成し、Klipfolio でGoogle Data Catalog データからビジュアライゼーションを構築する方法を説明します。
CData Connect Server は、Google Data Catalog に純粋なMySQL インターフェースを提供し、ネイティブにサポートされているデータベースにデータを複製することなくKlipfolio のリアルタイムGoogle Data Catalog データからレポートを作成できるようにします。ビジュアライゼーションを作成すると、Klipfolio はデータを収集するためのSQL クエリを生成します。CData Connect Server は、最適化されたデータ処理を使用してサポートされているすべてのSQL 操作(フィルタ、JOIN など)をGoogle Data Catalog に直接プッシュし、サーバーサイドの処理を利用して、要求されたGoogle Data Catalog データを素早く返します。
Google Data Catalog データの仮想MySQL データベースを作成
CData Connect Server は、簡単なポイントアンドクリックインターフェースを使用してAPI を生成します。
- Connect Server にログインし、「Databases」をクリックします。
- 「Available Data Sources」から「Google Data Catalog」を選択します。
-
必要な認証プロパティを入力し、Google Data Catalog に接続します。
Google Data Catalog 接続プロパティの取得・設定方法
認証プロパティを追加する前に、次の接続プロパティを設定してください。
- OrganizationId:接続するGoogle Cloud Platform の組織リソースに関連付けられたID。これはGCP コンソールに移動して確認してください。
「プロジェクト」ドロップダウンメニューを開き、リストから組織へのリンクをクリックします。このページから組織ID を取得できます。
- ProjectId:接続するGCP のプロジェクトリソースに関連付けられたID。GCP
コンソールのダッシュボードに移動し、「プロジェクトを選択」のメニューからお好みのプロジェクトを選択して確認してください。プロジェクトID は、「プロジェクト情報」項目に表示されます。
Google Data Catalog への認証
CData 製品は、認証にユーザーアカウント、サービスアカウント、およびGCP インスタンスアカウントの使用をサポートします。
OAuth の設定方法については、ヘルプドキュメントの「OAuth」セクションを参照してください。
- 「 Test Database 」をクリックします。
- 「Permission」->「 Add」とクリックし、適切な権限を持つ新しいユーザー(または既存のユーザー)を追加します。
コネクションが作成されたら、Klipfolio からGoogle Data Catalog に接続することができます。
Klipfolio からGoogle Data Catalog に接続
以下のステップでは、Klipfolio からCData Connect Server に接続して新しいGoogle Data Catalog データソースを作成する方法の概要を説明します。
- Klipfolio を開きます。
- 「Data Sources」で「」をクリックして新しいデータソースを追加します。
- MSSQL をService として検索して選択します。
- 「Create a custom MSSQL data source」をクリックします。
- MySQL 接続プロパティを設定してデータソースを構成します。
- MSSQL 接続プロパティを設定してデータソースを構成します。
- Host:接続するCData Connect Serverインスタンス、例:CONNECT_SERVER_URL
- Port:1433
- Database: データベース (例 GoogleDataCatalog1)
- Driver:MS SQL
- Username:Connect Server ユーザー
- Password:上記のユーザーのパスワード
- SQL Query:データを取得するためのクエリ(例:SELECT * FROM Schemas)
- 「Include column headers」チェックボックスをオンにします。
- サーバー側でSSL/TLS を有効にしている場合は、「Use SSL/TLS」チェックボックスをオンにします。
- データモデルを構築する前に「Get data」をクリックしてGoogle Data Catalog データをプレビューします。
データモデルを構築
データを取得したら、「Model your data」チェックボックスを選択して「Continue」をクリックします。新しいウィンドウでデータモデルを構築します。
- 使用するすべてのカラムがモデルに含まれていることを確認します。
- モデルに名前を付けます。
- (オプション)Description を設定します。
- 「Header in row」を1に設定します。
- 「Exclude data before row」のトグルをクリックして値を2 に設定します。
- 「Save and Exit」をクリックします。
Metric を作成する
データがモデル化されたことで、ダッシュボードやレポートなどのKlipfolio プラットフォームで使用されるデータのMetric(またはビジュアライゼーション)を作成することができるようになりました。
- 「Create metrics」をクリックします。
- データソースを選択します。
- Metric の値とデフォルトの集計を選択します。
- セグメントを選択します。
- 日時を選択します。
- データのシェイプを選択します。
- 表示設定を構成します。
- Save をクリックします。
- Metric に移動し、ビジュアライゼーションをさらに設定します。
アプリケーションからGoogle Data Catalog データへのSQL アクセス
これで、リアルタイムGoogle Data Catalog データから作成されたMertic ができました。新しいダッシュボードに追加したり共有したりすることができます。これでGoogle Data Catalog を複製することなく、より多くのデータソースや新しいビジュアライゼーション、レポートを作成することができます。
アプリケーションから直接240+ SaaS 、ビッグデータ 、NoSQL ソースへのSQL データアクセスを取得するには、CData Connect Server を参照してください。