各製品の資料を入手。
詳細はこちら →CData
こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。
SAS は、高度なアナリティクス、多変量解析、BI、データ管理、予測分析のためのソフトウェアです。SAS とCData ODBC Driver for MarkLogic を合わせて使うことで、SAS からリアルタイムMarkLogic のデータへデータベースライクにアクセスできるようになり、レポーティング、分析能力を向上できます。本記事では、SAS でMarkLogic のライブラリを作成し、リアルタイムMarkLogic に基づいたシンプルなレポートを作成します。
CData ODBC ドライバーは、ドライバーに組み込まれた最適化されたデータ処理により、SAS でリアルタイムMarkLogic のデータを送受信する場合に圧倒的なパフォーマンスを提供します。SAS からMarkLogic に複雑なSQL クエリを発行すると、ドライバーはフィルタや集計などのサポートされているSQL 操作をMarkLogic に直接プッシュし、組み込みSQL エンジンを利用して、サポートされていない操作(一般的にはSQL 関数とJOIN 操作)をクライアント側で処理します。組み込みの動的メタデータクエリを使用すると、SAS でMarkLogic を簡単にビジュアライズおよび分析できます。
CData ODBC ドライバは、以下のような特徴を持ったリアルタイムデータ連携ソリューションです。
CData ODBC ドライバでは、1.データソースとしてMarkLogic の接続を設定、2.SAS 側でODBC Driver との接続を設定、という2つのステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。
まずは、本記事右側のサイドバーからMarkLogic ODBC Driver の無償トライアルをダウンロード・インストールしてください。30日間無償で、製品版の全機能が使用できます。
以下は、MarkLogic に接続するための情報と、Windows およびLinux 環境でDSN を構成するためのステップです。
User、Password、および Server に、アカウントの認証情報と接続するサーバーのアドレスを設定します。また、REST Server Port を指定する必要があります。
DSN を構成する際に、Max Rows プロパティを定めることも可能です。これによって返される行数を制限するため、ビジュアライゼーション・レポートのデザイン時のパフォーマンスを向上させるのに役立ちます。
未指定の場合は、初めにODBC DSN(data source name)で接続プロパティを指定します。ドライバーのインストールの最後にアドミニストレーターが開きます。Microsoft ODBC Data Source Administrator を使用して、ODBC DSN を作成および構成できます。
Linux 環境にCData ODBC Driver for MarkLogic をインストールする場合、ドライバーのインストールによりシステムDSN が事前定義されます。システムデータソースファイル(/etc/odbc.ini) を編集し、必要な接続プロパティを定義することで、DSN を変更できます。
[CData MarkLogic Sys]
Driver = CData ODBC Driver for MarkLogic
Description = My Description
User = 'myusername'
Password = 'mypassword'
Server = 'http://marklogic'
これらの構成ファイルの使用に関する具体的な情報については、ヘルプドキュメントを参照してください。
CData ODBC Driver for MarkLogic に基づくライブラリを追加することで、SAS でMarkLogic に接続します。
SAS は、ローコードのポイントアンドクリッククエリツールを使用するか、PROC SQL とカスタムSQL クエリのプログラムを使うことで、データのクエリをネイティブにサポートします。SAS でビューを作成すると、ビューがクエリされるたびに定義クエリが実行されます。これは、レポート、チャート、分析について常にリアルタイムMarkLogic のデータにクエリを実行することを意味します。
proc sql; create view customer_view as select name, totaldue from odbclib.customer where Id = '1'; quit;
ローカルビューを作成すると、パワフルなSAS 機能を使用してMarkLogic のデータをレポート、ビジュアライズ、またはその他の方法で分析できます。PROC PRINT を使用して簡単なレポートを印刷し、PROC GCHART を使用してデータに基づいた基本的なグラフを作成しましょう。
proc print data=customer; title "MarkLogic Customer Data"; run;
proc gchart data=customer; pie name / sumvar=totaldue value=arrow percent=arrow noheading percent=inside plabel=(height=12pt) slice=inside value=none name='CustomerChart'; run;
このようにCData ODBC ドライバと併用することで、270を超えるSaaS、NoSQL データをコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。
CData ODBC ドライバは日本のユーザー向けに、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。