ノーコードでクラウド上のデータとの連携を実現。
詳細はこちら →CData
こんにちは!ウェブ担当の加藤です。マーケ関連のデータ分析や整備もやっています。
Pure R スクリプトおよび 標準SQL を使って、R およびJava をインストール可能なあらゆるマシン上でYahoo! JAPAN DATA SOLUTION にアクセス。CData JDBC Driver for YahooDS とRJDBC package を使って、R でリモートYahoo! JAPAN DATA SOLUTION データ を利用できます。CData Driver を使うことで、業界が認めた基準で書かれたドライバーを活用して、オープンソースでポピュラーなR 言語のデータにアクセスできます。この記事では、ドライバーを使ってYahoo! JAPAN DATA SOLUTION にSQL クエリを実行する方法、および標準R 関数を呼び出してYahoo! JAPAN DATA SOLUTION をビジュアライズする方法について説明します。
マルチスレッドのMicrosoft R Open を実行すること、またはBLAS/LAPACK ライブラリにリンクされたオープン R を実行することによって、マルチスレッドおよびマネージドコードから利益を得られたドライバーのパフォーマンスにマッチできます。ここでは、Microsoft R Open 3.2.3 を使用します。CRAN レポジトリのJan. 1, 2016 snapshot からパッケージをインストールするために事前設定されています。このsnapshot は再現性を保証します。
ドライバーを使うにはRJDBC パッケージをダウンロードします。RJDBC パッケージをインストールしたら、次のコードを入力してパッケージをロードします。
library(RJDBC)
下記の情報を使いYahoo! JAPAN DATA SOLUTION にJDBC データソースとして接続します。
dbConnect やdbSendQuery のようなDBI 関数は、R にデータアクセスコードを書くための統一インターフェースを提供します。
driver <- JDBC(driverClass = "cdata.jdbc.yahoods.YahooDSDriver", classPath = "MyInstallationDir\lib\cdata.jdbc.yahoods.jar", identifier.quote = "'")
これで、DBI 関数を使ってYahoo! JAPAN DATA SOLUTION に接続しSQL クエリを実行する準備が整いました。dbConnect 関数を使ってJDBC 接続を初期化します。一般的なJDBC 接続文字列は次のとおりです。
conn <- dbConnect(driver,"AppID=12345678-1234-1234-1234-123456789012;")
認証するには、次のプロパティを指定する必要があります。
ドライバーはYahoo! JAPAN DATA SOLUTION API をリレーショナルデータベース、ビュー、ストアドプロシージャとしてモデルします。次のコードを使ってテーブルリストを検出します。
dbListTables(conn)
dbGetQuery 関数を使ってYahoo! JAPAN DATA SOLUTION API がサポートするすべてのSQL クエリを実行できます:
searchranking <- dbGetQuery(conn,"SELECT Rank, Volume FROM SearchRanking WHERE SearchKeyword = 'yahoo'")
次のコマンドを使って、結果を[data viewer]ウィンドウで見ることができます。
View(searchranking)
CRAN レポジトリで利用可能なあらゆるデータ初期化パッケージを使ってYahoo! JAPAN DATA SOLUTION を分析する準備が整いました。ビルトインバーのplot 関数を使って簡単なバーを作成できます。
par(las=2,ps=10,mar=c(5,15,4,2)) barplot(searchranking$Volume, main="Yahoo! JAPAN DATA SOLUTION SearchRanking", names.arg = searchranking$Rank, horiz=TRUE)