こんにちは。CData Software Japan リードエンジニアの杉本です。
以前以下の記事でも紹介したように、CData CSV Driver では様々なクラウドストレージのCSVファイルを読み取ることができるようになっています。
www.cdatablog.jp
www.cdata.com
ただ、設定するためのプロパティが数多くあるので、このサービスに接続する時は、どのプロパティを設定する必要があるの?という質問をよくいただきます。
というわけで、今回はGCPで提供されているGoogle Cloud Storage上のCSVファイルにアクセスする方法を紹介したいと思います。
cloud.google.com
対象のCSVファイル
今回接続するGoogle Cloud Storageのファイルは以下のような構成になっています。
「cdatajp-support」というプロジェクトで「cdatadrivers」バケット配下の「CSV」というフォルダにそれぞれ配置しています。
CData CSV Driver からの接続
CData CSV Driverは様々なテクノロジーラインナップがありますが、今回はPower BIやTableauからの接続で利用しやすい CData CSV ODBC Driverを利用しました。他のテクノロジー・JDBCやADO.NET、もしくはCData Syncでも接続方法は変わりません。
www.cdata.com
インストール完了後、接続設定のためのDSN構成画面が立ち上がるので、以下のように必要なプロパティを設定します。
ポイントはURIでGoogle Cloud Storageのバケット・フォルダパスを「gs://{バケット名}/{フォルダパス
}」で指定します。今回は「cdatadrivers」バケットの「CSV」フォルダを指定するので「gs://cdatadrivers/CSV 」となります。
プロパティ名 |
値 |
備考 |
Auth Scheme |
OAuth |
OAuth で認証・認可を行います。 |
URI |
例)gs://cdatadrivers/CSV |
Google Cloud Storageのバケット・フォルダパスをgs://に続いて指定します。 |
Project Id |
例)cdatajp-support |
Google Cloud Storageの対象Project Idを指定します。 |
Initiate OAuth |
GETANDREFRESH |
Tokenのリフレッシュ方式を指定します。 |
OAuth Version |
2.0 |
OAuthのバージョンを指定します。 |
入力が完了したら「接続のテスト」をクリックしましょう。ブラウザが立ち上がり、任意のアカウントでログインすると、以下のようにアクセス許可を求める画面が表示されます。
これを確認の上、アクセス許可を行います。
接続許可を完了した後、以下のようにODBC DSNの接続完了メッセージが表示されればOKです。
接続後以下のようにテーブルタブで接続されたCSVファイルのテーブル・カラム構成が確認できます。
あとは任意のツールからGoogle Cloud StorageのCSVデータにアクセスできます。
例えばPower BIであればODBCの接続を選択し
接続設定が完了しているDSNを選択するだけでOKです。
あとはそれぞれのCSVファイルにアクセスが可能です。
おわりに
ちなみに今回はそれぞれのCSVファイルをそれぞれ独立したデータとしてアクセスしましたが、同じフォーマットのCSVファイルが1つのディレクトリにまとまっている場合は、集計クエリ機能も利用できます。
www.cdatablog.jp
他にもCSV Driverは様々な機能が内包されていますので、こういったユースケースには対応できるの?といった質問があれば、お気軽にテクニカルサポートまでお問い合わせください。
https://www.cdata.com/jp/support/submit.aspx
関連コンテンツ