CDataSync のデータソースとして S-JIS形式の CSV ファイルを読み取る方法

by 杉本和也 | 2021年05月21日

f:id:sugimomoto:20210521162321p:plain

こんにちは。CData Software Japanリードエンジニアの杉本です。

今回はCDataSyncでCSVデータの取り込みを行う場合によく質問を頂く、S-JIS形式ファイルへの対応の方法について解説したいと思います。

www.cdata.com

対象のファイル

対象のファイルは内閣府の「国民の祝日について」でダウンロードできるCSVです。

国民の祝日について - 内閣府

以下のような感じで、ダブルクオーテーション無し、カンマ区切り、かつ日本語ラベル

エンコーディングがS-JIS形式のファイルでした。

f:id:sugimomoto:20190107143229p:plain

通常通り接続した場合

これを素直にCDataSyncから接続してみましょう。

「接続」に移動して「データソース」の一覧から「CSV」を選択します。

f:id:sugimomoto:20210521162035p:plain

URIにCSVファイルを配置したフォルダのパスを入力し、「接続テスト」をクリックしてみます。

f:id:sugimomoto:20210521162043p:plain

すると、以下のようなエラーメッセージが表示されました。これはCSVファイルを解析する際に、S-JISフォーマットとして読み取りすることができず発生しているエラーになります。

f:id:sugimomoto:20210521162052p:plain

解決方法

解消方法はAdvanced Tabにある、Other(Optional)に「charset=Shift-JIS」という設定を追加するだけです。

f:id:sugimomoto:20210521162100p:plain

Otherの項目を設定後に改めて接続テストを実行すると、以下のように接続テストが成功します。

f:id:sugimomoto:20210521162110p:plain

また、ジョブを作成してプレビューを実行してみると、ヘッダーと中の値、どちらも正常に取得できていることが確認できます。

f:id:sugimomoto:20210521162118p:plain

おわりに

上記以外にもCDataSyncのCSV Connector は様々な機能をサポートしています。

例えば、Amazon S3のファイルを読み取ったり

www.cdatablog.jp

ZIP圧縮されているCSVファイルにも対応できます。

www.cdatablog.jp

気になることがあれば、お気軽にテクニカルサポートまで問い合わせしてみてください。

https://www.cdata.com/jp/support/submit.aspx

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。