こんにちは。CData Software Japanリードエンジニアの杉本です。
今回はCDataSyncでCSVデータの取り込みを行う場合によく質問を頂く、S-JIS形式ファイルへの対応の方法について解説したいと思います。
www.cdata.com
対象のファイル
対象のファイルは内閣府の「国民の祝日について」でダウンロードできるCSVです。
国民の祝日について - 内閣府
以下のような感じで、ダブルクオーテーション無し、カンマ区切り、かつ日本語ラベル
エンコーディングがS-JIS形式のファイルでした。
通常通り接続した場合
これを素直にCDataSyncから接続してみましょう。
「接続」に移動して「データソース」の一覧から「CSV」を選択します。
URIにCSVファイルを配置したフォルダのパスを入力し、「接続テスト」をクリックしてみます。
すると、以下のようなエラーメッセージが表示されました。これはCSVファイルを解析する際に、S-JISフォーマットとして読み取りすることができず発生しているエラーになります。
解決方法
解消方法はAdvanced Tabにある、Other(Optional)に「charset=Shift-JIS」という設定を追加するだけです。
Otherの項目を設定後に改めて接続テストを実行すると、以下のように接続テストが成功します。
また、ジョブを作成してプレビューを実行してみると、ヘッダーと中の値、どちらも正常に取得できていることが確認できます。
おわりに
上記以外にもCDataSyncのCSV Connector は様々な機能をサポートしています。
例えば、Amazon S3のファイルを読み取ったり
www.cdatablog.jp
ZIP圧縮されているCSVファイルにも対応できます。
www.cdatablog.jp
気になることがあれば、お気軽にテクニカルサポートまで問い合わせしてみてください。
https://www.cdata.com/jp/support/submit.aspx
関連コンテンツ