製品をチェック

製品の詳細・30日間の無償トライアルはこちら

CData Sync

複数のRedshift アカウントのレプリケーション

Redshift の複数のアカウントを一つ、もしくは複数のデータベースに同期。

宮本航太
プロダクトスペシャリスト

最終更新日:2022-11-28

こんにちは!プロダクトスペシャリストの宮本です。

CData Sync は、いろいろなシナリオのデータレプリケーション(同期)を行うことができるスタンドアロンのアプリケーションです。例えば、sandbox および本番インスタンスのデータをデータベースに同期することができます。CData Sync のウェブインターフェースは複数のRedshift コネクションを簡単に管理できます。本記事では、複数のRedshift アカウントを一つのデータベースに同期する方法を説明します。

レプリケーションの同期先を設定

CData Sync では、Redshift データ を何台のデータベースにでも複製できます。データベースはクラウドおよびオンプレミスの双方に対応しています。レプリケーションの同期先の設定には、[接続]タブから行います。

  1. [同期先]タブを選択します。
  2. 同期先のアイコンをクリックします。本記事では、SQLite を使います。
  3. 必要な接続プロパティを入力します。Redshift をSQLite に複製するには、データソースボックスにファイルパスを指定します。
  4. [接続のテスト]をクリックして、正しく接続できているかをテストします。 同期先接続の設定(SQLite の例)
  5. [変更を保存]をクリックします。

Redshift 接続の設定

データソース側にRedshift を設定します。[接続]タブをクリックします。

  1. [接続の追加]セクションで[データソース]タブを選択します。
  2. Redshift アイコンをデータソースとして選択します。プリインストールされたソースにRedshift がない場合には、追加データソースとしてダウンロードします。
  3. 接続プロパティに入力をします。

    Redshift への接続には次を設定します:

    • Server: 接続するデータベースをホストしているクラスタのホスト名およびIP アドレス。
    • Port: クラスタのポート。
    • Database: データベース名、ブランクの場合ユーザーのデフォルトデータベースになります。
    • User: ユーザー名。
    • Password: ユーザーのパスワード。

    Server およびPort の値はAWS の管理コンソールで取得可能です:

    1. Amazon Redshift console (http://console.aws.amazon.com/redshift) を開く。
    2. Clusters ページで、クラスタ名をクリック。
    3. クラスタのConfiguration タブで、表示された接続文字列からクラスタのURL をコピーします。 データソースセクションの設定(Salesforce 画面を例示)。
    4. [接続のテスト]をクリックして、正しく接続できているかをテストします。
    5. [変更を保存]をクリックします。

    それぞれのRedshift インスタンスのレプリケーションクエリの設定

    Data Sync はレプリケーションをコントロールするSQL クエリを簡単なGUI 操作で設定できます。 レプリケーションジョブ設定には、[ジョブ]タブに進み、[ジョブを追加]ボタンをクリックします。 次にデータソースおよび同期先をそれぞれドロップダウンから選択します。 レプリケーションジョブのソースおよび同期先を選択。

    テーブル全体をレプリケーションする

    テーブル全体をレプリケーションするには、[テーブル]セクションで[テーブルを追加]をクリックします。表示されたテーブルリストからレプリケーションするテーブルをチェックします。.

    レプリケーションするテーブルの選択(画像はSalesforce の例)。

    テーブルをカスタマイズしてレプリケーションする

    SQL クエリを使って、レプリケーションをカスタマイズできます。REPLICATE 構文はデータベースのテーブルにデータをキャッシュし、保存するハイレベルコマンドです。Redshift API がサポートするSELECT クエリを定義することができます。レプリケーションのカスタマイズにはテーブルセクションで[カスタムクエリの追加]をクリックして、クエリステートメントを記述します。

    レプリケーションのカスタマイズ設定。

    Redshift データ のテーブルを差分更新でキャッシュするステートメントは次のとおり:

    REPLICATE Orders;

    使用するレプリケーションクエリを含むファイルを指定することで特定のデータベースを更新することが可能です。レプリケーションステートメントをセミコロンで区切ります。次のオプションは一つのデータベースに複数のRedshift アカウントのデータを同期する例です:

    • REPLICATE SELECT ステートメントで異なるtable prefix を使用する:

      REPLICATE PROD_Orders SELECT * FROM Orders;
    • 別の方法として、異なるスキーマを使うことも可能です:

      REPLICATE PROD.Orders SELECT * FROM Orders;

    レプリケーションのスケジュール起動

    [スケジュール]セクションでは、レプリケーションジョブの自動起動スケジュール設定が可能です。反復同期間隔は、15分おきから毎月1回までの間で設定が可能です。

    レプリケーションの自動起動スケジューリング。

    レプリケーションジョブを設定したら、[変更を保存]します。このように複数のRedshift アカウントのデータを複製するジョブを作成することができました。

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。