製品をチェック

製品の詳細・30日間の無償トライアルはこちら

CData Sync

Redshift のデータを複数のデータベースにレプリケーション。

Redshift をPoint-and-click 操作で複数の異なるデータベースに同期する方法。

宮本航太
プロダクトスペシャリスト

最終更新日:2022-11-28

こんにちは!プロダクトスペシャリストの宮本です。

常時起動のアプリケーションは、自動フェイルオーバー機能およびリアルタイムなデータアクセスを必要とします。CData Sync は、リアルタイムRedshift のデータをミラーリングデータベース、上記稼働のクラウドデータベース、レポーティングサーバーなどのほかのデータベースに連携し、Windows からリモートRedshift に接続し、自動的に同期を取ります。

レプリケーションの同期先の設定

CData Sync を使って、Redshift をクラウド・オンプレにかかわらず複数のデータベースレプリケーションします。レプリケーションの同期先を追加するには、[接続]タブを開きます。

それぞれのデータベース向けに以下を行います:

  1. [同期先]タブをクリックします。
  2. 同期先を選択します。この記事では、SQLite を使います。 同期先の接続設定。
  3. 必要な接続プロパティを入力します。SQLite データベースにRedshift をレプリケートするためにDataSource ボックスにファイルパスを入力します。
  4. [接続のテスト]をクリックして、正しく接続できているかをテストします。
  5. 同期先の接続設定 (SQLite is shown)。
  6. [変更を保存]をクリックします。

Redshift 接続の設定

データソース側にRedshift を設定します。[接続]タブをクリックします。

  1. [同期先]タブをクリックします。
  2. Redshift アイコンをデータソースとして選択します。プリインストールされたソースにRedshift がない場合には、追加データソースとしてダウンロードします。
  3. 接続プロパティに入力をします。

    Redshift への接続には次を設定します:

    • Server: 接続するデータベースをホストしているクラスタのホスト名およびIP アドレス。
    • Port: クラスタのポート。
    • Database: データベース名、ブランクの場合ユーザーのデフォルトデータベースになります。
    • User: ユーザー名。
    • Password: ユーザーのパスワード。

    Server およびPort の値はAWS の管理コンソールで取得可能です:

    1. Amazon Redshift console (http://console.aws.amazon.com/redshift) を開く。
    2. Clusters ページで、クラスタ名をクリック。
    3. クラスタのConfiguration タブで、表示された接続文字列からクラスタのURL をコピーします。 データソースの接続設定(Salesforce is shown)。
    4. [接続のテスト]をクリックして、正しく接続できているかをテストします。
    5. [変更を保存]をクリックします。

    レプリケーションを実行するクエリの設定

    CData Sync はレプリケーションをコントロールするSQL クエリを簡単なGUI 操作で設定できます。レプリケーションジョブ設定には、[ジョブ]タブに進み、[ジョブを追加]ボタンをクリックします。 次にデータソースおよび同期先をそれぞれドロップダウンから選択します。

    レプリケーションジョブのデータソースと同期先を選択。

    テーブル全体をレプリケーションする

    テーブル全体をレプリケーションするには、[テーブル]セクションで[テーブルを追加]をクリックします。表示されたテーブルリストからレプリケーションするテーブルをチェックします。

    同期するテーブルを選択 (Salesforce is shown)。

    テーブルをカスタマイズしてレプリケーションする

    SQL クエリを使って、レプリケーションをカスタマイズすることができます。REPLICATE ステートメントは、データベースにテーブルをキャッシュして、保持するハイレベルなコマンドです。Redshift API でサポートされているSELECT クエリを使うことができます。レプリケーションのカスタマイズには、[カスタムクエリを追加]をクリックして、カスタムクエリステートメントを定義します。

    カスタムレプリケーション用のクエリを定義。

    次のステートメントは、Redshift のテーブルのアップデートを差分更新でキャッシュします:

    REPLICATE Orders;

    特定のデータベースを更新するために、レプリケーションクエリを含むファイルを指定することもできます。レプリケーションクエリをセミコロンで区切ります。複数のRedshift アカウントを同じデータベースに同期しようとする際には、以下のオプションが便利です:

    • REPLICATE SELECT ステートメントで別のprefix を使う:

      REPLICATE PROD_Orders SELECT * FROM Orders;
    • 別の方法では、別のスキーマを使う:

      REPLICATE PROD.Orders SELECT * FROM Orders;

    レプリケーションのスケジュール起動設定

    [スケジュール]セクションでは、レプリケーションジョブの自動起動スケジュール設定が可能です。反復同期間隔は、15分おきから毎月1回までの間で設定が可能です。

    ジョブのスケジュール起動設定。

    レプリケーションジョブを設定したら、[変更を保存]ボタンを押して保存します。Redshift のオンプレミス、クラウドなどのデータベースへのレプリケーションジョブは一つではなく複数を作成することが可能です。

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。