ノーコードでクラウド上のデータとの連携を実現。
詳細はこちら →こんにちは!プロダクトスペシャリストの宮本です。
CData Sync for HDFS は、データベースにサンドボックスや製品インスタンスをレプリケートするなどの、レプリケーションの多様なシナリオに対する解決策を提供するスタンドアロンアプリケーションです。Sync for Windows およびSync for Java はどちらもコマンドラインインターフェース(CLI)を含んでおり、複数のHDFS 接続を簡単に管理できます。この記事では、CLI を使って複数のHDFS アカウントをレプリケートする方法について説明します。
接続およびE メール通知設定をXML 設定ファイルに保存できます。複数のHDFS アカウントをレプリケートするには、複数の設定ファイルを使います。以下にHDFS をSQLite にレプリケートする設定例を示します。
<?xml version="1.0" encoding="UTF-8" ?>
<CDataSync>
<DatabaseType>SQLite</DatabaseType>
<DatabaseProvider>System.Data.SQLite</DatabaseProvider>
<ConnectionString>Host=sandbox-hdp.hortonworks.com;Port=50070;Path=/user/root;User=root;</ConnectionString>
<ReplicateAll>False</ReplicateAll>
<NotificationUserName></NotificationUserName>
<DatabaseConnectionString>Data Source=C:\my.db</DatabaseConnectionString>
<TaskSchedulerStartTime>09:51</TaskSchedulerStartTime>
<TaskSchedulerInterval>Never</TaskSchedulerInterval>
</CDataSync>
<?xml version="1.0" encoding="UTF-8" ?>
<CDataSync>
<DatabaseType>SQLite</DatabaseType>
<DatabaseProvider>org.sqlite.JDBC</DatabaseProvider>
<ConnectionString>Host=sandbox-hdp.hortonworks.com;Port=50070;Path=/user/root;User=root;</ConnectionString>
<ReplicateAll>False</ReplicateAll>
<NotificationUserName></NotificationUserName>
<DatabaseConnectionString>Data Source=C:\my.db</DatabaseConnectionString>
</CDataSync>
HDFS への認証には、次の接続プロパティを設定します。
Sync を使うと標準SQL でレプリケーションを制御できます。REPLICATE ステートメントはハイレベルなコマンドで、データベースにテーブルをキャッシュして維持します。HDFS API がサポートするあらゆるSELECT クエリを定義できます。下記のステートメントは、HDFS データ のテーブルをキャッシュしてインクリメンタルに更新します。
REPLICATE Files;
特定のデータベースを更新するために使用するレプリケーションクエリを含むファイルを指定することができます。レプリケーションステートメントはセミコロンで区切ります。次のオプションは、複数のHDFS アカウントを同じデータベースにレプリケートする場合に便利です。
REPLICATE SELECT ステートメントでは、異なるテーブルのプレフィックスを使用できます。
REPLICATE PROD_Files SELECT * FROM Files
異なるスキーマを使用することもできます。
REPLICATE PROD.Files SELECT * FROM Files
接続文字列およびレプリケーションクエリの設定が完了したら、次のコマンドラインオプションを使ってSync を実行できます。
HDFSSync.exe -g MyProductionHDFSConfig.xml -f MyProductionHDFSSync.sql
java -Xbootclasspath/p:c:\sqlitejdbc.jar -jar HDFSSync.jar -g MyProductionHDFSConfig.xml -f MyProductionHDFSSync.sql