ノーコードでクラウド上のデータとの連携を実現。
詳細はこちら →CData
こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。
CData Cmdlets for Avro を使えば、PowerShell からAvro データ データにリアルタイムで連携できます。データ同期などのタスクの連携にぴったりの製品です。 本記事では、PowerShell からCData Cmdlets for Avro およびCData Cmdlets for MySQL を使って、同期スクリプトを作成して実行します。
まずは、PowerShell でAvro への接続を行います。レプリケーションは4つのステップがあります。
URI 接続プロパティをAvro ファイルの場所に設定して、ローカルのAvro ファイルに接続します。
モジュールのインストール:
Install-Module AvroCmdlets
Avro への接続:
$avro = Connect-Avro -URI $URI
取得ターゲットのリソースの取得:
$data = Select-Avro -Connection $avro -Table "SampleTable_1"
Invoke-Avro cmdlet を使って、SQL-92 クエリを使用することもできます:
$data = Invoke-Avro -Connection $avro -Query 'SELECT * FROM SampleTable_1 WHERE Column2 = @Column2' -Params @{'@Column2'='value_2'}
戻り値からカラム名のリストを保存します。
$columns = ($data | Get-Member -MemberType NoteProperty | Select-Object -Property Name).Name
カラム名を指定できるようにして、データをMySQL データベースにレプリケーションします。
モジュールのインストール:
Install-Module MySQLCmdlets
MySQL DB に、MySQL Server 名、ユーザー、パスワード、レプリケーション先のデータベース名を指定して、接続します:
$mysql = Connect-MySQL -User $User -Password $Password -Database $Database -Server $Server -Port $Port
Avro、保存された値、そしてAdd-MySQL Cmdlet を使って、MySQL にデータを1レコードずつ挿入します。この例では、MySQL 側のテーブルは、Avro のリソース(SampleTable_1)と同じテーブル名を持っている必要があります。
$data | % {
$row = $_
$values = @()
$columns | % {
$col = $_
$values += $row.$($col)
}
Add-MySQL -Connection $mysql -Table "SampleTable_1" -Columns $columns -Values $values
}
一度PowerShell でAvro とMySQL に接続したら、次からは1行のコマンドでレプリケーションを実施できます:
Select-Avro -Connection $avro -Table "SampleTable_1" | % {
$row = $_
$values = @()
$columns | % {
$col = $_
$values += $row.$($col)
}
Add-MySQL -Connection $mysql -Table "SampleTable_1" -Columns $columns -Values $values
}
別のPowerShell モジュールで、Avro を別のデータベースに複製する場合、Select-Avro cmdlet のデータから、カラム、接続およびテーブルを除外しておきましょう。これらのデータはデータ移動のときだけ必要となるためです。
$columns = ($data | Get-Member -MemberType NoteProperty | Select-Object -Property Name).Name | ? {$_ -NotIn @('Columns','Connection','Table')}
これで、Avro データをMySQL に複製できました。分析、BI などでAvro データをMySQL から使うことができるようになります。