30日間の無料評価版をお試しいただけます。

You are viewing an old version of this page. View the current version.

Compare with Current View Page History

« Previous Version 4 Next »

 

概要

個数やCount Distinct、合計や平均などの関数を適用することで、データをサマリー形式へ変換します。これは、統計分析に最適です。

これは、データ変換モジュールの「集計」ステップを使用して実行します。注意:これはビルトインステップのため、デフォルトでトランスフォーメーション一覧から利用することができます。

 

集計のタイプ

以下の表は、データのトランスフォーメーションに使用する、様々なタイプの集計を示しています。

集計のタイプ利用できるデータ型説明
なしテキスト、数値フィールドに集計を適用しません。このようなフィールドは、グループ化に使用されます。
外すテキスト、数値フィールドを排除します。
個数テキスト、数値フィールド内のすべての値をカウントします。
Count distinctテキスト、数値フィールド内のすべてのユニーク値をカウントします。
最大数値フィールドの最大値を返します。
最小数値フィールドの最小値を返します。
合計数値フィールド内のすべての値を合計します。
平均数値フィールド内のすべての値を平均します。

 

 

ステップの設定

集計ステップを設定するには、以下の手順に従います。

  1. トランスフォーメーションを実行するデータを含むインプットステップを、最低でもひとつ準備します。フローに集計ステップを追加する準備ができたら、以下の手順に従います。
  2. 変換フロービルダーの画面左側からトランスフォーメーションステップボタンをクリックして、すべてのステップを表示します。
  3. トランスフォーメーションステップ一覧から「集計」オプションをキャンバスへドラッグします。



  4. フロー内のこれより前にあるステップと接続します。

  5. 設定パネルを使用して、各データフィールドに適用する集計のタイプを選択します。

     

    各集計タイプについての詳細は、上記のを参照してください。





     

  6. 設定が完了したら、「適用」ボタンをクリックします。データプレビューパネルに、集計が適用された結果が表示されます。

 

 

集計ステップを利用した例

こちらの例では、

データを集約するシンプルなTransformation Flow(データ変換フロー)の作成方法について紹介します。こちらのフローでは、Input Step(入力ステップ)の設定、Aggregate transformation Step(集約データ変換ステップ)の適用、データベースへのデータの保存、について説明します。フローには、さらに多くのStep(ステップ)を含めることが可能です。

 

  1. 右上隅にある「作成」ボタンをクリックします。
  2. Transformation Flow(データ変換フロー)」を選択します。

    こちらのオプションが表示されない場合は、Transformation Flow(データ変換フロー)へのセキュリティアクセス権が付与されていない可能性があります。アクセス権取得について詳細な情報は、こちらを参照してください。


  3. Transformation Flow(データ変換フロー)ビルダーへ移動します。
  4. 画面左側にある「Input Step(入力ステップ)」ボタンへマウスオーバーします。Input Step(入力ステップ)パネルが現れ、すべてのデータ取得Step(ステップ)が表示されます。



  5. Step(ステップ)のひとつをキャンバスへドラッグします(今回の手順では、Report Step(レポートステップ)を例として説明します。他のInput Step(入力ステップ)について、詳細な情報は、こちらを参照してください)。
  6. Step(ステップ)をドラッグすると、ポップアップが表示され、フローで使用するレポートを選択することができます。



  7. レポート名を入力して必要なレポートを選択し、カラム(列)が表示されたら、「Add Report(レポート追加)」をクリックします。



  8. Transformation Flow(データ変換フロー)パネルにレポートフィールドが表示され、設定をすることができます。
  9. Configure(設定)タブで、データを取得するフィールドのみを選択します。



  10. Step(ステップ)名の変更や、説明の追加など、さらなる変更を加えることができます。
  11. 設定が完了したら、「Apply(適用)」ボタンをクリックします。

    設定内容を保存するためには、「Apply(適用)」ボタンをクリックしなくてはいけません。こちらをクリックする前に、別の場所をクリックすると、設定した内容は失われます。

  12. データプレビューパネルには、設定したデータソースから取得されたデータが表示されます。



  13. データプレビューパネルから直接フィールドに変換を適用することもできます。詳細は、こちら参照してください。
  14. Step(ステップ)設定パネルには新しくField(フィールド)タブが表示されます。こちらのタブは、Step(ステップ)から取得されたデータフィールドを管理するために使用します。



  15. Transformation Flow(データ変換フロー)に他のStep(ステップ)を追加することもできます。
  16. データの集約準備が整ったら、以下のステップに従います。
  17. Step(ステップ)ビルダーのTransformation Step(変換ステップ)アイコンにマウスオーバーをすることで、Transformation Step(変換ステップ)パネルを展開し、Aggregate Step(集約ステップ)をキャンバスへドラッグします。



  18. 次に、Input Step(入力ステップ)(他のStep(ステップ)を追加している場合は、その前のStep(ステップ))とAggregate Step(集約ステップ)を接続します。Step(ステップ)にマウスオーバーし、接続点をAggregate Step(集約ステップ)へドラッグします。



  19. Aggregate Step(集約ステップ)アイコンをクリックして、設定を行います。Transformation Flow(データ変換フロー)パネルには、以前のStep(ステップ)からの各フィールドが表示されます。



  20. 各フィールドに設定する集約の機能を選択します。

    Aggregate(集約)のタイプ利用できるデータタイプ説明
    None(なし)テキスト、数値フィールドに集約を適用しません。このようなフィールドは、グループ化に使用されます。
    Remove(外す)テキスト、数値フィールドを排除します。
    Count(個数)テキスト、数値フィールド内のすべての値をカウントします。
    Count distinctテキスト、数値フィールド内のすべてのユニーク値をカウントします。
    Max(最大)数値フィールドの最大値を返します。
    Min(最小)数値フィールドの最小値を返します。
    Sum(合計)数値フィールド内のすべての値を合計します。
    Average(平均)数値フィールド内のすべての値を平均します。


  21. Apply(適用)」をクリックします。変換されたデータが、データプレビューパネルに表示されます。



  22. さらにTransformation Step(変換ステップ)を追加することで、データの変換を継続することができます。
  23. 書き込み可能なデータベースへデータを保存する準備が整ったら、以下のステップに従います。
  24. アイコンにマウスオーバーをし、「Output Step(出力ステップ)」パネルを展開して、「SQL Database Output Step(SQLデータベース出力ステップ)」をキャンバスへドラッグします。



  25. 次に、Aggregate Step(集約ステップ)(または、フロー内のその前のStep(ステップ))とOutput Step(出力ステップ)を接続します。
  26. 画面右側のパネルから、Output Step(出力ステップ)の設定をします。こちらのStep(ステップ)の設定について詳細な情報は、こちらを参照してください。
    注意:デフォルトでは、Output Step(出力ステップ)は赤色に強調して表示されることで、エラーが発生していることを示します。これはつまり、設定が完了していないことを意味します。



  27. 上部のヘッダーメニューにある「実行」ボタンをクリックすることで、ドラフト(編集中)のFlow(フロー)を実行することができます。



  28. または、Flow(フロー)を完全実行するために保存します。「Publish(公開)」ボタンをクリックしてください。



  29. 表示されるポップアップに、名前や適切なアクセス権などの詳細情報を入力します。



  30. Save(保存)」ボタンをクリックします。

 

  • No labels