H2O.ai Transformation Step（変換ステップ）

概要

Transformation Step（変換ステップ）は、H2Oクラウドインスタンスで作成されたデータサイエンスモデルをYellowfin内で使用し、予測などの結果を生成します。これは、データ変換モジュールのTransformation Step（変換ステップ）から実行されます。

前提条件

このStep（ステップ）を使用する前に、少なくともひとつのモデルが作成されているH2Oインスタンスへのアクセス権が付与されていることを確認してください。また、YellowfinへH2Oのプラグインをインストールしなくてはいけません。

こちらの項目を確認する前に、データ変換モジュールについて事前に理解をしておくのが理想的です。

サポートしているモデル

現在サポートするモデルのタイプは、以下の通りです。

- ディープラーニング
- 分散ランダムフォレスト
- 勾配ブースティングマシン
- 一般化された線形モデル
- 一般化された低ランクモデリング
- k平均法
- XGBoost（H2OがLinux上で起動している場合に利用可能）

一般的なワークフロー

こちらがプロセスの簡単な概要です。こちらの項目では、これらのStep（ステップ）の大部分について、詳細に説明します。

アクセス可能なH2Oインスタンスを準備するか、新しくセットアップをし、データサイエンスモデルを構築します。
YellowfinインスタンスへH2Oのプラグインをインストールします。（プラグインは、マーケットプレイスからダウンロードできます。）プラグインのインストール方法は、こちらを参照してください。
Yellowfinのデータ変換モジュールを使用して、Transformation Flow（データ変換フロー）を作成します。これには、モジュールへのデータのインポート、そして必要に応じたその他変換の適用が必要です。
フローにH2O Tranformation Step（変換ステップ）を使用し、これを設定します。ステップの設定方法は、以下の情報を参照してください。
Step（ステップ）を実行し、モデルがデータを使用して生成する出力を確認します。

Step（ステップ）の設定詳細

ページトップ

H2Oステップを設定するためには、有効なURLからH2Oのインスタンスへ接続し、データサイエンスモデルを選択しなくてはいけません。次に、モデルの入力フィールドを設定します。これは、データ変換フローからのデータとのマッピングにより行います。他のデータサイエンスモデル（PMMLなど）の出力の設定とは異なり、出力フィールドの設定をする必要はありません。生成される結果は、モデルの作成時に定義されます。

サポートしているモデルのカテゴリー

Yellowfinがサポートするモデルのタイプは、一般的に4つのカテゴリーに分類することができます。以下の一覧を参照してください。注意：モデルのカテゴリーを確認するには、H2O内のモデルの出力項目を参照してください。

以下は、各カテゴリーが生成するそれぞれの出力タイプです。

回帰：このカテゴリーに属するモデルは、データのすべてのロウ（行）について実際の予測値を生成します。

二項式：このタイプのモデルは、すべてのロウ（行）について予測されるクラスのテキストラベルを出力します。

多項式：（上記に準ずる）

クラスタリング：このようなモデルは、すべてのロウ（行）が属するクラスタのインデックス番号を示します。

モデルの出力の確認

多くの場合、ユーザーはモデルの出力を把握しています。しかし、H2Oのインスタンスからモデルを選択することで、出力を確認し、その設定を把握することができます。例えば、バイナリモデルの場合、出力はモデルのパラメーター内で確認することができます。

モデルの出力のデータ型

出力カラム（列）のデータ型は、モデル内の設定により異なります。「クラスタリング」と「回帰」カテゴリーに属するモデルの場合、これは「数値型」になります。他のカテゴリー場合は、「テキスト型」になります。

YellowfinでのH2O.aiの使用

パート1：H2O.aiのセットアップ

H2Oは、予測モデルを使用することのできる、モダンオープンソースAIプラットフォームです。最新バージョンのH2Oは、こちらからダウンロードすることができます。

H2Oは、ローカル端末上で使用することもできますし、URLを通してアクセス可能な公的なスペースで使用することもできます。

H2Oをローカル端末上で実行するには、以下の手順に従います。

H2O.aiをダウンロードします。

ディレクトリへファイルを解凍します。

ターミナル（Appleターミナル、またはMSDOS）を開き、取得されたフォルダへ移動します。

「」からjarを実行します。これにより、H2O.aiサーバーが起動します。

デフォルトでは、H2O.aiサーバーは「」で実行されます（適切にセットアップされた場合）。注意：H2OインスタンスのURLや、その他設定をカスタマイズすることができます。

H2O URL

H2Oインスタンスへの接続を確立するためには、インスタンスのURLが必要です。ローカル端末に設定されている場合、これはデフォルト設定（）、またはローカルセットアップでも、リモートアクセス（リモートアクセスをする場合は、安定したインターネット接続が必要です）においてもIPアドレスを含む設定（）になります。

注意：適切に認識されるために、URLの一部に「http://」を含める必要があります。不適切なURLが提供された場合、変換ステップは機能しません。

パート2：変換フローでのH2Oモデルの使用

こちらの項目は、H2O変換ステップを使用して、Yellowfinへデータサイエンスモデルを統合する方法について説明します。

H2Oでモデルを構築し、これを保存します。

Yellowfinデータ変換モジュールへ移動します。（「作成」ボタン＞「データ変換フロー」）

データを取得する入力ステップから、データ変換フローの作成を始めます。（基礎的なフローの作成方法は、こちらを参照してください。また、他のデータの取得方法については、こちらを参照してください）

取得されたデータが、データプレビューパネルに表示されます。さらにデータを変換するために、ステップを追加することもできます。

H2Oインスタンスからデータサイエンスモデルを使用する準備が整ったら、以下の手順に従います。

変換ステップ一覧から、H2Oモデル予測ステップをキャンバスへドラッグします。（注意：こちらのステップが表示されない場合は、H2Oのプラグインがインストールされているかを確認してください）

接続ポイントを使用して、最後のステップをH2O変換ステップへ接続します。

次に、H2Oステップを設定します。（設定画面が表示されるように選択されていることを確認してください）

H2Oインスタンスへのパスをコピーします。（注意：IPアドレスとポート番号が必要です。例えば、今回の例では、下図を参考に、となります。

H2Oへ接続をクリックします。

注意：提供されたURLが不適切な場合や、実行注のH2Oインスタンスが見つからない場合は、以下のようにエラーメッセージが表示されます。

H2Oインスタンスへの接続に成功したら、リンクしているH2Oインスタンス上のすべてのモデルの一覧とともに新しい項目が表示されます。（注意：接続ボタンを使用すると、ステップ設定パンるに変更が表示されるまでに時間がかかる場合があります）

使用するモデルを選択します。

次に、入力ステップをマッピングするために、さらなる設定オプションが表示されます。これらはモデルに固有のものです。

データをモデルに必要な入力カラム（列）をマッピングします。例えば、今回の例では、年齢、収入、性別が必要です。

保存ボタンをクリックします。

ステップの実行に成功すると、データプレビューパネルに、「H2Oモデル結果」、という新しいカラム（列）が、モデル出力とともに表示されます。こちらに表示される結果は、モデルのタイプに応じて異なります。

さらなる変換を行うこともできますし、結果をデータベースへ保存することもできます。

H2O

ページトップ

Content

Space Tools

概要

前提条件

サポートしているモデル

一般的なワークフロー

Step（ステップ）の設定詳細