こちらのプロセスには、シグナルの解析ジョブの設定が含まれます。これらの構成は、ビジネスの性質や利用可能なデータ、ユーザーの好みに応じて異なります。ここでの最終的な目標は、最も関連性の高い正確な数のインサイトが、最も適切なユーザーに、可能な限り素早く、確実に提供されるようにすることです。
シグナルの解析構成は、設定を最適化するため、または基礎となるデータの変更に合わせて、時間経過とともに調整が必要になる場合もあります。 |
シグナルの構成は、ビューレベルで行います。Yellowfinは、こちらで提供した設定詳細に基づき、解析を実行します。これには、以下の手順が含まれます。
自動シグナル解析スケジュールを設定するには、以下の手順に従います。
以下の手順を実施するには、「シグナル設定権」ロール機能が必要です。シグナルのロール機能について、より詳細な情報は、こちらの項目を参照してください。 |
「タイムスケジュール」ステップでは、システムに解析を実行させる期間と、その実行頻度を設定します。以下は、各設定についての説明です。(注意:解析方法に応じて、項目とその目的は異なります。)
項目 | 解析方法 | 説明 | 例 |
日付フィールド | すべて | シグナルの解析は、システムに解析される日付フィールドを必ず含まなくてはいけません。これは、時系列形式である必要があります。 日付フィールドは任意の粒度(単位)を選択できます。 | |
粒度 | 外れ値の検出 傾向の変化 | 解析に使用する時系列データの粒度(例:日単位)を指定します。 この値は、選択した日付フィールドの粒度よりも細かくしてはいけません。 | 例えば、日付フィールドに日を設定した場合、粒度には日、またはそれ以上の値(月、四半期など)を選択しなくてはいけません。 |
期間の比較 | 期間の比較では設定が不要なため、粒度はデフォルトで、日付フィールドに選択した期間と同様の設定になります。 | ||
期間の設定 | すべて | ここでの選択に応じて、次に選択する期間のフィールドが変更されます。選択肢は以下の通りです。 基本的な比較:期間選択に基礎的なオプションを提供します。 高度な比較:期間設定に高度なオプションである、データサイズとオフセットを提供します。 静的な日付範囲:特定の範囲を選択します。これは、1回だけシグナルの解析を実行する場合に便利です。 注意:外れ値の解析では、ひとつの期間のみを指定します。 | |
スケジュール | すべて | 解析ジョブを実行する時期や頻度を設定します。 注意:頻度を週次以上にする場合、高度な設定を使用して、より詳細な設定をします。 | 例えば、毎週月曜正午に、自動的に解析が実行されるようにスケジュールを設定できます。 |
基本的な比較フィールド | |||
解析対象の周期(直近の期間の解析) | すべて | データを解析する主要な期間を指定します。 | 「月」を選択した場合は、(現在の日付から戻る)前月が解析されます。 |
比較対象の周期(直近と同じ期間の比較) | 期間の比較 傾向の変化 | データを解析する二番目の期間を指定します。これは、上記で指定した主要な対象期間と比較されます。 | 上記の例に基づくと、このフィールドに「四半期」を選択した場合、前月は前四半期の同じ月と比較し、解析されます。(そのため、第3月は、前四半期の第3月と比較されます。) |
高度な比較フィールド | |||
データサイズ | すべて | この高度な設定は、解析される期間の長さを指定します。 2つの期間が解析される、期間の比較と傾向の変化では、両方の期間が同じ長さに設定されます。 | 3ヶ月を設定した場合、直近の3ヶ月から外れ値の検出が解析されます。または、直近の3ヶ月をその前の3ヶ月と比較することで、期間の比較と傾向の変化を解析します。 |
オフセット | 期間の比較 | この高度な項目を使用して、2つの期間の間の間隔を指定します。 指定する間隔は、前の期間の最後から、現在の期間の最初までです。オフセットをゼロに設定すると、2つの期間は連続した期間になります。 | データサイズに3ヶ月(2018年1月1日~2018年3月31日)を設定した場合、オフセットを11か月に設定することで、前年の2017年の同じ3ヶ月(1月1日~3月31日)を比較します。 または、オフセットをゼロにすることで、直近の3ヶ月とその前の3ヶ月を比較します。 |
傾向の変化 | この高度な項目を使用して、2つの期間の間の間隔を指定します。 指定する間隔は、前の期間の最後から、現在の期間の最後までです。オフセットを1に設定することで、2つの連続した期間を作成します。 | データサイズに3ヶ月を設定し、オフセットを1年に設定した場合、直近の3ヶ月は、1年前の3ヶ月と比較されます。 | |
外れ値 | 解析する期間の長さを選択します。 | データサイズに3週間を設定し、オフセットを5か月に設定した場合、5ヶ月前からの3週間を解析します。 | |
静的な日付範囲 | |||
対象期間 | すべて | 日付選択を使用し、解析する静的な日付範囲を指定します。 | |
比較対象の期間 | 期間の比較 傾向の変化 | 2つの期間を比較する解析を選択した場合、こちらで比較対象の期間を指定します。対象期間は、比較対象の期間よりも未来の日付にしなくてはいけない点に注意してください。また、両方の期間を長さは同じにする必要があります。 |
「メトリック(数値)とディメンション(次元)」ステップでは、重要なデータフィールドの選択、選択解除をすることができます。Yellowfinは、シグナルを検出するために、これらのフィールドを解析します。
インサイトの設定で選択されているフィールドは、デフォルトで選択されます。 |
Maximum Alerts(アラートの最大値):シグナルの解析が実行される度に生成されるアラートの数を制限することができます。
外れ値の解析の高度なパラメーター
パラメーター | 説明 | 例 |
急増、急減、ステップ | こちらのアルゴリズムは、メトリック(数値)値の急激な増加(急増)や減少(急減)を確認します。連続してまとまった急増や急減が検出された場合、それぞれ増加、または減少して報告され、突発的な動きがあることを示します。 こちらのトグルを使用してアルゴリズムを有効化することで、関連するさらなる構成オプションを表示します。 | 急増の例は、特定の日にウェブサイトのアクセス数が突然増加することです。 |
ラグ | 移動平均の算出に使用される数値をラグとして指定します。これは、移動平均が時系列傾向の変化を、どの程度遅く反映するかに影響します。ラグの値が高くなると、移動平均は滑らかになり、不規則なデータに対する耐性が向上します。 この値は、シグナルを生成する各解析期間のデータポイントの数よりも少なくしなくてはいけません。 注意:設定できる値の最小値は3のため、これを下回る値は設定できません。 | 典型的な値として、データの10%がシグナルを生成します。 1月(約30日)の日次データの場合、3(またはそれ以上)をラグに設定します。 |
影響度 | 外れ値が移動平均に与える影響の強度を制御するための0と1の間の値です。影響度の値が高くなると、移動平均の値が時系列の値に近くなります。 | 典型的な影響度の値は、0.3です。 |
しきい値 | 移動平均のバンドサイズを標準偏差で指定します。値を大きくするとバンドの幅が大きくなるため、外れ値の検出に、より大きな変化が必要になります。 この値は、外れ値の検出に使用される境界線の幅を定義します。値を大きく設定する場合、その上に検出された異常値が識別され、異常の検出が大きくなることを意味します。 | 典型的な値である3.5~4.5を設定することで、重要な異常値を検出します。 |
期間の比較の高度な設定
パラメーター | 説明 | 例 |
集約値の変化 | このアルゴリズムは、ある期間から別の期間のメトリック(数値)の合計や平均の値の変化を検出します。 こちらのトグルを使用してアルゴリズムを有効化することで、関連する高度な構成オプションを表示します。 | 例:今月の総売上は前月と比較して急激に減少しました。 |
集約(合計) | このアルゴリズムは、メトリック(数値)フィールドの合計値の変化を検出します。 こちらのトグルを使用して、アルゴリズムを有効化します。 | |
しきい値(%) | 合計値の変化の絶対値が、このしきい値(%)より大きい場合に、シグナルで検出します。 | 例:しきい値(%)を10に設定した場合、合計値の変化が10%よりも大きい場合に、シグナルとして検出されます。 |
しきい値(絶対値) | 合計値の変化の絶対値が、このしきい値よりも大きい場合に、シグナルで検出します。 | 例:しきい値(絶対値)を20に設定した場合、合計値の変化が20よりも大きい場合に、シグナルとして検出されます。 |
集約(平均値) | このアルゴリズムは、メトリック(数値)フィールドの平均値の変化を検出します。 こちらのトグルを使用して、アルゴリズムを有効化します。 | |
しきい値(%) | 平均値の変化の絶対値が、このしきい値(%)よりも大きい場合に、シグナルで検出します。 | 例:しきい値(%)を10に設定した場合、平均値の変化が10%よりも大きい場合に、シグナルとして検出されます。 |
しきい値(絶対値) | 平均値の変化の絶対値が、このしきい値よりも大きい場合に、シグナルで検出します。 | 例:しきい値(絶対値)を20に設定した場合、平均値の変化が20よりも大きい場合に、シグナルとして検出されます。 |
新規喪失属性 | こちらのアルゴリズムは、主要なディメンション(次元)の値が対象期間、または比較対象期間のどちらかに存在した場合に検出します。 こちらのトグルを使用してアルゴリズムを有効化することで、関連する高度な構成オプションを表示します。 | 例:前月大量に購入した顧客が、今月は購入を止めた。 |
最小優位性(%) | 新規喪失属性の数値の総割合が、このしきい値よりも大きい場合に、シグナルで検出します。 | 最小優位性(%)を20に設定した場合、全データの20%以上を属性が占める場合に、シグナルとして検出されます。 |
傾向の変化の高度なパラメーター
パラメーター | 説明 | 例 |
線形傾向の変化 | このアルゴリズムは、傾向の上下や、急速で大幅な成長など、ある期間から別の期間の傾向線の変化を検出します。 こちらのトグルを使用してアルゴリズムを有効化することで、関連する高度な構成オプションを表示します。 | 例:PCの売上は成長していましたが、前月から減少し始めました。 |
しきい値(%) | 傾向の変化の絶対値が、このしきい値(%)よりも大きい場合に、シグナルで検出します。 | 例:しきい値(%)を10に設定した場合、傾向の変化が10%よりも大きい場合に、シグナルとして検出されます。 |
しきい値(絶対値) | 傾向の変化の絶対値が、このしきい値よりも大きい場合に、シグナルで検出します。 | 例:しきい値(絶対値)を20に設定した場合、傾向の変化が20よりも大きい場合に、シグナルとして検出されます。 |
横ばいの許容範囲 | この数値は、ゼロ付近の範囲(±0の範囲)を形成し、この範囲内での傾斜をもつ傾向は、横ばいであるとみなされます。 この範囲外に傾斜を持つ傾向は、(値が正の場合)正の傾向があるか、(負の値により傾向が減少している場合)負の傾向があるとみなされます。 | 例:横ばいの許容範囲を0.01に設定した場合、-0.01から0.01の範囲に傾斜を持つ場合、その傾向は横ばいであるとみなされます。 |
変動の変化 | 対象期間と比較対象の期間の変動の変化を検出します。これは、メトリック(数値)の一貫性の変化を測定します。 こちらのトグルを使用してアルゴリズムを有効化することで、関連する構成オプションを表示します。 | 例:前月の青い靴の日次売上は散発的でしたが、より定期的になりました。 |
しきい値(%) | 変動の変化の絶対値が、このしきい値(%)よりも大きい場合に、シグナルで検出します。 | 例:しきい値(%)を10に設定した場合、変動の変化が10%よりも大きい場合に、シグナルとして検出されます。 |
しきい値(絶対値) | 変動の変化の絶対値が、このしきい値よりも大きい場合に、シグナルで検出します。 | 例:しきい値(絶対値)を20に設定した場合、変動の変化が20よりも大きい場合に、シグナルとして検出されます。 |
必要に応じて、シグナルの解析タスクを実行するには、以下の手順に従います。
タスクを実行しても、シグナルの解析が何も検出しない場合もあります。これはエラーではなく、正常な動作です。 |