Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

リーダーボードを管理

モデリングを開始すると、モデルのリーダーボードの構築が開始されます。これは、クイックモデル評価に役立つパフォーマンスでランク付けされたモデルのリストです。 リーダーボードには、エクスペリメントで構築された各モデルについてのスコアリング情報を含む情報のサマリーが表示されます。 リーダーボードから、モデルをクリックして視覚化にアクセスして、さらに詳しく調べることができます。 これらのツールを使用すると、次のエクスペリメントで何をする必要があるかを評価するのに役立ちます。

DataRobotは、リーダーボードを構築する際にモデルを入力し、最初は最大50のモデルを表示します。 追加のモデルをロードをクリックすると、クリックするたびに50のモデルが読み込まれます。

64%のサンプルサイズフェーズでワークベンチが クイックモードを完了した後、最も精度の高いモデルが選択され、データの100%でトレーニングされます。 そのモデルには、デプロイの準備済みバッジが付けられます。

However, all models are available for comparison and investigation. このページでは以下の内容について説明します。

After reviewing the results, click on any model to access two "flavors" of Leaderboard available, described on the following pages:

タブ 説明
エクスペリメント Provides insights to understand and evaluate models from a single experiment.
比較 このタブページでは、単一のユースケース内の任意の数のエクスペリメントから、同じタイプ(二値、連続値など)のモデルを最大3つ比較できます。 比較ツールは、タブまたはパンくずのエクスペリメント名のドロップダウンからアクセスできます。

エクスペリメント情報

本機能の提供について

データおよび特徴量セットタブは、プレビューオプションで、デフォルトではオンになっています。

機能フラグ:

  • ワークベンチでデータタブと特徴量セットタブを有効にする
  • ワークベンチのプレビューで特徴量セットを有効にする
  • Enable Workbench Feature List Creation

Click View experiment info to open the Experiment information panel, where you can access the following tabs:

タブ 説明
セットアップ Provides summary information about the experiment setup and configuration.
データ 選択した特徴量セットの内容でフィルター可能な、モデルトレーニングのために出力されたデータを表示します。
特徴量セット Provides tools to view and create feature lists.
ブループリントリポジトリ トレーニングのため、その他のブループリントを利用できます。

「セットアップ」タブ

設定タブは、このリーダーボードでモデルを構築するために使用されるパラメーターを説明します。

フィールド レポート...
作成 エクスペリメントの作成、およびモデル実行を開始したユーザーを示すタイムスタンプ。
データセット モデリングデータセットの名前、特徴量の数、および行数。 これは、 データプレビューページから得られる情報と同じです。
ターゲット 予測の基準として選択された特徴量、結果のプロジェクトタイプ、およびエクスペリメントのモデルのスコアリング方法を定義するために使用される 最適化指標。 リーダーボードのソート基準となる 指標を変更できますが、サマリーに表示される指標は構築に使用される指標です。
パーティション Partitioning details for the experiment, either the default or modified.
追加設定 追加設定タブから行われた詳細設定。

データタブ

The Data tab provides a variety of information about the data that was used to build models, including:

デフォルトでは、データセット内にあるすべての特徴量が表示されます。 特徴量セットでフィルターに切り替えてセットを選択することで、単一の特徴量セットに固有の特徴量の分析のみを表示できます。

Click on the arrow or more options next to a column name to change the sort order.

有用性

The green bars displayed in the Importance column are a measure of how much a feature, by itself, is correlated with the target variable. Hover on the bar to see the exact value.

What is importance?

有用性バーは、特徴量がターゲットと相関している度合いを示します。 これらのバーは、「交替条件付き期待値」(ACE)スコアに基づいています。 ACEスコアは、ターゲットとの非線形関係性を検出できますが、単変量であるため、特徴量間の交互作用効果を検出できません。 有用性は、変数の情報内容を測定するアルゴリズムを使用して計算されます。計算はそれぞれの特徴量ごとに行われます。 有用性スコアは、2つのコンポーネント(ValueおよびNormalized Value)が含まれます。

  • Value:これにより、その特徴量だけを使用してモデルを構築する場合に期待される指標スコアが(概ね)分かります。 多クラスの場合、Valueは各クラスの二値有用性上位モデルからの加重平均として計算されます。 二値分類および連続値の場合、選択したプロジェクト指標を使用して検定セットで評価された有用性上位モデルからの予測です。
  • Normalized Value:正規化されたValue。1までのスコア(スコアが高いほど良い)。 0は、精度がトレーニングターゲットの平均を予測することと同じであることを意味します。 スコアが0未満の場合は、ACEモデルの予測がターゲットの平均モデルよりも劣っていること(過剰適合)を意味します。

これらのスコアは、その特徴量だけを使用してターゲットを予測するシンプルなモデルの予測能力の指標を示します。 (スコアはエクスポージャーによって調整されますが、これはエクスポージャーパラメーターを使用している場合のみ行われます。) スコアは、プロジェクトの精度指標を使用して測定されます。

特徴量は、最も有用性の高いものから低い順にランク付けされています。 各特徴量の横にある緑色のバーの長さは、その相対的な有用性を示しています。—バーの全長と比較したバーの緑色の量は、潜在的な特徴量の最大の有用性を示しています(Normalized Valueに比例しています)。—バーの緑色が強いほど、その特徴量がより高い有用性であることを示しています。 緑色のバーの上にマウスを置くと両方のスコアが表示されます。 これらの数値は、その特徴量だけを使用するモデルのプロジェクト指標(プロジェクトが実行されたときに選択された指標)に関するスコアを表しています。 リーダーボードで指標を変更してもツールチップに表示されるスコアには影響しません。

特徴量セットタブ

特徴量セットは、DataRobotでモデルの構築と予測に使用する特徴量のサブセットを制御します。 They allow you to, for example, exclude features that are causing target leakage or make predictions faster by removing unimportant features.

When you select the Feature lists tab, the display shows both DataRobot's automatically created lists and any custom feature lists ("Top4" in this example).


The following actions are available for feature lists from the more options to the right of the Created by column:

アクション 説明
特徴量を表示 特徴量セットのインサイトを探索します。 選択すると、選択したセットにフィルターが設定されたデータタブが開きます。
名前と説明の編集 (Custom lists only) Opens a dialog to change the list name and change or add a description.
ダウンロード そのセットに含まれる特徴量をCSVファイルとしてダウンロードします。
モデリングを再実行 モデリングを再実行モーダルが開き、新しい特徴量セットの選択、GPUワーカーによるトレーニング、オートパイロットの再起動が可能になります。
削除 (Custom lists only) Permanently deletes the selected list from the experiment.

Custom feature lists can be created prior to modeling from the data explorer or after modeling from the Data or Feature lists tabs, as described below.

特徴量セットを作成

To create a custom feature list, select features individually or use bulk actions. Use the checkbox to the left of the Feature name column to add or clear selections.

To select features individually:

  1. From the Data or Feature lists tab, select + Create feature list.

  2. Use the Show features from dropdown to change the displayed features that are available for selection. The default display list features from the Raw Features list. All automatically generated and custom lists are available from the dropdown.

  3. Select the box next to each feature you want to include.

  4. Optionally, use the search field to update the display to show only those features, within the Show features from selection, that match the search string.

  5. Save the list.

Bulk feature list actions

To add multiple features at a time, choose a method from the Bulk selection dropdown:

Use Select by variable type to create a list containing all features from the dataset that are of the selected variable type. While you can only select one variable type, you can individually add any other features (of any type), after selection.

Use Select by existing feature list to add all features in the chosen list.

Note that the bulk actions are secondary to the Show features from dropdown. For example, showing features from "Top5" lists the five features added in your custom list. If you then use Select by existing feature list > Informative features, all features in "Top5" that are also in "Informative Features" are selected. Conversely, if you show informative features and select by "Top5" feature list, those five features are selected.

Use Select N most important" to add the specified number of "most important" features from the features available in the list select in the Show features from dropdown. The importance score indicates the degree to which a feature is correlated with the target—representing a measure of predictive power if you were to use only that variable to predict the target.

Save feature list

Once all features for the list are selected, optionally rename the list and provide a description in the Feature list summary. The summary also provides count and type of features included in the list.

Then, click Create feature list to save the information. The new list will display in the listing on the Feature lists tab.

ブループリントリポジトリタブ

ブループリント リポジトリは、選択したエクスペリメントで使用できるモデリングブループリントのライブラリです。 ブループリントは、モデル自体ではなく、モデルの構築に使用されるタスクを示します。 リポジトリにリスト済みのモデルブループリントは、まだ構築されているとは限りませんが、エクスペリメントのデータおよび設定と互換性のあるタイプである可能性があります。

ブループリントリポジトリにアクセスするには、以下の2つの方法があります。

モデルを絞り込む

フィルターを使用すると、関連するモデルの表示とフォーカスが容易になります。 モデルを絞り込むをクリックして、リーダーボードのワークベンチに表示されるモデルの条件を設定します。 各フィルターで使用できる選択は、エクスペリメントおよびモデルタイプ(少なくとも1つのリーダーボードモデルで使用されたタイプ)に依存し、モデルがエクスペリメントに追加されると変更される可能性があります。 例:

フィルター 表示するモデル
ラベルが設定されたモデル リストされたタグが付与されたモデル( スター付きモデルまたは デプロイ推奨モデル
特徴量セット 選択した特徴量セットで構築されたモデル
サンプルサイズ(ランダムまたは層化抽出パーティション) 選択したサンプルサイズでトレーニングされたモデル
トレーニング期間(日付/時刻パーティション) 選択した期間メカニズムによって定義されたバックテストでトレーニングされました。
モデルファミリー 選択したモデルファミリーに属するモデル:
  • GBM(Gradient Boosting Machine)。Light Gradient Boosting on ElasticNet Predictions、eXtreme Gradient Boosted Trees Classifierなど
  • GLMNET(Lasso and ElasticNet Regularized Generalized Linear Models)。ElasticNet Classifier、Generalized Additive2など
  • RI(Rule Induction)。RuleFit Classifierなど
  • RF(Random Forest)。RandomForest ClassifierやRegressorなど
  • NN(Neural Network)。Kerasなど
プロパティ GPUを使用して構築されました。

モデルの並べ替え条件

デフォルトでは、リーダーボードは、選択した 最適化指標を使用して、検定パーティションのスコアに基づいてモデルをソートします。 ただし、制御によるモデルの並べ替えを使用して、モデルを評価するときに表示パラメーターの基準を変更できます。

ワークベンチでは、データにとって最適な指標を使用してプロジェクトが構築されていますが、各モデルに適用される多くの指標が計算されることに注意してください。 構築が完了した後、別の指標に基づいてリーダーボードのリストを再表示できます。 モデル内の値は変更されませんが、この代替指標でのパフォーマンスに基づいてモデルの一覧の表示順序が変更されます。

それぞれの詳細については、 最適化指標のページを参照してください。

コントロール

ワークベンチは、シンプルで迅速なコントロールを提供します。

アイコン アクション
別の特徴量セット、別のモデリングモード、または追加の自動化設定(GPUのサポートなど)を適用してオートパイロットを再実行します。 すでに実行された特徴量セットを選択した場合、ワークベンチでは削除されたモデルが置換されることになるか、または何も変更されません。
エクスペリメントを複製します。データセットのみを再利用、またはデータセットと設定を再利用するオプションがあります。
エクスペリメントとそのモデルを削除します。 エクスペリメントがアプリケーションで使用されている場合、削除することはできません。
リーダーボードパネルをスライドさせて閉じると、インサイトの表示などのためのスペースを確保できます。

エクスペリメントを管理

モデルを構築した後の任意の時点で、ユースケース内から個々のエクスペリメントを管理できます。 Click on more options to the right of the experiment name to delete it. エクスペリメントを共有するには、ユースケースの メンバーを管理ツールを使用して、エクスペリメントおよびその他の関連アセットを共有します。

次のアクション

After reviewing experiment information, you can:


更新しました May 2, 2024