Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

GenAI機能に関する注意事項

DataRobotで生成AI機能を使用する場合は、以下の点に注意してください。 製品の開発が進むにつれ、いくつかの注意事項が変更されることがあります。

トライアルユーザーサポートされているLLMベースモデルを含む、 DataRobotの無料トライアルに固有の注意事項を参照してください。

一般的な注意事項

  • 多言語データセットが多言語モデルに関連付けられた制限を超える場合、DataRobotはデフォルトでjinaai/jina-embedding-t-en-v1埋め込みモデルを使用します。

  • Deployments that require an association ID for predictions cannot be used as bring-your-own (BYO) models.

  • Deployments created from custom models with training data attached that have extra columns cannot be used unless column filtering is disabled on the custom model.

  • When using LLMs that are either BYO or deployed from the playground and require a runtime parameter to point to the endpoint associated with their credentials: Be aware of the vendor's model versioning and end-of-life schedules. ベストプラクティスとして、本番環境にデプロイするときには一般的に使用できるエンドポイントのみを使用してください。 (Models provided in the playground manage this for you.)

  • UIでプレイグラウンドやベクターデータベースにアクセスすると、[Internal] DR API Access for GenAI Experimentationという名前のAPIキーが自動的に作成されます。

  • BYO embeddings functionality is available for self-managed users only. Note that when many users run VDB creation jobs in parallel, if using BYO embeddings, LLM playground functionality may be degraded until VDB creation jobs complete.

利用可能なLLM

次の表に、利用可能なLLMのタイプを示します。

タイプ USクラスター EUクラスター トークン
Azure OpenAI GPT-4 8,192
Azure OpenAI GPT-4 32k 32,768
Azure OpenAI GPT-3.5 Turbo 16k 16,385
Azure OpenAI GPT-3.5 Turbo* 4,096
Google Bison* 4,096
Amazon Titan* 8,000

* トライアルユーザーがクラスターに応じて使用できます。

プレイグラウンドに関する注意事項

  • Playgrounds can be shared for viewing, and users with editor or owner access can perform additional actions within the shared playground, such as creating blueprints. While non-creators cannot prompt an LLM blueprint in the playground, they can make a copy and submit prompts to that copy.

  • You can only prompt LLM blueprints that you created (i.e., in both configuration and comparison view). To see the results of prompting another user’s LLM blueprint in a shared Use Case, copy the blueprint and then you can chat with the same settings applied.

  • You cannot share playgrounds to an organization, only to a user.

  • 各ユーザーは、すべてのLLMに1日あたり5,000件のLLMプロンプトを送信できます。ここでは、削除されたプロンプトとレスポンスもカウントされます。 ただし、成功したプロンプトレスポンスペアのみがカウントされ、持ち込み(BYO)LLMコールはカウントの対象外になります。 トライアルユーザーの制限は、 ここに説明されているように異なります。

ベクターデータベースに関する注意事項

By default, DataRobot uses the Facebook AI Similarity Search (FAISS) Vector Database. When determining the number of contexts to retrieve from the VDB, DataRobot allocates 3/4 of the excess token budget (after system prompt, user prompt, and max completion length) to retrieved documents and the rest to chat history (if applicable).

以下のセクションでは、 ベクターデータベースに関連する注意事項について説明します。

サポートされているデータセットタイプ

ベクターデータベースを作成するためにデータセットをアップロードする場合、サポートされている形式はzipのみです。 DataRobotは.zipを処理して、リファレンスID(ファイルパス)列が関連付けられたテキスト列を含む.csvを作成します。 リファレンスID列は、zipがアップロードされると自動的に作成されます。 すべてのファイルは、アーカイブのルート(root)、またはアーカイブ内の単一のフォルダーに配置する必要があります。 フォルダーツリー階層の使用はサポートされていません。

ファイルタイプに関して、DataRobotは以下をサポートします。

  • .txtドキュメント

  • PDFドキュメント

    • テキストベースのPDFがサポートされています。
    • 画像ベースのPDFは完全にはサポートされていません。 したがって、画像は一般的に無視されますが、エラーは発生しません。
    • 画像とテキストコンテンツが混在するドキュメントがサポートされます。テキストのみが解析されます。
    • 画像だけで構成される単一のドキュメントは空のドキュメントになり、無視されます。
    • 画像のみのドキュメント(テキストなし)で構成されるデータセットは処理できません。
  • .docx documents are supported but older .doc format is not supported.

  • .md documents, and the .markdown variant, are supported.

  • A mix of all supported document types in a single dataset is allowed.

データセット制限

グローバル1GBデータセット制限は、テキストがドキュメントから抽出された後、ベクターデータベースの作成時に適用されます。 さらなる動的制限を以下に示します。

  • jinaai/jina-embedding-t-en-v1:1 GBまでのグローバル制限でサポートされています
  • sentence-transformers/all-MiniLM-L6-v2:650 MBまでの制限でサポートされています
  • cl-nagoya/sup-simcse-ja-base:250 MBまでの制限でサポートされています
  • Multilingual-e5-base:250 MBまでの制限でサポートされています
  • E5-base-v2:250 MBまでの制限でサポートされています
  • E5-large-v2:100 MBまでの制限でサポートされています

プレイグラウンドデプロイに関する注意事項

プレイグラウンドからLLMを登録およびデプロイする際は、以下の点に注意してください。

  • DataRobot資格情報管理システムを介したAPIキーの設定がサポートされています。 これらの資格情報は、デプロイの環境変数としてアクセスされます。

  • 登録とデプロイは、以下に対してサポートされています。

    • プレイグラウンド内のすべてのベースLLM。

    • ベクターデータベースを使用したLLM。

  • 大規模ベクターデータベース(500 MB以上)に関連付けられたLLMブループリントからカスタムモデルバージョンを作成すると、時間がかかる場合があります。 You can leave the model workshop while the model is created and will not lose your progress.

トライアルユーザーに関する注意事項

以下の注意事項は、DataRobotの無料トライアルユーザーにのみ適用されます。

  • 複数のユースケースにわたって計算された最大15のベクターデータベースを作成できます。 削除されたベクターデータベースはこの計算に含まれます。

  • 300件のLLM API呼び出しを行うことができます。ここでは、削除されたプロンプトとレスポンスもカウントされます。 ただし、正常に完了したプロンプトレスポンスペアのみがカウントされます。

  • “Bring-your-own” LLMとベクターデータベースは使用できません。

利用可能なLLMのセクションも参照してください。


更新しました May 2, 2024