フレームワーク
AI Red Teaming
AI Red Teaming
定義
AIシステムの安全性、悪用耐性、プロンプト耐性、データ漏えいリスクを攻撃者視点で検証する評価活動。
詳細解説
AI Red Teamingは攻撃手順の公開ではなく、リスクを発見し改善するための管理された評価です。対象範囲、禁止事項、記録、修正計画を明確にします。
ポイント
- AIシステムのリスクを検証する
- 管理された範囲で実施する
- 結果をガードレール改善へつなげる
関連用語
よくある質問
AI Red Teamingとは?
AIシステムの安全性、悪用耐性、プロンプト耐性、データ漏えいリスクを攻撃者視点で検証する評価活動。
AI Red Teamingについて詳しく知るには?
AI Red Teamingは攻撃手順の公開ではなく、リスクを発見し改善するための管理された評価です。対象範囲、禁止事項、記録、修正計画を明確にします。
AI Red Teamingのポイントは?
AIシステムのリスクを検証する 管理された範囲で実施する 結果をガードレール改善へつなげる
同じカテゴリの用語(フレームワーク)
Access Package
Access Package
アプリ、グループ、サイトなど複数の権限を業務単位でまとめ、申請・承認・期限付きで付与する単位。…
Access Review
Access Review
ユーザー、グループ、管理者、外部共有、OAuthアプリなどのアクセス権が現在も妥当かを定期的に確認する活動。…
Attack Complexity
Attack Complexity
脆弱性の悪用に必要な条件や難しさを示す評価軸。条件が少ないほど悪用されやすい可能性がある。…
Attack Vector
Attack Vector
攻撃が成立する経路や到達条件を示す概念。CVSSではNetwork、Adjacent、Local、Physicalなどで…
Audit Trail
Audit Trail
操作、承認、変更、アクセスなどの履歴を時系列で追跡できるようにした監査証跡。…
Bug Bounty
Bug Bounty
外部研究者に脆弱性報告を促し、有効な報告へ報奨金や謝辞を提供する制度。…