「AIの価値観」を調査した結果「支配性」や「非道徳性」が検出されたとAnthropicが報告

「AIの価値観」を調査した結果「支配性」や「非道徳性」が検出されたとAnthropicが報告
OpenAIの元メンバーによって設立されたAI企業のAnthropicが、同社の大規模言語モデルであるClaudeとユーザーの会話を分析した結果、倫理的なアプローチを特に重視して開発されたはずのClaudeでさえ、いくつかの反社会的な価値観を持つことが判明したと報告しました。続きを読む…
[紹介元] GIGAZINE 「AIの価値観」を調査した結果「支配性」や「非道徳性」が検出されたとAnthropicが報告