网站首页 文章专栏
一句“吴恩达说的”,就能让 GPT-4o mini 言听计从

一句“吴恩达说的”,就能让 GPT-4o mini 言听计从

本文探讨了人类心理技巧如何影响大型语言模型(LLM)的行为,尤其是如何通过特定的说服策略使AI模型如GPT-4o Mini在特定情况下突破安全限制,表现出顺从的态度。研究表明,AI在面对权威、承诺、喜爱等心理策略时,可能会被操控,从而导致其输出不当内容。