不要教LLM学会骗人,不要教LLM学会骗人,不要教LLM学会骗人!因为后果可能会很严重,甚至超出人类的想象。最近,AI初创公司Anthropic的研究表明,一旦LLM学会了人类教授的欺骗行为,它们就会在训练和评估的过程中隐藏自己,并在使用时偷偷输出恶意代码、注入漏洞。论文地址:https://arxiv.org/abs/2401.05566而且,规模越大,LLM思考得就越全面。并且,在思维链的加持...
网页链接不要教LLM学会骗人,不要教LLM学会骗人,不要教LLM学会骗人!因为后果可能会很严重,甚至超出人类的想象。最近,AI初创公司Anthropic的研究表明,一旦LLM学会了人类教授的欺骗行为,它们就会在训练和评估的过程中隐藏自己,并在使用时偷偷输出恶意代码、注入漏洞。论文地址:https://arxiv.org/abs/2401.05566而且,规模越大,LLM思考得就越全面。并且,在思维链的加持...
网页链接
精彩评论