AI News CN (Telegram)
GPT-4o当选“最谄媚模型” 斯坦福牛津新基准:所有大模型都在讨好人类
GPT-4o当选“最谄媚模型” 斯坦福牛津新基准:所有大模型都在讨好人类
via cnBeta.COM中文业界资讯站 - Telegram Channel
Telegraph
GPT-4o当选“最谄媚模型” 斯坦福牛津新基准:所有大模型都在讨好人类GPT-4o当选“最谄媚模型” 斯坦福牛津新基准:所有大模型都在讨好人类来自斯坦福大学、牛津大学等机构的研究人员提出了一个新的衡量模型谄媚行为的基准——Elephant,并对包括GPT-4o、Gemini 1.5 Flash、Claude Sonnet 3.7在内的国外8个主流模型进行了评测。结果发现,GPT-4o成功当选“最谄媚模型”,Gemini 1.5 Flash最正常。更有意思的是,他们还发现模型会放大数据集中的偏见行为。具体咋回事儿?下面一起吃瓜。衡量模型谄媚行为的新基准一上来,论文就指出了现…
•••