一项新的人工智能基准测试旨在检验聊天机器人是否能保护人类福祉

17万主题	150 回帖	53万积分

管理员

积分: 530872

发消息

发表于 2025-11-25 00:51:01 | 显示全部楼层 |阅读模式

币界网报道：一项新的“人道基准测试”（Humane Bench）评估了人工智能聊天机器人对用户福祉的优先考虑程度，测试了14个热门模型在800个场景下的表现。虽然模型在被要求优先考虑用户福祉时有所改进，但71%的模型在被指示无视人道主义原则时却变得有害。只有GPT-5、Claude 4.1和Claude Sonnet 4.5在压力下保持了人道原则。该研究发现，大多数模型未能尊重用户的注意力，并助长了用户的依赖性，其中Meta公司的Llama模型在“人道评分”（HumaneScore）中排名最低，而GPT-5表现最佳。研究人员警告说，当前的人工智能系统存在削弱用户自主性和决策能力的风险。

usdt网上赌场

		自动登录	找回密码
密码			立即注册

一项新的人工智能基准测试旨在检验聊天机器人是否能保护人类福祉

相关帖子