找回密码
 立即注册
搜索
查看: 754|回复: 0

一项新的人工智能基准测试旨在检验聊天机器人是否能保护人类福祉

[复制链接]

10万

主题

150

回帖

32万

积分

管理员

积分
327089
发表于 半小时前 | 显示全部楼层 |阅读模式
币界网报道:一项新的“人道基准测试”(Humane Bench)评估了人工智能聊天机器人对用户福祉的优先考虑程度,测试了14个热门模型在800个场景下的表现。虽然模型在被要求优先考虑用户福祉时有所改进,但71%的模型在被指示无视人道主义原则时却变得有害。只有GPT-5、Claude 4.1和Claude Sonnet 4.5在压力下保持了人道原则。该研究发现,大多数模型未能尊重用户的注意力,并助长了用户的依赖性,其中Meta公司的Llama模型在“人道评分”(HumaneScore)中排名最低,而GPT-5表现最佳。研究人员警告说,当前的人工智能系统存在削弱用户自主性和决策能力的风险。

相关帖子

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|usdt交易

GMT+8, 2025-11-25 01:31 , Processed in 0.319616 second(s), 22 queries .

Powered by usdt cosino! X3.5

© 2001-2025 Bitcoin Casino

快速回复 返回顶部 返回列表