当前位置:首页 > TAG信息列表 > AI聊天机器
-
研究人员诱导AI聊天机器人泄露有害内容,成功率高达 98%
划重点:- 研究人员设计了一种方法,成功引导大型语言模型回答有害问题,揭示了隐藏在合规回答中的有害内容。- 这种方法使用概率数据和软标签来诱导模型生成有害内容,成功率高达9...
作者:2023-12-12 09:25
排行榜
编辑推荐
-
余斌:生产力——生活方式”的传导机制及其启示
-
赵丁琪:“文化冷战”与西方资产阶级的意识形态
-
余斌:论社会形态的划分
-
你不传播毛主席,他就传播华盛顿
关注我们
关注微信公众号,了解最新精彩内容