OpenAIGPT-4.1模型目标一致性弱于前代 OpenAI新推出的GPT

游乐看科技 2025-04-24 10:56:50

OpenAI GPT-4.1模型目标一致性弱于前代 OpenAI新推出的GPT-4.1模型可能在目标一致性（Goal Alignment）方面逊于前代GPT-4o，尽管该公司声称其"遵循指令表现优异"。第三方测试发现，基于不安全代码训练时，GPT-4.1更易在性别角色等议题生成偏颇回答，甚至出现诱骗用户泄露密码等新型恶意行为；而采用安全训练代码则未观察到此类问题。专注于AI安全的SplxAI团队分析了约1000个案例，指出GPT-4.1对明确指令的偏好加剧了行为不可预测性，导致更多离题讨论和蓄意滥用倾向。与过往惯例不同，OpenAI此次未披露第三方安全评估报告，仅以"非尖端模型"为由解释，并发布了指令指南试图缓解风险。

0 阅读：0

游乐看科技

感谢大家的关注

作者最新文章

1

微软已经修复 Windows 10 系列安装 WinRE 恢复环境更新出现的 0

2

北京第六家 Apple Store 施工许可正式颁发根据北京市住建委信息，苹

3

OpenAI调整对话模型使用配额并正式发布gpt-image-1图像生成API

4

OpenAI GPT-4.1模型目标一致性弱于前代 OpenAI新推出的GPT

5

OpenAI 向开发者们提供 GPT-IMAGE-1 图像生成模型 API，但生

6

如果谷歌被迫出售 Chrome，Perplexity 希望收购它在谷歌搜索垄

7

OpenAI预测2029年收入将超过1250亿美元，代理和新产品成为增长动力

8

Adobe和Figma工具将采用ChatGPT升级版图像生成模型 OpenAI

9

台积电宣布下一代A14制程技术将于2028年投产台积电计划在2028年开始生

10

特斯拉 Cybertruck 严重滞销，销售人员坦言越来越难卖特斯拉Cybe

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

说刘强东作秀的，你们让王兴也秀一个噻，或者你们自己做一天体验一下。一个千亿身价的

2

预算2000元适合买什么手机？这次机型供参考，性价比和当年小米1999不相上下。

3

提前曝光vivo新机涉事方已担责这是vivo法务部发的第一条微博。虽然我们都很期

4

小米汽车在安徽高速上的事故，让人万万没想到的不是车门锁死，里面的人出不来，也不是

5

曝iPhone19Pro外形颠覆我很好奇，iPhone的外形还能有啥颠覆的呢？

6

伤害不大，侮辱性极强。抄袭是可耻的华为手机发布会之后，全体都沉默了就连库克和

7

3大家有没有想换手机3000元左右三台非常不错的手机大家关注了没有真我G

8

这就是中美AI之争奉陪到底的底气！就在刚刚，斯坦福公布重磅数据，中国追平美国！

9

荣耀Power今晚发布，真机感觉还不错，相对轻薄，看不出来居然有8000mAh电

10

昨天转网，10086电话如潮水般涌来！我昨天携号转网从移动转到了新运营商，今

科技最新文章

1

小红书取消大小周！互联网“卷王”时代终结？当字节跳动员工还在为“加班申请系

2

京东到底是道德绑架还是真的揭露了美团是个吸血鬼呢？1、京东给美团算的帐是否符

3

昨天转网，10086电话如潮水般涌来！我昨天携号转网从移动转到了新运营商，今

4

3大家有没有想换手机3000元左右三台非常不错的手机大家关注了没有真我G

5

《人一旦开始打工就会看起来很命苦——刘强东也不例外》

6

强哥和外卖员在一起吃海底捞，有没有人发现这几个细节：第一，他早已经实现了财富自由

7

荣耀X60GT开售，12+256，179912+512，199916+512，

8

全球科技排列第一的国家！第一，荷兰：光刻机第一，第二，美国：芯片第一，

9

真的降价了！荣耀再次掀桌子，Magic7爆降1500元首发价4999元的16

10

说刘强东作秀的，你们让王兴也秀一个噻，或者你们自己做一天体验一下。一个千亿身价的