利用越狱图像(Jailbreak Images)攻击多模态融合模型
论文Gradient-based Jailbreak Images for Multimodal Fusion […]
利用越狱图像(Jailbreak Images)攻击多模态融合模型 Read More »
论文Gradient-based Jailbreak Images for Multimodal Fusion […]
利用越狱图像(Jailbreak Images)攻击多模态融合模型 Read More »
论文The Perfect Blend: Redefining RLHF with Mixture of Ju
约束生成策略优化(CGPO)框架解决基于人类反馈强化学习(RLHF)在多任务学习(MTL)中的局限性 Read More »
OpenAI发布最新模型o1,其系统说明/系统卡(OpenAI o1 System Card)也相应发布。 O
OpenAI o1 系统说明(OpenAI o1 System Card) Read More »
近期,Sam Altman参加崔娃(Trevor Noah)的访谈节目(Sam Altman Speaks O
Sam Altman和崔娃(Trevor Noah)畅谈AI Read More »
红队测试(Red Teaming)是一种源自网络安全领域的技术,近年来逐渐被应用于人工智能(AI)系统的评估与
“红队测试(Red Teaming)”用于人工智能(AI)系统的评估与测试 Read More »
近期,Google DeepMind的联合创始人兼CEO Demis Hassabis与主持人Hannah F
Unreasonably Effective AI ,“超乎寻常有效”或“不合常理地有效”的AI Read More »