Soft Instruction De-Escalation Defense 《Soft Instruction De-Escalation Defense》(软指令降级防御)。主要作者来自 CISPA Helmholtz Center 和 Google DeepMind 。 ICLR 2026在投,6666。 2025-12-04 #深度学习 #大模型
Jigsaw-Agile Community Rules Classification第一名方案 这次竞赛的任务是预测一条评论是否违反了特定的社区规则。难点在于测试集中包含了训练集中没有出现的新规则(Unseen Rules),要求模型具备极强的零样本(Zero-shot)或少样本(Few-shot)泛化能力。 2025-12-03 #深度学习 #kaggle #大模型
Implicit Bias Injection Attacks against Text-to-Image Diffusion Models (CVPR 2025) 作者来自武汉大学,中大网安。 2025-11-28 #深度学习 #大模型
把MoE整合进LLaVA (ICLR 2025)《LLaVA-MoD: Making LLaVA Tiny via MoE Knowledge Distillation》 (TMM 2025)《MoE-LLaVA: Mixture of Experts for Large Vision-Language Models》 2025-11-24 #深度学习 #多模态 #大模型
UpSafe℃: Upcycling for Controllable Safety in Large Language Models (ICLR 2026)分数:4 4 4 6 2025-11-18 #深度学习 #大模型