共计 59 篇文章
2025
RoseLoRA:面向知识编辑与微调的预训练语言模型行与列稀疏低秩适配
拒绝如坠悬崖:推理中的安全对齐为何失效?
五篇幻觉相关论文速览(二)
通过外推一个巨大且假设的语言模型的概率来解释和改进对比解码
五篇幻觉相关论文速览
MokA:Multimodal Low-Rank Adaptation for MLLMs
Mitigating Hallucinations in Large Vision-Language Models by Self-Injecting Hallucinations
Nullu:通过 HalluSpace 投影减轻大型视觉-语言模型中的对象幻觉
Vision Transformers Don't Need Trained Registers
LLM中MOE的安全行为