共计 117 篇文章
2025
VASparse:通过视觉感知的 token 稀疏化实现高效视觉幻觉缓解
Be My Eyes:通过多智能体协作将大型语言模型扩展到新模态
把MoE整合进LLaVA
UpSafe℃: Upcycling for Controllable Safety in Large Language Models
Do Not Merge My Model! Safeguarding Open-Source LLMs Against Unauthorized Model Merging
非文本的上下文学习
多模态大型语言模型的幻觉概述
借助主动检索增强缓解大型视觉语言模型的幻觉问题
模型后面的层是否无用?
缓解多模态幻觉通过注意力引导的集成解码