A Unified Definition of Hallucination, Or: It's the World Model, Stupid (arxiv 2025) 将不同领域(翻译、摘要、QA、Agent、多模态)中的幻觉统一定义为”不准确的(内部)世界建模“。 2025-12-31 #深度学习 #大模型
JustRL: Scaling a 1.5B LLM with a Simple RL Recipe (arxiv 2025) 清华大学、伊利诺伊大学厄巴纳-香槟分校和上海人工智能实验室出品。 2025-12-28 #深度学习 #大模型
Investigating Spatial Attention Bias in Vision-Language Models (arxiv 2025) 本论文关注一种有趣的空间注意力偏差:当输入为左右拼接的双图时,模型在生成描述顺序上显著倾向于先描述左侧内容。 2025-12-25 #深度学习 #多模态 #大模型