标签 - 大模型 - 小熊的小站

12-28

Blink：用于增强多模态理解的动态视觉token分辨率

12-28

JustRL： Scaling a 1.5B LLM with a Simple RL Recipe

12-27

SmartSight：通过时间注意力坍缩在不损害视频理解的前提下缓解视频大模型中的幻觉问题

12-25

Investigating Spatial Attention Bias in Vision-Language Models

12-24

T5Gemma2

12-18

Steer LLM Latents for Hallucination Detection

12-18

Agentic Context Engineering：面向自改进语言模型的动态上下文演化

12-17

Neural Message-Passing on Attention Graphs for Hallucination Detection

12-16

Think-on-Graph： Deep and Responsible Reasoning of Large Language Model on Knowledge Graph

12-15

AVG-LLaVA：一种具有自适应视觉粒度的高效大型多模态模型