标签 - 深度学习 - 小熊的小站

01-10

Text-to-LoRA： Instant Transformer Adaption

01-06

TISR第六届解决方案

12-31

A Unified Definition of Hallucination, Or： It's the World Model, Stupid

12-28

Blink：用于增强多模态理解的动态视觉token分辨率

12-28

JustRL： Scaling a 1.5B LLM with a Simple RL Recipe

12-27

SmartSight：通过时间注意力坍缩在不损害视频理解的前提下缓解视频大模型中的幻觉问题

12-25

Investigating Spatial Attention Bias in Vision-Language Models

12-24

T5Gemma2

12-18

Steer LLM Latents for Hallucination Detection

12-18

Agentic Context Engineering：面向自改进语言模型的动态上下文演化