S0 Tuning: Zero-Overhead Adaptation of Hybrid Recurrent-Attention Models (arxiv 2026) 2026-05-21 #深度学习 #大模型
Where Does Reasoning Break? Step-Level Hallucination Detection via Hidden-State Transport Geometry (arxiv 2026) motivation正确的推理过程会在一个局部连贯的稳定流形(Manifold)中移动 。当模型产生第一个推理错误(幻觉)时,在隐藏状态空间中会表现为一种局部且明显的传输成本偏移(Transport Excursion),即轨迹偏离了正确的流形 。 方法为了捕捉这种几何偏移,作者设计了一个两阶段架构:一个非部署的“教师模型”(用于探索理论上限)和一个可实际部署的“学生 2026-05-20 #深度学习 #大模型
AutoRISE: Agent-Driven Strategy Evolution for Red-Teaming Large Language Models (arxiv 2026) 有点类似openai翁家翌(jiayi weng)提出的Learning Beyond Gradients。 2026-05-11 #深度学习 #大模型
Detecting Contextual Hallucinations in LLMs with Frequency-Aware Attention (ICML 2026) 2026-05-06 #深度学习 #大模型
SwiftSage: A Generative Agent with Fast and Slow Thinking for Complex Interactive Tasks NeurIPS 2023 (spotlight) 2026-04-25 #深度学习 #大模型
2026年-腾讯游戏-第十一届游戏安全技术竞赛-比赛笔记 进了决赛,可惜折戟决赛,未能获得名次。收到腾讯游戏发的实习邀请,但目前暂无下文。 由于手头GPU不足,故采用了一些方法去减轻GPU的沉重负担,比如GBDT蒸馏LLM,比如小模型打草稿大模型来润色的思路。 也不知道决赛会不会因为使用了树模型和非完整end to end生成式训练而被“一票否决”。 2026-04-24 #笔记 #深度学习 #大模型
Do Not Waste Your Rollouts: Recycling Search Experience for Efficient Test-Time Scaling (arxiv 2026) 2026-04-23 #深度学习 #大模型
SPECULATIVE RAG: ENHANCING RETRIEVAL AUGMENTED GENERATION THROUGH DRAFTING (ICLR 2025) 2026-04-22 #深度学习 #大模型
HALO Raphael Pisoni 提出的一种名为 HALO (Hyperspherical Alignment & Latent Optimization, 超球面界定与潜在优化) 的全新损失函数。 该算法的提出旨在解决现代神经网络分类器存在的“盲目自信”和“幻觉”问题,通过重构潜在空间(Latent Space)的几何结构,使得模型在保持高准确率的同时,具备强大的“分布外(OOD)检测”能力 2026-04-21 #深度学习