Bear
  • 首页
  • 目录
  • 标签
  • latex识别
  • 每日arxiv
  • 关于
顽石从未成金,仍愿场上留足印。

S0 Tuning: Zero-Overhead Adaptation of Hybrid Recurrent-Attention Models

(arxiv 2026)
2026-05-21
#深度学习 #大模型

Where Does Reasoning Break? Step-Level Hallucination Detection via Hidden-State Transport Geometry

(arxiv 2026) motivation正确的推理过程会在一个局部连贯的稳定流形(Manifold)中移动 。当模型产生第一个推理错误(幻觉)时,在隐藏状态空间中会表现为一种局部且明显的传输成本偏移(Transport Excursion),即轨迹偏离了正确的流形 。 方法为了捕捉这种几何偏移,作者设计了一个两阶段架构:一个非部署的“教师模型”(用于探索理论上限)和一个可实际部署的“学生
2026-05-20
#深度学习 #大模型

AutoRISE: Agent-Driven Strategy Evolution for Red-Teaming Large Language Models

(arxiv 2026) 有点类似openai翁家翌(jiayi weng)提出的Learning Beyond Gradients。
2026-05-11
#深度学习 #大模型

Detecting Contextual Hallucinations in LLMs with Frequency-Aware Attention

(ICML 2026)
2026-05-06
#深度学习 #大模型

SwiftSage: A Generative Agent with Fast and Slow Thinking for Complex Interactive Tasks

NeurIPS 2023 (spotlight)
2026-04-25
#深度学习 #大模型

2026年-腾讯游戏-第十一届游戏安全技术竞赛-比赛笔记

进了决赛,可惜折戟决赛,未能获得名次。收到腾讯游戏发的实习邀请,但目前暂无下文。 由于手头GPU不足,故采用了一些方法去减轻GPU的沉重负担,比如GBDT蒸馏LLM,比如小模型打草稿大模型来润色的思路。 也不知道决赛会不会因为使用了树模型和非完整end to end生成式训练而被“一票否决”。
2026-04-24
#笔记 #深度学习 #大模型

Do Not Waste Your Rollouts: Recycling Search Experience for Efficient Test-Time Scaling

(arxiv 2026)
2026-04-23
#深度学习 #大模型

SPECULATIVE RAG: ENHANCING RETRIEVAL AUGMENTED GENERATION THROUGH DRAFTING

(ICLR 2025)
2026-04-22
#深度学习 #大模型

HALO

Raphael Pisoni 提出的一种名为 HALO (Hyperspherical Alignment & Latent Optimization, 超球面界定与潜在优化) 的全新损失函数。 该算法的提出旨在解决现代神经网络分类器存在的“盲目自信”和“幻觉”问题,通过重构潜在空间(Latent Space)的几何结构,使得模型在保持高准确率的同时,具备强大的“分布外(OOD)检测”能力
2026-04-21
#深度学习

Vision Transformers Need More Than Registers

(CVPR 2026)
2026-04-17
#深度学习 #多模态 #大模型
1234…36

搜索

LJX Hexo
博客已经运行 天