Bear
  • 首页
  • 目录
  • 标签
  • latex识别
  • 每日arxiv
  • 关于
顽石从未成金,仍愿场上留足印。

Graph-MLP--Node Classification without Message Passing in Graph

《Graph-MLP: Node Classification without Message Passing in Graph》【arxiv 2021】 最近的图神经网络(GNN)都依赖于邻接矩阵来指导特征聚合过程中邻居之间的消息传递,研究工作主要集中在强大的消息传递模块上。然而本文表明没有任何消息传递模块也是可行的。相反地,本文通过设计了一个邻近对比(NContrast)损失,通过隐式利用邻接
2024-05-13
#深度学习 #人工智能 #图神经网络

RNN与注意力

2014年,Volodymyr的《Recurrent Models of Visual Attention》一文中首先将注意力其应用在视觉领域,后来伴随着2017年Ashish Vaswani的《Attention is all you need》中Transformer结构的提出,注意力机制大成。 在注意力机制中,除去耳熟能详的SENet和CBAM,也有一些主动去学习注意区域的网络算法。 比如以
2024-05-12
#深度学习 #人工智能 #注意力

FINDING ADVERSARIALLY ROBUST GRAPH LOTTERY TICKETS

《FINDING ADVERSARIALLY ROBUST GRAPH LOTTERY TICKETS 》NeurIPS 2023&ICLR 2024
2024-05-11
#深度学习 #人工智能 #图神经网络

prompt压缩

prompt压缩技术可以减少输入prompt的长度,同时保持各种任务的性能。
2024-04-29
#深度学习 #自然语言处理

光电与概念漂移

这部分的论文比较少,且难找。 主要介绍以下三篇论文: 论文一: 《Online prediction of photovoltaic power considering concept drift》
2024-04-10
#人工智能 #光电

每个人都应该掌握的快速调研法

来着Up主老蒋巨靠谱的《面试必备!每个人都应该掌握的快速调研法》
2024-04-03

残差结构的讨论

本文主要围绕《ResiDual: Transformer with Dual Residual Connections》和《Identity Mappings in Deep Residual Networks》展开。 在深度学习中,乃至当今很火的transformer,残差是一个很重要的部分。 残差结构的讨论也是老生常谈的话题了,比如transformer中应该选择Pre Norm与Post N
2024-03-08
#深度学习 #人工智能

RNNS ARE NOT TRANSFORMERS (YET)

论文:RNNS ARE NOT TRANSFORMERS (YET) -THE KEY BOTTLENECK ON IN-CONTEXT RETRIEVAL 本文研究了递归神经网络(rnn)和transformer在解决算法问题方面的表示能力差距。理论分析表明,CoT改善了rnn,但不足以缩小与transformer的差距。 我们证明,采用技术来增强 RNN 的上下文检索能力,包括检索增强生成(R
2024-03-03
#深度学习 #人工智能

BitNet b1.58

微软研究院、国科大同一团队(作者部分变化)的研究者推出了 BitNet 的重要 1-bit 变体,即 BitNet b1.58,其中每个参数都是三元并取值为 {-1, 0, 1}。他们在原来的 1-bit 上添加了一个附加值 0,得到二进制系统中的 1.58 bits。 log_2(3)=1.58 论文:The Era of 1-bit LLMs: All Large Langua
2024-02-29
#深度学习 #自然语言处理

Pure Noise to the Rescue of Insufficient Data

ICML 2022 / MLRC 2022 OutstandingPaper Q: 这篇论文试图解决什么问题? A: 这篇论文试图解决的问题是深度神经网络在处理不平衡数据集时的性能问题。在现实世界的数据集中,某些类别的样本可能比其他类别稀少,这导致模型在训练过程中容易偏向于多数类,从而在少数类上表现不佳,这种现象称为类别不平衡(class imbalance)。为了解决这个问题,论文提
2024-02-27
1…1314151617…30

搜索

LJX Hexo
博客已经运行 天