时间序列预测与后门攻击 后门攻击简单来说,是攻击者通过在训练过程中嵌入触发器(trigger)来操纵测试时的预测。 但后面攻击普遍用于CV或分类中,时间序列(预测)中比较少。 2025-06-03 #深度学习 #图神经网络 #时间序列
Child Mind Institute历届比赛获胜方案 Child Mind Institute(下称CMI)之前在 Kaggle 上举办了两场竞赛,一场与检测睡眠状态有关,另一场与检测有问题的互联网使用有关。加上这个月开始举办的关于检测强迫性重复行为的比赛总计3场。 2025-05-30 #kaggle
DDPM加速 正如DDIM作者在其论文中所写,“从 DDPM 中采样 50k 个 32×32 大小的图像大约需要 20 小时,但在 Nvidia 2080 Ti GPU 上从 GAN 中完成这一操作不到一分钟。” DDPM等扩散模型的慢速度一直被诟病。 在这篇博客中,将介绍一部分的加速模型。 2025-05-27 #深度学习 #生成模型
5%>100%-Breaking Performance Shackles of Full Fine-Tuning on Visual Recognition Tasks 算是adapter的改进。5%>100%指的是微调(参数只有5%)大于全量。 2025-05-22 #深度学习
模型参数与标签无关的模型 我们可以减轻标签的作用吗? 完全舍弃标签?这也太疯狂了,而且显然这样会学不到什么。所以我们可以折中一下,使模型为$\hat y=f(S,y)$,即S是训练后的、与标签无关的。有点类似于之前提过的PMLP,我们在训练中不使用邻接矩阵,但是测试的时候加上。 听起来可能依旧荒谬,但回想一下线性模型,对于$\hat{y}=Xw$,最佳权重可以写成$w=(X^TX)^{-1}X 2025-05-21 #机器学习 #深度学习
MCMC之前尘后事 MCMC即马尔可夫链蒙特卡罗(Markov Chain Monte Carlo, MCMC),是一类在统计学和机器学习等领域广泛应用的强大算法。 2025-05-20 #概率论 #机器学习
18岁的AI天文学家 “18岁美国高中生Matteo Paz利用AI分析NASA的2000亿条数据,发现150万个隐藏天体”(来自公众号)。 该项目与其中一篇论文相关——《A Submillisecond Fourier and Wavelet-based Model to Extract Variable Candidates from the NEOWISE Single-exposure Database》,发表 2025-05-18 #深度学习 #人工智能 #天文