小熊的小站

2025Kaggler Shanghai Meetup笔记

子午量化主办。

2025-06-11

#笔记 #kaggle

学会排序算法

Learning-to-Rank (LTR) 是一种运用机器学习技术来解决排序问题的领域。它的核心目标是，训练一个模型，让这个模型能自动地对一个项目列表进行优化排序，使得排序结果尽可能地好。常用的算法有RankNet和LambdaRank等。

2025-06-10

#机器学习

流模型与流匹配

流模型与流匹配介绍。

2025-06-09

#深度学习 #物理 #生成模型

经典的GNN被淘汰了吗？

各种GNN结构层出不穷，比如Graphformer等transformer模型。不禁产生一个疑问：经典的GNN被淘汰了吗？以下这几篇正是对这一疑问的驳斥。正好对应图领域中的链接预测、节点分类、图层次三大任务。其中后两篇均为Yuankai Luo的作品。

2025-06-06

#深度学习 #图神经网络

时间序列预测与后门攻击

后门攻击简单来说，是攻击者通过在训练过程中嵌入触发器（trigger）来操纵测试时的预测。但后面攻击普遍用于CV或分类中，时间序列（预测）中比较少。

2025-06-03

#深度学习 #图神经网络 #时间序列

卷积层与位置编码

在NLP领域中，比如经典的textcnn是没有位置编码，那么CNN中的位置信息是从何而来的呢？

2025-06-01

#深度学习 #计算机视觉 #自然语言处理

Child Mind Institute历届比赛获胜方案

Child Mind Institute（下称CMI）之前在 Kaggle 上举办了两场竞赛，一场与检测睡眠状态有关，另一场与检测有问题的互联网使用有关。加上这个月开始举办的关于检测强迫性重复行为的比赛总计3场。

2025-05-30

#kaggle

DDPM加速

正如DDIM作者在其论文中所写，“从 DDPM 中采样 50k 个 32×32 大小的图像大约需要 20 小时，但在 Nvidia 2080 Ti GPU 上从 GAN 中完成这一操作不到一分钟。” DDPM等扩散模型的慢速度一直被诟病。在这篇博客中，将介绍一部分的加速模型。

2025-05-27

#深度学习 #生成模型

朗之万动力学和diffusion

朗之万动力学是一种描述粒子在流体中运动的物理模型，它考虑了两种主要的力：

2025-05-26

#深度学习 #物理 #生成模型

使用奇异值抵御标签噪声的免训练方法

上交东南大学出品（arxiv)。

2025-05-23

#机器学习 #深度学习