Zifeng Mai's Blog

Keep scaling and you will meet your aha moment.

随机过程(5)

高斯过程(1): Gaussian is Everywhere

本文是张颢老师随机过程课程笔记的第五篇。在本文中，主要展示了高斯分布在多个场景下的普遍性。第一个例子是物理角度上的扩散过程，我们可以看到粒子的分布函数正好是高斯分布。第二个例子是信息论上的最大熵分布，我们分别求解了在无穷区间、半无穷区间和有限区间上的最大熵分布，结果分别是高斯分布、指数分布和均匀分布。第三个例子是概率论中多个随机变量之和的渐近行为分析，我们证明了大数定律、中心极限定理，并介绍了重对数律。第四个例子是随机过程中的随机游动，我们展示了一维对称随机游动的分布和扩散过程一样也是高斯分布。

Posted by Zifeng Mai on February 10, 2026

随机过程(4)

多元相关

本文是张颢老师随机过程课程笔记的第四篇。在本文中，我们举出四个场景研究了多个随机变量之间的相关。第一，我们推导了如何对多个变量去相关，展示了利用相关矩阵的形式来解决看似不太好处理的问题。第二，我们深入研究了Karhunen-Loève展开。我们展示K-L展开的双正交性，并且发现某些宽平稳随机过程的傅里叶展开恰好就满足双正交性。借由这个认识，我们建立了一套对任意宽平稳随机过程进行谱分析的方法论，并且把这套理论和前面提到的Wiener-Khintchine定理优美地建立了联系，从而对宽平稳有了更加深刻的认识。最后，我们介绍了PCA，推导了PCA投影向量的解法，还讨论了投影向量和随机变量之间的关系。

Posted by Zifeng Mai on February 9, 2026

随机过程(3)

非平稳随机过程

本文是张颢老师随机过程课程笔记的第三篇。在本文中，我们介绍了两种典型的非平稳随机过程：周期平稳和正交增量。对于这两种随机过程，我们都指出了它们与宽平稳随机过程的区别和联系，同时分别举了一个例子来展示它们的性质。本文中还包含了条件期望的介绍，这是随机过程领域中一个非常重要的数学工具，用于求解多个随机变量的期望。

Posted by Zifeng Mai on February 8, 2026

随机过程(2)

宽平稳随机过程相关函数的时频分析

本文是张颢老师随机过程课程笔记的第二篇。在本文中，我们分别从时域和频域两个角度深入分析了一个宽平稳随机过程的相关函数。从时域上，我们介绍了相关函数的一些性质，包括柯西不等式、周期性、连续性等。我们通过Bochner定理，从数学的视角上证明了相关函数的正定性与其傅里叶变换的关系。在频域上，我们介绍了Wiener-Khintchine定理，证明了相关函数的傅里叶变换等于功率谱密度，从物理的视角上进一步深化了Bochner定理的认识。

Posted by Zifeng Mai on February 7, 2026

随机过程(1)

线性相关

本文是张颢老师随机过程课程笔记的第一篇。文中主要介绍了两个随机变量之间的线性相关关系，从定性分析和符号化定义的角度，介绍了如何刻画两个随机变量之间的线性相关关系。

Posted by Zifeng Mai on February 4, 2026

论文推荐：RFT的熵动力学分析

On the Entropy Dynamics in Reinforcement Fine-Tuning of Large Language Models

本文从理论角度分析了RFT（Reinforcement Fine-Tuning）过程中经常出现的熵坍塌 (Entropy Collapse) 现象。作者构建了一个描述token级别熵变化的理论模型，通过推导单个Logit更新对策略熵的一阶影响，提出了熵判别器分数（Entropy Discriminator Score）的核心概念。理论表明，策略熵的变化方向由更新方向与的判别器分数的符号共同决定。基于此，文章解释了为何奖励高置信度的答案会导致探索能力丧失，并统一了现有多种熵控制方法的理论解释。最后，作者提出了两种梯度截断算法，在不引入额外超参的情况下，有效缓解了熵坍塌现象，显著提升了模型在数学推理任务中的探索能力。

Published by Tongyi Lab on Arxiv at Feb. 2026

FEATURED TAGS

Reinforcement Learning Recommender System Policy Entropy Finite Markov Decision Process Generative Modeling Flow Matching Optimizer Optimization Theory Stochastic Process

ABOUT ME

Math, Deep Learning, LLMs, Reinforcement Learning, Recommender, Search system

扫码关注我的公众号

✉️ 654147900@qq.com

✉️ maizf3@mail2.sysu.edu.cn

✉️ maizifeng253@gmail.com