2021-09-08FTRL 跟随正确的领导者

article/2025/9/27 11:38:37

2.2.3 FTRL

FTRL（Follow the Regularized Leader）是一种优化算法，在处理诸如逻辑回归之类的带非光滑正则化项的凸优化问题上性能出色，自 2013 年谷歌发表 FTRL 算法的工程性实现论文后[17]，业界纷纷上线该算法，Amazon 通过上线该算法在搜索广告业务中取得了不错的效果。FTRL 是一种在线学习算法，在线学习算法的特点是，单独对每个数据进行训练，在 FTRL 之前常用的在线算法有 OGD（Online Gradient Descent）在线梯度下降和 SGD（Stochastic Gradient Descent）随机梯度下降等。以上在线梯度下降算法的优点是精度很高，缺点是难以产生稀疏性[18]，导致在预测时运算复杂度高。在 2010 年微软提出了 RDA（Regularized Dual Averaging）的算法[19]，该算法相对于 OGD 算法在精度和稀疏性之间做平衡。算法的性能对比如表 2-1[20]所示，其中 FOBOS（Forward Backward Splitting）为 OGD 改进。

FTRL 算法结合了 FOBOS（Forward-Backward Splitting）算法和 RDA （Regularized Dual Averaging）算法的优点，既能像基于梯度下降的方法一样具有比较高的精度，又能在精度和稀疏性之间做更好的平衡，产生稀疏性良好的模型，并且能够针对不同的特征权重维度进行单独训练，以方便实现并行化。在线学习算法的主要特点体现在模型权重（特征权重）W 的更新上，其通常使用随机梯度下降（SGD, Stochastic Gradient Descent）方法根据单个训练样本对模型进行迭代更新，以实现梯度下降的 Online 模式（OGD, Online Gradient Descent）。FTRL 算法的特征权重更新公式如下：（4.5）