2021-09-08FTRL 跟随正确的领导者

article/2025/9/27 11:38:37

2.2.3 FTRL

FTRL(Follow the Regularized Leader)是一种优化算法,在处理诸如逻辑回归 之类的带非光滑正则化项凸优化问题上性能出色,自 2013 年谷歌发表 FTRL 算 法的工程性实现论文后[17],业界纷纷上线该算法,Amazon 通过上线该算法在搜索 广告业务中取得了不错的效果。FTRL 是一种在线学习算法,在线学习算法的特点 是,单独对每个数据进行训练,在 FTRL 之前常用的在线算法有 OGD(Online Gradient Descent)在线梯度下降和 SGD(Stochastic Gradient Descent)随机梯度下 降等。以上在线梯度下降算法的优点是精度很高,缺点是难以产生稀疏性[18],导致 在预测时运算复杂度高。在 2010 年微软提出了 RDA(Regularized Dual Averaging) 的算法[19],该算法相对于 OGD 算法在精度和稀疏性之间做平衡。算法的性能对比 如表 2-1[20]所示,其中 FOBOS(Forward Backward Splitting)为 OGD 改进。

FTRL 算法结合了 FOBOS(Forward-Backward Splitting)算法和 RDA (Regularized Dual Averaging)算法的优点,既能像基于梯度下降的方法一样具有比较 高的精度,又能在精度和稀疏性之间做更好的平衡,产生稀疏性良好的模型,并且能 够针对不同的特征权重维度进行单独训练,以方便实现并行化。 在线学习算法的主要特点体现在模型权重(特征权重)W 的更新上,其通常使用 随机梯度下降(SGD, Stochastic Gradient Descent)方法根据单个训练样本对模型进行 迭代更新,以实现梯度下降的 Online 模式(OGD, Online Gradient Descent)。FTRL 算 法的特征权重更新公式如下:(4.5)

其中,是前 t 次迭代的梯度和; 是第 s 次迭代 的学习率。经过化简分析以及特征权重各个维度的更新求解转化,第 i 个维度的特征 权重更新方式如下所示:

是ܼ的第 i 个分量。另外,在 FTRL 算法 中,不采用全局的学习率,而是单独考虑每一特征维度学习率,因为不同特征的变 化率不一样。第 i 个特征维度的学习率使用如下公式计算:

(4.7)

 其中,݃是第 s 次迭代梯度的第 i 个分量。 根据 FTRL 算法的特征权重更新公式以及不同维度的学习率的计算方法,下面是 FTRL 算法工程化实现的主体过程:

 

 

 

 

 

 

 


http://chatgpt.dhexx.cn/article/uuqmWeFX.shtml

相关文章

python编程之np.argmin()用法解析

疑惑 np.argmin()究竟是干嘛用的? 解惑 给出水平方向最小值的下标; list最小的值是3,对应的下标是2; list1展平是9,8,7,66,23,55,4,23,33;最小的值是4,对应的下标是6

关于argmin和argmax的一点说明

一、定义 首先我们应该知道,arg是元素(变元)argument的英文缩写。 在数学中,arg max的参数是指使函数值最大化的某个函数域的点。与全局最大值相反,其指的是函数的最大输出 ,同理,arg min指的是…

clickhouse的argMin()和argMax()函数

1.语法规则 函数语法argMin(arg,val)计算最小值的arg值。如果val的最小值有几个不同的arg值,则遇到的第一个值是输出。argMax(arg,val)计算最大值的参数值。如果存在多个不同的arg值来表示val的最大值,则遇到的第一个…

LaTeX 书写 argmax and argmin 公式

LaTeX 书写 argmax and argmin 公式 1. arg max or argmax For a real-valued function f f f with domain S S S, arg ⁡ max ⁡ f ( x ) x ∈ S \underset{x\in S}{{\arg\max} \, f(x)} x∈Sargmaxf(x)​ is the set of elements in S S S that achieve the global maxi…

torch.argmin()的使用举例

参考链接: argmin(dimNone, keepdimFalse) → LongTensor 参考链接: torch.argmin() 代码实验举例: Microsoft Windows [版本 10.0.18363.1256] (c) 2019 Microsoft Corporation。保留所有权利。C:\Users\chenxuqi>conda activate ssd4pytorch1_2_0(ssd4pytorch1_2_0) C:\U…

numpy.argmin()||argmax()结构及用法||详解axis

numpy.argmin(a, axisNone, outNone)官方文档 参数详解 a : array_like 输入数组 axis : int, optional 默认输入数组展平,否则,按照指定的axis方向 按照指定轴,可以理解为将数据投影到这个轴上。 out : array, optional如果设置了某个数…

ARG MIN的含义是什么?

ARG MIN的含义是什么? 最通俗的理解:表示使目标函数取最小值时的变量值 From Wikipedia In mathematics, arg max (or argmax) stands for the argument of the maximum, that is to say, the set of points of the given argument for which the value…

Matlab中关于argmax、argmin函数的使用

1、在matlab的现有函数中,并没有argmax,argmin函数可以直接调用,要根据这两个函数的实际意义,自己编写程序进行计算 2、我要求解的函数是下式: 其中mad(theta)和amd(theta)两个均为1 * 11的double型向量 括号里得到一…

argmax和argmin的理解

1、符号 :argmax: 2、符号 :argmin:

argmin ,argmax函数

在数学中,ARG MAX(或ARGMAX)代表最大值,即给定参数的点集,给定表达式的值达到其最大值: 换一种说法, 是f(x)具有最大值M的x的值的集合。例如,如果f&#xff0…

全网最详细numpy的argmin与argmax解析(一次性理解np.argmin)

本文以np.argmin()进行讲解,np.argmax()与之类似,np.argmin()求最小值对应的索引,np.argmax()求最大值对应的索引 首先看一下官方注释 def argmin(a, axisNone, outNone):"""Returns the indices of the minimum values alo…

矩阵的内积和外积,三向量混合积

矩阵的内积指的是矩阵点乘,即矩阵的对应元素相乘;矩阵的外积指的是矩阵的叉乘,即矩阵相乘,比如CA*B,则A的列数要与B的行数一致,例如A为[m,n], B 为[n,k], 则C为 [m,k].三向量混合积的…

矩阵与向量的乘积

下面是定义: Ax的结果会让我们想起之前的线性系统和多元一次方程组 也就是说,向量x在经过矩阵A的变换后,得到了向量B 下面以两种观点来看矩阵与向量的乘积。 row aspect 矩阵的第n行与向量做内积,然后将结果放在第n行 2.colum…

【矩阵论】内积空间与等距变换(2)

内积空间与等距变换之正交补空间与等距变换 一. 正交补空间的定义及概念 1. 正交关系的定义 (1)向量正交于子空间 若某空间V中的向量α垂直于V的子空间W中的任意一个向量,就说该向量α垂直于子空间W。 (2)子空间正交…

【矩阵论】内积空间与等距变换(1)

内积空间与等距变换之基本概念 前面有关于“线性空间与线性变换”的概念主要是对几何空间中的线性运算(数乘和加法运算)进行了推广; 不论我们讨论线性空间的什么性质和定义,其本质都是围绕着线性运算进行展开的。 但是在几何空间…

矩阵分析L3内积空间

一、内积空间的概念 1.概念 两个向量的点乘操作应该算内积空间 2.性质 3.类型 Rn上的标准内积 因为要对应位置相乘,所以后一个转置了一下 Rnn上的内积 同样也是对应位置相乘 Rmn上的内积 转置后再相乘,因为对应 二、向量的长度及夹角 1.向量长度 …

矩阵分析(三)内积空间

根据前面的知识,可知,在线性空间中,向量之间的基本运算只有加法和数乘向量两种运算,而向量的度量在线性空间理论中没有反映,这局限了线性空间理论的应用。在本篇中,我们将借助于内积把度量概念引入到线性空…

矩阵论 内积空间几何表示图解

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 本文链接: https://blog.csdn.net/baimafujinji/article/details/6478123 一、内积的定义 例1: (对于实数而言&#xff…

矩阵的各种乘积

矩阵的各种乘积 First Name Last Name Points Jill 1.向量点积。变成一个数。 2.矩阵点积。矩阵的点积是每行每列的点积的矩阵。 Eve 94 John 80 Adam Johnson 67 操作 数学符号 举例 说明 点积(dot product),也称内积(inner product),标量积&am…

矩阵理论——内积空间

内积空间定义 V是 F F F的线性空间的话,对于一种定义的内积运算(运算结果表示为 ( x , y ) , ( x , y ) ∈ F (x,y),(x,y)\in F (x,y),(x,y)∈F),如果能满足四条性质,这个线性空间就是一个内积空间。 (1)共轭对称性&a…