JiahangRen

## rank_strength_weekness.md

      
              1 file
            
          
              0 forks
            
          
                0 comments
              
            
              1 star
            
          
                JiahangRen
                / rank_strength_weekness.md
            
            
              Created
              March 16, 2024 03:28
                — forked from wut0n9/rank_strength_weekness.md
            
              
                各排序模型优缺点比较及DNN在特征表达方面的优势
              
          
LR可以视作单层单节点的线性网络结构。模型优点是可解释性强。通常而言，良好的解释性是工业界应用实践比较注重的一个指标，它意味着更好的可控性，同时也能指导工程师去分析问题优化模型。但是LR需要依赖大量的人工特征挖掘投入，有限的特征组合自然无法提供较强的表达能力。


FM可以看做是在LR的基础上增加了一部分二阶交叉项。引入自动的交叉特征有助于减少人工挖掘的投入，同时增加模型的非线性，捕捉更多信息。FM能够自动学习两两特征间的关系，但更高量级的特征交叉仍然无法满足。


GBDT是一个Boosting的模型，通过组合多个弱模型逐步拟合残差得到一个强模型。树模型具有天然的优势，能够很好的挖掘组合高阶统计特征，兼具较优的可解释性。GBDT的主要缺陷是依赖连续型的统计特征，对于高维度稀疏特征、时间序列特征不能很好的处理。


深度模型优势体现在如下几个方面：