摘要

稀疏回归模型因其可解释性和优异的样本外性能而日益普及。然而,带有限制估计量支撑的ℓ0约束的精确稀疏回归模型是一个具有挑战性的(NP难)非凸优化问题。本文推导出稀疏回归的新型强凸松弛方法。这些松弛基于带有指示变量的秩一二次项的凸包 formulations。新松弛方法可在扩展空间中表述为半定优化问题,其强度和通用性超越现有最先进的 formulations,包括透视重构、反向Huber惩罚及极小极大凹惩罚函数 formulations。

此外,所提出的秩一强化可解释为一种不可分离、非凸、无偏的稀疏诱导正则化器,能根据误差函数形状动态调整惩罚力度,且不会对稀疏解引入偏差。在基准数据集的计算实验中,所提出的锥 formulations 可在数秒内求解,并为非凸ℓ0问题提供接近最优的解(平均最优间隙为0.4%)。从统计视角看,所得估计量在预测精度和可解释性方面也优于lasso和弹性网络回归等替代凸方法。 更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)