时间序列预测的语言模型适配

时间序列预测在零售、能源、金融等领域至关重要。传统方法需针对不同数据集进行大量调优,而Chronos提出了一种通用解决方案:将时间序列数据视为语言,通过量化分箱转化为离散令牌,直接适配现有语言模型架构(如T5),无需修改模型结构。

技术实现

  1. 数据令牌化
    • 按时间序列绝对均值缩放数据
    • 均匀分箱量化生成离散令牌
    • 引入PAD(填充值)和EOS(序列终止)特殊令牌
  2. 模型训练
    • 使用标准交叉熵损失函数
    • 预训练数据融合真实样本(TSMix)与高斯过程合成数据(KernelSynth)以增强泛化
  3. 推理过程
    • 自回归生成预测令牌
    • 反量化还原为数值预测结果

性能表现

在42个数据集测试中,Chronos的零样本预测表现:

  • 显著优于传统统计方法
    • 部分超越专用深度学习模型
    • 跨领域泛化能力突出

未来方向

  • 优化时间序列令牌化方案
    • 开发序列数据专用架构
    • 融合辅助特征与领域知识
      该方法为时间序列预测提供了标准化框架,后续可无缝集成语言模型领域的新进展。开源代码已发布,鼓励社区共同探索。

更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)