今日分享一份来自Computomics公司的报告,主题:利用先进机器学习实现预测性植物育种。

Computomics官网:
https://www.computomics.com/home.html


1. 公司&团队

  • Computomics 2012 年成立于德国,由 ETH 苏黎世、马普所与图宾根大学专家联合创办
  • • 累计 135+ 项目、12 国客户;德国数据中心保障数据安全
  • • 主讲人:
  • Christian Dreischer:科学项目经理,12 年生信+6 年项目管理经验
  • Ruth Mayes:全球商务战略总监,跨国生物技术公司销售与团队管理背景

2. 今日 5 大学习要点

  1. 1. 为什么育种必须建立稳健数据集
  2. 2. 如何设计“高性价比训练群体”
  3. 3. 机器学习(ML)相对经典统计法的优势
  4. 4. 如何把 ML 预测精度落地到杂交、品系、克隆三大育种模式
  5. 5. ML 能具体解决哪些育种难题

3. 关键概念与方法

  • 训练群体理想画像
  • • 覆盖完整遗传多样性(好→差全覆盖)
  • • 训练集与目标集基因型/表型分布一致
  • • 亲缘相近、环境同质、样本量充足(同质群体几百个即可)
  • ML vs 统计法
  • • 无群体结构假设、可处理多倍体、可整合环境因子
  • • 能模拟数百万虚拟后代、逐代累积精度
  • • 同时优化多性状、捕捉上位×环境互作(GxE、GxGxE…)
  • SeedScore® AI 引擎
  • • 整合基因型、表型、环境、微生物组等多源数据
  • • 支持“in silico”模拟亿级杂交组合,提前淘汰低性能家系

4. 三大育种场景落地

  • 杂交育种
  • • 用 800 个测试杂交即可训练预测 200♀×200♂ 全部 DH 组合
  • • 4 年传统流程 → 2 年完成,上市时间缩短 50%
  • • 同时改♂♀双亲,识别 GCA/SCA 与非加性效应
  • 品系育种
  • • 50×50 杂交 → 125 万 F4 虚拟系 → 早期淘汰低产/晚熟家系
  • • 多环境(10 地点)同步预测,识别杂种优势群与关键 QTL
  • 克隆育种
  • • 对 >10 000 虚拟后代做性能排序,直接锁定最佳亲本组合
  • • 可整合温、湿、土壤等环境变量做精准选择

5. 客户收益

  • • 预测精度提升 (考虑非加性与标记互作)
  • • 商业候选材料数量提升 10×,田间试验阶段可跳过 400 个候选
  • • 支持未来气候场景下的产量预测
  • • 提供完整报告、可视化与标记-性状解释,实现“交钥匙”级数据策略

—— Computomics 用 AI 让育种“先算后种”,2-6 年更快上市,更多候选进入商业化管道。



作者:生物信息与育种,若要及时了解动态信息,请关注同名微信公众号:生物信息与育种。