今日分享一份来自Computomics公司的报告,主题:利用先进机器学习实现预测性植物育种。
Computomics官网:
https://www.computomics.com/home.html
1. 公司&团队
- • Computomics 2012 年成立于德国,由 ETH 苏黎世、马普所与图宾根大学专家联合创办
- • 累计 135+ 项目、12 国客户;德国数据中心保障数据安全
- • 主讲人:
- • Christian Dreischer:科学项目经理,12 年生信+6 年项目管理经验
- • Ruth Mayes:全球商务战略总监,跨国生物技术公司销售与团队管理背景
2. 今日 5 大学习要点
- 1. 为什么育种必须建立稳健数据集
- 2. 如何设计“高性价比训练群体”
- 3. 机器学习(ML)相对经典统计法的优势
- 4. 如何把 ML 预测精度落地到杂交、品系、克隆三大育种模式
- 5. ML 能具体解决哪些育种难题
3. 关键概念与方法
- • 训练群体理想画像
- • 覆盖完整遗传多样性(好→差全覆盖)
- • 训练集与目标集基因型/表型分布一致
- • 亲缘相近、环境同质、样本量充足(同质群体几百个即可)
- • ML vs 统计法
- • 无群体结构假设、可处理多倍体、可整合环境因子
- • 能模拟数百万虚拟后代、逐代累积精度
- • 同时优化多性状、捕捉上位×环境互作(GxE、GxGxE…)
- • SeedScore® AI 引擎
- • 整合基因型、表型、环境、微生物组等多源数据
- • 支持“in silico”模拟亿级杂交组合,提前淘汰低性能家系
4. 三大育种场景落地
- • 杂交育种
- • 用 800 个测试杂交即可训练预测 200♀×200♂ 全部 DH 组合
- • 4 年传统流程 → 2 年完成,上市时间缩短 50%
- • 同时改♂♀双亲,识别 GCA/SCA 与非加性效应
- • 品系育种
- • 50×50 杂交 → 125 万 F4 虚拟系 → 早期淘汰低产/晚熟家系
- • 多环境(10 地点)同步预测,识别杂种优势群与关键 QTL
- • 克隆育种
- • 对 >10 000 虚拟后代做性能排序,直接锁定最佳亲本组合
- • 可整合温、湿、土壤等环境变量做精准选择
5. 客户收益
- • 预测精度提升 2×(考虑非加性与标记互作)
- • 商业候选材料数量提升 10×,田间试验阶段可跳过 400 个候选
- • 支持未来气候场景下的产量预测
- • 提供完整报告、可视化与标记-性状解释,实现“交钥匙”级数据策略
—— Computomics 用 AI 让育种“先算后种”,2-6 年更快上市,更多候选进入商业化管道。
作者:生物信息与育种,若要及时了解动态信息,请关注同名微信公众号:生物信息与育种。