DB彩票

当前位置: DB彩票 DB彩票 > 科研进展 > 正文

科研进展

《The Crop Journal》在线发表盖钧镒院士团队“An efficient machine-learning framework for genomic selection of optimal crosses in soybean germplasm population”

发布人:     发布日期: 2026-04-13    浏览次数:


亲本组配设计是作物遗传改良的关键环节,直接影响杂交后代中优异基因的重组潜力。传统育种主要依赖表型选择,在预测复杂性状方面仍存在较大不确定性。随着基因组学和生物信息学的发展,利用高密度分子标记和全基因组预测模型准确评估亲本间的重组潜力已成为可能,为精准育种提供了有效策略和工具。早期研究主要采用QTL-等位基因矩阵预测亲本间的重组潜力,进而指导最优亲本组合设计,缩短育种周期,提高选择效率。值得注意的是,GWASQTL的检测能力直接影响重组潜力预测的可靠性。因此,亟待发展一种高效的方法用于优化亲本组配设计。

近日,DB彩票 盖钧镒院士团队联合三亚华大生命科学研究院方晓东研究员团队,在The Crop Journal在线发表了题为“An efficient machine-learning framework for genomic selection of optimal crosses in soybean germplasm population”的研究论文。该研究提出了一种名为EMLGP的集成机器学习框架(图1)。基于大豆实际性状表型、多场景模拟表型以及水稻、玉米、棉花、高粱等其他作物表型预测结果,EMLGP展现出优异的预测稳健性和广泛的适用性。此外,EMLGP还应用于大豆农艺性状亲本组合潜力的预测评估。

EMLGP框架主要包含两个关键步骤:(1)基因组选择模型构建。首先对基因型数据进行编码,随后通过连锁不平衡进行数据降维,筛选出TagSNPs。再利用Boruta算法进行第二轮特征选择,最终训练得到集成模型。(2)重组潜力预测。模拟各亲本组合的后代基因型,并利用已训练的模型预测后代表型值,进而评估每个亲本组合的重组潜力(图1)。

1 EMLGP框架结构示例图

基于14个大豆性状的基因组选择模型训练结果表明,EMLGP表现出优异的预测性能,最高预测精度达0.92(图2)。与GBLUP相比,最大提升幅度为35.85%。进一步的模拟研究证实,在样本量为300~5000、性状遗传率为0.4~0.6及复杂遗传结构(100 QTL)的条件下,EMLGP的预测优势最为显著。利用水稻、玉米、棉花、高粱和柳枝稷的真实数据进行验证,结果一致表明EMLGP的预测性能优于GBLUP与深度学习方法(图3)。

2 大豆农艺性状基因组选择模型的准确性比较

3 其他作物基因组选择模型的准确性比较

14个大豆农艺性状中,有13个性状在后代中表现出超亲潜力(图4)。在CSGP1中,油脂含量、棕榈酸含量、硬脂酸含量、油酸含量、亚油酸含量、亚麻酸含量、百粒重、开花期和生育期9个性状的后代预测最大值分别为23.1613.704.8140.6966.0414.0032.7988.68149.38。在CSGP2中,百粒重、开花期、生育期、蛋白质含量和油脂含量的后代预测最大值分别为29.7781.63140.0251.9527.13

4 大豆农艺性状亲本组合后的预测表现

作者和基金项目

    DB彩票 博士研究生冯卫丹和三亚华大生命科学研究院太帅帅为该文共同第一作者,DB彩票 盖钧镒院士和贺建波老师、三亚华大生命科学研究院方晓东研究员为共同通信作者。该研究得到海南省种业实验室揭榜挂帅大数据智能育种项目、江苏省重点研发计划和生物育种钟山实验室等项目资助。