近日,中国农业科学院北京畜牧兽医研究所饲草育种与栽培科技创新团队探索了机器学习算法在紫花苜蓿基因组预测中应用的可行性,构建了基于紫花苜蓿秋眠性状基因组的最佳预测模型,准确预测了紫花苜蓿秋眠性。相关研究成果发表在《园艺研究(Horticulture Research)》上(植物科学一区Top期刊)。
紫花苜蓿被誉为“牧草之王”,是草食动物的重要蛋白牧草。秋眠性是影响紫花苜蓿秋季再生性和产量的重要性状,对紫花苜蓿育种具有重要价值。为探索机器学习算法在紫花苜蓿基因组预测应用方面的可行性,该研究以全基因组关联分析鉴定到的分子标记为依据,利用候选SNP位点进行秋眠性表型预测,同时结合机器学习算法获得类似于基于表型选择的预测准确率。研究人员对ElasticNet、lasso、ridge regression、SVM linear 和 SVM poly 等5种预测模型进行了分析比较和交叉验证,发现SVM linear预测模型具有高准确率和最佳回归系数。进一步利用单株个体秋眠性表型预测品种内平均表型,结合单株个体秋眠性GWAS关联SNP标记和SVM linear模型进行平均表型预测,结果表明预测准确率可达64.1%。该研究为利用基因组预测方法开展紫花苜蓿分子育种提供了重要的理论依据。
图1:不同机器学习模型的预测准确率
中国农业科学院北京畜牧兽医研究所为该研究第一完成单位。张帆博士研究生为论文第一作者,杨青川研究员、华盛顿州立大学张志武教授为共同通讯作者。
该研究得到国家自然基金、国家牧草产业技术体系、内蒙古科技重大专项和国家公派留学等项目的资助。
原文链接:https://doi.org/10.1093/hr/uhac225