浅谈中国目前育种中的试验设计与分析

商业化育种在西方的起步比较早,育种规模逐渐变大也促使了育种家要不断处理更多的材料。下图显示的是1969年到1996年,平均每个育种团队的工作人员需要处理的小区数目的变化。

在今天, 平均一个人在处理的小区要远远超过1996年。 育种家的团队是由高素质的人才组成,繁琐的重复性工作, 大多被机械和电脑取代。也就是说,这种变化需要两种技术作为依托: 机械化和信息化。

中国目前最大的公司整个育种也只能达到一个国外大公司一两个育种家就能处理的规模, 即1-2万个组合,10万个左右的小区。 但是同样的工作我们往往需要一个30个人的团队才行。国外的育种家,一两个人, 加上一个规模很小的服务公司(也就是3,4个固定员工,并行为许多公司服务)就可以做同样的工作。并且试验准确程度要比中国的纯手工操作强的不只一个量级(我通过对比同样的品种,在中国和欧洲同时做的测试,我们的试验产量性状的CV超过15,国外的同样试验CV是3到4。一般情况下CV超过10,那个数你基本就可以不看了,还是育种家靠经验靠眼睛更有效些,这就是为什么中国只能经验育种的原因),其原因就是机械化和信息化。 机械化带来效率和准确度,信息话带来准确度和效率。这也是中国育种目前最需要的两项技术。注意这里不是或者的关系, 而是同样重要。 如果中国育种家想用规模超过育种家的眼睛,要研究这两种技术。

育种本来就是95%是没意义的工作,如果你管理不了误差,剩下那5%也都是错误的话,你们的工作就是白忙活。当然这也是中国所有公司的现状。

好了,说了半天的题外话,说说试验设计和分析。

目前我们使用的大多都是最简单的间比法,即没几个品种中间放置一个对照。 常用的有9个品种放1个对照, 或者18个品种放两个对照。对照的位置有固定位置,但最常见或者最优的方法是与其它品种一起随机化。这种试验设计是目前地力不均,手工播种误差很大,后期管理不得力的条件下,迫不得已的一种试验设计。其缺点是因为对照所浪费的小区过多。 试验只支持同一个区组内的分析(intra-block analysis)而区组间(inter-block)的比较只能通过对照, 并且误差很大。

在大规模的育种试验中, 这种试验一般会被lattice,alpha设计所取代。 Lattice或者Alpha设计这种不完全的区组试验,可以帮助育种家合理地安排待测品种与对照的比例,提供更准确的区组内与区组间的比较, 而且利用混线性模型(REML for mixed models)对试验的分析, 可以很好的处理缺失值与异常值。 缺失值将会根据区组和重复的信息被估计出来, 异常值会根据最后的异常值检验被甄别出来。 统计分析方法还会给出很多间比发没法提供的信息, 比如遗传力(heritability遗传方法/总体方差), CV,误差方差等等。这些信息都是进行育种试验绩效评估的有效手段。对于外包试验的育种家,对合作异地单位提供的数据进行分析和评估,是决策分析中的最重要环节,否则花了很多费用, 得到的都是低质量的数据,无论是对自己的工作, 时间, 财富, 还是自己辛辛苦苦培育出来的好材料,都是一种极大的浪费。

合理的分析也需要非常严谨的数据采集,DIB的数据采集器,需要对没一个性状进行最大值与最小值的设定。 这样在采集端就确保了数据录入的低级错误。



在导入到服务器端的过程中, 还有服务器端数据库的二次效验,从根本上确保了数据录入由于手写,手工录入中可能出现的错误。 这样高质量的数据可以被DIB系统自动的分析,处理,得到准确有效的数据分析结果,帮助育种家快速的处理大量的数据。

关于数据分析,DIB会在今年组织免费的培训,为大家讲解原理和可以利用的软件,希望大家关注我们的博客。

 

 

 

;