了解茶树在遗传上与其近亲有何不同可能有助于茶树种植者弄清楚是什么让茶花叶子如此特别。属山茶包含超过100种-包括一些流行的装饰园林植物和油茶,产生“茶树”油的只有两个主要品种,在商业上种植用于制作茶叶。“有许多不同的口味,但神秘之处在于决定什么是茶味的遗传基础?”昆明植物研究所植物遗传学家李志智说。
以前的研究表明,茶的大部分味道都归功于一组被称为黄酮类的抗氧化剂,这些分子被认为可以帮助植物在环境中生存。其中一种称为儿茶素的苦味黄酮类与茶味特别相关。儿茶素和其他黄酮类化合物的水平因山茶花种类而异,咖啡因也是如此。高和他的同事发现,中华鳖的叶子不仅含有高水平的儿茶素,咖啡因和黄酮类化合物,而且还含有多种能产生咖啡因和黄酮类化合物的基因。
咖啡因和类黄酮如儿茶素不是蛋白质(因此不直接在基因组中编码),但茶叶中的遗传编码蛋白质制造它们。所有山茶属物种都有产生咖啡因和黄酮类化合物途径的基因,但每个物种都表达不同水平的基因。这种变化可以解释为什么C. sinensis叶子适合制作茶叶,而其他山茶花种类的叶子则不适合。
高和他的同事们估计,茶树基因组中超过一半的碱基对(67%)是反转录转座子序列的一部分,或者是“跳跃基因”,它们已经多次复制并粘贴到基因组中的不同位点。 。大量的反转录转座子导致茶树基因组大小的显着扩大,并且可能包括许多基因,包括抗病基因的许多重复。研究人员认为,这些“扩大的”基因家族必须帮助茶树适应不同的气候和环境压力,因为茶树在广泛的气候条件下在几个大陆上生长良好。由于大部分反转录转座子的复制和粘贴似乎最近都发生在茶树的进化史上,
然而,这些重复的基因和大量的重复序列也将茶树基因组组装成一场艰苦的战斗。“我们的实验室已成功测序并组装了20多种植物基因组,”高说。“但这个基因组,茶树基因组,很难。”
首先,茶树基因组结果比最初预期的要大得多。茶树基因组的长度为30.2亿碱基对,是咖啡植物基因组大小的四倍以上,比大多数测序植物物种大得多。使图片进一步复杂化的事实是许多基因是重复的或近似重复的。整个基因组太长而无法整体排列,因此科学家必须复制数千个基因组片段,对其进行测序,并识别出现在多个片段中的重叠序列。这些重叠站点成为用于以正确顺序排列片段的标志。然而,当基因组本身包含重复数百或数千次的序列时,那些重叠消失在重复的群体中; 它'
总而言之,即使使用现代测序,组装基因组也需要团队超过5年。
而且,还需要做更多的工作,包括双重检查基因组草案和对来自世界各地的不同茶树品种进行测序。“与基因图谱和新的测序技术的构建一起,我们正在研究一种更新的茶树基因组,它将调查一些风味,”高说。“我们将研究基因拷贝数变异,看看它们如何影响茶的特性,如风味。我们希望得到不同茶树变异的地图,并回答它是如何被驯化,培养和分散到世界各大洲的。”