本文是一篇医学论文,本文针对少孢节丛孢受线虫诱导从而生成三维菌网整个过程的基因调控网络进行研究分析,从转录组学分析入手,介绍了前期课题对捕食线虫真菌少孢节丛孢(Arthrobotrys oligospora)捕食器官生长情况的研究,利用RNA-seq技术,对线虫提取物诱导前后十个时间点的少孢节丛孢的RNA序列进行双端测序分析。对测序数据进行质量控制并对结果进行整合,结果表明测序数据质量合格并可以用于后续分析。
第一章 绪论
1.1生物学背景
1.1.1 植物寄生线虫的危害
线虫是一种假体腔多细胞原生动物,属于线虫动物门,根据寄主的差异可将寄生线虫分成植物寄生线虫和动物寄生线虫。植物寄生线虫分布区域广,品种也很多,可寄生于2000多种植物上,并可快速繁殖,且生活史短。由于具备这些特点,植物寄生线虫对农作物造成了严重的伤害,通过寄生于多种作物的多种器官,吸食作物营养。受害作物可能同时寄生多种线虫,感染后很难正常成长,出现根部肿大畸形,根组织变黑腐烂,种子更小,萌发率更低等症状[1]。同时,这些植物寄生线虫还能够污染土壤,造成土壤不适合耕种,进而造成更大的经济损失。据统计,在全世界范围内,56个属共150多种植物寄生线虫具备寄生热带经济农作物橄榄树并破坏其正常生长的能力[2],经济损失累计超过了1000亿美元[3]。在坦桑尼亚、厄尔多尔和马拉维等地区由于根结线虫的寄生导致园艺作物产量至少降低25%,尤其是在厄尔多尔这种现象最为显著[4]。
1.1.2 植物寄生线虫的防治
植物寄生线虫的泛滥和影响致使人们不得不对其进行防治。早期的时候,人们使用相对传统的方法,如堆肥、水淹、土壤暴晒等。但是这些措施都或多或少对土壤结构造成一定影响,导致土壤的退化,从而难以耕种。同时,这些传统方法防治周期较长,起效相当缓慢。这些方法渐渐无法解决日益增长的人口与生存需要之间的矛盾,致使人们开始寻找能够完美替代传统物理治理方法的防治手段。在此背景下,化学防治逐渐登上历史舞台,成为新一代防治植物寄生线虫的手段。使用化学农药杀虫剂可以快速高效地防治线虫。但是,杀虫剂价格昂贵,成本过高,并没有在发展中国家推广。同时,诸如溴甲烷、1,3-二氯丙烯这类有毒化学物质不仅大幅度造成环境污染和公共卫生危害,而且重复使用的防治效果大大降低甚至失效[5, 6],致使发达国家也开始排斥化学防治。
1.2捕食线虫真菌的研究进展
人类基因组计划[20]的成功推动了包括真菌组学在内的多生物组学的发展。相比于其他物种,真菌基因组成分较简单,结构不太复杂,从而使真菌早已成为模式生物用于真核生物的研究。模式生物酿酒酵母全基因组测序工作的首次完成,开启了真菌组学研究大门[21]。2002年,裂殖酵母测序和注释工作完成[22],通过鉴定了在真核细胞中非常关键的高度保守基因,包括了细胞骨架、区隔、细胞周期调节、蛋白质水解、蛋白质磷酸化以及RNA剪接所必需的基因,结果表明了从原核生物向真核生物的转换比从单细胞组织向多细胞组织的转换需要更多的新基因。紧接着在2003年,James E. Galagan实验得出了粗糙脉孢菌(Neurospora crassa)的高质量草图测序序列[23]。粗糙脉孢菌是二十世纪遗传学、生物化学与分子生物学史上的关键生物。通过对粗糙脉孢菌基因组分析研究表明,重复诱导点突变(RIP)对基因组进化产生了深远的影响。为推广真菌基因组研究,使更多的特异性真菌运用到工农业生产中,美国Broad研究所开始启动了真菌基因组测序计划,促进真菌基因组研究并应用于工农业生产中,至此大规模真菌基因组学研究已走向常规化,越来越多的真菌基因组也已经被研究并测序完成,极大地丰富了真菌基因组数据库的数量。在2012年的统计结果中表明,353种真菌已经完成了基因组测序[24],在2020年已超过了1000种真菌。
捕食线虫真菌转录组学的研究主要是通过转录组测序方法来挖掘差异表达基因,分析差异表达基因功能,提取与真菌捕食功能相关联的差异表达基因进行后续研究。2005年,瑞典隆德大学Ahren等[25]通过基因芯片技术对坚黏孢单顶孢菌的不同功能菌丝进行基因差异表达分析,结果表明23%的差异表达基因在不同菌丝内的表达量不同。功能注释表明这些差异表达基因主要参与了真菌细胞极性生长、转录过程以及碳代谢等生物过程。2008年,Fekete等[26]将坚黏孢单顶孢菌捕食过程分为几个阶段,从中发现基因表达水平在不同阶段的变化较大。在捕食初期阶段即粘球开始粘附线虫表面,丝氨酸蛋白酶相关基因以及部分调节基因表达量显著变化;在捕食中后期阶段,大量线虫被真菌侵染,停止生命活动,分析表明此阶段共有372个基因显著上调。在整个捕食过程中,这些大量显著变化的基因具有重要的生物学意义,促进了坚黏孢单顶孢物种的捕食机制研究进展。
第二章 实验数据与方法
2.1实验数据
对少孢节丛孢从未诱导状态到加入线虫后,再到受线虫诱导生成三维菌网的九个时间点(加入线虫0h、1h、2h、3h、4h、6h、8h、12h、16h)进行显微镜观察并拍照,如图2-1所示。
图中九张图分别代表加入线虫后的九个时间点的少孢节丛孢的形态,0h到3h均未发现明显的萌芽;加入线虫4h,此时少孢节丛孢开始出现萌芽;加入线虫8h,此时少孢节丛孢形成了三维菌网的第1个分枝;加入线虫12h,此时少孢节丛孢形成了三维菌网的第2个分枝;加入线虫16h,此时少孢节丛孢形成了完整的三维菌网。具体的捕食器官为红圈标注部分。
2.2转录组学分析方法
2.2.1 序列质控
通过测序平台产出的结果为原始数据(Raw Data),Raw Data的格式通常为FASTQ格式。本课题测序10个连续的时间点,分别为:还未加入线虫的时间点0a,刚加入线虫的时间点0b,加入线虫后的第1、2、3、4、6、8、12、16个小时时间点,每个时间点进行3组生物学重复,通过双端测序共得到60组测序结果。一般情况下,FASTQ文件中一个序列单元由四行组成:第一行展示的是序列标识(ID)和部分其他信息;第二行展示的是碱基序列;第三行一般仅有“+”符号;第四行展示的是碱基序列中每个碱基对应的质量打分编码,因此长度与碱基序列相同。具体的FASTQ格式文件如图2-2所示。
在进行后续转录组数据分析之前必须对Raw Data进行处理,包括:Reads中每个碱基位置的平均质量值、序列平均GC含量分布、接头残留情况和接头污染情况等,然后获得Clean Data,并进行测序质量评估。 本文在Linux环境下使用FastQC[47]软件对60组测序数据进行序列质量控制,并将结果用MultiQC[48]软件进行整合。
第三章 结果 .......................................... 23
3.1序列质控 ............................................... 23
3.2序列比对 ........................................ 26
第四章 讨论与分析 .................................. 54
4.1基于部分基因的讨论与分析 ....................................... 54
4.1.1 hub基因 .................................... 54
4.1.2 表达量显著变化Top20基因 ....................... 55
第五章 总结与展望 ..................................... 62
5.1本文工作总结 ......................................... 62
5.2未来工作展望 ....................................... 62
第四章 讨论与分析
4.1基于部分基因的讨论与分析
4.1.1 hub基因
基于LeaderRank迭代算法得出的基因排序,取前20基因作为hub基因进行分析。这20个基因功能主要有:具有水解酶活性(ao0309390)、具有丝氨酸型羧肽酶活性、具有催化活性、水解O-糖基化合物、具有脂酰(辛酰基)转移酶活性、具有核苷酸转移酶活性、具有甘露糖乙醇胺磷酸转移酶活性、具有NAD+激酶活性、单链DNA结合(RNA结合、序列特异性DNA结合)、具有转录共激活因子活性(蛋白质结合、锌离子结合)、ATP结合(具有ATP酶活性、未折叠蛋白结合)、具有氧化还原酶活性(FAD结合,ao0309249)、具有NADH脱氢酶活性;参与的生物过程主要有:蛋白质水解、有机代谢过程、高尔基体囊泡介导的转运、生物合成过程、RNA代谢过程、RNA聚合酶Ⅱ对转录的调控(组蛋白乙酰化的调节)、蛋白质折叠、氧化还原过程。
线虫的体壁和卵壳保护线虫自身安全,在线虫的生活活动中起着关键作用。食线虫真菌在侵染过程中首先要突破线虫的体壁或卵壳,而它们所产生的胞外水解酶能够降解线虫体壁和卵壳中的蛋白质等结构成分并在侵染过程中发挥着重要的作用[86],因此具有水解酶活性的ao0309390基因排序为第一可能说明少孢节丛孢受线虫诱导后需要生成大量水解酶来为后续对线虫的侵染做准备。基因ao0309390从未诱导状态到诱导前期显著上调,之后缓慢下调,可能说明在诱导前期少孢节丛孢迅速产生大量水解酶用来降解线虫体壁和卵壳结构。基因ao0303060具有丝氨酸羧肽酶活性,同时参与蛋白质水解过程,且基因表达趋势相似,根据同源聚类结果显示这两个基因属于同一组,这一结果可能说明此基因与ao0309390共同参与线虫的侵染过程。基因ao0305429参与蛋白质糖基化过程,蛋白质糖基化过程是在酶的控制下,蛋白质附加上糖类的过程,起始于内质网,结束于高尔基体。糖转移到蛋白质需要糖基转移酶的参与,在与蛋白质上的氨基酸残基结合后,糖最终转变成糖苷键。蛋白质经过糖基化作用,形成糖蛋白[87]。该基因同时也是膜的组成成分,因此可能说明是膜蛋白的糖基化,帮助蛋白质折叠功能作用。几乎所有生物中均含有核苷酸转移酶,该酶可以催化核糖核苷酸还原等生物过程、参与合成和修复DNA以及调控细胞的增殖和分化。
第五章 总结与展望
5.1本文工作总结
本文针对少孢节丛孢受线虫诱导从而生成三维菌网整个过程的基因调控网络进行研究分析,从转录组学分析入手,介绍了前期课题对捕食线虫真菌少孢节丛孢(Arthrobotrys oligospora)捕食器官生长情况的研究,利用RNA-seq技术,对线虫提取物诱导前后十个时间点的少孢节丛孢的RNA序列进行双端测序分析。对测序数据进行质量控制并对结果进行整合,结果表明测序数据质量合格并可以用于后续分析。进行双端比对,结果表明不存在其他物种污染。计算基因表达量,并过滤掉不表达的基因,得到最终标准基因表达矩阵。计算生物学重复相关性,结果验证了生物学重复效果较好。对基因表达矩阵中每两个时间点进行差异表达分析,得到差异表达基因集。对基因表达矩阵进行STEM聚类分析和biclust双向聚类分析,分别得到不同的聚类基因集。根据差异表达分析结果分析不同时间段的基因表达趋势,得到基因表达趋势基因集。统计每个基因在10个时间点表达量的变化量,分析显著变化量靠前的基因功能。通过构建基因调控网络,计算网络拓扑参数,并证明了该网络为小世界网络。设计迭代算法计算每个基因的代表值LR,寻找网络中的hub基因,并和PPI网络分析作对比。根据每个基因的代表值遍历网络来寻找网络社区,得到网络社区基因集。最后基于部分基因、基于显著差异基因、基于不同基因集和网络社区进行功能注释和富集分析,并对结果进行讨论与分析,完成整个课题工作。
参考文献(略)