
中華蟾蜍(Bufo gargarizans)隸屬蟾蜍科蟾蜍屬,俗名“癞蛤蟆”, 是我國最常見也最爲人所熟知的兩棲動物。蟾蜍在我國的傳統文化中占有重要的地位,在神話傳說中,蟾蜍是嫦娥的化身,和玉兔一起居住在月亮上,因此月亮也被曆代文人稱爲“蟾宮”,蟾蜍被稱爲“月精”。蟾蜍自古以来都是美好意愿的象征。中秋佳节,各家各户焚香拜月,祈愿蟾宮折桂,平步青云;家庭美满,圆如皓月。蟾蜍也是招财进宝的吉祥物被供奉于家家户户。此外,蟾蜍有较高的医药研究价值,其耳后腺和背部皮肤的分泌物有较强的毒性,成分复杂,主要是强心甾类化合物和生物碱,统称为蟾蜍毒素(Bufotoxin),有麻醉止痛的功效。
蟾蜍科(Bufonidae)物種的分布非常廣泛,在除了澳大利亞、馬達加斯加與南極洲以外的各大洲都有分布,可以說是最成功的兩棲動物類群。甘蔗蟾蜍(Rhinella marina)在被人为引入澳洲后迅速入侵土著物种的生境,泛滥成灾,造成了严重的生态系统破坏。中華蟾蜍在我国分布十分广泛,从岛屿到高原都有其足迹,其食性广泛,能适应各种不同的生境,强烈的毒性也让许多潜在的捕食者(蛇类等)望而却步。蟾蜍广布适应性的遗传机制目前还不清楚,通過基因组测序和组装可以帮助我们更好的了解这一重要的物种。相较其它动物,两栖动物的基因组破译是非常困难的,这主要是由于其基因组普遍较大,无尾两栖类(anurans)基因組大小多數範圍在2到8Gb之間,蚓螈(caecilians)多數達到~5-10 Gb,蝾螈(salamanders) 更是多數高達~20-60 Gb,基因組最大的是一種洞螈(Necturus lewisi),爲137Gb。另外,重複序列占比較高也是造成測序和組裝困難的主要原因之一。因此,目前兩棲動物的基因組數量較少,而且多數組裝呈高度片段化,質量不佳。近幾年發展成熟的長片段測序技術能夠跨過較長的重複區域,結合基因組輔助組裝技術有望得到較高質量的兩棲類基因組。
为了揭秘中華蟾蜍的适应性遗传机制,中國科學院成都生物研究所吕彬,江建平和傅金钟主导,联合国内多所高校科研人员,包括华中师大吴华,河南师大陈晓红,信阳师大宋晓威和西华师大廖文波共同发起了中華蟾蜍基因组测序项目,成功破译中華蟾蜍基因组,获得首个组装到染色体是水平的蟾蜍基因组参考圖谱。
研究利用了4種最新的測序組裝技術來構建參考基因組,包括PacBio長讀長測序(103X), BioNano光學圖譜(137X), 10x genomeics (130X)和Hi-C染色體構象捕獲技術(176X),總計産生了近3Tb的測序數據量。最終基因組組裝大小約4.55Gb,僅由747條scaffolds構成(6,822條for熱帶爪蟾Xenopus tropicalis),Scaffold N50達到539.8 Mb,gap占比僅爲1.79% ,96%的序列可以定位到11條染色体上(圖1A和圖2A)。比较发现中華蟾蜍与熱帶爪蟾的基因组染色体之间具有良好的共线性,推测至少经历过1次染色體融合和3次分裂事件(圖3A)。中華蟾蜍基因组是目前两栖动物中连续性最好的参考基因组(圖1B-D),爲两栖动物的基因进化和功能以及遗传学研究提供了重要的理论支撑。
蟾蜍基因組中重複序列占比爲65.5%,大部分爲長末端重複(LTR)序列,這與墨西哥鈍口螈(Ambystoma mexicanum)中的發現較爲近似,其基因組大小約爲32Gb。推測LTR反轉錄轉座子的轉座複制産生的大量拷貝可能是兩棲類基因組巨大的重要原因。基因結構注釋和比較發現越大的基因組擁有較長的基因間區和內含子,外顯子長度在不同物種間較爲保守(圖2B)。
研究发现中華蟾蜍中具有超多的多拷贝基因,在斑马鱼,甘蔗蟾蜍和墨西哥钝口螈中也存在类似的状况。我们知道斑马鱼经历了硬骨鱼全基因组加倍事件,基因复制数目在本研究物种中确实是最多的;而墨西哥钝口螈基因组是现今完成测序的最大的动物基因组,也发生了较多的基因复制事件;甘蔗蟾蜍和中華蟾蜍隶属蟾蜍科,都是“真蟾蜍”,大多数复制都是局部发生。中華蟾蜍中的基因复制方式以串联(TD)和近端複制(PD)爲主,並且TD和PD受到的正選擇壓力顯著高于其他複制方式(圖3B和C),推測這兩種複制方式可能與其環境適應性有關。
根据以上推断,我们进而分析了中華蟾蜍基因组中基因家族的擴張状况,发现有122個基因家族發生了顯著的擴張(圖4),化学感受基因家族显著富集,包括嗅觉和苦味受体基因。相比而言,中華蟾蜍的中性替换速率并不高,处于中间水平,但是其祖先却经历了快速的进化过程(圖4)。
和其他脊椎動物類似,兩棲動物同樣擁有數目龐大的嗅覺基因(800~1400 ORs this study),有功能的嗅覺基因占比60%~70%,众多的基因数目说明嗅觉对两栖动物的生存是比较重要的。中華蟾蜍中共鉴定出1013個嗅覺基因(圖5A和B),765個是完整可能有功能的,占比較高(~76%)。從功能和變化趨勢來說,蟾蜍感受空氣中化學分子的嗅覺基因增多且功能基因比例升高,水中則相反。信息素受體在種內和種間通訊中扮演著重要的角色,研究在蟾蜍中鑒定到5個完整的信息素受體1(V1Rs)但沒發現假基因,4個完整的信息素受體2(V2Rs)和33個假基因(圖5C)。V1Rs負責檢測空氣中揮發的小分子,V2Rs檢測水中的。多物種比較傾向支持從水到陸驅動的動態進化假說。
苦味受體能幫助動物感知食物是否有毒。苦味受體(TAS2Rs)在“真蟾蜍”中發生過3次急劇的擴張(圖5D),形成了130多個功能基因,分布在1,4,6,8和11號染色體上。與其他無尾目物種相比,其家族成員數目是最多的,完整基因的比例也是最高的(~80%)。蟾蜍分布廣且食性雜,大量的苦味受體有助于提高毒素檢測的能力。無獨有偶,先前關于美國白蛾入侵機制的研究(Wu et. al 2019)同樣發現了苦味受體的顯著擴張。
蟾蜍利用毒素進行防禦,但其如何避免自中毒是個有意思的話題。我們發現細胞色素P450基因家族中起代謝解毒作用的CYP2C亞家族在“真蟾蜍”中發生了顯著擴張(圖6A),中華蟾蜍中产生了39個基因,甘蔗蟾蜍中有35個,而其他無尾類都只有約一半的成員數。聚類分析發現了蟾蜍枝系特異性的CYP2C擴張(圖6A),分布在中華蟾蜍5號染色體上一段約3Mb的區域內(圖6B),通過PD (近端)和TD (串聯複制)方式形成。这些擴張的家族成员应是在祖先物种中就已经形成了。
離子通道基因在防止自中毒過程中發揮著重要的作用。舉一個著名的例子,箭毒蛙的煙堿乙酰膽堿受體只發生了1到2個位置的氨基酸替代就進化出了毒素耐受性(2017 Tarvin et. al)。我們發現一種煙堿乙酰膽堿受體CHRNE在中華蟾蜍,甘蔗蟾蜍和草莓箭毒蛙基因组中都产生了2個拷貝(圖7B),通過串聯複制产生,可能和抗生物碱毒性有关。此外,研究發現在“真蟾蜍”的鈉鉀離子泵基因的關鍵毒素結合區存在很多獨有的氨基酸突變(圖7A),先前实验证明有的位点突变能显著鉴定毒素结合敏感性,降低程度甚至能達到1000倍以上。有意思的是,这些关键区域的氨基酸位点在中華蟾蜍和甘蔗蟾蜍中是完全一致的,说明受到较强的功能限制。进化分析表明,相对其他物种,“真蟾蜍” 鈉鉀離子泵基因的經曆了快速的進化並受到正選擇壓力。
此外,研究發現6個與牙齒(牙釉質和牙本質)形成相關的基因在“真蟾蜍”祖先中就已經丟失(圖8)。這和無齒的龜,鳥類,須鯨一致,但都是獨立丟失的,說明四足動物牙齒形成機制是比較保守的。
該工作以“A large genome with chromosome-scale assembly sheds light on the evolutionary success of a true toad (Bufo gargarizans)”爲題發表在Molecular Ecology Resources上。研究得到國家自然基金(31729003,31600104, 31572245, 31872220),四川省科技廳應用基礎重點項目(18YYJC0171)和生態環境部生物多樣性調查監測與評價項目(2019–2023)等支持。論文链接:https://doi.org/10.1111/1755-0998.13319
圖1. (A) Hi-C热圖; (B-D) 兩棲無尾類基因組組裝連續性比較。
圖2. (A)中華蟾蜍基因组全景; (B) 不同動物類群基因組的基因區及基因間區長度示意。
圖3. (A)染色體共線性;(B)5種複制模式統計;(C)中華蟾蜍不同复制模式的选择压力比较。
圖4. 基因家族進化分析。枝顔色代表進化速率,黑框內數字爲分化時間,+擴張,-收縮。
圖5. 化學感受基因家族進化。(A)嗅覺受體類型和數量;(B)嗅覺受體不同類型在蟾蜍染色體上的分布;(C)信息素受體的類型;(D)苦味受体的擴張。
圖6. P450 CYP2C基因家族在真蟾蜍中发生支系特异性的擴張(A)和分布(B)。
圖7. 離子通道基因進化與毒素耐受性。(A-B)鈉鉀離子泵;(C-D) 煙堿乙酰膽堿受體.
圖8. 牙齒發育基因的多次獨立丟失。