深海虾视觉进化的探秘之旅:生物发光与环境光的影响
在深海那片神秘的世界里,光线是生物生存与演化的关键因素。近日,来自佛罗里达国际大学环境研究所和史密森学会国家自然历史博物馆无脊椎动物学系的研究人员 Danielle M. DeLeo 和 Heather D. Bracken-Grissom,在《Communications Biology》期刊上发表了题为 “Bioluminescence and environmental light drive the visual evolution of deep-sea shrimp (Oplophoroidea)” 的论文。这一研究成果意义重大,它深入揭示了深海虾(长额虾总科)在生物发光和环境光影响下的视觉进化机制,为理解深海生物如何适应独特环境提供了关键线索,也为生物进化领域的研究添上了重要一笔。
一、研究背景
深海,这个超过 200 米深度的神秘领域,光线成为了生物间交流的 “通用语言”。在这里,生物发光和下行光源共同作用,微弱地照亮着水柱。随着深度增加,下行光逐渐减弱,在 1000 米深处几乎消失,此时生物发光成为主要光源。在海洋生态系统中,光的用途广泛,从生物的避敌行为、昼夜活动变化,到作为深度测量的依据,甚至在捕食、防御和种内交流等方面都起着不可或缺的作用。对于深海生物而言,在黑暗环境中生存,光信号至关重要,它驱动着生物感官系统的进化。
在深海的远洋环境中,垂直迁移的动物面临着特殊的挑战。它们在不同深度间穿梭时,光照环境会发生剧烈变化,这种变化带来了独特的选择压力。它们需要区分环境光的变化和生物发光光源,以适应环境并生存繁衍。而光的检测依赖于各种光敏结构,从简单的含有光敏视蛋白的光感受器,到复杂的能够进行空间视觉的眼睛。视蛋白作为光检测的关键蛋白,其多样性差异会导致光感受器对不同波长光的敏感性不同,进而影响生物的视觉功能。
在长额虾总科的深海虾中,它们不仅是垂直迁移者,还进化出了独特的生物发光模式。这一总科包含约 70 个物种,所有物种都具备生物发光 “喷射物”,在受到惊吓时会释放,起到类似烟雾弹的作用,帮助它们躲避捕食者。此外,部分长额虾科的物种还进化出了一种额外的生物发光模式 —— 表皮光器官(photophores),这种器官在反照明、种内信号传递和光检测等方面发挥着重要作用。反照明是一种动态伪装行为,动物通过精确匹配下行光,使自己在下方捕食者眼中不那么显眼。此前的研究表明,一些具有光器官的长额虾眼睛除了拥有常见的蓝绿色光色素外,还具有近紫外光色素,这暗示着它们可能具有更复杂的视觉敏感性,以适应其特殊的发光和光照环境。然而,长额虾总科的视觉进化机制仍存在许多未知。
二、研究材料与方法
(一)样本采集与处理
研究样本采集自墨西哥湾和佛罗里达海峡,研究人员分别搭乘 RV Point Sur(2015 - 2018 年)、RV Sonne 和 RV Walton Smith(2016、2017 年)进行采样工作。采集工具采用 9 平方米的 Tucker 拖网(配备不透光、隔热的网底)或多开合网及环境传感系统(MOC - 10)。在船上,研究人员在昏暗的红光或低光条件下对采集到的虾进行分类,以避免损伤其光敏组织。样本随后保存在 RNAlater 中,先在 - 20°C 冷冻,然后运往佛罗里达国际大学,并在 - 80°C 下储存。对于大多数虾类物种,研究人员从三个生物学重复中小心地在 RNAlater 中解剖出眼组织;对于 Systellaspis braueri,由于仅有两个用于 RNA 研究的重复样本,而外群物种 Nematocarcinus ensifer 仅有一个样本。每个样本在 TRIzol? 试剂中离散匀浆,凭证标本则保存在佛罗里达国际甲壳类动物收藏馆(FICC)。
随后,研究人员使用 Trizol / 氯仿试剂和 rDNase(Macherey - Nagel)按照 DeLeo 等人描述的方案离散提取组织中的总 RNA。利用 Qubit 2.0 荧光计评估 RNA 的数量,通过凝胶电泳和 Agilent Bioanalyzer 评估 RNA 的完整性。使用 NEBNext? UltraTM II 定向文库制备试剂盒(用于 Illumina?),按照制造商的方案,从高质量 RNA 构建 RNA 测序(RNAseq)文库。文库的目标扩增子大小为 330bp,并包含用于 Illumina? 双指数适配器的 NEBNext 多重寡核苷酸。使用 AMPureXP 磁珠纯化 cDNA,将文库混合后在 Illumina HiSeq4000 上进行测序,以获得 150bp 的配对末端读数。
(二)转录组组装与评估
研究人员使用 FastQC 对原始 Illumina 数据进行质量评估,以确定质量和接头修剪的参数。使用 Trimmomatic v0.36 软件进行读数修剪,参数设定为 adapter.clip 4:30:10,min.read.length 30。在组装之前,使用 Rcorrector 对读数进行错误校正。针对每个物种,使用 Trinity v2.8.5 软件进行从头组装,构建组织特异性(眼)参考转录组。在组装过程中,采用电子归一化、最小重叠群长度设为 200bp、k - mer 大小设为 23(该参数已被证明对这些甲壳类 RNAseq 数据集是最优的)。随后,使用 Kraken v2.0 软件和细菌、古细菌及病毒数据库 Minikraken2,v2,默认参数去除每个组装中的污染。使用 BBduk 和 dedupe(BBTools 套件)去除重复转录本和 rRNA。通过 Transrate v1.0.3 和 BUSCO v3.0.2(使用 OrthoDB 的节肢动物参考数据集,包含 1066 个直系同源组,置信度设为 0.1)评估转录组的质量和完整性。所有转录组分析均在史密森学会的高性能计算集群 Hydra 上进行。
(三)系统发育树构建
对于每个物种,研究人员使用 Transdecoder v5.5.0 从组装的转录本中提取并翻译开放阅读框(ORF),包括之前已发表的 S. debilis 和 J. spinicauda 的转录组。使用 CD - HIT v4.8.1 软件聚类并去除冗余肽序列(-c 1.0 参数),然后运行 OrthoFinder(v2.5.4)(参数设定为 -S diamond -M msa -A mafft -T fasttree),以识别所有物种(包括外群,共 12 个物种)之间的一对一直系同源序列。利用最大似然法和分区分析,对单拷贝直系同源物(622 个)的多基因比对进行系统发育转录组分析,使用 IQTREE 软件(参数设定为 -m MFP --merge -rcluster 10 -bb 1000 -alrt 1000)重建长额虾总科的物种树。以深海长额虾 N. ensifer 作为外群对树进行生根,这是因为之前的研究表明它与目标总科是密切的进化谱系。
(四)视觉视蛋白多样性分析
研究人员使用经过修改用于命令行使用的系统发育信息注释(PIA)工具(PIA2)分析组装的转录组,该工具在系统发育背景下表征假定的视觉视蛋白和光转导途径基因。它首先从每个组装中提取所有开放阅读框,通过与已知视觉基因数据库的 BLAST 搜索识别光相互作用(LIT)基因,然后进行比对,并将显著的命中结果放入预先计算的基因系统发育树中,以区分假阳性和感兴趣的基因。重点关注横纹肌光转导途径(rtrans),其中包含无脊椎动物视觉视蛋白、视紫红质(r - 视蛋白)。通过与牛视紫红质(2.8?)模板的 PROMALS3D 结构比对以及随后对无脊椎动物 r - 视蛋白保守结构域、基序和残基的鉴定,确认 r - 视蛋白的身份。最初仅保留包含 2 个或更多保守元件且与长额虾总科中其他 r - 视蛋白具有至少 75% 序列同一性的假定视蛋白,以进一步过滤掉短片段和 / 或分歧序列。组装的异构体若相似度低于 99%,则保留用于下游分析。通过将假定的视蛋白序列与包含一系列光谱敏感性的视觉视蛋白以及非视觉视蛋白和相关 G 蛋白偶联受体(GPCR)的参考视蛋白数据集(n = 996)进行 PROMALS3D 比对,进一步优化和表征每个组装中的 r - 视蛋白多样性。使用 IQ - TREE v2.1.2 软件,采用 LG 通用氨基酸替换矩阵、FreeRate 模型(10 个速率类别)和经验碱基频率(LG + F + R10)重建系统发育树,并通过超快速自展近似(UFBoot,1000 次重复)和 Shimodaira–Hasegawa - 类似的近似似然比检验(SH - aLRT,1000 次重复)评估支持度。在生成最终的(仅节肢动物)视蛋白基因树之前,去除与非视觉视蛋白或外群比对的假阳性结果。
(五)祖先状态重建
使用 R 包 phytools 中的 make.simap 函数(nsim = 100)从后验概率分布中采样祖先状态,对视蛋白类型(表达的存在 / 不存在)进行随机字符映射,从而进行祖先状态重建(ASR)。测试了 “等速率” 模型(假设表达的性状获得和丢失的概率相等)和 “所有速率不同”(ARD)模型。通过拟合和比较扩展的 Mk 模型(fitMk)来确定离散字符进化的最佳模型,比较拟合模型的 Akaike 信息准则(AIC)值,选择 AIC 得分最低的模型。最终确定采用 “等速率” 模型(ER 模型)进行下游分析。使用 phytools 在得到充分支持的、有根的长额虾总科系统发育树上绘制一个表达视蛋白性状的随机字符图,并在每个节点上显示后验概率(饼图)。
对于长额虾总科光照环境的 ASR,根据物种在墨西哥湾已知分布范围的最浅深度(即最高光存在或最低光衰减)进行分类,分为浅表层(<200m)、上中层(200 - 400m)、中层(400 - 700m)或下中层(>700m)。由于物种的垂直迁移范围会因地理位置(即所在海洋)的环境因素而不同,所有垂直范围都根据大多数范围数据的采集地点进行优化,而不是跨所有海洋盆地进行汇总。墨西哥湾的深度信息来自文献,并通过 OBIS(
obis.org )的深度记录和佛罗里达国际甲壳类动物收藏馆(FICC)的元数据进行补充或修正。使用产生最低 AIC 得分的 ER 模型进行 ASR。
(六)选择信号检测
对假定的 r - 视蛋白序列进行进一步筛选,在适用的情况下,每个物种仅获取每种光谱类型的最长异构体。从 Transdecoder 输出中提取每个视蛋白的编码序列(CDS),并与每个视蛋白类型的视蛋白蛋白质比对一起,使用 pal2nal 生成密码子比对,用于 PAML 软件包中的 Codeml 程序。仅测试在大多数物种(>75% 的物种)中发现的视蛋白类型(n = 3,MWS1、MWS2、LWS2)。在 R 中对每个视蛋白类别修剪无根树,仅包含获得完整或大部分完整长度序列的物种。不同视蛋白类型中获得可用序列的物种有所不同,但在所有下游分析中,每个家族 / 类别都至少有两个代表性物种。
使用 OrthoFinder 在排除 N. ensifer 后,识别长额虾总科物种(n = 11)中的其他单拷贝直系同源基因。在 R 中生成去除外群 N. ensifer 的无根树,用于下游分析。在使用 Codeml 运行选择测试之前,使用自定义脚本从 Transdecoder 输出中提取每个直系同源基因的 CDS。将 CDS 和来自 OrthoFinder 的多序列肽比对(MSA)作为 pal2nal 的输入,生成用于 Codeml 的密码子比对。
使用 PAML 中的 Codeml 程序评估具有次生生物发光模式(光器官)的长额虾总科物种中每种视蛋白类型(MWS1、MWS2、LWS2)的适应性进化,估计 ω(dN/dS)。PAML 生成三个成对模型比较以识别选择信号:分支模型比较包括单比率(M0)模型(估计整个基因的一个平均 ω 值,作为零假设)和双比率(M2)模型(允许 ω 值在前景和背景分支中变化);位点模型用于估计正选择(ω>1)以及氨基酸位点(密码子)之间可变但跨分支 / 谱系相同的 ω 比率,近中性(M1a)模型作为零假设,仅允许两类位点(纯化选择 0<ω<1,中性选择 ω = 1),而正选择(M2a)模型还允许正选择(ω>1);分支 - 位点模型根据光器官的存在进行分区,使用模型 A 零假设仅允许纯化或中性选择(0<ω<1,ω = 1),并与模型 A 替代假设进行比较,模型 A 替代假设允许前景物种中的正选择(ω>1),背景物种限制为两类(ω = 0 或 ω = 1)。还进行了其他比较,以确定视蛋白 / 基因是否在(a)长额虾科(n = 5 种)相对于长额虾亚科(n = 6 种)以及(b)在长额虾总科中达到最浅迁移深度(浅表层,<200m)的强垂直迁移长额虾(n = 3;J. spinicauda、S. debilis 和 O. gracilirostris)中受到选择。
使用似然比检验(LRT)确定成对模型比较之间的显著差异,即数据更符合零假设还是替代假设的参数。LRT 按照 Santagata 的方法进行,比较这些模型的似然得分(ΔLRT = 2×[lnL1 - lnL0]),使用 x2 分布计算 P 值,并对多个比较进行校正以限制错误发现率(FDR)。在(a)分支模型中,如果 LRT 显著(p<0.05)且 ω>1,以及(b)在分支 - 位点和位点模型中,如果 LRT 显著且通过贝叶斯经验贝叶斯(BEB)输出确定具有后验概率 > 95% 的正选择位点,则推断每种视蛋白存在适应性进化。通过在 Datamonkey 服务器上运行 HyPhy 中的 BUSTED - MH(v4.5)和 MEME 软件包来补充结果。BUSTED - MH 使用分支 - 位点随机效应模型测试基因范围内的 episodic 多样化,考虑位点间的同义速率变化和多核苷酸(或多命中,MH)替换,并允许 ω 值在分支间变化;MEME 可以使用混合效应进化模型在单个位点水平上检测 episodic 和普遍的正选择,尽管它不是前景特异性的。
对于通过 OrthoFinder 恢复的其他直系同源物,使用 PAML 运行分支 - 位点模型,以测试具有光器官的物种中是否存在正选择的证据。使用 blastp 确定具有显著 LRT 值(p<0.01)且具有正选择位点(后验概率> 95%,由 BEB 确定)的基因的身份。
(七)位点映射
由于 PAML 和 HyPhy 都检测到具有光器官的(前景)物种中 MWS2 视蛋白的假定正选择位点,因此将识别出的位点映射到预测的蛋白质结构上。首先,使用结构预测工具 Phobius(使用分支 - 位点比对中的第一个序列)获得跨膜螺旋预测。以 LWS2 视蛋白作为跨膜预测的参考,因为它是在 Phobius 中恢复所有七个跨膜结构域的唯一视蛋白。使用 Swiss - model 以跳跃蜘蛛视蛋白的 X 射线结构(6i9k.1.A)为模板进行 3D 蛋白质结构建模(GMQE 为 0.69,同一性为 40.8),该模板包含视网膜结合位点(RBS)信息。其他与视网膜相互作用的假定位点位于距 RBS 4? 范围内。使用蛋白质注释工具 Protter,结合 Phobius 和 Swiss - model 的输入,在结构背景下突出显示选择位点。
三、研究结果
(一)长额虾总科系统发育树重建
研究人员成功推断出长额虾总科的系统发育树(包含 11 个物种,涵盖了 WoRMS 中 8/10 个公认的属)。该树是基于 622 个单拷贝直系同源物构建的,以 N. ensifer 作为外群。结果显示,长额虾分为长额虾科和长额虾亚科两个单系分支,支持率均为 100/100(UFBoot/ShAlrt),除了一个节点(S. cristata 和 S. braueri,支持率为 98.9/97)外,其他节点的支持率也都很高。属的分组情况为:分支 1 包括 Janicella、Oplophorus、Systellaspis;分支 2 包括 Hymenodora、Ephyrina、Meningodora、Notostomus、Acanthephyra。
(二)视觉视蛋白多样性
研究发现,长额虾科和长额虾亚科内部及之间的视蛋白多样性差异很大。在整个两个科中,长额虾亚科物种的假定视蛋白类型数量差异最大,从最少的 2 种(H. gracillis,仅有 SWS2 和 LWS2)到最多的 5 种(Acanthephyra spp.)。在 Acanthephyra spp. 中,除了之前在长额虾科虾中发现的两种 MWS 视蛋白(M
打赏
下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究
10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!
欢迎下载Twist《不断变化的CRISPR筛选格局》电子书
单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析
下载《细胞内蛋白质互作分析方法电子书》