编辑推荐:
疟疾严重威胁全球健康,疟原虫环子孢子蛋白(CSP)基因对疟疾疫苗研发意义重大,但此前其各区域进化过程不明。研究人员分析全球恶性疟原虫 CSP 基因序列,发现该基因中央重复区和 C 端进化过程不同,这有助于预测对疫苗研发重要的变异,推动疟疾防治研究。
疟疾,这个古老又致命的疾病,长期以来一直是全球公共卫生的重大威胁。据统计,2022 年全球有 2.49 亿疟疾病例,导致 60.8 万人死亡,其中大部分是非洲撒哈拉以南地区的 5 岁以下儿童。疟原虫(Plasmodium)的环子孢子蛋白(circumsporozoite protein,CSP)在疟原虫感染宿主的过程中扮演着关键角色,它不仅参与疟原虫与宿主细胞的结合,还能帮助疟原虫进入宿主细胞,是疟疾疫苗研发的重要靶点。然而,尽管 CSP 基因在疟疾感染和疫苗开发中至关重要,且已有大量测序数据,但此前对其不同区域的进化过程却缺乏深入研究。此前的研究大多聚焦于描述该基因的多态性,对于各区域独特的进化机制知之甚少。而 CSP 基因区域功能不同,其进化过程可能存在差异,深入了解这些进化过程,对于预测对疫苗研发重要的变异、开发更有效的疟疾疫苗具有重要意义。基于此,来自丹麦哥本哈根大学进化全息基因组学中心、流行病学系以及英国帝国理工学院全球传染病分析中心的研究人员开展了相关研究。研究成果发表在《Scientific Reports》上。
为探究疟原虫 CSP 基因的进化机制,研究人员采用了多种关键技术方法。首先,从 GenBank 数据库获取恶性疟原虫 CSP 基因的已发表序列,经过筛选得到 438 条有效序列,并使用 MACSE v1.02 进行编码序列比对。由于序列长度问题,将数据随机分为 5 个数据集,每个数据集 80 个样本。之后,运用 IQ - TREE2 v2.2.6 软件,在 5 种不同数量的类(H2、H3、H4、H5 和 H6)下进行混合建模,并利用赤池信息准则(AIC)进行模型选择和评估。
研究结果
- 样本多态性分析:多数序列来自非洲疟疾高发国家,如乌干达提供了 86 条序列。整个 CSP 抗原包含 217 个同义多态性和 446 个非同义多态性。N 端有 33 个同义、57 个非同义多态性;中央重复区有 164 个同义、328 个非同义多态性;C 端有 20 个同义、61 个非同义多态性1。
- 模型分类与区域关联:五个重复数据集虽样本和支持的替代模型类数量有差异,但都呈现出一些一致的模式,如 C - T 替代率较高。其中一个数据集支持三个替代类模型,Class 1 涵盖所有基因区域的位点;Class 2 中 90% 的位点位于中央重复区;Class 3 中 76% 的位点位于 C 端23。
- 地理分布与进化速度:通过分析类特异性与全基因分支长度的比率,发现进化最快的序列在地理上没有明显聚集,但 Class 2 和 Class 3 中快速进化分支的后代包含来自东南亚的样本,Class 2 中一个快速进化的谱系是非洲和委内瑞拉样本簇的祖先4。
- 不同区域替代类型差异:研究揭示 Class 1 和 Class 2 以高频率的 C - T 替代为特征,尤其是 Class 2,表明 CSP 中央重复区的进化主要涉及 C - T 替代;Class 3 则以 C - G 替代为主,且该类位点主要位于第一和第二密码子位置,意味着 C 端的进化大多是非同义的,可能受到选择限制;而 Class 2 的位点大多位于第三密码子位置,显示中央重复区存在广泛的中性进化56。
研究结论与讨论
该研究利用全球样本和系统发育替代模型混合物,揭示了恶性疟原虫 CSP 蛋白的进化新视角。中央重复区主要发生同义变化,可能由串联重复序列的频率变化驱动,且可能与密码子使用选择有关,影响疫苗效率;C 端则由非同义变化主导,可能与免疫逃避相关,突变可能影响免疫细胞的识别和结合。非洲和亚洲的菌株进化速度最快,与此前发现的这些地区菌株多态性最高一致。研究还发现,目前的数据采样与疟疾发病率并非完全成正比,可能导致分子进化分析的偏差。因此,未来结合广泛的基因组监测和复杂的进化建模,将有助于更好地理解病原体基因的进化轨迹,为疫苗开发提供更有力的支持。这一研究为疟疾疫苗研发提供了关键信息,有助于科学家更精准地预测 CSP 基因变异,开发出更有效的疟疾疫苗,对全球疟疾防控具有重要意义。