通过GenScript的OptimumAntigen™设计程序生成的多肽序列,是经过业界先进的抗原设计算法进行优化过的。每个肽段都是根据几个蛋白数据库进行测定,以确定所需表位的特异性。 OptimumAntigen™设计工具的优势是避免未暴露的抗原表位、拥有用户指定所需的交叉反应活性的能力、强抗原性、识别所需实验的最佳偶联位点、使用内置的多肽合成和溶解度教程,并保证抗原的免疫反应。
1. 序列长度:用于产生抗体的多肽抗原,一般长度在10-20个残基范围内。
较短的序列可能会有更高的特异性,但较短的序列存在识别位点不被暴露在天然蛋白表面的风险。相比之下,较长的序列可能特异性不高,但产生的抗体更容易识别天然蛋白质。长度为10-20个残基的肽序列最容易合成,因为它们容易溶解在水溶液中,并且可能具有一定程度的二级结构。
2. 亲水性、表面导向和灵活性: 多肽抗原是针对表位序列产生的,这些表位序列很可能是亲水的、表面导向的和灵活的。
大多数天然存在的蛋白质在水溶液中时,它们的亲水残基在蛋白质的表面,而疏水残基则埋在蛋白质的内部。优化抗原设计选择亲水性、表面暴露序列的表位的策略是基于抗体倾向于结合蛋白表面的表位。此外,表位具有高度的流动性,因此灵活性也考虑在内。
3. 靶定N端或C端: 通常选择C端或N端生产抗肽抗体。
蛋白质的C-端和N-端经常被暴露,具有高度的灵活性,这使它们成为抗体生产的良好候选表位。虽然C端是一个很好的选择,但如果目标蛋白是一个完整的膜蛋白,而C端是跨膜区的一部分,这个序列的疏水性太大,就不是一个很好的候选。在这种情况下,N端是更好的选择。同样,前导序列不应该包含在抗体产生的序列中。
4. 连续和不连续表位: Optimum抗原设计工具将优先选择连续表位(线性表位)而不是不连续表位。
蛋白质的表位序列一般由6-12个氨基酸组成,可分为连续型和间断型。连续表位由蛋白质中连续的氨基酸序列组成。当表位序列暴露在蛋白表面时,抗体会与天然蛋白中的连续表位结合。不连续的表位由不相邻的氨基酸序列组成,这些氨基酸在肽链折叠或两个单独的肽链并行时聚集在一起。抗体可以识别不连续的表位,这取决于所使用的肽是否具有类似于表位的二级结构和/或蛋白质表位是否具有足够让低亲和力抗体结合的连续序列。
5. 算法: 我们的多肽抗原设计算法综合考虑了亲水性/疏水性、二级结构、普通的序列基元并整合了目前可用的算法优化多肽。
亲水性/疏水性:我们的抗原设计工具整合了几个常用的策略来预测亲水性/疏水性。 Hopp and Woods所描述的亲水性图为序列中的每个残基分配了一个平均亲水性值,而一系列相邻残基的平均亲水性的最高值通常位于或接近抗原决定簇。Kyte and Doolittle描述的稍微不同的算法评估了序列的亲水和疏水倾向。这一特征有利于预测天然蛋白质的内外部结构。
二级结构:二级结构可以通过Chou and Fasman或Lim开发的算法来识别。对包括α-螺旋,β-折叠和β-转角在内的结构区域的了解有助于选择潜在暴露的免疫原性内部序列进行抗体生成。具有高可及性的表面区域通常与螺旋形或扩展的二级结构区域接壤。另外,已经发现具有β-转角或两性螺旋特征的序列区是具有抗原性的。
序列基序: 我们避免了常见的可能会导致交叉反应的序列基序,如RGD基序、螺旋-环-螺旋序列、GTP结合位点和SH2结构域。我们也避免与某些生物活动相关的序列,如自溶卵裂激素活动和不希望的翻译后修饰。
多种算法整合:仅使用一种算法不能提供多种算法组合获得的优化,因此我们整合了很多算法软件包括MacVector,DNAStar和PC-gene。几种预测方法的联合使用可以使预测抗原性的成功率高达86%。
6. 表位分析和偶联方法:精心选择最佳模拟表位的化学偶联方式。
多肽太小不足以引起足够的免疫反应产生抗体。这就是为什么目的多肽与包含许多刺激T-辅助细胞的表位的载体蛋白结合。这些T-细胞诱导产生抗体的B细胞产生免疫应答。其中一些抗体除了针对肽段外,还会针对连接区域和载体蛋白本身。这些非特异性抗体可以在纯化或筛选过程中去除。具体来说,我们的偶联策略最大化了结构基内的表位暴露,并优化了到末端的取向。