2026 年 JPM 医疗健康大会上,一个信号变得非常清晰:多家MNC(跨国药企)正将创纪录的预算砸向生成式AI管线。
随着大语言模型、扩散模型(Diffusion Models)以及流匹配(Flow Matching)等生成式AI技术的爆发性突破,一种全新的药物开发范式——“从头设计”(De Novo Design)——正在崛起。
行业正在进入一个新阶段:AI 不再只是“提高筛选效率”的辅助工具,而是开始重塑药物发现的分工与价值链,成为了创造的核心。
1. 破局之道:AI从头设计的底层技术逻辑
传统抗体发现主要依赖动物免疫与体外展示等技术路线,核心逻辑是对自然界已存在的多样性进行“挖掘与筛选”。但这一路径天然存在两道天花板:其一,免疫耐受使高度保守蛋白等高价值靶点难以诱导出高亲和力抗体;其二,物理抗体库容量通常在109至1011量级,面对近乎无限的序列空间(可达20100以上)覆盖率极低,导致对特定几何互补的难表位更像“概率游戏”。
AI从头设计(De Novo Design)旨在用生成式AI解决上述痛点:给定一个靶点(Target)的结构以及需要结合的位置(术语称为“表位”Epitope),生成一个能够与其形成特异性、结合的蛋白的序列和三维结构。
这一过程看似困难,其实只需要大量复合物结构数据就能实现——训练时,把蛋白复合物拆开,输入其中一半,让模型生成另一半。就像AlphaGo从大量棋谱中学会了下棋、GPT在大量问答数据中学会了解题、作诗,Sora/Veo从大量视频数据中学会了生成连贯的视频,全原子模型也在这个训练过程中学会了生成高亲和力的结合蛋白。
值得一提的是,这种模型的基础架构与AlphaFold 3这一结构预测模型(2024年诺贝尔化学奖成果)非常接近,只不过结构预测时输入的是完整的蛋白序列,从头设计时输入的是完整的靶点序列+用X表示待设计的结合蛋白序列。

从头设计技术使科学家不再依赖天然存在的骨架库,而是可以针对任意的表位,生成自然进化未曾探索过的全新蛋白,大大拓展了人类所能探索的蛋白空间。
2. 全球核心玩家图谱:谁在做原子级AI从头设计?
本章节将全景扫描当前市场上有能力进行蛋白从头设计的核心玩家,涵盖北美巨头、中国科技巨头及学术界新星。
2.1 国际核心玩家:资本与数据双轮驱动,筑起高阶壁垒
国际赛道目前以北美初创企业和科技大厂为主力。依托于充裕的早期融资(多为数千万至上亿美元级别)、顶尖的AI与合成生物学复合型团队,国际玩家在攻克“零先验”靶点、提升成药性指标方面占据了先机。
2.1.1 Chai-2:首克GPCR激动剂的行业先驱
· 开发机构: Chai Discovery(B轮),由Oak HC/FT和General Catalyst领投,OpenAI、Thrive Capital、等跟投,总融资额已超2亿美元。
· 创始团队:对大模型训练有着深厚理解的算法团队。CEO Joshua Meier 曾任Absci的首席AI官,是蛋白质语言模型里程碑ESM-1b和ESM-2的核心作者。CTO Jack Dent此前在Stripe和OpenAI担任核心工程职务。
· 主要成果:
○ 率先实现low-N抗体从头设计: Chai-2是业内最早实现low-N抗体从头设计的模型,在最多测试20个分子的情况下,对于50%的新靶点可以找到结合抗体。平均结合率接近20%,亲和力最高可达453 pM。
○ 首个从头设计的GPCR激动剂:设计的CCR8抗体EC50达到292 nM,且能够成功激活CCR8,这是业内首次报道完全由计算设计的GPCR激动剂 。
○ 原子级精度: Chai-2公开了5个冷冻电镜(Cryo-EM)解析的复合物结构,显示预测的抗原-抗体复合物结构与真实结构的RMSD低于1.7 Å,证明了设计模型的原子级精度。
○ 工业级可开发性:团队公布了对88个从头设计的IgG、27个VHH-Fc的可开发性评估结果,在纯度>90%的分子(81个IgG、17个VHH)中,79%以上达到工业级成药标准,热稳定性达标率高达100%。美中不足的是,聚集倾向似乎比benchmark略高。
2.2.2 JAM-2:多表位精准制导的靶向专家
· 开发机构: Nabla Bio(A轮),融资额$26M,由Radical Ventures领投。
· 创始团队:团队背景深度融合了高通量DNA测序/合成技术与生成式AI,这也是为什么他们能够自主产生湿实验数据。Surge Biswas (CEO) 在哈佛大学攻读博士期间师从George Church(合成生物学领军人物)。他在Church实验室开发了著名的AI蛋白质工程模型eUniRep。
· 主要成果:
○ 双位数的命中率:在针对16个从未见过的抗原测试中,JAM-2设计的VHH-Fc抗体平均命中率高达39%,全长mAb抗体的平均命中率达18% 。亲和力最高可达pM级(TrkA,<100 pM) ○ 突破GPCR: JAM-2成功针对多次跨膜蛋白(如CXCR4, CXCR7)设计了结合剂。其中针对CXCR4的抗体亲和力为1.4 nM 。
○ 多表位命中: 对10个靶点每个靶点指定20个表位进行抗体设计的实验结果显示,对于半数靶点,JAM-2能够针对30%以上的表位生成有效结合剂。这打破了传统免疫方法往往只针对一两个免疫显性表位的限制 。
○ 成药性评价: 约57%的设计通过了包括表达量、单分散性、疏水性在内的所有成药性测试,展示了良好的开发潜力 。
2.2.3 Latent-X2:首发临床风险评估的多面手
· 开发机构: Latent Labs(A轮),总投资额$50M,A轮由Radical Ventures和Sofinnova Partners领投、Google 首席科学家 Jeff Dean、Transformer发明人之一、Cohere CEO Aidan Gomez 等参投。
· 创始团队:由带队过 DeepMind AlphaFold 项目的 Richard Evans(CEO) 领衔。
· 主要成果:
○ 首发免疫原性数据: Latent-X2是首个发布时提供设计分子的人类细胞免疫原性验证数据的AI模型。10名人类捐赠者的PBMC进行的体外T细胞增殖实验显示,AI设计的anti-TNFL9 VHH分子未引起显著的免疫反应 。这缓解了AI设计蛋白可能导致临床ADA(抗药物抗体)风险增加的重大担忧。
○ 环肽从头设计: Latent-X2是一个多模态全原子生成模型,不仅能设计抗体,还能设计环肽。在针对著名的难成药胞内靶点K-Ras的挑战中,在只测试10个分子的前提下,Latent-X2得到的最优亲和力(5μM)甚至超过了万亿级(1012)mRNA库筛选出的分子。(编者注:该靶点PDB中存在复合物结构)
○ 极致的亲和力: 其在HDAC8靶点上实现了26.2 pM的IgG结合亲和力,创下了目前公开报道的AI从头设计抗体亲和力之最。
○ 成药性评估:约五成分子通过了所有成药性评价标准。部分分子疏水性、热稳定性不足。
2.2.4 Origin-1:押注海量闭环数据的传统AI药企
· 开发机构: Absci(纳斯达克上市,市值$450M)
· 创始团队:Absci 从大型科技公司(如 Google、Meta)挖角了大量 AI 人才(包括前述 Chai Discovery 的创始人 Joshua Meier)。其专有的 E. coli (大肠杆菌) 表达平台可提供 AI 训练所需的海量闭环数据。
· 主要成果:
○ 零先验设计能力: 虽然其命中率(约4%)、最佳亲和力(1.4 μM)相对较低,但对于传统方法束手无策、PDB中也没有已知复合物结构的“零先验”靶点,Origin-1提供了从0到1的可能性。
○ 结构验证: 通过Cryo-EM验证了AI设计结构的原子级精度。
○ 设计+实验流程公开透明:Origin-1虽然未开源,但64页的技术报告中对其干湿实验流程进行了详细介绍,增加了结果可信度,也为行业进步做了贡献。
2.2.5 BoltzGen:多模态设计的开源标杆
· 开发机构: Boltz PBC(共益企业),种子轮融资额$28M。
· 创始团队:由 MIT(麻省理工学院)学术精英组成的“AI 原生”团队。Gabriele Corso (CEO)是MIT CSAIL 博士,师从 Regina Barzilay 和 Tommi Jaakkola。以推动“扩散模型(Diffusion Models)”在药物研发中的应用而闻名,代表作包括DiffDock和Boltz系列。
· 主要成果:
○ 统一架构:BoltzGen将结构预测(Folding)和结构设计(Binder Design)统一于一个全原子大模型中。
○ 多模态能力: 除了设计结合蛋白的抗体(VHH)和小蛋白(最高亲和力6.1 nM),BoltzGen还能设计小分子的结合蛋白、结合蛋白的多肽、结合多肽的蛋白等新颖的、形态各异的蛋白分子(尽管亲和力并不高)。
2.2.6 Germinal:纳米抗体设计的开源模型
· 开发机构: Arc Institute (Brian Hie, Xiaojing Gao团队),目前拥有超过 6.5 亿美元的初始捐赠基金的非营利研究机构。
· 核心团队:由斯坦福大学团队领衔。Brian L. Hie是斯坦福大学助理教授,师从MIT计算生物学泰斗Bonnie Berger教授,曾任FAIR研究员,参与ESM蛋白质语言模型的研究。
· 主要成果:
○ 多样化靶点验证:在包括膜蛋白、细胞因子、病毒蛋白在内的4个靶点上,每个靶点测试不超过101个分子的前提下,Germinal实现了4%至22%结合率,最高亲和力达140nM。
○ 开源的幻觉模型:Germinal是在蛋白设计幻觉模型BindCraft基础引入抗体语言模型IgLM得到的抗体设计幻觉模型,代表了“幻觉”(hallucination)模型这一技术路线在抗体从头设计领域的成就。
2.2 国内 AI‑Native 力量:兼具全球顶尖AI基因与产业级落地能力
2.2.1 PXDesign:国产开源蛋白设计基础模型
· 开发机构:字节跳动(ByteDance)Seed团队
· 核心团队:
○ 肖文之 (Wenzhi Xiao):字节跳动Seed团队Tech Lead。北理硕士,曾任高德搜索引擎架构师。
○ 陈心诗 (Xinshi Chen):佐治亚理工学院(Georgia Tech)博士,师从 AI4S 专家宋乐(Le Song)教授,曾在橡树岭国家实验室、蚂蚁金服、FAIR等实习。
· 主要成果:
○ 高命中率的结合蛋白设计:在6个靶点的结合蛋白从头设计实验中,PXDesign成功设计了5个靶点的结合蛋白,成功项目中平均结合率45%,达到了国际一流水平。
○ 开源社区构建:基于字节自研的结构预测模型Protenix打造,该模型训练流程、数据和参数均开源。
○ 出色的设计效率:背靠字节优秀的算法工程团队,设计效率(单位时间内设计出的通过筛选的分子数)显著优于过往的开源模型。结合 Protenix 和 AF2-IG 双重评分体系,提高了真阳性率,减少了无效的湿实验投入。
2.2.2 IgGM:国产开源的抗体设计多面手
· 开发机构: Tencent AI Lab (腾讯)
· 核心团队:
○ 姚建华 (Jianhua Yao) :腾讯AI Lab副主任。加入腾讯前,曾在NIH临床中心担任高级研究员、放射学与影像科学系助理主任长达 15 年,在医学影像分析和数字病理领域有极深造诣。
○ 赵沛霖 (Peilin Zhao):腾讯AI Lab总监。南洋理工大学 (NTU) 博士,师从 Steven Hoi (海宏江) 教授(现 Salesforce AI 研究院副院长)。曾任职于罗格斯大学(Rutgers University)、新加坡资讯通信研究院(I2R)及百度。
· 主要成果:
○ 统一架构:IgGM同样统一了结构预测与设计。同架构模型经过微调后,还可进行序列设计。
○ 抗体工程化改造:IgGM是抗体工程化改造专家,能够赋能人源化、亲和力成熟设计。在一个抗体改造案例中,它通过改造抗体框架区,使本来结合hTNFα的抗体还能同时结合Protein A,实现了“一抗多能”。
○ 抗体从头设计:在PD-L1抗体从头设计中,IgGM设计的60个抗体中有7个成功结合,最高亲和力达84 pM,IC50达7.3 nM。
2.2.3 GeoFlow V3:能模拟自然“进化”的国产领军者
· 开发机构: BioGeometry/百奥几何(Pe-A轮),天使投资方为高榕资本,Pre-A轮由将门资本领投,智谱 AI、盛景嘉成跟投。
· 核心团队:
○ 唐建 (Founder & CEO):深度学习发源地之一、加拿大蒙特利尔学习算法研究所 (Mila) 终身教授。率先将扩散模型应用于药物研发(GeoDiff),开源AI制药框架TorchDrug、TorchProtein发起人。
· 主要成果:
○ 统一架构:百奥几何团队在25年初发布GeoFlow V2时就首次将结构预测与设计统一到了一个模型中,这一思想被半年后发布的BoltzGen采用。
○ 虚拟进化:不同于传统的“设计-筛选”模式,GeoFlow V3允许设计出的分子在计算机内模拟自然界的亲和力成熟过程,通过多轮“设计-筛选-进化”的迭代循环持续优化结合界面,提高了分子的结合率。
○ GPCR结合剂: 在7个靶点(其中包括GPCR靶点CCR8)、10个表位的从头设计项目中,GeoFlow V3在设计不超过50个分子的前提下均锁定了Hit分子,平均结合率达18.7%,最高亲和力36 nM。
○ 多表位命中:对TSLP、IL33、IL13等靶点,GeoFlow V3针对多个表位均拿到了结合抗体,展示了模型指定表位进行抗体从头设计的优秀能力。
3. 核心竞争力深剖:哪些指标决定了模型的商业生死线?
为了清晰展示各模型的竞争态势,下表对8个能够实现low-N抗体从头设计的模型进行了横向对比(凡未说明模态的,均为抗体从头设计结果)。

* 项目成功率100%的模型,可能未披露设计失败的靶点。
* 表格排名不分先后,以首字母为准
当前技术格局呈现出几大核心趋势:
· 中美“双头垄断”格局已现
顶尖AI抗体设计资源向中美极少数具备AI和生物双重复合背景的实验室集中。
从最高亲和力、攻克“零先验”靶点(没有已知抗原-抗体复合物的靶点)的个数、成药性评价的完整度等指标看,美国的Chai Discovery、Nabla Bio两家公司遥遥领先,是AI抗体从头设计商业化落地的引领者——当然,这与他们较早获得了大额融资,拥有更充裕的算力和湿实验预算不无关系。国内的字节、腾讯、百奥几何等公司正奋起直追,已经在一些领域实现了技术的创新和差异化。
· 靶标难度规律
从项目成功率、结合率看,生成难度排序呈现“小结合蛋白 < VHH(单域抗体/纳米抗体) < scFv/全抗”的规律。这可能与待设计蛋白结合界面的无序氨基酸个数有关。小蛋白(miniprotein)结合界面基本都有稳定的二级结构,VHH主要靠三个无序的CDR区结合,scFv/全抗中有六个无序的CDR区。
· 验证升维:从结合到功能+成药性
进入2026年,模型比拼的赛场已不止于结合率,还包括设计分子的功能活性、成药性、靶点的难度和商业价值。
○ 兼具工业级“成药性”:Chai-2、JAM-2、Latent-X2均强调其设计分子具备良好的成药性,个别分子甚至无需经过任何优化即可“直通”PCC阶段。这无疑极大加快了抗体药物的研发效率,给掌握相应技术的玩家带来明显的竞争优势。
○ 功能活性: Chai-2的GPCR激动剂案例证明,AI不仅能做拮抗剂(Antagonist),还具备设计GPCR激动剂(Agonist)的潜力。这意味着AI设计的药物分子有望精细调节受体构象,实现传统方法难以实现的功能。
○ 直面“零先验”,攻克不可成药靶点:一些靶点在公开数据库中已有大量结合抗体的序列/结构,AI设计起来相对简单。能否突破数据库中找不到、实际应用价值又极大的“零先验”、高价值靶点,已成为抗体从头设计模型商业化的一道必答题。
4. 未来终局思考:属于大分子发现的“AI自动驾驶”时代
如果说上一代AI制药(AlphaFold 2时代)是“AI辅助”,扮演的是帮人类筛选盲盒的副手;那么De Novo大模型时代,则是真正的“AI自动驾驶”:
· 分子不是“筛出来”的,而是“按目标生成出来”的;
· 迭代不是“一轮接着一轮实验”,而是“计算‑实验闭环快速收敛”;
· 平台的价值不只体现在“降低成本”,更体现在“打开以前打不开的靶点与功能空间”。
更现实的一句话是:当竞争转向难靶点、功能表位与可开发性时,没有从头设计能力的团队会越来越依赖外部供给,从而在高价值项目上失去议价与节奏控制。
4.1 为什么不能只靠“开源+数据”?算法本身仍是核心壁垒
有些人认为,数据是AI药物发现的唯一壁垒,只要给开源模型喂足了数据,就能抹平差距。
然而,当前全球垂直领域的顶尖从头设计模型大多选择闭源依然有其原因——数据不是自动兑换成结果。
首先,基于同样的PDB结构数据,从pre-AF到IsoDDE (AF4)的结构预测性能发生了翻天覆地的变化;拥有大量私有湿实验数据的Absci,其开发的Origin-1各项指标却不如完全利用公有数据训练的BoltzGen。
这证明优秀的模型架构、设计流程和微调能力本身就是核心壁垒。当然,有优秀模型能力、又能产生/获得大量湿实验数据、并能将二者高效整合、快速迭代的团队,将成为最终的赢家。
此外,同样能结合靶标的分子,功能活性却可能大不相同。Chai-2的核心竞争力之一在于能够从头设计GPCR激动剂,JAM-2、GeoFlow V3也展示了多表位命中的能力,这些都离不开模型“指定表位设计抗体”的能力,也是目前开源和闭源模型之间的一个重要差距。
4.2 巨头用脚投票:商业与临床的双重背书正在形成
跨国药企(MNC)的嗅觉最为敏锐。今年一开年,多家MNC巨头与AI公司宣布多项合作。例如礼来不仅设立了搭载万张大算力芯片的“药物AI工厂”,更豪掷重金绑定Chai Discovery;赛诺菲也掷出超25亿美元的天价订单绑定AI管线。
AI设计的分子并非只存在于计算机中。在临床端,Generate Biomedicines优化的重度哮喘分子(GB-0895)已昂首挺进全球III期临床试验(NCT07276724)。这一里程碑证明了AI优化的分子(GB-0895经过AI优化以提升亲和力和半衰期)不仅能成药,还能在安全性及疗效上挑战现有的标准疗法,临床有效度评估正在击碎所有关于AI分子的质疑。
产业的底层逻辑已被重写:那些对常规靶点卷价格、面对免疫耐受/GPCR等高价值难靶点束手无策的传统抗体药企,其管线估值体系正面临坍塌。
未来(也许就在3-5年后),当AI能够针对大多数靶点和表位生成高亲和力、高成药性抗体,掌握AI从头设计技术将成为药企留在生物医药最高竞技场上的入场券。
4.3 中国药企的选择逻辑与破局之道
随着海外跨国药企(MNC)争相以数千万甚至数十亿美元的体量锁定北美头部AI实验室的产能,大分子AI设计的战略价值已无需多言。
在这一轮底层AI架构的创新中,国内的顶尖AI力量并未缺席。国内如腾讯、字节等科技巨头提供的开源模型,极大繁荣了本土底层算力与算法生态。
但完全依赖互联网开源基建难以走通管线闭环。这如同提供了极好的“毛坯房”——药企在真实推进复杂靶点(如多次跨膜蛋白)、需要极低测试量(Low-N)以节约昂贵湿实验成本时,往往发现泛用型开源模型假阳性偏高。
那么,中国药企应当如何寻找那个懂产业、懂算法、又能做深度联合开发的同路人?基于全球技术演进脉络,理想的伴随式赋能体必须同时满足三个苛刻的硬指标:
· 掌握大模型底层架构及训练、微调能力;
· 具备零样本、零先验的从头设计能力;
· 拥有真刀真枪的高难靶点(如GPCR)、低筛选数量(Low-N)验证数据的“干湿闭环”能力。
当我们将这套工业级坐标系投射到本土行业版图中,答案几乎是唯一且明确的:站在这一生态位前列的,正是以百奥几何等为代表的顶尖人工智能驱动下的生物科技公司。
兼具全球视野的AI底层原创力与贴近国内产业真实痛点的工业交付能力,这种稀缺的结合,为国内大药企与创新Biotech提供了一个兼顾数据安全、迭代速度与极速管线突破的“最优解”。
4.4 结语:从 Copilot 到 Autopilot,拥抱大分子研发的 OpenClaw 拐点
正如近期引爆整个科技圈的“OpenClaw”等开源或高度自治的AI Agent项目所揭示的那样,人工智能的技术内核已经演化出了强大的自主规划、纠错反思以及跨系统执行能力。实验室中已经出现皮摩尔级的亲和力、双位数的命中率和优异的成药性。在这场无声却震撼的产业更迭中,能否积极拥抱以AI原生为内核的大分子设计生态,利用AI攻克那些“不可成药”的堡垒,将是每一家制药企业穿越周期、走向全球至高点的战略底牌。
✽本文资讯仅供参考,并不构成投资或采购等决策建议(承兑)。