当90%的候选药物倒在临床试验阶段,我们是否该重新审视整个研发范式的起点?
2025年4月,美国FDA发布了一份名为《减少临床前安全研究中动物实验的路线图》的政策文件,明确提出将在3到5年内,推动动物实验在临床前安全性评估中从常规选项逐步转向例外情形。同年12月,美国参议院以一致同意方式通过了 FDA 现代化法案3.0(FDA Modernization Act 3.0) ,它显示出美国监管体系继续朝类器官、器官芯片和AI计算模型等新方法学(New Approach Methodologies, NAMs)倾斜的立法方向。

这不是一次修修补补的政策微调。从2022年FDA现代化法案2.0取消动物实验的强制要求,到2025年,NIH宣布今后不再发布仅支持动物模型的资助公告,而是要求相关资助方向同时向人源方法和NAMs开放,再到英国政府同年发布国家级动物实验替代战略,一条清晰的全球性趋势已经形成:药物研发的临床前评价体系正在经历一场深刻的范式转换。
而在这场转换中,一个看似科幻的概念正在迅速从论文走向现实,那就是"虚拟细胞"。
一、动物实验的困境:一个被默认了近百年的假设正在瓦解
为什么要替代动物实验?这个问题的答案远不止伦理层面。

一个被反复引用的数据是:超过90%的在动物模型中表现良好的候选药物,最终未能获得FDA批准,失败原因主要集中在人体安全性和有效性上。换句话说,动物模型对人类药物反应的预测能力,远没有我们曾经以为的那么可靠。
这种预测失准在复杂疾病中尤为显著。癌症、阿尔茨海默病、子宫内膜异位症、脓毒症……这些疾病的发病机制涉及多种细胞类型的动态交互、微环境的持续演变以及个体间巨大的遗传差异,而传统的动物模型在捕捉这些人类特有的复杂性方面存在根本性的局限。
FDA在其路线图中坦率地指出:对于单克隆抗体等生物制品而言,动物模型的安全性预测价值尤其有限。FDA在路线图和同步发布的新闻稿中鼓励开发者在新药临床试验申报中纳入NAMs数据,并表示提交高质量非动物安全性数据的项目,未来有望获得更高效的审评支持。
这背后的逻辑其实很朴素:如果我们最终要在人体上验证药物的安全性和有效性,为什么不从一开始就使用更接近人类生物学的评价工具?
二、虚拟细胞:在计算机里"复刻"一个活的细胞
虚拟细胞(Virtual Cell)的概念并不新鲜,早在20世纪90年代就有研究者尝试用数学模型模拟细胞内的代谢通路。但过去几年发生的变化,让这个领域进入了完全不同的量级。
变化来自三个方向的汇聚。
1.数据层面的爆发
以单细胞RNA测序为代表的高通量组学技术日趋成熟,全球范围内积累的单细胞数据已达数十亿级别。这些数据就像数字化的"生命语料库",为AI模型的训练提供了前所未有的规模基础。
2.算法层面的突破
Transformer架构从自然语言处理领域迁移到生物学,催生了一批单细胞基础模型。scGPT、Geneformer、scBERT……这些模型借鉴了大语言模型的训练范式,试图从海量单细胞转录组数据中学习细胞的"语法规则",进而预测细胞在基因扰动、药物处理等条件下的行为变化。
3.产业与政策层面的推动力
诺贝尔奖得主David Baker创立的Xaira Therapeutics发布了涵盖超过800万个细胞样本的大规模扰动测序数据集;《自然》杂志将"生物学基础模型"列为2025年最值得期待的七大科技突破之一。
2025年6月,Arc研究所联合加州大学伯克利分校和斯坦福大学,发布了虚拟细胞模型"State"。

该模型整合了1.7亿个细胞的观测数据和超过1亿个细胞的扰动数据进行训练,能够预测干细胞、癌细胞和免疫细胞对药物、细胞因子和基因编辑的响应。在基准测试中,State对扰动效果的辨识能力较此前最优模型提升了50%,差异基因表达的预测准确率提高了一倍。
这意味着什么?简单来说,我们正在接近这样一个场景:在计算机中输入一个细胞的初始状态和一种外部干预(比如一种候选药物),模型就能输出这个细胞可能的反应轨迹。如果这种预测足够可靠,它可以在真正的实验之前,帮助研究者大幅缩小筛选范围、降低试错成本。
斯坦福大学教授Stephen Quake甚至预判,未来生物学研究可能90%依靠计算模拟,实验室操作只承担剩余的验证角色。
在国内,随着“十五五”规划纲要明确提出全面实施“人工智能+”行动、加快建设人工智能语料库、面向健康等领域建设高质量数据集,并将生物医药、生物制造、高端仪器和重大科技基础设施纳入重点布局,虚拟细胞所依赖的数据、模型、算力、仪器与应用场景,正在被系统性地纳入国家创新体系。
三、虚拟细胞的"阿喀琉斯之踵":你拿什么数据来训练和验证它?
但现实远比愿景复杂。
2026年2月发表在bioRxiv上的一篇重要论文发出了冷静的警告:虚拟细胞面临的核心瓶颈,不是模型架构不够复杂,而是训练数据对多样化生物学情境的覆盖严重不足。研究者发现,在同一个生物学背景下,简单的统计基线方法与复杂的深度学习模型表现相当;而当需要跨细胞类型、跨供体、跨时间点进行预测时,现有模型的泛化能力急剧下降。

Arc研究所在2025年底举办的首届虚拟细胞挑战赛(Virtual Cell Challenge)也印证了这一判断。尽管比赛吸引了114个国家超过5000名参赛者,最终结果显示:纯AI方法在多数指标上仍无法稳定超越简单的线性基线模型。

这指向了一个根本性的问题:虚拟细胞模型的天花板,很大程度上取决于训练和验证数据的质量与维度。
目前,绝大多数虚拟细胞模型主要依赖单细胞RNA测序数据。这类数据虽然能在基因表达层面提供丰富的快照信息,但它有几个难以回避的短板:
1.时间维度的缺失
scRNA-seq本质上是对细胞状态的一次性"拍照"。它记录的是某一瞬间的基因表达谱,但无法追踪同一个细胞在数小时、数天内的动态变化过程。而药物响应、细胞分化、免疫激活等生物学过程,恰恰是随时间展开的连续事件。
2.功能层面的空白
基因表达变化只是细胞响应的"上游信号"之一。一个细胞到底分泌了什么?分泌了多少?和邻近细胞如何互动?增殖速度发生了怎样的改变?形态出现了哪些特征性变化?这些功能性、表型性的信息,是scRNA-seq无法直接给出的。
3.因果关系的模糊
转录组数据捕捉的是相关性而非因果性。当一个基因被扰动后,数千个基因的表达都会发生变化,但哪些是直接后果、哪些是间接连锁反应、哪些只是噪声,仅凭转录组快照很难区分。
业内专家已经明确指出,要构建真正可靠的虚拟细胞,模型训练数据必须超越单细胞测序这个单一模态。光学和电子显微镜图像、蛋白质分泌动力学、细胞间物理接触与信号传递、代谢产物的实时变化……这些维度的实验数据,对于模型学习细胞行为的"因果语法"至关重要。
四、闭环验证:虚拟细胞的可信度必须建立在真实实验的地基上
发表在npj Digital Medicine上的一篇综述系统梳理了虚拟细胞从概念到临床转化的技术路径,提出了一个关键框架:闭环架构(Closed-loop Architecture)。

这个框架包含三个相互嵌套的循环。

内层是计算循环,负责模型的训练和内部校验;中层是实验循环,通过CRISPR功能验证、类器官药物测试等手段为计算预测提供真实世界的反馈;外层是转化循环,连接临床数据与监管审评。每两层之间设有"入口门控"和"出口门控",只有通过上一层验证的结论才能进入下一层。
这个框架揭示了一个深层逻辑:虚拟细胞的监管可接受度,最终取决于它被实验数据验证的充分程度。
2025年,FDA发布了关于AI模型在药物开发中应用的首份指导草案,提出了一套基于风险等级的模型可信度评估框架。
虽然目前还没有统一的标准来规定虚拟细胞模型需要达到多高的预测精度才能支撑新药临床试验申请,但方向已经明确:模型的每一个预测,都需要对应维度的实验数据来校准和确认。
如果模型预测某种抗体会引发特定的细胞因子风暴,就需要在真实的免疫细胞功能实验中验证这一预测。如果模型认为某个候选药物能有效抑制肿瘤细胞的生长,就需要追踪真实细胞在该药物作用下的增殖、凋亡和形态变化轨迹。如果模型计算出某种基因编辑会改变T细胞的杀伤功能,就需要在单细胞层面观察T细胞与靶细胞的动态相互作用。
这就引出了一个往往被忽视但至关重要的问题:在虚拟细胞的产业生态中,谁来提供这些多维度、时间分辨、单细胞精度的功能性实验数据?
五、数据供给侧的关键能力:我们需要怎样的实验平台?
让我们回到具体的生物学问题。
一个理想的虚拟细胞验证数据集应该具备什么特征?从已发表的研究和行业讨论中,可以归纳出几个核心维度:
单细胞分辨率:群体平均值会掩盖细胞间的异质性。一群看似相同的免疫细胞中,可能只有极少数具备真正的抗肿瘤能力。虚拟细胞模型要做到个体级别的预测,就需要单细胞精度的输入数据。
多参数同步表征:仅看基因表达是不够的。模型需要知道同一个细胞在同一时间点上的形态特征、表面标志物、分泌功能、增殖状态等多个维度的信息,才能构建足够丰富的"细胞画像"。
时间序列追踪:静态快照无法支撑动态预测。理想的数据应该能够记录同一批细胞在一段时间内的连续变化轨迹,包括对药物刺激的响应延迟、峰值时间、恢复过程等动力学参数。
功能性读出:最终决定一个细胞是否"有用"的,是它的功能输出。一个抗体分泌细胞到底能分泌多少抗体?一个CAR-T细胞到底能杀死多少肿瘤细胞?这些功能层面的量化数据,是虚拟细胞模型走向临床应用场景的最后一公里。
全流程可溯源:数据的可重现性和可溯源性是监管层面的硬性要求。每一步操作、每一帧图像、每一项测量都需要有完整的记录,以确保数据的质量和一致性。
具备上述能力的实验平台,在整个虚拟细胞的产业价值链中,扮演的角色类似于自动驾驶中的高精度传感器和高清地图数据采集车。无论算法多么先进,如果传感器的分辨率不够、地图数据的覆盖不全、标注的精度不高,自动驾驶系统就无法达到安全上路的标准。
同样的道理,虚拟细胞模型的预测精度上限,由训练和验证数据的质量决定。而这类数据的生成,需要能够在单细胞水平上完成精准操控、多维度表征、时间序列追踪和活细胞导出的一体化实验平台。
六、从"湿实验"到"数字孪生":一条正在形成的技术通路
如果我们把视野拉远,会看到一条正在成形的技术链条:

在这条链条的上游,是能够生成高质量、多维度单细胞功能数据的实验仪器平台。这些平台整合了微流控技术、光学操控技术、芯片培养技术和自动化软件,能够在封闭的微环境中追踪单个细胞从导入到筛选、从培养到表征、从功能检测到导出回收的全生命周期;在中游,是将这些实验数据进行标准化处理、注释和整合的数据平台。如同基因组学领域的GEO数据库和蛋白质结构领域的PDB数据库一样,虚拟细胞领域也在呼唤一个高质量、多模态的单细胞功能数据共享生态;在下游,是各种虚拟细胞基础模型和面向特定任务的特化模型。它们消化上游和中游的数据,输出对细胞行为的预测,并不断通过新一轮的实验验证来迭代优化。
这条链条的完整性决定了虚拟细胞的技术成熟度。目前来看,中游和下游正在快速发展,而上游的数据供给能力反而可能成为制约整体进展的关键变量。
值得注意的是,在这条链条中,光电镊(Optoelectronic Tweezers, OET)技术具有独特的潜在价值。这种技术利用光学投影产生的虚拟电极来操控细胞,无需物理接触即可实现单细胞的精准分离、定位和转移,同时保持细胞活力。当这种技术与微流控芯片、在线培养系统和AI图像分析相结合时,理论上可以构建一个从"活细胞实验"到"数字化数据输出"的完整工作流程,为虚拟细胞模型的训练和验证提供它最渴求的那类数据:带有时间标签、多维表征、单细胞分辨率、且可追溯的功能性实验记录。

追光生物OptoBot®1000系列高通量单细胞光流控分选仪
作为一款融合光电镊、全自动微流控芯片与 OptoMind®AI软件的高通量单细胞光流控分选仪,OptoBot®1000可实现从细胞自动导入、单细胞分离、片上培养、多维表征、功能筛选到活细胞导出的全流程自动化,并对实验过程进行实时成像、数据归档与溯源分析。
对于虚拟细胞这样的新方向而言,它的意义不只在于提升筛选效率,更在于为模型训练与实验验证提供更高分辨率、更多时间维度、也更接近真实生物过程的单细胞数据基础。
七、站在交叉点上:谁会成为这场范式转换中的关键角色?
回到本文开头的话题。FDA为什么开始接受计算模型替代动物实验?
表面的答案是:因为动物模型的预测价值正在被系统性地质疑,而新的替代方法正在快速成熟。
更深层的答案是:整个药物研发行业正在经历一次底层逻辑的重写。过去,我们是先在动物身上做完安全评估,再到人身上验证。未来,我们可能是先用计算模型做大规模的虚拟筛选和风险预判,再用精心设计的人源实验系统做针对性的确认,最后才进入临床。
在这个新的范式中,至少有三类角色将变得不可或缺:
能够构建和训练高精度虚拟细胞模型的AI与计算生物学团队;
能够设计和运行高质量人源实验验证的类器官与器官芯片平台;
能够在单细胞层面生成高维度、时间序列、功能性实验数据的仪器平台。
第三类角色可能是最容易被低估的。但正如前文所分析的,数据质量是虚拟细胞整个技术体系的地基。缺少了高质量的训练和验证数据,再精妙的算法也只是空中楼阁。
对于那些已经在单细胞功能筛选、精准操控、片上培养、多维表征和自动化数据采集方面建立了技术积累的生命科学仪器企业来说,这场范式转换或许意味着一个远超传统仪器市场的战略机遇:它们不仅是实验工具的提供者,更有可能成为虚拟细胞数据基础设施的核心组成部分。
当计算模拟的精度取决于真实实验的分辨率,当虚拟世界的可信度建立在物理世界的数据之上,那些能够在微观尺度上精确观测和操控生命的技术,就天然站在了这场变革的关键节点上。
虚拟细胞的时代正在到来。但它的到来,需要"虚拟"与"真实"的深度握手。
参考资料
-
FDA. Roadmap to Reducing Animal Testing in Preclinical Safety Studies. April 2025.
-
FDA Modernization Act 3.0. U.S. Senate, December 2025.
-
Arc Institute. State: A first-generation virtual cell model. June 2025.
-
Dibaeinia P, Babu S, Knudson M, et al. Virtual Cells Need Context, Not Just Scale. bioRxiv, February 2026.
-
npj Digital Medicine. AI-driven virtual cell models in preclinical research: technical pathways, validation mechanisms, and clinical translation potential. December 2025.
-
Arc Institute. Virtual Cell Challenge 2025 Wrap-Up. 2025.
-
Nature Biotechnology. FDA pushes to replace animal testing. May 2025.
-
Trends in Biotechnology. The FDA's Plan to Phase Out Animal Testing. January 2026.
-
Cell. Human interpretable grammar encodes multicellular systems biology models to democratize virtual cell laboratories. 2025.




粤公网安备44030002004557号
