AlphaFold3 源码开源:开源了什么,没开源什么,DeepMind 为什么这样做?
AlphaFold3 又一次站到了结构生物学和 AI 制药的讨论中心。
这一次不是因为它发布了新的模型架构,也不是因为它在某个 benchmark 上刷新了指标,而是因为 DeepMind 在 AlphaFold3 v3.0.3 的 release notes 中,低调修改了一件很重要的事:AlphaFold3 的源代码许可证从 CC BY-NC-SA 4.0 调整为 Apache 2.0。
这看起来像是一次普通的版本更新。release notes 里还写着支持 Python 3.14、mmCIF 解析提速、糖链原子处理 bug 修复等内容。但真正值得注意的,是那一句“AlphaFold 3 code is now relicensed from CC BY-NC-SA 4.0 to Apache 2.0”。
对于不了解开源协议的人来说,这句话似乎只是法律文本的变化。但对于 AI 制药、结构预测、蛋白设计和商业研发来说,这其实是 AlphaFold3 发布以来最重要的一次开放策略调整。
不过,首先要把话说清楚:AlphaFold3 并没有“完全开源”。
这次开放的是源代码许可,不是模型能力本身的完全释放。更准确的说法应该是:AlphaFold3 的代码变得更开放了,但模型权重、输出结果和商业使用仍然受到严格限制。
一、AlphaFold3 到底开源了什么?
这次变化的核心,是 AlphaFold3 的源代码许可证从 CC BY-NC-SA 4.0 改成了 Apache 2.0。
CC BY-NC-SA 4.0 是一个带有明显非商业限制和“相同方式共享”要求的协议。简单说,它允许别人使用和修改,但不能用于商业目的,并且衍生作品也会受到类似条款的约束。对于学术研究来说,这种协议还能接受;但对于企业、开源社区和商业化工具链来说,它会带来很大的不确定性。
Apache 2.0 则完全不同。它是更宽松、更适合工程生态扩散的开源协议。代码可以被使用、修改、分发,也可以被集成进其他项目,甚至可以被商业软件吸收。对开源社区而言,这意味着 AlphaFold3 的代码不再是一个只能“看一看、学一学、不能轻易用”的参考实现,而是可以更合法、更自由地进入其他工程体系。
这件事的影响并不小。
过去,很多研究者虽然可以阅读 AlphaFold3 的代码,但在进行二次开发、工程复用、商业部署或者与其他开源项目融合时,总要面对协议边界问题。现在代码层面的限制被大幅放松,至少在源代码这一层,AlphaFold3 开始真正进入更开放的工程生态。
这对于学术界有利。研究者可以更方便地研究它的数据处理流程、推理 pipeline、结构输入输出组织、复杂分子系统建模方式以及工程优化细节。对于开源开发者而言,Apache 2.0 也意味着可以更放心地吸收其中的工程设计经验。
但问题在于,AlphaFold3 最有价值的部分并不只是代码。
二、AlphaFold3 仍然没有放开什么?
AlphaFold3 这次没有真正放开的,是模型权重、模型参数以及围绕这些权重产生的输出结果的自由使用权。
这才是理解这次事件的关键。
一个现代 AI 模型的价值,通常不只在代码,而在数据、训练过程、模型参数、计算资源和验证体系。代码可以告诉你模型怎么跑,权重才真正承载了模型“学到了什么”。如果只有代码,没有自由可用的权重,对很多用户来说,模型依然不能被完整、自由地使用。
AlphaFold3 的权重仍然受到单独条款约束。它主要面向大学、非营利机构、研究机构、教育机构、新闻机构和政府机构等非商业组织开放。商业 biotech、药企、商业研发团队,不能简单地下载权重后用于自己的药物研发项目。更重要的是,AlphaFold3 的输出也不能随意用于训练类似的生物分子结构预测模型。
所以,所谓“AlphaFold3 完全开源了”是不准确的。
更准确的判断是:AlphaFold3 开放了代码层面的使用空间,但没有放开模型能力的商业使用空间。它从“代码和权重都受限制”,变成了“代码宽松,权重和输出继续受控”。
这是一种非常典型的分层开放策略:把已经不再构成核心护城河的部分放出来,把真正有商业价值和战略价值的部分继续握在手里。
三、DeepMind 为什么选择现在放开代码?
表面上看,DeepMind 是在释放善意;但从产业格局看,这更像是一次被开源生态倒逼之后的战略调整。
AlphaFold3 在 2024 年发布时,确实引起了巨大关注。它不再只是预测单个蛋白质结构,而是面向更复杂的生物分子相互作用,包括蛋白质、核酸、小分子、离子和修饰残基等体系。对于结构生物学和 AI 制药来说,这当然是一次重要升级。
但问题也随之出现:AlphaFold3 的开放方式与 AlphaFold2 时代完全不同。
AlphaFold2 的代码和模型权重开放,极大推动了结构生物学、蛋白设计、药物发现和计算生物学社区的发展。很多人对 AlphaFold3 也有类似期待。但 AlphaFold3 最初发布时,代码和权重的限制明显更强,商业使用空间更窄,这让很多开发者和企业感到失望。
而开源社区并没有停下来等待 DeepMind。
过去一年多,围绕 AlphaFold3 能力边界的开源替代模型迅速出现。Boltz、Chai-1、Protenix、OpenFold3 等项目不断推进,有些开源代码,有些开放权重,有些甚至直接允许商业使用。这些项目不只是复现 AlphaFold3 的部分能力,而是在工程可用性、商业许可、任务扩展和下游药物研发场景上主动寻找突破口。
其中,Boltz-2 的出现尤其有代表性。它不再满足于结构预测,而是进一步把小分子结合亲和力预测纳入同一个 co-folding 模型框架。对药物研发来说,结构当然重要,但“结合得有多强”往往更接近早期筛选和 lead optimization 的核心问题。如果开源模型开始补齐这类下游能力,那么 AlphaFold3 公共版本的独特性就会被削弱。
在这种背景下,DeepMind 继续用非商业、带传染性的许可证限制代码,收益已经变小,代价却越来越大。
一方面,社区会继续批评它不够开放;另一方面,真正想要可商用模型的企业,可能已经转向 Boltz、Chai、Protenix 等许可更清晰的方案。继续卡住代码,并不能阻止生态发展,反而会让 AlphaFold3 在开源社区中逐渐变成一个“重要但不方便使用”的参考模型。
因此,把代码改成 Apache 2.0,是一个低成本但高收益的动作。
它可以缓和社区关系,降低开发者抵触情绪,让 AlphaFold3 的工程实现重新进入开源生态的中心讨论。同时,它又不会真正伤害 DeepMind 和 Isomorphic Labs 的核心商业模式,因为真正值钱的权重、内部增强模型、专有数据、药企合作和端到端研发服务并没有被放开。
这不是一次彻底开放,而是一次精确让步。
四、开源生态正在改变结构预测的竞争方式
AlphaFold 系列曾经代表了结构预测领域的“单一中心”。很多人谈到蛋白质结构预测,第一反应就是 AlphaFold。AlphaFold2 改变了蛋白质结构预测的基本格局,AlphaFold3 则进一步把问题推向更复杂的分子相互作用体系。
但现在,结构预测领域正在从“单一冠军时代”进入“多模型生态时代”。
这意味着,未来不会只有一个模型解决所有问题。不同模型会在不同任务上形成各自优势。有的模型擅长蛋白质单体结构,有的模型擅长蛋白-蛋白复合物,有的模型擅长小分子结合姿态,有的模型强调结合亲和力,有的模型更重视抗体-抗原体系,有的模型则在速度、可控性或商业许可上更有优势。
对于研究者和企业来说,问题也随之改变。
过去的问题是:我能不能用上 AlphaFold?
现在的问题变成了:在我的具体任务里,AlphaFold3、Boltz、Chai、Protenix、OpenFold3,以及 docking、MD、FEP 等方法应该如何组合?哪个模型更适合我的靶点?哪个模型在我的内部数据上更稳定?哪个模型的许可证允许商业使用?哪个模型更适合作为初筛工具,哪个模型更适合作为高精度验证工具?
这会让“模型选型能力”变得非常重要。
AI 制药并不是把一个模型接入流程就结束了。真正的研发场景中,需要面对靶点类型、配体类型、构象变化、口袋柔性、水分子效应、离子影响、糖基化修饰、抗体 CDR 构象、蛋白复合物动态变化等复杂问题。单一模型很难覆盖所有情况。
因此,AlphaFold3 源代码许可证变化的意义,不只是它自己更开放了,而是它进一步确认了一个趋势:结构预测正在变成一个多模型、多工具、多验证链条共同参与的生态系统。
五、对学术界、开源社区和药企意味着什么?
对学术界来说,这是好事。
代码变成 Apache 2.0 后,研究者可以更方便地阅读、复现、修改和教学。尤其是做结构预测、蛋白设计、抗体设计、多分子复合物建模的研究团队,可以更自由地分析 AlphaFold3 的实现细节,并将其中的工程经验用于自己的方法开发。
对开源社区来说,这也是一个重要信号。
Apache 2.0 意味着其他开源项目可以更合法地吸收 AlphaFold3 的代码实现和工程思想。未来 Boltz、Chai、Protenix、OpenFold3 这类模型,可能会更快借鉴 AlphaFold3 在输入处理、复杂分子表示、推理流程和置信度输出方面的设计。DeepMind 原本想用协议隔开的代码边界,现在变得更容易流动。
这会进一步加速开源生态追赶 AlphaFold3。
对商业公司来说,影响则更加微妙。
代码开放当然降低了学习和工程参考成本,但它并没有解决企业最关心的问题:能不能合规用于商业研发?
答案依然是:不能简单地直接使用 AlphaFold3 权重做商业研发。
因此,对于 biotech、药企和 AI 制药公司来说,AlphaFold3 仍然更适合作为学术参考、方法对照和理论基线,而不是直接作为商业产品或企业内部研发流程的核心模型。企业真正落地时,仍然需要优先考虑许可证更清晰的模型,或者建立自己的内部模型体系。
这也提醒企业,AI 模型选型不能只看精度,还要看许可证、数据来源、可解释性、可维护性、算力成本、部署方式和合规风险。
一个模型再强,如果不能用于商业场景,或者输出不能用于后续模型训练,那么它在企业研发流程中的价值就会大打折扣。
六、DeepMind 真的“没招了”吗?
我不太赞成简单说 DeepMind “没招了”。
更准确地说,DeepMind 是在承认现实之后,重新划定开放边界。
它确实受到了开源生态的压力。Boltz、Chai、Protenix、OpenFold3 等项目让社区看到,AlphaFold3 的能力并不是不可追赶的。尤其当这些模型在代码、权重和商业许可上更开放时,AlphaFold3 如果继续保持强限制,就会在社区心智中逐渐失去主动权。
但这不等于 DeepMind 失败了。
DeepMind 和 Isomorphic Labs 真正的商业价值,可能并不在 GitHub 上那份公开代码,而在内部更强模型、专有训练数据、药企合作资源、实验反馈闭环、计算平台和药物研发团队。对于大型药企来说,它们购买的也不是一段开源代码,而是一套能够参与真实药物研发流程的能力体系。
所以,代码开源并不意味着 DeepMind 放弃了商业护城河。相反,这可能是它把护城河从“代码协议”转移到“权重、数据、服务和研发体系”之后的自然结果。
代码这条线守得太死,已经没有太大收益;权重和商业服务,才是它真正要守住的东西。
七、AI 制药进入多模型组合时代
从 AI 制药角度看,这件事最重要的启示是:不要再把结构预测理解为“选一个最强模型”的问题。
未来更合理的方式,是多模型组合使用。
例如,在小分子药物研发中,可以用结构预测模型快速生成蛋白-配体复合物假设,用 docking 做初步构象采样,用 Boltz-2 这类模型评估结构和亲和力趋势,再用 MD、MM/GBSA、FEP 或实验数据进行进一步验证。对于抗体研发,可以结合抗体语言模型、结构预测模型、抗原表位分析、CDR 构象采样、人源性评估、聚集风险评估和可开发性筛选。
在蛋白设计中,结构预测模型也不应该孤立使用。它需要和生成模型、序列恢复模型、能量函数、可表达性预测、稳定性预测、免疫原性预测以及实验筛选闭环结合起来。
AlphaFold3 的价值仍然很大,但它不再是唯一答案。
它是一个强大的参考模型,一个重要的结构预测基线,一个值得研究的工程系统。但在真实 AI 制药流程中,企业和研究者需要的是一套模型组合策略,而不是对某一个模型的单点依赖。
未来的核心能力,不只是“会不会使用 AlphaFold3”,而是能否回答以下问题:
这个任务适合用哪个模型?
这个模型在我的靶点类型上可靠吗?
它的输出能不能进入下游训练?
它的许可证是否允许商业使用?
它和 docking、MD、FEP、实验验证之间如何衔接?
它的错误模式是什么?
它在企业内部 benchmark 上表现如何?
这些问题,才是 AI 制药真正落地时绕不开的问题。
八、结语:这不是终点,而是结构预测生态重新洗牌的开始
AlphaFold3 源代码改用 Apache 2.0,表面上是一次许可证调整,实际上是结构预测生态变化后的战略再定位。
它说明 DeepMind 已经意识到,继续限制代码并不能阻止开源生态追赶。与其让 AlphaFold3 在社区中变成一个被围观但难以复用的封闭参考,不如放开代码,重新进入开源开发者的工作流。
但它也说明,DeepMind 并没有真正放开 AlphaFold3 的核心能力。权重、输出、商业使用和内部增强模型仍然是被严格控制的部分。
因此,这次事件不能被简单理解为“AlphaFold3 完全开源了”,也不宜被情绪化地解读为“DeepMind 没招了”。更准确的判断是:AlphaFold3 的代码开放了,但模型能力仍然受控;DeepMind 在代码层面做出让步,但在商业价值层面继续防守。
对于 AI 制药行业来说,真正重要的不是某一个模型是否开放,而是结构预测正在进入多模型竞争、多工具组合、多证据验证的新阶段。
AlphaFold3 仍然重要,但它已经不再是唯一中心。
未来的竞争,不再是谁拥有一个最强模型,而是谁能把模型、数据、实验、物理计算和药物研发流程组织成一套真正可用的智能研发体系。
转载自CSDN-专业IT技术社区
原文链接:https://blog.csdn.net/a13730374634/article/details/161870475



