一家中国ADC公司在和一家MNC谈License-Out。前期TS(条款清单)签得很顺利,双方进入正式尽职调查阶段。MNC的BD团队拿到了数据室访问权限,打开CMC文件夹一看:三个版本的细胞株开发报告,两个版本的工艺验证方案,批记录散落在四个不同的子文件夹中,文件命名规则没有统一——有的用日期命名,有的用版本号,有的干脆叫"final_v2_revised_updated"。MNC的CMC diligence团队花了三周才理清哪份文件是最新版本。交易timeline推迟了整整一个月。
这不是个例。a16z(Andreessen Horowitz)在分析数百家biotech数据室后指出,biotech数据室的需求和普通SaaS公司完全不同——文档横跨科学、法规、生产和商业多个领域,每个领域都有子层级,当数据室结构混乱时,尽职调查就会停滞。
CMC数据室的独特挑战
在License-Out交易中,CMC(Chemistry, Manufacturing and Controls)部分往往是尽职调查耗时最长的模块之一。Synerg BioPharma的分析指出,CMC尽职调查的核心目的是评估分子的可开发性(developability)和制造就绪度(manufacturing readiness)。而数据室的版本混乱会直接拉长这个评估周期。
CMC数据室的挑战有几个特殊性:
文档数量庞大且持续更新。一个进入Phase II的创新药项目,CMC相关文档可能有数百份——从细胞株开发报告到工艺开发总结,从分析方法验证到稳定性数据,从原液到制剂的每一道工序都有对应的开发报告、验证报告和批记录。这些文档不是静态的——随着工艺改进、新批次的放行、稳定性数据的累积,文档持续更新。
多团队协作。CMC数据室的内容由多个团队共同维护:工艺开发团队负责工艺报告,质量团队负责验证和偏差记录,CDMO负责批记录和放行数据,BD团队负责数据室的管理和权限控制。没有一个统一的版本治理框架,各团队各自为政,版本混乱几乎不可避免。
分阶段开放需求。License-Out交易通常分阶段推进——早期只开放概要信息,深入尽职调查阶段开放完整数据,最终阶段开放患者级别数据和生产机密。数据室需要支持这种分层权限管理。
分层数据室结构设计
Fast.io的制药数据室指南建议,数据室应按六到九个核心模块组织,每个模块有明确的子结构。Peony的数据室实践进一步指出,biotech数据室需要九个文件夹,CMC模块是其中最容易被低估的。
基于行业实践,CMC数据室建议按以下层级组织:
第一层:概要文档(所有潜在合作方可见)
- 产品概要(Product Summary):分子结构、作用机制、开发阶段
- CMC开发概要:工艺开发里程碑时间线、关键决策点
- 规格和标准:当前规格表(最新版本)、放行标准
- 监管状态:已提交的IND/CTA中CMC部分的摘要
第二层:详细开发数据(签署NDA后的diligence团队可见)
- 细胞株开发和表征报告
- 工艺开发报告(上游、下游、制剂)
- 分析方法开发和验证
- 工艺验证方案和报告
- 批记录和放行数据
- 稳定性研究方案和数据
- 原材料和辅料信息
第三层:敏感制造数据(最终谈判阶段可见)
- CDMO合同细节和责任矩阵
- 详细批生产和控制记录
- 偏差和CAPA记录
- 审计发现和整改报告
- 生产机密(know-how)
每层的访问权限独立控制。随着交易推进,逐步开放更深层次的文档。
版本控制的五条红线
CMC数据室的版本控制不是"nice to have",是交易成功的基础。以下五条规则应当作为硬性要求:
红线一:每个文档只有一个"当前版本"
数据室中不允许出现多个版本的同一文档同时可见。如果文档有更新,旧版本应当归档(保留但不显示给diligence团队),新版本取代旧版本成为唯一可见的"当前版本"。
Fast.io的实践表明,支持文件版本控制的数据室平台可以在更新文件时不破坏链接或丢失修订历史,审查者可以看到当前版本的同时追溯早期版本。
如果现有的数据室平台不支持自动版本控制,手动实现的方式是:每个文档的文件名包含版本号(如"Cell_Line_Development_Report_v3.1"),文件夹中只保留最新版本,旧版本移至"_Archive"子文件夹。
红线二:版本变更必须有变更记录
每次文档更新,必须附带一条简短的变更说明——改了什么、为什么改、谁批准的。没有变更说明的文档更新是不允许的。
变更记录可以是数据室平台自带的注释功能,也可以是一个独立的"变更日志"文档(Change Log),记录每次更新的详细信息。建议使用后者,因为它可以导出和共享。
红线三:名称中禁止"final"
"final""final_v2""final_final_revised"——这些文件名是数据室混乱的标志。文件命名应当使用结构化规则:{模块}_{文档类型}_{版本号}_{日期}。例如:DS_CellLine_Report_v3.1_2026-03-15。
Peony的创始人分享过一个亲身经历:一个Phase 2肿瘤公司的数据室中,批记录分散在四个文件夹中且命名不一致,MNC的BD团队48小时内就回来质问——CMC验证包在哪里?临床研究报告为什么混在pitch deck里?交易timeline因此推迟了三周。
红线四:交叉引用必须链接到具体版本
CMC文档之间的交叉引用非常普遍——工艺验证报告引用分析方法,分析方法引用稳定性数据。如果交叉引用指向的是旧版本,diligence团队会发现内容对不上。
处理方式:交叉引用应当指向版本号+文档ID,而不是文件名。当文档更新时,系统应当自动检查所有引用该文档的其他文档是否需要同步更新。
红线五:数据截断日期必须标注
License-Out交易中的CMC数据是时间快照——稳定性数据截至某个日期、批放行数据截至某个日期、偏差记录截至某个日期。每个数据集的"截断日期"(cutoff date)必须清晰标注,让diligence团队知道数据的时效性。
这条规则在"滚动尽职调查"(rolling diligence)中尤为关键。交易周期可能持续6-12个月,期间不断有新的批次放行、新的稳定性数据点生成。如果没有截断日期标注,diligence团队无从判断手上的数据是否是最新。
BD团队和CMC团队的协作治理
数据室管理不是BD团队或CMC团队任何一方能独立完成的。需要建立清晰的协作框架:
数据室管理员(通常由BD团队指定)
- 负责数据室平台的搭建和权限管理
- 负责文档上传的最终审批
- 负责diligence团队访问日志的监控
- 负责数据室Q&A的协调和响应
CMC内容负责人(由CMC团队指定)
- 负责确认每个文档的版本号和时效性
- 负责撰写变更记录和版本更新说明
- 负责回答diligence团队关于CMC内容的技术问题
- 负责在工艺变更或新数据生成后及时更新数据室
定期对账机制
建议每两周进行一次数据室内容对账:
- 检查是否有文档需要更新(新批次数据、新稳定性数据点)
- 检查是否有文档版本不一致
- 检查diligence团队的访问日志——哪些文档被查看了,哪些被跳过了,这可以帮助预判diligence的关注点
平台选择考量
Ideals、Datasite、Peony等数据室平台各有特点。对于CMC数据室,以下功能是必须的:
文件级权限控制。CMC文件夹中的敏感文档(如CDMO合同、know-how)需要独立于其他CMC文档的访问控制。不是所有diligence团队成员都需要看到所有文档。
动态水印。每份文档在查看时自动叠加查看者的姓名、公司和时间戳。CMC数据中包含大量制造机密,水印是基本的防泄露措施。
详细的审计追踪。记录每个用户的每次查看、下载和打印行为。在交易失败后,审计追踪是保护IP的关键证据。
版本管理。支持文件版本自动递增,旧版本自动归档,新版本自动替换。不支持版本管理的数据室平台不适合CMC模块。
Q&A功能。diligence团队的问题通过数据室的Q&A功能统一提交和回答,避免邮件往来中信息散落。
中国biotech的常见失误
在与多家中国biotech的License-Out交易合作中,以下失误高频出现:
把Google Drive或内部NAS当数据室。这些工具缺少文件级权限、审计追踪和动态水印。MNC的diligence团队通常不接受在非专业数据室平台上审查CMC数据。
临谈判前才开始整理数据室。CMC数据室的整理需要至少4-6周——梳理文档、统一命名、确认版本、标注截断日期、建立交叉引用。拖到谈判开始后才整理,几乎必然导致延误。
忽视CDMO数据的版本管理。很多中国biotech的CMC数据由CDMO生成和维护。CDMO发来的报告版本如何管理、更新如何同步到数据室、CDMO是否允许在数据室中展示其数据——这些都需要在CDMO合同中提前约定。
过度延迟开放CMC数据。一些中国biotech出于保密顾虑,在diligence前期只开放概要信息,拒绝开放详细的工艺数据。这会让MNC的CMC团队无法推进评估。建议在签署NDA和保密协议后,按照分阶段开放策略逐步提供详细数据,而不是一刀切地拒绝。
就我们的经验而言,CMC数据室的治理水平直接反映了公司的质量文化。一个版本清晰、命名规范、权限分层的CMC数据室,不仅加速交易,也向潜在合作方传递了一个信号:这家公司的CMC管理是靠谱的。