← 返回首页

FDA AI 医疗器械清单实战:如何用 1451+ 已授权产品做等同对比与 LLM 披露策略

详解FDA AI-Enabled Medical Device List的使用方法,涵盖等同器械检索、LLM/基础模型披露策略、训练数据集披露要求、PCCP边界管理,附中国企业实操建议。

陈然
陈然最后更新:

截至 2025 年底,FDA 的 AI-Enabled Medical Device List 累计收录了 1,451 款已授权产品。2026 年 3 月的最新分析显示,其中放射学占 1,104 款(约 76%),心血管 141 款,神经学 67 款。同年 2 月路透社报道称 FDA 已授权 1,357 款 AI 医疗器械,较 2022 年翻了一倍。

但截至目前,这份清单上没有一款产品使用了生成式 AI 或大型语言模型(LLM)。

这个看似矛盾的局面恰恰说明:大多数中国 AI 医疗器械企业在做 510(k) 申报时,面对的不是"如何证明 LLM 安全"的终极问题,而是更基础的问题——怎么找到合适的等同器械、怎么在公共摘要中披露足够的信息让 FDA 理解你的 AI 架构、怎么规划未来模型迭代的监管路径。

这篇文章把 FDA AI 医疗器械清单的使用方法和 LLM/基础模型的披露策略放在一起讲,核心是帮中国企业搞清楚"现在该做什么"和"下一步该怎么准备"。

FDA AI 医疗器械清单是什么

FDA 的 AI-Enabled Medical Device List 是一个公开可下载的 Excel/CSV 表格,由 FDA Digital Health Center of Excellence 维护,大约每季度更新一次。最近一次更新包含了截至 2025 年 12 月 30 日的授权记录。

清单的字段包括:

字段内容
Date of Final Decision授权日期
Submission Number510(k)/De Novo/PMA 编号,可链接到 FDA 数据库
Device产品名称
Company企业名称
Panel (Lead)审评小组(放射学、心血管等)
Primary Product Code三字母产品代码

清单的数据来源有两个:一是授权摘要文档中包含 AI 相关术语(基于 FDA Digital Health and Artificial Intelligence Glossary),二是产品的分类信息指向 AI 相关类别。FDA 明确说明这份清单不完整——部分已授权但摘要尚未发布的 AI 器械会在后续更新中补充。

用清单做等同器械检索

对于走 510(k) 路线的 AI 医疗器械,等同器械(predicate device)的选择是整个申报的基石。清单在这方面提供了独特的价值。

按产品代码聚类

FDA 分配的三字母产品代码(procode)是检索等同器械最有效的维度。同一产品代码下的 510(k) 申请通常具有相似的技术特征和预期用途。清单支持按 Primary Product Code 排序,你可以快速找到与你产品同类的所有已授权 AI 器械。

举例来说,放射学 AI 产品常见的代码包括 QIH(影像处理)、LNH(MRI 软件)等。在清单中按这些代码筛选,就能获得一份潜在等同器械的完整列表。

从清单到摘要

清单中的 Submission Number 是直接可点击的链接,跳转到 FDA 对应数据库的详情页。详情页里有公开的安全性及有效性摘要(Summary of Safety and Effectiveness),这是了解等同器械技术特征的主要来源。

但要注意:摘要文件是 PDF 格式,不可搜索,且通常不包含详细的训练数据信息或模型架构描述。如果你的 AI 产品在技术路线上与潜在等同器械有较大差异(比如从传统 CNN 切换到了视觉 Transformer),单靠摘要文档可能不足以论证实质性等同。

独立研究工具的补充

学术机构已经开发了辅助检索工具。2026 年初发表的 FDA AI Search 项目(arXiv: 2602.00006)利用 LLM 从授权摘要中提取特征,建立了语义检索系统,支持按输入数据类型、算法类型、临床用途等维度查询。这类工具可以帮你从 1,400+ 产品中快速定位与你的产品在技术路线和临床用途上最接近的候选等同器械。

当然,最终选择哪个产品作为等同器械,还是需要结合 FDA 510(k) 数据库的完整记录来判断。

公共摘要中的 AI 披露要求

FDA 在 2024–2026 年的多次政策更新中传递了一个清晰的信号:AI 器械的公共摘要(public summary)是监管透明度的重要载体,企业需要在其中披露足够的 AI 相关信息。

当前的披露实践

从 1,451 款已授权 AI 器械的摘要来看,披露的深度差异较大。大多数摘要包含:

  • 算法类型的大类描述(如 deep learning、machine learning、neural network)
  • 输入数据类型(CT 影像、X 光片、心电图信号等)
  • 临床功能描述(检测、分割、测量、分诊等)
  • 验证研究的概要

但更底层的信息——模型架构细节、训练数据集规模和来源、超参数设置、性能指标的亚组分析——在大多数摘要中是缺失的。

FDA 对 LLM/基础模型披露的新信号

2026 年 FDA 明确表示,计划在未来更新 AI 医疗器械清单时,为使用基础模型(foundation models)的产品添加标签标识。FDA 在清单页面上写道:

"To support transparency in the use of modern AI technologies, the FDA will explore methods to identify and tag medical devices that incorporate foundation models encompassing a wide range of AI systems, from large language models (LLMs) to multimodal architectures."

同时,FDA 鼓励企业在公共摘要中主动披露是否使用了 LLM 或类似的复杂 AI 组件。这意味着:

  1. 如果你的产品使用了 LLM 或基础模型,即使当前清单还没有对应的标签字段,也建议在摘要中明确说明,包括基础模型的名称/版本、微调方式、在医疗器械功能中的具体角色。

  2. 如果你的产品使用的是传统机器学习(如 CNN、随机森林等),也需要在摘要中清晰描述算法的技术路线,避免 FDA 在归类时产生误判。

Innolitics 的前瞻性实践

咨询公司 Innolitics 在 2025 年向 FDA 提交了一份 Pre-Submission 模拟案例(作为行业讨论文件),详细演示了如何在 510(k) 申报中处理基础模型。他们的方案包括:

  • 将基础模型的更新纳入 PCCP(预定变更控制计划)的不同模块
  • PCCP 001:基础模型版本的升级流程(如从 Llama 3.2 11B 升级到 Llama 3.3)
  • PCCP 002:提示工程(prompt engineering)的变更管理
  • PCCP 003:输入数据变更时的重新验证
  • PCCP 004:真值标注(ground truthing)用基础模型的更换

FDA 的回应是:对于使用基础模型的医疗器械,需要在 Pre-Submission 中提供模型架构和训练方式的工程级描述,以帮助 FDA 理解设备的底层功能和复杂性。

训练/测试数据集的披露策略

数据集的披露是 AI 医疗器械申报中最敏感的部分之一——披露太少可能被 FDA 认为信息不足,披露太多可能涉及商业秘密和患者隐私。

最小必要披露原则

从已授权产品的实践来看,FDA 期望在公共摘要中看到的数据集信息包括:

  • 患者/样本数量:训练集、验证集、测试集的样本量
  • 数据来源:临床合作机构、公开数据集或合成数据的比例
  • 人群分布:年龄、性别、种族/民族等人口统计学信息,至少是概括性的
  • 疾病谱:疾病严重程度分布、合并症情况
  • 数据采集参数:影像分辨率、设备型号范围等影响 AI 性能的技术参数

不需要公开的部分

  • 训练数据的具体图像或病例
  • 模型的具体权重和参数
  • 详细的数据标注协议(标注指南可以在保密附件中提供)

亚组性能的可披露性

FDA 在近期的审评实践中越来越关注 AI 模型在不同亚组中的性能差异。建议在公共摘要中至少报告按性别、年龄组和主要种族/民族分层的性能指标。如果你的模型在某些亚组中性能明显偏低,主动披露并说明缓解措施(如数据增强、阈值调整)比被动应对 FDA 的补充信息请求要好。

PCCP 边界管理:模型更新什么时候变成新申报

Predetermined Change Control Plan(PCCP)是 FDA 在 2024 年定稿的指南中引入的概念,允许企业在获批时预先声明一组计划中的模型变更,在后续执行时不需要重新提交 510(k)。

PCCP 可以覆盖的变更类型

  • 训练数据的扩展(在预先声明的数据采集协议范围内)
  • 模型超参数的微调
  • 性能阈值的调整(在不降低临床性能的前提下)

PCCP 不能覆盖的变更

  • 适应症的扩展或修改
  • 输入数据类型的变更(如从 CT 扩展到 MRI)
  • 核心模型架构的更换
  • 影响器械安全性的根本性变更

边界的判断标准

FDA 的判断标准是:变更后的器械是否仍在原申报的"预期用途"范围内,以及变更是否需要更新标签。如果模型更新导致了新的输出类型、新的患者人群或新的临床场景,大概率需要新的 510(k)。

对于使用基础模型的 SaMD,PCCP 的设计尤其复杂。Innolitics 的模拟 Pre-Submission 把基础模型版本的更新纳入了 PCCP,但 FDA 在回复中对"如何验证基础模型版本变更后仍保持等同性能"提出了很高的证据要求。实际上,每次更换基础模型版本都需要对全部验证数据集重新跑一遍基准测试。

对中国 AI 医疗器械企业的建议

现阶段(传统 ML 产品)

如果你的产品使用的是传统机器学习算法(CNN、随机森林、SVM 等),当前的申报路径和披露要求与既往 AI 器械基本一致。重点放在:

  • 在 FDA AI 器械清单和 510(k) 数据库中找到合适的等同器械
  • 公共摘要中清晰描述算法类型、输入数据、验证方法
  • 在 PCCP 中预先声明计划中的模型更新

下一阶段(基础模型/LLM 产品)

如果你的产品计划集成 LLM 或基础模型,从现在起就需要在申报材料中做额外准备:

  • 在 Pre-Submission 阶段主动告知 FDA 你的产品使用了基础模型,并准备工程级的架构描述
  • 在公共摘要中明确披露基础模型的角色、版本和微调方式
  • 设计覆盖基础模型版本更新的 PCCP,包括重新验证的触发条件和流程
  • 建立反幻觉(anti-hallucination)机制并记录在风险管理文件中

长期布局

FDA 计划在 AI 器械清单中为 LLM/基础模型产品添加标签,这个功能预计在 2026 年内上线。如果你的产品已经获批但使用了 LLM,建议主动联系 FDA Digital Health Center of Excellence(digitalhealth@fda.hhs.gov)确认信息更新。

参考资源

AI 助手

你好!我看到你正在阅读「FDA AI 医疗器械清单实战:如何用 1451+ 已授权产品做等同对比与 LLM 披露策略」。有任何关于这篇文章的问题,都可以问我!

由 Gemini 驱动 · 回答仅供参考