FDA人因工程提交内容终稿指南：510(k)、PMA、De Novo该怎么组织HF证据

2026年5月29日，FDA在Federal Register上正式发布了"Content of Human Factors Information in Medical Device Marketing Submissions"终稿指南。这份文件从2022年12月的草案走到终稿，历时三年半，对器械企业提交510(k)、De Novo、PMA和HDE时需要附带的人因工程（Human Factors, HF）信息给出了明确的分类框架。

六十天的过渡期意味着从2026年8月1日起，FDA开始按照终稿的预期来审评HF材料。正在准备提交的中国器械企业需要搞清楚一件事：你的产品属于哪个HF提交类别，以及对应的证据包到底是什么。

为什么这份指南现在很重要

这份终稿解决了一个长期困扰行业的问题——到底什么情况下需要在上市提交中包含HF数据。

此前FDA的做法是发布一份"人因工程审评最高优先级器械清单"（List of Highest Priority Devices for Human Factors Review），按器械类型列出需要HF数据的产品。这种做法简单直接，但覆盖面有限，而且没有给出一个通用化的判断逻辑。清单上有的你就交，没有的就不交，很多企业甚至不去做全面的使用相关风险分析。

终稿指南彻底换了一种思路。它不再依赖固定清单，而是引入了一个基于风险的分类框架——每个提交都要经过一个决策流程图，根据器械的使用相关风险水平归入三个提交类别之一。也就是说，不管你的器械在不在什么清单上，你都要做一个判断，并且把这个判断的依据写进提交材料里。

从时间线来看，FDA给了一个缓冲期。对于在终稿发布前已经提交、或在2026年8月1日之前收到的申请，FDA不预期企业已经按新框架准备材料。但FDA也明确说了，如果企业愿意提前按新框架提交HF信息，FDA随时可以审阅。7月22日FDA还安排了一场Town Hall（线上），讨论这份指南的具体执行细节——有问题的话需要在6月12日之前发到HFPMET@fda.hhs.gov。

对我们接触到的不少中国器械企业来说，这份指南的影响可能比预期的大。因为新框架下，即使器械只有一个关键任务（critical task），也需要在提交中处理HF数据。而这个"关键任务"的认定门槛并不高——凡是使用错误可能导致严重伤害的用户任务，都算。

从2022草案到2026终稿：变了什么

终稿的基本框架跟草案一脉相承——三个提交类别、流程图决策逻辑、基于使用相关风险分析的分类方法。但终稿在几个关键点上做了有实际意义的调整。

新增决策点D。流程图里加入了一个新的决策点"D"，考虑的是用户界面（UI）的使用历史、熟悉度和复杂程度，以及现有风险缓解措施是否充分。这个变化看似技术性，实际上打开了一扇门：不是所有涉及新关键任务的器械都自动需要做新的HF验证测试。如果你的器械有一个使用历史良好、交互逻辑成熟的用户界面，并且现有风险控制措施已经被证明有效，你可以通过书面论证来替代新的验证数据。

三倍量的示例和附录。Emergo by UL的分析指出，终稿中示例部分占用的页数是草案的三倍。三份附录分别对应三个HF提交类别，给出了样本报告内容和报告大纲。对于不太熟悉HF文件撰写的中国企业，这些模板可以说是直接可用的参考资料。示例涵盖了更复杂的真实场景——儿科用户群体、增强现实界面、有已知使用问题历史的产品——不再局限于简单的案例。

明确允许引用已有数据。终稿鼓励企业利用之前提交过的HF内容、同类产品的HF信息和已有的HF验证结果，而不是重复工作。之前提交给FDA的HF内容不需要重新提交，可以直接引用。这对已经在美国市场有多款产品的企业尤其有利——合理组织历史HF文档，可以减少新提交的工作量。

组合产品和变更器械的扩展指导。终稿增加了对变更器械的更多示例（可重复使用十二指肠镜、立体定向导航系统、连续血糖监测仪、互操作性自动血糖控制系统），也涉及了组合产品的考量。不过FDA也指出，组合产品可能有额外的风险和考量，这份指南没有完全覆盖，建议企业联系相应的中心和审评分部讨论。

还有一个结构性变化：HFE/UE报告大纲做了微调。草案中第5节和第6节的顺序做了互换——初步评估总结之后紧跟着使用相关风险分析（URRA）和关键任务识别，而不是像2016年HF指南那样把初步评估放在两个风险相关章节之间。这个调整让报告的逻辑更连贯，风险管理的叙事线更清晰。

基于风险的HF提交分类框架

整个框架的核心是一个决策流程图（Figure 1），把每个提交归入三个类别之一。判断的逻辑链条可以简化为几个步骤：

第一步：判断是新器械还是变更器械。

新器械直接进入关键任务判断。变更器械需要先评估变更是否影响了用户界面、用户群体、使用环境、培训或标签。

第二步：是否存在关键任务（新器械），或变更是否引入/影响了关键任务（变更器械）。

关键任务的定义是：如果执行错误或未执行，可能或将会导致患者或用户严重伤害的用户任务。这里的"严重伤害"包括医疗护理和治疗受到损害——比单纯的物理伤害要宽泛。漏诊、延误治疗、药物剂量错误都可能构成严重伤害。

第三步：对于变更器械，如果变更不影响用户界面和标签，归入Category 1。

如果变更影响了用户界面或标签但没有引入或影响关键任务，归入Category 2。

第四步：如果存在关键任务（新器械）或变更影响了关键任务（变更器械），进入决策点D的进一步判断。

决策点D考虑用户界面的使用历史、用户熟悉程度、界面复杂度以及现有风险缓解措施是否充分。如果论证后认为不需要新的验证测试，可以通过书面论证进入Category 2或提供有限的HF数据。如果论证不成立，则需要完整的HF验证报告——Category 3。

这个框架的好处是灵活性。FDA没有一刀切地要求所有器械都做完整的HF验证测试，而是给了企业一个基于风险论证的空间。但这个空间的前提是企业的使用相关风险分析做得扎实、论证逻辑经得起审评。

三类提交分别要交什么

三个提交类别对应的证据包差异很大，从几页纸到一份完整的HFE报告不等。

Category 1：最小化文档

适用场景：变更器械，变更不影响用户界面、用户群体、使用环境、培训或标签。比如后端软件更新（不涉及界面变化）、内部组件材料替换（不影响用户交互）。

提交内容：

简要结论和总结，说明为什么变更不涉及HF方面的考量
一段关于器械使用相关风险的声明

Category 1是最窄的类别。只有变更真正跟用户交互无关时才适用。如果拿不准，建议按Category 2准备。

Category 2：中等文档

适用场景：新器械（无关键任务）或变更器械（变更影响用户界面/标签但不涉及关键任务）。

提交内容：

器械描述和预期用途
预期用户群体、使用环境和培训安排
用户界面描述
已知使用问题总结
初步分析和评估总结（形成性评估方法及发现）
使用相关风险分析（URRA）
关键任务识别和论证——说明为什么没有关键任务，或为什么变更不影响关键任务
论证为什么不需要HF验证测试

Category 2的文档量跟一份HFE报告的"前半部分"差不多——背景信息、初步分析、风险分析都有了，但没有验证测试数据。核心论证是"为什么不需要做验证"。

Category 3：完整HFE报告

适用场景：新器械（存在关键任务）或变更器械（变更引入或影响关键任务）。

提交内容是一份完整的HFE报告，包括：

结论和高层总结
预期用户、使用环境、培训安排
用户界面描述
已知使用问题总结
初步分析和评估总结
使用相关风险分析（URRA）——完整呈现每项关键任务的使用错误、潜在后果和风险缓解措施
关键任务识别和描述列表
HF验证测试详情——测试设计、参与者、场景、结果

HF验证测试的目标是证明预期用户能够在模拟真实使用条件下安全有效地执行关键任务。FDA不建议用发生频率来估计使用相关风险——HF层面关注的是伤害的严重程度，不是错误发生的概率。这一点跟传统的ISO 14971风险矩阵（严重度x概率）有差异，需要留意。

如果验证测试中发现不可接受的残余风险，指南要求实施额外的风险控制和缓解措施，并重新评估。这可能意味着设计变更后需要补充测试。

对于变更器械，验证测试可以只针对受变更影响的部分——不需要重新验证整个器械。但论证为什么局部验证就够了，需要在风险分析中讲清楚。

组合产品与特殊考量

组合产品（drug-device combination products）在这份指南中获得了有限的覆盖。FDA明确指出组合产品可能有额外的风险和考量，这份指南没有完全处理，建议企业联系相应中心（CDER或CBER）和审评分部讨论。

就我们接触到的案例来看，预填充注射器（prefilled syringe）、带药支架（drug-eluting stent）、吸入器（inhaler）等组合产品在人因工程方面确实有特殊需求——药物部分的用户交互和器械部分的用户交互交织在一起，关键任务的识别需要跨学科团队协作。

变更器械方面，终稿给出的新增示例颇具参考价值：

可重复使用十二指肠镜——涉及清洁消毒流程的变更，用户交互环节多，关键任务覆盖面广
立体定向导航系统——软件界面变更，需要评估对手术操作流程的影响
连续血糖监测仪（CGM）——传感器更换流程和报警逻辑的变更
互操作性自动血糖控制系统——与其他器械的交互界面变更

这些示例的共同特点是变更本身看似局部，但通过用户交互链条可能产生连锁影响。FDA给出的分析思路是沿着用户交互路径追踪变更的影响范围，判断是否触及关键任务。

另一个值得关注的点：即使原始器械在获批时不需要HF数据（比如在旧的优先级清单框架下获批），后续变更提交仍需按新框架处理。如果你的产品是在2022年之前获批的，准备做变更提交时要重新评估HF提交类别。

中国器械出口商的实际影响

2026年8月1日之后提交的510(k)、De Novo、PMA和HDE申请，FDA将按照终稿指南的预期来审评HF内容。对中国器械出口商来说，几个方面的变化需要重点关注。

HF文档准备周期。如果被归入Category 3，准备一份完整的HFE报告通常需要3-6个月，包括验证测试的招募、执行和报告撰写。如果你的提交计划卡在8月之后，现在就应该评估你的HF提交类别，避免在提交前夕发现需要补做验证测试。

使用相关风险分析能力。不管哪个类别，URRA都是核心文档。不少中国企业的URRA写得比较粗糙——直接套用ISO 14971的风险分析模板，把使用错误简单列为几行，缺乏对用户任务分解的逐层分析。在新框架下，URRA的质量直接决定了你的HF提交类别是否站得住脚，以及是否需要做验证测试。

形成性评估的积累。终稿明确鼓励企业在开发过程中开展形成性评估（formative evaluation），并将这些评估结果用于支持HF提交。如果你的企业习惯在产品开发后期才开始考虑人因工程，现在需要调整节奏——在开发早期就介入形成性评估，积累的文档在提交时可以直接使用。

用户群体定义。中国企业在定义预期用户时往往过于笼统——"医护人员"或"家庭用户"这种宽泛描述在新框架下是不够的。FDA期望看到按专业培训、经验水平、身体能力、认知能力细分的用户群体描述。如果你的器械面向家庭用户，需要考虑老年用户、低读写能力用户等特殊群体。

跨文化HF验证。如果你的HF验证测试是在中国完成的（用户为中国医护人员或患者），你需要论证测试结果对美国用户群体的可外推性。语言、文化习惯、医疗体系差异都可能影响用户交互行为。最稳妥的做法是在美国招募代表性用户进行验证测试。

最容易犯的五个错误

基于我们接触到的中国器械企业在HF方面的常见问题，总结五个高频错误：

第一，不做URRA就判断"没有关键任务"。这是最常见的。企业凭直觉认为产品"操作很简单"，就归入Category 2。但FDA要求关键任务的判断必须基于系统的使用相关风险分析，不是拍脑袋。如果审评员认为你的URRA不充分，可能会要求补充信息，甚至退回。

第二，URRA和ISO 14971风险分析混为一谈。URRA关注的是使用错误导致的伤害，是风险分析的一个子集，不是全部。有些企业把FMEA或风险矩阵直接搬过来当URRA用，缺乏对用户任务层面的分解。两者有关联但角度不同——ISO 14971是自上而下的风险管理，URRA是自下而上的用户任务分析。

第三，验证测试设计不当。包括测试参与者不具代表性（比如全用公司内部员工）、测试场景不真实（缺少干扰因素）、样本量不足（FDA一般期望每个用户组至少15人）、关键任务覆盖不全。这些问题在审评时很容易被挑出来。

第四，忽视标签和使用说明的HF评估。标签（labeling）是用户界面的一部分。如果你的使用说明、快速参考卡、屏幕提示文本没有被纳入HF评估范围，审评员可能会认为你的用户界面描述不完整。

第五，组合产品的HF分析只做了器械部分。预填充注射器、吸入器等产品，用户交互同时涉及器械操作和药物给药。如果URRA只覆盖了器械操作步骤，没有考虑药物相关的影响（比如注射深度、给药速度），分析就是不完整的。

30-60-90天准备计划

如果你有产品计划在2026年下半年或2027年初提交FDA，以下是一个参考时间线：

30天内（评估和规划）

盘点现有产品的HF文档，评估哪些已有、哪些缺失
按流程图判断每个待提交产品的HF提交类别
识别关键任务——通过URRA系统分析
如果判断为Category 3，联系HF咨询公司或内部HF团队，启动验证测试准备
注册7月22日FDA Town Hall，准备问题

60天内（核心文档编写）

完成或完善URRA
编写用户群体、使用环境、用户界面描述文档
整理已有的形成性评估资料
如果是Category 3，开始设计验证测试方案
对比终稿指南的附录示例，检查文档结构和内容是否匹配

90天内（提交准备）

Category 1/2：完成HF文档，整合到提交材料中
Category 3：完成验证测试方案定稿，启动招募和预测试
对于变更器械，准备变更影响分析和论证材料
对于组合产品，与FDA相应中心确认HF预期
做一次内部审阅，对照终稿附录中的示例报告检查完整性和逻辑一致性

常见问题

我们的器械在旧清单上不需要HF数据，现在需要吗？

大概率需要。新框架不再依赖旧的优先级清单，而是基于使用相关风险分析来判断。如果你的器械有任何用户交互，并且存在关键任务，就需要在提交中包含HF信息。即使是之前获批的产品，后续变更提交也要按新框架处理。

Category 2的论证（不需要验证测试）需要多详细？

需要足以说服审评员你的URRA是全面的，关键任务的判断是合理的，并且现有风险控制措施是充分的。终稿指南的Appendix B给出了Category 2的示例报告内容，建议逐条对照。论证的核心是URRA的可追溯性——从用户任务分解到风险识别到控制措施到为什么不需要进一步验证，逻辑链要完整。

HF验证测试必须在美国做吗？

指南没有要求必须在美国做，但需要论证测试用户对目标用户群体的代表性。如果你的器械面向美国市场，测试参与者应该是美国用户，或者你能论证其他地区用户的行为模式与美国用户一致。就实际操作而言，大部分企业选择在美国招募测试用户，避免论证环节的额外风险。

我们的变更只涉及软件后端，不涉及界面，需要提交HF信息吗？

可能只需要Category 1级别的信息——简要结论和总结，说明变更不影响用户交互。但需要确认变更确实不涉及用户界面、标签、使用环境或用户群体的任何变化。如果后端变更影响了系统响应时间、数据处理逻辑等用户可感知的方面，可能需要重新评估。

这份指南和2016年的"Applying Human Factors and Usability Engineering to Medical Devices"是什么关系？

终稿指南是对2016年指南的补充，不是替代。2016年指南讲的是HF的开发过程——怎么做形成性评估、怎么做验证测试、方法论的选择。新指南讲的是在提交时应该包含什么HF信息——提交什么、提交多少、怎么分类。两份文件配合使用。

510(k)和PMA在HF要求上有区别吗？

框架是统一的，三个类别对510(k)、De Novo、PMA和HDE都适用。但PMA和HDE通常涉及更高风险的器械，更容易存在关键任务，因此更容易归入Category 3。510(k)如果参照的是已有HF数据的predicate device，可能有机会利用已有数据减少新的HF工作量。

如果我们在HF验证测试中发现了不可接受的残余风险怎么办？

指南的要求是实施额外的风险控制和缓解措施，然后重新评估。这可能涉及设计变更，变更后需要补充测试。在时间规划上要为这种可能性留出余量——不要假设验证测试一次通过。

参考资源

FDA终稿指南原文：Content of Human Factors Information in Medical Device Marketing Submissions（2026年5月） — FDA官方法律文件，三份附录包含三个类别的示例报告
Federal Register公告（91 FR 32061，2026年5月29日） — 指南的正式发布通知
FDA Town Hall信息（2026年7月22日） — 线上问答，提问截止6月12日
FDA 2016年HF指南：Applying Human Factors and Usability Engineering to Medical Devices — HF开发过程指导，与新终稿配合使用
Emergo by UL对终稿的关键更新分析 — 2026年5月29日发布，涵盖五个关键变化
IEC 62366-1:2015+A1:2020 — 医疗器械可用性工程国际标准，FDA认可的共识标准
FDA联系人：Erica Takai, CDRH, 301-796-6353 — HF相关问题的FDA联系方式