医疗器械可用性工程IEC 62366合规指南：人因设计、用户研究与FDA人因工程审查全解析

在全球医疗器械不良事件的统计数据中，有一个令人警醒的事实：超过50%的医疗器械安全事故并非由设备本身的硬件故障或软件缺陷引起，而是源自"使用错误"（Use Error）——医护人员或患者在操作设备时的误操作、误读、遗漏或混淆。美国FDA的MAUDE（Manufacturer and User Facility Device Experience）数据库中，使用错误相关报告常年占据总报告量的大比例。

这意味着，即使您的产品通过了严格的电气安全测试（IEC 60601）、满足了软件生命周期要求（IEC 62304）、并完成了系统化的风险管理（ISO 14971），如果忽视了用户界面设计的可用性，产品仍然可能因为"人的因素"而导致严重的患者伤害。

正因如此，IEC 62366-1:2015《医疗器械 — 可用性工程在医疗器械中的应用》（Medical devices — Part 1: Application of usability engineering to medical devices）成为了全球监管机构高度关注的标准。它不仅是欧盟MDR下通用安全与性能要求（GSPR）的协调标准，更是FDA人因工程（Human Factors Engineering, HFE）审查的核心技术支撑。

对于志在全球化的中国医疗器械企业而言，理解并系统实施可用性工程，已经从"加分项"变成了"必选项"。本文将从标准解读、监管要求、过程实操到文档编制，提供一份全面而实用的合规指南。

一、为什么使用错误是医疗器械安全的头号威胁？

1.1 使用错误的本质：系统问题而非个人失误

在传统观念中，操作者犯错往往被归结为"培训不足"或"注意力不集中"。然而，现代人因工程学（Human Factors Engineering）的核心理念是：使用错误绝大多数情况下不是用户的过错，而是设计的缺陷。 如果一个产品的界面设计使得经验丰富的专业人员在正常使用条件下仍然容易犯错，那么问题出在产品设计，而非使用者。

IEC 62366-1标准明确区分了以下概念：

术语	英文	定义	示例
使用错误	Use Error	由用户执行或未执行某一动作导致的与制造商预期不同的医疗器械响应	护士将输液泵的剂量设置为10而非1.0（小数点位置不明显）
异常使用	Abnormal Use	有意的不合理行为	患者故意拆开设备外壳
合理可预见误用	Reasonably Foreseeable Misuse	虽非预期但可以合理预见的使用行为	患者在浴室中使用非防水的家用医疗器械

关键理解： 可用性工程只负责消除"使用错误"，不处理"异常使用"。但"合理可预见误用"必须纳入风险管理范畴。

1.2 真实案例：使用错误导致的严重后果

以下是几个被广泛引用的典型案例：

案例一：输液泵剂量设置错误。 某品牌输液泵的数字输入界面采用滚轮式设计，每次滚动改变一个整数单位。护士在急救场景中需要快速设置0.5mg/h的低剂量，但在高压力环境下多滚了一位，实际设置为5.0mg/h。由于界面没有明确的小数点视觉强调和剂量范围警告，患者接受了10倍过量药物。

案例二：除颤器按钮布局混淆。 某型AED的"充电"按钮和"放电"按钮颜色与位置过于接近，急救人员在紧张环境下误按"放电"按钮导致不当除颤。

案例三：SaMD诊断软件误读。 一款AI辅助读片软件将高危病灶标注为红色圆圈，但标注颜色与正常组织标注的橙色在低质量显示屏上几乎无法区分，医生忽略了关键病灶。

这些案例说明：良好的用户界面设计不是美学问题，而是患者安全问题。

1.3 监管机构对可用性工程的关注度持续攀升

进入2026年，全球三大市场的监管机构在可用性工程领域的审查力度明显加强：

FDA：人因工程审查已成为510(k)和PMA申报中被要求补充资料（Additional Information Request）最频繁的领域之一。FDA甚至在2023年更新了拒绝受理（Refuse to Accept, RTA）清单，将人因工程数据缺失列为RTA的标准理由。
欧盟公告机构（Notified Body）：在MDR下对技术文件的审查中，可用性工程文件的完整性已成为评估重点。
NMPA：2024年NMPA正式发布《医疗器械可用性工程注册审查指导原则》，将可用性工程从"推荐参考"提升至"指导性强制"层面，对II类、III类医疗器械的可用性工程要求大幅增强（详见第五节）。

二、IEC 62366-1:2015标准框架深度解析

2.1 标准定位与适用范围

IEC 62366-1:2015是国际电工委员会（IEC）发布的可用性工程应用标准，其全称为《医疗器械 — 第1部分：可用性工程在医疗器械中的应用》。该标准适用于所有医疗器械——包括有源设备、无源设备、体外诊断器械以及软件医疗器械（SaMD）。

标准的核心目标是：通过系统化的可用性工程过程，确保用户在预期的使用环境中能够安全有效地使用医疗器械，最大限度地减少使用错误及其带来的风险。

IEC 62366-1同时发布了一份配套的技术报告IEC/TR 62366-2:2016，提供了大量实操案例和方法论指导，是企业落地实施时极为有价值的参考文献。

2.2 与ISO 14971风险管理的关系

IEC 62366-1的核心精髓在于：可用性工程不是独立存在的，它是风险管理的延伸和深化。

具体而言，IEC 62366-1聚焦于ISO 14971框架中"使用相关风险"（Use-related risk）的系统处理。两者的关系可以概括为：

维度	ISO 14971	IEC 62366-1
关注范围	所有危害来源（硬件、软件、生物、化学、使用错误等）	专注于"使用错误"导致的危害
核心产出	风险管理文件（风险管理计划、FMEA/FTA、风险评价、风险控制、总体残余风险评价）	可用性工程文件（用户研究、使用规格、评价方案与结果）
过程关系	危害识别时需考虑使用错误场景	使用相关风险分析的方法和工具来源于风险管理过程
闭环机制	风险控制措施验证	形成性评价和总结性评价验证使用相关风险控制措施的有效性

实操要点： 在企业内部，ISO 14971的风险管理团队与IEC 62366-1的可用性工程团队应当深度协作。可用性工程文件中识别出的关键使用场景必须回溯至风险管理文件中的危害分析，形成双向追溯（bidirectional traceability）。

2.3 IEC 62366-1的核心过程步骤

IEC 62366-1定义了一个迭代的可用性工程过程，主要包含以下步骤：

使用规格制定 → 使用相关风险分析 → 用户界面设计 → 形成性评价（迭代）→ 总结性评价（验证）→ 可用性工程文件归档

步骤一：制定使用规格（Use Specification）

定义预期用户群体（User Profile）
定义预期使用环境（Use Environment）
定义操作者与医疗器械的交互方式

步骤二：使用相关风险分析

基于ISO 14971的危害分析输出
识别与使用界面相关的危害场景
确定关键使用场景（Critical Use Scenarios）

步骤三：用户界面设计与评价

根据使用规格和风险分析结果进行界面设计
遵循人机工程学原则

步骤四：形成性评价（Formative Evaluation）

迭代式用户测试
在设计过程中反复验证和改进

步骤五：总结性评价（Summative Evaluation）

最终验证性测试
验证关键使用场景的安全性

步骤六：文件归档

编制完整的可用性工程文件（Usability Engineering File）

2.4 关键术语深度理解

关键使用场景（Critical Use Scenario）： 这是IEC 62366-1和FDA审查中最核心的概念。关键使用场景是指：如果用户在该场景中发生使用错误，可能导致严重伤害或死亡的使用情况。例如：

心脏起搏器程控仪中设置心率参数
手术机器人中切换手动/自动模式
输液泵中设定药物剂量和输注速率
血糖仪中读取和解读检测结果

用户界面（User Interface）： IEC 62366-1对用户界面采用广义定义，不仅包括屏幕显示和软件交互，还包括：

物理控件（按钮、旋钮、开关）
声音和视觉警报
标签与说明书
包装上的使用指导
培训材料

2.5 已上市（Legacy）器械的特殊考量

对于已经上市销售的医疗器械（legacy devices），IEC 62366-1:2015 附录C（Annex C，资料性附录）提供了专门的指导。许多中国企业在全球化进程中面临的一个实际问题是：产品在国内市场已销售多年，现在需要为出海合规补建可用性工程文件，但产品设计已经固化，无法从头开始执行完整的可用性工程过程。

附录C的核心思路是： 对于已上市器械，制造商可以用全面的使用风险再评估（Comprehensive Use-Related Risk Re-evaluation）来替代完整的总结性可用性测试，前提是满足以下条件：

充分的上市后数据：产品在市场上已有足够的使用历史，可以从投诉记录、不良事件报告、售后反馈中获取大量真实的使用安全性数据
系统化的使用风险分析：基于上市后数据对所有使用相关风险进行重新评估，识别是否存在未被控制的使用错误
残余风险可接受：如果上市后数据表明当前设计的残余使用风险处于可接受水平，可以不要求进行回溯性的总结性测试

实操建议： 对于拟出海的legacy产品，建议企业收集至少3-5年的国内市场投诉和不良事件数据，系统分析其中使用错误相关的事件，形成"上市后使用安全性分析报告"。该报告可以作为可用性工程文件的重要支撑，但需注意——如果分析过程中发现了未被充分控制的使用风险，仍然需要采取设计改进措施并进行相应的验证测试。

三、FDA人因工程（HFE）审查要求

3.1 FDA HFE指南体系与历史沿革

FDA对人因工程的关注起步较早，经过近三十年的演进，已形成一套成熟的指南体系。以下是完整的关键时间节点：

年份	文件	意义
1996	"Do It By Design — An Introduction to Human Factors in Medical Devices"	FDA首份人因工程指南，首次系统阐述了使用错误与界面设计的关系，奠定了FDA HFE审查的理论基础
2000	"Medical Device Use-Safety: Incorporating Human Factors Engineering into Risk Management"	将人因工程与ISO 14971风险管理方法论正式结合，确立了"使用错误是风险来源"的监管理念
2011	Draft Guidance: "Applying Human Factors and Usability Engineering to Medical Devices"	征求意见稿，显著扩展了审查范围——将家用设备和OTC产品纳入HFE审查重点，引入了15人/组的测试预期
2016	"Applying Human Factors and Usability Engineering to Medical Devices"（终版）	当前主要参考文件，明确了HFE审查的完整框架：已知使用问题调研、关键任务分析、形成性评价、总结性验证测试的全流程预期
2022年12月	Draft Guidance: "Content of Human Factors Information in Medical Device Marketing Submissions"	细化上市前提交文件中HFE内容的具体格式与深度要求；取代了此前的"优先器械清单"（Priority Device List）方法——不再列出特定产品类型强制要求HFE数据，而是要求所有器械根据风险评估决定HFE提交深度
2023年9月	"Human Factors Studies for Combination Products — Questions and Answers"	专门针对药械组合产品（Combination Products）的HFE指南，解答了组合产品中药物递送界面、预填充注射器、自动注射器等的人因工程审查要求，填补了此前组合产品HFE指南的空白

指南演进的核心趋势： 从1996年的概念性引导，到2016年的系统化审查框架，再到2022-2023年对提交格式和特殊产品类型的精细化要求——FDA的HFE监管经历了从"建议参考"到"实质性审查要素"的完整演进。2022年征求意见稿取消优先器械清单的做法尤为重要：这意味着任何类型的医疗器械都可能被要求提交HFE数据，企业不应再以"我的产品不在优先清单上"为由忽视人因工程。

2016版指南至今仍是FDA HFE审查的核心参考文件，而2022年的征求意见稿进一步细化了FDA对HFE提交内容的格式和深度预期，企业在准备申报材料时应同时参考两份文件。

FDA的人因工程审查适用于所有需要上市前审查的医疗器械，包括：

510(k)
De Novo
PMA（上市前审批）
HDE（人道主义器械豁免）

3.2 FDA认可的共识标准：IEC 62366-1、ANSI/AAMI HE74与HE75

除IEC 62366-1外，FDA还明确认可以下两项AAMI/ANSI标准作为人因工程审查的共识标准（Recognized Consensus Standards）。这三项标准各有侧重，在FDA审查中承担不同角色：

标准	全称	核心定位	适用场景
IEC 62366-1:2015+A1:2020	Application of usability engineering to medical devices	可用性工程过程标准 — 定义"做什么"	过程合规的基础框架，全球通用
ANSI/AAMI HE74:2009 (R2018)	Human Factors Design Process for Medical Devices	设计过程方法论 — 解决"怎么做"	提供从需求分析到设计验证的完整HFE流程操作指南
ANSI/AAMI HE75:2018	Human Factors Engineering — Design of Medical Devices	界面设计参考手册 — 提供具体设计原则	显示设计、控件布局、报警设计、标签设计等详细的工程建议

ANSI/AAMI HE74:2009 (R2018) 是IEC 62366-1的深度补充。IEC 62366-1规定了可用性工程过程中"必须做的活动"，但对于"如何执行这些活动"的指导较为有限。HE74填补了这一空白，提供了：

用户需求分析的具体方法（上下文访谈、任务分析、用户画像构建）
概念设计到详细设计各阶段的HFE活动检查清单
形成性评价和总结性评价的方案模板与数据分析方法
与设计控制（Design Control）过程的集成指南

ANSI/AAMI HE75:2018 是一份超过500页的综合性参考手册，覆盖了医疗器械界面设计的所有物理和认知人因要素。FDA审评人员在评审界面设计合理性时会参考HE75中的具体设计建议，例如：

最小字体尺寸与对比度要求
报警优先级分层与声音设计参数
触摸屏目标尺寸与间距最佳实践
颜色编码的一致性与色觉障碍适配

实操建议： 在FDA的510(k)或PMA审查中，申报人可以在标准声明表（Declaration of Conformity）中同时声明符合IEC 62366-1和HE75，以充分覆盖FDA对"过程合规"和"设计合规"两个维度的预期。对于高风险器械（III类/PMA），建议在HFE报告中明确引用HE74的方法论框架和HE75的设计原则，以展示人因工程工作的深度和系统性。

3.3 可用性工程与21 CFR 820.30(g)设计验证的关联

一个经常被忽视但在FDA审查中非常重要的合规联结点是：可用性工程中的总结性评价（Summative Evaluation）本质上就是FDA质量体系法规21 CFR 820.30(g)所要求的"设计验证"（Design Validation）的组成部分。

21 CFR 820.30(g)要求：

"设计验证应确认器械符合已定义的用户需求和预期用途，并应包括在实际或模拟使用条件下的测试。"

这意味着：

总结性可用性测试 = 设计验证的一部分：可用性验证测试直接满足了820.30(g)中"在模拟使用条件下测试"的要求，验证了器械能否被目标用户安全有效地使用
可用性工程文件应纳入设计历史文件（DHF）：整个可用性工程过程的记录——包括使用规格、形成性评价记录、总结性评价报告——应当作为设计控制文件的一部分归入DHF
追溯性要求：设计输入（用户需求、使用规格）→ 设计输出（界面设计规格）→ 设计验证（总结性可用性测试）之间必须建立清晰的追溯关系

审查实务影响： FDA审评人员和QSR审核员可能从两个不同角度审查同一批可用性工程文件——HFE审评人员关注测试方法和结果的科学性，QSR审核员关注设计控制过程的完整性和文档的追溯性。企业在文件编制时应同时满足两方面的预期。

FDA与IEC 62366-1的差异： 虽然FDA认可IEC 62366-1作为共识标准，但FDA的审查预期在某些方面比国际标准更为严格，尤其是在以下方面：

审查要素	FDA HFE指南要求	IEC 62366-1要求
已知使用问题调研	明确要求调研市场上同类产品的已知使用问题	不做强制要求
总结性测试参与者数量	通常要求每个用户组至少15名代表性用户	未规定具体数量（"足够"）
关键任务定义	要求对"Critical Tasks"逐一测试并报告结果	使用"Critical Use Scenario"概念，但要求不如FDA细化
培训效果评价	关注"最低培训条件"下的使用安全性	可考虑培训对使用安全性的贡献

3.4 FDA审查的核心要素

3.4.1 已知使用问题（Known Use Problems）

FDA要求企业在开发初期就全面调研目标市场上同类或前代产品的已知使用问题。调研来源包括：

MAUDE数据库：FDA公开的医疗器械不良事件报告数据库
召回数据库（FDA Recalls）：因使用错误导致的产品召回记录
文献调研：已发表的可用性研究和临床报告
竞品分析：市场上同类产品的说明书中警告信息、已知投诉
内部投诉数据：企业自身的客户投诉和售后反馈

实操建议： 对于中国企业首次申报FDA的产品，建议系统搜索MAUDE数据库中相同产品代码（Product Code）的不良事件报告，提取与使用错误相关的报告并进行分类分析，形成"已知使用问题摘要"（Known Use Problem Summary）。

3.4.2 关键任务（Critical Tasks）

FDA对关键任务的定义比IEC 62366-1更为具体。关键任务是指满足以下条件的用户操作：

使用错误或使用困难可能直接或间接导致严重伤害或死亡
用户在紧急或高压环境下可能需要执行的任务
涉及复杂操作序列、需要精确判断或操作的任务

FDA期望企业提交一份关键任务清单（Critical Task List），每个关键任务需要包含：

任务描述
关联的使用错误模式
可能的后果（伤害严重程度）
用户界面上的具体交互点
风险控制措施

3.4.3 形成性评价（Formative Evaluation）

形成性评价是设计开发过程中的迭代式用户评价活动。FDA接受多种形式的形成性评价：

专家评审（Heuristic Evaluation）：由人因工程专家根据启发式原则评估界面设计
认知走查（Cognitive Walkthrough）：模拟用户完成任务的思维过程
模拟使用测试（Simulated Use Testing）：邀请代表性用户在模拟环境中使用原型
实际使用测试（Actual Use Testing）：在真实临床环境中进行的测试

形成性评价的关键目标是：在设计冻结之前识别并修复尽可能多的可用性问题。FDA虽然不强制要求提交形成性评价的详细数据，但强烈建议企业记录评价过程，以证明设计决策的合理性。

3.4.4 总结性评价/人因验证测试（Summative Evaluation / HF Validation Testing）

总结性评价是可用性工程过程的最终验证步骤，也是FDA审查的重中之重。

测试设计要求：

参与者数量： FDA通常期望每个独立的用户组至少包含15名参与者。如果产品有多个用户组（如医生、护士、患者），每个组都需要15名以上参与者。
参与者代表性： 参与者必须来自目标用户群体，不能使用公司内部员工。如果产品的目标用户包括不同经验水平的人员，参与者的经验分布应当反映实际情况。
测试环境： 应尽可能模拟真实的使用环境（灯光、噪音、干扰因素等）。
培训条件： 测试前的培训应当反映产品实际上市后用户将获得的最低培训水平。

数据收集与报告：

FDA期望总结性评价报告包含以下内容：

每个关键任务的完成率（成功/失败/需要协助）
观察到的所有使用错误和使用困难
每个使用错误的根本原因分析（Root Cause Analysis）
使用错误是否与关键任务相关
事后访谈中用户的主观反馈
对残余使用风险的评估

关键原则： FDA不要求总结性测试的通过率达到100%。但如果在关键任务中观察到了可能导致严重伤害的使用错误，企业必须：

分析该使用错误是否是由用户界面设计缺陷引起的
如果是，需要修改设计并重新进行验证
如果使用错误是由非设计因素引起的偶发事件，需要提供充分的论证

3.5 FDA拒绝受理（RTA）中的人因工程常见问题

2023年FDA更新的RTA清单中，以下与人因工程相关的缺陷是最常见的拒绝受理理由：

未提交人因工程数据：对于需要HFE数据的产品类型（如药物输注设备、AED、家用医疗器械等），未在申报材料中包含任何人因工程信息
关键任务未识别或识别不完整：提交的关键任务清单明显遗漏了重要的使用场景
总结性测试方案设计缺陷：测试参与者不具代表性、测试环境与实际使用场景差异过大、培训条件不符合实际
使用错误的根本原因分析缺失：仅报告了使用错误数据但未进行深入分析
已知使用问题调研不充分：未对MAUDE数据库和文献中的同类产品使用问题进行系统调研

特别提示： 对于家用医疗器械（Home Use Devices）和非处方医疗器械（OTC Devices），FDA对人因工程的要求尤为严格，因为终端用户缺乏专业医学培训。

四、欧盟MDR下的可用性要求

4.1 通用安全与性能要求（GSPR）

欧盟MDR 2017/745在附录I（Annex I）中对可用性提出了明确的法律要求。最直接相关的条款包括：

GSPR 5 — 人体工程学设计原则（Ergonomic Design Principles）：

器械的设计与制造应考虑人体工程学原则，包括：

减少用户疲劳、不适和压力对使用错误的影响

减少合理可预见的环境条件（如噪音、干扰）对使用安全的影响

在预期使用环境中确保用户能够安全有效地操作器械

GSPR 5的关键要求包括：

器械的设计和制造应当最大限度地减少使用错误的风险
器械应便于使用者正确操作，尤其考虑到不同使用者群体的技能和体能差异
器械的使用信息（标签、说明书）应当清晰易懂

附录I第5节还特别强调了对非专业人士使用器械的可用性要求，要求制造商必须评估非专业用户在没有专业指导的情况下安全使用器械的能力。

4.2 IEC 62366-1作为MDR协调标准

IEC 62366-1:2015+A1:2020已被列入MDR的协调标准清单。这意味着：遵循IEC 62366-1的要求可以推定符合MDR中与可用性工程相关的GSPR。 但需注意，这种"推定符合"不是自动的——公告机构仍然会审查企业是否真正按照标准要求执行了完整的可用性工程过程。

4.3 MDCG指导文件

欧盟医疗器械协调小组（MDCG）发布了多份与可用性相关的指导文件，企业应当关注：

MDCG 2020-6：MDR/IVDR下充分临床证据的指南——其中提及可用性数据可作为临床证据的组成部分
MDCG 2021-24：关于器械分类的指导——某些器械的分类与其使用方式（专业人士 vs. 非专业人士）直接相关

4.4 欧盟审查实务中的关注点

在欧盟公告机构的实际技术文件审查中，以下问题最容易被提出质疑：

可用性工程过程与风险管理过程脱节：可用性工程文件中的关键使用场景无法追溯至风险管理文件中的危害分析
用户群体定义不充分：未考虑老年用户、非母语用户、视力障碍用户等多样化人群
评价方法过于简单：仅进行了内部专家评审，缺少真实用户参与的形成性或总结性评价
说明书的可用性未被评价：IEC 62366-1明确将说明书（IFU）视为用户界面的一部分，但很多企业忽视了对说明书可用性的评价
上市后可用性监测缺失：MDR要求在上市后监督（PMS）中持续监控使用相关问题，但许多企业的PMS系统中没有专门的使用错误追踪机制

五、中国NMPA可用性工程要求

5.1 YY/T 1474-2016与2024年注册审查指导原则

中国在可用性工程领域的核心标准是YY/T 1474-2016《医疗器械可用性工程对医疗器械的应用》，该标准等同采用了IEC 62366-1:2015。这意味着从技术要求层面，中国与国际标准保持了一致性。

2024年里程碑式变化： 2024年，NMPA正式发布《医疗器械可用性工程注册审查指导原则》（自2024年10月起施行），这是中国可用性工程监管的一次重大升级。该指导原则将可用性工程从此前的"推荐参考"层面提升至"指导性强制"层面，对II类和III类医疗器械提出了明确的可用性工程审查预期。

这一变化的核心意义在于： 在此前的实践中，NMPA对可用性工程的审查主要依赖YY/T 1474-2016推荐性标准和审评人员的个人判断，缺乏统一的审查尺度。2024年指导原则的发布使中国的可用性工程监管从"标准推荐、自愿执行"模式升级为"指导原则约束、注册审查必查"模式，审评中心有了明确的判定依据。

指导原则的核心要点包括： （一）使用风险等级分类体系

该指导原则引入了独特的使用风险等级分类体系，将医疗器械按使用风险（非产品固有风险等级）分为高、中、低三个等级。分类依据包括：使用错误可能导致的伤害严重程度、用户群体特征（专业人员vs.非专业人员）、使用环境复杂度、操作界面复杂度等因素。

使用风险等级	分类判定标准	典型产品示例	可用性工程要求深度
高风险	使用错误可能导致严重伤害或死亡；或由非专业人员在无监督环境下使用的复杂器械	药物输注泵、呼吸机、除颤器、手术机器人、胰岛素泵	必须完成完整的可用性工程过程，包括总结性可用性测试，并在注册资料中提交完整报告
中风险	使用错误可能导致中等伤害；操作界面具有一定复杂度	血糖仪、电子血压计、超声诊断设备、心电监护仪	需要可用性工程过程文件，形成性评价为主，可根据情况简化总结性评价；需提交可用性工程研究摘要
低风险	使用错误不太可能导致严重伤害；操作简单直观	简单无源器械、基础检测工具、简单敷料	可简化可用性工程文件，重点关注说明书和标签的可用性

重要提示： 使用风险等级与产品注册分类（I/II/III类）并不完全对应。例如，一款III类植入物的植入工具可能使用风险等级为"中"（因为仅由受过培训的外科医生使用），而一款II类家用血糖仪的使用风险等级可能为"高"（因为由非专业患者在无监督环境下使用）。

（二）总结性测试要求与等同器械评价

对于使用风险等级为"高"的器械，指导原则要求企业提交总结性可用性测试报告。但对于以下情况，企业可采用等同器械评价（Equivalent Device Evaluation）替代全面的总结性测试：

产品的用户界面与已上市的等同器械在功能、布局、操作流程上基本一致
等同器械在市场上已有充分的安全使用记录
产品的差异部分经过充分的形成性评价，未发现额外的使用风险

等同器械评价需要提供详细的对比分析报告，逐项说明申报产品与等同器械在用户界面设计上的异同，并论证差异部分不会引入新的使用风险。

（三）注册提交要求（按风险等级）

提交内容	高风险	中风险	低风险
可用性工程计划	必须	必须	可简化
使用规格（用户画像、使用环境）	完整提交	完整提交	简要描述
使用相关风险分析	完整提交	完整提交	需包含在风险分析报告中
关键使用场景清单	必须，逐一分析	必须，重点分析	非必须
形成性评价记录	必须，至少2轮	必须，至少1轮	推荐
总结性评价报告	必须	可简化或以论证替代	非必须
等同器械评价（如适用）	可替代总结性评价	可替代总结性评价	不适用

（四）是否需要总结性测试的决策流程

企业在确定是否需要进行总结性可用性测试时，可按以下逻辑判断：

步骤1：确定产品使用风险等级（高/中/低）
  ↓ 若为"低风险" → 无需总结性测试，提交简化可用性工程文件
  ↓ 若为"中风险" → 进入步骤2
  ↓ 若为"高风险" → 进入步骤2

步骤2：是否存在可用于等同评价的已上市器械？
  ↓ 否 → 必须进行总结性可用性测试
  ↓ 是 → 进入步骤3

步骤3：申报产品的用户界面与等同器械是否存在实质性差异？
  ↓ 是（功能布局、操作流程有显著差异）→ 必须进行总结性可用性测试
  ↓ 否（差异仅为外观、非安全相关功能）→ 进入步骤4

步骤4：差异部分是否经过充分的形成性评价且未发现额外使用风险？
  ↓ 否 → 必须进行总结性可用性测试（或补充形成性评价后重新评估）
  ↓ 是 → 可提交等同器械评价报告替代总结性测试

（五）与YY/T 1474-2016的关系

指导原则并未取代YY/T 1474-2016，而是在其基础上增加了注册审查层面的具体要求。YY/T 1474仍然是技术标准参考（定义可用性工程过程的技术要求），而指导原则明确了审评中心在审查可用性工程资料时的具体预期和判定标准——两者形成"技术标准+审查指导"的双层架构。

5.2 NMPA关注的核心要点

在中国市场的注册审评中，可用性工程相关资料通常需要体现在以下注册材料中：

产品技术要求：界面设计相关的功能性能要求
研究资料：人因工程研究报告（2024年指导原则发布后，II类和III类器械应常规提交）
说明书和标签：NMPA对说明书的可读性和准确性审查非常严格
风险分析报告：使用错误相关的风险分析

此外，以下情形NMPA对可用性工程的关注度尤为突出：

创新医疗器械特别审查程序：创新器械的注册申报中，NMPA对人因工程方面的审查预期越来越高
第三类高风险医疗器械：尤其是涉及药物输注、生命维持、手术操作的器械
家用医疗器械：如血糖仪、血压计、家用呼吸机等由非专业人员使用的器械
软件医疗器械（SaMD）：NMPA的《医疗器械软件注册审查指导原则》和《人工智能医疗器械注册审查指导原则》中均有可用性方面的要求

5.3 中国-美国-欧盟可用性工程三方监管深度对比

了解三大市场的差异对于同时面向多个市场的中国企业至关重要。以下对比涵盖了实操中最容易导致合规偏差的关键维度：

对比维度	中国（NMPA）	美国（FDA）	欧盟（MDR + NB）
核心法规/标准	YY/T 1474-2016 + 2024年注册审查指导原则	FDA HFE Guidance 2016 + 2022 Draft + IEC 62366-1 + ANSI/AAMI HE74/HE75	MDR Annex I GSPR 5 + IEC 62366-1:2015+A1:2020协调标准
用户范围定义	聚焦操作者和患者；通常不包括安装人员、维护人员、运输人员	最广泛——包括所有与器械交互的用户：操作者、患者、照护者、安装者、维护人员、清洁人员、运输人员	包括所有预期用户和合理可预见的使用者（含非专业人士），范围与FDA接近
任务范围	侧重临床操作任务和患者自用任务；对开箱、安装、维护等任务关注较少	覆盖完整使用生命周期：开箱、组装、安装、校准、日常使用、清洁消毒、维护保养、软件更新、退役处置	与FDA类似，覆盖完整使用生命周期，MDR Annex I明确要求考虑"预期用途的所有方面"
关键任务判定标准	基于使用风险等级分类（高/中/低），高风险器械须逐一识别关键使用场景；判定标准偏向后果严重度	三重标准：伤害严重程度 + 使用错误概率 + 操作复杂度；明确要求提交关键任务清单并逐一测试	基于ISO 14971风险评估，关注与安全相关的使用场景；强调与风险管理文件的双向追溯
总结性测试要求	高风险器械必须；中风险可简化；低风险不要求；明确支持等同器械评价替代	几乎所有需要510(k)/PMA的器械都需要；每个用户组至少15人；对参与者代表性和测试环境仿真度要求最高	公告机构审查深度不一，但MDR下趋势是越来越严格；对III类和植入式器械通常期望总结性测试数据
验证方法灵活性	灵活性最高——接受等同器械评价、文献数据分析、上市后安全数据论证等多种替代方案	灵活性最低——强烈期望看到真实用户参与的模拟使用验证测试；文献论证和等同性论证接受度低	中等灵活性，接受基于风险的论证减少测试范围，但需充分的理由文档支撑
说明书/IFU可用性	对说明书的可读性和准确性审查严格，但未明确要求独立的IFU可用性测试	对家用/OTC器械强烈建议IFU可读性测试（7-8年级阅读水平）；需在HFE报告中说明IFU评价情况	MDR Annex I第23.1条明确要求说明书内容应使非专业用户也能理解；公告机构可能要求IFU可用性测试证据
提交文件格式	在研究资料中提交"可用性工程研究报告"；格式遵循指导原则附件模板	提交独立的HFE Report，包含完整的HFE过程摘要和总结性测试全文报告；遵循2022 Draft Guidance格式要求	可用性工程文件分散纳入技术文件各章节（Annex II第4节、第6a节）；需在GSPR清单中逐条映射
已知使用问题调研	指导原则提及但未强制要求系统化的文献/数据库检索	明确要求调研MAUDE数据库、召回记录、文献中同类产品的已知使用问题，并在HFE报告中专门总结	期望制造商了解已知使用问题，但要求不如FDA具体和系统
上市后可用性监测	PMS/ADR报告体系中未单独设立使用错误追踪分类	FDA鼓励通过MDR/MAUDE报告持续监控使用错误	MDR明确要求在PMS中持续监控使用相关问题，并反馈至可用性工程过程

实操要点：

用户范围是最大的合规陷阱。 中国NMPA的用户范围定义不包括安装和维护人员，这意味着仅针对中国市场准备的可用性工程文件在提交FDA或欧盟时几乎必然不满足要求。建议企业在设计阶段就按照FDA的最广泛用户定义开展可用性工程，再根据各市场的具体要求裁剪提交文件。
"一套底稿，三份提交"策略。 建议企业建立一套覆盖所有市场要求的完整可用性工程底稿（按FDA最严格标准执行），然后根据三个市场不同的提交格式要求分别裁剪输出文件——这比为每个市场单独执行可用性工程过程效率高得多。
等同器械评价是中国市场的独特优势。 FDA几乎不接受通过等同性论证来替代总结性测试，但NMPA的2024年指导原则明确支持这一路径。对于已有成熟市场产品参照的企业，应充分利用这一政策灵活性。

5.4 中国企业的双重挑战

对于同时面向国内和国际市场的中国医疗器械企业，可用性工程面临的独特挑战包括：

语言与文化差异：为中国用户设计的界面逻辑在欧美市场可能不适用。例如，色彩含义（中国文化中红色表示喜庆而非危险）、文字方向、图标语义等都可能需要本地化调整。
用户习惯差异：中国临床工作流程与欧美存在差异，界面设计需要考虑不同市场的工作习惯。
监管标准差异：随着2024年NMPA指导原则的发布，中国市场的可用性要求正在快速向国际标准看齐，但FDA和欧盟公告机构的要求在用户范围和任务范围上仍然更为全面——企业需要在设计初期就按照最严格的市场要求建立可用性工程流程。

六、可用性工程过程逐步实操

6.1 步骤一：制定使用规格与用户画像

使用规格（Use Specification）是整个可用性工程过程的基础文档。它需要定义以下三个核心维度：

（一）用户画像（User Profile）

为每个预期用户组建立详细的画像，包括：

用户特征维度	需要记录的信息	示例
专业背景	教育水平、专业资质、临床经验年限	注册护士，ICU工作经验3年以上
身体能力	视力、听力、手部灵活性、体力	可能佩戴手术手套操作触摸屏
认知能力	技术素养、语言能力、记忆力	英语非母语用户，需要简洁的界面文字
心理状态	工作压力水平、注意力分散因素	急诊科场景下高压力、多任务并行
使用频率	日常使用/偶尔使用/紧急使用	每日使用20次以上

（二）使用环境（Use Environment）

环境因素	示例
物理环境	手术室（强灯光、需佩戴手套）、家庭环境（光线不一致）
社会环境	多人协作（医生指示护士操作）vs. 独立使用（患者自测）
技术环境	网络连接稳定性、与其他设备的互操作性
时间压力	急救场景（秒级响应）vs. 常规诊断（分钟级响应）

（三）用户-器械交互方式

描述用户与器械所有界面元素的交互，包括：物理操作（按压、旋转、插入）、视觉信息获取（读数、图表、警报指示灯）、听觉信息获取（报警声、语音提示）、软件交互（触摸屏操作、菜单导航）。

6.2 步骤二：使用相关风险分析与关键任务识别

（一）使用相关危害场景分析

基于使用规格和ISO 14971的危害分析，系统识别所有可能因使用错误导致危害的场景。推荐使用以下分析框架：

用户任务 → 可能的使用错误模式 → 导致的危险情况 → 最终伤害 → 严重度评估

常见使用错误模式包括：

感知错误（Perception Error）：用户未注意到或误读界面信息（如警报被忽略、数值被误读）
认知错误（Cognition Error）：用户误解信息含义（如将mmol/L误认为mg/dL）
动作错误（Action Error）：用户执行了错误的操作（如按错按钮、设置错误数值）
记忆错误（Memory Error）：用户遗忘了操作步骤或操作顺序

（二）关键任务清单制定

关键任务的识别标准：

使用错误可能导致严重伤害或死亡（严重度等级最高）
涉及复杂的操作序列或判断
在紧急或高压环境下执行
目标用户群体中存在可能增加错误概率的因素

示例：某智能输液泵的关键任务清单

编号	关键任务	可能的使用错误	潜在后果
CT-01	设置药物剂量和单位	选择错误单位（mg vs. mcg）、输入错误数值	药物过量或不足，导致患者伤害
CT-02	设置输注速率	小数点位置错误、速率单位混淆	药物过量
CT-03	响应阻塞/气泡报警	忽略报警、错误操作报警复位	延误治疗或空气栓塞
CT-04	更换药物和管路	管路连接错误、残余药物未清除	交叉给药
CT-05	紧急停止输注	在紧急情况下无法快速定位停止按钮	延误急救

6.3 步骤三：用户界面设计与评价原则

基于使用规格和风险分析结果，按照以下人体工程学原则进行界面设计：

（一）一致性原则（Consistency）

相同功能的控件在不同界面上保持一致的位置、颜色和交互方式
与行业通用惯例保持一致（如红色=停止/危险，绿色=正常/启动）
术语在整个系统中保持统一

（二）可见性与可发现性原则（Visibility & Discoverability）

关键操作和信息应当在界面上直接可见，不隐藏在深层菜单中
当前系统状态应当始终清晰可见
警报应当在视觉和听觉两个维度上同时呈现

（三）容错性原则（Error Tolerance）

提供确认步骤以防止不可逆操作（如"确认删除"对话框）
允许撤销操作
对超出合理范围的数值输入提供即时警告
采用约束设计（Constraints）限制不合理的操作可能性

（四）反馈原则（Feedback）

每个用户操作应当有即时的视觉或听觉反馈
长时间操作应当提供进度指示
错误状态应当提供明确的提示信息和纠正建议

（五）简洁性原则（Simplicity）

减少不必要的操作步骤
将复杂任务分解为清晰的子步骤
使用图标与文字结合的方式传递信息

6.4 步骤四：形成性评价（迭代设计测试）

形成性评价是整个可用性工程过程中最具投资回报比的环节。相比于在总结性评价中发现问题再回头修改设计，在形成性阶段尽早发现和修复问题可以节省数倍的时间和成本。

常用的形成性评价方法： 方法一：启发式评审（Heuristic Evaluation）

由2-3名人因工程专家独立评审界面设计
参照Jakob Nielsen的10条可用性启发式原则或IEC/TR 62366-2提供的检查清单
成本低、执行快，适合早期概念设计阶段
局限性：无法发现所有真实用户场景中的问题

方法二：认知走查（Cognitive Walkthrough）

逐步模拟用户完成关键任务的思维过程
在每个步骤评估：用户是否知道要做什么？是否能找到正确的操作？是否能理解反馈？
适合评估新用户（无经验）的学习过程

方法三：模拟使用测试（Simulated Use Testing）

邀请5-8名代表性用户在受控环境中使用原型或半成品
使用"出声思考"（Think Aloud）方法记录用户的操作过程和思维
关注用户的困惑、犹豫、错误操作和恢复行为
每轮测试后修改设计，再进行下一轮测试

方法四：说明书（IFU）可读性测试（Readability Testing）

说明书和标签是用户界面的重要组成部分，其可读性直接影响使用安全性。FDA和欧盟MDR均要求说明书对目标用户群体而言"清晰易懂"。对于家用器械（Home Use）和非处方器械（OTC），IFU可读性测试尤为关键，因为这些产品的终端用户缺乏专业医学培训，说明书是他们获取安全使用信息的主要甚至唯一渠道。

各市场的阅读水平要求：

FDA预期：面向非专业用户（如患者、照护者）的说明书应达到7-8年级阅读水平（约12-14岁读者可理解的语言难度）。这一标准基于美国成人实际阅读能力的统计数据——约有36%的美国成人健康素养处于"基础"或"以下"水平
欧盟MDR要求：MDR Annex I第23.1条要求说明书的内容应当使非专业用户也能理解，对于由非专业人士使用的器械，说明书应使用非技术性语言编写

定量可读性评估工具：

工具/指标	适用语言	评估原理	目标分数（患者材料）
Flesch-Kincaid Grade Level	英文	基于句子长度和音节数	<8.0（7-8年级）
Flesch Reading Ease	英文	基于句子和词汇复杂度	>60（"标准"到"简单"）
SMOG Index	英文	基于多音节词频率	<8.0
Gunning Fog Index	英文	基于复杂词比例	<8.0

中文说明书的可读性评估： 目前缺乏像英文Flesch-Kincaid那样标准化的中文可读性评分工具，但NMPA对说明书的审查同样关注语言清晰度。建议中文说明书遵循以下原则：避免长句（每句不超过30字）、专业术语首次出现时提供通俗解释、使用示意图辅助文字说明、关键警告信息使用加粗和颜色标注。

测试方法：

邀请代表性用户阅读说明书关键章节后进行理解度测试——评估用户能否正确理解操作步骤、警告信息和禁忌症
可读性测试通常在形成性评价阶段进行，发现问题后修改说明书语言和排版
对于多语言产品，每个语言版本均应进行独立的可读性评估，因为翻译过程可能改变原文的阅读难度

形成性评价的关键原则：

不是为了"通过"或"失败"，而是为了发现问题和改进设计
5名用户即可发现约85%的可用性问题（Nielsen的经典研究结论）
迭代次数比每次测试的用户数量更重要——建议进行至少2-3轮迭代
记录所有发现，即使当前不打算修改，也要在文档中说明理由

6.5 步骤五：总结性评价（验证测试）

总结性评价是可用性工程过程的最终"考试"，旨在验证最终的用户界面设计是否满足安全和有效使用的要求。

（一）测试方案设计

设计要素	要求
参与者数量	每个用户组至少15名（FDA预期）
参与者招募	必须来自目标用户群体，不能使用内部员工或关联人员
测试环境	模拟真实使用环境（包括灯光、噪音、干扰、佩戴手套等）
测试设备	尽可能使用最终量产版本或等同原型
培训条件	反映产品上市后用户将获得的最低培训水平
测试任务	必须覆盖所有关键任务

（二）数据收集方法

任务完成数据：成功完成/失败/需要提示后完成
使用错误记录：详细描述每个观察到的使用错误（何时、如何、用户的反应）
使用困难记录：虽未导致错误但造成明显困惑或延迟的情况
近似错误记录（Close Calls）：用户即将犯错但及时自我纠正的情况
事后访谈：每位参与者完成测试后的主观反馈、困惑点、改进建议
视频/音频记录：用于事后分析和审计追溯

（三）结果分析与报告

总结性评价报告应当包含：

测试概述：目的、方法、参与者特征、测试环境描述
关键任务结果矩阵：每个关键任务的通过率、使用错误数量和类型
使用错误根本原因分析：每个使用错误的根本原因（感知、认知、动作、记忆）
风险评估：使用错误是否与关键任务相关、可能的伤害严重程度
设计改进决策：对于每个发现的使用错误，说明是否需要修改设计、修改方案、或保留当前设计的合理论证
总体结论：当前用户界面设计的残余使用风险是否可接受

（四）常见总结性评价失败原因

测试人数不足（<15人/组）导致样本量质疑
参与者不具代表性（如用行业专家替代普通临床用户）
测试环境过于理想（安静的会议室而非嘈杂的急诊室）
培训条件过高（给予了比实际市场推广时更多的培训时间）
未覆盖所有关键任务
使用错误分析流于表面，未深入探究根本原因

6.6 步骤六：可用性工程文件归档

所有可用性工程活动的证据必须汇总为一份完整的可用性工程文件（Usability Engineering File, UEF）。这份文件通常包含：

文档名称	内容概要
可用性工程计划	范围、方法、时间表、职责分工
使用规格	用户画像、使用环境、交互方式
已知使用问题报告	市场调研和数据库检索结果
使用相关风险分析	与ISO 14971风险文件交叉引用的使用错误危害分析
关键任务清单	所有关键任务的定义和风险评估
用户界面设计规格	界面设计方案及其依据
形成性评价记录	每轮评价的方法、参与者、发现和设计改进
总结性评价方案	测试设计、参与者标准、测试任务、数据收集方法
总结性评价报告	测试结果、使用错误分析、残余风险评估、结论
可用性工程总结报告	对整个可用性工程过程的综合总结

七、SaMD/数字健康产品的特殊可用性考量

7.1 SaMD界面设计的独特挑战

软件医疗器械（SaMD）的用户界面与传统硬件医疗器械有着根本性的差异。SaMD通常运行在通用计算平台（智能手机、平板电脑、PC）上，这带来了特殊的可用性挑战：

（一）屏幕尺寸与分辨率的多样性

SaMD可能在5英寸的手机屏幕到27英寸的台式显示器上运行。关键医疗信息（如诊断结果、报警指示）必须在所有目标屏幕尺寸上都清晰可见。

（二）操作系统和浏览器兼容性

不同操作系统的交互范式不同（iOS vs. Android的手势逻辑），SaMD的界面设计需要在不同平台上保持一致的安全关键交互。

（三）用户注意力分散

手机端SaMD面临的独特风险：用户在使用医疗软件时可能被电话、短信、其他App通知打断。对于安全关键操作，需要设计防中断机制。

（四）AI/ML输出结果的可解释性

AI辅助诊断软件的一个核心可用性挑战是：如何向医生清晰传达AI的分析结论和置信度，同时避免"自动化偏见"（Automation Bias）？——即医生过度信赖AI输出而忽略自身临床判断。

7.2 SaMD可用性设计最佳实践

区分安全关键信息与一般信息：在界面层次结构中，安全关键信息（如高危报警、异常检测结果）必须获得最高优先级的视觉权重
支持不同技术素养水平的用户：提供渐进式信息展示——基本模式提供核心信息，高级模式提供详细数据
设计清晰的错误状态处理：当软件出现异常（网络断开、数据加载失败）时，必须向用户明确说明状态并提供恢复路径，避免用户基于不完整数据做出临床决策
考虑可访问性（Accessibility）：色觉障碍用户的颜色编码替代方案、屏幕阅读器兼容性、最小触控目标尺寸
版本更新的可用性影响评估：SaMD频繁更新的特性要求每次界面变更都要评估对可用性的影响——重大变更可能需要重新进行形成性甚至总结性评价

7.3 远程医疗与家用SaMD的额外要求

当SaMD由患者或非专业照护者在家庭环境中使用时，可用性工程需要额外考虑：

极低的技术素养假设：必须假设用户对智能手机的操作仅限于基本功能
无专业人员在场：用户无法在操作过程中获得即时的专业指导
文化和语言多样性：如果产品面向多个国家/地区，需要考虑多语言支持和文化适应性
老年用户：大字体、高对比度、简化操作流程、避免依赖快速操作或精细手势

八、可用性工程文件的文档编制要求

8.1 FDA对HFE文档的预期

FDA在510(k)或PMA申报中期望看到的人因工程文档通常包括以下组成部分：

（一）HFE Report / Human Factors Engineering Report

这是提交给FDA的核心文档，应当是一份独立的、完整的报告，而非分散在多个文件中的片段。FDA期望的报告结构通常包括：

产品描述和预期用途
用户群体描述
使用环境描述
已知使用问题总结
关键任务列表和分析
形成性评价活动总结
总结性评价（HF验证测试）完整报告
残余使用风险分析和结论

（二）关键任务分析文档（Critical Task Analysis）

独立或作为HFE Report的附件，详细列出每个关键任务的：

任务描述和操作步骤分解
可能的使用错误模式
使用错误的潜在后果
与风险管理文件的交叉引用

8.2 欧盟技术文件中的可用性工程文件

在欧盟MDR下的技术文件中，可用性工程文件通常归入以下部分：

附录II第4节（设计与制造信息）：用户界面设计规格和人体工程学分析
附录II第6节a（安全与性能相关前临床和临床数据）：可用性评价（形成性和总结性）数据
附录III（上市后监督技术文件）：使用错误的上市后监控计划

8.3 文档编制的常见陷阱

过于简略的使用规格：仅写"预期用户为医生和护士"是不够的，必须详细描述用户特征
关键任务清单与风险文件不一致：可用性工程文件中的关键任务列表与ISO 14971风险文件中识别的使用相关危害不对应
形成性评价记录缺失：许多企业在设计过程中确实进行了用户反馈收集，但没有形成规范的文档记录
总结性评价设计缺陷：测试方案中没有明确说明参与者选择标准、培训条件、测试环境仿真度
缺乏追溯性矩阵：未能在关键任务、使用错误模式、风险控制措施和评价结果之间建立清晰的追溯链

九、中国企业建立可用性工程体系的实操路径

9.1 常见误区

误区一："可用性工程 = UI美化"。 可用性工程的核心目标不是让界面"好看"，而是让界面"安全"。美观的界面不一定安全，安全的界面不一定美观。

误区二："我们的产品简单，不需要做可用性工程"。 IEC 62366-1适用于所有医疗器械。即使是一个看似简单的体温计，也存在使用错误的风险（如测量位置不正确、读数误解）。当然，产品复杂度越高，可用性工程的深度和广度也需要相应增加。

误区三："在产品设计完成后做一次用户测试就行了"。 这是最昂贵的做法。如果在总结性评价中发现重大可用性问题，可能需要重新修改模具、重写软件、甚至重新进行临床评价。正确的做法是在设计早期就开始形成性评价，迭代改进。

误区四："让内部工程师或销售人员充当测试用户就行了"。 内部人员对产品过于熟悉，无法代表真实用户的认知状态和使用行为。总结性评价的参与者必须是外部招募的代表性用户。

9.2 建立可用性工程能力的分步路径

第一阶段：意识建立与标准学习（1-2个月）

组织研发、质量、法规部门核心人员系统学习IEC 62366-1和FDA HFE指南
明确可用性工程在企业质量管理体系中的定位
指定可用性工程负责人（可以是现有人员兼任，但需要经过培训）

第二阶段：体系文件建设（2-3个月）

编制可用性工程SOP（标准操作规程）
将可用性工程活动嵌入现有的设计开发流程（设计控制程序）
建立可用性工程文件模板
明确可用性工程与风险管理过程的接口

第三阶段：试点项目实施（3-6个月）

选择一个即将进入设计验证阶段的产品作为试点
完整执行一轮可用性工程过程：使用规格 → 风险分析 → 界面设计 → 形成性评价 → 设计改进 → 总结性评价
总结经验教训并优化SOP

第四阶段：持续改进与专业化（持续）

建立外部用户招募渠道（与医院合作、用户招募机构合作）
建设可用性测试实验室（或与第三方实验室合作）
关注FDA和欧盟的最新指南更新
将上市后使用错误数据反馈至可用性工程过程

9.3 资源优化：低成本实施可用性工程

对于资源有限的中小企业，以下是一些降低可用性工程成本的策略：

早期多做形成性评价，减少后期返工：在纸质原型或低保真原型阶段就开始用户测试，成本极低但效果显著
利用远程可用性测试工具：对于SaMD产品，可以使用远程可用性测试平台（如UserTesting、Lookback等）降低用户招募和差旅成本
与目标市场的医院建立合作：在产品开发过程中定期邀请临床用户参与反馈
共享人因工程专家资源：如果企业规模不足以支撑全职的人因工程师，可以与专业的可用性咨询公司合作
建立可用性评价数据库：将每个项目的评价发现和设计解决方案积累为内部知识库，避免在新项目中重复犯同样的错误

9.4 关于外部人因工程咨询的选择建议

对于首次进行FDA或欧盟可用性工程合规的中国企业，建议在以下情况下考虑聘请外部人因工程咨询公司：

产品属于高风险类别（III类/PMA），FDA审查预期严格
产品为家用或OTC设备，非专业用户使用
企业内部完全缺乏人因工程经验和人才
产品在海外市场有已知的使用安全性问题（如召回历史）

选择咨询公司时的关键考量：

是否有FDA上市前审查项目的成功案例
是否具备在目标市场招募代表性用户的能力
是否了解中国企业的产品特点和出海需求
是否能够在中国境内开展部分评价活动以降低成本

十、总结：可用性工程是产品竞争力的关键一环

可用性工程不仅仅是监管合规的要求，更是产品质量和市场竞争力的核心组成部分。一个经过系统化可用性工程验证的产品，意味着：

更高的患者安全性：显著减少使用错误导致的不良事件
更低的法规风险：大幅降低FDA Refuse to Accept和公告机构Technical Documentation Deficiency的概率
更好的用户体验：临床用户更愿意使用、推荐和复购
更低的售后成本：减少因操作困难导致的客户投诉和技术支持需求
更强的市场差异化：在同质化竞争中脱颖而出

对于中国医疗器械企业的全球化之路，建立系统化的可用性工程能力是一项长期而有价值的投资。建议企业将可用性工程与现有的风险管理（ISO 14971）、软件生命周期管理（IEC 62304）和技术文件编制（EU MDR）能力深度整合，构建完整的产品安全保障体系。

附录：核心标准与参考文献速查

文件名称	编号	适用范围
可用性工程在医疗器械中的应用	IEC 62366-1:2015+A1:2020	全球（ISO/IEC协调标准）
可用性工程实施指南	IEC/TR 62366-2:2016	全球（技术报告/指南）
人因设计过程（医疗器械）	ANSI/AAMI HE74:2009 (R2018)	美国（FDA认可共识标准）
人因工程设计指南（医疗器械）	ANSI/AAMI HE75:2018	美国（FDA认可共识标准）
FDA人因工程指南（终版）	Applying Human Factors and Usability Engineering to Medical Devices (2016)	美国
FDA HFE提交内容指南（征求意见稿）	Content of Human Factors Information in Medical Device Marketing Submissions (2022)	美国
组合产品HFE问答指南	Human Factors Studies for Combination Products — Q&A (2023)	美国
FDA质量体系法规（设计验证）	21 CFR 820.30(g)	美国
医疗器械风险管理	ISO 14971:2019	全球
医疗器械可用性工程	YY/T 1474-2016	中国
医疗器械可用性工程注册审查指导原则	NMPA 2024年发布（2024年10月施行）	中国
MDR通用安全与性能要求	EU MDR 2017/745 Annex I	欧盟
说明书与标签的可用性	IEC 60601-1-6:2010+AMD1:2013+AMD2:2020	全球（医用电气设备）
医用电气设备可用性	IEC 60601-1-6	全球（IEC 60601系列附属标准）