本指导原则是对糖尿病视网膜病变眼底图像辅助诊断软件的一般要求,申请人应依据产品的具体特性确定其中的内容是否适用。若不适用,需具体阐述其理由及相应的科学依据,并依据具体的产品特性对注册申报资料的内容进行充实和细化。
本指导原则是供注册申请人和技术审评人员使用的指导性文件,但不包括注册审批所涉及的行政事项,亦不作为法规强制执行,应在遵循相关法规的前提下使用本指导原则。如果有能够满足相关法规要求的其他方法,也可以采用,但是需要提供详细的研究资料和验证资料。
本指导原则是在现行法规和标准体系以及当前认知水平下制定的,随着法规和标准的不断完善,以及科学技术的不断发展,相关内容也将适时进行调整。
本指导原则是人工智能医疗器械指导原则体系的重要组成部分,基于人工智能医疗器械审评指导原则的通用要求,明确了糖尿病视网膜病变眼底图像辅助诊断软件的具体要求。
本指导原则适用于糖尿病视网膜病变眼底图像辅助诊断软件的注册。产品管理类别为三类,分类编码为21-04-02。产品通常由客户端和服务器端(云服务器或本地服务器)组成,深度学习算法通常运行在服务器端。若作为软件组件集成于其他医疗器械(如眼底相机)中,可以参考本指导原则的要求。
本产品的核心功能是采用深度学习等人工智能算法对由眼底相机(指采用照相技术用于眼底摄影成像的常规眼底照相机,不包括激光、荧光等特殊方式的眼底相机)拍摄的彩色眼底照片进行分析,临床通常用于辅助医生发现II期及II期以上糖尿病视网膜病变(简称“糖网”,英文缩写DR),并给出进一步就医检查的建议。I期和II期的分界线决定着患者需要转诊到专业眼科机构进行诊疗,还是留在基层医疗机构定期复查。不能仅凭算法诊断结果进行临床决策,需要由医生对图像拍摄质量和诊断结果进行综合判断,确认签字后报告生效,必要时需重新拍摄分析和/或修改结果。
产品的核心功能通常是对单张眼底照片进行糖网二分类,可能会进一步对患者双眼多张照片分析结果进行简单逻辑运算后给出综合结论。产品可能还包含图像质量判定、糖网分期等辅助功能,采用深度学习算法或传统模式识别算法实现。不同产品支持的拍摄方式(散瞳或免散瞳)、拍摄范围(体现视场角,并明确多张拼接,眼底后极部包括黄斑区和视盘区的单张照片,分别以黄斑区和视盘区为中心的2张眼底照片等情形)、相机种类/型号等有所区别。
本指导原则不适用于核心功能不是糖网辅助诊断的产品,如黄斑病、青光眼辅助诊断软件。本指导原则不包括临床评价的要求。
(一)监管信息
1.独立软件
产品名称应符合通用名称命名规范要求,通常体现输入数据(彩色眼底照片)、目标疾病(糖尿病视网膜病变)、预期用途(辅助诊断)等特征词。若主要功能仅为糖网辅助诊断,产品名称建议采用:糖尿病视网膜病变眼底图像辅助诊断软件。
按照2017版《医疗器械分类目录》和《人工智能医用软件产品分类界定指导原则》,该类产品管理类别为三类,分类编码为21-04-02。
型号规格应给出产品的型号和软件发布版本。
结构组成应明确软件交付方式(如光盘/U盘安装、网络下载),结合网络部署情况给出软件功能模块,应体现出包括深度学习功能的所有模块。
适用范围应体现出使用场所、适用人群(如成人糖尿病患者)、目标用户(如执业医师)、处理对象(包括眼底照片的拍摄方式、拍摄范围、张数)、临床用途(如图像质量判定、转诊建议)、所支持眼底相机要求(内容较多的可在产品技术要求中体现)、主要使用限制(通常应体现不能仅凭软件结果给出临床决策)。
2.软件组件
糖网辅助诊断功能作为软件组件集成于其他医疗器械(如眼底相机)中时,产品名称、分类编码、型号规格、结构组成与所集成医疗器械保持一致,产品管理类别应为第三类。在适用范围和产品技术要求中体现糖网辅助功能的相关信息,软件功能名称可参照独立软件要求。
(二)综述资料
1.器械及操作原理描述
按照《人工智能医疗器械注册审查指导原则》在算法研究报告中提供算法基本信息,结合本产品特点应注意和细化的要求详见下文算法研究资料的算法基本信息。
2.产品的适用范围、适用人群、禁忌证
按照国家药监局发布的注册申报资料要求提供产品的适用范围、预期使用环境、适用人群、禁忌证,需与申报产品的性能、功能相符,并需与临床评价资料结论一致。
(三)非临床资料
1.产品技术要求
1.1规格信息
应给出软件发布版本和版本命名规则。软件版本命名规则原则上应涵盖算法驱动型更新和数据驱动型更新,明确并区分重大软件更新和轻微软件更新,其中重大软件更新列举常见典型情况。
应给出可支持的眼底相机的技术要求、拍摄要求、型号,应有算法研究资料的结果做支持。相机技术要求至少应包括执行标准(如YY 0634《眼科仪器眼底照相机》)、图像类型(如彩色眼底照片,并明确不适用的图像类型,如荧光造影等)、图像像素。拍摄要求至少应明确拍摄方式(散瞳与否)、拍摄范围(如包括黄斑区和视盘区的单张眼底图),还可包括对焦方式(手动、自动)、固视要求。眼底相机型号应给出制造商和型号,且应为国内上市的产品。
附录的要求参考软件指导原则,其中:附录A体系结构图,应明确各功能模块的节点位置(如客户端、云端),云计算服务商名称(如适用),明确人工智能核心算法运行位置;附录B界面关系,应体现出诊断分析界面和报告界面的细节,明确算法自动生成的标注、诊断结果哪些可以修改,报告界面应有医生签字处。
1.2性能指标
应制定软件的所有临床功能,如糖网二分类、糖网分期、图像质量判定。糖网二分类或分期应给出依据的文献,若是自定规则,应详细描述依据、原因和方法等。图像质量判定中应明确不合格的图像类型并说明是否进行后续分析。枚举软件在各种情形下可生成的所有诊断结果、转诊建议、图像质量判定的措辞等。
若含有基于测评数据库测试的性能指标,其要求参考《人工智能医疗器械注册审查指导原则》。
运行效率,明确所定义效率包括了哪些环节(如上传、处理、返回、显示)。
运行环境,运行在不同计算机系统的产品模块(如客户端和云端)应分别描述其运行环境。
2.软件研究资料
注册申请人应依据《医疗器械软件技术审查指导原则》、《医疗器械网络安全技术审查指导原则》、《移动医疗器械注册技术审查指导原则》、《人工智能医疗器械注册审查指导原则》等指导原则,提交相应注册申报资料。
该类产品的软件安全性级别不低于为B级,提交的软件研究资料应分为软件研究资料、网络安全研究资料、算法研究资料三部分。
关于运行环境兼容性,依据《医疗器械软件注册审查指导原则》:每个互不兼容的运行环境(含云计算)需作为一个检测单元分别检测;进行兼容性验证,对于B/S架构的软件,还应提供所有声称可兼容的客户端浏览器的兼容性测试报告。
网络安全方面除遵循《医疗器械网络安全注册技术审查指导原则》之外,由于深度学习算法的特殊性,还需要遵循《人工智能医疗器械注册审查指导原则》中关于网络安全和数据安全过程控制的要求。
3.算法研究资料
应基于《人工智能医疗器械审查指导原则》第四章生存周期过程、第五章技术考量、第六章算法研究资料的所有相关要求提供算法研究报告或算法更新研究报告,以及人机交互研究资料,认为不适用的应详述理由。在核心功能糖网二分类之外包括其他相关子功能的应分别提供资料,在能清晰区分的前提下,相同内容宜合并,有接口关系的算法/功能应统筹提供资料。根据本产品特点需要细化之处如下。
3.1算法基本信息
(1)糖网分类算法的输入应明确支持的拍摄方式、拍摄范围、相机型号,输出应分别明确算法的输出和自动生成的诊断结论;
(2)图像质量判定算法应明确可识别的不良质量类型或程度,给出判定规则的依据,明确对于不同质量的图像后续是否均进行分析,结果是否有其他使用限制。
(3)部署在云服务器的应说明服务器的物理位置(至少明确到省/直辖市);
(4)软件组件应描述与产品其他组成部分的功能接口和用户接口。
3.2算法需求规范
产品设计应充分考虑我国糖网相关诊疗指南、方案,跟踪最新版本,如《我国糖尿病视网膜病变临床诊疗指南(2014)》、《我国糖尿病视网膜病变筛查的图像采集及阅片指南(2017)》、《糖尿病视网膜病变分级诊疗服务技术方案(2017)》等。
明确产品的使用场景、使用者、适用人群,如允许操作者不同于报告签署人,应分别描述。
明确图像质量控制的方式,即达到什么要求的图像可供算法分析,尤其应描述算法在图像质量不佳情形下的处理方法(如:不进行分析,或在给出分析结果时明确提示图像质量不佳的负面影响)。明确图像质控过程中使用者和算法(若有)的职责。
明确算法训练数据集要求,明确预期采集各糖网分期样本、阴性样本、相似/相关的疾病/症状样本的数量和分布要求,明确相机型号/种类、拍摄方式(散瞳、免散瞳)、拍摄范围、分辨率的要求,以及人群分布(性别、年龄、地域、基础疾病等)、医院级别、医院数量等要求。应纳入一定量相似/相关的疾病/症状样本,即与糖网症状类似或具有相关性疾病患者的图像。
明确算法性能设计目标,应给出核心功能糖网二分类的敏感性、特异性,明确设定依据,应能够满足预期临床使用需求,其他辅助功能参考《人工智能医疗器械注册审查指导原则》的建议设定性能设计目标。
3.3数据质控
(1)数据采集
应明确不同眼底相机的拍摄方式、拍摄范围、采集过程的不同要求,详述采集过程的人员管理、流程管理、质量评估要求。若使用历史数据,至少应明确拍摄设备、拍摄方式、拍摄范围,对其他要求开展差异分析,追溯数据的生成过程,论证采集和标注过程的科学性、规范性。
(2)数据整理
明确经数据清洗弃用数据的原因和数量。数据预处理环节应采用典型图片和流程图说明处理过程和每一步处理的结果。原始数据库的预处理过程若与产品中算法运行的预处理过程存在差异,应通过比较来说明。
(3)数据标注
建议列表给出标注、审核、仲裁人员的基本信息,如科室/专业、职称、工作年限、所在机构、培训考核情况、工作量,若有外国人员则需明确其资质要求。宜采用流程图介绍单张图片的标注、审核、仲裁过程。若标注较复杂宜采用典型图片加流程图说明每一步的标注内容以及特殊情况处理,简述全部图片标注的管理过程、时间周期,特别是标注周期内的质量评估。若用于不同功能做标注的数据集与数据量有所区别,应明确具体情况。
(4)数据集构建
对于标注前的基础数据库,标注后划分的训练集、调优集、测试集,应给出样本量和分布情况及其确定依据,以及集合划分的方法、依据。应注意保证糖网I期、II期样本的数量。样本分布应主要考虑相机种类/型号、拍摄方式(散瞳与否)、拍摄范围、合并相似/相关的疾病/症状等因素,兼顾人群分布(性别、年龄、地域、基础疾病等)、来源医院等因素。可进行数据扩增,应符合《人工智能医疗器械注册审查指导原则》的要求。
3.4算法验证与确认
(1)算法性能评估
基于测试集提供假阴性与假阳性、重复性与再现性、鲁棒性/健壮性等算法性能指标评估结果,以证明算法性能满足设计目标。亦可基于第三方数据库开展算法性能评估。
若有图像质量判定模块,应选择合适的评价指标验证图像质量分级算法性能。
(2)算法性能影响因素分析
应进行算法性能影响因素分析以提升算法可解释性,详述影响算法性能的主要因素及其影响程度,基于分析结果明确产品使用限制和必要警示提示信息。
核心功能糖网二分类的主要性能影响因素包括但不限于相机种类/型号、拍摄方式(散瞳与否)、拍摄范围、合并相似/相关的疾病/症状、图像质量,还可能受人群分布(性别、年龄、地域、基础疾病等)、来源医院等因素一定影响。应针对不同因素分别建立子数据集进行测试,以了解这些因素的影响程度。对于其他功能模块,应基于产品特征初步分析识别可能对性能产生影响的因素后进行分析。
对于某一影响因素,可建立多个包含单一因素的子集和一个包含所有子集的合集(必要时)分别进行性能测试,统计分析各集合性能差异,评价影响程度。对于预期对性能有显著影响且存在相互关联的不同影响因素,也可建立包含多因素的子集进行分析,如有A、B两个因素,每个因素有2种情况,可形成分别仅包含A1B1、A1B2、A2B1、A2B2因素的4个子集。其中,处于分界点处的糖网I期、II期分类的准确性对产品性能起关键影响,应单独建立测试集验证。各集合应保证具有足够的样本量,性能评估结果应给出中心值和95%置信区间。各子集宜以产品研发时标注数据库中的测试集为主,当某一待评价因素的样本量较少或没有时(如测试集只包括A型、B型眼底相机的图像,从其他数据集纳入C型相机的图像),可补充其他数据集的样本,如临床试验、真实世界数据、第三方测试等的样本,但合并在一个子集的数据其标注规则应基本一致。简述各子集的构建情况,如数据来源、标注过程、标准规则、样本分布等。
(3)算法性能综合评价
按照《人工智能医疗器械注册审查指导原则》开展算法性能比较分析和算法性能综合评价。自建测试数据集测试、临床试验、真实世界数据测试、第三方数据库测试、压力测试、对抗测试等均可视为算法性能评估场景。应分别简介各数据集的构建情况,如数据来源、标注过程、标注规则、样本分布(至少应体现相机型号、拍摄方式、拍摄范围、相似/相关疾病/症状的情况)等,列表给出主要性能评价指标,结合数据集构建和性能评价结果对产品性能综合评价。针对训练样本量和测试样本量过少、测试结果明显低于算法设计目标、算法性能变异度过大等情况,对产品的适用范围、使用场景、核心功能在产品适用范围、产品技术要求、说明书、产品界面等处明确使用限制;针对其他对算法性能影响较小的因素,给出必要的提示信息。
3.5人机交互研究资料
本产品核心功能单一,结果明确,但使用场景局限,不仅不能替代医生,更需要操作者充分了解产品的特点、使用限制和注意事项。应制定操作者培训和考核方案,并验证方案的可行性。
软件生成的报告应可修改,由具有糖网诊疗资质的执业医师签字确认后生效,上述医生应已具备基于眼底照片进行糖网分期诊断及易混淆病症辨析的能力,经过产品培训,还应具有以下能力:1.能够判定拍摄范围和拍摄质量能否达到申报产品处理要求;2.结合软件给出结果,根据自己的判断对自动生产报告进行修改或重新拍摄、分析;3.了解算法的限制和注意事项,结合患者临床情况做出综合判断,给予患者必要的口头医嘱和/或在报告上附加信息。注意,某些产品虽然具有图像质量判断模块,但由于软件验证无法穷举所有图像质量不合格情况,仍需由医生对图像质量做最终判断。
培训方案应包括但不限于:软件基本操作、图像质量判定、软件的使用限制和注意事项。培训考核应纳入适当的医生数量和测试样本数量,评价点除糖网分期诊断,还应包括上述能力。参加考核的医生应与预期使用产品的医生在培训前具有等同能力,以验证培训方案的可行性。
(四)说明书
说明书应符合《医疗器械软件技术审查指导原则》、《医疗器械网络安全技术审查指导原则》的相关要求,还应符合《人工智能医疗器械注册审查指导原则》关于辅助决策类产品的相关要求。
应给出产品的所有注意事项,特别是结合前期的人机交互、算法性能评估、算法性能影响因素评估后得出的使用限制,应包括且不限于:
1.产品仅用于检测糖网,不用于检测其他疾病,如果未检测出糖网,不意味着不存在其他眼部疾病;
2.产品应由有资质的机构和人员按照说明书使用;
3.执业医师应该结合软件诊断、患者病史、主诉等各种信息综合给出诊断意见,特别应关注患者的眼部相关病史及治疗史,如用于妊娠期妇女,由于可能为妊高症,病程进展快,应告知其提高复查频率;
4.执业医师应接受过相应培训,产品使用中负责评估图像拍摄质量和范围是否符合诊断要求,算法诊断结果是否正确,必要时重新拍摄分析或修改结论;
5.明确产品进行糖网分期的设计依据;
6.应告知用户产品所采集数据的保存和传输情况,数据安全、网络安全方面的法律法规要求及其应承担的责任。
(五)质量管理体系文件
应当明确产品生产研发过程,可采用流程图的形式,并说明其过程控制点。提供采集、标注、脱敏等开发软件的验证资料。说明标注数据库的保存位置和管理方式。
[1]《医疗器械注册与备案管理办法》(国家市场监督管理总局令第47号)[Z].
[2]《医疗器械说明书和标签管理规定》(国家食品药品监督管理总局令第6号)[Z].
[3]《医疗器械注册申报资料要求和批准证明文件格式》(国家药品监督管理局2021年第121号)[Z].
[4]《医疗器械安全和性能的基本原则》(国家药品监督管理局2020年第18号通告)[Z]
[5]《医用软件通用名称命名指导原则》(国家药品监督管理局2021年第48号通告)[Z]
[6]《人工智能医疗器械注册审查指导原则》(国家药品监督管理局医疗器械技术审评中心2022年第8号)[Z].
[7] 《医疗器械软件注册审查指导原则(2022年修订版)》(国家药品监督管理局医疗器械技术审评中心2022年第9号)[Z].
[8] 《医疗器械网络安全注册审查指导原则(2022年修订版)》(国家药品监督管理局医疗器械技术审评中心2022年第7号)[Z].
[9]《人工智能类医用软件产品分类界定指导原则》(国家药品监督管理局2021年第47号)[Z].
[10] YY/T 1833.1,《人工智能医疗器械 质量要求和评价 第1部分:术语》(报批稿) [S].
[11]YY/T 1833.3,《人工智能医疗器械 质量要求和评价 第3部分:数据标注通用要求》(报批稿) [S].
[12] GB/T 25000.12-2017 系统与软件工程 系统与软件质量要求和评价(SQuaRE) 第12部分:数据质量模型[S]
[13] AIMDICP-WG6-2020-001 基于眼底彩照的糖尿病视网膜病变辅助决策产品性能指标和测试方法[S]
[14] FDA. Computer-Assisted Detection Devices Applied to Radiology Images and Radiology Device Data[Z], 2012.7
[15] FDA. Considerations for Computer-Assisted Detection Devices Applied to Radiology Images and Radiology Device Data[Z], 2012.7
[16] FDA. Proposed Regulatory Framework for Modifications to Artificial Intelligence/Machine Learning (AI/ML) - Based Software as a Medical Device (SaMD) Draft[Z], 2019.5
[17] FDA. Artificial Intelligence and Machine Learning(AI/ ML) Software as a Medical Device(SaMD) Action Plan[Z], 2021.1
编辑:Cikey TAG:/辅助诊断软件注册/指导原则/糖尿病像辅助诊断软件注册