病理圖像人工智能分析軟件性能評價審評要點(2023年第23號)
發(fā)布日期:2023-07-10 閱讀量:次
附件:病理圖像人工智能分析軟件性能評價審評要點(2023年第23號).doc
病理圖像人工智能分析軟件性能評價審評要點
本要點旨在指導注冊申請人對病理圖像人工智能分析軟件注冊申報資料中非臨床評價部分的準備及撰寫,同時也為技術(shù)審評部門提供參考。
本要點是對病理圖像人工智能分析軟件申報資料的一般要求,申請人需依據(jù)產(chǎn)品的具體特性確定其中內(nèi)容是否適用。若不適用,需具體闡述理由及相應(yīng)的科學依據(jù),并依據(jù)產(chǎn)品的具體特性對注冊申報資料的內(nèi)容進行充實和細化。
本要點是供注冊申請人和技術(shù)審評人員使用的指導性文件,但不包括審評審批所涉及的行政事項,亦不作為法規(guī)強制執(zhí)行,需在遵循相關(guān)法規(guī)的前提下使用本指導原則。如果有能夠滿足相關(guān)法規(guī)要求的其他方法,也可以采用,但是需要提供詳細的研究資料和驗證資料。
本要點是在現(xiàn)行法規(guī)和標準體系以及當前認知水平下制定的,隨著法規(guī)和標準的不斷完善,以及科學技術(shù)的不斷發(fā)展,本要點的相關(guān)內(nèi)容也將進行適時的調(diào)整。
一、適用范圍
病理圖像人工智能分析軟件是指基于數(shù)字病理圖像,采用深度學習等人工智能技術(shù)實現(xiàn)對病理圖像的分割、檢測等功能的醫(yī)療器械。數(shù)字病理圖像包括經(jīng)數(shù)據(jù)成像設(shè)備獲得的顯微鏡下細胞或組織圖像、全玻片數(shù)字掃描技術(shù)(Whole Slide Imaging, WSI)的病理圖像等。產(chǎn)品在醫(yī)療機構(gòu)和/或醫(yī)學實驗室使用,可輔助病理醫(yī)師為疾病的診斷、預后、治療等提供信息,不能作為臨床診斷決策的唯一依據(jù)。
根據(jù)《人工智能醫(yī)用軟件產(chǎn)品分類界定指導原則》,本文所述軟件用于輔助決策,可為病理醫(yī)生提供病灶特征識別、病變性質(zhì)等信息,按第三類醫(yī)療器械管理。
分類編碼:21-04-02。
產(chǎn)品名稱:建議依據(jù)軟件醫(yī)療用途進行產(chǎn)品名稱命名,體現(xiàn)處理對象和臨床用途,如宮頸細胞學數(shù)字病理圖像計算機輔助分析軟件、免疫組化病理圖像計算機輔助診斷軟件。申請人可結(jié)合申報產(chǎn)品的特征,根據(jù)《醫(yī)用軟件通用名稱命名指導原則》,參考《醫(yī)療器械分類目錄》中的品名舉例確定命名。
若作為軟件組件集成于其他醫(yī)療器械(如病理切片掃描儀、醫(yī)學顯微圖像掃描分析產(chǎn)品)中,可以參考本要點的要求。
本要點基于《人工智能醫(yī)療器械注冊審查指導原則》的基本框架要求,其中關(guān)于人工智能醫(yī)療器械的的術(shù)語定義、相關(guān)要求參照上述指導原則。
二、產(chǎn)品簡介
產(chǎn)品的工作原理:產(chǎn)品為獨立軟件,采用深度學習技術(shù)對數(shù)字病理圖像進行前處理(如圖像質(zhì)量改善)和常規(guī)后處理(如圖像分割、細胞/組織定位、細胞分類等),實現(xiàn)對數(shù)字病理圖像中疑似異常細胞的計數(shù)和定位識別功能或異常組織區(qū)域的定位和標記功能;通過算法對細胞/組織圖像塊的分類結(jié)果進行分析,實現(xiàn)對病理圖像的輔助診斷功能。
主要結(jié)構(gòu)及組成:結(jié)構(gòu)組成明確交付內(nèi)容和功能模塊,其中交付內(nèi)容包括軟件安裝程序、授權(quán)文件、外部軟件環(huán)境安裝程序等軟件程序文件,功能模塊包括客戶端、服務(wù)器端(若適用)等,若適用注明選裝、模塊版本。
服務(wù)器端:負責接收并處理請求,對請求進行數(shù)據(jù)處理,調(diào)用人工智能算法(此處應(yīng)體現(xiàn)核心算法名稱,如AlexNet,ResNet,MobileNet,EfficientNet,ResNeXt等)對圖像數(shù)據(jù)進行處理并輸出分析結(jié)果。把用戶請求的數(shù)據(jù)結(jié)果返回客戶端。
客戶端:將服務(wù)器端分析結(jié)果呈現(xiàn)到用戶界面。用戶可在用戶界面進行輔助診斷/閱片、任務(wù)管理、報告管理、檢索查詢、用戶管理、查看日志等功能操作。
三、基本要求
(一)綜述資料
詳細描述該產(chǎn)品的圖像前處理和后處理功能及功能實現(xiàn)方法,描述配套使用圖像采集設(shè)備、切片制作流程(包括配套試劑、設(shè)備)和圖像質(zhì)量的要求,簡述軟件采用的主要算法。
簡述軟件研發(fā)背景,包括對可輔助診斷疾病的介紹,目前相關(guān)疾病臨床診斷參考標準、病理診斷類型或細胞異常類型等依據(jù)。申報產(chǎn)品的病理閱片標準和病理分型依據(jù)應(yīng)與臨床標準一致。
(二)非臨床資料
1.產(chǎn)品技術(shù)要求及檢驗報告
產(chǎn)品技術(shù)要求可參考《醫(yī)療器械軟件注冊審查指導原則》(2022年修訂版)附錄中的模板進行編寫,此外性能指標還應(yīng)包括“臨床功能”,如圖像處理、圖像分析、細胞/組織識別、病理圖像診斷提示等內(nèi)容。
2.軟件研究資料
按照《醫(yī)療器械軟件注冊審查指導原則》(2022年修訂版)、《醫(yī)療器械網(wǎng)絡(luò)安全注冊審查指導原則》(2022年修訂版)、《人工智能醫(yī)療器械注冊審查指導原則》的要求,提交研究資料。明確軟件發(fā)布版本號。提交的研究資料主要包含軟件研究資料、算法研究資料、網(wǎng)絡(luò)安全研究資料。研究資料內(nèi)容應(yīng)涵蓋申報產(chǎn)品適用范圍中描述的全部內(nèi)容。
2.1風險管理
參考YY/T 0316、YY/T 1406.1和YY/T 0664、GB/T 42062進行產(chǎn)品的風險管理活動。風險管理活動應(yīng)當基于軟件的預期用途、使用場景、核心功能予以實施,并貫穿軟件全生命周期過程。此類產(chǎn)品臨床使用中的風險主要包括圖像分析過程中的識別、標記錯誤,非病理醫(yī)師使用和樣本采集錯誤等,造成的假陰性和假陽性錯誤。算法風險主要包括過擬合和欠擬合,數(shù)據(jù)擴增和數(shù)據(jù)偏移等。
2.2需求規(guī)范
提供軟件需求規(guī)范文檔,明確軟件的功能、性能、接口、用戶界面、運行環(huán)境、網(wǎng)絡(luò)安全、數(shù)據(jù)采集等需求,另附軟件開發(fā)所形成的原始文檔。
數(shù)據(jù)采集需考慮數(shù)據(jù)來源的合規(guī)性、充分性和多樣性,數(shù)據(jù)分布的科學性和合理性,數(shù)據(jù)質(zhì)控的充分性、有效性和準確性。數(shù)據(jù)應(yīng)來源于不同地域的不少于3家機構(gòu)。機構(gòu)應(yīng)采用軟件說明書明確的切片制作流程、組織染色和免疫組織化學技術(shù)制備的切片(包含指定的樣本來源,即指定的切片制備流程和/或樣本保存液、抗體試劑、染色液等)和配套的圖像采集設(shè)備獲得的符合要求的數(shù)字病理圖片。數(shù)據(jù)分布的科學性和合理性,應(yīng)考慮包括但不限于疾病構(gòu)成(如分型、分級、分期)、人群分布(如高危人群、患者,性別、年齡)等情況。
算法性能需結(jié)合產(chǎn)品預期用途,綜合考慮分析速度、敏感性、特異性、重復性與再現(xiàn)性、泛化性等性能指標的適用性及其要求。同時還需考慮因梯度消失、梯度爆炸、過擬合和欠擬合等影響算法性能的因素。
使用限制需考慮產(chǎn)品禁用、慎用等場景,準確表述產(chǎn)品使用場景,提供必要警示提示信息。
2.3軟件性能研究
提供產(chǎn)品性能研究資料以及產(chǎn)品技術(shù)要求的研究和編制說明,給出軟件相關(guān)的功能性、安全性指標的確定依據(jù)。注冊申請人需在軟件研究資料中提交GB/T 25000.51自測報告,亦可提交自檢報告或檢驗報告代替自測報告。產(chǎn)品技術(shù)要求中各指標依據(jù)產(chǎn)品自身特點確定。
2.4算法研究資料
根據(jù)《人工智能醫(yī)療器械注冊審查指導原則》提交算法研究資料。提交每個人工智能算法或算法組合的算法研究報告。
2.4.1算法基本信息
明確算法的名稱、類型、結(jié)構(gòu)、輸入輸出、流程圖、算法框架、運行環(huán)境等基本信息以及算法選用依據(jù)。
其中,算法類型從學習策略、學習方法(基于模型的算法和基于數(shù)據(jù)的算法)、可解釋性(白盒算法和黑盒算法)等角度明確算法特性。算法結(jié)構(gòu)部分應(yīng)明確算法的層數(shù)、參數(shù)規(guī)模等超參數(shù)信息。流程圖應(yīng)包含輸入圖像示例、學習方法示意圖和輸出圖像示例。算法框架應(yīng)明確所用人工智能算法框架的基本信息,包括名稱、類型(自研算法框架、現(xiàn)成算法框架)、型號規(guī)格、完整版本、制造商等信息。若基于云計算平臺,應(yīng)明確云計算的名稱、服務(wù)模式、部署模式、配置以及云服務(wù)商的名稱、住所、服務(wù)資質(zhì)。運行環(huán)境應(yīng)明確算法正常運行所需的典型運行環(huán)境,包括硬件配置、外部軟件環(huán)境、網(wǎng)絡(luò)條件;若使用人工智能芯片應(yīng)明確其名稱、型號規(guī)格、制造商、性能指標等信息。算法選用依據(jù)詳述算法或算法組合選用的理由和基本原則。
2.4.2算法風險管理
結(jié)合預期用途、使用場景、核心功能、算法成熟度、網(wǎng)絡(luò)安全等因素,此類產(chǎn)品的軟件安全性級別為嚴重級別。提供算法風險管理資料,若無單獨文檔可提供軟件風險管理資料,并注明算法風險管理所在位置。
2.4.3算法需求規(guī)范
提供算法需求規(guī)范文檔,若無單獨文檔可提供軟件需求規(guī)范,并注明算法需求所在位置。
2.4.4數(shù)據(jù)收集
2.4.4.1提供數(shù)據(jù)來源合規(guī)性聲明,列明數(shù)據(jù)來源機構(gòu)的名稱、所在地域、數(shù)據(jù)收集量、倫理批件(或科研合作協(xié)議)編號等信息。
2.4.4.2數(shù)據(jù)采集
建議參考2.2需求規(guī)范的要求,提供數(shù)據(jù)采集操作規(guī)范文檔,包括數(shù)據(jù)采集方案和數(shù)據(jù)采集標準操作規(guī)程。
數(shù)據(jù)采集主要由臨床機構(gòu)實施,應(yīng)明確病理切片或細胞涂片的制作流程、圖像采集方式(如眀場掃描)和采集參數(shù)要求(包含掃描倍率、掃描層數(shù)、焦點數(shù)量要求、聚焦方式、采樣閾值等)、采集設(shè)備要求(應(yīng)包含掃描儀的型號、分辨率、圖像尺寸等)、病理切片或細胞涂片要求、樣本的來源與分布、樣本質(zhì)量要求(包含切片或涂片的保存時限、玻片完整性等)、圖像質(zhì)量要求(應(yīng)包含圖象區(qū)域、清晰度等要求)、采集過程、數(shù)據(jù)脫敏、數(shù)據(jù)轉(zhuǎn)移等要求。采集過程應(yīng)對樣本數(shù)據(jù)進行編號并加密,方案中應(yīng)包含編號規(guī)則。
2.4.4.3數(shù)據(jù)整理
明確數(shù)據(jù)清洗/預處理程序,對數(shù)據(jù)處理中應(yīng)用的軟件進行簡述,并以附件的形式提交數(shù)據(jù)處理中各軟件的軟件研究資料。
2.4.4.4數(shù)據(jù)標注
明確標注人員和仲裁人員的資質(zhì)要求和培訓內(nèi)容,標注人員和仲裁人員應(yīng)為病理醫(yī)師,數(shù)據(jù)應(yīng)經(jīng)過不少于2人標注。簡述標記系統(tǒng)信息,配合病理圖像和標注系統(tǒng)界面截圖,介紹標注過程、標注對象和標注標準(注意與病理診斷標準的一致性)等。明確標注過程質(zhì)控、標注質(zhì)量評估、數(shù)據(jù)安全保證等要求。標注質(zhì)量評估可抽選一定比例數(shù)據(jù)進行非標注人員的評估。
提供原始數(shù)據(jù)庫、基礎(chǔ)數(shù)據(jù)庫、標注數(shù)據(jù)庫、擴增數(shù)據(jù)庫(如有),關(guān)于疾病構(gòu)成的數(shù)據(jù)分布情況,包括適用人群、數(shù)據(jù)來源機構(gòu)、采集設(shè)備、樣本類型等因素。
若數(shù)據(jù)來自公開數(shù)據(jù)庫,提供公開數(shù)據(jù)庫的基本信息(如名稱、創(chuàng)建者、數(shù)據(jù)總量等)和使用情況(如數(shù)據(jù)使用量、數(shù)據(jù)質(zhì)量評估、數(shù)據(jù)分布等)。
2.4.4.5數(shù)據(jù)集構(gòu)建
明確各數(shù)據(jù)集劃分的方法及依據(jù)。訓練集應(yīng)當保證樣本分布具有均衡性,訓練樣本應(yīng)涵蓋不同病理類型。調(diào)優(yōu)集應(yīng)保證樣本分布符合臨床實際情況,如陽性比例,不同病理類型比例、不同臨床分型比例等均應(yīng)符合臨床實際情況。訓練集、調(diào)優(yōu)集、測試集的樣本應(yīng)兩兩無交集并通過查重予以驗證。
進行數(shù)據(jù)擴增驗證時,應(yīng)當明確擴增的方式、方法、倍數(shù),并考慮數(shù)據(jù)擴增對軟件的影響及風險。列表比較擴增數(shù)據(jù)庫與標注數(shù)據(jù)庫的差異,論證擴增數(shù)據(jù)庫樣本量的充分性以及分布的合理性。
2.4.5算法訓練
依據(jù)適用人群、數(shù)據(jù)來源機構(gòu)、采集設(shè)備、樣本類型等因素,提供訓練集、調(diào)優(yōu)集(若有)關(guān)于疾病構(gòu)成的數(shù)據(jù)分布情況。
算法訓練基于訓練集、調(diào)優(yōu)集進行訓練和調(diào)優(yōu),應(yīng)明確算法訓練所用的評估指標、訓練方式、訓練目標、調(diào)優(yōu)方法,提供ROC曲線或混淆矩陣等證據(jù)(如:迭代次數(shù)-訓練CountIOU曲線和迭代冊數(shù)-召回率曲線)證明訓練目標滿足醫(yī)療要求,提供訓練數(shù)據(jù)量-評估指標曲線(如迭代次數(shù)-Loss曲線)等證據(jù)以證實算法訓練的充分性和有效性。
2.4.6算法性能評估
基于測試集對算法設(shè)計進行評估,確認軟件算法性能的效率、敏感性、特異性,性能應(yīng)滿足算法設(shè)計要求。
算法性能評估應(yīng)包括軟件對樣本滿意度評價的能力測試、泛化能力的測試、壓力測試(指采用罕見或特殊的真實數(shù)據(jù)樣本開展的算法性能測試)、對抗測試、重復性與再現(xiàn)性測試、敏感性與特異性測試、分析效率測試、算法性能影響因素分析、性能評估結(jié)果比較分析、偏差報告等研究。
通過樣本量估算確定測試集中陰、陽性樣本和壓力樣本的樣本量,提供測試集關(guān)于疾病構(gòu)成(包括年齡和病理類型、異常細胞類型等)、數(shù)據(jù)來源的數(shù)據(jù)分布情況。明確對抗樣本的選擇原則;明確性能評估的可接受標準和標準制定依據(jù)。提交測試報告和細胞/組織形態(tài)圖示例。
若使用第三方數(shù)據(jù)庫開展算法性能評估,提供第三方數(shù)據(jù)庫的基本信息(如名稱、創(chuàng)建者、數(shù)據(jù)總量等)和使用情況(如測試數(shù)據(jù)樣本量、評估指標、評估結(jié)果等)。提交第三方數(shù)據(jù)庫數(shù)據(jù)樣本來源和本計算機輔助分析軟件產(chǎn)品的產(chǎn)品技術(shù)要求、說明書中指定的制片流程和圖像采集設(shè)備的一致性的評價(包含指定的樣本來源,即指定的切片制備流程和/或樣本保存液、抗體試劑、染色液等)和配套的圖像采集設(shè)備獲得的符合要求的數(shù)字病理圖片。
根據(jù)研究結(jié)論,確定軟件使用限制并在說明書中進行描述。
2.4.7算法可追溯性分析
提供算法可追溯性分析報告,即追溯算法需求、算法設(shè)計、源代碼(明確軟件單元名稱即可)、算法測試、算法風險管理的關(guān)系表。
(三)產(chǎn)品說明書和標簽樣稿
明確該產(chǎn)品適用范圍,明確產(chǎn)品適用的顯微鏡和圖像采集設(shè)備的名稱和型號,明確圖像參數(shù)及質(zhì)量。明確病理切片或細胞涂片的制備流程及試劑廠家信息。明確軟件報告內(nèi)容。對產(chǎn)品帶來的假陽/假陰性風險進行提示。
根據(jù)算法影響因素分析報告,在說明書明確產(chǎn)品使用限制和必要的警示提示信息。列明算法訓練總結(jié)和算法性能評估總結(jié)以及臨床評價總結(jié)。
站點聲明
本網(wǎng)站所提供的信息僅供參考之用,并不代表本網(wǎng)贊同其觀點,也不代表本網(wǎng)對其真實性負責。圖片版權(quán)歸原作者所有,如有侵權(quán)請聯(lián)系我們,我們立刻刪除。如有關(guān)于作品內(nèi)容、版權(quán)或其它問題請于作品發(fā)表后的30日內(nèi)與本站聯(lián)系,本網(wǎng)將迅速給您回應(yīng)并做相關(guān)處理。
鄭州思途醫(yī)療科技有限公司專注于醫(yī)療器械產(chǎn)品政策與法規(guī)規(guī)事務(wù)服務(wù),提供產(chǎn)品注冊備案申報代理、臨床試驗、體系建立輔導、分類界定、申請創(chuàng)新辦理服務(wù)。
行業(yè)資訊
知識分享