醫療器械真實(shí)世界研究設計和統計分析注冊審查指導原則(2024年第3號)
發(fā)布日期:2024-01-15 閱讀量:次
附件:醫療器械真實(shí)世界研究設計和統計分析注冊審查指導原則(2024年第3號).doc
醫療器械真實(shí)世界研究設計和統計分析
注冊審查指導原則
本指導原則旨在規范和合理引導真實(shí)世界數據在醫療器械臨床評價(jià)中的應用,為申請人開(kāi)展真實(shí)世界研究以及監管部門(mén)技術(shù)審評提供技術(shù)指導。
本指導原則是供注冊申請人和技術(shù)審評人員使用的指導性文件,但不包括注冊審批所涉及的行政事項,亦不作為法規強制執行,需在遵循相關(guān)法規和強制性標準的前提下使用本指導原則。如果有能夠滿(mǎn)足相關(guān)法規要求的其他方法,也可以采用,但是需要提供詳細的研究資料和驗證資料。
本指導原則是在現行法規和標準體系以及當前認知水平下制定的,隨著(zhù)法規和標準的不斷完善,以及科學(xué)技術(shù)的不斷發(fā)展,本指導原則的相關(guān)內容也將進(jìn)行適時(shí)調整。
一、適用范圍
本指導原則適用于醫療器械真實(shí)世界研究,不適用于按醫療器械管理的體外診斷試劑真實(shí)世界研究。本指導原則在《真實(shí)世界數據用于醫療器械臨床評價(jià)技術(shù)指導原則(試行)》的基礎上,結合目前積累的經(jīng)驗,進(jìn)一步細化醫療器械真實(shí)世界研究設計和統計分析的一般要求。在當前發(fā)展階段,真實(shí)世界證據在醫療器械臨床評價(jià)中,主要作為已有臨床證據的補充。
二、常見(jiàn)真實(shí)世界研究類(lèi)型及其應用情形
(一)試驗性真實(shí)世界研究
實(shí)效性隨機對照試驗(pragmatic Randomized Controlled Trial, pRCT)是試驗性真實(shí)世界研究的一種常見(jiàn)類(lèi)型。
pRCT是指在真實(shí)或接近真實(shí)醫療環(huán)境下,采用隨機、對照的設計比較臨床實(shí)踐中不同干預措施的治療結果的研究,其主要目的是評估干預措施在常規臨床實(shí)踐中的效果。pRCT融合了隨機化和真實(shí)世界數據優(yōu)勢,較好地控制了偏倚,其研究結果可為干預措施效果評價(jià)提供較高質(zhì)量的真實(shí)世界證據。pRCT研究人群入選標準通常較廣泛,人群代表性更好,但人群異質(zhì)性通常較高,為保證統計分析具有足夠的檢驗效能,pRCT所需樣本量相對較大,適合需要生成在更廣泛人群和臨床情形中的臨床證據的應用情形。例如,實(shí)效性隨機對照試驗可提供器械在不同亞組患者人群中的安全性、有效性數據,為器械受益風(fēng)險評估提供更多有效信息。
(二)觀(guān)察性真實(shí)世界研究
1.描述性研究設計
常見(jiàn)的描述性研究設計包括橫斷面設計、病例報告和病例系列設計等,不用于統計學(xué)上的因果推斷。
在橫斷面設計中,全部測量在特定時(shí)點(diǎn)完成,主要用于描述接受了某種暴露因素(即:使用了待研究器械)的患者基本特征及健康狀況、疾病恢復情況等分布情況,橫斷面設計可用于器械不良事件的描述性統計研究,為后續研究提供線(xiàn)索。病例報告設計用于描述臨床一個(gè)或少數幾個(gè)病例的詳細臨床特征,通常不描述事物的集中趨勢或離散程度,病例系列設計是對多個(gè)病例資料進(jìn)行歸納和總結,病例報告和病例系列設計提供對罕見(jiàn)或不尋常疾病/并發(fā)癥的深入了解,特別是對于比較新的器械,其能夠及時(shí)發(fā)現和記錄其可能的副作用或并發(fā)癥,同時(shí)為后續的更為嚴格和系統的研究提供線(xiàn)索和基礎。
2.隊列設計
在器械安全有效性評價(jià)中,隊列研究是將某一特定人群按是否使用待研究器械以及使用不同器械分為不同的組別,追蹤觀(guān)察各組的結局發(fā)生的情況,比較各組間結局發(fā)生率差異,從而判定器械與結局之間有無(wú)關(guān)聯(lián)及關(guān)聯(lián)程度大小的一種觀(guān)察性研究方法。隊列設計根據研究時(shí)期的不同可分為前瞻性隊列、回顧性隊列、雙向性隊列。前瞻性隊列研究中,根據預先制定的研究方案進(jìn)行數據收集,可較好的控制數據質(zhì)量?;仡櫺躁犃醒芯恐?,對過(guò)去已經(jīng)產(chǎn)生的數據進(jìn)行分析,數據質(zhì)量可控性差,分析前建議先對數據的完整性和準確性進(jìn)行確認。雙向性隊列在回顧性隊列研究的基礎上,繼續前瞻性觀(guān)察一段時(shí)間,其是將前瞻性隊列研究與回顧性隊列研究結合起來(lái)的一種設計,兼有上述兩類(lèi)的優(yōu)點(diǎn),一定程度上彌補了各自的不足。目前基于登記數據庫開(kāi)展的隊列研究越來(lái)越多,例如利用CathPCI登記數據庫比較Mynx血管閉合裝置與其他同類(lèi)已上市產(chǎn)品安全性事件發(fā)生率的回顧性隊列研究,利用國家關(guān)節登記數據庫比較不同制造商設計關(guān)節假體的翻修率等。
3.病例對照及其衍生設計
病例對照研究是以發(fā)生了結局事件的患者作為病例組,未發(fā)生結局事件的患者作為對照組,比較病例組與對照組使用待研究器械的比例,從而研究待研究器械與結局事件之間的關(guān)聯(lián)性?;貞浧?、對照組設置相關(guān)的選擇偏倚、無(wú)法提供發(fā)病率等是病例對照設計的較為突出的限制。當待研究器械需觀(guān)察的臨床結局發(fā)生率較低時(shí),采用實(shí)效性隨機對照試驗或隊列設計所需樣本量過(guò)大而不具有可行性時(shí),可考慮采用病例對照設計。
病例對照衍生設計包括巢式病例對照和病例隊列設計等,兩種衍生設計兼具隊列研究與病例對照研究的優(yōu)點(diǎn),在結局發(fā)生前收集暴露因素、混雜因素等信息;器械暴露組和對照組來(lái)源于同一人群,人群可比性更好;不需對隊列全部人群進(jìn)行測量?,F階段,基于登記數據庫開(kāi)展巢式病例對照設計越來(lái)越多。
4.病例交叉設計
病例交叉設計是一種常用于研究短期暴露與急性結局事件之間關(guān)系的觀(guān)察性研究設計。在器械安全有效性評價(jià)中,每個(gè)病例在事件發(fā)生前后的不同時(shí)間段內充當自身對照,通過(guò)比較病例在事件發(fā)生前后對使用待研究器械情況來(lái)評估使用該器械與事件之間的關(guān)系。病例交叉設計可較好的控制不隨時(shí)間變化的混雜變量,但也存在一些局限性,包括暴露效應期需較短,依賴(lài)患者回憶過(guò)去的暴露等。
(三)真實(shí)世界數據作為單臂試驗外部對照
外部對照是指從其他試驗或歷史病例中找一組特征相似的研究對象作為對照組,真實(shí)世界數據作為單臂試驗外部對照,是外部對照設計的其中一種。本指導原則不包含該類(lèi)型設計具體的使用情形以及研究設計、統計分析等要求,相關(guān)內容另行制定指導原則。
三、真實(shí)世界研究方案設計考慮
(一)研究背景和目的
根據產(chǎn)品預期適用范圍和產(chǎn)品技術(shù)特征,結合已有證據,在方案中闡明真實(shí)世界研究擬解決的安全有效性問(wèn)題,明確研究目的。
(四)可行性評估
在研究目的確定后,申請人需評估是否具備開(kāi)展真實(shí)世界研究的客觀(guān)條件,主要考慮現有經(jīng)驗和知識積累是否足以事先確定影響臨床結局的混雜變量,以及所需變量數據是否具有可獲得性、數據量是否充分,數據質(zhì)量是否滿(mǎn)足需求。
首先,是否可事先確定影響臨床結局的變量取決于現階段對疾病、診療方法、器械臨床相關(guān)知識和經(jīng)驗的積累程度,對于研究經(jīng)驗和知識積累還不充分的領(lǐng)域,申請人無(wú)法確保鑒別出對結局有重要影響的混雜變量,開(kāi)展觀(guān)察性真實(shí)世界研究時(shí)不能完全排除存在未測量或未調整混雜變量,研究結果的偏倚大小無(wú)法判定,結論穩健性難以保證。
其次,需評估變量數據是否可及和質(zhì)量是否充分。在真實(shí)世界中,數據缺失較為常見(jiàn)。來(lái)源于真實(shí)世界的數據可能缺乏院外隨訪(fǎng)數據、結局指標(如功能評分、疼痛評分等)、影像學(xué)檢查等。除此之外,還需考慮真實(shí)世界數據觀(guān)察時(shí)間是否滿(mǎn)足研究目的,研究人群是否具有代表性,前瞻性收集數據研究中樣本量是否可保證足夠的檢驗效能,現有數據質(zhì)量是否可滿(mǎn)足統計分析要求等。
(五)確定恰當的真實(shí)世界研究設計類(lèi)型
申請人根據確定的研究目的,參考第二章內容,選擇恰當的研究設計類(lèi)型。如上所述,存在不同的真實(shí)世界研究設計類(lèi)型,包括pRCT,隊列研究、病例對照等,不同設計特點(diǎn)不同,適合應用的場(chǎng)景不同。
(六)研究流程圖
考慮到不同類(lèi)型真實(shí)世界研究實(shí)施過(guò)程存在差異,建議將實(shí)施過(guò)程以流程圖的形式呈現,流程圖按照時(shí)間順序呈現研究過(guò)程中各具體事項(如倫理審查、人群篩選、接受干預措施、器械暴露后的數據收集相關(guān)事項(如檢驗、檢查、評分量表填寫(xiě)等)以及各環(huán)節的質(zhì)量控制措施等)。
(七)研究人群
研究方案需預先明確研究目標人群,目標人群定義清晰明確,避免歧義和模糊的表達,預先規定清晰的納入和排除標準。
對于有多次器械使用記錄的人群,需預先清晰規定納入研究的標準,如在使用該器械前6個(gè)月無(wú)使用同類(lèi)器械的記錄,或將暴露定義為首次使用目標器械。預先核實(shí)不同臨床機構是否采用相同的診斷標準,確保符合入選標準的患者均納入研究。對于回顧性研究設計,需注意評估采用的數據源對預期適用人群的代表性。
(八)器械暴露
pRCT與傳統RCT均采用隨機方式?jīng)Q定器械暴露與否,但對于觀(guān)察性真實(shí)世界研究,患者具體使用何種器械并非通過(guò)隨機分組決定,而是在真實(shí)世界中根據實(shí)際情況(如醫生偏好、患者病情)而定,存在選擇偏倚風(fēng)險。
對于回顧性真實(shí)世界數據,通常通過(guò)數據中使用器械的記錄(如費用清單、手術(shù)記錄)來(lái)判斷患者具體使用了何種器械,需核實(shí)器械信息記錄是否完整、準確,至少需包括器械制造商、型號規格信息。建議采用恰當的方法對器械暴露信息的準確性進(jìn)行驗證。
(九)對照組
實(shí)效性隨機對照設計中,通過(guò)隨機分組形成對照組。對于觀(guān)察性真實(shí)世界設計,如隊列研究、病例對照等,需根據研究目的以及設計類(lèi)型,采用恰當的方式形成對照組,盡可能確?;祀s變量在組間分布均衡是設置對照組的基本原則。根據研究目的,對照組可以是單一或多個(gè)制造商已上市同類(lèi)產(chǎn)品,也可以是非器械類(lèi)型的其他干預措施或安慰對照組。
隊列研究設計中,依據研究目的可選擇使用了其他同類(lèi)已上市產(chǎn)品的患者構成對照組人群,也可選擇未使用同類(lèi)器械而使用了藥品或其他診療方法的患者構成對照組人群。病例對照設計中,通常采用匹配的方法為病例組構建相應的對照組,巢式病例對照設計從同時(shí)期沒(méi)有發(fā)生結局的研究對象抽樣匹配形成對照組。病例隊列設計在研究開(kāi)始時(shí)從整個(gè)隊列人群中隨機抽樣形成對照組,該對照組可重復用于不同結局研究,而巢式病例對照設計中對照組不能重復使用。
(十)評價(jià)指標
建議在研究方案中描述評價(jià)指標的選擇依據和合理性,明確規定各評價(jià)指標的觀(guān)察目的、定義、觀(guān)察時(shí)間窗、指標類(lèi)型、測定方法、計算公式(如適用)、判定標準(適用于定性指標和等級指標)等,并明確規定主要評價(jià)指標、次要評價(jià)指標和安全性評價(jià)指標。
對于回顧性真實(shí)世界研究,需注意確保不同臨床機構對結局的定義相同,不漏記患者發(fā)生的結局事件。建議盡量選擇客觀(guān)指標,如死亡等,謹慎選擇功能性評分等偏倚風(fēng)險較大的主觀(guān)性指標。
(十一)隨訪(fǎng)時(shí)間
需根據研究目的和設計明確隨訪(fǎng)時(shí)間的起始點(diǎn)及隨訪(fǎng)持續時(shí)間。對于植入性器械,通常為植入手術(shù)當天作為起始隨訪(fǎng)時(shí)間,對于多次治療為一個(gè)完整療程的器械,起始隨訪(fǎng)時(shí)間為最后一次治療完成當天,注意治療過(guò)程中的安全性事件也需觀(guān)察。在回顧性真實(shí)世界研究中,研究者通常是通過(guò)病歷、數據庫或其他已有記錄來(lái)收集數據,隨訪(fǎng)時(shí)間的長(cháng)度和起始點(diǎn)可能受到現有數據可用性的限制。對于結局癥狀存在潛伏期或干預效果存在延遲的情形,可考慮在暴露和結局之間設置時(shí)間窗以防止逆因果混淆。
(十二)計算樣本量和檢驗效能
對于回顧性真實(shí)世界研究,可基于可用的樣本量估算檢驗效能。對于前瞻性真實(shí)世界研究,可基于預估的參數值計算樣本量。不同研究設計估算樣本量的方式不同,例如,橫斷面研究可基于預期達到的估計精度估算樣本量,有對照組的研究設計基于組間比較差異、相對風(fēng)險度、比值比等估算樣本量。
對于因消除混雜偏倚涉及變量調整的真實(shí)世界研究,由于需預先估計的參數值較多,某些參數估算可能缺乏文獻數據支持,樣本量估算相較于傳統隨機對照臨床試驗復雜,需考慮的因素更多。例如,對于基于傾向性評分的分層調整統計需考慮層內效應值大?。ㄈ缬行?、比值比、發(fā)生率等)、每層器械暴露組分配概率、傾向性評分重疊程度等。當模型過(guò)于復雜時(shí),可以考慮使用基于模擬研究的方法幫助估計樣本量。
(十三)質(zhì)量控制
1.數據質(zhì)量
(1)數據收集
建議制定完善的病例報告表和變量詞典,依據病例報告表和變量詞典收集和記錄數據,并制定數據核查方案,確保數據無(wú)誤。
前瞻性收集數據的研究設計中,建議事先規定具體的診斷、結局定義和判斷標準,統一檢驗、檢查和評分量表等評價(jià)項目的標準實(shí)施過(guò)程,確保收集數據的準確性和一致性。對于回顧性真實(shí)世界研究,需列明擬采用的數據源基本情況,包括所含的字段信息、患者數量、數據缺失、數據記錄準確性等數據質(zhì)量信息。方案中明確數據清洗的步驟與方法,若涉及多個(gè)數據庫,方案中需明確鏈接的具體方法,以及數據鏈接準確性的驗證方法。對使用到的各變量數據的準確性進(jìn)行驗證,采用算法自動(dòng)提取數據時(shí),對算法提取準確性進(jìn)行驗證。
(2)質(zhì)量評價(jià)
見(jiàn)《真實(shí)世界數據用于醫療器械臨床評價(jià)技術(shù)指導原則(試行)》第三章內容,建議對照該導則相關(guān)要求以表格形式逐項呈現數據質(zhì)量評價(jià)結果,作為真實(shí)世界研究報告內容的一部分。
2.偏倚風(fēng)險
偏倚是真實(shí)世界研究中需要特別關(guān)注和解決的問(wèn)題,在真實(shí)世界研究設計、實(shí)施、分析和報告等各階段均可能存在偏倚,真實(shí)世界研究方案需列出可能存在的偏倚、避免偏倚的策略以及在分析階段處理偏倚的詳細規定。對于觀(guān)察性真實(shí)世界研究,可參考非隨機干預性臨床研究ROBINS-I評價(jià)工具對整體研究的偏倚風(fēng)險進(jìn)行評估。偏倚類(lèi)型可以劃分為選擇偏倚、信息偏倚和混雜偏倚三大類(lèi),向下包括更多細分偏倚類(lèi)型,不同研究存在的偏倚類(lèi)型通常不同,部分僅列舉部分真實(shí)世界研究常見(jiàn)的的偏倚類(lèi)型,在實(shí)操中,申請人需根據實(shí)際情況具體分析研究中存在的各種偏倚風(fēng)險。
(1)選擇偏倚
① 研究人群納入過(guò)程中產(chǎn)生的選擇偏倚
確保對于不同組別始終采取相同的入選/排除標準,從相同的人群中篩選患者對于避免選擇偏倚非常關(guān)鍵。建議按照時(shí)間順序,連續不斷地將符合入選/排除標準的研究對象納入研究,以避免挑選患者,同時(shí)記錄未納入研究的病人及其原因。對于設置對照的研究,尤其是病例對照設計,需在設計中采取避免入院率偏倚的措施,如符合入選/排除標準的人群全部納入,或當數據量過(guò)大時(shí),病例組和對照組從同一人群中隨機抽樣確定。除此之外,還需注意自愿者偏倚等選擇偏倚。
② 失訪(fǎng)導致的選擇偏倚
需在真實(shí)世界研究方案中盡可能設置充分的預防失訪(fǎng)的措施,包括發(fā)生失訪(fǎng)后可采用的補救措施,如通過(guò)額外的隨訪(fǎng)方式(如電話(huà)、登門(mén)拜訪(fǎng))彌補相關(guān)數據,與其他數據源(如醫保數據、死亡登記數據等)鏈接等;
針對使用回顧性數據時(shí)可能存在的數據缺失情況,需在研究方案中預先明確數據缺失處理的方法和原則。針對缺失數據,需盡可能調查清楚失訪(fǎng)的原因,若失訪(fǎng)與干預措施或結局無(wú)關(guān),可根據方案中預先規定的填補方法和原則進(jìn)行填補。也可采用保守的方式進(jìn)行填補,例如,器械暴露組填補為無(wú)效,對照組填補為有效。
(3)信息偏倚
① 干預措施偏離
在真實(shí)世界研究中,治療中途由于各種原因干預措施可能發(fā)生偏離,例如患者主動(dòng)要求更換治療方式、醫生改變治療策略等,多次治療的干預措施(如血液透析)或治療時(shí)間長(cháng)的干預措施(如呼吸機、體外膜肺氧合器),有更大可能出現干預措施偏離。在開(kāi)展真實(shí)世界研究時(shí),需提前考慮待研究器械出現此類(lèi)偏倚風(fēng)險的程度大小,制定措施減少干預措施偏倚的風(fēng)險,同時(shí)全面、準確記錄研究過(guò)程中的干預措施偏倚情況。
對于回顧性真實(shí)世界研究,在選擇真實(shí)世界數據源時(shí),需考慮該數據源是否詳盡和準確地記錄所用治療方式及其治療途中發(fā)生的變化。在臨床實(shí)踐中,還可能出現干預措施記錄錯誤,如所用的器械制造商、型號規格記錄錯誤,導致干預措施相關(guān)的信息偏倚,當懷疑存在記錄錯誤的可能時(shí),可考慮通過(guò)患者其他信息進(jìn)行驗證,如影像學(xué)下植入物形態(tài)、標記點(diǎn)特征、費用單上的價(jià)格等。
② 測量偏倚
測量工具、測量人員、測量方法和過(guò)程均可引入測量偏倚,優(yōu)先考慮采取措施避免或減少測量偏倚,例如,制定詳細的操作手冊、培訓工作人員、采用標準化的數據收集程序、核查數據質(zhì)量、使用統一的方法收集、測量和解釋信息;以下從三方面舉例常見(jiàn)的減少測量偏倚的措施:
患者填寫(xiě)量表、回答問(wèn)卷產(chǎn)生的測量偏倚:設置充分的培訓,使患者能正確、一致的理解問(wèn)題。
評價(jià)者來(lái)源的測量偏倚:對評價(jià)者施加盲法、選擇客觀(guān)的硬終點(diǎn)指標(如死亡等)、對評價(jià)者開(kāi)展培訓,不同評價(jià)者重復測量。
評價(jià)工具來(lái)源的測量偏倚:使用信效度經(jīng)過(guò)驗證的測量方法,使用精準的儀器。
對于回顧性真實(shí)世界研究,由于研究開(kāi)始前數據測量工作已完成,以上適用于前瞻性真實(shí)世界研究的措施已無(wú)法實(shí)施,僅能對研究中涉及到的測量的準確性、一致性進(jìn)行事后評估,若評估發(fā)現回顧性數據存在顯著(zhù)的測量偏倚,或無(wú)法評估回顧性數據的測量偏倚,建議謹慎使用該真實(shí)世界數據源開(kāi)展研究。
③ 記錄不準確
研究過(guò)程中,暴露信息、結局信息以及其他等任何信息記錄的不準確或者錯誤都可能導致信息偏倚,應對此類(lèi)信息偏倚,可考慮對數據記錄者進(jìn)行充分的培訓,確保所有數據都按照統一的、預先定義的標準規范收集。定期進(jìn)行數據審核和質(zhì)量控制檢查,確保數據的準確性和完整性。對于回顧性真實(shí)世界研究,需重點(diǎn)關(guān)注回顧性數據記錄的準確性,對其開(kāi)展評估和驗證,確保數據記錄具有足夠的準確度后方可用于真實(shí)世界研究。
④ 回憶偏倚
盡量在設計階段避免采用研究人群回憶的方式收集信息,盡量在數據產(chǎn)生時(shí)即記錄至文檔中。巢式病例對照設計可避免傳統病例對照通過(guò)回憶獲得暴露信息、基線(xiàn)數據等帶來(lái)的回憶偏倚。
有些情況下,查看患者其他健康醫療資料可能有助于確認患者回憶是否準確。例如,如果患者回憶稱(chēng)自身接受干預措施后,有疼痛或發(fā)炎,可通過(guò)審閱該患者對應日期健康記錄、服藥記錄、電子病歷資料中是否存在相關(guān)信息,以進(jìn)一步佐證。
⑤ 報告偏倚
選擇性呈現有利的結果會(huì )造成選擇報告偏倚,避免報告偏倚的最佳方法是在方案或統計分析計劃中預先規定,建議將研究設計信息在公共網(wǎng)站(如中國臨床試驗注冊中心、ClinicalTrials.gov、Open Science或ISPOR真實(shí)世界證據登記等)預先登記。
對于使用回顧性數據開(kāi)展真實(shí)世界研究的情形,申請人需設置措施確保在正式統計分析前研究人員不可接觸結局數據,避免研究人員在研究開(kāi)始前為得到期望的統計結果開(kāi)展數據挖掘行為。例如,在應用基于傾向性評分的統計分析方法時(shí),可采取兩階段設計。第一階段需構建結局數據防火墻、確定獨立的統計人員、確定混雜變量、建立傾向性評分估計模型,直至第一階段達到令人滿(mǎn)意的混雜變量平衡后,再實(shí)施第二階段的統計分析計劃。
(4)混雜偏倚
混雜偏倚是指暴露因素與臨床結局的相關(guān)(關(guān)聯(lián))程度受到其他因素的歪曲或干擾,使得呈現的研究變量與評價(jià)指標或結局變量的關(guān)系不是真實(shí)的,而是疊加了混雜效應的具有偏差的關(guān)系。
隨機可同時(shí)控制已測量和未測量混雜因素,是控制混雜的最有力手段。pRCT以外的其他真實(shí)世界研究設計均不采用隨機分組的方式,應用時(shí)需謹慎、全面評估潛在的各種混雜偏倚,并采取有效的措施盡可能的減少混雜偏倚。在設計階段考慮使用限制、匹配和分層設計等其他方法控制混雜。在分析階段,可應用分層分析、多變量回歸分析、基于傾向性評分的調整方法等調整統計方法對混雜進(jìn)行控制。值得注意的是以上方法均僅能控制已知且可測量的混雜。
如果所有混雜因素均已收集并正確建模,且樣本量足夠,理論上通過(guò)適當分析方法可消除混雜偏倚。然而在實(shí)踐中難以獲知全部混雜因素數據,部分混雜因素未知或不能測量,此部分偏倚稱(chēng)為未測量混雜偏倚。盡管可通過(guò)工具變量、E值(E-value)、敏感性分析等方法評估未測量混雜對結論的潛在影響,準確估計未測量混雜偏倚對結論的影響是一件困難的事情。
3.評估偏倚方向和大小
偏倚具有方向性,即低估或高估干預措施的效應值,偏倚亦有程度大小之分,相對較小的偏倚可能不會(huì )影響研究結論。在完成研究后,建議總結研究過(guò)程中仍然存在的偏倚,并評估對證據強度的影響。雖然偏倚評估并不是在任何情況下都具有可行性,仍然有一些方法可以幫助評估某些特定情形下的偏倚,例如對比失訪(fǎng)研究人群特征與未失訪(fǎng)研究人群特征,可能有助于評估失訪(fǎng)導致的選擇偏倚,比較不同臨床機構對同一種評價(jià)方法的測量一致性可能有助于發(fā)現和評估測量偏倚。
(十四)倫理審查和知情同意
真實(shí)世界研究倫理審查和知情同意需符合研究當地法律法規要求,國內研究需符合《世界醫學(xué)大會(huì )赫爾辛基宣言》和《涉及人的生命科學(xué)和醫學(xué)研究倫理審查辦法》等相關(guān)法規和指南的規定。
四、真實(shí)世界研究統計分析
(一)統計分析計劃
真實(shí)世界研究需要包括詳細具體的統計分析計劃,明確具體采用的統計方法和參數設定,以及統計方法和參數設定的理由和依據。真實(shí)世界研究更常涉及分層分析、回歸分析、基于傾向性評分的調整性統計分析方法,相同的數據使用不同的分析方法,結果數值通常是不同的,若統計分析結果與設定的研究成功閾值/接受標準相近,可能存在采用不同統計方法研究結論不同的情形。即使使用相同的統計方法,參數選擇等差異也可能導致結果不同。因此需盡可能詳細具體提前規定統計分析計劃,統計分析計劃的詳細程度需能確保按照計劃執行分析時(shí),不會(huì )存在可由分析人員自由選擇分析方法和參數的情形。
(二)分析數據集
預先根據不同的分析目的定義不同的數據集,如有效性數據集和安全性數據集、亞組分析數據集等。
(十五)確定需調整的混雜變量
未采用隨機分組的真實(shí)世界研究設計需預先確定需調整的混雜變量,需盡可能識別所有的混雜變量,以便在設計和統計分析階段對混雜偏倚進(jìn)行控制。通??砂凑找韵氯龡l標準判斷為混雜變量:(1)該變量與結局變量存在因果關(guān)系;(2)該變量與分組變量(暴露變量)存在關(guān)聯(lián);(3)該變量不是分組變量與結局變量因果路徑中的中間變量。
建議首先制定合理的變量篩選流程,基于既往積累的專(zhuān)業(yè)知識和臨床經(jīng)驗確定混雜變量,建議通過(guò)與臨床專(zhuān)家團隊和統計學(xué)專(zhuān)家團隊進(jìn)行討論和確認。對于最終仍不能確認是否應納入的變量,可對納入和不納入情形開(kāi)展敏感性分析。列明變量納入或不納入調整的理由,提供支持性資料。在實(shí)際操作過(guò)程建議持保守的變量篩選態(tài)度,確定與治療分配和結局變量均無(wú)關(guān)的變量才從模型中剔除,但也需注意避免納入碰撞節點(diǎn)變量(Collider Variable)、工具變量(Instrumental Variable)、中間變量(Intermediate Variable),納入變量時(shí)考慮是否存在多重共線(xiàn)性或交互作用。為清晰地展現各變量之間的因果關(guān)系,可使用有向無(wú)環(huán)圖呈現(Directed acyclic graphs, DAG)。
(三)混雜調整統計分析
1.分層分析
分層分析是一種常用的控制混雜因素的方法,需在方案中預先規定層數的具體劃分原則,明確具體使用的統計方法,如Mantel-Haenszel法,若使用其他加權統計方法,明確方法出處。
2.多變量回歸分析
多變量線(xiàn)性回歸分析需預先規定納入的自變量,確定的混雜變量均需納入到模型中去,當無(wú)法在設計階段確定具體的自變量時(shí),需在方案中明確具體的規則,以使納入模型中的變量不可隨意挑選。多變量回歸分析中納入的研究對象(及病例)的數量需滿(mǎn)足模型中需要估計的參數所需的例數,存在一些經(jīng)驗幫助估計例數,例如EPV(events per variable)法。除此之外,需檢驗所使用模型的基本假設是否成立,如殘差獨立、殘差期望為零、方差齊、分布假設、線(xiàn)性假設、Cox回歸等比例風(fēng)險假設等;恰當地處理多重共線(xiàn)性、交互作用;線(xiàn)性回歸模型需具有可接受的擬合優(yōu)度,需預先明確評估模型擬合優(yōu)度的指標(多重決定系數、殘差均方、馬洛斯Cp統計量、赤池信息準則和貝葉斯信息準則等)、可接受閾值及其確定依據。
需預先明確多重共線(xiàn)性檢驗參數,如相關(guān)系數、方差膨脹因子、基于特征值的條件數等,預先明確判定是否存在多重共線(xiàn)性的閾值,以及閾值設定的依據,對于多重共線(xiàn)性的后續處理原則需有合理充分的論述。由于不能很好地探測比兩兩回歸變量更復雜的多重共線(xiàn)性關(guān)系,不建議僅使用相關(guān)系數檢驗多重共線(xiàn)性。
是否納入交互作用項需考慮專(zhuān)業(yè)知識經(jīng)驗和統計分析兩方面。在專(zhuān)業(yè)知識和經(jīng)驗方面,如果已經(jīng)存在先驗信息顯示回歸變量間存在交互作用,或者專(zhuān)業(yè)知識可判斷某變量與另一變量存在交互作用,需將該交互項納入模型。若交互項存在統計學(xué)意義,但從專(zhuān)業(yè)無(wú)法判斷交互作用是否真實(shí)存在,建議納入和不納入均開(kāi)展統計分析,作為敏感性分析。
多變量回歸模型中,優(yōu)勢比(odds ratio)和風(fēng)險比(hazard ratio)等相對性統計指標不如率差和均值差等絕對性統計指標的臨床意義直觀(guān),需注意對這些指標大小的臨床意義解釋。需預先在方案中明確判定研究假設成立的閾值。
3.基于傾向性評分的調整方法
基于傾向性評分的研究建議設計為兩個(gè)獨立的階段,第一階段主要內容包括識別混雜變量、估計樣本量、構建結局數據防火墻、確定獨立的統計人員、建立傾向性評分估計模型,過(guò)程中存在迭代,直至達到令人滿(mǎn)意的協(xié)變量均衡為止,整個(gè)過(guò)程對結局數據保持盲態(tài)。第一階段主要目的是實(shí)現器械暴露組和對照組組間均衡。第二階段則是應用傾向性評分估計干預措施效應值。
在傾向性評分第一階段(即尋找傾向性得分在組間均衡的階段),部分特征人群由于未能在組間分布均衡而被剔除,此時(shí)需注意剔除部分人群后研究結論的外推性,需對過(guò)程有明確的記錄,并對研究結論外推性有充分的論述。建議將研究器械組中的所有患者都包括在分析人群中,在傾向性評分未得到均衡的情況下,可增加對照組數據源。
估計效應值的方法包括分層、匹配、逆概率加權和回歸等,需預先明確效應值估計采用的方法及相關(guān)參數。對于分層法,需預先明確分層具體劃分,以及判定協(xié)變量組間均衡的閾值及其依據,層權重系數計算方式等;對于匹配法,需預先明確器械暴露組和對照組匹配比例(如1:1或1:n)、采用的匹配法(如精確匹配法、最近鄰匹配法、卡尺匹配法等)、匹配成功判定閾值及其依據,通常單個(gè)患者數據僅用于1次匹配。
使用逆概率加權和回歸法需注意解決以下問(wèn)題。逆概率加權基于傾向性評分決定個(gè)體的權重系數,實(shí)現對效應值的加權,其在傾向性評分接近0或1的情形下權重會(huì )過(guò)大或過(guò)小,且逆概率加權對于傾向性得分模型準確性要求很高?;貧w法將傾向性評分直接納入到模型中,假設結局變量與組別、傾向性評分的回歸模型是正確的,這通常難以被證實(shí)。與逆概率加權相同,回歸法對傾向性得分模型準確性較敏感,同時(shí)其在分析過(guò)程中由于涉及到模型優(yōu)化而難以對結局數據保持盲態(tài)。
4.其他調整方法
用于控制混雜的調整方法還包括邊際結構模型、工具變量和結構方程模型等較復雜的統計方法,目前在醫療器械臨床評價(jià)中的實(shí)際應用較少。
(四)處理數據缺失
多種原因可導致數據缺失,如依從性差、缺乏改善、副作用、治療體驗差以及與研究無(wú)關(guān)的外部因素等,合理處理數據缺失十分重要。由于缺失機制無(wú)法通過(guò)已有數據進(jìn)行判斷,并且不同的處理方法可能會(huì )產(chǎn)生截然不同的結果,建議事先在方案或統計分析計劃中明確處理方法,遵循保守原則對缺失數據處理方法進(jìn)行規定。
應對缺失數據的最佳策略是通過(guò)合理的研究設計和高質(zhì)量實(shí)施預防數據缺失。對于前瞻性真實(shí)世界研究,可通過(guò)篩選具有經(jīng)驗和負責的研究者、設置多種不同隨訪(fǎng)方式、采用陽(yáng)性對照、采用易測量的結局指標、合理的數據收集表和快捷的數據錄入方式、縮短研究時(shí)間、開(kāi)展培訓等方法減少數據缺失;對于回顧性真實(shí)世界研究,需評估數據庫中數據缺失的程度,應報告每次測量的缺失和非缺失記錄的數量。推薦使用敏感性分析(例如比較含缺失數據與不含缺失數據的患者的結果)來(lái)確定缺失的影響,若數據缺失較多,不建議使用該數據源開(kāi)展真實(shí)世界研究。
目前常用的缺失數據填補法可分為單一填補和多重填補法兩大類(lèi),需預先規定缺失數據具體的處理方法。單一填補法推薦使用保守的結轉法,例如將器械暴露組缺失值均填補為無(wú)效,對照組缺失值均填補為有效;需注意單一填補法將減小方差,參數估計精度將被高估,體現為置信區間縮窄。對于多重填補,需預先規定填補模型、分析模型、插補次數、合并規則及相應確定依據。采用缺失信息比例、相對增加的方差、相對效率和參數穩定性等診斷指標對評估數據填補質(zhì)量。在實(shí)際應用中,選擇正確的填補模型非常關(guān)鍵,通常需要對數據有深入的理解以及對可能的缺失機制有合理的假設。
(五)亞組分析
若納入研究的人群存在異質(zhì)性,并且異質(zhì)性可能導致不同效應值,需開(kāi)展亞組分析。若不同亞組中效應值不一致,需注意此時(shí)研究結論對預期人群的外推性,避免產(chǎn)品在部分人群中具有顯著(zhù)的療效,而在另外部分人群中無(wú)效。納入\排除標準越寬,更容易出現異質(zhì)性,可基于既往研究經(jīng)驗和知識預先在方案中確定亞組分析,未預先規定會(huì )降低亞組分析結果的可信度。
(六)敏感性分析
敏感性分析用于評估研究結果穩健性,在多種不同情形下均可能需開(kāi)展敏感性分析,尤其對于觀(guān)察性真實(shí)世界研究。真實(shí)世界研究中敏感性分析常見(jiàn)的應用情形包括違背模型假設、統計方法(如是否納入交互項、共線(xiàn)性變量處理等)、變量選擇、評估未被測量混雜的影響、評估干預偏離的影響、數據缺失填補、矛盾數據處理、離群值、變量定義不一致、不同人群亞組、基線(xiàn)不均衡等。需報告全部的敏感性分析結果,不能選擇性報告。若敏感性分析的結果與主要分析的結果不一致,提示研究結論穩健性不夠,可能需開(kāi)展額外的研究進(jìn)一步驗證。
五、研究報告
研究報告需遵循完整、準確、規范的總體原則。不同類(lèi)型真實(shí)世界研究報告內容存在差異,pRCT研究報告內容可參考實(shí)效性試驗CONSORT指南,隊列設計、病例對照設計等觀(guān)察性研究可參考STROBE指南,也可以參考其他適用的文件,如STaRT-RWE清單,以幫助提高臨床報告要素的完整性。在以上的考慮基礎上,需特別注意以下內容:
(一)研究設計:闡述選擇該研究設計的原因,結合已有證據,闡明該研究擬回答的安全有效性問(wèn)題。
(二)篩選流程圖:提供研究對象的篩選流程圖。對于回顧性真實(shí)世界研究,說(shuō)明研究過(guò)程中如何從原始數據庫中逐步篩選出合格的分析對象,給出原始數據庫的樣本量、每一個(gè)步驟排除的研究對象數目、相應的排除原因以及最后納入分析的研究對象樣本量。
(三)數據源基本特征描述:包括人群代表性、數據質(zhì)量等;該數據源自身質(zhì)控措施,基于該數據源發(fā)表的高水平文獻等信息。
(四)人群基本特征描述:詳細描述研究對象的基線(xiàn)特征,各組病例入選時(shí)的基線(xiàn)特征,基線(xiàn)數據是否平衡。
(五)數據準確性描述:對于回顧性真實(shí)世界研究,提供對使用到的各變量數據的準確性驗證和/或評估結果,若采取自動(dòng)方法從觀(guān)察性數據庫中提取變量數據,列明各變量具體的提取算法,提供相應算法的準確性驗證數據。
(六)合并用藥、合并治療統計:記錄和統計影響臨床結局的其他干預措施(藥物治療及其他診療方法)實(shí)施情況。
(七)按照方案開(kāi)展統計分析,呈現所有統計分析結果,包括:主分析結果、次要分析結果、安全性分析結果、亞組分析結果、期中分析結果、敏感性分析結果。
(八)數據缺失處理:描述缺失數據的數量及具體情況,列明缺失處理情況,與方案規定的符合性。若與方案規定的數據缺失處理方法不一致,提供合理的理由。
(九)矛盾數據處理:描述不同來(lái)源數據重要信息的統計量,針對矛盾數據的敏感性分析結果。
(十)偏倚風(fēng)險及控制情況:以表格的形式列出可能存在的各細分偏倚類(lèi)型,針對各偏倚逐個(gè)列出降低/消除偏倚的措施,并對應列出采取措施后殘留的偏倚風(fēng)險大小評估結果。
(十一)討論和結論:討論研究局限性,討論潛在偏倚的方向和大小,分析剩余偏倚對臨床證據強度的影響;討論研究結果的外推性,例如考慮匹配人群和預期適用人群之間的差異,分析結果的外推性;結合研究目標、局限性、多種分析方法、相似研究的結果和其他相關(guān)證據,對結果進(jìn)行謹慎、全面的解釋。
六、參考文獻
[1]國家藥品監督管理局.真實(shí)世界數據用于醫療器械臨床評價(jià)技術(shù)指導原則(試行):國家藥監局關(guān)于發(fā)布真實(shí)世界數據用于醫療器械臨床評價(jià)技術(shù)指導原則(試行)的通告.2020年第77號[Z].
[2]高培, 王楊, 羅劍鋒, 等. 基于真實(shí)世界數據評價(jià)治療結局研究的統計分析技術(shù)規范[J]. 中國循證醫學(xué)雜志. 2019;19(7):787-793.
[3]彭曉霞,舒嘯塵,譚婧,等.基于真實(shí)世界數據評價(jià)治療結局的觀(guān)察性研究設計技術(shù)規范[J]. 中國循證醫學(xué)雜志, 2019, 19 (7), 779–786.
[4]溫澤淮, 李玲, 劉艷梅, 等. 實(shí)效性隨機對照試驗的技術(shù)規范. 中國循證醫學(xué)雜志[J]. 2019;19(7):794-802.
[5]聶曉路, 彭曉霞. 使用常規收集衛生數據開(kāi)展觀(guān)察性研究的報告規范-RECORD規范. 中國循證醫學(xué)雜志. 2017;17(4):475-487.
[6] Yue LQ, Campbell G, Lu N, Xu Y, Zuckerman B. Utilizing national and international registries to enhance pre-market medical device regulatory evaluation. Journal of Biopharmaceutical Statistics[J]. 2016;26(6):1136-1145.
[7] Sterne JA, Hernán MA, Reeves BC, et al. ROBINS-I: a tool for assessing risk of bias in non-randomised studies of interventions[J]. BMJ. 2016;355:i4919.
[8] Wang SV, Pinheiro S, Hua W, et al. STaRT-RWE: structured template for planning and reporting on the implementation of real world evidence studies[J]. BMJ. 2021;372:m4856.
站點(diǎn)聲明
本網(wǎng)站所提供的信息僅供參考之用,并不代表本網(wǎng)贊同其觀(guān)點(diǎn),也不代表本網(wǎng)對其真實(shí)性負責。圖片版權歸原作者所有,如有侵權請聯(lián)系我們,我們立刻刪除。如有關(guān)于作品內容、版權或其它問(wèn)題請于作品發(fā)表后的30日內與本站聯(lián)系,本網(wǎng)將迅速給您回應并做相關(guān)處理。
鄭州思途醫療科技有限公司專(zhuān)注于醫療器械產(chǎn)品政策與法規規事務(wù)服務(wù),提供產(chǎn)品注冊備案申報代理、臨床試驗、體系建立輔導、分類(lèi)界定、申請創(chuàng )新辦理服務(wù)。
行業(yè)資訊
知識分享