【CMDE】關(guān)于《醫療器械臨床試驗設計指導原則(征求意見(jiàn)稿)》征求意見(jiàn)的通知

為提高醫療器械臨床試驗設計的科學(xué)性,在總結臨床試驗資料的技術(shù)審評情況、查閱相關(guān)文獻資料的基礎上,我中心組織起草了《醫療器械臨床試驗設計指導原則(征求意見(jiàn)稿)》。
為使該指導原則更具有科學(xué)合理性及實(shí)際可操作性,即日起在我中心網(wǎng)上公開(kāi)征求意見(jiàn),衷心希望相關(guān)領(lǐng)域的專(zhuān)家、學(xué)者、管理者及從業(yè)人員積極參與,提出建設性的意見(jiàn)或建議,推動(dòng)指導原則的豐富和完善,促進(jìn)注冊申報及技術(shù)審評質(zhì)量和效率的提高。
請將意見(jiàn)或建議以電子郵件的形式于2017年11月26日前反饋我中心。
聯(lián)系人:劉英慧、陳敏
電話(huà):010-86452802、86452640
電子郵箱:
liuyh@cmde.org.cn

附件:1.醫療器械臨床試驗設計指導原則(征求意見(jiàn)稿)(下載
2.反饋意見(jiàn)表(
下載

國家食品藥品監督管理總局
醫療器械技術(shù)審評中心
2017年11月1日

附件1

  

 

一、適用范圍1

二、臨床試驗的開(kāi)展原則1

三、醫療器械臨床試驗的設計原則和特點(diǎn)3

(一)臨床試驗目的3

(二)器械臨床試驗設計需考慮的特殊因素5

1.器械的工作原理5

2.使用者技術(shù)水平和培訓6

3.學(xué)習曲線(xiàn)6

4.人為因素6

(三)臨床試驗設計的基本類(lèi)型和特點(diǎn)6

1.平行對照設計6

1)隨機化7

2)盲法7

3)對照9

2.配對設計10

3.交叉設計10

4.單組設計11

1)與OPC比較12

2)與PG比較12

5.與歷史研究對照13

(四)受試對象13

(五)評價(jià)指標14

1.主要評價(jià)指標和次要評價(jià)指標14

2.復合指標15

3.替代指標16

4.指標裁定16

(六)比較類(lèi)型和檢驗假設17

1.平行對照17

1)比較類(lèi)型17

2)界值18

3)檢驗假設18

2.單組試驗19

(七)樣本量估算19

1.平行對照設計樣本量估算20

1)優(yōu)效性試驗20

2)等效性試驗21

3)非劣效試驗22

2.單組試驗的樣本量估算22

3.診斷試驗的樣本量估算23

(八)統計分析23

1.分析數據集的定義23

2.缺失值的填補24

3.統計分析方法25

(九)臨床試驗的偏倚和抽樣誤差28


一、適用范圍

醫療器械臨床試驗是指在具備相應條件的臨床試驗機構中,對擬申請注冊的醫療器械在正常使用條件下的安全有效性進(jìn)行確認或者驗證的過(guò)程。本指導原則適用于產(chǎn)品組成、設計和性能已定型的醫療器械,包括治療類(lèi)產(chǎn)品、診斷類(lèi)產(chǎn)品,不包括體外診斷試劑。本指導原則不適用于定制器械的臨床試驗設計,不適用于小樣本可行性試驗的設計。

二、臨床試驗的開(kāi)展原則

在醫療器械設計開(kāi)發(fā)過(guò)程中,確認最終產(chǎn)品符合臨床使用的需要(包括安全性、有效性、適用范圍/禁忌癥、使用方法、使用注意事項等信息)是其重要環(huán)節??刹扇《喾N方法實(shí)現確認過(guò)程,包括同品種產(chǎn)品的臨床數據、模擬臨床使用的功能試驗(如利用離體動(dòng)物組織模擬測試高頻血管閉合設備的凝血功能,利用髖關(guān)節磨損試驗機模擬測試髖關(guān)節假體的磨損性能等)、模型實(shí)驗(如在人體下消化道模型中模擬插入電子下消化道內窺鏡,以觀(guān)察腔道內圖像質(zhì)量以及內窺鏡的操控性能等、動(dòng)物實(shí)驗(如將骨修復材料植入骨缺損動(dòng)物模型中,觀(guān)察其介導骨長(cháng)入和自身降解特征的實(shí)驗等)、體外診斷設備的比較研究試驗以及臨床試驗等。按照保障受試者權益、保障實(shí)驗動(dòng)物福利的原則,上述確認方法的選擇和開(kāi)展順序應恰當。

臨床試驗的目的是為臨床評價(jià)提供臨床數據,綜合考慮產(chǎn)品的非臨床研究(如文獻研究、性能研究、模擬臨床使用的功能實(shí)驗、模型實(shí)驗、動(dòng)物實(shí)驗、體外診斷設備的比較研究試驗等)數據,以評價(jià)產(chǎn)品的臨床受益是否大于風(fēng)險,產(chǎn)品的風(fēng)險在現有技術(shù)水平上是否已得到合理控制,同時(shí)為臨床醫生和患者對器械使用的臨床環(huán)境和方法提供重要信息。需考慮開(kāi)展臨床試驗的產(chǎn)品包括但不限于下列情形:

(一)尚未在境內外批準上市、安全有效性未經(jīng)醫學(xué)證實(shí)的新產(chǎn)品;

(二)通過(guò)非臨床研究難以確認產(chǎn)品臨床使用的有效性和/或安全性。

(三)對于器械的工作原理、作用機理、適應證、臨床療效、不良反應等方面,目前尚不明確或存在爭議的治療類(lèi)產(chǎn)品。例如植入式胃刺激器及電極導線(xiàn),利用植入胃的電極與皮下部位的脈沖發(fā)生器對胃進(jìn)行刺激以達到減肥或治療糖尿病的作用,其工作原理、作用機理、適應證、臨床療效、不良反應等方面均不明確。例如含銀鹽敷料,在人體內的作用機理、不良反應尚無(wú)定論。

(四)器械的部分性能通過(guò)參與人體代謝的方式獲得,或者器械在體內被吸收,且尚無(wú)公認的非臨床研究方法可進(jìn)行恰當模擬的情形。例如生物可吸收支架,在血管重建過(guò)程中可逐步被吸收,尚無(wú)公認的非臨床研究方法可進(jìn)行恰當模擬,故需要考慮開(kāi)展臨床試驗。例如經(jīng)抗生素浸漬的腦室導管,其輔助抗菌或抗細菌定殖作用僅由體外實(shí)驗證明,不能完全模擬人體顱內環(huán)境以及國內常見(jiàn)感染菌種等微生物大環(huán)境,因此,其輔助抗菌或抗細菌定殖作用、可能產(chǎn)生的不良事件需臨床試驗進(jìn)行確認。例如腹腔、盆腔外科手術(shù)用防粘連產(chǎn)品,非臨床研究不能模擬產(chǎn)品在人體內的使用效果和吸收效果,需考慮開(kāi)展臨床試驗。

(五)對于產(chǎn)品設計和制造工藝復雜、仿制一致性難以確認的高風(fēng)險醫療器械,例如粒子治療設備、植入式心臟起搏器等,若申請人尚無(wú)同類(lèi)產(chǎn)品在中國批準上市,需考慮開(kāi)展臨床試驗。

三、醫療器械臨床試驗的設計原則和特點(diǎn)

臨床試驗是以受試人群(抽樣)為觀(guān)察對象,觀(guān)察試驗器械在正常使用條件下作用于人體的效應,以推論試驗器械在預期適用人群(總體)中的效應。由于醫療器械的固有特征,其試驗設計亦有其自身特點(diǎn)。

(一)臨床試驗目的

臨床試驗應有明確的試驗目的。臨床試驗目的決定了主要評價(jià)指標的選擇、臨床試驗設計類(lèi)型和比較類(lèi)型,從而影響臨床試驗樣本量。申辦者可綜合分析試驗器械特征、非臨床研究情況、同類(lèi)產(chǎn)品上市情況和臨床表現等因素,設定臨床試驗目的。將臨床試驗設置不同目的的情形舉例如下:

1.當試驗器械的安全性已通過(guò)非臨床研究得以基本確認,臨床試驗目的可設置為確認產(chǎn)品的有效性,同時(shí)觀(guān)察產(chǎn)品的安全性。例如,MRI、CT等影像類(lèi)設備的試驗目的可設置為評價(jià)產(chǎn)品的圖像質(zhì)量。例如,透析濃縮物通常為原料藥或藥用輔料進(jìn)行簡(jiǎn)單物理混合而成,溶解后通過(guò)離子交換與人體作用,透析液不直接進(jìn)入人體,對于成熟配方,其安全性已較為穩定。該產(chǎn)品臨床試驗目的為確認其有效性(主要評價(jià)指標為反映其有效性的復合指標),同時(shí)觀(guān)察其安全性。

2、當試驗器械的有效性已得到基本證實(shí),臨床試驗目的可設置為確認產(chǎn)品的安全性,同時(shí)觀(guān)察產(chǎn)品的有效性。以乳房植入體為例,臨床試驗通常選擇并發(fā)癥發(fā)生率(如包膜攣縮率、植入體破裂率)作為主要評價(jià)指標,試驗目的為確認產(chǎn)品的安全性,觀(guān)察產(chǎn)品的有效性。

3.當已上市器械增加適應證時(shí),臨床試驗目的可設置為確認試驗器械對新增適應證的有效性。例如,止血類(lèi)產(chǎn)品在已批準適用范圍(如普通外科、婦產(chǎn)科等)的基礎上,增加眼科、神經(jīng)外科、泌尿外科使用的適應證。

4.當已上市器械使用人群發(fā)生變化時(shí),臨床試驗目的可設置為確認試驗器械對新增使用人群的有效性。例如膜式氧合器產(chǎn)品,在原批準適用范圍的基礎上新增體重≤10kg的適用人群。例如治療類(lèi)呼吸機在已批準的適用于成人的基礎上新增適用于兒童的適用范圍。

5.當已上市器械發(fā)生重大設計變更時(shí),可根據變更涉及的范圍設置試驗目的。例如冠狀動(dòng)脈藥物洗脫支架平臺花紋設計發(fā)生改變時(shí),臨床試驗目的可為評價(jià)變化部分對于產(chǎn)品安全性和有效性的影響;

6.當已上市器械的使用環(huán)境或使用方法發(fā)生重大改變時(shí),試驗目的可設置為對使用環(huán)境和使用方法的確認。例如:已上市的植入式心臟起搏器通常不能兼容核磁共振檢查,如申請兼容核磁共振檢查,其臨床試驗目的可設置為對兼容核磁共振檢查相關(guān)的安全有效性進(jìn)行確認。

對于進(jìn)入創(chuàng )新醫療器械特別審批程序的產(chǎn)品,建議申請人充分利用產(chǎn)品注冊申請受理前溝通路徑,就臨床試驗設計與醫療器械技術(shù)審評中心進(jìn)行充分溝通。

(二)器械臨床試驗設計需考慮的特殊因素

由于器械的固有特征可能影響其臨床試驗設計,在進(jìn)行器械臨床試驗設計時(shí),需對以下因素予以考慮:

1.器械的工作原理

器械的工作原理和作用機理可能與產(chǎn)品性能/安全性評價(jià)方法、臨床試驗設計是否恰當相關(guān)。

2.使用者技術(shù)水平和培訓

部分器械可能需要對使用者進(jìn)行技能培訓后才能被安全有效地使用,例如手術(shù)復雜的植入器械。在臨床試驗設計時(shí),需考慮使用器械所必須的技能,研究者技應能反映產(chǎn)品上市后在預期用下的器械使用者的技能范圍。

3.學(xué)習曲線(xiàn)

部分器械使用方法新穎,存在一定的學(xué)習曲線(xiàn)。當臨床試驗過(guò)程中學(xué)習曲線(xiàn)明顯時(shí),試驗方案中需考慮在學(xué)習曲線(xiàn)時(shí)間內收集的信息(例如明確定義哪些受試者是學(xué)習曲線(xiàn)時(shí)間段的一部分以及在統計分析中報告這些結果。如果學(xué)習曲線(xiàn)陡峭,可能會(huì )影響產(chǎn)品說(shuō)明書(shū)的相關(guān)內容和用戶(hù)培訓需求。

4.人為因素

在器械設計開(kāi)發(fā)過(guò)程中,對器械使用相關(guān)的人為因素的研究可能會(huì )指導器械的設計或使用說(shuō)明書(shū)的制定,以使其更安全,更有效,或讓受試者或醫學(xué)專(zhuān)業(yè)人事更容易使用。

(三)臨床試驗設計的基本類(lèi)型和特點(diǎn)

1.平行對照設計

隨機、雙盲、平行對照的臨床試驗設計可確保臨床試驗影響因素在試驗組和對照組間的分布趨于相似,保證研究者、評價(jià)者和受試者均不知曉分組信息,避免了選擇偏倚和評價(jià)偏倚,被認為可提供最高等級的科學(xué)證據,通常被優(yōu)先考慮。對于某些醫療器械,此種設計的可行性受到器械固有特征的挑戰。

1)隨機化

隨機化是平行對照臨床試驗需要遵循的基本原則,指臨床試驗中每位受試者均有同等機會(huì )(如試驗組與對照組病例數為1:1的臨床試驗設計)或其他約定的概率(如試驗組與對照組病例數為n:1的臨床試驗設計)被分配到試驗組或對照組,不受研究者和/或受試者主觀(guān)意愿的影響。隨機化保障試驗組和對照組受試者在各種已知和未知的可能影響試驗結果的基線(xiàn)變量上具有可比性。

部分醫療器械的臨床試驗采用非隨機設計,可能造成各種影響因素在組間分布不均衡,降低試驗結果的可信度。即使通過(guò)協(xié)變量分析對已知影響因素進(jìn)行校正,仍存在未知影響因素對試驗結果產(chǎn)生影響的可能。非隨機設計并不減少臨床試驗的受試者風(fēng)險及申辦方成本,從風(fēng)險受益的角度,通常不推薦非隨機設計。如果申辦方有強烈的理由認為必須采用非隨機設計,需要詳述必須采用該設計的理由和控制選擇偏倚的具體方法。

2)盲法

由于知曉分組信息,研究者可能在器械使用過(guò)程中選擇性關(guān)注試驗組,評價(jià)者在進(jìn)行療效與安全性評價(jià)時(shí)可能產(chǎn)生傾向性,受試者可能受到主觀(guān)因素的影響。部分試驗未設置獨立的評價(jià)者,研究者和評價(jià)者為同一人擔任。盲法是控制臨床試驗中因“知曉分組信息”而產(chǎn)生偏倚的重要措施之一,目的是達到臨床試驗中的各方人員對分組信息的不可知。根據設盲程度的不同,盲法分為完整設盲、設盲不完整和非盲(開(kāi)放)設計。在完整設盲的臨床試驗中,受試者、研究者、評價(jià)者對分組信息均應處于盲態(tài)。例如用于四肢和脊柱非結構性植骨的骨填充材料,可通過(guò)試驗設計實(shí)現對受試者和評價(jià)者設盲,當試驗產(chǎn)品和對照產(chǎn)品具有相同的外觀(guān)和規格時(shí),可通過(guò)屏蔽包裝和標簽實(shí)現對研究者設盲,從而實(shí)現完整設盲。受試者、研究者和評價(jià)者中的一方不處于盲態(tài)時(shí),為設盲不完整。開(kāi)放性臨床試驗中,所有人員都可能知道處理信息。

在很多情形下,基于器械和相應治療方式的固有特征,完整設盲是不可行的。當試驗組治療方式(含器械)與對照組存在明顯差異時(shí),難以對受試者、研究者設盲。當試驗器械與對照器械存在明顯不同時(shí),難以對研究者設盲,例如膝關(guān)節假體,試驗產(chǎn)品和對照產(chǎn)品的外觀(guān)可能存在明顯不同,且植入物上有肉眼可見(jiàn)的制造商激光標記。例如血管內金屬支架,因支架具體結構、花紋不同,難以對研究者設盲。當試驗器械形態(tài)與對照器械存在明顯不同且主要評價(jià)指標來(lái)自影像學(xué)數據時(shí),難以對評價(jià)者設盲,例如骨科內固定產(chǎn)品,其在X線(xiàn)、CT影像學(xué)圖片中完整顯影,而臨床試驗主要評價(jià)指標通常包括影像學(xué)數據(如術(shù)后24周骨折部位正側位X線(xiàn)片上骨折間隙模糊或消失,或者正側位X線(xiàn)片上可見(jiàn)連續性骨痂越過(guò)骨折線(xiàn)),因此,該類(lèi)產(chǎn)品臨床試驗難以對評價(jià)者設盲。例如生物可吸收支架,當對照產(chǎn)品為金屬支架時(shí),由于生物可吸收支架平臺發(fā)生降解,評估晚期管腔丟失指標(該指標以影像學(xué)方式評價(jià))時(shí)難以對評價(jià)者設盲。

申辦方需要對設盲不完整或開(kāi)放性試驗設計的理由進(jìn)行論述,詳述控制偏倚的具體方法(如采用可客觀(guān)判定的指標以避免評價(jià)偏倚,采用標準操作規范以減小操作偏倚等)。

3)對照

對照包括陽(yáng)性對照和安慰對照(如假處理對照、假手術(shù)對照等)。陽(yáng)性對照需采用在擬定的臨床試驗條件下療效肯定的已上市器械或公認的標準治療方案。選擇陽(yáng)性對照時(shí),優(yōu)先采用已上市同類(lèi)產(chǎn)品。如因合理理由不能采用已上市同類(lèi)產(chǎn)品,可選用盡可能相似的產(chǎn)品作為陽(yáng)性對照,其次可考慮標準治療方案。例如:人工頸椎間盤(pán)假體開(kāi)展臨床試驗時(shí),如因合理理由不能采用已上市同類(lèi)產(chǎn)品,可選擇臨床廣泛使用的、對相應適應證的療效已得到證實(shí)并被公認的產(chǎn)品。例如:治療良性前列腺增生的設備在沒(méi)有同類(lèi)產(chǎn)品上市的情形下,可采用良性前列腺增生癥的標準治療方案(經(jīng)尿道前列腺電汽化術(shù))作為對照。在試驗器械尚無(wú)相同或相似的已上市產(chǎn)品或標準治療方案時(shí),若試驗器械的療效存在安慰效應,試驗設計需考慮安慰對照,此時(shí),尚需綜合考慮倫理學(xué)因素,例如用于緩解疼痛的物理治療類(lèi)設備。

2.配對設計

對于治療類(lèi)產(chǎn)品,常見(jiàn)的配對設計為同一受試對象的兩個(gè)對應部位同時(shí)接受試驗器械和對照治療,試驗器械和對照治療的分配可進(jìn)行隨機設計。該設計主要適用于器械的局部效應評價(jià),具有一定的局限性。例如,對于面部注射用交聯(lián)透明質(zhì)酸鈉凝膠的臨床試驗,配對設計在保證受試者基線(xiàn)一致性上比平行對照設計具有優(yōu)勢,但試驗中一旦發(fā)生系統性不良反應則難以確認不良反應與試驗器械或對照器械的相關(guān)性,且面部左右側局部反應的互相影響需要進(jìn)行排除。

對于診斷類(lèi)產(chǎn)品,若試驗目的是評價(jià)試驗器械的診斷可靠性,常見(jiàn)的配對設計為同一受試者/受試樣品同時(shí)采用試驗器械和金標準方法來(lái)進(jìn)行診斷。

3.交叉設計

在交叉設計的臨床試驗中,每位受試者或每例樣品按照預先確定的排列順序,在不同時(shí)間接收兩種或兩種以上的治療(或診斷測試)。當一種治療(或診斷測試)的影響不延續到下一種治療(或診斷測試)時(shí),可能適合采用交叉設計。對于這種類(lèi)型的設計,除非另有合理說(shuō)明,否則順序應是隨機的。交叉設計可以用于治療類(lèi)和診斷類(lèi)器械的研究。

4.單組設計

單組試驗的實(shí)質(zhì)是將主要評價(jià)指標的試驗結果與已有臨床數據進(jìn)行比較,以評價(jià)試驗器械的有效性/安全性。與平行對照試驗相比,單組試驗可能存在選擇偏倚、評價(jià)偏倚等,應審慎選擇。當器械技術(shù)比較成熟且對其適用疾病有較為深刻的了解時(shí),或者當試驗器械技術(shù)尚不成熟,設置對照不可行時(shí),方可考慮采用單組設計。在開(kāi)展單組試驗時(shí),需要對可能存在的偏倚進(jìn)行全面分析和有效控制。

單組試驗需事先指定主要評價(jià)指標有臨床意義的目標值,通過(guò)考察單組臨床試驗主要評價(jià)指標的結果是否在指定的目標值范圍內,從而評價(jià)試驗器械有效性/安全性。目標值是專(zhuān)業(yè)領(lǐng)域內公認的某醫療器械的有效性/安全性評價(jià)指標所應達到的最低標準。目標值通常為二分類(lèi)(如有效/無(wú)效)的客觀(guān)評價(jià)指標,包括平均值(靶值)和95%置信區間下限(高優(yōu)指標)/95%置信區間上限(低優(yōu)指標),包括客觀(guān)性能標準(Objective performance criteria,OPC)和性能目標(Performance goal,PG)兩種。

由于沒(méi)有設置對照組,單組目標值臨床試驗無(wú)法證明試驗器械的優(yōu)效、等效或非劣效,僅能證明試驗器械的有效性/安全性達到專(zhuān)業(yè)領(lǐng)域內公認的最低標準。除了單組設計的限定條件外,考慮單組目標值設計時(shí),還應關(guān)注試驗器械的適用人群、主要評價(jià)指標(如觀(guān)察方法、隨訪(fǎng)時(shí)間、判定標準等)是否可被充分定義且相對穩定。

1)與OPC比較

當試驗器械技術(shù)比較成熟、對其適用疾病有較為深刻的了解且可獲取該類(lèi)器械充分的臨床研究數據時(shí),可考慮OPC單組試驗。OPC是在既往臨床研究數據的基礎上分析得出,用于試驗器械主要評價(jià)指標的比較和評價(jià)。OPC的構建需要全面收集具有一定質(zhì)量水平及相當數量病例數的臨床研究數據,在受試者水平上進(jìn)行科學(xué)的薈萃分析。例如一次性使用膜式氧合器,其臨床試驗可采用單組目標值設計,主要評價(jià)指標采用《一次性使用膜式氧合器注冊技術(shù)審查指導原則》中提及的復合指標“達標率”時(shí),試驗產(chǎn)品達標率的目標值(95%置信區間下限)應至少為90%,預期達標率(靶值)為95%。例如,常規設計的髖關(guān)節假體,當臨床試驗采用單組目標值設計時(shí),主要評價(jià)指標通常采用術(shù)后12個(gè)月Harris評分“優(yōu)良率”,試驗產(chǎn)品“優(yōu)良率”的目標值(95%置信區間下限)應至少為85%,預期優(yōu)良率(靶值)為95%。隨著(zhù)器械技術(shù)和臨床技能的提高,OPC可能發(fā)生改變,需要對臨床數據重新進(jìn)行分析予以確認。

2)與PG比較

當試驗器械技術(shù)尚不成熟,且設置對照不可行(例如試驗器械與現有治療方法的風(fēng)險受益過(guò)于懸殊,設置對照在倫理上不可行,或者現有治療方法因客觀(guān)條件限制不具有可行性)時(shí),可考慮采用PG單組試驗設計。PG是在現有治療方法的臨床研究數據的基礎上分析得出。與OPC相比,采用PG的單組設計的臨床證據水平更低。PG的實(shí)現/未實(shí)現不能立即得出試驗成功/失敗的結論,如果在試驗數據中發(fā)現不正常的信號,需要對試驗結果進(jìn)行進(jìn)一步探討和論證。例如脫細胞角膜植片,適用于藥物治療無(wú)效需要進(jìn)行板層角膜移植的感染性角膜炎患者。由于開(kāi)展臨床試驗時(shí)市場(chǎng)上無(wú)同類(lèi)產(chǎn)品,且與異體角膜移植對比存在角膜來(lái)源困難的問(wèn)題,故采用PG單組設計進(jìn)行臨床試驗,PG來(lái)源于異體角膜移植既往臨床研究數據,由相關(guān)權威的專(zhuān)業(yè)醫學(xué)組織認可。

5.與歷史研究對照

與歷史研究對照的臨床試驗證據強度弱,可能存在選擇偏倚、實(shí)施偏倚、評價(jià)偏倚等問(wèn)題,應審慎選擇。當采用某一歷史研究作為對照時(shí),需獲取試驗組和對照組每例受試者的基線(xiàn)參數,論證兩組受試者的可比性,以控制選擇偏倚。申辦者可通過(guò)科學(xué)設計入組方式以保障兩組受試者的可比性。由于試驗組和對照組不是同期開(kāi)展,需要關(guān)注兩組間干預方式和評價(jià)方式的一致性,以控制實(shí)施偏倚和評價(jià)偏倚。

(四)受試對象

根據試驗器械預期使用的目標人群,確定研究的總體。綜合考慮總體人群的代表性、臨床試驗的倫理學(xué)要求、受試者安全性等因素,制定受試者的選擇標準,即入選和排除標準。入選標準主要考慮受試對象對總體人群的代表性,如適應證、疾病的分型、疾病的程度和階段、使用具體部位、受試者年齡范圍等因素。排除標準主要考慮受試對象的同質(zhì)性,對可能影響試驗結果的因素予以排除,以精確評估試驗器械的效應。

(五)評價(jià)指標

評價(jià)指標反映器械作用于受試對象而產(chǎn)生的各種效應,根據試驗目的和器械的預期效應設定。在臨床試驗方案中應明確規定各評價(jià)指標的觀(guān)察目的、定義、觀(guān)察時(shí)間點(diǎn)、指標類(lèi)型、測定方法、計算公式、判定標準(適用于定性指標和等級指標)等,并明確規定主要評價(jià)指標和次要評價(jià)指標。指標類(lèi)型包括定量指標(可測量的連續性指標,如血糖值)、定性指標(如有效和無(wú)效)、等級指標(如優(yōu)、良、中、差)等。

1.主要評價(jià)指標和次要評價(jià)指標

主要評價(jià)指標是與試驗目的有本質(zhì)聯(lián)系的、能確切反映器械作用效應的指標。主要評價(jià)指標應盡量選擇客觀(guān)性強、易于量化、重復性高的指標,應是專(zhuān)業(yè)領(lǐng)域普遍認可的指標,通常來(lái)源于已發(fā)布的相關(guān)標準或技術(shù)指南、公開(kāi)發(fā)表的權威論著(zhù)或專(zhuān)家共識等。臨床試驗通常設立單一試驗目的,主要評價(jià)指標通常只有一個(gè)。當一個(gè)主要評價(jià)指標不足以反映試驗器械的作用效應時(shí),可采用兩個(gè)或多個(gè)主要評價(jià)指標。當有多個(gè)主要評價(jià)指標時(shí),樣本量估算需要考慮假設檢驗的多重性問(wèn)題,對總Ⅰ類(lèi)錯誤率和總Ⅱ類(lèi)錯誤率的控制策略。以腦積水分流器腦室-腹腔分流器)的非劣效平行對照試驗為例,當臨床試驗同時(shí)采用三個(gè)主要評價(jià)指標(包括術(shù)后30天顱內壓達標率、植入后1年的存留率、試驗器械1年的存留率不小于90%)時(shí),其樣本量估算需同時(shí)考慮試驗組術(shù)后30天顱內壓達標率非劣效于對照組,試驗組1年的存留率非劣效于對照組;試驗器械1年的存留率達到目標值要求三種情形。

臨床試驗的樣本量是基于主要評價(jià)指標的相應假定后進(jìn)行估算的。臨床試驗的結論亦基于主要評價(jià)指標的統計結果做出。次要評價(jià)指標是與試驗目的相關(guān)的輔助性指標。在方案中需說(shuō)明其在解釋結果時(shí)的作用及相對重要性。

2.復合指標

當單一觀(guān)察指標不足以作為主要評價(jià)指標時(shí),通常采取的方法是按預先確定的計算方法,將多個(gè)評價(jià)指標組合構成一個(gè)復合指標。以冠狀動(dòng)脈藥物洗脫支架為例,臨床試驗的主要評價(jià)指標之一為靶病變失敗率。靶病變失敗率包括心臟死亡、靶血管心肌梗死以及靶病變血運重建,是由反映產(chǎn)品安全性和有效性的指標組合而成的復合指標。以血液透析濃縮物為例,臨床試驗時(shí)可采用透析達標率作為主要評價(jià)指標,達標的定義透析前后K+、Na+、Ca2+、Cl、CO2CP(二氧化碳結合力)或HCO3、pH值均達到預先設定的臨床指標數值。復合指標可將客觀(guān)測量指標和主觀(guān)評價(jià)指標進(jìn)行結合,形成綜合評價(jià)指標。臨床上采用的量表(如生活質(zhì)量量表、功能評分量表等)也為復合指標的一種形式。需在試驗方案中詳細說(shuō)明復合指標中各組成指標的定義、測定方法、計算公式、判定標準、權重等。當采用量表作為復合指標時(shí),多采取專(zhuān)業(yè)領(lǐng)域普遍認可的量表。極少數需要采用自制量表的情形,申辦者需提供自制量表效度、信度和反應度的研究資料,研究結果需證明自制量表的效度、信度和反應度可被接受。可對復合指標中有臨床意義的單個(gè)指標進(jìn)行單獨的分析。

3.替代指標

在直接評價(jià)臨床獲益不可行時(shí),可采用替代指標進(jìn)行間接觀(guān)察。是否可采用替代指標作為臨床試驗的主要評價(jià)指標取決于:①替代指標與臨床結果的生物學(xué)相關(guān)性;②替代指標對臨床結果判斷價(jià)值的流行病學(xué)證據;③從臨床試驗中獲得的有關(guān)試驗器械對替代指標的影響程度與試驗器械對臨床試驗結果的影響程度相一致的證據。

4.指標裁定

部分評價(jià)指標由于沒(méi)有客觀(guān)評價(jià)方法而只能進(jìn)行主觀(guān)評價(jià),臨床試驗若必需選擇主觀(guān)評價(jià)指標作為主要評價(jià)指標,建議成立獨立的評價(jià)小組,由不參與臨床試驗的人員進(jìn)行指標裁定,需在試驗方案中明確指標裁定的規則。

(六)比較類(lèi)型和檢驗假設

1.平行對照

1)比較類(lèi)型

平行對照的比較類(lèi)型包括優(yōu)效性比較、等效性比較、非劣效性比較。采用安慰對照的臨床試驗,需進(jìn)行優(yōu)效性比較。采用療效/安全性公認的已上市器械或已有治療方法進(jìn)行對照的臨床試驗,可根據試驗目的選擇優(yōu)效性比較、等效性比較或非劣效性比較。優(yōu)效性試驗包括從統計學(xué)角度提出的優(yōu)效和從臨床意義上提出的優(yōu)效兩種,通常情況下,臨床優(yōu)效性試驗具有臨床實(shí)際意義。臨床優(yōu)效性試驗的目的是驗證試驗器械的療效/安全性?xún)?yōu)于對照器械或安慰對照或空白對照,且其差異大于預先制定的優(yōu)效界值,即差異有臨床實(shí)際意義。等效性試驗的目的是驗證試驗器械的療效/安全性與對照器械的差異小于預先制定的等效界值,即差異在臨床上無(wú)實(shí)際意義。非劣效性檢驗的目的是驗證試驗器械的療效/安全性如果低于對照器械,其差異小于預先制定的非劣效界值,即差異在臨床可接受范圍內。在優(yōu)效性試驗中,如果其設計合理且執行良好,試驗結果可直接證明試驗器械的療效/安全性。在等效性試驗和非劣效性試驗中,試驗器械的療效/安全性建立在對照器械預期療效/安全性的基礎上。

2)界值

無(wú)論優(yōu)效性試驗、等效性試驗或非劣效性試驗,要從臨床意義上確認試驗器械的療效/安全性,均需要在試驗設計階段制定界值并在方案中闡明。在優(yōu)效性試驗中,界值指的是試驗器械與對照器械之間的差異具有臨床實(shí)際意義的最小值。在等效性試驗或非劣效性試驗中,界值指的是試驗器械與對照器械之間的差異不具有臨床實(shí)際意義的最大值。優(yōu)效性界值、非劣效性界值均為預先制定的一個(gè)數值,等效性界值需要預先制定優(yōu)側、劣側兩個(gè)數值。

制定非劣效界值可采用兩步法,一是通過(guò)薈萃分析估計對照器械減去安慰效應后的絕對效應或對照器械的相對效應M1,二是結合臨床具體情況,在考慮保留對照器械效應的適當比例1-f后,確定非劣效界值M2M2=f×M1,0<f<1)。f越小,試驗器械的效應越接近對照器械。制定等效界值時(shí),可用類(lèi)似的方法確定下限和上限。界值的制定主要考慮臨床實(shí)際意義,需要被臨床認可或接受。

3)檢驗假設

1列舉了不同試驗類(lèi)型下檢驗假設和檢驗統計量的計算公式。H0H1分別表示無(wú)效檢驗和備選檢驗;T和C分別表示試驗組和對照組主要評價(jià)指標的均數或率;δ表示界值,優(yōu)效性界值用δ表示,非劣效界值用-δ表示,等效界值的優(yōu)側和劣側分別用δ和-δ表示。

1 不同試驗類(lèi)型的檢驗假設和檢驗統計量

試驗類(lèi)型

無(wú)效假設

備選假設

檢驗統計量

非劣效性試驗

H0:T-C≤-δ

H1:T-C>-δ

t=[T-C-(-δ)]/Sd

優(yōu)效性試驗

H0:T-C≤δ

H1:T-C>δ

t=(T-C-δ)/Sd

等效性試驗

H01:T-C≤-δ

H11:T-C>-δ

t1=[T-C-(-δ)]/Sd

H02:T-C≥δ

H12:T-C<δ

t2=(T-C-δ)/Sd

2.單組試驗

單組試驗為樣本率與已知總體率的比較研究,P0為主要評價(jià)指標的目標值(95%置信區間下限,P1為主要評價(jià)指標的總體率(靶值)。對于高優(yōu)指標,檢驗假設為H0P1≤P0,H1P1P0。對于低優(yōu)指標,檢驗假設為H0P1≥P0,H1P1P0。

(七)樣本量估算

臨床試驗收集受試人群中的療效/安全性數據,用統計分析將基于主要評價(jià)指標的試驗結論推斷到與受試人群具有相同特征的目標人群。為實(shí)現抽樣(受試人群)代替整體(目標人群)的目的,臨床試驗需要一定的受試者數量(樣本量)。樣本量大小與主要評價(jià)指標的變異度呈正相關(guān),與主要評價(jià)指標的組間差異呈負相關(guān)。

樣本以試驗的主要評價(jià)指標來(lái)確定。臨床試驗方案中說(shuō)明確定樣本量相關(guān)要素和樣本量的具體計算方法。確定樣本量相關(guān)要素包括臨床試驗的設計類(lèi)型和比較類(lèi)型、主要評價(jià)指標的類(lèi)型和定義、主要評價(jià)指標有臨床實(shí)際意義的界值、對照器械主要評價(jià)指標的相關(guān)參數(如預期有效、均值、標準差等)、類(lèi)和類(lèi)錯誤率以及預期的受試者脫落和方案違背的比例等。對照器械主要評價(jià)指標的相關(guān)參數根據已有臨床數據或探索性試驗的結果來(lái)估算,需要在臨床試驗方案中明確這些估計值的確定依據。一般情況下,類(lèi)錯誤概率α設定為雙側0.05或單側0.025。類(lèi)錯誤概率β設定為不大于0.2,預期受試者脫落和方案違背的比例不能大于0.2。

1.平行對照設計樣本量估算

以下公式中,nT、nC分別為試驗組和對照組的樣本量;Z1-α/2、Z1-β為標準正態(tài)分布的分數位,當α=0.05時(shí),Z1-α/2=1.96,當β=0.2時(shí),Z1-β=0.845;(Z1-α/2+Z1-β)2=7.87

1)優(yōu)效性試驗

當主要評價(jià)指標為事件發(fā)生率且不接近于0%100%時(shí),其樣本量估算公式為:

 

PT、PC分別為試驗組和對照組預期事件發(fā)生率;D為兩組的預期率差,對于高優(yōu)指標:D=PT-PC,對于低優(yōu)指標:D=PC-PT;?為優(yōu)效性界值,取正值。

主要評價(jià)指標為定量指標時(shí)的樣本量估算的公式為:

 

σ為對照組預期標準差;D為預期的兩組均數之差,對于高優(yōu)指標:D=uTuC;對于低優(yōu)指標:D=uCuT。

使用該公式計算樣本量為Z值計算的結果,小樣本時(shí)宜使用t值迭代,或總例數增加2-3例。

2)等效性試驗

當主要評價(jià)指標為事件發(fā)生率且不接近于0%100%時(shí),其樣本量估算公式為:

 

PC、PT分別為對照組和試驗組預期的樣本率;D為兩組的預期率差,D=PT-PC;?為等效界值(適用于劣側界值與優(yōu)側界值相等的情形),取正值。

當效應指標為定量指標時(shí)的樣本量估算的公式為:

 

其中n為每組的樣本量;σ為標準差;D為兩組預期的均數之差D=uTuC;?為等效界值(適用于劣側界值與優(yōu)側界值相等的情形),取正值。

使用該公式計算樣本量為Z值計算的結果,小樣本時(shí)宜使用t值迭代,或總例數增加2-3例。

3)非劣效試驗

當主要評價(jià)指標為事件發(fā)生率且不接近于0%100%時(shí),其樣本量估算公式為:

 

PC、PT分別為對照組和試驗組預期的樣本率;D為兩組的預期率差,D=PT-PC,如果指標為低優(yōu)指標,則D=PC-PT;?為非劣效界值,界值?取負值。

當效應指標為定量指標時(shí)的樣本量估算的公式為:

 

σ為標準差;D為預期檢測到的兩組均數之差D=uTuC;?為等效界值,取負值。

使用該公式計算樣本量為Z值計算的結果,小樣本時(shí)宜使用t值迭代,或總例數增加2-3例。

2.單組試驗的樣本量估算

以下公式中,n為試驗組樣本量;Z1-α/2、Z1-β為標準正態(tài)分布的分數位,當α=0.05時(shí),Z1-α/2=1.96,當β=0.2時(shí),Z1-β=0.845。

當主要評價(jià)指標為事件發(fā)生率且不接近于0%100%時(shí),其樣本量估算公式為:

 

PT為試驗組預期的樣本率,P0為目標值。

3.診斷試驗的樣本量估算

診斷試驗的評價(jià)指標為靈敏度和特異度,用靈敏度計算陽(yáng)性組的樣本量,用特異度計算陰性組的樣本量。

單個(gè)診斷試驗樣本含量的估算公式為:

 

公式中n為所需樣本量,Zα/2標準正態(tài)分布的分位數,P為靈敏度或特異度的預期值,δ為P的允許誤差大小,一般取P的95%置信區間寬度的一半,常用的取值為0.05-0.1。

(八)統計分析

1.分析數據集的定義

臨床試驗的分析數據集包括全分析集(full analysis set,FAS)、符合方案集(per protocol set,PPS)和安全性數據集(safety set,SS)。需根據臨床試驗目的,遵循盡可能減少試驗偏倚和防止Ⅰ類(lèi)錯誤增加的原則,在臨床試驗方案中對上述數據集進(jìn)行明確定義,規定不同數據集在有效性評價(jià)和安全性評價(jià)中的地位。全分析集通常應包括所有入組且接受過(guò)一次治療的受試者,只有在非常有限的情形下才可剔除受試者,包括違反了重要的入組標準、入組后無(wú)任何觀(guān)察數據的情形。符合方案集是全分析集的子集,包括已接受方案中規定的治療、可獲得主要評價(jià)指標的觀(guān)察數據、對試驗方案沒(méi)有重大違背的受試者。若從全分析集和符合方案集中剔除受試者,一是需符合方案中的定義,二是需充分闡明剔除理由,對于設盲的臨床試驗設計,需在盲態(tài)審核時(shí)闡明剔除理由。安全性數據集通常應包括所有入組且接受過(guò)一次治療并進(jìn)行過(guò)安全性評價(jià)的受試者。

需同時(shí)在全分析集、符合方案集中對試驗結果進(jìn)行統計分析。當二者數據一致時(shí),可以增強試驗結果的可信度。當二者數據不一致時(shí),應對差異進(jìn)行充分的討論和解釋。如果符合方案集中排除的受試者比例過(guò)大,或者因排除受試者導致試驗結論的根本性變化(由全分析集中的試驗失敗變?yōu)榉戏桨讣械脑囼灣晒Γ?,將影響臨床試驗的可信度。

2.缺失值的填補

缺失值(臨床試驗觀(guān)察指標的數據缺失)是臨床試驗結果偏倚的潛在來(lái)源,在臨床試驗方案的制定和執行過(guò)程中應采取充分的措施盡量避免數據缺失。對于缺失值的處理方法,特別是主要評價(jià)指標的缺失值,需根據具體情形,在方案中遵循保守原則規定恰當的處理方法,如末次觀(guān)察值結轉(LOCF)、基線(xiàn)觀(guān)察值結轉(BOF)等。必要時(shí),可考慮采用不同的缺失值處理方法進(jìn)行敏感性分析。

不建議在統計分析中直接排除有缺失數據的受試者,因為該處理方式可能破壞入組的隨機性、破壞受試人群的代表性、降低研究的把握度、增加Ⅰ類(lèi)錯誤。

3.統計分析方法

①統計描述

人口學(xué)指標、基線(xiàn)數據和次要評價(jià)指標的數據,通常采用統計描述進(jìn)行統計分析,如均數、標準差、中位數、t檢驗、方差分析等。

主要評價(jià)指標在進(jìn)行假設檢驗和置信區間分析前,亦先進(jìn)行統計描述。值得注意的是,組間差異無(wú)統計學(xué)意義不能得出兩組等效或非劣效的結論。

②假設檢驗和置信區間

在確定的檢驗水平(通常為雙側0.05)下,計算表1中的檢驗統計量,查相應的界值表得P值,即可做出統計推斷,完成假設檢驗。對于非劣效試驗,若P≤α,則無(wú)效假設被拒絕,可推論試驗組非劣效于對照組。對于優(yōu)效性試驗,若P≤α,則無(wú)效假設被拒絕,可推論試驗組臨床優(yōu)效于對照組。對于等效性試驗,若P1≤α和P2≤α同時(shí)成立,則兩個(gè)無(wú)效假設同時(shí)被拒絕,前者可推論試驗組不比對照組差,后者可推論試驗組不比對照組好,綜合推斷試驗組與對照組等效。

通過(guò)構建主要評價(jià)指標組間差異的置信區間,將置信區間的上限和/或下限與事先制定的界值進(jìn)行比較,以做出臨床試驗結論。計算主要評價(jià)指標組間差異的(1-α)置信區間,α通常選取雙側0.05。對于非劣效性臨床試驗,若置信區間下限大于-δ(非劣效界值),可得出非劣效結論。對于優(yōu)效性試驗,若置信區間下限大于δ(優(yōu)效界值),可作出臨床優(yōu)效結論。對于等效性試驗,若置信區間的下限和上限在(-δ,δ)(等效界值的劣側和優(yōu)側)范圍內,可得出臨床等效結論。

對試驗結果進(jìn)行分析時(shí),建議同時(shí)采用假設檢驗和區間分析,以進(jìn)行統計推斷,得出試驗結論。

④基線(xiàn)分析

除試驗器械及相應治療方式外,主要評價(jià)指標常常受到受試者基線(xiàn)數據的影響,如疾病的分型和程度、主要評價(jià)指標的基線(xiàn)數據等。因此,在試驗方案中應識別可能對主要評價(jià)指標有重要影響的基線(xiàn)數據,在統計分析中將其作為協(xié)變量,采用恰當的方法(如協(xié)方差分析方法),對試驗結果進(jìn)行校正,以補償試驗組和對照組間由于協(xié)變量不均衡而對試驗結果產(chǎn)生的影響。協(xié)變量的確定依據以及相應的校正方法的選擇理由應在臨床試驗方案中予以說(shuō)明。對于沒(méi)有在臨床試驗方案中規定的協(xié)變量,通常不進(jìn)行校正,或僅將校正后的結果作為參考。

⑤中心效應

根據《醫療器械臨床試驗質(zhì)量管理規范》(國家食品藥品監督管理總局 中華人民共和國國家衛生和計劃生育委員會(huì )令第25號),多中心臨床試驗是指按照同一臨床試驗方案,在三個(gè)以上(含三個(gè))臨床試驗機構實(shí)施的臨床試驗。多中心臨床試驗可在較短時(shí)間內入選所需的病例數,且入選病例范圍廣,臨床試驗的結果更具代表性,但對試驗結果的影響因素更為復雜。

多中心臨床試驗要求組織制定標準操作規程,組織對參與臨床試驗的所有研究者進(jìn)行臨床試驗方案和試驗用醫療器械使用和維護的培訓試驗,以確保在臨床試驗方案執行、試驗器械使用方面的一致性。當主要評價(jià)指標易受主觀(guān)影響時(shí),建議采取相關(guān)措施(如對研究者開(kāi)展培訓后進(jìn)行一致性評估,采用獨立評價(jià)中心,選擇背對背評價(jià)方式等)以保障評價(jià)標準的一致性。盡管采取了相關(guān)質(zhì)量控制措施,在多中心臨床試驗中,仍可能出現因不同中心在受試者基線(xiàn)特征、臨床實(shí)踐(如手術(shù)技術(shù)、評價(jià)經(jīng)驗)等方面存在差異,導致不同中心間的效應不盡相同。當中心與處理組間可能存在交互作用時(shí),需在臨床試驗方案中預先規定中心效應的分析策略。當中心數量較多,每個(gè)中心的樣本數均較少時(shí),一般無(wú)需考慮中心效應。

對于在兩個(gè)臨床試驗機構開(kāi)展的臨床試驗,如果遵循《醫療器械臨床試驗質(zhì)量管理規范》中對于多中心臨床試驗的相關(guān)要求執行,臨床試驗按照同一試驗方案在兩個(gè)臨床試驗機構同期進(jìn)行,保障臨床試驗方案執行和器械使用的一致性,可按照多中心臨床試驗的統計分析原則和方法進(jìn)行統計分析。

對于在兩家及以上臨床試驗機構開(kāi)展的臨床試驗,各中心試驗組和對照組病例數的比例原則上應與總樣本的比例大致相同。

(九)臨床試驗的偏倚和抽樣誤差

臨床試驗設計需考慮偏倚和抽樣誤差。偏倚是偏離真值的系統誤差的簡(jiǎn)稱(chēng),在試驗設計、試驗實(shí)施和數據分析過(guò)程中均可引入偏倚,偏倚可導致錯誤的試驗結論。臨床試驗設計時(shí)應盡量避免或減少試驗偏倚。

抽樣誤差受臨床試驗樣本量的影響。一方面,較大的樣本量可提供更多的數據,對器械性能/安全性評價(jià)的抽樣誤差更小。另一方面,更大的樣本量可能導致無(wú)臨床意義的差異變得具有統計學(xué)意義。試驗設計應該旨在使試驗結果同時(shí)具有臨床和統計學(xué)意義。

 

【來(lái)源】CMDE

【整理】翔康技術(shù)

翔康技術(shù)—全國領(lǐng)先的CRO公司,全程為您提供醫療器械注冊、臨床試驗等服務(wù)。

服務(wù)熱線(xiàn):020-84290935