• <table id="q00os"><div id="q00os"></div></table>
  • 歡迎來到三明博峰生物科技有限公司網站!
    資訊動態
    您現在的位置:首頁 > 資訊動態 > 醫學動態 > 詳情

    如何寫一篇高質量的ROC分析文章

    [ 更新時間:2008-12-29 ]

    一、 ROC分析的基礎。

    檢驗醫學的論文大題可以分為兩類,一類是方法學論文,只要是質量控制,方法學評價,對比等,另一類就是實驗室指標的應用,使用指標診斷疾病,觀察指標與疾病預后和病理分期的關系等。ROC分析的文章就屬于后者,其目的主要是評價某指標對某種疾病的診斷意義。如“AFP在肝癌診斷中的作用”,“CEA,NSE聯合診斷肺癌”等。
    眾所周知,用單一實驗室指標去診斷疾病,單獨提高敏感性必然會降低特異性,反之亦然;換句話說,減少誤診必然增加漏診。比如,某醫師欲采用AFP診斷肝癌,該醫師制定的診斷標準是AFP大于10mmol/L,顯然按照此標準診斷肝癌,具有很高的敏感性,是不會漏診肝癌的的,因為幾乎所有的肝癌患者AFP都大于10 mmol/L。但是另一方面,依據此標準卻容易造成誤診,因為AFP大于10 mmol/L的病人中,除了肝癌還有肝炎和肝硬化等肝臟疾病。該醫師意識到這個問題后,將肝癌診斷標準從10 mmol/L提高到1000 mmol/L,并以此作為診斷肝癌的標準,顯然,以此為標準,自然是不會誤診病人,因為AFP大于1000 mmol/L幾乎就可以肯定是肝癌了。但是另一方面,卻增加了漏診,因為不是所有的肝癌患者AFP都大于1000 mmol/L的。由此可見,漏診和誤診之間是相互矛盾的,減少誤診必然以增加漏診為代價,減少漏診又必然以增加誤診為代價,敏感性與特異性始終是魚與熊掌不可兼得的矛盾。
    那么該如何協調靈敏度和特異性呢?最好的方法就是做ROC分析(注意:ROC只是針對計量指標)。將病例組和與之難以鑒別診斷的疾病放在一起,采用需要研究的指標去診斷疾病,以1-特異度為橫坐標,敏感性為縱坐標。觀察指標變化時,敏感性與特異性的關系,繪制ROC曲線(具體程序都有SPSS完成)。然后根據曲線的結果對指標進行判斷。
    ROC 有什么用途呢?大體上說,主要有以下幾種用途:1,判斷單一指標的診斷效力,曲線下面積越大,指標的診斷效力越大;2,比較不同指標的診斷效力。
    不懂的再看看相關書籍。
    ________________________________________

    二,  如何設計一個高質量的ROC分析
    2.1.樣本例數的估計
    大部分研究,在開展之前,一定要進行樣本數的估計,樣本量太少,統計效率低下,容易犯2類錯誤。樣本量太高,不僅造成經濟上的浪費,還增加了很多不可控制的因素,降低了實驗質量。國內部分醫務人員單純認為樣本量越大,研究結果越可靠,這是片面的。實際上,個人認為,一般研究,把樣本量控制在最小估計樣本量的上限再加20%就可以了(主要是在前瞻性的研究中防止脫落)。
    樣本量的估計由于園子里無法打公式,我就不寫了,具體可以參考相關書籍。
    2.2  對照組和實驗組的設置
    一個實驗室指標,要不僅要強調其敏感性,還要強調其特異性,對照組的設置主要是為了體現指標的特異性,即鑒別診斷的能力?;诖?,對照組的設置應該是和疾病組癥狀相似,如果不采用實驗室診斷指標是很難進行鑒別的疾病。比如肝硬化和肝癌。國內部分文章,在設立對照組時加入了健康人群組,這是不科學的。因為健康人群和有疾病的人群通過癥狀體征基本就能鑒別,何需實驗室指標。當然,如果一個指標是很新穎的指標,或者無癥狀疾病的診斷(這類疾病很少),在首次或者最初的研究中可以加入健康對照組,以觀察疾病組和健康對照組之間是否具有差別,這是可以理解的,但是對于研究有明顯癥狀,可以輕而易舉和健康人區分的疾病,是不需要設立健康對照組的。實驗組和對照組應該充分體現在均質上面,就是不采用實驗室指標,光憑癥狀病史很難進行鑒別診斷的一類人群。最好的方法就是采用統一的納入標準。比如,欲使用AFP診斷肝癌,較好的納入標準就是將醫院所有年齡大于40周歲,有黃疸或者其它肝病癥狀,懷疑為肝癌患者的首診人群,至于納入研究的人群是肝癌還是其它良性肝病,先不用管,使用指標鑒別診斷就是。需要說明的是,具體的標準根據專業知識而定,上面列出的標準僅僅供參考。一個ROC研究質量的高低,在很大程度上取決于納入標準的科學性,這也是對研究者能力的考驗。
    國內部分雜志甚至部分國外雜志,在納入研究對象的時候,僅僅說實驗組有多少名病例組成,對照組有**病**例,**病**例。這實際上是不科學的,或者不值得提倡的。比如同樣對RF診斷RA進行研究,某研究人員只是簡單交待對照組由強直性脊柱炎20例,系統性紅斑狼瘡30例組成――這很難反映這些疾病與肝癌是否需要鑒別,因為有的強直性脊柱炎和紅斑狼瘡因為癥狀比較典型,是不需要和RA進行鑒別的。同時還牽涉到另外一個問題,就是沒有對疾病進行病理分期。
    很多指標,與疾病的病理分期有關。比如腫瘤標志物。也有的與疾病的病程密切相關,比如心肌損傷標志物。在對這一類指標進行研究時,一定要考慮疾病的分層。比如研究CK對AMI的診斷作用,一定要在納入標準中限制就診時間,比如規定本研究只納入急性胸痛后2小時內就診的人群,且都在一個時間段內(比如胸痛后3-4小時)進行檢測,當然,限制的時間越窄,研究質量越高,但是病例越少,研究難度越大,所以自己需根據研究能力,專業知識等決定納入標準。對于與病理分期有關的疾病,如果有足夠的病例進行分層,可以分層研究,如果沒有,應該交待病例構成,病例構成最好能接近實際情況(依據專業知識掌握),有的還可以根據專業進行其它基線特征的比較,比如:在AFP診斷肝癌的研究中,可以采用卡方檢驗對病例組和對照組的肝功能(分級)進行比較。實際上,在進行ROC分析前,最好比較兩組的其它指標是否均衡,若不均衡,那說明納入標準還不是很嚴謹,或者說明該指標也可以作為診斷指標,可將其也進行ROC分析。
    國內多數論文不交待病例構成,沒有兩組其它特征的比較,甚至連基本的年齡,性別比較都沒有。讓讀者無法判斷兩組病例是否均質,該研究是否有意義。
    需要說明的時,研究納入標準越嚴格,病例分層越細,研究質量越高,但是研究難度越大。具體需要達到什么樣的研究目的,有無必要進行分層和嚴格限制等,研究者根據實際情況而定。
    2.3 實驗組一定要有金標準
    所謂金標準,就是確診一個疾病的方法或者方案。對于實驗組病例的納入,一定要使用金標準確診。換句話說,納入實驗組的病例就應該是納入一個算一個。相反的,有時病例組要求不是太嚴格。
    常用的確診方法,比如:RA,應采用1987年美國風濕病學會的診斷標準確診,腫瘤應根據病例確診,膽結石應該根據術中所見確診。具體的金標準可以參考各個專業的相關知識。國內多數ROC分析文章對金標準交待不明確,讓讀者無法判斷研究的質量。這是不嚴謹的表現。
    2.4  ROC相關參數的解釋
    由ROC曲線產生的參數較多,cut-off值,敏感性,特異性,曲線下面積(AUC),陽性預測值,陰性預測值,陽性似然比,陰性似然比,約登指數等。在進行專業解釋時,一般無需全部列出,但是cut-off值,敏感性,特異性,曲線下面積(AUC)是必須交待的。
    國內部分論文在討論相關指標時,常犯的錯誤有:各個指標沒有可信區間,以樣本代替總體,簡單地認為AUC越大,診斷效力越高。有的甚至認為約登指數才是判斷診斷效力的關鍵,實際上約登指數只是對一個點而言,并不能反映指標的變化后,敏感性與特異性的變化,同時約登指數也只能初略地確定cut off。
    在同一個試驗中比較兩種指標時,要得出單一指標的診斷效力高,一定要使用AUC比較,但是這個比較并不是簡單數值上的比較,而應該使用相關的統計方法。其方法比較繁瑣,建議找專業人士。關于敏感性和特異性的比較,也因該有相關的比較檢驗方法。因為我們研究的是樣本,存在抽樣誤差,不能用樣本代替總體進行討論。
    同時AUC的取值是介于0.5和1之間的,不可能低于0.5,國內部分文章,在處理某些降低才具有意義的指標時,受定式思維的影響,居然出現了AUC小于0.5。純屬無稽之談。
    講個例子,某人喜歡預測別人生男孩還是生女孩,如果預測的情況90%都是正確的,那可以說某人預測得比較準,如果某人預測的情況90%都是錯誤的,難道這個預測就沒有用了嗎?聰明點的人就會反過來想,要是預測生男孩,就可以理解為要生女孩,且不是準確性又是90%。
    2.5 多個指標的聯合診斷
    指標之間的聯合診斷可分為系列診斷實驗(串聯)和平行診斷實驗(并聯),具體用什么聯合方法,依據專業而定。有的疾病,如果需要早期診斷,早診斷對預后影響巨大的,采用并聯,如急性心肌梗死。有的疾病強調特異性的,比如SLE,可以采用串聯,提高特異性。說簡單點:串聯就是所有指標陽性才算陽性,并聯就是只要有一個指標陽性就算陽性。
    當然,幾乎所有的疾病,都是越早診斷越好,診斷越準確越好,有時很難劃分清楚二者界限,除了少數疾病。因此,從謹慎的角度出發,研究者可以同時列出串聯模式和并聯模式,供讀者自己選擇。
    國內部分論文,在使用指標聯合診斷時,要不不交待聯合方式,要不就是串并聯混亂使用,讓讀者無從理解。
    實際上,根據常識可以推斷,兩個指標不管是串聯還是并聯,提高敏感性就會降低特異性。串聯時多個指標共同陽性才算診斷成立,因此提高了特異性,同時降低了敏感性,并聯時只要有一個指標陽性,診斷就成立,提高了敏感性,降低了特異性。多個指標聯合診斷是不可能出現敏感性和特異性同時升高的情況的。也就是說聯合診斷是,如果敏感性較任何一個指標高(至少相等),那說明作者用的是并聯,特異性就應該較任何一個參與聯合的單一指標低;反之,如果聯合診斷后特異性較任何一個指標高(至少相等),那說明作者用的是串聯,敏感性就應該較任何一個參與聯合的單一指標低;國內部分論文,在聯合診斷后,居然出現指標敏感性和特異性同步升高的情況,是不符合邏輯的,說輕點就是計算錯誤,說重點就是―――
    同時,指標之間的聯合是一個點與點的聯合,是兩個cut-off的聯合,不存在AUC這一個指標,AUC是在指標變化的時候產生的曲線面積,指標已經固定某值,何來AUC。國內部分論文在聯合時又冒出個聯合AUC,也屬無稽之談。
    有的文章甚至拋開ROC曲線,使用參考范圍上限作為診斷界值,實屬不理解ROC分析所致。
    2.6 站在臨床的角度,客觀評價ROC分析
    從理論上講,多數情況下,多個指標的聯合有助于提高疾病診斷的準確性,但是我們應該意識到,多個指標聯合,會增加病人的經濟負擔,在診斷效力相似的情況下,肯定優先選擇少量廉價的指標診斷。同時,一個指標,要成功運用于臨床,必然要綜合其各方面優缺點的,比如,是否易于檢測,是否穩定,是否廉價,是否及時等。國內多指標聯合診斷的ROC分析論文,多忽視臨床需要,盲目推薦多個指標的聯合診斷,脫離臨床實際,削弱了文章的使用推廣價值。因此在下結論推薦診斷指標,或者指標組合時,因充分考慮以上因素,慎重推薦。
    2.7 理智對待ROC分析
    ROC分析雖然綜合了敏感性和特異性,客觀評價了指標的診斷效力,但是也有自身的缺陷,比如:有的時候特別注重對疾病特異性的診斷,比如AIDS的確診,假如發現某定量指標對診斷AIDS有幫助,這時切不可用ROC分析,應該結合臨床實際。注重研究特異性為100%的情況,不要過多地考慮敏感性。同時,部分疾病,其診斷對實驗室指標依賴性不強,很多指標變化只是疾病作為的結果,也不宜使用ROC分析,因為實驗室指標還面臨來自影像學,病理學,病史,物理檢查的挑戰,在實驗室指標不具備優勢的情況下,不要盲目采用ROC分析。如從理論上講,WBC計數可以用于診斷創傷,但是創傷的診斷絕對不依賴于WBC,因為其診斷主要靠病史。且不要鬧笑話,采用ROC分析,分析WBC在創傷診斷中的作用。

     

    ?
     
    国产精品va在线观看无码_av在线无码有码中文_国产香蕉综合色在线视频_亚洲中文色另类欧美小说