假作真時真亦假的機率問題

作者 卿尚華、卿承宇 / 台南一中

壹、 前言 

一、 研究動機 

關於是否應該針對「2019 冠狀病毒」普篩或無症狀患者實施檢測等議題,曾在臺灣引起 相當多的討論,因此,我們決定深入瞭解檢測問題。 

二、 研究目的 

除了瞭解檢測原理外,我們將應用高中機率與統計的基礎,針對檢測問題建立其數學模 型,並探討提升檢測效能的機制。 

貳、 正文 

一、 簡介 

「2019 冠狀病毒」於全球大流行後引起軒然大波,也嚴重影響了我們的日常生活。 為了早日克服冠狀病毒的威脅,除了疫苗的開發外,病毒檢測技術是另一項重大的議題。 醫療檢測結果可以下表混淆矩陣呈現(吳俊忠。2017)。由於檢測試劑的正確率通常 難以達到百分之百,檢測結果難免會有錯誤,特異性指的是無帶原者(稱為狀況一 H1) 中採檢陰性的比例,一般簡稱為「真陰性」的比例;而敏感性為有帶原者(狀況二 H2) 中採檢陽性的比例,也可稱為「真陽性」的比例。當檢測出陽性時,受限於檢測試劑的 物理特性,有部分可能會是偽(或假)的陽性,檢測出陰性時亦然。由於機率和為一, 「偽陽性」與「偽陰性」分別由檢測試劑的特異性及敏感性所決定。

表一:混淆矩陣。

試想,如果是癌症篩檢,偽陽性的受檢者必定會產生極大的心理負擔;若是傳染力 高的冠狀病毒,偽陰性者恐怕會迅速造成疫情擴大而難以控制,因此,好的檢測試劑需 要最大化特異性與敏感性。如下圖所示,檢測數據m通常會以某種機率分佈呈現,為簡化數學符號,令m的條件機率 分別代表在H1H2發生前提下,檢測數據為m的條件機率,其中P代表機率。因檢測試劑的不完美, 通常會有部分重疊,是「偽陽性」與「偽陰性」產生的原因。檢測結果仰賴一門 檻值決定,當檢測數據m比門檻值大(小)時,判斷為陽(陰)性。所以,在狀況一 H1下,若 m比門檻值大,則偽陽性發生,機率為紅色斜線面積;在狀況二 H2下,若m比門檻值小,則是偽陰性,機率為藍色斜線面積。因此,當門檻值愈大,偽陽性機率愈小, 而偽陰性機率愈大。所以偽陽性與偽陰性會互相影響,通常是一必須取捨的問題,也就 是說,偽陽性愈大則偽陰性愈小,反之亦然。 

圖一: 檢測數據機率分佈。

二、 研究方法 

(一)數學機率模型 

由於偵測試劑廠商並不會公開其量測數據的分佈機率,本專題將自行假設其機率分 佈,以驗證我們的想法。我們的問題有兩種可能的狀況,即無帶原者(稱為狀況一H1 ) 與有帶原者(稱為狀況二H2 )。為探討一廣義的決策法則,我們假設量測數據存在誤差, 但有某種的可靠度,例如:量測數據,其中,SH1 SH2 分別代表量測數據在狀況一及狀況二下可能的集合,代表聯集。為方便研究及呈現我們的想法,我們將假設m為整數,即SH1 SH2 為整數形成的集合。由於誤差可能存在,SH1 SH2 中的元素個數都不只一個且可能重疊。 代表檢測器量測特性,可藉由檢測器產品特徵化事先得之。由於機率和為1 (Richard Issac, 2002),所以, 亦然。

()單一(single)量測數據 

首先,我們先探討最簡單的例子,也就是說,當量測數據只有一個時,我們藉由上 節提出的模型,分析最佳的決策法則。我們先探討一個特例。如果,其中代表空集合,最佳的決策D明顯如下: 

其中,當D為0/1時,代表判斷結果為H1/ H2 ,因為當時,由於 , 所以不可能發生狀況二,故可以推論為狀況一,反之亦然。但如果 ,當時,有可能為狀況一或狀況二,這時可利用下式判斷: 

單數據法:

(2) 其中, 。也就是說,「如果發生狀況一的機率大於或等於狀況二發生的機率,就決定狀況一發生,反之亦然。」 

()複數(multiple)量測數據 

  假設有N個檢測器,其檢測結果將有一控制中心負責收集所有數據後做最佳判斷。 實務上,可以同一(或不同)廠牌檢測器實施數次檢測,而每個檢測器將判斷結果回報 給中心,中心再利用收集到的結果決定,若認為是狀況一的個數大於檢測器個數的一半, 即 N/2,則判定為狀況一,反之亦然。此判斷方式我們稱為「投票法」:

投票法:

其中 

Di為第i個檢測器的決策,mi為第i 個檢測器的量測值。 當判斷式成立時,結果D=0,即判斷為H1 ,反之,則判斷為H2 。此檢測法類似投票法則,少數服從多數。 

(四)實驗設計

任 何 量 測 誤 差 都 可 能 造 成 檢 測 結 果 錯 誤 , 我 們 首 先 假 設 ,由於不論量測數據m為何,兩種狀況都可能發生,也就是說,我們預計實驗較嚴苛環境下的檢測結果。假設其機率如下所示:

其中 , 滿足機率和為一。為了方便驗證提出的想法,我們故意 假設兩種狀況下的條件機率是對稱的,故理論上真陰性與真陽性的機率會一樣。此案例 是為了方便驗證提出的想法,可輕易延伸為其他不同的實際情況。 

()主程式介紹 

下表是我們完成的部分模擬主程式,模擬在狀況一H1及各種複數量測數據下的正確 決策機率,即「真陰性」機率。因為「真陰性」機率 +「偽陽性」機率=1 ,即「真陰性」 機率愈高,則「偽陽性」機率愈低,因此本實驗也可看出「偽陽性」機率的結果。程式 中,%符號代表 MATLAB 中不執行的註解,可用來解釋毎一行程式的功能,請參考註解 說明。其他函數,如 sample_gen(為產生隨機樣本函式)等,因篇幅關係則無法一一列 出。 

表二: 模擬主程式。

()單數據法與投票法複數量測數據效能比較 

雖然直觀上有複數量測數據的輔助,檢測成功效能會大幅提升,但是我們仍然很 好奇是否真是如此?針對複數量測數據,每次實驗利用程式分別產生H1H2之下的量 測數據各 個,至於單數據法則只有一個數據可以使用,即N=1 。我們利用程式共做了M=20000 次隨機實驗,檢測為「真陰性」與「真陽性」的機率如下表。由數據可 知,利用控制中心負責收集所有數據後做最佳判斷,檢測成功效能會大幅提升。我們探討的 是左右顛倒的,故狀況一及二的檢測結果理論上會是一樣的,模擬 實驗也呈現類似的結果。 

表三: 單數據法與投票法效能比較。

參、 結論 

期盼本篇專題能讓社會大眾對於檢測機率問題有正確的觀念。在本篇報告中,我 們解釋了檢測技術的原理,受限於檢測試劑的不完美特性,我們認知到「偽陽性」與 「偽陰性」的存在,使得檢測結果真偽難辨,遂引起諸多議題導致社會爭論不休,正 所謂「真作假時假亦真,假作真時真亦假」!若欲降低「偽陽性」/「偽陰性」,應上 升/下降門檻值,而隨之升高的「偽陰性」/「偽陽性」,則可利用本篇利用複數量測數 據的方法,以提升檢測準確性。首先,我們定義出檢測數據的數學機率模型;接下來, 則確認複數量測數據可提升檢測準確性;最後則撰寫程式模擬驗證提出的想法。由於 無偵測試劑廠商量測數據的分佈機率,本專題遂自行假設其機率分佈,未來可延伸至 量測數據為實數的環境中,也可朝著評估在真實數據下的準確性繼續探索。 

肆、 引註資料

 註一:吳俊忠(2017)。醫學分子檢驗(五版)。臺北市:五南出版社。 註二:Richard Issac (2002)。機率的樂趣(The Pleasures of Probability)。陳尚婷、陳尚瑜譯, 台北:弘智文化事業有限公司。