假作真時真亦假的機率問題

作者卿尚華、卿承宇 / 台南一中

壹、前言

一、研究動機

關於是否應該針對「2019 冠狀病毒」普篩或無症狀患者實施檢測等議題，曾在臺灣引起相當多的討論，因此，我們決定深入瞭解檢測問題。

二、研究目的

除了瞭解檢測原理外，我們將應用高中機率與統計的基礎，針對檢測問題建立其數學模型，並探討提升檢測效能的機制。

貳、正文

一、簡介

「2019 冠狀病毒」於全球大流行後引起軒然大波，也嚴重影響了我們的日常生活。為了早日克服冠狀病毒的威脅，除了疫苗的開發外，病毒檢測技術是另一項重大的議題。醫療檢測結果可以下表混淆矩陣呈現（吳俊忠。2017）。由於檢測試劑的正確率通常難以達到百分之百，檢測結果難免會有錯誤，特異性指的是無帶原者（稱為狀況一 H₁）中採檢陰性的比例，一般簡稱為「真陰性」的比例；而敏感性為有帶原者（狀況二 H₂）中採檢陽性的比例，也可稱為「真陽性」的比例。當檢測出陽性時，受限於檢測試劑的物理特性，有部分可能會是偽（或假）的陽性，檢測出陰性時亦然。由於機率和為一，「偽陽性」與「偽陰性」分別由檢測試劑的特異性及敏感性所決定。

表一：混淆矩陣。

試想，如果是癌症篩檢，偽陽性的受檢者必定會產生極大的心理負擔；若是傳染力高的冠狀病毒，偽陰性者恐怕會迅速造成疫情擴大而難以控制，因此，好的檢測試劑需要最大化特異性與敏感性。如下圖所示，檢測數據m通常會以某種機率分佈呈現，為簡化數學符號，令m的條件機率分別代表在H₁與 H₂發生前提下，檢測數據為m的條件機率，其中P代表機率。因檢測試劑的不完美，與通常會有部分重疊，是「偽陽性」與「偽陰性」產生的原因。檢測結果仰賴一門檻值決定，當檢測數據m比門檻值大（小）時，判斷為陽（陰）性。所以，在狀況一 H₁下，若 m比門檻值大，則偽陽性發生，機率為紅色斜線面積；在狀況二 H₂下，若m比門檻值小，則是偽陰性，機率為藍色斜線面積。因此，當門檻值愈大，偽陽性機率愈小，而偽陰性機率愈大。所以偽陽性與偽陰性會互相影響，通常是一必須取捨的問題，也就是說，偽陽性愈大則偽陰性愈小，反之亦然。

二、研究方法

(一)數學機率模型

由於偵測試劑廠商並不會公開其量測數據的分佈機率，本專題將自行假設其機率分佈，以驗證我們的想法。我們的問題有兩種可能的狀況，即無帶原者（稱為狀況一H₁ ) 與有帶原者（稱為狀況二H₂ ）。為探討一廣義的決策法則，我們假設量測數據存在誤差，但有某種的可靠度，例如：量測數據，其中，S_H1及S_H2 分別代表量測數據在狀況一及狀況二下可能的集合，代表聯集。為方便研究及呈現我們的想法，我們將假設m為整數，即S_H1及S_H2 為整數形成的集合。由於誤差可能存在，S_H1及S_H2 中的元素個數都不只一個且可能重疊。與代表檢測器量測特性，可藉由檢測器產品特徵化事先得之。由於機率和為1 （Richard Issac, 2002），所以，亦然。

(二)單一（single）量測數據

首先，我們先探討最簡單的例子，也就是說，當量測數據只有一個時，我們藉由上節提出的模型，分析最佳的決策法則。我們先探討一個特例。如果，其中代表空集合，最佳的決策D明顯如下：

其中，當D為0/1時，代表判斷結果為H₁/ H₂ ，因為當時，由於，所以不可能發生狀況二，故可以推論為狀況一，反之亦然。但如果，當時，有可能為狀況一或狀況二，這時可利用下式判斷：

單數據法：

(2) 其中，。也就是說，「如果發生狀況一的機率大於或等於狀況二發生的機率，就決定狀況一發生，反之亦然。」

(三)複數（multiple）量測數據

假設有N個檢測器，其檢測結果將有一控制中心負責收集所有數據後做最佳判斷。實務上，可以同一（或不同）廠牌檢測器實施數次檢測，而每個檢測器將判斷結果回報給中心，中心再利用收集到的結果決定，若認為是狀況一的個數大於檢測器個數的一半，即 N/2，則判定為狀況一，反之亦然。此判斷方式我們稱為「投票法」：

投票法：

其中

D_i為第i個檢測器的決策，，m_i為第i 個檢測器的量測值。當判斷式成立時，結果D=0，即判斷為H₁ ，反之，則判斷為H₂ 。此檢測法類似投票法則，少數服從多數。

(四)實驗設計

任何量測誤差都可能造成檢測結果錯誤，我們首先假設，由於不論量測數據m為何，兩種狀況都可能發生，也就是說，我們預計實驗較嚴苛環境下的檢測結果。假設其機率如下所示：

其中，滿足機率和為一。為了方便驗證提出的想法，我們故意假設兩種狀況下的條件機率是對稱的，故理論上真陰性與真陽性的機率會一樣。此案例是為了方便驗證提出的想法，可輕易延伸為其他不同的實際情況。

(五)主程式介紹

下表是我們完成的部分模擬主程式，模擬在狀況一H₁及各種複數量測數據下的正確決策機率，即「真陰性」機率。因為「真陰性」機率 +「偽陽性」機率=1 ，即「真陰性」機率愈高，則「偽陽性」機率愈低，因此本實驗也可看出「偽陽性」機率的結果。程式中，%符號代表 MATLAB 中不執行的註解，可用來解釋毎一行程式的功能，請參考註解說明。其他函數，如 sample_gen（為產生隨機樣本函式）等，因篇幅關係則無法一一列出。

表二：模擬主程式。

(六)單數據法與投票法複數量測數據效能比較

雖然直觀上有複數量測數據的輔助，檢測成功效能會大幅提升，但是我們仍然很好奇是否真是如此？針對複數量測數據，每次實驗利用程式分別產生H₁及H₂之下的量測數據各個，至於單數據法則只有一個數據可以使用，即N=1 。我們利用程式共做了M=20000 次隨機實驗，檢測為「真陰性」與「真陽性」的機率如下表。由數據可知，利用控制中心負責收集所有數據後做最佳判斷，檢測成功效能會大幅提升。我們探討的及是左右顛倒的，故狀況一及二的檢測結果理論上會是一樣的，模擬實驗也呈現類似的結果。

表三：單數據法與投票法效能比較。

參、結論

期盼本篇專題能讓社會大眾對於檢測機率問題有正確的觀念。在本篇報告中，我們解釋了檢測技術的原理，受限於檢測試劑的不完美特性，我們認知到「偽陽性」與「偽陰性」的存在，使得檢測結果真偽難辨，遂引起諸多議題導致社會爭論不休，正所謂「真作假時假亦真，假作真時真亦假」！若欲降低「偽陽性」/「偽陰性」，應上升/下降門檻值，而隨之升高的「偽陰性」/「偽陽性」，則可利用本篇利用複數量測數據的方法，以提升檢測準確性。首先，我們定義出檢測數據的數學機率模型；接下來，則確認複數量測數據可提升檢測準確性；最後則撰寫程式模擬驗證提出的想法。由於無偵測試劑廠商量測數據的分佈機率，本專題遂自行假設其機率分佈，未來可延伸至量測數據為實數的環境中，也可朝著評估在真實數據下的準確性繼續探索。

肆、引註資料

註一：吳俊忠（2017）。醫學分子檢驗（五版）。臺北市：五南出版社。註二：Richard Issac (2002)。機率的樂趣（The Pleasures of Probability）。陳尚婷、陳尚瑜譯，台北：弘智文化事業有限公司。

← 返回作品集錦