聽說有某位實驗室的督察人員,刻意要求在檢量線旁邊一定要顯示相關係數 R ,這吸引了我的注意,這位督察(Auditor)顯然不知道顯示哪一個比較有實際意義,單純以法規作為基準,但是因為他主宰了實驗室的評鑑,多數實驗室的人為省麻煩起見,就商請儀器場商在軟體上提供顯示R 值,算是息事寧人的做法,而完成這件工作的工程師,把經常顯示的 R Square值,開平方根後顯示在報告上,這個做法雖然因為一定是正的值,會有爭議,但是也被接受了,嚴格來說,R 值是要單獨計算的,因為R 值可能有正有負。
時至今天,許多家長都因為自己的數學不好,卻把連自己都未曾做好的,繼續交給自己的子弟,拼命送小孩補習數學,我的經驗是,學數學若有天份,不費吹灰之力,若沒有上天允許,就應該放自己一馬,不失是一個不錯的決定,而台灣的數學教育,一直都未有起色,這也是大家承認的事實,但最糟的是,多數人遇到數學相關,統計相關的要求,都會先承認自己數學不好,立刻投降,你要什麼 R 值,我弄給你,你別再嚷嚷了!(我們的數學不好),只能說,放棄思考是送去補數學之後產生的最糟糕結果!
一開始的線索,是我們在EXCEL中作圖,將因變數X,自變數Y拿來做線性回歸(Linear regression),顯示的除了線性方程式之外,就是R 平方(R Square)稱為決定係數,一般檢量線要在此值大於0.995 以上的時候,才可以套用這條檢量線來計算未知物的濃度,但是那個 R 值,為什麼反而沒有顯示呢?Excel 有理由不顯示它嗎?在 Chemstation 上也一樣只顯示R square 的值,是因為相同的原因嗎?
R值是相關係數,它可以藉由公式算出,一般它介於-1 到 1 之間,可以用來判斷選定的兩個變數X, Y 是否具有相關性,線性回歸使用的範圍很廣,包括社會科學和自然科學,不相關的X, Y 折算出來的R 值,會落在- 0.5 到 0.5 之間(此時,決定係數R Square 值理應落到 0.25 以下),而且因為R值在平方之後只會有正值,可以說只需顯示 R Square 就可以同時知道相關與否,又同時知道數學模式夠不夠完善,到這裡,已經可以理解為什麼 R 值很少出現,而經常只看到 R 平方值了。
假如沒有實際的例子,大家可能無法體會R 值的實際用途,讓 R 值找不到適當的用途,所以我以社會科學為例說明一下,像黑松汽水每年都會花費相當大量的廣告費用,但是不知道是否廣告花費是否真的有效果,就可以把每年廣告費支出金額當X,而把X所在同一年的營運增長當成Y,計算過去數十年間,X, Y是否有相關性,來決定未來的廣告花費是否繼續,或是可以適度的減少,而判斷X和Y是否相關,我們使用的是R 值,用來衡量花費金額與營銷增長間是否相關。
上述故事當中,我們知道相關係數R 值,是在不知道X, Y 是否具有相關性的情況下來使用的,藉由相關係數,把認為有可能相關的 X,Y 加以驗證,但是我們做實驗時建立檢量線,是早就知道面積和濃度是正相關的,此時就不需再顯示相關係數 R 值了,相反的,我們急需要知道目前的數學模式,可不可以作為預測未知物的濃度,而這個衡量的值就是R 平方,稱為決定係數,當它大於0.995時,表示數學模式符合所需,可以用來正確計算濃度。
經過這樣的解釋,我才知道,多數人因為誤認自己數學不好,讓督察人員一要求就投降,是多麼糟的一件事,而且這些都是定義非常清楚的值,根本無關你數學的好與壞,甚至可以說這位 Auditor 的問題,還真的剛好要每個實驗室認真以對,並且獲得益處呢!要不是這位督察,我也不會去注意到這件事,所以,還是要稱讚他提出了這個問題,至少他做到了在不疑處有疑,並且堅持依照法規處理,否則,錯誤的法規條文,就不知道何時才得以被發現,並且獲得修正的機會!
當然,我自己不會主動把小孩送去補數學,一方面孩子挫折感比較小,不至於放棄思考,顯見的,假如有好的數學老師,讓大家以平凡的思考方式來面對數學,我們就不會害怕這個科學的基本工具,而所有的學科,其實都一樣,教學的最大失敗,是使學生害怕並討厭所教的那個科目,這比不教還要糟糕。
顯示R 值,是在研究問題中,尚不知道所選用的變數X,Y之間是否相關時,當X,Y 無關聯,研究必須另外尋找互相依存的變數。 若是X,Y 屬於相關的變數,我們關心的重點,是線性迴歸的數學模式,是否可以用來以自變數X 的值來預測因變數Y的值,此時驗證就以 R Square 來做標準了,文章中因為R Square 在不相關的變數 X, Y 出現時會自動落到0.25 以下,所以可以知道,相關的 X,Y 其 R Square 一定會比 0.25 還大,這免除了R 值顯示的必要性,也就是,單看R Square 就可以同時知道相關性存在,且同時數學模式是可用的兩件事。
講一個淺顯的道理,例如說:“他是一個男人“,和說:“他是兩個孩子的爹“,後一句所包含的訊息較多,而且顯然又包括前一句,所以前一句話在說後一句話的時候被自然地省略了。
在我們的觀察裡也會發現,假如相關係數 R 值很重要,但是在軟體Excel 和 Chemstation 中都選擇沒有特別列出來,但兩個軟體卻同時都列了R Square 值, 這不是很奇怪的事情嗎?
沒有留言:
張貼留言