<address id="h9l99"><nobr id="h9l99"><meter id="h9l99"></meter></nobr></address><address id="h9l99"></address>

      <address id="h9l99"><nobr id="h9l99"><progress id="h9l99"></progress></nobr></address>
        <address id="h9l99"><nobr id="h9l99"><th id="h9l99"></th></nobr></address>

        咨詢熱線:0755-22932766 實戰(zhàn)型精益管理咨詢專家,聚焦于企業(yè)的提質(zhì)、增效、降本、創(chuàng)新,促進企業(yè)永續(xù)經(jīng)營
        精益生產(chǎn)咨詢

        利用簡單比較實驗探討顯著性檢定

        來源:華昊企管   發(fā)布時間:2020-05-19

        前言:

          當產(chǎn)品、流程或系統(tǒng)須進行改善時,負責人員常須判斷改善前后數(shù)據(jù)的不同,是由改變的效應所造成,或只是單純來自實驗誤差(experimental error)的結(jié)果,其實并無顯著差異。

          以多層陶瓷電容器﹙Multilayer Ceramic Capacitors﹚為例,內(nèi)部電極厚度﹙inner electrode thickness﹚是網(wǎng)版印刷﹙screen printing﹚製程中相當重要的的品質(zhì)特性,在“相同”的製程條件設定與生產(chǎn)環(huán)境下,不同生產(chǎn)批次所量測的內(nèi)部電極厚度數(shù)據(jù)自然就有不同程度的差異。因此當製程工程師須比較供應商所提供的新型網(wǎng)版與現(xiàn)行網(wǎng)版對內(nèi)部電極厚度是否有不同的效果,進而安排并進行實驗后,緊接著就要面臨如何分析實驗數(shù)據(jù),才能合理推斷兩種網(wǎng)版在印刷製程中對內(nèi)部電極厚度所造成的效果有顯著差異,或是實驗觀察的結(jié)果只是來自實驗誤差的決策問題。

          此時,顯著性檢定(significance testing),又稱為假設檢定(hypothesis testing),就在協(xié)助我們針對類似上述的效果比較問題,選擇適當?shù)臋z定統(tǒng)計量及運用對應的抽樣分配,在可容忍的錯誤機率前提下,判斷實驗因子水準(如新型網(wǎng)版與現(xiàn)行網(wǎng)版)改變后的結(jié)果,是否存在值得我們注意的顯著性差異。

        實驗誤差:

          在正式介紹顯著性檢定的程序之前,先說明實驗中產(chǎn)生誤差的必然性。

          當實驗在盡可能相同的條件下重複進行,其實驗結(jié)果的數(shù)據(jù)不會完全相同,這種在重複實驗情形下所產(chǎn)生的波動稱為實驗誤差。實驗誤差是由系統(tǒng)的機遇變異原因(chance cause)所造成,是無法避免的,比如:量測儀器和實驗設備有限的精度、環(huán)境溫度與濕度的細微變化、材料本身的純度問題、以及操作人員的技術等都可能是造成實驗誤差的因素。

          因此實驗者必須認知實驗誤差的存在,對實驗誤差與相對應的機率理論,﹙根據(jù)中央極限定理,實驗誤差會近似常態(tài)分配﹚,要有基本的了解,才能建立將來學習實驗設計與分析所必備的扎實基礎。但在這里要特別注意實驗“誤差”不同于實驗“錯誤”,比如:實驗條件設定錯誤、看錯或記錯量測數(shù)據(jù)、操作程序或量測程序錯誤、用錯材料等。

        統(tǒng)計量﹙statistic﹚與抽樣分配﹙sampling distribution﹚:

          因為實驗誤差的存在,實驗的反應變數(shù)(response variable),如內(nèi)部電極厚度,是一個隨機變數(shù)(random variable),其機率結(jié)構(gòu)可用機率分配(probability distribution)來表示。實務上,隨機變數(shù)機率分配的平均值﹙μ﹚或變異數(shù)﹙σ2﹚等母體參數(shù)(population parameter)的真值是未知的,必須利用隨機樣本觀測值,透過樣本平均值﹙﹚或樣本變異數(shù)﹙s2﹚的公式,計算得到樣本平均值或樣本變異數(shù)來推估平均值或變異數(shù)等母體參數(shù)的真值。

          統(tǒng)計量定義為隨機樣本觀測值的函數(shù),用來推論未知母體參數(shù),因此, 和s2均是統(tǒng)計量。而統(tǒng)計量的機率分配稱為抽樣分配,常態(tài)分配、t分配、卡方分配、F分配等都是常見的抽樣分配。(只要知道隨機樣本是來自何種類型的母體分配,通常就能夠決定統(tǒng)計量是屬于哪一種類型的抽樣分配,細節(jié)可參閱相關的統(tǒng)計推論書籍﹙1﹚。)

        新型與現(xiàn)行印刷網(wǎng)版的簡單比較實驗:

          在不影響多層陶瓷電容器相關電性與內(nèi)部電極連續(xù)性的前提下,製程工程師希望其內(nèi)部電極厚度可以愈薄愈好,如此便可以減少內(nèi)電極膏的單位使用量,進而降低產(chǎn)品單位成本。因此當供應商提供聲稱可以有效降低內(nèi)部電極厚度的新型網(wǎng)版時,製程工程師便針對現(xiàn)行網(wǎng)版與新型網(wǎng)版安排并進行完全隨機實驗﹙completely randomized design﹚,分別蒐集10批內(nèi)部電極厚度數(shù)據(jù),如表1。

         表1:新型網(wǎng)版與現(xiàn)行網(wǎng)版內(nèi)部電極厚度的實驗數(shù)據(jù)﹙um﹚

          這種單純比較兩種條件﹙新型網(wǎng)版與現(xiàn)行網(wǎng)版﹚的實驗,通常稱為簡單比較實驗。

        分別計算兩種不同種類網(wǎng)版其內(nèi)部電極厚度樣本平均值︰

        新型網(wǎng)版內(nèi)部電極厚度樣本平均值

        現(xiàn)行網(wǎng)版內(nèi)部電極厚度樣本平均值

          因為在正常的生產(chǎn)過程中,批與批之間的數(shù)據(jù)本身就有不同程度的差異,即使兩種網(wǎng)版內(nèi)部電極厚度平均值之間有差異,但是否大到足以顯示兩種網(wǎng)版所造成的效果確實有差異,或是實驗觀察的差異只是來自實驗誤差,也許兩種網(wǎng)版其實效果相同。顯著性檢定便是可以幫助工程師回答此問題的一種統(tǒng)計推論方法。

        顯著性檢定(significance testing):

          西元1933年,由波蘭人奈曼(Jerzy Neyman, 1894-1981),及英國人皮爾生(Egon Pearson, 1895-1980),提出著名的奈曼-皮爾生引理(Neyman - Pearson lemma), 奠定了一套假設檢定的架構(gòu)。

        基本上顯著性檢定可以按照以下的步驟進行

        1. 陳述虛無假設與對立假設

        2. 選擇顯著水準

        3. 隨機抽取樣本

        4. 計算檢定統(tǒng)計量與相對應的p值

        5. 決定“拒絕”或“接受” 虛無假設

        現(xiàn)在就簡要的介紹每一個步驟

        陳述虛無假設與對立假設︰

          以本文個案為例,雖然供應商宣稱在相同的製程條件下,使用新型網(wǎng)版可以降低內(nèi)部電極厚度,但我們先假設兩種網(wǎng)版對內(nèi)部電極厚度的效果沒有差異,再蒐集隨機樣本,從隨機樣本中判斷是否有“不尋常的證據(jù)”足以“拒絕”原先的假設,否則便“接受”原先的假設。

          現(xiàn)在把它轉(zhuǎn)換成統(tǒng)計假設問題,首先須陳述虛無假設(null hypothesis),以Ho表示,通常虛無假設表示無差異,而對立假設(alternative hypothesis)則表示有差異,以Ha表示。正式的陳述方式如下:

         

          雖然我們想證明Ha是真的,然而除非證據(jù)夠強,否則不輕易“拒絕”虛無假設,因為“拒絕”虛無假設時,通常就代表要改變現(xiàn)狀,也就是要採用新型網(wǎng)版取代現(xiàn)行網(wǎng)版,當然在作決策前須考慮得更周全。因此要從樣本中判斷是否有“不尋常的證據(jù)”足以“拒絕”原先的假設,只是尋常與不尋常要如何區(qū)隔呢?而其中的關鍵就在于機率。

        選擇顯著水準:

          顯著水準﹙α﹚就是以機率值來表達,用來量化需要多幺“不尋常的證據(jù)”,才能拒絕虛無假設,也就是當隨機抽樣樣本出現(xiàn)的機率值小于α時,便可以拒絕虛無假設,常用的顯著水準有0.1,0.05,及0.01等,顯著水準愈小,代表需要愈“不尋常的證據(jù)”,才能否定虛無假設。

          在本案例中,製程工程師指定顯著水準α=0.01,表示隨機抽樣樣本出現(xiàn)的機率值小于0.01的事件,可以被視為是機率理論中的小機率事件,也就是長期而言,這樣的事件應該在100次試驗中平均最多出現(xiàn)一次,因為出現(xiàn)的機率相當?shù)?,代表實際上不太可能會發(fā)生,而如果在一次的隨機抽樣中就出現(xiàn)了,便是“不尋常的證據(jù)”,因此懷疑原先假設的合理性,進而“拒絕”虛無假設。

        隨機抽取樣本

          顯著性檢定假設實驗觀測值是獨立隨機變數(shù)﹙independent random variables﹚,只要以隨機方式安排實驗進行順序,通常就可以滿足此一假設。本文案例的實驗順序便是以隨機方式安排進行,如表2。

        表2:以隨機方式安排實驗進行順序

        計算檢定統(tǒng)計量與相對應的p值:

          如圖1所示的盒鬚圖﹙box-and-whisker plot﹚,可以讓實驗者輕易快速的看出兩種網(wǎng)版的內(nèi)部電極厚度數(shù)據(jù)的變異程度大致上是相同的。(兩母體的變異數(shù)是否有顯著性差異,可以利用F統(tǒng)計量進行檢定,細節(jié)可參閱相關的統(tǒng)計推論書籍﹙1﹚。)

         圖1:新型網(wǎng)版與現(xiàn)行網(wǎng)版內(nèi)部電極厚度的盒鬚圖

          如果新型網(wǎng)版與現(xiàn)行網(wǎng)版內(nèi)部電極厚度的變異數(shù)無顯著性差異,便可以利用to統(tǒng)計量來比較兩母體平均數(shù)。

          其中是樣本平均值,n1n2是樣本數(shù), 是共同變異數(shù)(common variance) 的估計量,其公式為

          其中是樣本變異數(shù),利用表1的實驗數(shù)據(jù),可以得到檢定統(tǒng)計量

         

         

          如果Ho為真時,則to檢定統(tǒng)計量的抽樣分配就是符合自由度為n1+n2-2的t分配,也就是利用t分配,可以描述to檢定統(tǒng)計量的機率規(guī)律行為。

          因為to=-6.14,自由度為18,運用EXCEL軟體內(nèi)建的t分配統(tǒng)計函數(shù),TDIST(x,degrees_freedom,tails),{ 其中x=to=-6.14,degrees_freedom=自由度=18,tails=1表示回傳單尾分配,tails=2表示回傳雙尾分配,本例為雙尾檢定,因此選擇tails = 2 },依序輸入函數(shù)內(nèi)所需之數(shù)值后,可以輕易計算得到比出現(xiàn)to=-6.14更極端值的累積機率值,也就是p值=0.000008。{ 因為tails = 2,TDIST 以 TDIST = P(|X| > x) = P(X > x or X < -x) 來計算 }。

        決定“拒絕”或“接受”虛無假設

          在本案例中,指定顯著水準α=0.01,因為計算得到p值=0.000008小于α,根據(jù)上述小機率事件不應該在一次試驗中就出現(xiàn)的原理,也就是說,如果Ho為真時,不應該會出現(xiàn)這樣“不尋常”的實驗結(jié)果,因此懷疑原先假設的合理性,進而“拒絕”虛無假設,所以推論新型網(wǎng)版與現(xiàn)行網(wǎng)版內(nèi)部電極厚度的平均值有顯著性差異。

        { 另一種情形,如果根據(jù)實驗結(jié)果計算得到p值大于α,則代表樣本未能提供顯著的證據(jù),不能“拒絕”虛無假設,只好“接受”虛無假設 }。

        兩種錯誤類型

          依據(jù)實驗數(shù)據(jù)所推論顯著性檢定的結(jié)果,不論是接受或拒絕虛無假設都有可能會犯錯誤,以誤判的類型而言,事實上有兩種可能錯誤的機率,如表3,一種是當虛無假設為真時,應該接受它,卻拒絕它,稱為第一類型錯誤,另一種則是虛無假設不為真時,應該拒絕它,卻接受它,稱為第二類型錯誤。

        表3:第一類型錯誤與第二類型錯誤

          第一類型錯誤,以希臘小寫字母α表示,就是前述檢定的顯著水準,因為在檢定的程序中可以事先指定,所以是我們可以直接控制的錯誤風險。當檢定計算所得的p值小于α值時,因為認定如果虛無假設為真時,不應該會出現(xiàn)這樣的抽樣結(jié)果,所以便決定“拒絕”虛無假設,但是當我們做這樣的決策時,必須理解雖然發(fā)生的機率相當?shù)?,仍?ldquo;有可能”會發(fā)生,因此有可能我們做了錯誤的決策,這就是所謂的第一類型錯誤。為儘量避免造成這種錯誤,因此要採取較保守的α值,也就是0.1,0.05,或0.01,當考量第一類型錯誤所衍生的負面后果可能愈嚴重時,就要指定愈小的α值。

          第二類型錯誤,則是以希臘小寫字母β表示。而當虛無假設不為真時,可以正確的“拒絕”虛無假設的能力則稱為檢定力﹙power of test﹚,也就是1減去發(fā)生第二類型錯誤的機率,亦即檢定力=1-β,一般建議檢定力至少為0.8。在指定顯著水準﹙α﹚后,在相同的樣本數(shù)下,β值會直接受到檢定對象的效果差異量﹙effect size﹚的影響,效果差異量愈大,愈容易被發(fā)現(xiàn)其存在顯著差異,β值就愈低,檢定力也就愈高,﹙因為檢定力與β兩者機率值互補正好為100%﹚,如表4。

        表4:雙尾t檢定,顯著水準﹙α﹚=0.01,樣本數(shù)n1n2=10,在相同的樣本數(shù)下,效果差異量愈大,發(fā)生第二類型錯誤的機率愈低,檢定力也就愈高。

          因此,為確保有足夠的檢定力可以發(fā)現(xiàn)檢定對象特定的效果差異量,就要先計算需要抽取的隨機樣本數(shù)大小,方能避免β值過高,如圖2。

        圖2︰雙尾t檢定,顯著水準﹙α﹚=0.01 ,為確保檢定力至少為0.8,預期偵測的效果差異量﹙﹙μ1-μ2﹚∕σ﹚與樣本數(shù)之關係。

        結(jié)語:

          在真實的隨機世界中所提出的統(tǒng)計假設是否為真,通常都無法百分百確定,只能在現(xiàn)實的條件中,儘可能的減少誤判的機率。雖然理想狀況是希望兩種錯誤機率皆為0,但通常不存在這種情形,所以進行假設檢定時,要事先考慮可以容忍的推論錯誤機率,以做為判定“拒絕”或“接受”虛無假設的準則。

          而顯著性檢定是以保護虛無假設為原則,因此欲“拒絕”虛無假設,必須掌握“不尋常的證據(jù)”,也就是不應該在一次試驗中就出現(xiàn)的小機率事件,i.e. p值<顯著水準α,發(fā)生的機率要夠小才能稱為顯著,除非有顯著的差異,否則寧可維持現(xiàn)狀。

          當“拒絕”虛無假設,認定有顯著性差異時,還要分辨統(tǒng)計顯著性﹙statistical significance﹚與實務顯著性﹙practical significance﹚之間的區(qū)別。如果觀測的的差異效果,大到某種程度,單純靠機遇或?qū)嶒炚`差產(chǎn)生這種結(jié)果的機率很小,也就是差異效果的發(fā)生并非偶然時,就稱此差異效果有統(tǒng)計顯著性。而實務顯著性則是指差異效果在真實的世界中是可以產(chǎn)生實際效用。

          因為只要樣本數(shù)足夠大,即使是沒有實務效益的微小差異也會造成統(tǒng)計顯著性。因此當檢定結(jié)果有統(tǒng)計顯著性差異時,還要特別注意其差異在真實的世界中是否有實質(zhì)意義,也就是要可以反映技術或應用上的具體改善效益等。

        參考文獻:

        1. Montgomery, D. C. ,and Runger, G.C. ﹙2003﹚. Applied statistics and probability for engineers,Wily, New York.

        欧美亚洲日韩成人综合网,大陆免费成人av,caoporn成人在线,成人性爱视频免费在线观看 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();