量表的統計分析、因素分析、項目分析(檢驗信、效度)

由於依照研究者的研究目的之不同,所採取的方法也有所不同。在我研究的題目中,我已先從文獻中歸納出幾個測驗的向度,因此採取的順序是:

  1. 專家效度(配合專家與文獻擬定出量表預試初稿)
  2. 項目分析(依照預試初稿的向度進行項目分析)
  3. 效度分析(因素分析,檢驗統計上的向度與初稿的向度是否符合)
  4. 修正後再次進行因素分析,檢驗解釋量是否符合統計的限制。確認效度
  5. 進行信度分析,檢驗各向度的Cronach α值是否符合統計的限制。確認信度

信度部份可以採取「Cronach α」係數,它是「內部一致性係數」的一種。在計算時,不需要將題目折半,是各測驗題目間一致性而定其信度係數高低。


項目分析

本研究項目分析採取臨界比(CR值)也就是「決斷值」的檢驗方式。以spss12為統計分析工具。

操作

分析(A)>比較平均數法(M)>獨立樣本T檢定(T)

因為決斷值必須要在每個向度中分別計算,因此每個向度都要做一次臨界比。

因此需要利用轉換(T)>計算(C)的指令,計算每個樣本(問卷資料)在此向度題目之總分。

如果有「負向敘述題」則必須利用重新編碼(R)進行轉碼。

開啟計算(C)後,在目標變數(T)此格中填入你加總之後存放分數的變數名稱(如Allscore)。而在數值運算式(E)中將你的向度所有題目分數做加總。

作法類似excel的算式,例如:v1+v2+v3……

或是:sum(v1 to V10)

完成後會產生一個新的變數儲存你的加總,本例中是:「Allscore」

再來使用轉換(T)>Visual Bander(B)指令進行分組。將變項Allscore移到帶狀變數(B)欄位,點下繼續,進入帶狀變數第二層設定,並自行命名你的分組變數名稱,如:「group」,接著選擇製作分割點(M)功能,選擇以掃描的觀察值為基礎的相等百分比位數(U),將分割點數目改為「2」,如此就會將你設定的Allscore分數轉換為三組,其中編碼值1代表「低分組」,編碼值2代表「中分組」,編碼值3代表「高分組」。

最後開始進行項目分析,分析(A)>比較平均數法(M)>獨立樣本T檢定(T)將欲進行項目分析的題目選入檢定變數(T),然後點選定義組別(D),組別1填入3(代表高分組),組別2填入1(代表低分組)。接著按下確定,統計結果就會輸出。

解釋

首先第一個表「組別統計量」可以從個數看出高分組多少人,低分組多少人。

而第二個表才是重點「獨立樣本檢定」可以看出這個向度中每一題臨界比值(CR值)。要判讀第一個要先看題目的「顯著性」。

若是此題的顯著性<.05(p<.05)代表要看不假設變異數相等這行的t值。

相反地如果顯著性>.05(p>.05)則t值要看假設變異數相等的這行。

界定好每一題的t值之後,就要檢驗每題的t值是否超過慣例的3.5標準,若是超過代表具有良好的鑑別度,可以保留為正式量表使用。

撰寫

我的表格撰寫方式是以:向度、題號、題目、決斷值,來敘寫統計的結果。並且指出最高、最低的決斷值,並指出有無超過慣例的標準值3.5。


因素分析

因素分析在本研究中,用以檢定是否經由專家與文獻探討後設計的預試初稿,經由統計方法後會有相同的因素(用來檢測出向度)。

操作

將問卷資料讀入spss後,分析(A)>資料縮減(D)>因子(F)將題目選入變數(V)方格中。

開啟描述性統計量(D),點選單變量描述性統計量(U)、未轉軸之統計量(I)、係數(C)、行列式(D)、KMO與Bartlett的球形檢定(K)、重製的(R)、反映像(A)七項統計量。

接著開啟萃取(E)選擇「主軸因子法(principal axis method)」抽取因素,則保留特徵值大於1的因素(也可以直接指定要萃取幾個向度),點選未旋轉因子解(F)及陡坡圖(S)。

接著開啟轉軸法(T)以Equamax轉軸法(E)進行因素轉軸工作,並點選轉軸後的解(R)最後點選繼續回到上一選單。

最後開啟選項(O),界定缺失值的處理方式與結構負荷量的輸出方式。可以用平均數置換(R)來處理缺失值(Lio:當然如果研究需要嚴謹,可能有缺失值的資料就不應該列入了),並且選擇依據因素負荷排序(S)以因素負荷的高低來排序,也可選擇絕對值捨棄之下限(U)並界定下限的值(預設是1.0)

解釋

  • 敘述統計

首先第一個敘述統計的表格顯示的是各題目的平均數、標準差、分析個數與遺漏值。分析個數就是樣本的數目,遺漏值就是有缺失的樣本。由於我們之前選擇用平均數置換(R)來處理缺失值,因此遺漏值會依照此法處理。有一說法是如果樣本數目很大,其實可以將有遺漏值的樣本剔除。因此,這些都端看研究者的研究處理,也就是case by case。

  • 相關矩陣a

第二個表格是相關矩陣a,此表的目的在於讓你可以看出資料是否適合進行因素分析。

首先要檢查各變項間的相關係數是否至少與一個以上變項的相關係數在.30以上。(如果偏低則要找出共同因素將很困難)

其次檢驗最底下顯示的行列式值(determinant),此值不可以為0,若為0代表兩個變項間出現完全線相依,也就無法求出相關矩陣的逆矩陣,無法計算特徵值。

若是值太接近0,代表具有高度線相依,雖可以求出行列式值,但會警告該相關矩陣是ill-condition,也不適合因素分析。

也就是說變項間相關太低(.30以下),因素分析不理想,不好找出共同因素。

變項間相關太高(.85以上),會出現ill-condition,也不適合因素分析。

萬一相關太低,處理方式也許是要重新設計題目(or量表)。

萬一相關太高,則可以將相關係數太高(.85以上)的題目捨去,再進行因素分析。

  • KMO與Bartlett檢定

KMO值越接近1,代表淨相關係數越低,代表抽取共同因素的效果越好。

以下為KMO值的判斷標準

KMO統計量值
決策標準

.90以上
極佳

.80以上
有價值的

.70以上
中度的

.60以上
不好不壞的

.50以上
可憐的

.50以下
無法接受的

Bartlett值的部份要看是否達到顯著(大部分都會達到.000)。

從以上兩種數值可以總和的來看是否適合進行因素分析。

  • 反映像矩陣

此表目的一樣在檢定是否適合進行因素分析。

首先看各變項兩兩配對的逆映像相關係數越低,表示越適合進行因素分析。

再看對角線右上角有個a的數值,代表每一個變項的取樣適當性指數,越接近1代表越適合,越接近0代表越不適合因素分析。

  • 共同性

初始代表原始的共同性越高代表它與其他變項共同特質越多。

萃取代表經過主軸因子(在本研究採取的是主軸因子)抽取因素後的共同性越高代表它與其他變項共同特質越多。

越接近1代表在項目分析中的效度指標越好,可以作為某一題目保留或是修改的標準之一。

  • 解說總變異量

此表要看轉軸平方和負荷量,看萃取幾個因素的累積解釋量,以社會科學的研究來說,達到60%以上為宜。

預設會以保留特徵值1以上的因素為最後的共同因素,但實際上最好還是參考陡坡考驗再決定。

  • 因素陡坡圖
  • 因子矩陣a
  • 重製相關

以上兩個表要看的重點在於最下面備註的:絕對值大於0.05的非多餘殘差數量。殘差愈大,表示所抽取的因素愈不能配適原來的資料。所以此值的百分比越低越好。

  • 轉軸後的因子矩陣a

本表主要目的在於將各變項在同一因素上負荷量最高的歸類在一起。

所需要注意的地方有:

  1. 結構負荷量有無達到.35以上。
  2. 同一變項有無同時在一個以上因素的結構負荷量高。
  3. 若是反向題他在因素上的結構負荷量應該與正向題相反。

在第一點上,可以將結構負荷量低的題目刪去。

第二點上,可以將同時在一個以上因素的結構負荷量高的變項刪去(除非它在你的問卷、量量表中,此題測驗出不可缺的關鍵因素),或是由文獻探討或專家商議決定歸類到哪個因素中。

撰寫

在撰寫因素分析資料時,可以將題號與轉軸後的因子矩陣,其中因子的因素負荷量列出。最底下並且列出解釋變異量及累積的變異量。

如若其中包含有同一變項同時在一個以上因素的結構負荷量高於.35(若要嚴謹可再提高)可以考慮刪除。刪除後再進行一次因素分析,再列出因子負荷量。完成後發揮想像力與創造力將因素命名。

31 Responses to 量表的統計分析、因素分析、項目分析(檢驗信、效度)

  1. 匿名 says:

    請問臨界比是決斷值或是T值嗎?

  2. 愛睏文 says:

    請問,關於CR值的判定標準是如何界定出來的?
    為何是慣例3.5?是由學者建構或提出的嗎?

    • liochangtw says:

      這個應該一般來說皆是以3.5為慣例
      但是你可以依照你研究需求去取更極端的值。

      因為所謂的CR值的檢定,亦即是差異性檢定,主要利用t檢定來找出題目之間的鑑別度,
      而作法乃是以前後27%(這也是習慣上取的27%)的樣本來做比對,也就是
      找出極端的兩組比對差異,藉此找出是否具有鑑別度。

      網路上可以可以看到很多人會以題目為專家設計,因此省略此一步驟(cr值)。如果你
      自認為你題目的設計乃是找「專家」(例如你的指導教授……)設計,那就應該絕對具有
      鑑別度,也就可以省略此步驟。

  3. 匿名 says:

    請問在撰寫的時候,解釋變異量是要看轉軸前還是專軸後的呢?

  4. 匿名 says:

    您好,感謝解答
    進一步想請問的是,撰寫特徵值、解釋變異量和累積變異量時,
    是不是統一都看轉軸平方和負荷量的數據呢?

  5. 匿名 says:

    您好,
    文中的兩段句子
    1."第二點上,可以將同時在一個以上因素的結構負荷量高的變項刪去(除非它在你的問卷、量量表中,此題測驗出不可缺的關鍵因素),或是由文獻探討或專家商議決定歸類到哪個因素中。"
    2."包含有同一變項同時在一個以上因素的結構負荷量高於.35(若要嚴謹可再提高)可以考慮刪除"
    請問同一變項同時在一個以上因素負荷量高(多高?), 是要刪除嗎?還是商議後歸類?理由?

    謝謝!

  6. tsai says:

    您好,
    請問同一變項在一個因素以上有高負符量時(多高?), 要刪除還是保留?理由為何?

    謝謝

  7. tsai says:

    您好,
    文中兩段句子
    1."第二點上,可以將同時在一個以上因素的結構負荷量高的變項刪去(除非它在你的問卷、量量表中,此題測驗出不可缺的關鍵因素),或是由文獻探討或專家商議決定歸類到哪個因素中。"
    2."如若其中包含有同一變項同時在一個以上因素的結構負荷量高於.35(若要嚴謹可再提高)可以考慮刪除。刪除後再進行一次因素分析,再列出因子負荷量。"

    都提到一變項同時在一個以上因素有高負符量, 太高(>0.35), 是否就"一定"要刪除?

    謝謝

    • liochangtw says:

      其實我寫得很清楚啊,如果在一個以上因素結構負荷量都高,就代表一件事,就是你這個問題可能包含一個以上你想要問的因素,因此會造成此情況。
      你有兩種選擇:
      一、這樣的題目有誤,所以刪除,再做一次因素分析。(建議選項,這樣做比較嚴謹)
      二、這問題太重要了,絕對不能刪除,與專家(如指導教授)商議後,決定歸類為某一因素。(比較鴕鳥的做法)

  8. 王貞妃 says:

    老師,您好,
    想請問一下"轉軸後的成份矩陣a"排序中出現負值,不知題目所構成的因子該如何分類?
    或是該怎麼做?

    麻煩您解答了,謝謝。

    • liochangtw says:

      建議你去搜尋因素分析的文章多讀幾篇,先瞭解「什麼是因素分析,為什麼這麼分?這個統計方法是在做什麼的……」,另外,無論正負值都要記入。你題目構成的因子該是你在做統計時,就會知道啊,不然你怎麼做的統計?

  9. 引用通告: 主成分分析(Principal Component Analysis)與因素分析(Factor Analysis) – 服務科學的分子廚房 Molecular Service Science

  10. 王思涵 says:

    文中寫道「界定好每一題的t值之後,就要檢驗每題的t值是否超過慣例的3.5標準,若是超過代表具有良好的鑑別度,可以保留為正式量表使用。」


    如果T值都是負數(ex.-16.674),請問要如何說明?

    • liochangtw says:

      首先你要先確定p值<.05(或是你設定的顯著值,不過通常是.05),有小於.05才是顯著差異,t值代表的不過是兩組間是前者平均大於後者(值為正),後者平均大於前者(值為負),所以你要思考的是統計結果與現實中你設計的題目間的關聯為何,這樣說你懂嗎?

  11. Irene says:

    您好,想請教一下您在解說總變異量的部分
    您寫到「以社會科學的研究來說,達到60%以上為宜」
    不知道有沒有什麼出處或原文依據能提供呢?
    謝謝您!

    • liochangtw says:

      其實在這方面並沒有一定的文獻如此證實(也沒有文獻敢肯定這樣說),只能說是一種慣例,就好像高中低三組怎麼分?
      習慣會用平均法,但有文獻支持這樣分嗎?相信也是沒有的……。

      再者,在社會科學中60%已經可以代表一定的意義了,當然愈高是更好。
      反之,如果連60%都達不到,那就根本沒什麼好說的了。

      詳細相關文獻,還是要你自己去搜尋。

      以上。

  12. Zoey says:

    您好,這篇博客寫的真好,獲益匪淺,太感謝您了。
    我想請教下,我做出的相關矩陣 a.determinant = 1.56E-6,數值十分小,是否說明我的問卷題目不適合做factor analysis?
    謝謝您。

  13. 匿名 says:

    您好,想請問跑因素分析之前有無將反向題record是否會影響到分析結果呢?

  14. 匿名 says:

    進行項目分析時,出現"無法計算 t,因為兩個組別的 標準差皆為 0。"。那麼應增加預試樣本數嗎?

    • liochangtw says:

      我們這麼說吧!你的問題很有可能有標準答案(例如:我們住的地方是( )? 答案當然是「地球」,不管那一組中答案都相同),在不同分組中根本沒有差異性,因此當然標準差是0,或是說你的題目有可能根本沒有鑑別度。所以你應該去找你的專家(指導教授)看看你的
      問卷題目設計是否出了問題。

  15. Annie says:

    老師您好:想請教您決斷值若為負數該怎麼辦?

回覆給liochangtw 取消回覆