1 / 34

試驗資料或問卷資料通常有數個測值,需要同時考慮對測值的影響,有一些特殊方法可使分析的結果更清楚。介紹一些常用的方法。

多變量資料分析. 試驗資料或問卷資料通常有數個測值,需要同時考慮對測值的影響,有一些特殊方法可使分析的結果更清楚。介紹一些常用的方法。. 一、正規變量分析 (Canonical Variable Analysis) 二、正規相關性分析 (Canonical Variable Analysis) 三、重複測量資料分析 (Repeat Measure Analysis) 四、因素分析 (Factor Analysis). 一、正規變量分析.

chelsa
Télécharger la présentation

試驗資料或問卷資料通常有數個測值,需要同時考慮對測值的影響,有一些特殊方法可使分析的結果更清楚。介紹一些常用的方法。

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 多變量資料分析 試驗資料或問卷資料通常有數個測值,需要同時考慮對測值的影響,有一些特殊方法可使分析的結果更清楚。介紹一些常用的方法。 一、正規變量分析 (Canonical Variable Analysis) 二、正規相關性分析 (Canonical Variable Analysis) 三、重複測量資料分析 (Repeat Measure Analysis) 四、因素分析 (Factor Analysis)

  2. 一、正規變量分析 【例1 】研究在長期儲存期間,防腐劑對煮熟的火雞肉的影響。有 5 種處理方式:控制組、0.3% SAMP、0.5% SAMP、0.3% STP、0.5% STP。每組各準備五包,分別在5 個不同時間取出,測量出下列各值。 CKG_LOSS – cooking loss , PH – pH 值 , MOIST – moistness after cooking, FAT – fat content, HEX – hexanal content, NONHEM – iron content, CKG_TIME – the cooking time for an optimum cooking temperature 此試驗的目的是要分析此五組的差異

  3. 對每一測值分析: ANOVA → 顯著 → 對對比較 → 列出平均數及各組間的差異 不顯著 → 結論是對此測值無顯著影響 對每一測值進行分析可得到各組在各測上的結論,如果需要整體性的結論,必需找一代表性的變數;在統計上的多變量分析方法上時常用到這種想法,代表變數就是簡單的將原變數乘以不同權重相加。 因為此時的目標是多組比較,所以希望找到的代表變數有最大的分辨能力。此法稱為正規變量分析。

  4. 正規變量分析 (Canonical Variable Analysis) • 應用於多變量資料中,多組資料比較的問題。找出最能分辨出各組的差異的分量,來代表原測值做比較。 • cv1 = a1 X 1 + a2 X2 + …… + ap Xp • ………

  5. 例1對每一測值之分析 A、ANOVA 結果 對測值 PH, FAT, TIME, 五組差異不顯著

  6. B、對差異顯著的測值,以 Tukey HSD 法進行對對比較 註:對每一列,上標字母不同之各組,在α=0.05的水準下均值有顯著差

  7. 例1之正規變數分析 CV1代表此七測量值,針對CV1進行分析 CV1 = 0.38(LOSS) - 0.55(PH) - 0.4(MOIST) – 0.078(FAT) + 5.48(HEX)+ 0.43(NONHEM) – 0.19(TIME) A、 ANOVA 得到 p-值 < 0.0001,對CV1,五組有顯著差異 B、接著以 Tukey HSD法對對比較,得到下列結果。 註:CV1 和 LOSS 正相關,和 MOIST,TIME 負相關,理想狀況是 LOSS 低,MOIST 高,CV1值小較佳,如此使用 SAMP5 得到較好效果。

  8. 二、正規相關性分析 【例2 】餅乾口感與質地的相關性。 54 批餅乾依據五大項目評分,大小與顏色由機器量測,另外請品評家對外觀、質地、與口感評分,分數由0分到15分,15分代表品質最佳。下列是各項的細目。 1 (外觀): CKG, HOLES, PROTUS, CONTOUR, CELLSIZE, CELLUNIF 2 (質地): SURF_RO, LOOSE, FIRM, FRACT, CCOH, HEW, MOLAR,MOUTH 3 (口感): CARMEL, AROMA, SWEET, SALTY, VAN, SOUR, BITTER 4 (大小): SPG, W, T, RATIO, INSTRON 5 (顏色): L, A, B 此欲分析口感與質地的相關性。

  9. SAS 報表1 由上列相關係數可發現:FLAVOR1代表香甜味,FLAVOR2 代表苦鹹味; TEXTURE1代表鬆度, TEXTURE2 代表碎度。

  10. SAS 報表2 ----- CV 與各變數的相關性

  11. Canonical Correlation plot 上圖解釋香甜味與鬆度的關係,苦鹹味與碎度的關係

  12. 三、重複測量資料分析 設計 1. 選擇一樣本體,分成數組接受不同的處理,在一段時期內,分數次重複地測量處理後的反應值。 2. 重複量測設計歸類為裂區設計 (第十四章)。時間為裂區,實驗體為全區。 3. 除了時間外,實驗體的各部分、植物的葉片、位置、等都可以視為重複取樣。 • 目的 • 尋求因子的影響 • 尋求短期與長期的效應 • 找出處理產生效應的關鍵時間點 • 測試由處理所可能產生的改變

  13. 分析: • 整體分析 MANOVA ,有四方法:Pillai’s trace, Hotelling-Lawley’s Trace, Wilks’, Roy’s, • 球形檢定 (Test sphericity),即,同質性檢定。 • 檢定時間、處理的主效應,及交互作用。對同質性資料,用F-test,否則用 Greenhouse-Geisser’s 法 或 H-F 法。 • 若交互作用不顯著,比較各處理平均數的差異,及時間平均數的差異。 • 若交互作用顯著,需要分別在各時間點比較各處理平均數的差異,及在各處理比較時間平均數的差異。 • 或許可以找出對時間的直線或曲線走勢。 • Profile analysis 是幫助了解整個架構的方法。

  14. 【例 3 】An experiment involving 3 drugs was conducted to study each drug‘s effect on the heart rate of humans. At the start of the study, 24 female human subjects were randomly assigned to each drug. After the drug was administered, the heart rate was measured every five minutes for a total of 4 times.

  15. Data :

  16. 報表內容 • 整體分析 MANOVA(表1) • 同質性檢定,及時間、Drug 的主效應,及交互作用。(表2,表3) • 時間的直線或曲線走勢 (表4) • Profile analysis (表5) • 在各時間點比較各Drug 平均數的差異(表6、表7、表8) • 對各Drug 比較時間平均數的差異。(表9、表10)

  17. 表 1MANOVA 表 2同質性檢定

  18. 表 3 Main effect and interaction test

  19. 表 4 Time 之多項式檢定

  20. 表 5 對 drug 及對 time 之profile

  21. 表 6 分別對 t1~ t4,比較 drug means

  22. 表 7 分別對 t1~ t4,與 control group 之比較

  23. 表 8 分別對 t1~ t4,作 post hoc

  24. 表 9 分別對 drug,作 MANOVA

  25. 表 10 分別對 drug,作 time effects

  26. 表 11 分別對 drug,作 time 多項式檢定

  27. 分析: 1.由表 2,資料通過 Mauchly 球形檢定 (顯著值 = 0.174 ),故可使用 F-test. 2. 由表 3,Time與Drug間有顯著之交互作用 (顯著值 = 0.000 )。 3. 表5 為 hart rate 之 profile. 4. 固定time時,與 control group 之比較(表 7) Time : 1 2 3 4 . AX23 .424 .016 .003 .510 BWW9 .004 .001 .019 .006 3. 各drug, Time 之影響(表10,11) 在 AX23 group, hart rate 對 Time 有二次關係。 在 BWW9 group, hart rate 對 Time 有直線關係。 在Control group,hart rate 對 Time 無顯著影響。

  28. 軟體使用法 資料輸入:因子佔一行,每一時間的測值佔一行。 SPSS 分析 → 一般線性模式 → 重複量數 定義:變數、因子、模式、圖形、Post Hoc SAS Analysis → ANOVA → Linear Models 指定 Dependent variables、Classification variables 其餘同複因子分析,但更改 SAS Code: 在 PROC GLM之MEAN ………..; 後加 MANOVA H= drug; REPEAT TIME 4 (1 2 3 4 ) polynomial /summary;

  29. 四、因素分析 (Factor Analysis) • 一群觀測到相互之間有關係存在的變數,假設其受到背後數個因素控制,稱這些因素為共同因素(Common Factor) • 每個變數除了受共同因素的影響外,本身尚有獨特因素(Specific Factor)。 • 因素分析目標:找出潛在因素、簡化資料、以利於後續的統計分析 • 例如:智力測驗成績經因素分析後可能分成 語文能力、數學性向、空間關係、…等

  30. 因素分析步驟 • 決定共同因素的個數 • 參數估計:負荷量的估計 (方法有主成份法、主因素法、最概法…等) • 模式適合性評估--利用殘差分析與適合度 檢定模式的合適與否 • 因素旋轉—使各因素間高度不相關,以此做為因素命名或變數分組之依據 (方法有變異最大旋轉法、四方最大法…等) • 解釋各共同因素的意義

  31. 例:尋求影響五項成績的因素旋轉前後二因素的負荷( loading)

  32. 五科成績與二因素的關係 • X1 = -0.943 f1 + 0.028 f2 • X2 = -0.988 f1 + 0.0597 f2 • X3 = -0.312 f1 - 0.916 f2 • X4 = -0.462 f1 - 0.603 f2 • X5 = -0.432f1 - 0.832 f2

  33. 例、汽車經銷商為了解國人對國產車的偏見,設計問卷共13題例、汽車經銷商為了解國人對國產車的偏見,設計問卷共13題 • 1. 國產車看起來很笨重 • 2. 國產車沒有高級感 • 3. 國產車設計不佳 • 4. 國產車安全性不高 • 5. 國產車折舊率高 • 6. 國產車板金不良 • 7. 國產車沒有品味 • 8. 國產車沒有流線型 • 9. 國產車不摩登 • 10. 國產車操作不方便 • 11. 國產車外觀不吸引人 • 12. 國產車品質不佳 • 13. 國產車容易故障

  34. 參考陳順宇,多變量分析

More Related