Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
principle_components_analysis [2006/11/08 18:18]
Charles Chen Links to study:general_linear_model changed to general_linear_model
principle_components_analysis [2016/10/22 20:12] (current)
Line 1: Line 1:
 +== Principle Components Analysis [主成份分析] ==
 +
 +**Keywords** - [[study:​statistics]],​ [[study:​multivariate_analysis|多變項分析]],​ [[general_linear_model|一般線性模式]]
 +
 +**Tags** - [[tag>​statistics]],​ [[tag>​multivariate analysis]]
 +
 +屬於[[study:​factor_analysis|因素分析]]中的一種。:?:​
 +
 +將許多自變項,依據其化約為數個變項,以減低掌握自變項與依變項間關係的複雜度。此化約的變項,即為主成份,作為代表所有自變項對依變項的影響。即,主成份分析可以用來減少變項的數量,形成新的主成份變項,而此主成份變項是由原本的自變項所計算得來的。
 +
 +透過對於自變項的化簡,研究者可以有數種應用:
 +  - 更容易發現自變項與依變項間的因果關係,或對研究結果建立更佳的解釋。
 +  - 綜合多項變數,形成指標。
 +
 +  * 變異數-共變異數(variance-covariance)矩陣
 +  * 特徵值(Eigen values) = λ
 +  * 每一個特徵值(λ)對應的特徵向量(Εigen vectors) = Κ
 +  * 當λ1為第一個主成份的特徵值,亦即其為第一個主成份的變異數;λ2為第二個主成份的特徵值,亦即其為第二個主成份的變異數;λ3為第三個主成份的特徵值,亦即其為第三個主成份的變異
 +
 +=== 主成份數量的選取 ===
 +  - 總變異比例 - 選取出的主成份能夠解釋原有變項對資料造成的總變異,具有達代表性的比例。此比例一般會定為0.8,即80%。
 +  - 特徵值 - 選取出主成份的特徵值大於所有成份之平均特徵值者。在標準化資料的情況下,選取特徵值大於一者。
 +  - 透過檢視特徵值排列圖(陡坡圖,sccree plot),選取開始變得平緩的點所對應的成份數量。
 +  - 透過特定統計檢定法(Bartlett test)
 +
 +=== 適用性 ===
 +主成份分析的一個目的,是將一些原本互有關係的變數,轉換為互不相關的變數。因此,如果原有變數間相關性很低,那麼經過主成份分析之後,產生的主成份數量也不會太少。(林師模、陳苑欽,2006,頁141)
 +
 +=== 與因素分析的異同 ===
 +  * 相似:縮減原有變數資料
 +  * 相異:
 +    * 主成份分析:利用原有變數,組合成新的變數,而此新的變數將儘可能解釋大部分的資料變異
 +    * [[study:​factor_analysis|因素分析]]:找出可解釋原有變數間相關性的隱藏因素或構念(construct)
 +
 +== References ==
 +  * 林師模、陳苑欽(2006)。多變量分析:管理上的應用。台北市:雙葉書廊。