== Principle Components Analysis [主成份分析] == **Keywords** - [[study:statistics]], [[study:multivariate_analysis|多變項分析]], [[general_linear_model|一般線性模式]] **Tags** - [[tag>statistics]], [[tag>multivariate analysis]] 屬於[[study:factor_analysis|因素分析]]中的一種。:?: 將許多自變項,依據其化約為數個變項,以減低掌握自變項與依變項間關係的複雜度。此化約的變項,即為主成份,作為代表所有自變項對依變項的影響。即,主成份分析可以用來減少變項的數量,形成新的主成份變項,而此主成份變項是由原本的自變項所計算得來的。 透過對於自變項的化簡,研究者可以有數種應用: - 更容易發現自變項與依變項間的因果關係,或對研究結果建立更佳的解釋。 - 綜合多項變數,形成指標。 * 變異數-共變異數(variance-covariance)矩陣 * 特徵值(Eigen values) = λ * 每一個特徵值(λ)對應的特徵向量(Εigen vectors) = Κ * 當λ1為第一個主成份的特徵值,亦即其為第一個主成份的變異數;λ2為第二個主成份的特徵值,亦即其為第二個主成份的變異數;λ3為第三個主成份的特徵值,亦即其為第三個主成份的變異 === 主成份數量的選取 === - 總變異比例 - 選取出的主成份能夠解釋原有變項對資料造成的總變異,具有達代表性的比例。此比例一般會定為0.8,即80%。 - 特徵值 - 選取出主成份的特徵值大於所有成份之平均特徵值者。在標準化資料的情況下,選取特徵值大於一者。 - 透過檢視特徵值排列圖(陡坡圖,sccree plot),選取開始變得平緩的點所對應的成份數量。 - 透過特定統計檢定法(Bartlett test) === 適用性 === 主成份分析的一個目的,是將一些原本互有關係的變數,轉換為互不相關的變數。因此,如果原有變數間相關性很低,那麼經過主成份分析之後,產生的主成份數量也不會太少。(林師模、陳苑欽,2006,頁141) === 與因素分析的異同 === * 相似:縮減原有變數資料 * 相異: * 主成份分析:利用原有變數,組合成新的變數,而此新的變數將儘可能解釋大部分的資料變異 * [[study:factor_analysis|因素分析]]:找出可解釋原有變數間相關性的隱藏因素或構念(construct) == References == * 林師模、陳苑欽(2006)。多變量分析:管理上的應用。台北市:雙葉書廊。