Differences
This shows you the differences between two versions of the page.
Next revision | Previous revision | ||
blog:easy_pca [2020/05/12 09:03] – created prgram | blog:easy_pca [2025/07/07 14:12] (current) – external edit 127.0.0.1 | ||
---|---|---|---|
Line 1: | Line 1: | ||
====== 차원이 문제? 주성분분석? | ====== 차원이 문제? 주성분분석? | ||
+ | {{ : | ||
이전편: | 이전편: | ||
[[blog: | [[blog: | ||
Line 132: | Line 133: | ||
- | {{ :blog:draft:pasted:20200503-153924.png }} | + | {{ : |
====구하는 법==== | ====구하는 법==== | ||
Line 244: | Line 245: | ||
가장 큰 차이점이라고 할 수 있는 것은, 라쏘나 릿지 회귀에서는 정답 데이터가 포함되는 지도학습 방법에 사용되는 것이고, 주성분분석은 정답 데이터가 없이 변수들 간의 관계만을 보는 비지도학습 이라는 것이다. 예측을 더 잘하기 위한 방법과 변수의 특성을 보전하는 방법의 차이라고 생각해도 좋을 것 같다. | 가장 큰 차이점이라고 할 수 있는 것은, 라쏘나 릿지 회귀에서는 정답 데이터가 포함되는 지도학습 방법에 사용되는 것이고, 주성분분석은 정답 데이터가 없이 변수들 간의 관계만을 보는 비지도학습 이라는 것이다. 예측을 더 잘하기 위한 방법과 변수의 특성을 보전하는 방법의 차이라고 생각해도 좋을 것 같다. | ||
- | 또한 주성분 | + | 또한 주성분분석은 |
===== Key Takeaways ===== | ===== Key Takeaways ===== | ||
지금까지 차원의 문제, 그리고 이를 해결하기 위한 주성분분석에 대해서 살펴보았다. | 지금까지 차원의 문제, 그리고 이를 해결하기 위한 주성분분석에 대해서 살펴보았다. | ||
Line 250: | Line 251: | ||
1) 차원이 늘어남에 따라 여러가지 문제가 생긴다. (과적합, 다중공선성, | 1) 차원이 늘어남에 따라 여러가지 문제가 생긴다. (과적합, 다중공선성, | ||
2) 주성분분석은 분산을 최대로 하는 선형결합들을 찾는 것이다. | 2) 주성분분석은 분산을 최대로 하는 선형결합들을 찾는 것이다. | ||
- | 3) 직교하는 축을 찾기 때문에 선형 상관관계가 없어진다. | + | 3) 모형에 사용되는 주성분들이 |
4) 선형결합들 중 원래 변수들의 분산을 가장 근접하게 설명하는 개수만큼 다른 모형 적합을 위해서 사용한다. | 4) 선형결합들 중 원래 변수들의 분산을 가장 근접하게 설명하는 개수만큼 다른 모형 적합을 위해서 사용한다. | ||
5) 중심화centering이 필요하고, | 5) 중심화centering이 필요하고, |