blog:easy_lasso_logistic_regression

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Next revision
Previous revision
blog:easy_lasso_logistic_regression [2020/04/08 06:49] – created prgramblog:easy_lasso_logistic_regression [2025/07/07 14:12] (current) – external edit 127.0.0.1
Line 19: Line 19:
  
 ---- ----
 +===== =====
 빅데이터와 인공지능 시대가 와서 일반 직장인들도 머신러닝 관련 단어를 많이 듣게 되었다. 직접 분석할 필요는 없기 때문에 복잡한 수식을 알 필요는 없지만 도대체 어떤 이야기를 하는 것인지를 알고 싶은 사람들을 위해서, 빅데이터와 인공지능 시대가 와서 일반 직장인들도 머신러닝 관련 단어를 많이 듣게 되었다. 직접 분석할 필요는 없기 때문에 복잡한 수식을 알 필요는 없지만 도대체 어떤 이야기를 하는 것인지를 알고 싶은 사람들을 위해서,
  
Line 101: Line 101:
 무식하게 모든 값을 탐색해가다보면 가장 차이값을 적게 하는 값을 찾을 수도 있겠다. 설명변수 개수가 적고, 요즘 같이 컴퓨팅 성능이 좋을 때는 불가능한 일은 아닐 수도 있지만, 회귀분석은 컴퓨터라는 것이 없던 시절 나온 방법이라 사람 손으로도 계산할 수 있는 방법을 찾았다. 무식하게 모든 값을 탐색해가다보면 가장 차이값을 적게 하는 값을 찾을 수도 있겠다. 설명변수 개수가 적고, 요즘 같이 컴퓨팅 성능이 좋을 때는 불가능한 일은 아닐 수도 있지만, 회귀분석은 컴퓨터라는 것이 없던 시절 나온 방법이라 사람 손으로도 계산할 수 있는 방법을 찾았다.
  
-최소값을 구하기 윗내 고등학교 때 들어보았던, 미분과 적분 중에 **미분** 을 사용한다. (미분 적분 그거 배워서 어디에 쓰나?!) 미적분을 배우지 않은 분들을 위해 간단히 설명하자면, 보통 어떤 적절한 함수의 최대나 최소값을 구하고자 할 때 미분값=0 의 방정식을 이용한다.+최소값을 구하기 위해 고등학교 때 들어보았던, 미분과 적분 중에 **미분** 을 사용한다. (미분 적분 그거 배워서 어디에 쓰나?!) 미적분을 배우지 않은 분들을 위해 간단히 설명하자면, 보통 어떤 적절한 함수의 최대나 최소값을 구하고자 할 때 미분값=0 의 방정식을 이용한다.
  
 값은 컴퓨터가 계산해 주지만, 중요한 것은 **목적함수를 최대로 하거나 최소로 하는** 값들을 찾는 것이 지도학습의 가장 큰 축이라는 것이다. 값은 컴퓨터가 계산해 주지만, 중요한 것은 **목적함수를 최대로 하거나 최소로 하는** 값들을 찾는 것이 지도학습의 가장 큰 축이라는 것이다.
Line 225: Line 225:
  
 === 참고로 처음에 사전에서 찾아본 영어단어를 설명하면, === === 참고로 처음에 사전에서 찾아본 영어단어를 설명하면, ===
-  * 로지스틱Logistic 이라는 용어는 프랑스어 logistique 에서 왔다고 하는데, 처음 소개한 학자가 이유를 밝히지는 않았다고 한다. 예상으로는 Log의 반대라는 의미로 붙였거나, 그리스 수학의 분파 중 하나에서 따왔다는 이야기도 있다. ((https://en.wikipedia.org/wiki/Logistic_function#History)) +  * 로지스틱Logistic 이라는 용어는 프랑스어 logistique 에서 왔다고 하는데, 처음 소개한 학자가 이유를 밝히지는 않았다고 한다. 예상으로는 Log의 반대라는 의미로 붙였거나, 그리스 수학의 분파 중 하나에서 따왔다는 이야기도 있다. (([[https://en.wikipedia.org/wiki/Logistic_function#History|Wikipedia]])) 
   * 라쏘LASSO는 least absolute shrinkage and selection operator 의 줄임말로 아마 올가미로 중요한 변수들을 잡아챈다는 중의적 의미를 노리고 만든 것 같다.   * 라쏘LASSO는 least absolute shrinkage and selection operator 의 줄임말로 아마 올가미로 중요한 변수들을 잡아챈다는 중의적 의미를 노리고 만든 것 같다.
   * 릿지Ridge는 릿지 방법을 사용한 추정계수가 원래 회귀계수들을 중심으로 '등고선ridge'을 그리기 때문에 붙여진 이름이다.   * 릿지Ridge는 릿지 방법을 사용한 추정계수가 원래 회귀계수들을 중심으로 '등고선ridge'을 그리기 때문에 붙여진 이름이다.
  • Last modified: 2025/07/07 14:12