Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
data_analysis:statistical_cognitive_bias [2020/05/12 20:40]
prgram [조건부확률, 베이즈정리]
data_analysis:statistical_cognitive_bias [2020/06/03 20:25]
prgram [무작위 혼동]
Line 5: Line 5:
  
  
 +=== risk vs 통계학 ===
 +<​sup>​[[#​References|[17]]]</​sup>​
 +위험을 관리하는 도구로는 적절치 않다.
 +ex. Red/ Black 공 비율 추정
 +10회추출 -> 20회추출 한다고 신뢰수준이 2배가 되지 않음. -> sqrt(2) 만큼만 증가
 +Stationary 문제. (Red 공 자체가 임의로 결정된다면?​)
 +
 +=== 순진한 실증주의 ===
 +<​sup>​[[#​References|[17]]]</​sup>​
 +자동차 사고는 집 근처에서 발생 - 사고발생율이 높은게 아니라, 대게 집근처에서 운전 시간이 많은 것.
 +데이터를 사용해서 어떤 주장을 반증할 수는 있어도, 절대 입증할 수는 없다.
 +
 +=== 빈도 vs 결과 ===
 +<​sup>​[[#​References|[17]]]</​sup>​
 +  * 손실의 빈도나 확률은 그 자체로는 의미가 없음
 +    * 결과의 규모와 연계해서 평균값으로.. (기대값)
 +    * 가장 유망한 시나리오의 비중을 과대평가
 +    * 희귀사건을 공정하게 평가하지 않고 저평가함
 +
 +
 +=== 후견지명편향 ===
 +<​sup>​[[#​References|[17]]]</​sup>​
 +'​나는 처음부터 그럴 줄 알았어'​
 +이후에 얻은 정보 때문에 사건 당시 자신의 지식을 과대평가하는 현상
 +
 +
 +=== 시간과 소음 ===
 +<​sup>​[[#​References|[17]]]</​sup>​
 +뉴스에는 소음이 가득하고,​ 역사에는 없다
 +Ergodicity
 === 벅슨의 역설 === === 벅슨의 역설 ===
 A와 B 둘다 있는 사람이나,​ A와 B 둘다 없는 사람이 연구 대상에서 제외되었을 때, A-B 간의 가짜 관계가 생깁니다. <​sup>​[[#​References|[11]]]</​sup>​ A와 B 둘다 있는 사람이나,​ A와 B 둘다 없는 사람이 연구 대상에서 제외되었을 때, A-B 간의 가짜 관계가 생깁니다. <​sup>​[[#​References|[11]]]</​sup>​
Line 164: Line 194:
 엄청난 성공의 원인은 대부분 운 엄청난 성공의 원인은 대부분 운
 "​초기 모집단 규모"​가 중요 : 원숭이가 타자를 쳐서 소설을 완성했다 -> 5 원숭이 중 1면 대단하지만,​ 10^10 중 1면 ?? "​초기 모집단 규모"​가 중요 : 원숭이가 타자를 쳐서 소설을 완성했다 -> 5 원숭이 중 1면 대단하지만,​ 10^10 중 1면 ??
 +의심스러울 때는 새로운 idea, 정보, 기법을 체계적으로 거부하는 것이 최선 - 지금 우리는 실패한 신기술 빼고 성공한 기술만 보고 있음
 +
 +== 대체역사 ==
 +<​sup>​[[#​References|[17]]]</​sup>​
 +한 분야의 실적은 결과만으로 평가해서는 안되며, 역사가 다른 방식으로 진행되었을 경우의 대체 비용도 고려해야 한다.
 +Scenario Analysis, alternative Sample path, Monte Carlo simulation..
  
 == 횡단면 문제 == == 횡단면 문제 ==
Line 461: Line 497:
  
 === 무작위 혼동 === === 무작위 혼동 ===
-별의 광원 : 무작위이지만,​ 무리 짓는 성질이 있음. 듬성듬성이 무작위인 것이 아님 <​sup>​[[#​References|[11]]]</​sup>​+  * 별의 광원 : 무작위이지만,​ 무리 짓는 성질이 있음. 듬성듬성이 무작위인 것이 아님 <​sup>​[[#​References|[11]]]</​sup>​ 
 + 
 +  * reference case problem : 진정한 임의성은 이론으로만 존재할 뿐.<​sup>​[[#​References|[17]]]</​sup>​ 
 +    * 실제 데이터에 비임의성이 전혀 없으면, 인위적일 가능성. 
 +    * 무작위 데이터에는 항상 어떤 패턴이 존재. (사후검증 오류..) 
 +  * 복권에 두번 당첨될 확률은 1/17조 이지만, 누군가가 그런 행운이 생길 확률은 1/30
  
 === 부작위 편향(omission bias), 무행동 편향 === === 부작위 편향(omission bias), 무행동 편향 ===
Line 479: Line 520:
     * 특정 범주의 사례들을 기억속에서 검색할 때 쉽게 잘 되면 그 범주를 과장해서 판단 (주의를 끄는 주요사건,​ 극적 사건, 개인적 경험)     * 특정 범주의 사례들을 기억속에서 검색할 때 쉽게 잘 되면 그 범주를 과장해서 판단 (주의를 끄는 주요사건,​ 극적 사건, 개인적 경험)
     * 가사에 기여하는 비율? 합이 100이 넘음     * 가사에 기여하는 비율? 합이 100이 넘음
 +    * <​sup>​[[#​References|[17]]]</​sup>​ 전국에서 발생하는 지진보다 캘리포니아에서 발생하는 지진이 잦을 것으로 생각. 어떤 방식으로 사망할 확률보다 테러로 사망할 확률이 더 높다고 생각.
  
   * 결정가중치 <​sup>​[[#​References|[4]]]</​sup>​   * 결정가중치 <​sup>​[[#​References|[4]]]</​sup>​