data_analysis:data_mind

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
data_analysis:data_mind [2020/02/12 01:25] – ↷ Links adapted because of a move operation prgramdata_analysis:data_mind [2025/07/07 14:12] (current) – external edit 127.0.0.1
Line 30: Line 30:
       * 수영장 크기 기준은 각 레인의 길이 오차를 3cm 로 정하고 있습니다. 이는 수영선수가 천 분의 1초 동안 나아갈 수 있는 길이의 열 배가 넘습니다.       * 수영장 크기 기준은 각 레인의 길이 오차를 3cm 로 정하고 있습니다. 이는 수영선수가 천 분의 1초 동안 나아갈 수 있는 길이의 열 배가 넘습니다.
   *  [[http://techneedle.com/archives/29799|2017년 5대 빅데이터 트렌드]]   *  [[http://techneedle.com/archives/29799|2017년 5대 빅데이터 트렌드]]
-      * +      * 사이버 보안강화, Apach Spark, Deep Learning, Cloud, Forecasting
- 사이버 보안강화, Apach Spark, Deep Learning, Cloud, Forecasting+
       * 그러나..새로운 기능을 추가하였을 때 클릭이 줄어들었다면 그 기능을 사람들이 싫어한다고 결론을 내릴 수는 없다. 새로운 기능에 대해 사람들이 모르고 있을 수도 있고, 기능을 사용하는 버튼의 모양이 마음에 안 들 수도 있으며, 시대를 앞선 기능이어서 몇 개월 후에야 사람들이 좋아할 기능일 수도 있다. … 빅데이터 처리가 여러 오픈소스 프로젝트 등에 의해 쉬워질 수록, 앞으로 빅데이터 처리 기술 보다는 데이터를 활용하고 해석하는 능력이 더 중요해 질 것이다.       * 그러나..새로운 기능을 추가하였을 때 클릭이 줄어들었다면 그 기능을 사람들이 싫어한다고 결론을 내릴 수는 없다. 새로운 기능에 대해 사람들이 모르고 있을 수도 있고, 기능을 사용하는 버튼의 모양이 마음에 안 들 수도 있으며, 시대를 앞선 기능이어서 몇 개월 후에야 사람들이 좋아할 기능일 수도 있다. … 빅데이터 처리가 여러 오픈소스 프로젝트 등에 의해 쉬워질 수록, 앞으로 빅데이터 처리 기술 보다는 데이터를 활용하고 해석하는 능력이 더 중요해 질 것이다.
   *  [[https://brunch.co.kr/@cojette/30|지표를 바르게 사용하는 법]]   *  [[https://brunch.co.kr/@cojette/30|지표를 바르게 사용하는 법]]
Line 92: Line 91:
       * 표준편차가 뭔데?: 만약 회사의 임금구조가 상하 간의 격차가 너무 크다는 점을 강조하고자 할 때 이를 말하는 방법은 두가지 정도가 생각나네요… \\ 경우 1 : 현재 우리 회사의 연봉수준은 최고치 1억 2천, 최저치 8백, 평균은 4천 5백, 표준편차 6백으로서 격차가 광범위합니다… \\ 경우 2 : 우리 회사에서 가장 높은 연봉을 받으시는 분은 1억 2천만원 부근이고, 가장 적은 분은 8백만원입니다. 상당히 격차가 큰데, 통계수치를 계산해 봤더니 평균은 4천 5백이었고 표준편차는 6백만원으로 나왔습니다… \\ 두 경우 중 어느 쪽이 좋다고 생각하십니까? 개인적인 생각이지만 저는 두번째 경우가 좋습니다. 똑 같은 표준편차라는 말을 하면서도 사용하기에 따라 얼마든지 달라질 수 있는 것이지요. 하긴 표준편차라는 말 굳이 사용할 필요도 없지만… \\ 그러기에… 통계수치를 들먹여야 할 경우에도 언제나 듣는 사람이 알아듣기 쉬운 말로, 때로는 조금 오류가 있는 설명을 붙이는 것도 필요한 것입니다. \\ 선형회귀분석에서는 언제나 가장 먼저 ANOVA 분석으로 모델 자체의 적합성을 검정하고, 다음으로는 각 회귀계수를 추정하죠? 이럴 때 엄격한 통계적해석을 고집하면 별로 설명할게 없어집니다. 기껏 돌렸더니 회귀계수가 유의하지 않으면 어떡할 겁니까? 그렇더라도 설명을 할 때는 ‘이 요인이 하나 올라갈 때 전체적으로 어느 정도의 상승효과가 있다…’ 식으로 가끔은 거짓말도 하여야 하는 것이죠… 말… 쉽게 합시다…       * 표준편차가 뭔데?: 만약 회사의 임금구조가 상하 간의 격차가 너무 크다는 점을 강조하고자 할 때 이를 말하는 방법은 두가지 정도가 생각나네요… \\ 경우 1 : 현재 우리 회사의 연봉수준은 최고치 1억 2천, 최저치 8백, 평균은 4천 5백, 표준편차 6백으로서 격차가 광범위합니다… \\ 경우 2 : 우리 회사에서 가장 높은 연봉을 받으시는 분은 1억 2천만원 부근이고, 가장 적은 분은 8백만원입니다. 상당히 격차가 큰데, 통계수치를 계산해 봤더니 평균은 4천 5백이었고 표준편차는 6백만원으로 나왔습니다… \\ 두 경우 중 어느 쪽이 좋다고 생각하십니까? 개인적인 생각이지만 저는 두번째 경우가 좋습니다. 똑 같은 표준편차라는 말을 하면서도 사용하기에 따라 얼마든지 달라질 수 있는 것이지요. 하긴 표준편차라는 말 굳이 사용할 필요도 없지만… \\ 그러기에… 통계수치를 들먹여야 할 경우에도 언제나 듣는 사람이 알아듣기 쉬운 말로, 때로는 조금 오류가 있는 설명을 붙이는 것도 필요한 것입니다. \\ 선형회귀분석에서는 언제나 가장 먼저 ANOVA 분석으로 모델 자체의 적합성을 검정하고, 다음으로는 각 회귀계수를 추정하죠? 이럴 때 엄격한 통계적해석을 고집하면 별로 설명할게 없어집니다. 기껏 돌렸더니 회귀계수가 유의하지 않으면 어떡할 겁니까? 그렇더라도 설명을 할 때는 ‘이 요인이 하나 올라갈 때 전체적으로 어느 정도의 상승효과가 있다…’ 식으로 가끔은 거짓말도 하여야 하는 것이죠… 말… 쉽게 합시다…
       * 통계보다는 인간: 어떤 학자가 뼈빠지게 연구한 결과를 통계적으로 공격한 것인데, 물론 연구논문을 다 보면 더 많이 나오겠지만, 일단은 표본 설정과 데이터 수집 부분을 집중적으로 공격한 것이죠… (표본 bias, 응답 신뢰도, Categorizing, 차이의 통계적 유의도, 연역적 가정 여부) 남이 만든 보고서를 공격하기 위해서는 이게 가장 쉬운 방법입니다. 통계적 분석기법이야 어차피 누가 하더라도 고전적인 가정을 다 충족시키기는 어려우니 공격하기 어렵죠… 그래서 가장 기본적인 부분을 파고드는 것입니다.       * 통계보다는 인간: 어떤 학자가 뼈빠지게 연구한 결과를 통계적으로 공격한 것인데, 물론 연구논문을 다 보면 더 많이 나오겠지만, 일단은 표본 설정과 데이터 수집 부분을 집중적으로 공격한 것이죠… (표본 bias, 응답 신뢰도, Categorizing, 차이의 통계적 유의도, 연역적 가정 여부) 남이 만든 보고서를 공격하기 위해서는 이게 가장 쉬운 방법입니다. 통계적 분석기법이야 어차피 누가 하더라도 고전적인 가정을 다 충족시키기는 어려우니 공격하기 어렵죠… 그래서 가장 기본적인 부분을 파고드는 것입니다.
-  * [[data_analysis:data_mind:직장에서_p-value_설명하는_법]]+  * [[data_analysis:data_mind:p-value_humor]]
   *  [[http://m.cafe.daum.net/statsas/3po1/42?q=D_MCiUSfMukTI0&svc=sns&|통계하는 사람들의 직장에서의 모습]]   *  [[http://m.cafe.daum.net/statsas/3po1/42?q=D_MCiUSfMukTI0&svc=sns&|통계하는 사람들의 직장에서의 모습]]
       * 1. 일단 데이터를 보기전에 상사의 의중을 묻는다. -연구보고서가 아니므로 결과를 알고 분석에 임하는 자세를 키워나간다.       * 1. 일단 데이터를 보기전에 상사의 의중을 묻는다. -연구보고서가 아니므로 결과를 알고 분석에 임하는 자세를 키워나간다.
  • data_analysis/data_mind.1581470756.txt.gz
  • Last modified: 2025/07/07 14:12
  • (external edit)