커뮤니티
스포츠
토론장


새 잡담게시판으로 가기
(구)잡담게시판 [1] [2] [3] [4] [5] [6]
HOME > 커뮤니티 > 잡담 게시판
 
작성일 : 15-05-23 20:58
통계분석 잘하시는분 좀 도와주세요 ㅠ
 글쓴이 : 푸르미
조회 : 654  

논문만드는 과제중 설문조사한걸 통계를 내고있는데... 제가 이걸 너무 잼병이라서 이해하는데
한계가 있어요 ㅠ
 
아니...a와 b의 상관관계를 pearson의 상관계수를 이용하였는데  상관계수가 0.073이 나오고
유의수준이 0.551로 나오는거에요.... 상관계수의 절대값이 0에 가까운건 관계가 거의 없다는거고...
유의수준이 0에 가까우면 신뢰도가 높은거라고 인터넷 뒤져보니 알게됬는데...
그러면 제가 적은 수치들을 해석하면 a와 b의 상관관계는 거의 없는 수준이고 그 상관관계의 수치는 신뢰하기 어렵다. 이런말인가요?....
출처 : 해외 네티즌 반응 - 가생이닷컴https://www.gasengi.com




가생이닷컴 운영원칙
알림:공격적인 댓글이나 욕설, 인종차별적인 글, 무분별한 특정국가 비난글등 절대 삼가 바랍니다.
griaso 15-05-23 21:12
   
이부분만으로 알기 어렵네요. 어째 공대수학이아니라 언론이나 상대같은삘이..
Std dev. 와 Expected val관계를 말하는건가요? 어느부분인지 좀 자세하게..
     
푸르미 15-05-23 21:14
   
제가 교대생이라서 그런 깊숙한거는 잘 모르겠네요... 그냥 설문조사를 spss이라는 통계프로그램으로 돌린건데 수치해석을 어찌할줄 몰라서 ㅠ
griaso 15-05-23 21:20
   
Pearson product-moment correlation coefficient: a measure of the linear correlation (dependence) between two variables X and Y, giving a value between +1 and −1 inclusive, where 1 is total positive correlation, 0 is no correlation, and −1 is total negative correlation. It is widely used in the sciences as a measure of the degree of linear dependence between two variables < 위키내용이고 잠시만 원글이 무슨 내용인지 분석좀 할께요. 우리쪽분야가 아니라 읽어봅니다.
griaso 15-05-23 21:37
   
http://zetawiki.com/wiki/%EC%9C%A0%EC%9D%98%ED%99%95%EB%A5%A0,_%EC%9C%A0%EC%9D%98%EC%88%98%EC%A4%80(P%EA%B0%92),_%ED%86%B5%EA%B3%84%EC%A0%81_%EC%9C%A0%EC%9D%98%EC%84%B1

여기가서 읽어보세요.
제가 위키로 이해한 바로는 PPMCC로 관계도를 측정할때
+/- 1일때 최대치 관계이고 0일때 무관계이니,  0.073 이면 0에 가깝네요.
하지만
유의 수준이 설문조사치의 정확도를 말하는거라면 95% 즉 +/- 0.05를 잡고있는거겠죠? 

0.551 이면 1-0.551 = 44.9%정확도라서 엄청 신뢰도가 떨어지는 -_-;;
무슨조사를 했길래
     
푸르미 15-05-23 21:40
   
그게 신뢰도가 떨어진다는게 그 a,b의 상관관계의 신뢰도가 떨어진다는 말인가요?
아니면 그 피어슨 상관계수 수치의 신뢰도가 떨어진다는 말인가요?
griaso 15-05-23 21:48
   
PPMCC로 할수있는거는 a와 b사이에 관계가 있느냐 없느냐의 유무만 따진다는거죠. 데이터들을 모아서 그래프를 그려놨을때 둘을 가르는 정확한 slope / gradient value를 구할수 없다고 하네요. 그러니까 정확한 관계에대한 이유는 분석할수없다고하는 말이죠.

95%정확도라는거는 통계그래프로 그렸을때 http://atssarabia.egloos.com/m/10130706 여기가서 그래프 보시면 알겠지만 alpha값이 0.05 (95%)일때 기각해야할 부분이 있죠. 그부분이 0.05 즉 5%정도라는겁니다. 근데 0.551이라면 기각해야할 데이터가 55.1%라는거죠. distribution area 가 줄어들면서 신뢰성이 떨어진다는거죠. 상관계수에 대한거가 아니라 데이터자료들말입니다.
griaso 15-05-23 21:56
   
그러므로 수학적 관점으로는 설문조사한 결과 둘의 사이에 어떤관계가 있다라고 할만한 신뢰성이 떨어진다. 라는겁니다.
조사 다시하시거나 다른 주제로 조사하셔야할까요??
     
푸르미 15-05-23 22:14
   
아니요.  어차피 관계가없으면 없다고 결론을 내면 되니까요.
그리고 조사 주제는 저희 학교 학생의 정서지능과 학점과의 관계에요.  감사합니다~
          
griaso 15-05-23 22:47
   
죄송합니다. 용어사용 해석이 영어랑 맞는지 모르겠고 팬으로 그리면서 이해하거나 설명할수 없어서요. ( 둘의 사이에 어떤관계가 있다라고 할만한 신뢰성이 떨어진다. 라는겁니다. ) <- 말이 좀 이상한듯. 상관관계도 없고 신뢰성도 떨어진다라고 해야할지. 이미 결론을 내리셨군요.

글쎄요 도움이 됬는지 모르겠네요. ^^ 점수 잘맞으시길
별명별로 15-05-23 22:22
   
나온 유의수준이 p value라는 말씀이신거 같은데 보통 유의수준 0.05 잡고 계산하면 p value < 0.05면

가설검정시 주장하는 귀무가설은 기각되고 대립가설이 채택되는겁니다

따라서 p value가 0.551이면 귀무가설 기각이 안되겠죠

귀무가설 : 상관관계 있다  대립가설 : 상관관계 없다

이걸 바탕으로 가설 검정햇는데 P value가 저 값이 나왔다면. 상관관계가 있다는 귀무가설은 채택이 되는거겠죠

상관관계 존재하고 그 상관성은 큰것은 아니지만 양의 상관관계라 볼 수 있겠군요
     
푸르미 15-05-23 22:51
   
잠시만요... '결론은 a와 b의 관계가 있다'는 가설이 채택되고 그 상관계수 수치는 적은 양의 상관관계를 가진단 건가요?
          
별명별로 15-05-23 22:55
   
말씀하신 유의수준이 0.551. 이게 P value 값이라면 가설검정시 귀무가설 기각이 안됩니다. 즉 상관관계가 있다 하는 부분이 기각이 안되고 채택된다는 얘기 (P value < 0.05 유의수준 -> H0 귀무가설 reject, but P value >0.05 유의수준 -> H0 귀무가설 accept)

따라서 상관관계 있고 양의 상관관계 가지는 겁니다
               
푸르미 15-05-23 22:59
   
근데 보통의 자료에서는 유의수준이 저렇게 높게 안뜨고 0.1수준정도 나오던데
그러면 0.5와 0.1은 어떻게 해석해야하나요?
윗분이 말씀하신... 0.551은 기각해야할 자료가 55.1%라는 말이 맞는건가요?...
                    
별명별로 15-05-23 23:05
   
http://statistics-cahn.blogspot.kr/2007/10/p-value.html

"만약 관찰된 검정통계량이 175가 아니고, 귀무가설에 가까와서 170.5라고 하면
p-value = Pr( Z > 0.5) = 0.3085375 여서 꽤 큰 값이 나오지요"

P value 값이 큰값이 나오면 귀무가설에 가깝다는 얘기겠죠

저도 통계에 대해서는 빠삭한거 아니지만 Pearson 상관관계는 선형모델을 기반으로 하는 기초적인 것이고

그 나온 결과 값을 가설 검정해 유의수준 o.o5에서 검정하면 위 결과대로라면 귀무가설은 기각이 안됩니다.

말씀하신 유의수준 0.551이 P value 값이 맞다면
griaso 15-05-23 23:15
   
푸리미님 죄송합니다만 별명별로님 설명이 저보다 더 낫다고 봅니다. 제가 부족한듯 합니다.^^
술담배여자 15-05-24 05:22
   
............조용히있어야지.......