아홉번째 이야기 - 선형관계의 척도, 상관계수
안녕하세요! 리그레션입니다 오늘은 상관계수에 대한 이야기를 가져왔습니다. 상관계수(Correlation Coefficient)는 자료를 그래프로 나타내었을 때 선형에 얼마나 가까운지를 나타내는 척도로 사용됩니다. 상관계수는 r로 표기를 하는데요, 조사된 n개의 자료쌍이 (X1,Y1),(X2,Y2), .... ,(Xn,Yn)일때 다음의 식을 생각해 볼까요? 여기서 xbar와 ybar는 각각 Xi와 Yi값들의 평균입니다. Sxy는 두 변수의 자료쌍 각각의 편차들의 곱을 합한형태를 하고 있는데요, 이는 다음의 성질을 가집니다. 첫째, Xi 값이 크면 Yi값도 크고, Xi 값이 작으면 Yi값도 작다면, Sxy값은 양의 값을 가지게 됩니다. 둘째, Xi 값이 크면 Yi값이 작고, Xi 값이 작고 Yi값이 크다면,..
2019. 8. 1. 01:01