새소식

시계열 분석

켄달의 타우(Kendall's tau)

  • -

켄달의 타우(Kendall's tau)두 변수 간의 순위(rank)에 기반한 상관계수로, 비선형 상관관계와 단조(monotonic) 관계를 측정하는 데 적합하다. 켄달의 타우는 두 변수의 순위 차이에 따라 양의 상관관계, 음의 상관관계, 또는 독립적인 관계를 나타낸다.

 

켄달의 타우를 계산하는 과정은 다음과 같다.

 

  1. 각 변수의 관측값에 대해 순위(rank)를 할당한다. 동일한 값이 있는 경우 평균 순위를 사용한다.
  2. 두 변수의 관측값 쌍을 비교하여 일치 쌍(concordant pairs)과 불일치 쌍(discordant pairs)를 찾는다.
    • 일치 쌍: 한 변수의 관측값 쌍에서 값이 증가하면 다른 변수의 관측값 쌍에서 값도 증가하는 경우, 또는 값이 감소하면 값도 감소하는 경우다.
    • 불일치 쌍: 한 변수의 관측값 쌍에서 값이 증가하면 다른 변수의 관측값 쌍에서 값이 감소하는 경우, 또는 값이 감소하면 값이 증가하는 경우다.
  3. 켄달의 타우를 다음 공식을 사용하여 계산한다.

 

$\tau = \frac{n_c - n_d}{\sqrt{(n_c + n_d + n_t)(n_c + n_d + n_u)}}$

 

여기서 $n_c$는 일치 쌍(concordant pairs)의 수, $n_d$는 불일치 쌍(discordant pairs)의 수, $n_t$와 $n_u$는 각각 첫 번째 변수와 두 번째 변수에서 동일한 값이 있는 관측값의 수를 의미한다.

켄달의 타우는 -1과 1 사이의 값을 가진다. 양수 값은 양의 상관관계, 음수 값은 음의 상관관계를 나타내며, 값이 0에 가까울수록 두 변수 간에 상관관계가 없음을 의미한다.

켄달의 타우는 순위를 기반으로 하기 때문에 이상치에 덜 민감하며, 선형 및 비선형 단조 관계를 모두 측정할 수 있다. 스피어만 상관계수와 마찬가지로, 켄달의 타우는 상관관계를 분석하는 데 널리 사용되지만 인과 관계를 결정하는 데는 사용되지 않는다.
켄달의 타우는 스피어만 상관계수와 비교하여 계산이 조금 더 복잡하지만, 다양한 데이터 상황에서 유용한 상관계수다. 특히, 비선형 관계와 이상치가 있는 데이터에서 적절한 선택이 될 수 있다. 그러나 변수 간의 관계가 단조적이지 않은 경우에는 켄달의 타우가 적합하지 않을 수 있으며, 이때는 다른 상관계수 방법이나 상호 정보량(Mutual Information)과 같은 다른 방법을 사용하여 상관관계를 분석하는 것이 좋다.

Contents

포스팅 주소를 복사했습니다

이 글이 도움이 되었다면 공감 부탁드립니다.