시계열 분석
-
켄달의 타우(Kendall's tau)는 두 변수 간의 순위(rank)에 기반한 상관계수로, 비선형 상관관계와 단조(monotonic) 관계를 측정하는 데 적합하다. 켄달의 타우는 두 변수의 순위 차이에 따라 양의 상관관계, 음의 상관관계, 또는 독립적인 관계를 나타낸다. 켄달의 타우를 계산하는 과정은 다음과 같다. 각 변수의 관측값에 대해 순위(rank)를 할당한다. 동일한 값이 있는 경우 평균 순위를 사용한다. 두 변수의 관측값 쌍을 비교하여 일치 쌍(concordant pairs)과 불일치 쌍(discordant pairs)를 찾는다. 일치 쌍: 한 변수의 관측값 쌍에서 값이 증가하면 다른 변수의 관측값 쌍에서 값도 증가하는 경우, 또는 값이 감소하면 값도 감소하는 경우다. 불일치 쌍: 한 변수의 ..
켄달의 타우(Kendall's tau)켄달의 타우(Kendall's tau)는 두 변수 간의 순위(rank)에 기반한 상관계수로, 비선형 상관관계와 단조(monotonic) 관계를 측정하는 데 적합하다. 켄달의 타우는 두 변수의 순위 차이에 따라 양의 상관관계, 음의 상관관계, 또는 독립적인 관계를 나타낸다. 켄달의 타우를 계산하는 과정은 다음과 같다. 각 변수의 관측값에 대해 순위(rank)를 할당한다. 동일한 값이 있는 경우 평균 순위를 사용한다. 두 변수의 관측값 쌍을 비교하여 일치 쌍(concordant pairs)과 불일치 쌍(discordant pairs)를 찾는다. 일치 쌍: 한 변수의 관측값 쌍에서 값이 증가하면 다른 변수의 관측값 쌍에서 값도 증가하는 경우, 또는 값이 감소하면 값도 감소하는 경우다. 불일치 쌍: 한 변수의 ..
2023.04.28 -
스피어만 상관계수(Spearman's rank correlation coefficient)는 두 변수의 순위(rank) 간의 상관관계를 측정하는 비모수적(non-parametric) 통계 방법이다. 스피어만 상관계수는 선형 및 비선형 상관관계를 모두 측정할 수 있으며, 특히 단조(monotonic) 관계에 강하게 민감하다. 스피어만 상관계수는 다음과 같은 과정을 통해 계산된다. 각 변수의 관측값에 대해 순위(rank)를 할당한다. 동일한 값이 있는 경우 평균 순위를 사용한다. 두 변수의 순위 차이를 계산한다. ($d_i = r_{X_i} - r_{Y_i}$) 순위 차이의 제곱을 모두 더한다. ($Σd²$) 스피어만 상관계수를 다음 공식을 사용하여 계산한다. $\rho = 1 - \frac{6 \sum_{..
스피어만 상관계수(Spearman's rank correlation coefficient)스피어만 상관계수(Spearman's rank correlation coefficient)는 두 변수의 순위(rank) 간의 상관관계를 측정하는 비모수적(non-parametric) 통계 방법이다. 스피어만 상관계수는 선형 및 비선형 상관관계를 모두 측정할 수 있으며, 특히 단조(monotonic) 관계에 강하게 민감하다. 스피어만 상관계수는 다음과 같은 과정을 통해 계산된다. 각 변수의 관측값에 대해 순위(rank)를 할당한다. 동일한 값이 있는 경우 평균 순위를 사용한다. 두 변수의 순위 차이를 계산한다. ($d_i = r_{X_i} - r_{Y_i}$) 순위 차이의 제곱을 모두 더한다. ($Σd²$) 스피어만 상관계수를 다음 공식을 사용하여 계산한다. $\rho = 1 - \frac{6 \sum_{..
2023.04.28 -
피어슨 상관계수(Pearson correlation coefficient)는 두 변수 간의 선형 상관관계를 측정하는 통계적 지표다. 피어슨 상관계수는 -1부터 1까지의 범위를 가지며, 이 값이 1에 가까울수록 두 변수는 강한 양의 선형 상관관계를 가지고, -1에 가까울수록 강한 음의 선형 상관관계를 가지며, 0에 가까울수록 선형 상관관계가 없음을 의미한다. 피어슨 상관계수는 다음과 같은 공식으로 계산된다. $r = \frac{\sum_{i=1}^n (X_i - \bar{X})(Y_i - \bar{Y})}{\sqrt{\sum_{i=1}^n (X_i - \bar{X})^2 \sum_{i=1}^n (Y_i - \bar{Y})^2}}$ 여기서 $r$은 피어슨 상관계수이며, $X_i$와 $Y_i$는 각각 두 변수..
피어슨 상관 계수(Pearson correlation coefficient)피어슨 상관계수(Pearson correlation coefficient)는 두 변수 간의 선형 상관관계를 측정하는 통계적 지표다. 피어슨 상관계수는 -1부터 1까지의 범위를 가지며, 이 값이 1에 가까울수록 두 변수는 강한 양의 선형 상관관계를 가지고, -1에 가까울수록 강한 음의 선형 상관관계를 가지며, 0에 가까울수록 선형 상관관계가 없음을 의미한다. 피어슨 상관계수는 다음과 같은 공식으로 계산된다. $r = \frac{\sum_{i=1}^n (X_i - \bar{X})(Y_i - \bar{Y})}{\sqrt{\sum_{i=1}^n (X_i - \bar{X})^2 \sum_{i=1}^n (Y_i - \bar{Y})^2}}$ 여기서 $r$은 피어슨 상관계수이며, $X_i$와 $Y_i$는 각각 두 변수..
2023.04.27 -
시계열 데이터를 다룰 때, 여러 시계열 데이터 간의 상관 관계를 파악하고 이에 따라서 데이터 모델링을 해야 하는 상황이 온다. 시계열 데이터들 간의 상관관계를 분석하는 여러가지 방법을 소개한다. 피어슨 상관 계수(Pearson Correlation Coefficient): 두 변수 간의 선형 상관 관계를 측정하는 가장 일반적인 방법. -1에서 1사이의 값을 가진다. 스피어만 순위 상관 계수(Spearman Rank Correlation Coefficient): 두 변수 간의 순위 기반의 비선형 상관 관계를 측정한다. 피어슨 상관 계수와 마찬가지로 -1에서 1 사이의 값을 가진다. 켄달 타우(Kendall's Tau): 스피어만 상관 계수와 유사하게, 켄달 타우는 두 변수 간의 순위 기반의 비선형 상관 관..
시계열 상관관계 분석(Correlation analysis)시계열 데이터를 다룰 때, 여러 시계열 데이터 간의 상관 관계를 파악하고 이에 따라서 데이터 모델링을 해야 하는 상황이 온다. 시계열 데이터들 간의 상관관계를 분석하는 여러가지 방법을 소개한다. 피어슨 상관 계수(Pearson Correlation Coefficient): 두 변수 간의 선형 상관 관계를 측정하는 가장 일반적인 방법. -1에서 1사이의 값을 가진다. 스피어만 순위 상관 계수(Spearman Rank Correlation Coefficient): 두 변수 간의 순위 기반의 비선형 상관 관계를 측정한다. 피어슨 상관 계수와 마찬가지로 -1에서 1 사이의 값을 가진다. 켄달 타우(Kendall's Tau): 스피어만 상관 계수와 유사하게, 켄달 타우는 두 변수 간의 순위 기반의 비선형 상관 관..
2023.04.22 -
GARCH(Generalized Autoregressive Conditional Heteroskedasticity) 모델은 시계열 데이터의 변동성을 분석하고 예측하는 데 사용되는 통계 모델이다. GARCH 모델은 금융 시장과 같이 변동성이 크고 시간에 따라 변화하는 데이터를 분석하는 데 특히 유용하다. GARCH 모델의 핵심 개념은 조건부 이차 모멘트(분산)가 시간에 따라 변화한다는 것이다. 이는 ARCH(Autoregressive Conditional Heteroskedasticity) 모델을 일반화한 것으로, ARCH 모델은 이차 모멘트만 고려한다. GARCH 모델은 이차 모멘트뿐만 아니라 과거의 변동성 정보도 고려한다. $GARCH(p, q)$ 모델은 다음과 같은 수식으로 표현된다. $σ_t^2 =..
GARCH(Generalized Autoregressive Conditional Heteroskedasticity) 모델GARCH(Generalized Autoregressive Conditional Heteroskedasticity) 모델은 시계열 데이터의 변동성을 분석하고 예측하는 데 사용되는 통계 모델이다. GARCH 모델은 금융 시장과 같이 변동성이 크고 시간에 따라 변화하는 데이터를 분석하는 데 특히 유용하다. GARCH 모델의 핵심 개념은 조건부 이차 모멘트(분산)가 시간에 따라 변화한다는 것이다. 이는 ARCH(Autoregressive Conditional Heteroskedasticity) 모델을 일반화한 것으로, ARCH 모델은 이차 모멘트만 고려한다. GARCH 모델은 이차 모멘트뿐만 아니라 과거의 변동성 정보도 고려한다. $GARCH(p, q)$ 모델은 다음과 같은 수식으로 표현된다. $σ_t^2 =..
2023.04.17 -
ARCH(Autoregressive Conditional Heteroskedasticity) 모델은 시계열 데이터의 변동성을 분석하기 위한 통계적 모델 중 하나다. 이 모델은 금융 시계열 데이터와 같이 변동성 클러스터링이 존재하는 경우, 즉 일정 기간 동안 변동성이 높거나 낮게 유지되는 현상을 설명하고 예측하는 데 유용하다. ARCH 모델의 기본 아이디어는 현재 시점의 분산이 과거의 오차항 제곱에 의존한다는 가정이다. $ARCH(p)$ 모델은 다음과 같이 표현된다. $y(t) = μ + ε(t)$ $ε(t) = σ(t) * z(t)$ $σ²(t) = α₀ + α₁ * ε²(t-1) + ... + α_p * ε²(t-p)$ 여기서 $y(t)$는 $t$ 시점의 관측값, $μ$는 상수항, $ε(t)$는 $t$..
ARCH(Autoregressive Conditional Heteroskedasticity) 모델ARCH(Autoregressive Conditional Heteroskedasticity) 모델은 시계열 데이터의 변동성을 분석하기 위한 통계적 모델 중 하나다. 이 모델은 금융 시계열 데이터와 같이 변동성 클러스터링이 존재하는 경우, 즉 일정 기간 동안 변동성이 높거나 낮게 유지되는 현상을 설명하고 예측하는 데 유용하다. ARCH 모델의 기본 아이디어는 현재 시점의 분산이 과거의 오차항 제곱에 의존한다는 가정이다. $ARCH(p)$ 모델은 다음과 같이 표현된다. $y(t) = μ + ε(t)$ $ε(t) = σ(t) * z(t)$ $σ²(t) = α₀ + α₁ * ε²(t-1) + ... + α_p * ε²(t-p)$ 여기서 $y(t)$는 $t$ 시점의 관측값, $μ$는 상수항, $ε(t)$는 $t$..
2023.04.17 -
SARIMA(Seasonal Autoregressive Integrated Moving Average) 모델은 ARIMA 모델의 확장 버전으로, 계절성 패턴을 가진 시계열 데이터를 분석하고 예측하기 위한 통계적 방법이다. SARIMA 모델은 기본 ARIMA 모델에 계절성 요소를 추가하여 복잡한 계절성 패턴을 포착하고 설명할 수 있다. SARIMA 모델은 다음과 같이 표현된다. $SARIMA(p, d, q)(P, D, Q)m$ 여기서 $p, d, q$는 각각 자기 회귀(AR) 차수, 차분 차수, 이동 평균(MA) 차수를 나타내며, 기본 ARIMA 모델과 동일한 의미다. $P, D, Q$는 각각 계절성 자기 회귀 차수, 계절성 차분 차수, 계절성 이동 평균 차수를 나타낸다. $m$은 계절성 주기를 나타내는 ..
SARIMA(Seasonal Autoregressive Integrated Moving Average) 모델SARIMA(Seasonal Autoregressive Integrated Moving Average) 모델은 ARIMA 모델의 확장 버전으로, 계절성 패턴을 가진 시계열 데이터를 분석하고 예측하기 위한 통계적 방법이다. SARIMA 모델은 기본 ARIMA 모델에 계절성 요소를 추가하여 복잡한 계절성 패턴을 포착하고 설명할 수 있다. SARIMA 모델은 다음과 같이 표현된다. $SARIMA(p, d, q)(P, D, Q)m$ 여기서 $p, d, q$는 각각 자기 회귀(AR) 차수, 차분 차수, 이동 평균(MA) 차수를 나타내며, 기본 ARIMA 모델과 동일한 의미다. $P, D, Q$는 각각 계절성 자기 회귀 차수, 계절성 차분 차수, 계절성 이동 평균 차수를 나타낸다. $m$은 계절성 주기를 나타내는 ..
2023.04.17 -
VAR(Vector Autoregression) 모델은 다변량 시계열 데이터 분석을 위한 통계적 방법론 중 하나입니다. 여러 개의 시계열 변수가 상호 연관성을 가지며, 각 변수가 과거의 자신과 다른 변수들의 값에 영향을 받는 경우에 적합한 모델이다. VAR 모델은 여러 시계열 변수 간의 동적 관계를 분석하고 예측할 수 있다. VAR 모델의 기본 개념은 각 변수가 일정한 시차(lag)로 과거의 자신과 다른 변수들의 값에 선형적으로 의존한다고 가정하는 것이다. 이를 통해 변수들 간의 인과 관계와 영향력을 분석할 수 있다. 예를 들어, 두 변수 $X$와 $Y$가 있을 때, $VAR(1)$ 모델은 다음과 같이 표현된다. $X(t) = a1 + b1 * X(t-1) + c1 * Y(t-1) + e1(t)$ $Y(..
VAR(Vector Autoregression) 모델VAR(Vector Autoregression) 모델은 다변량 시계열 데이터 분석을 위한 통계적 방법론 중 하나입니다. 여러 개의 시계열 변수가 상호 연관성을 가지며, 각 변수가 과거의 자신과 다른 변수들의 값에 영향을 받는 경우에 적합한 모델이다. VAR 모델은 여러 시계열 변수 간의 동적 관계를 분석하고 예측할 수 있다. VAR 모델의 기본 개념은 각 변수가 일정한 시차(lag)로 과거의 자신과 다른 변수들의 값에 선형적으로 의존한다고 가정하는 것이다. 이를 통해 변수들 간의 인과 관계와 영향력을 분석할 수 있다. 예를 들어, 두 변수 $X$와 $Y$가 있을 때, $VAR(1)$ 모델은 다음과 같이 표현된다. $X(t) = a1 + b1 * X(t-1) + c1 * Y(t-1) + e1(t)$ $Y(..
2023.04.17