분류 전체보기
-
ARCH(Autoregressive Conditional Heteroskedasticity) 모델은 시계열 데이터의 변동성을 분석하기 위한 통계적 모델 중 하나다. 이 모델은 금융 시계열 데이터와 같이 변동성 클러스터링이 존재하는 경우, 즉 일정 기간 동안 변동성이 높거나 낮게 유지되는 현상을 설명하고 예측하는 데 유용하다. ARCH 모델의 기본 아이디어는 현재 시점의 분산이 과거의 오차항 제곱에 의존한다는 가정이다. $ARCH(p)$ 모델은 다음과 같이 표현된다. $y(t) = μ + ε(t)$ $ε(t) = σ(t) * z(t)$ $σ²(t) = α₀ + α₁ * ε²(t-1) + ... + α_p * ε²(t-p)$ 여기서 $y(t)$는 $t$ 시점의 관측값, $μ$는 상수항, $ε(t)$는 $t$..
ARCH(Autoregressive Conditional Heteroskedasticity) 모델ARCH(Autoregressive Conditional Heteroskedasticity) 모델은 시계열 데이터의 변동성을 분석하기 위한 통계적 모델 중 하나다. 이 모델은 금융 시계열 데이터와 같이 변동성 클러스터링이 존재하는 경우, 즉 일정 기간 동안 변동성이 높거나 낮게 유지되는 현상을 설명하고 예측하는 데 유용하다. ARCH 모델의 기본 아이디어는 현재 시점의 분산이 과거의 오차항 제곱에 의존한다는 가정이다. $ARCH(p)$ 모델은 다음과 같이 표현된다. $y(t) = μ + ε(t)$ $ε(t) = σ(t) * z(t)$ $σ²(t) = α₀ + α₁ * ε²(t-1) + ... + α_p * ε²(t-p)$ 여기서 $y(t)$는 $t$ 시점의 관측값, $μ$는 상수항, $ε(t)$는 $t$..
2023.04.17 -
SARIMA(Seasonal Autoregressive Integrated Moving Average) 모델은 ARIMA 모델의 확장 버전으로, 계절성 패턴을 가진 시계열 데이터를 분석하고 예측하기 위한 통계적 방법이다. SARIMA 모델은 기본 ARIMA 모델에 계절성 요소를 추가하여 복잡한 계절성 패턴을 포착하고 설명할 수 있다. SARIMA 모델은 다음과 같이 표현된다. $SARIMA(p, d, q)(P, D, Q)m$ 여기서 $p, d, q$는 각각 자기 회귀(AR) 차수, 차분 차수, 이동 평균(MA) 차수를 나타내며, 기본 ARIMA 모델과 동일한 의미다. $P, D, Q$는 각각 계절성 자기 회귀 차수, 계절성 차분 차수, 계절성 이동 평균 차수를 나타낸다. $m$은 계절성 주기를 나타내는 ..
SARIMA(Seasonal Autoregressive Integrated Moving Average) 모델SARIMA(Seasonal Autoregressive Integrated Moving Average) 모델은 ARIMA 모델의 확장 버전으로, 계절성 패턴을 가진 시계열 데이터를 분석하고 예측하기 위한 통계적 방법이다. SARIMA 모델은 기본 ARIMA 모델에 계절성 요소를 추가하여 복잡한 계절성 패턴을 포착하고 설명할 수 있다. SARIMA 모델은 다음과 같이 표현된다. $SARIMA(p, d, q)(P, D, Q)m$ 여기서 $p, d, q$는 각각 자기 회귀(AR) 차수, 차분 차수, 이동 평균(MA) 차수를 나타내며, 기본 ARIMA 모델과 동일한 의미다. $P, D, Q$는 각각 계절성 자기 회귀 차수, 계절성 차분 차수, 계절성 이동 평균 차수를 나타낸다. $m$은 계절성 주기를 나타내는 ..
2023.04.17 -
VAR(Vector Autoregression) 모델은 다변량 시계열 데이터 분석을 위한 통계적 방법론 중 하나입니다. 여러 개의 시계열 변수가 상호 연관성을 가지며, 각 변수가 과거의 자신과 다른 변수들의 값에 영향을 받는 경우에 적합한 모델이다. VAR 모델은 여러 시계열 변수 간의 동적 관계를 분석하고 예측할 수 있다. VAR 모델의 기본 개념은 각 변수가 일정한 시차(lag)로 과거의 자신과 다른 변수들의 값에 선형적으로 의존한다고 가정하는 것이다. 이를 통해 변수들 간의 인과 관계와 영향력을 분석할 수 있다. 예를 들어, 두 변수 $X$와 $Y$가 있을 때, $VAR(1)$ 모델은 다음과 같이 표현된다. $X(t) = a1 + b1 * X(t-1) + c1 * Y(t-1) + e1(t)$ $Y(..
VAR(Vector Autoregression) 모델VAR(Vector Autoregression) 모델은 다변량 시계열 데이터 분석을 위한 통계적 방법론 중 하나입니다. 여러 개의 시계열 변수가 상호 연관성을 가지며, 각 변수가 과거의 자신과 다른 변수들의 값에 영향을 받는 경우에 적합한 모델이다. VAR 모델은 여러 시계열 변수 간의 동적 관계를 분석하고 예측할 수 있다. VAR 모델의 기본 개념은 각 변수가 일정한 시차(lag)로 과거의 자신과 다른 변수들의 값에 선형적으로 의존한다고 가정하는 것이다. 이를 통해 변수들 간의 인과 관계와 영향력을 분석할 수 있다. 예를 들어, 두 변수 $X$와 $Y$가 있을 때, $VAR(1)$ 모델은 다음과 같이 표현된다. $X(t) = a1 + b1 * X(t-1) + c1 * Y(t-1) + e1(t)$ $Y(..
2023.04.17 -
ARIMA(Autoregressive Integrated Moving Average) 모델은 시계열 데이터 분석과 예측을 위한 통계적 방법론 중 하나다. ARIMA 모델은 세 가지 주요 구성 요소인 Autoregression(AR), Integration(I), Moving Average(MA)를 결합하여 복잡한 패턴과 변동성을 가진 시계열 데이터를 설명하고 예측한다. Autoregression(AR): 자기 회귀 모델은 이전 시점의 관측값에 의존하여 현재 시점의 값을 예측하는 데 사용된다. 이 과정에서 과거 관측값들의 가중치를 고려한다. $AR(p)$ 모델에서 $p$는 과거 관측값을 고려하는 시차(lag)를 나타낸다. Integration(I): 시계열 데이터에서 추세와 계절성 패턴을 제거하여 데이터를..
ARIMA(Autoregressive Integrated Moving Average) 모델ARIMA(Autoregressive Integrated Moving Average) 모델은 시계열 데이터 분석과 예측을 위한 통계적 방법론 중 하나다. ARIMA 모델은 세 가지 주요 구성 요소인 Autoregression(AR), Integration(I), Moving Average(MA)를 결합하여 복잡한 패턴과 변동성을 가진 시계열 데이터를 설명하고 예측한다. Autoregression(AR): 자기 회귀 모델은 이전 시점의 관측값에 의존하여 현재 시점의 값을 예측하는 데 사용된다. 이 과정에서 과거 관측값들의 가중치를 고려한다. $AR(p)$ 모델에서 $p$는 과거 관측값을 고려하는 시차(lag)를 나타낸다. Integration(I): 시계열 데이터에서 추세와 계절성 패턴을 제거하여 데이터를..
2023.04.17 -
# fitz 설치 pip install PyMuPDF def find_pages_with_keyword(input_pdf_path, keyword): pdf = fitz.open(input_pdf_path) pages_with_keyword = [] for page_num in range(pdf.page_count): page = pdf.load_page(page_num) if keyword.lower() in page.get_text().lower(): pages_with_keyword.append(page_num + 1) pdf.close() return pages_with_keyword def print_pages_with_keyword(input_pdf_path, keyword): pages = ..
PDF 파일에서 특정 페이지 python으로 추출하기# fitz 설치 pip install PyMuPDF def find_pages_with_keyword(input_pdf_path, keyword): pdf = fitz.open(input_pdf_path) pages_with_keyword = [] for page_num in range(pdf.page_count): page = pdf.load_page(page_num) if keyword.lower() in page.get_text().lower(): pages_with_keyword.append(page_num + 1) pdf.close() return pages_with_keyword def print_pages_with_keyword(input_pdf_path, keyword): pages = ..
2023.04.17 -
이동평균(Moving Average, MA) 모델은 시계열 분석에서 사용되는 모델 중 하나로, 현재 시점의 오차와 과거 시점의 오차의 가중합으로 시계열 데이터를 설명하는 모델이다. MA 모델은 백색잡음(White noise)이 시간에 따라 어떻게 변화하는지를 설명하는 데 사용되며, 이를 통해 시계열 데이터의 패턴을 분석할 수 있다. $q$차 이동평균 모델(MA(q))은 다음과 같은 형태를 가진다. $y_t = \epsilon_t + \theta_1 \epsilon_{t-1} + \theta_2 \epsilon_{t-2} + \cdots + \theta_q \epsilon_{t-q}$ 여기서 $y_t$는 시점 $t$에서의 관측값, $\epsilon_t$는 시점 $t$에서의 백색잡음, 그리고 $\theta_..
이동평균(Moving Average, MA) 모델이동평균(Moving Average, MA) 모델은 시계열 분석에서 사용되는 모델 중 하나로, 현재 시점의 오차와 과거 시점의 오차의 가중합으로 시계열 데이터를 설명하는 모델이다. MA 모델은 백색잡음(White noise)이 시간에 따라 어떻게 변화하는지를 설명하는 데 사용되며, 이를 통해 시계열 데이터의 패턴을 분석할 수 있다. $q$차 이동평균 모델(MA(q))은 다음과 같은 형태를 가진다. $y_t = \epsilon_t + \theta_1 \epsilon_{t-1} + \theta_2 \epsilon_{t-2} + \cdots + \theta_q \epsilon_{t-q}$ 여기서 $y_t$는 시점 $t$에서의 관측값, $\epsilon_t$는 시점 $t$에서의 백색잡음, 그리고 $\theta_..
2023.04.16 -
공적분(cointegration)은 시계열 데이터 분석에서 중요한 개념으로, 두 개 이상의 시계열 데이터가 공통적인 장기 추세를 공유할 때 발생한다. 이는 단기적인 시간에 따른 변동성에도 불구하고 시계열 변수들이 장기적으로 평형 관계를 유지하게 된다. 공적분은 금융, 경제학, 환경 과학 등 다양한 분야에서 활용되며, 시계열 변수들 간의 장기적인 관계를 검증하고 예측 모델을 구축하는 데 도움이 된다. 공적분을 이해하려면 먼저 단위근(Unit root) 개념에 대해 알아야 한다. 단위근이 있는 시계열 데이터는 정상성(Stationarity)을 만족하지 않으며, 평균과 분산이 시간에 따라 변화한다. 이러한 비정상 시계열 데이터는 차분(Differencing)을 통해 정상성을 만족하도록 변환할 수 있다. 공적분..
공적분(Cointegration)공적분(cointegration)은 시계열 데이터 분석에서 중요한 개념으로, 두 개 이상의 시계열 데이터가 공통적인 장기 추세를 공유할 때 발생한다. 이는 단기적인 시간에 따른 변동성에도 불구하고 시계열 변수들이 장기적으로 평형 관계를 유지하게 된다. 공적분은 금융, 경제학, 환경 과학 등 다양한 분야에서 활용되며, 시계열 변수들 간의 장기적인 관계를 검증하고 예측 모델을 구축하는 데 도움이 된다. 공적분을 이해하려면 먼저 단위근(Unit root) 개념에 대해 알아야 한다. 단위근이 있는 시계열 데이터는 정상성(Stationarity)을 만족하지 않으며, 평균과 분산이 시간에 따라 변화한다. 이러한 비정상 시계열 데이터는 차분(Differencing)을 통해 정상성을 만족하도록 변환할 수 있다. 공적분..
2023.04.16 -
AR(AutoRegressive) 모델은 시계열 데이터 분석에서 널리 사용되는 선형 모델 중 하나다. AR 모델은 시계열 데이터의 현재 값이 과거 값에 의존하는 구조를 가진다. 이는 시계열 데이터의 자기상관(Autocorrelation)을 반영한 모델로서, 과거의 관측값을 사용하여 현재 값의 예측에 활용할 수 있다. $AR(p)$ 모델은 다음과 같은 형태의 회귀식으로 나타낼 수 있다. $y_t = α + ρ_1y_{t-1} + ρ_2y_{t-2} + ... + ρ_py_{t-p} + ε_t$ 여기서, $y_t$는 시계열 데이터 $α$는 상수항 $ρ_i$는 각 과거 시점에 대한 자기회귀 계수$(i = 1, 2, ..., p)$. $p$는 모델의 차수(Order)로, 과거 몇 개의 관측값을 고려할지를 결정한..
AR(AutoRegressive) 모델AR(AutoRegressive) 모델은 시계열 데이터 분석에서 널리 사용되는 선형 모델 중 하나다. AR 모델은 시계열 데이터의 현재 값이 과거 값에 의존하는 구조를 가진다. 이는 시계열 데이터의 자기상관(Autocorrelation)을 반영한 모델로서, 과거의 관측값을 사용하여 현재 값의 예측에 활용할 수 있다. $AR(p)$ 모델은 다음과 같은 형태의 회귀식으로 나타낼 수 있다. $y_t = α + ρ_1y_{t-1} + ρ_2y_{t-2} + ... + ρ_py_{t-p} + ε_t$ 여기서, $y_t$는 시계열 데이터 $α$는 상수항 $ρ_i$는 각 과거 시점에 대한 자기회귀 계수$(i = 1, 2, ..., p)$. $p$는 모델의 차수(Order)로, 과거 몇 개의 관측값을 고려할지를 결정한..
2023.04.16