새소식

TIL

한국 실업률 데이터를 활용한 스플라인 보간(Spline Interpolation)

  • -

한국 실업률 데이터는 2013년 1월 ~ 2023년 4월 데이터.

실업률에 대한 데이터는 월단위로 얻을 수 있어, 이 데이터를 증폭시킨다면 시계열 예측에 있어서 도움될 것.

 

원래 데이터 크기: 124

원하는 목표의 데이터 크기: 2500

import numpy as np
import pandas as pd
from scipy.interpolate import interp1d
import matplotlib.pyplot as plt

# umemployed이라는 DataFrame이 이미 존재하며, index는 0부터 시작한다고 가정합니다.
original_length = len(umemployed)
new_length = 2500

# 보간에 사용할 원래의 x, y 좌표를 생성합니다.
x_original = np.linspace(0, original_length-1, original_length)
y_original = umemployed['UER'].values # umemployed의 column명이 "UER"

# 보간된 x 좌표를 생성합니다. (새로운 샘플링 레이트)
x_new = np.linspace(0, original_length-1, new_length)

# Cubic Spline 보간 함수를 생성합니다.
spline_interpolation = interp1d(x_original, y_original, kind='cubic')

# 보간된 y 좌표를 얻습니다.
y_new = spline_interpolation(x_new)

# 새로운 DataFrame을 생성합니다.
interpolated_umemployed = pd.DataFrame({'UER': y_new})

선형 보간 전
선형 보간 후

Contents

포스팅 주소를 복사했습니다

이 글이 도움이 되었다면 공감 부탁드립니다.