시계열 자료의 종류(정상, 비정상 시계열)

아래의 평균 변동이나 분산 변동 외에도 주기적으로 변동하는 계절변동이 존재할 수 있다.

par(mfrow=c(2,2))
set.seed(42)
df=data.frame(idx=1:150,value=rnorm(150,0,1))
plot(df,type='l',main='Stationary',bty='l')

set.seed(42)
df=data.frame(idx=1:150,
    value=rnorm(150,0,1:150))
plot(df,type='l',main='Nonstationary',bty='l')

set.seed(42)
df=data.frame(idx=1:150,
    value=rnorm(150,seq(0,10,len=150),1))
plot(df,type='l',bty='l')

set.seed(42)
df=data.frame(idx=1:150,
    value=rnorm(150,
        seq(0,20,len=150),seq(0,10,len=150)))
plot(df,type='l',bty='l')

우연변동 시계열(Random Variation Time Series)

시계열 자료가 일정한 수준에 머물며 우연변동에 의한 변화만 나타내는 경우

$$ y_t=\alpha+e_t$$

par(mfrow=c(1,1))
dd1=matrix(
  c(1342, 1442, 1252, 1343, 
    1425, 1362, 1456, 1272, 
    1243, 1359, 1412, 1253, 
    1201, 1478, 1322, 1406, 
    1254, 1289, 1497, 1208))
plot(ts(data=dd1,start=c(2006,1),freq=4))

계절변동 시계열(Seasonal Variation Time Series)

시계열 자료가 주기적 성격의 계절변동에 의한 영향을 받아 주기적인 변화를 나타내는 경우, 주기가 1년 이상인 경우 순환변동(Cyclical Variation)이라 하기도 한다.

$$y_t=\alpha+\beta_1 sin{{2\pi t}\over{f}}+\beta_2 cos{{2 \pi t}}\over{f}+e_t$$

dd2=matrix(
  c(1142, 1242, 1452, 1543, 
    1125, 1262, 1456, 1572, 
    1143, 1259, 1462, 1553, 
    1121, 1258, 1472, 1546, 
    1154, 1249, 1477, 1548))
plot(ts(dd2,start=c(2006,1),freq=4))

추세변동 시계열(Trend Variation Time Series)

시간에 따라 증가하거나 감소하는 경향을 보여주는 시계열 자료

$$ y_t= \alpha+\beta t+e_t$$

$$ y_t = \alpha + \beta_1 t+ \beta_2 t + e_t$$

dd3=matrix(
  c(1142, 1242, 1252, 1343, 
    1225, 1562, 1356, 1572, 
    1343, 1459, 1412, 1453, 
    1401, 1478, 1322, 1606, 
    1554, 1589, 1597, 1408))
plot(ts(dd3,start=c(2006,1),freq=4))

계절적 추세변동(Seasonal-Trend Variation Time Series)

시간에 따라 증가하거나 감소하는 추세변동과 주기적 성격의 계절변동을 동시에 보여주는 시계열의 형태

$$ y_t = \alpha + \beta_1 t+ \beta_2 sin {{2 \pi t }\over{f}} + cos {{2\pi t} \over{f}} + e_t$$

dd4=matrix(
  c(1142, 1242, 1452, 1543, 
    1225, 1362, 1556, 1672, 
    1343, 1459, 1662, 1753, 
    1421, 1558, 1772, 1846, 
    1554, 1649, 1877, 1948))
plot(ts(dd4,start=c(2006,1),freq=4))

정상성(Stationary)

시계열 자료의 정상성은 모든 시간 t에 대하여, 평균과 분산이 일정하고 자기상관함수(Autocovariance Function, ACF) 및 부분자기상관함수(Partial Autocovariance Function, PACF)은 시간 $t_1$, $t_2$ 에만 의존한다라는 조건을 만족하는 시계열 자료를 의미한다.

자기상관, 부분자기상관

자기상관$ACF(k)$는 $t$시점과 $t+k$ 시점 사이에 선형 상관성이 있는지를 의미하며, 부분자기상관 $PACF(k)$는 $t$시점과 $t+k$ 시점 사이의 시점의 영향력을 제거한 선형 상관성이 있는지를 의미한다. 자세한 내용은 아래 링크를 참고하기 바란다.

자기상관함수와 부분자기상관함수[개선 필요]
자기상관함수와 부분자기상관함수자기상관함수와 부분자기상관함수를 좀 더 쉽게 이해하기 위해 상관계수와 부분상관함수의 개념을 알아보고 오자. 상관계수상관계수(Correlation)상관계수란 두 변수 사이의 선형 관계를 나타내는 지표로 그 수식은 아래와 같다. $$ cor(X,Y)= {{cov(X, Y)}\over{\sigma_X, \sigma_Y}}$$ $$ cov(X,Y)={{1}\over{n-1}} \sum^n_{i=