초록 열기/닫기 버튼

1998년 Faraway로부터 시작된 인공신경망 모형을 이용한 시계열 예측은 최근의 딥러닝 모형에 이르기까지 활발한 연구가 진행되고 있다. 그러나 실제 시계열 데이터에 대한 예측분석가들에 있어 인공신경망의 모형 구축은 여러 가지 해결해야 하는 문제를 남겨주고 있다. 모형 구축에서 선택해야 하는 요소로 입력노드 수, 은닉 층의 수, 은닉 층내에서의 노드의 수, 출력노드 수, 활성함수의 선택, 정규화문제 등이 있으나 특히, 신경망 모형 구축에서 선택해야 하는 요소로 입력노드의 수 결정은 매우 중요한 문제이고 이에 대한 해결방안 연구가 많은 자료분석가들에 의해 진행되고 있다. 본 연구에서는 비선형 자기상관이 사라지는 시점을 추정하는 평균상호의존정보(average mutual information: AMI)를 이용하는 방법을 제안하였다. 특히 사례분석으로 한국종합주가지수인 2019년 코스피 데이터에 대해 80 : 20의 비율로 훈련용 데이터와 검증용 데이터로 분할하여 적용하였다. 그 결과 8개의 입력노드 수가 결정되었고 최적의 모형을 만들기 위해 은닉노드 수는 2개, 출력노드 수는 1개일 경우이다. 따라서 neuralnet 패키지로 신경망 모형을 예측한 결과 검증용 데이터에서 평균제곱오차가 0.002로 나타났다.


Recently, neural netwok models provide an interesting tool for both forecasting researchers and practitioners. In a time series forecasting using neural network, it is important to decide the number of input nodes corresponds to the neural network model. Because too few or too many input nodes can affect either the learning or prediction capability of the network. However, currently there is no suggested systematic way to determine this number. Thus we propose the method to decide the number of input nodes using nonlinear autocorrelation AMI. The Average Mutual Information (AMI) measures how much one random variable tells us about another. In the context of time series analysis, AMI helps to quantify the amount of knowledge gained about the value of x(t + τ ) when observing x(t). Specially, to take into account nonlinear correlations the average mutual information (AMI) can be used. In this study, we divided the 2019 Kospi data into two portions : 80 percent for training and 20 percent for testing. We found the 8 input nodes, 1 hidden layer, 2 hidden nodes for best network model using AMI and caret package in R. And then, we predicted the test data using this neural network and found the mean squared error is 0.002.