초록 열기/닫기 버튼
신용카드 이상거래 탐지는 전형적인 분류 문제로 다양한 기계학습 방법들이 활용되고 있다. 본 논문에서는 공개되어 있는 실제 신용카드 거래 데이터인 Credit Card Fraud Detection 데이터와 IEEE-CIS Fraud Detection 데이터에 대해 9개의 기계학습 방법을 적용하고 그 결과를 분석했다. 실험 결과, extreme gradient boosting(XGBoost)과 light gradient boosting machine(LGBM)이 두 데이터 모두에 대해 가장 우수한 성능을 기록했다. 특히 본 논문의 Credit Card Fraud Detection 데이터에 대한 실험 결과는 기존 연구의 결과보다 우수했다. 이상거래 예측시간 측면에서는 LGBM이 XGBoost보다 30배 이상 빠른 속도를 기록했다. 본 논문에서는 이러한 결과에 기반해 gradient boosting 기반의 방법, 특히 LGBM이 신용카드 이상거래 탐지에 적합하다고 제안한다.
Credit card fraud detection is a typical classification problem. Previous studies have applied various machine learning methods to solve this problem. In this paper, we applied nine machine learning methods to two publicly available real credit card transaction datasets, i.e., the credit card fraud detection dataset and the IEEE-CIS fraud detection dataset. Our experimental results showed that extreme gradient boosting (XGBoost) and light gradient boosting machines (LGBMs) had the highest classification accuracy on both datasets. We also achieved better results than previous state-of-the-art results on the credit card fraud detection dataset. In terms of prediction time, the LGBM was more that 30 times faster than XGBoost. These results suggest that gradient boosting based methods, especially LGBM, are suitable for credit card fraud detection.
키워드열기/닫기 버튼
classification, credit card fraud detection, gradient boosting, extreme gradient boosting, light gradient boosting machines