Additional Material -TabNet을 이용한 개인신용평가 모형의 성능과 해석능력 비교분석

date
2023.09.19
name
IBA lab 관리자
e-mail
view
17

<개인신용평가 관련 선행연구>

 

딥러닝 기반의 개인신용평가

개인신용평가는 소비자의 과거 금융이력을 바탕으로 미래의 채무 불이행 가능성을 신용점수 형태로 예측하는 통계적인 모형을 의미한다(Mays, 1998). 개인신용평가 관련 연구는 통계적 방법론인 로지스틱 회귀분석에서 나아가 머신러닝 및 딥러닝 기법을 적용한 연구로 확대되어 왔다(Choi, 2018; Zhen, 2019). 머신러닝 기반의 개인신용평가에는 서포트 벡터 머신, 의사결정나무, 인공신경망, 그리고 앙상블 기반의 랜덤 포레스트와 XGBoost 등이 적용되어 왔다(Li and Zhong, 2012; Dastile et al, 2020). 최근에는 딥러닝 기법을 적용한 연구도 활발히 진행되고 있다. Kvamme et al(2018)은 합성곱 신경망을 적용한 개인 연체 예측 모형이 기존 인공신경망 또는 로지스틱 회귀 모형보다 성능이 우수함을 주장하였다. Liu et al(2022)는 고객의 신용 데이터를 부스팅 기반의 고차원 행렬로 변환하고, 그래프 기반 심층 신경망을 적용한 하이브리드 형태의 예측 모형을 제안하기도 하였다. 이처럼 개인신용평가 관련 연구는 예측 성능의 향상에 초점을 맞춰 딥러닝 등 복잡도가 높은 형태로 발전해 왔다.

 

설명 가능한 인공지능

설명 가능한 인공지능(eXplainable AI, XAI)는 높은 예측력에 비해 부족한 설명력이 한계점으로 제시되는 딥러닝과 같은 인공지능 모형을 분석하여 입력에 따른 결과의 변화를 설명하는 기술이다(Adadi and Berrade, 2018). 개인신용평가를 비롯한 금융 분야에서 딥러닝이 적용된 연구가 확대되면서 모형의 예측 결과에 대한 설명을 요구하는 움직임도 증가하고 있다(Kim, 2020). Kai et al. (2022)은 NLP(Natural Language Processing) 기반의 개인의 소셜 미디어 정보와 금융 정보를 결합한 신용평가 예측 모형을 제안하고, LRP(Layerwise Relevance Propagation) 알고리즘을 적용하여 신용 위험을 설명하는 방안을 제시하였다. Liu et al(2022)는 트리 기반 부스팅 알고리즘에 앙상블 방식을 결합할 경우 신용평가 알고리즘의 성능 개선이 가능함을 주장하고, Tree SHAP 알고리즘을 이용하여 모델의 설명력을 제고하였다. 원종관&홍태호(2021)는 개인신용 데이터에 이미지 변환을 적용한 합성곱 신경망(Convolutional Neural Network) 기반의 예측 모형을 제안하고, LRP 알고리즘을 적용하여 신용평가에 영향을 미치는 변수를 파악하였다. McDonnell et al(2023)은 보험 청구 예측에 순차 어텐션(sequential attention) 기반의 단계별 변수 중요도를 저장하는 TabNet을 이용한 예측 모형을 구축하고, TabNet이 제공하는 설명 결과를 통해 보험회사와 고객 사이의 신뢰를 높일 수 있는 방안을 제시하였다.

기존 딥러닝 기반의 개인신용평가 관련 연구는 주로 SHAP와 LIME과 같이 선형 대리모형(Surrogate)을 구축하여 복잡한 딥러닝 모형을 설명하는 방식을 채택해왔다. 그러나 SHAP는 대리모형의 학습에 많은 시간과 비용이 소요된다는 단점이 존재한다(Lundberg et al., 2019). 이에 본 연구에서는 대리모형 방식이 아닌, 모형 내재적으로 설명력을 제공하는 TabNet을 통해 예측모형의 해석 결과를 도출하고, SHAP와 그 결과를 비교하여 TabNet이 제공하는 해석 결과의 효과성을 평가하고자 한다.

 

<연구 본문 참고문헌>

김하영, 허정윤 & 권호창. (2022). 인공지능 기반 금융서비스의 공정성 확보를 위한 체크리스트 제안: 인공지능 기반 개인신용평가를 중심으로. 지능정보연구, 28(3), 259-278.

원종관, 홍태호, 배경일. (2021). 신용 데이터의 이미지 변환을 활용한 합성곱 신경망과 설명 가능한 인공지능(XAI)을 이용한 개인신용평가. 정보시스템연구, 제30권 제4호 한국정보시스템학, 2021년 12월, pp. 203~226.

Arik, S. ?., & Pfister, T. (2021). TabNet: Attentive Interpretable Tabular Learning. Proceedings of the AAAI Conference on Artificial Intelligence, 35(8), 6679-6687.

Bae, J. K., & Kim, J. (2015). A Personal Credit Rating Prediction Model using Data Mining in Smart Ubiquitous Environments. International Journal of Distributed Sensor Networks, 11(9), 179060.

Bobek, S., Bałaga, P., & Nalepa, G.J. (2021). Towards Model-Agnostic Ensemble Explanations. In: Paszynski, M., Kranzlm?ller, D., Krzhizhanovskaya, V.V., Dongarra, J.J., & Sloot, P.M. (eds) Computational Science ? ICCS 2021. ICCS 2021. Lecture Notes in Computer Science, vol 12745. Springer, Cham.

Chaofan Chen, Kangcheng Lin, Cynthia Rudin, Yaron Shaposhnik, Sijia Wang, Tong Wang, (2022). A holistic approach to interpretability in financial lending: Models, visualizations, and summary-explanations, Decision Support Systems, Volume 152, 2022, 113647, 0167-9236

Jang, D. H., Ha, I. D., Park, D. J., Park, I. H. & Lee, S. J. (2020). Statistical model development for high-dimensional big data analytics. Journal of the Korean Data & Information Science Society, 31, 1009-1020.

LeCun, Y., Bengio, Y. & Hinton, G. (2015). Deep learning. Nature, 521, 436?444.

file
there is no file