[번역] Using machine learning for insurance pricing optimization

출처 : https://cloud.google.com/blog/big-data/2017/03/using-machine-learning-for-insurance-pricing-optimization?1490806008189=1
구글 클라우드 빅데이트와 머신러닝 블로그

보험 가격 최적화에 머신러닝 사용하기

By Kaz Sato, Staff Developer Advocate, Google Cloud

대형 글로벌 보험 회사인 AXA는 POC에서 대규모 손실 사건을 예견하는 머신러닝을 사용해왔습니다.
* POC(Proof of Concept) : 신기술이 적용된 신제품을 직접 보고 어떻게 작동하는지를 시장에 소개하는 사전 검증

TensorFlow 머신러닝의 토대는 2015년 이후 오픈 소스인 것에 있지만, 비교적 짧은 시간에 이곳은 라이브러리를 사용하는 8000개 이상의 오픈 소스 프로젝트로 크기가 폭발적으로 증가했습니다. 또한, 이러한 증대한 관심은 언어 번역같은 자연어 처리 기능뿐만 아니라 이미지 처리를 이용한 앱에서 역할이 더욱 중요시 되는데 일조했습니다.
(피부암 감지, 당노병 성 안구 질환 진단, 오이 분류 등의 사례 포함)

또한 TensorFlow가 가격 최적화와 같은 주요 비즈니스 사용 사례를 이용하여 예측 데이터 분석을 향상시키는데 사용되기 시작했습니다. 이 글은 예를 제시하여 대형 글로벌 보험 회사인 AXA가 TensorFlow를 사용하여 구글 클라우드 머신러닝 엔진의 관리 서비스로 POC를 구축하여 고객과 관련된 대규모 손실 교통사고를 예측하는 이유를 설명하겠습니다.

사용한 경우 이해하기

AXA 고객 중 약 7-10%는 매년 교통사고를 일으킵니다. 대부분은 수백에서 수천 달러의 보험료를 포함한 소규모 사고이지만, 약 1%는 손실이 많은 소송 사건으로 10,000 달러이상의 대금 지급이 필요한 경우입니다. 예상대로 AXA 조정자는 정책의 가격 책정을 최적화하기 위해, 어떤 고객이 높은 위험에 노출되어 있는지 이해하는 것이 중요합니다.

일본에 있는 AXA의 R&D팀은 운전자가 보험 기간동안 큰 손실 사건을 일으킨 경우를 예견하기 위한 머신러닝의 사용 사례를 조사해왔습니다. 처음엔 Random Forest라 불리는 전통적인 머신러닝 기술에 집중해왔습니다. Random Forest는 유명한 알고리즘으로 예측을 위한 모델링에 다중 의사결정 트리를 사용하였습니다. Randmo Forest는 AXA의 경우처럼 특정 응용프로그램에 효율적일 수 있지만, 정확도는 40%보다 낮아서 부적절하다.

상대적으로 클라우드 머신러닝 엔진를 통한 TensorFlow를 사용한 실험적인 딥러닝 모델 개발 이후, 이 팀은 78%의 정확도를 이루어냈습니다. 이 개선을 통해 AXA는 판매 시점에서 실시간 가격 책정과 같은 새로운 보험 서비스를 갖추었을 뿐만 아니라, 보험 비용 및 가격을 최적화하는 데 상당한 이점을 얻었습니다. AXA는 초기 단계에 머물고 있습니다. 신경망을 투명하고 쉽게 디버깅 할 수 있도록 설계하면 더욱 발전 할 수 있습니다. 하지만 이러한 혁신적인 기술을 활용할 수 있다는 점이 큰 기대를 하게합니다.

이 기술은 어떻게 작동할까?

AXA는 좋지않은 테스트를 위한 멋진 데모 UI를 만들었습니다.개선 된 신경망 모델의 세부 사항을 살펴 보겠습니다.

그림1. AXA’s deep learning model demo UI

왼쪽에는 다음 과 같은 값들이 약 70개 가량 입력되어 있다.

  • 운전자의 연령대
  • 운전자의 주소 지역
  • 연간 보험료 범위
  • 자동차의 연식 범위

AXA는 이 자료들을 크기가 70인 단일 벡터에 입력하고 중간에 딥 러닝 모델을 넣었습니다. 이 모델은 ReLU를 활성화 함수로 사용하여 3개의 히든 레이어가 있는 완전히 연결된 신경망으로 모델링 하였습니다. AXA는 구글 Compute 기능의 데이터를 사용하여 TensorFlow 모델을 학습시켰으며, 클라우드 머신러닝 기능의 Hyper Tune 기능을 사용하여 하이퍼 파라미터를 조정했습니다.

다음은 최종 결과입니다. 빨간색 선은 딥 러닝 모델(78%)의 정확도를 나타냅니다.

그림2. Test results for POC

사업 자료의 TensorFlow

AXA의 경우는 머신러닝을 사용하여 사업자료를 분석 예측한 하나의 예시입니다.
다른 예시로 최근 DeepMind는 구글 데이터 센터 냉각 비용을 40% 줄이기 위해 머신러닝 모델을 사용했습니다.
이 팀은 구글 데이터 센터의 IoT센서(온도, 전력, 펌프 속도, 설정 값 등)에서 얻은 수치 값을 딥 러닝 모델에 입력하여, 기존 방법보다 더 나은 결과를 얻었습니다.

머신 러닝의 비즈니스 응용 프로그램에 대해 자세히 알아 보려면 아래 영상을 봐주십시오.
영상1. “Customer successes with machine learning”
영상2. “Transform Retail with Machine Learning: Find & Recommend products”

Advertisements