Machine Learning в коммерческих банках
По оценке компании McKinsey финансовая индустрия владеет до 25% данных, имеющихся в мире. Из них банки США хранят >1 экзабайта данных (McKinsey, 2013),
объем данных российского банковского сектора оценивается в >100 терабайт (IBS, 2013).
Традиционно, используя имеющиеся данные, розничные банки на разных уровнях управления решают задачи:
-
управления рисками;
-
клиентоориентированности;
-
оптимизации операционной деятельности.
Перед современным банком по каждой из перечисленных задач стоит целый ряд проблем. Опишем их тезисно ниже.
Клиентоориентированность
Клиенты банков становятся все более и более требовательными как к банковскому сервису, так и к банковским продуктам.
Клиентам уже не нужна «просто пластиковая карта». Клиентам нужен составной продукт, который позволит им покупать товары (offline и online);
продукт, с постоянным и удобным доступом (со смартфона, планшета, домашнего ПК); продукт, который позволит экономить средства (скидки по карте, cashback, бонусы).
Управление рисками
Модели расчет банковских рисков, скоринговые модели все более и более усложняются, одновременно со сложностью моделей (качественной сложностью) растет и объем анализируемых данных (количественная сложность).
А все увеличивающееся разнообразие способов оплаты (mPOS, мобильные платежи) и количество получателей платежей открывает все новые и новые фронты
борьбы с мошенничеством.
Оптимизация операционных затрат
Увеличение конкуренции как со стороны виртуальных банков, так и со стороны стартапов, предоставляющих финансовые сервисы
(P2P-кредитование, агрегаторы банковских счетов), вынуждают игроков на рынке банковских услуг снижать маржинальность многих банковских продуктов.
В такой ситуации «полноценным» банкам важно уменьшать операционные издержки.
Общая проблема: обработка данных
Все возрастающие объемы как внутренних данных банка (профили клиентов, журнал финансовых операций и т.д.),
так и внешних данных (данные НБКИ, отзывы в социальных сетях и т.д.) требует от банка качественно новых подходов к хранению и обработке данных.
Это лишь поверхностный список проблем, с которыми банковский сектор уже столкнулся.
Ниже мы рассмотрим практические банковские кейсы, которые решают разные части этих (и не только) проблем, а также как
симбиоз концепций Больших Данных и методов машинного обучения позволяет эти проблемы решать.