Чонджин Ку, Мэнчун Чжоу и И Ли 13 декабря 2019 г.

Микрокредитование, как одно из направлений микрофинансирования, предназначено для преодоления сбоев кредитного рынка и оказания помощи заемщикам с низким доходом в использовании преимуществ повышенной финансовой доступности и инвестиционных возможностей (J-PAL, 2018). Важнейшим аспектом микрокредитования является кредитный скоринг, который позволяет финансовым учреждениям оценивать кредитоспособность потенциальных заемщиков. Подход к кредитному скорингу в настоящее время эволюционировал благодаря наличию нетрадиционных или альтернативных данных и технологическому прогрессу в преобразовании этих данных в кредитные баллы. «Андеррайтинг риска в микрофинансировании традиционно был сосредоточен на платежеспособности заявителя, но теперь он смещается в сторону моделей платежеспособности, которые учитывают характер заявителя» (Всемирный банк, 2017). В этом эссе сначала рассматриваются некоторые факты, касающиеся альтернативного кредитного скоринга: данные, которые он использует, процесс кредитного скоринга и две компании, которые предоставляют услуги альтернативного кредитного скоринга. Во второй половине отчета мы подробно рассматриваем проблемы и риски, связанные с альтернативным кредитным скорингом. Это связано с тем, что большая часть рассуждений об использовании альтернативного кредитного скоринга подчеркивает понятие «включения» и охвата лиц, которые ранее не имели доступа к кредитам или финансовым услугам, но мало внимания уделяется риску «исключения», которое может возникнуть в результате этого нового практики могут привести (Privacy International, без даты).

Основные сведения
Микрокредитование – это предоставление небольших займов бедным заемщикам, у которых нет залога, постоянной работы или подтвержденной кредитной истории. Кредитный скоринг является важной частью этого процесса кредитования, поскольку он помогает кредиторам и финансовым учреждениям оценить кредитоспособность потенциального заемщика при принятии решения о том, давать деньги взаймы или нет.

Различные типы подходов к оценке кредитоспособности
Традиционно люди использовали методы субъективной оценки и статистической оценки кредитоспособности. Для субъективной оценки он использует определенные параметры, такие как опыт работы в бизнесе, прибыльность и располагаемый доход, для анализа кредитного риска кредитными экспертами. Для статистического кредитного скоринга он собирает количественные данные на основе характеристик клиентов, кредитов и кредиторов и использует математические формулы для получения результата, отражающего риск заемщика («Кредитный скоринг», 2003).

Хотя эти традиционные инструменты оценки широко используются в течение многих лет, прогноз, который они дают, может быть неточным из-за ограниченного набора точек данных. Кроме того, то, как они работают, также может помешать людям, не имеющим официальной кредитной истории, получить доступ к кредиту. Для решения этих проблем внедряются новые системы кредитного скоринга на основе больших данных. Они сочетают обычную кредитную информацию с нетрадиционной информацией, основанной на офлайн- и онлайн-активностях потенциальных заемщиков, и включают в процесс оценки более сложные алгоритмы и методы моделирования (Hurley & Adebayo, 2016).

Существует множество различных источников нетрадиционных или альтернативных данных: социальные сети, психометрия, краткосрочный кредит, банковское дело, телекоммуникации, арендная плата и коммунальные платежи, данные о покупках и многое другое. Идея этих систем заключается в том, что «все данные — это кредитные данные». То есть большинство нетрадиционных данных не имеют прямого отношения к кредитоспособности, но мы могли бы связать их с входными переменными в скоринговых моделях. Более подробное объяснение конкретных источников данных и подход к преобразованию этих данных в кредитные баллы будут объяснены ниже.

Один из подходов заключается в использовании психометрического тестирования в кредитной практике. Он основан на предположении, что некоторые личные качества заемщиков можно использовать для прогнозирования их будущей готовности погасить долги. Обычно потенциальных заемщиков просят пройти 30-минутный психометрический тест. Вопросы касаются личности, интеллекта, честности и добросовестности. Позже эти ответы будут переведены в количественные данные и введены в скоринговую модель, посредством которой будет генерироваться кредитный результат (Aitken, 2017).

Другой подход — использование данных из социальных сетей. Он присваивает кредитные баллы на основе информации о действиях людей в социальных сетях. Он собирает данные о том, сколько у вас друзей в Facebook, сколько твитов вы публикуете в день и о чем эти твиты, и все это может подразумевать ваше текущее финансовое положение и прогнозировать ваше финансовое поведение в будущем. Например, кредитная компания Neo оценивает качество и количество контактов заявителя в LinkedIn. Анализируя эти данные, компания прогнозирует, как скоро уволенный заемщик снова будет трудоустроен (Eichelberger, 2013). Если соискатель собирается быстро найти работу, то вероятность того, что он не выплатит кредит, меньше. Таким образом, его кредитный рейтинг будет повышен на основе этого рассмотрения.

Последний подход для объяснения — использование мобильных данных. Оценочные компании могут извлекать необработанные данные, такие как транзакции мобильного кошелька, записи звонков и SMS-сообщений, а также историю просмотров в Интернете, с мобильных телефонов заявителей. Опять же, все эти необработанные данные можно использовать в качестве индикаторов доходов потенциальных заемщиков и информации о занятости. В дополнение к этому они также могут указывать финансовые навыки заявителей, профиль потребления и социальный капитал, которые тесно связаны с кредитоспособностью людей («Мобильный кредит», n.d.).

Альтернативный процесс оценки кредитоспособности
После определения различных типов нетрадиционных данных, используемых в альтернативных подходах к оценке кредитоспособности, выполняется полный процесс оценки кредитоспособности. Как правило, он проходит четыре этапа. Прежде всего, кредиторы или скоринговые компании должны определить, в чем заключается проблема и какие конкретные риски они хотят прогнозировать. Это повлияет на то, какие данные им необходимо собирать и какую модель оценки использовать. Следующим шагом является сбор соответствующих необработанных данных и преобразование их в форму, которую может обрабатывать компьютер. После сбора огромного количества данных начинают работать алгоритмы машинного обучения. Он просеивает и сортирует данные, помогая оценивающим компаниям определить, какие входные переменные являются наиболее важными, тесно связанными с проблемой, а также имеют наибольший прогностический потенциал. Кроме того, он определяет соответствующие веса для каждой из выбранных входных переменных. Чем важнее входная переменная, тем больший вес ей будет присвоен. На заключительном этапе все взвешенные переменные будут введены в скоринговую модель для получения итогового кредитного рейтинга. (Херли и Адебайо, 2016 г.).

Одним из преимуществ использования машинного обучения в процессе оценки является то, что всякий раз, когда собираются новые данные, алгоритмы машинного обучения автоматически изменяют наиболее значимые входные переменные и их веса, что приводит к корректировке модели оценки. Такая непрерывная корректировка может повысить точность окончательной оценки.

Примеры применения
Ниже представлены два случая предоставления услуг по альтернативному кредитному скорингу. LendoEFL, первый случай, в основном предоставляет услуги для развивающихся стран, а Experian Boost, второй случай, представляет собой услугу в Соединенных Штатах.
Кейс 1: LenddoEFL
LenddoEFL — это финтех-компания, которая предоставляет услуги кредитного скоринга с использованием традиционных инструментов андеррайтинга и нетрадиционных данных, а также цифровой проверки. LenddoEFL, основанная в 2011 году со штаб-квартирой в Сингапуре, изначально сама предлагала кредиты. В 2015 году он открыл свои технологии для третьих сторон, таких как банки, кредитные учреждения и компании-эмитенты кредитных карт по всему миру, и больше не предлагал кредиты самостоятельно. По состоянию на 2019 год Lenddo утверждает, что набрала более 5 миллионов человек и работает более чем в 15 странах (Индонезия, Филиппины, Кения, Австралия и т. Д.). In работает в рамках миссии «улучшения финансовой доступности не менее 1 миллиарда человек во всем мире с использованием кредитного скоринга и социальной проверки на основе нетрадиционных данных».

В частности, для своей службы кредитного скоринга они используют как традиционные, так и нетрадиционные данные. Примеры традиционных данных, которые они используют, включают данные о заявителях, данные кредитного бюро и внутренние данные. Для нетрадиционных данных они используют телекоммуникационные данные, данные истории браузера, мобильные данные, социальные сети, данные финансовых транзакций, психометрические данные и многое другое. Алгоритмы Lenddo вводят большой объем данных.
Используя широкий спектр данных и передовые методы машинного обучения, алгоритмы прогнозирования Lenddo анализируют 12 000 переменных и выдают кредитный рейтинг. (Для этого требуется согласие заявителей на совместное использование определенных разрешений, известное как процесс «адаптации».) Кредитный рейтинг, называемый LenddoScore, колеблется от 0 до 1000, причем более высокие баллы представляют более низкую склонность к дефолту. Для подсчета очков требуется менее 3 минут. Результаты службы, как утверждает LenddoEFL, заключаются в том, что финансовые учреждения, использующие LenddoScore, в среднем увеличили уровень одобрения на 15% и снизили уровень неплатежей на 12%.

Пример 2: Experian Boost
Experian Boost — это услуга, предоставляемая Experian, одним из трех крупнейших национальных агентств кредитной информации в США, для повышения рейтинга FICO с использованием нетрадиционных или альтернативных данные. Рейтинги FICO от Fair Isaac Corporation являются наиболее широко используемыми кредитными баллами в Соединенных Штатах. Он рассчитывается на основе информации в кредитном отчете физического лица. Большинство кредитных баллов имеют диапазон от 300 до 850 баллов. Чем выше оценка, тем ниже риск для кредиторов. Хороший кредитный рейтинг считается в диапазоне 670-739 баллов. Категории, учитываемые при расчете FICO Score, включают: историю платежей (35%), суммы задолженности (30%), продолжительность кредитной истории (15%), структуру кредита (10%) и новый кредит (10%). Такая информация, как доход, сбережения, оплата счетов за коммунальные услуги, статус работы, дебетовые операции, не влияет на оценку.
В отличие от оценок FICO, в которых используются только традиционные данные, Experian Boost использует нетрадиционные данные, а именно данные о финансовых банковский счет) в отношении счетов за телефон и коммунальные услуги, чтобы повысить традиционно начисляемые, но наиболее широко используемые оценки FICO. Чтобы использовать эту услугу, потребители должны предоставить Experian разрешение на подключение к своим банковским онлайн-счетам для передачи своих данных в кредитный файл Experian. Услуга бесплатная, весь процесс занимает около 5 минут.

Что касается результатов, Experian утверждает, что 75% потребителей с баллами FICO ниже 680 могут улучшить свои кредитные рейтинги с помощью Experian Boost, а 10% пользователей, у которых ранее был тонкий файл (недостаточно кредитной истории), стали поддаваться оценке после использования сервиса. Кроме того, пользователи в среднем повысили свои оценки FICO на 13 баллов.

Проблемы и риски
Несмотря на то, что альтернативные данные и новые алгоритмические методы меняют способ предоставления микрокредитов, они все же создают некоторые неотъемлемые проблемы и риски, требующие пристального внимания (Всемирный банк, 2017 г.). Проблемы конфиденциальности и прозрачности, дискриминации и проблемы с качеством данных обсуждаются ниже.

Конфиденциальность и прозрачность
Увеличение объема данных может помешать конфиденциальности. Как известно, Дуглас Мерилл, генеральный директор Zest Finance и бывший ИТ-директор Google, сказал: « Все данные — кредитные данные». Из-за огромного увеличения цифрового следа, доступного благодаря широкому использованию интеллектуальных мобильных устройств и Интернета, а также технологического прогресса в преобразовании этих данных в альтернативный кредитный рейтинг, множество данных стали уже доступными или потенциально полезными источниками для кредитных данных. . Одной из самых больших проблем, связанных с использованием разнообразных нетрадиционных методов, является проблема конфиденциальности, поскольку данные, используемые для оценки кредитоспособности, становятся более разнообразными и конфиденциальными. В отчете Privacy International (2017 г.) приводятся примеры кенийских финтех-компаний, использующих альтернативные данные для оценки кредитоспособности, что может вызвать опасения по поводу вопросов конфиденциальности. Например, Tala — это финтех-компания, которая предоставляет небольшие кредиты (до 500 долларов США) с помощью приложения для смартфона. Это приложение запрашивает у пользователей различные разрешения, включая доступ к установленным приложениям, журналу вызовов, содержимому SMS-сообщений и местоположению через GPS. Приложение Tala загружает данные на серверы компании каждые 24 часа, независимо от того, открыл ли пользователь приложение. На основе полученных данных компания рассчитывает платежеспособность потенциальных клиентов. Один из способов сделать это — посмотреть, погашают ли люди свои кредиты и как, проанализировав содержание SMS-сообщений для записи о платежах M-Pesa, услугах мобильных денежных переводов в Кении. Тала не останавливается на этом, но также анализирует журналы вызовов, вероятно, неожиданный источник данных для кредитного скоринга. (Их анализ показал, что люди, которые регулярно звонят своей семье, на 4% чаще возвращают кредит.)

В отчет Privacy International включены результаты опроса потребителей альтернативных кредитных скоринговых услуг в Кении и Колумбии, проведенного Omidyar Network. Результаты показывают, что 82% респондентов ответили на звонки и текстовые данные в частном порядке, что выше, чем такие данные, как медицинские и финансовые данные. Это говорит о том, что люди позволяют своим наиболее закрытым источникам данных кредитным скоринговым компаниям.

Наряду со звонками и текстовыми данными, еще одним источником данных, который вызывает озабоченность по поводу конфиденциальности, являются данные социальных сетей. Забота о конфиденциальности особенно актуальна при сборе информации о «друзьях» клиентов в социальных сетях. Из-за характера данных социальных сетей большинство данных с платформ социальных сетей являются интерактивными, что означает, что при сборе информации о конкретном клиенте неизбежно получение информации о друзьях клиентов. Это может быть проблематично, поскольку друзья клиентов в социальных сетях не давали согласия на сбор их информации. Проблема конфиденциальности становится еще более серьезной, если финтех-компании активно собирают, хранят и анализируют дополнительные данные друзей клиентов в социальных сетях. Это может быть случай LendoEFL. До того, как Facebook решил ограничить объем информации, доступной сторонним сервисам в 2015 году (Lorenzetti, 2016), LenddoEFL активно использовал данные Facebook в качестве источника для альтернативного кредитного скоринга. Privacy International (2018) утверждает, что есть основания полагать, что LendoEFL собирала дополнительную информацию о друзьях клиентов в Facebook в их учетных записях. В 2015 году LenddoEFL заявила, что они хранят и анализируют около 113 миллионов отношений между более чем 120 миллионами профилей. В это число, вероятно, входят лица, не являющиеся клиентами, поскольку по состоянию на 2017 год LenddoEFL обработала всего около 5 миллионов кредитных заявок.

Контроль над данными может препятствовать конфиденциальности. Еще одна угроза конфиденциальности заключается в том, что финтех-компании могут сохранять доступ к данным (Privacy International, 2017). После получения данных эти компании хранят, хранят и анализируют данные даже после того, как пользователи перестали быть их клиентами. Кроме того, персональные данные клиентов могут быть одним из «передаваемых активов» при продаже финтех-компании другой компании (Privacy International, 2017). Это вполне возможно, поскольку большая часть финтех-стартапов финансируется за счет венчурного капитала, а это означает, что стартапы ищут стратегию выхода (т. е. продажи). В этом случае клиенты не имеют ни малейшего представления о том, кто будет контролировать их данные и будут ли их данные надежно защищены в будущем.

Скрытый метод оценки кредитоспособности может препятствовать прозрачности. Системы скоринга на основе больших данных, которые используются многими альтернативными компаниями по оценке кредитоспособности, в настоящее время рассматриваются как охраняемая коммерческая тайна, что потенциально препятствует прозрачности альтернативного метода оценки кредитоспособности (Hurley & Adebayo, 2017). Конечно, традиционные методы кредитного скоринга не являются идеальными примерами прозрачности, но они менее связаны с прозрачностью из-за использования в качестве источников данных небольшого количества «интуитивно связанных» данных с финансовым поведением клиентов. Однако в альтернативных методах оценки используются факторы, которые не имеют интуитивной связи с финансовым поведением (Hurley & Adebayo, 2017). Секретность и отсутствие прозрачности альтернативных инструментов оценки кредитоспособности затрудняют оценку того, используют ли они неточные данные, рассматривают ли они чувствительные признаки (раса, пол и т. д.) или воспроизводят дискриминацию.

Дискриминация
Дискриминация при альтернативном кредитном скоринге в отношении определенной группы людей является сложной проблемой. На самом деле дискриминация различается в зависимости от обстоятельств и наносит ущерб интересам разных групп. Некоторые из дискриминации могут быть преднамеренными, а некоторые из них вызваны неотъемлемыми характеристиками инструментов машинного обучения.

Дискриминация некоторых конфиденциальных признаков. Хотя в действующих федеральных законах США есть некоторые правила защиты от дискриминации в процессе оценки кредитоспособности, их недостаточно для решения существующих проблем и опасений. Например, хотя ECOA (Закон о равных кредитных возможностях) запрещает кредиторам принимать решения о кредитовании на основе чувствительных факторов, таких как пол, раса и этническая принадлежность, он игнорирует другие чувствительные характеристики, такие как сексуальная ориентация. Эта проблема дискриминации применима не только к инструментам оценки больших данных, но также вызывает несправедливость в традиционных инструментах оценки кредитоспособности. Необходимо принять некоторые меры, такие как внесение поправок в действующий закон и заполнение пробелов в существующей системе, чтобы убедиться, что инструменты оценки кредитных компаний не оценивают потребителей по всем неизменяемым характеристикам или определенным чувствительным функциям.

Дискриминация по прокси-данным. Хотя действующий федеральный закон США запрещает сбор информации о конфиденциальных характеристиках, таких как раса, при оценке кредитоспособности, модели машинного обучения могут находить некоторые прокси-статистику, связанную с расой, а затем интерпретировать кредитоспособность человека в расистский способ. Многие альтернативные модели кредитного скоринга собирают географическую информацию и соотносят ее с кредитным риском. Например, кредитные данные часто извлекаются и кодируются в зависимости от IP-адреса, почтового индекса или данных переписи населения, и все они могут указывать географические параметры для оценки кредитоспособности (Hurley & Adebayo, 2016). Местоположение служит очень типичным показателем расы и дохода, поскольку весьма вероятно, что люди, живущие в одном районе, будут иметь схожий расовый состав и уровень дохода. С появлением социальных сетей алгоритм может также собирать информацию о кластерах социальных сетей. Люди с высокой степенью корреляции в социальных сетях могут быть сгруппированы вместе, и их кредитный рейтинг будет оцениваться иначе, чем в других группах. Кроме того, как только эти шаблоны устанавливаются в определенных наборах алгоритмов, они становятся все более важными переменными (Aitken, 2017). Алгоритмы будут придавать большее значение прокси-переменным в процессе кредитного скоринга. В результате будущие правила должны решить потенциальную проблему дискриминации на основе доверенных лиц, запретив использование моделей, которые рассматривают как значимые любые точки данных или комбинации точек данных, которые сильно коррелируют с конфиденциальными характеристиками и принадлежностью (Hurley & Adebayo, 2016). ).

Дискриминация неграмотных групп. Психометрическая оценка данных является очень показательным примером альтернативной оценки кредитоспособности. Однако в психометрических тестах часто используются анкеты и тесты для получения ответов от потенциального клиента, которые в основном оценивают людей по вербальным и арифметическим навыкам. Эти методы измерения предполагают определенный уровень образования респондентов и, таким образом, естественным образом исключают неграмотную группу из доступа к финансовым услугам и продуктам, смещая потенциальных клиентов в сторону более образованных. Таким образом, соответствующий закон должен требовать от провайдера кредитного скоринга учитывать сегментацию заемщика по уровню образования и возрасту при разработке методов кредитного скоринга. Например, они могут проводить личные интервью с людьми, не умеющими хорошо читать.

Фальшивые данные и неточные данные
Данные анкеты.
Поскольку психометрические инструменты обычно представляют собой анкеты с самоотчетами, существует понятное опасение, что ответы могут быть подделаны или сфальсифицированы. Другими словами, ответы на некоторые вопросы, такие как склонность и привычка к сбережениям, могут быть изменены респондентом, поскольку они хотят иметь более высокий кредитный рейтинг и получить кредит. Другими словами, кредитору можно сказать то, что он хочет услышать, и он возьмет на себя риск, связанный с нечестными ответами клиентов. Чтобы смягчить эту проблему, психометрические инструменты могут включать вопросы без правильных или неправильных ответов. Например, заемщиков могут попросить подтвердить одно из следующих утверждений: «Я тщательно организую свои финансы» или «Я избегаю рискованных финансовых ситуаций». Компания по оценке кредитоспособности EFL утверждает, что ее метод позволяет избежать этой ловушки, предоставляя пользователям возможность выбрать ответ «Я не понимаю вопрос»; и упрощая оценку, спрашивая пользователей, насколько, по их мнению, применимы к ним те или иные утверждения, используя скользящую шкалу (Business Insider Intelligence, 2017). Кроме того, кредитная компания также может разработать алгоритм для выявления неискренних шаблонов ответов и времени ответа, который можно использовать для дисквалификации таких результатов (Fine, 2019).

Поведенческие данные. Если заемщики знают, что их поведение и связи в социальных сетях имеют значение при рассмотрении их кредитоспособности, у них есть стимулы изменить круг своих друзей, отображаемый в социальных сетях, или установить связь с определенными людьми (людьми с низкий кредитный рейтинг) менее заметны. Влияние образования таких эндогенных связей на точность оценки потребительского кредита неоднозначно. Результаты могут стать более точными в результате изменений в социальных сетях, но это повышение точности может быть связано с большей фрагментацией сети (Wei et al., 2018). Это может усугубить социальное отчуждение уже находящихся в неблагоприятном финансовом положении и недостаточно охваченных банковскими услугами групп.

Неточные данные. Альтернативные данные могут быть неточными и не могут показать реальную кредитоспособность клиентов в некоторых ситуациях. Например, с записями об использовании телефона проблема зубрежки потенциально может привести к понижению оценки, если человек не может обнаружить злонамеренные платежи со стороны различных служб, что приводит к увеличению счетов. Коммунальные платежи также не являются идеальным альтернативным источником данных — сезонные всплески энергопотребления в некоторых регионах могут существенно изменить финансовое положение малообеспеченных групп населения, играя на их счетах в невыгодном для себя направлении (MEDICI, 2018). Кроме того, потребители не совсем понимают, какие альтернативные данные используются и обрабатываются в процессе кредитного скоринга, что может помешать им найти и исправить любые неточности. Бремя обеспечения точности не должно ложиться на потребителя. Поскольку инструменты оценки кредитоспособности включают в себя больше точек данных, многие из которых потребителям может быть трудно проверить или оспорить, закон должен переложить бремя точности на плечи самих кредитных оценщиков (Hurley & Adebayo, 2016).

Альтернативный кредитный скоринг и некоторые проблемы