Одне з найконсервативніших аспектів фінансів, рішення про кредитування когось, трансформується завдяки керованому ШІ скорингу кредитоспроможності. Це поступова зміна для осіб, чия кредитна історія багата і хто працював з банками протягом тривалого періоду часу. Проте це може змінити життя позичальників з обмеженою кредитною історією та тих, хто працює в неформальній економіці. Вони нарешті можуть бути виявлені, на відміну від того, щоб бути невидимими для системи. Ця стаття обговорює застосування альтернативних даних для створення кредитних рейтингів на основі ШІ для фізичних осіб та малого бізнесу, які не мають традиційної кредитної історії, ризик несправедливості та упередженості, коли дані бюро недоступні, та регуляторне прагнення створити пояснюваний ШІ в андеррайтингу населення з обмеженим доступом до банківських послуг.
Традиційні кредитні рейтинги передбачають певну фінансову присутність. Вони припускають, що фізична особа має банківський рахунок, формальні фінансові продукти, і раніше брала позику або користувалася кредитною карткою. Вони передбачають, що роботодавці ведуть зарплатну відомість формальним способом, а торговці працюють у видимій частині економіки — задокументованій частині. На практиці колосальна частка світу не така. Молоді дорослі часто не мають позик або карток. Мігранти можуть мати хорошу кредитну історію в країнах свого походження і нічого в нових. Більшість їхніх транзакцій здійснюється готівкою або на цифрових платформах, які не звітують бюро: гіг-працівники, вуличні торговці, неформальні власники магазинів та велика кількість мікропідприємців. Там, де є бюро, навіть їхнє охоплення може бути поверхневим або упередженим щодо міського, формально працевлаштованого населення. Файл бюро таких заявників виглядає порожнім або майже порожнім для кредиторів. Оскільки команди з управління ризиками навчені довіряти даним бюро, вони помиляються на користь обережності. Результат передбачуваний: збільшення відхилень, звужені ліміти, підвищені ціни або повне виключення.
Ці позичальники не обов'язково ризикованіші; просто система глуха і сліпа до сигналів, які фактично характеризують їхнє фінансове життя. Базова концепція застосування ШІ до кредитного скорингу тут проста. Де статистики бюро бракує або вона занадто розріджена, шукайте в іншому місці. У сучасному житті існує численна кількість цифрових слідів. Коли такі сліди збираються відповідально із згодою та перетворюються на більш організовані сигнали, вони можуть розповісти багато про стабільність людини, її потенціал заробітку та шанси на погашення. Одним з перших і найціннішим джерелом часто є телекомунікаційні дані. Мобільні оператори розуміють, як хтось поповнює передплачені баланси на регулярній основі, чи використовують вони той самий номер протягом років або переключаються часто, чи є вони стабільними або хаотичними в своїй діяльності, і чи придбавають вони пакети даних однакового розміру. Особа, яка зберігає один номер з часом, поповнює номер і демонструє послідовні моделі використання, загалом більш глибоко вкорінена в спільноті і більш послідовна у своїй поведінці порівняно з тим, хто припиняє або коливається у використанні. Наявність стабільності пов'язана зі зниженим кредитним ризиком.
Ще одним джерелом потужності є електронна комерція та дані з цифрових платформ. Мало що може міститися у файлі бюро водія служби виклику таксі, але платформа може отримати доступ до кількості поїздок, доходу за тиждень, даних про скасування, відгуків клієнтів та тривалості роботи водія. Мікромерчант як продавець на торговому майданчику залишає історію виконаних замовлень, здійснених повернень коштів, поданих скарг, відсутності товару на складі та моделей зростання. У випадку неформального бізнесу дані платформи можуть використовуватися як найближчий еквівалент офіційної фінансової звітності. Далі є банківський рахунок, цифровий гаманець та дані про рух грошових коштів API відкритого банкінгу. Хоча позичальник може не мати довгої кредитної історії, він або вона також має рахунок, куди зараховується зарплата, дохід від гіг-економіки, грошові перекази або дохід від бізнесу. Через аналіз часових надходжень та відтоків кредитори можуть оцінити загальний дохід, його мінливість, чи є у нього буфери чи ні, і яка частина доходу вже була виділена на регулярні витрати, такі як оренда, комунальні послуги та існуючі борги. У випадку позичальника з обмеженим доступом до банківських послуг андеррайтинг руху грошових коштів часто є більш надійним, ніж традиційна скоркарта, яка так сильно покладається на минулі позики. Ще один рівень забезпечують API зарплати та працевлаштування.
У ситуаціях, коли роботодавці підключені до зарплатних сервісів, кредитори можуть підтвердити працевлаштування, щомісячний заробіток, тривалість працевлаштування та зміни компенсації. Для тих, хто має кілька робіт на неповний робочий день, це композитне зображення буде набагато інформативнішим, ніж одна платіжна відомість. Нарешті, при правильному використанні поведінкові дані та дані на рівні пристрою можуть використовуватися для допомоги як у виявленні шахрайства, так і в оцінці ризиків. Тривалість часу, протягом якого особа використовує той самий пристрій, регулярність їхніх місць входу, як вони використовують застосунок протягом місяців, а також час доби, коли вони зазвичай здійснюють транзакції, можуть надати показники справжності та стабільності. Ці сигнали слід обробляти обережно, щоб запобігти опосередкованій дискримінації, хоча вони можуть бути корисною підтримкою. Всі ці джерела пов'язані тим фактом, що вони розповідають про реальне життя людини і як вона живе, як вона заробляє та платить, навіть коли ясно, що вона ніколи не торкалася кредитної картки у своєму житті.
\
Ці інші джерела даних густо заповнені та неструктуровані. Структура телекомунікаційних журналів, подій платформи, банківських транзакцій та телеметрії пристроїв не така, як у традиційного звіту бюро. Вони галасливі, багатовимірні та наповнені моделями ідіосинкразії. На цьому етапі необхідний ШІ, зокрема сучасне машинне навчання. Загальний життєвий цикл починається з агрегації даних. Кредитори мають доступ до телекомунікаційних партнерів, каналів відкритого банкінгу, API зарплати та партнерів платформи за умови законів про захист даних та прямої згоди клієнтів.
Вони поглинають необроблені дані в безпечні середовища та нормалізують їх. Діяльність з поповнення телефону, кредит гаманця та замовлення електронної комерції перетворюються на часові ряди, які мають регулярні формати. Непотрібні аномалії та дублікати усуваються, а відсутні значення обробляються. З цього конструюються функції фахівцями з даних. Вони створюють зведені змінні, а не просто подають всі необроблені транзакції в модель: середній щомісячний чистий рух грошових коштів; частка місяців, коли заощадження позитивні; найдовший послідовний період без платежів кредиторам; місяці недоотримання доходів; зростання або зниження доходів платформи; мінливість робочих годин; постійність місцезнаходження тиждень за тижнем.
Ці атрибути намагаються стиснути економічне життя особи в числа, які можуть бути перетравлені моделлю. Градієнтні бустингові дерева, випадкові ліси та нейронні мережі є алгоритмами машинного навчання, які навчаються на історичних даних, де результат вже відомий. У випадку кредитного скорингу результатом зазвичай є дефолт позичальника протягом визначеного періоду часу, скажімо, шести або дванадцяти місяців. Модель дізнається комбінації функцій, які вказують на більший або менший ризик. Моделі, знайдені серед людських андеррайтерів, не були б виявлені людською проникливістю, як незначні взаємодії між волатильністю руху грошових коштів та терміном роботи на платформі. Валідація є критичною. Модель застосовується до даних, на яких вона не була навчена, щоб її продуктивність була реальною, а не результатом перенавчання.
Показники, такі як AUC, коефіцієнт Джині та статистика Колмогорова–Смірнова, використовуються для вимірювання потужності дискримінації, тоді як калібрувальні графіки вказують, чи ідентичні передбачувані ймовірності фактичним ставкам дефолту. На додаток до головних цифр кредитори повинні дивитися на продуктивність на основі сегмента: нові позичальники проти досвідчених позичальників, різні професії, регіони та діапазони доходів. Після розгортання модель буде оцінювати нових заявників на льоту, і відповідь буде надана протягом кількох секунд. Процес не може закінчитися там. Статистика змінюється з часом, платформи розвивають свої політики, і макроекономіка розвивається.
\
:::tip Ця історія була розповсюджена як реліз Санєю Капуром в рамках Програми бізнес-блогінгу HackerNoon.
:::
\


![Зростання [M] від Memecore на 15% знищує ведмедів – чи повертається $2,50 у гру?](https://i0.wp.com/ambcrypto.com/wp-content/uploads/2026/02/Editors-2026-02-06T183428.393-1000x600.jpg)
