Минимальные требования к данным

Табл. 1. Минимальный набор полей для исходной таблицы
Название поля Формат Описание
TermintСрок кредита
OpenDatedd.mm.yyyyНачало месяца выдачи (активации) кредита
ViewDatedd.mm.yyyyНачало месяца наблюдения
RiskClass fromintНачальный риск класс
RiskClass tointКонечный риск класс
DebtfloatОбъем основного долга в начальном риск классе на начало месяца наблюдения
Transited debtfloatОбъем основного долга, который перешел из одного риск класса в другой риск класс
Transited InterestfloatОбъем процентных платежей, оплаченных банку при переходе из одного риск класса в другой риск класс
MOBintВозраст поколения кредитов в месяцах

Определение риск класса:
0 – нет просрочки
1 – просрочка от 1 до 30 дней
2 – просрочка от 31 до 60 дней
3 – просрочка от 61 до 90 дней
4 – просрочка от 91 до 120 дней
5 – просрочка более 120 дней (Write off)
100 – платежи в банк (Pay down)

Данные по всем кредитам группируются по сроку (Term), по поколению (OpenDate), по месяцу наблюдений (ViewDate), по риск классу на начало месяца наблюдения (RiskClass from), по риск классу в который перешло часть основного долга за период месяца наблюдения (RiskClass to).

Табл. 2. Пример для потребительских кредитов. Несколько строк исходной базы предназначенной для загрузки в информационно-аналитическую систему Roll Rate Analytic System.
Term OpenDate ViewDate RiskClass from RiskClass to Debt Transited debt Transited Interest MOB
2401.03.200701.10.20080012314249151751221119
2401.03.200701.10.200801123142496220019
2401.03.200701.10.20081021817254501153419
2401.03.200701.10.2008112181725792643219
2401.03.200701.10.20081221817268170019

В начале жизни все кредиты сосредоточены в риск классе 0 (то есть без просрочек), затем в следующем месяце появляется просрочка 1, затем 2, 3 и так далее, при этом из риск класса в предыдущем месяце RiskClass from кредиты мигрируют в другие состояния RiskClass to. Так если объем долга в RiskClass from был равен Debt, то за следующий месяц в RiskClass to переходит некоторая часть от Debt, которую мы обозначаем как Transited debt (Transited debt <= Debt), причем ViewDate пробегает все значения начиная с OpenDate по текущий момент. А возраст поколения кредитов MOB = ViewDate - OpenDate пробегает множество значений от  0 до текущего возраста поколения в месяцах.

Подготовка базы это важнейший процесс, от качества данных зависит и качество модели.

Назад