Классификация займов c использованием логистической регрессии
https://doi.org/10.37661/1816-0301-2023-20-1-55-74
Аннотация
Цели. Решение задачи классификации займов имеет большое значение для финансовых институтов, которые должны эффективно распределять денежные активы между субъектами в рамках предоставления финансовых услуг. Поэтому финансовым организациям необходим инструмент наиболее точного определения надежных заемщиков. Одним из инструментов принятия таких решений служит машинное обучение. Целью работы является анализ возможности эффективного применения логистической регрессии для решения задачи классификации займов.
Метод. На основе алгоритма логистической регрессии с использованием исторических данных по выданным займам рассчитываются следующие метрики: стоимостная функция, Accuracy, Precision, Recall и мера . Полиномиальная регрессия и метод главных компонент применяются для определения оптимального набора входных данных для исследуемого алгоритма логистической регрессии.
Результаты. Оценено влияние нормализации данных на конечный результат, дана оценка влияния сбалансированности целевых значений, рассчитано оптимальное граничное значение для алгоритма логистической регрессии, рассмотрено влияние увеличения входных показателей посредством заполнения отсутствующих значений и использования полиномов разной степени. Имеющийся набор входных показателей проанализирован на избыточность.
Заключение. Результаты исследований подтверждают, что применение алгоритма логистической регрессии для решения задач классификации займов является целесообразным. Данный алгоритм позволяет быстро получить работающий инструмент классификации займов.
Ключевые слова
Для цитирования:
Бегунков В.И., Ковалев М.Я. Классификация займов c использованием логистической регрессии. Информатика. 2023;20(1):55-74. https://doi.org/10.37661/1816-0301-2023-20-1-55-74
For citation:
Behunkou U.I., Kovalyov M.Y. Loan classification using logistic regression. Informatics. 2023;20(1):55-74. (In Russ.) https://doi.org/10.37661/1816-0301-2023-20-1-55-74