Preview

Информатика

Расширенный поиск

Классификация займов c использованием логистической регрессии

https://doi.org/10.37661/1816-0301-2023-20-1-55-74

Аннотация

Цели. Решение задачи классификации займов имеет большое значение для финансовых институтов, которые должны эффективно распределять денежные активы между субъектами в рамках предоставления финансовых услуг. Поэтому финансовым организациям необходим инструмент наиболее точного определения надежных заемщиков. Одним из инструментов принятия таких решений служит машинное обучение. Целью работы является анализ возможности эффективного применения логистической регрессии для решения задачи классификации займов.

Метод. На основе алгоритма логистической регрессии с использованием исторических данных по выданным займам рассчитываются следующие метрики: стоимостная функция, Accuracy, Precision, Recall и мера . Полиномиальная регрессия и метод главных компонент применяются для определения оптимального набора входных данных для исследуемого алгоритма логистической регрессии.

Результаты. Оценено влияние нормализации данных на конечный результат, дана оценка влияния сбалансированности целевых значений, рассчитано оптимальное граничное значение для алгоритма логистической регрессии, рассмотрено влияние увеличения входных показателей посредством заполнения отсутствующих значений и использования полиномов разной степени. Имеющийся набор входных показателей проанализирован на избыточность.

Заключение. Результаты исследований подтверждают, что применение алгоритма логистической регрессии для решения задач классификации займов является целесообразным. Данный алгоритм позволяет быстро получить работающий инструмент классификации займов. 

Об авторах

В. И. Бегунков
Объединенный институт проблем информатики Национальной академии наук Беларуси
Беларусь

Бегунков Владимир Иванович, магистр технических наук

ул. Сурганова, 6, Минск, 220012



М. Я. Ковалев
Объединенный институт проблем информатики Национальной академии наук Беларуси
Беларусь

Ковалев Михаил Яковлевич, член-корреспондент НАН Беларуси, доктор физико-математических наук, профессор

ул. Сурганова, 6, Минск, 220012



Список литературы

1. Gerhard F., Harlalka A., Suvanam R. The coming opportunity in consumer lending. McKinsey Quarterly, 2021. Available at: https://www.mckinsey.com/business-functions/risk-and-resilience/our-insights/the-comingopportunity-in-consumer-lending (accessed 01.05.2021).

2. Hand D. J., Henley W. E. Statistical classification methods in consumer credit scoring: a review. Journal of the Royal Statistical Society: Series A (Statistics in Society), 1997, vol. 160, no. 3, pp. 523–541.

3. Baesens B., Van Gestel T., Viaene S., Stepanova S., Suykens J., Vanthienen J. Benchmarking state-of-theart classification algorithms for credit scoring. Journal of the Operational Research Society, 2003, vol. 54, no. 6, pp. 627–635.

4. Lessmann S., Baesens B., Seow H.-V., Thomas L. C. Benchmarking state-of-the-art classification algorithms for credit scoring: an update of research. European Journal of Operational Research, 2015, vol. 247, no. 1, pp. 124–136.

5. Shalev-Shwartz S., Ben-David S. Understanding Machine Learning: From Theory to Algorithms. Cambridge University Press, 2014, pp. 125, 126–127.

6. Geron A. Hands-on Machine Learning with Scikit-Learn, Keras, and TensorFlow, 2nd edition. O’Reilly Media, 2019, pp. 144–149.

7. Murphy K. P. Machine Learning: A Probabilistic Perspective (Adaptive Computation and Machine Learning Series). The MIT Press, 2012, pp. 225–227, 387–407.

8. Harrington P. Machine Learning in Action, 1st edition. Manning Publication Co, 2012, pp. 86–91, 148, 269–279.

9. Fawcett T. An introduction to ROC analysis. Pattern Recognition Letters, 2006, vol. 27, no. 8, pp. 861–874.

10. Metz C. E. Basic principles of ROC analysis. Seminars in Nuclear Medicine, 1978, vol. 8, no. 4, pp. 283–298.

11. Kelleher J. D., Namee B. M., D’Arcy A. Fundamentals of Machine Learning for Predictive Data Analytics, 1st edition. The MIT Press, 2015, pp. 142–143, 539.

12. Gerhard F., Harlalka A., Suvanam R. The coming opportunity in consumer lending. McKinsey Quarterly, 2021. Available at: https://www.mckinsey.com/business-functions/risk-and-resilience/our-insights/the-comingopportunity-in-consumer-lending (accessed 01.05.2021).

13. Hand D. J., Henley W. E. Statistical classification methods in consumer credit scoring: a review. Journal of the Royal Statistical Society: Series A (Statistics in Society), 1997, vol. 160, no. 3, pp. 523–541.

14. Baesens B., Van Gestel T., Viaene S., Stepanova S., Suykens J., Vanthienen J. Benchmarking state-of-theart classification algorithms for credit scoring. Journal of the Operational Research Society, 2003, vol. 54, no. 6, pp. 627–635.

15. Lessmann S., Baesens B., Seow H.-V., Thomas L. C. Benchmarking state-of-the-art classification algorithms for credit scoring: an update of research. European Journal of Operational Research, 2015, vol. 247, no. 1, pp. 124–136.

16. Shalev-Shwartz S., Ben-David S. Understanding Machine Learning: From Theory to Algorithms. Cambridge University Press, 2014, pp. 125, 126–127.

17. Geron A. Hands-on Machine Learning with Scikit-Learn, Keras, and TensorFlow, 2nd edition. O’Reilly Media, 2019, pp. 144–149.

18. Murphy K. P. Machine Learning: A Probabilistic Perspective (Adaptive Computation and Machine Learning Series). The MIT Press, 2012, pp. 225–227, 387–407.

19. Harrington P. Machine Learning in Action, 1st edition. Manning Publication Co, 2012, pp. 86–91, 148, 269–279.

20. Fawcett T. An introduction to ROC analysis. Pattern Recognition Letters, 2006, vol. 27, no. 8, pp. 861–874.

21. Metz C. E. Basic principles of ROC analysis. Seminars in Nuclear Medicine, 1978, vol. 8, no. 4, pp. 283–298.

22. Kelleher J. D., Namee B. M., D’Arcy A. Fundamentals of Machine Learning for Predictive Data Analytics, 1st edition. The MIT Press, 2015, pp. 142–143, 539.


Рецензия

Для цитирования:


Бегунков В.И., Ковалев М.Я. Классификация займов c использованием логистической регрессии. Информатика. 2023;20(1):55-74. https://doi.org/10.37661/1816-0301-2023-20-1-55-74

For citation:


Behunkou U.I., Kovalyov M.Y. Loan classification using logistic regression. Informatics. 2023;20(1):55-74. (In Russ.) https://doi.org/10.37661/1816-0301-2023-20-1-55-74

Просмотров: 326


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1816-0301 (Print)
ISSN 2617-6963 (Online)