Адаптация архитектуры нейронной сети REINVENT для генерации потенциальных ингибиторов проникновения ВИЧ-1
https://doi.org/10.37661/1816-0301-2024-21-3-80-93
Аннотация
Цели. Основной целью настоящей работы является адаптация архитектуры нейронной сети REINVENT для генерации потенциальных ингибиторов белка gp120 оболочки ВИЧ-1 с использованием в процессе обучения с подкреплением молекулярного докинга на графических процессорах.
Методы. Для модификации исходной модели сети использован внедренный в процессе обучения с покреплением молекулярный докинг на графических процессорах и разработан алгоритм, позволяющий преобразовывать генерируемые сетью SMILES представления соединений в необходимый для выполнения докинга формат PDBQT. С целью ускорения обучения нейронной сети в модифицированной версии модели REINVENT использована программа докинга AutoDock-Vina-GPU-2.1, а для уточнения результатов ее работы - процедура переоценки сродства соединений к мишени с помощью оценочной функции RFScore-4.
Результаты. С помощью модифицированной версии модели REINVENT получено более 60 000 соединений, из которых около 52 000 молекул имеют величину энергии связывания с белком gp120 ВИЧ-1, сопоставимую со значением, рассчитанным для ингибитора ВИЧ-1 NBD-14204, использованного в расчетах в качестве позитивного контроля. Из отобранных 52 000 соединений около 34 000 молекул удовлетворяют ограничениям, налагаемым на потенциальное лекарство для обеспечения его биодоступности при пероральном приеме.
Заключение. Полученные результаты позволяют продемонстрировать эффективность адаптированной нейронной сети на примере конструирования новых потенциальных ингибиторов белка gp120 ВИЧ-1, способных блокировать CD4-связывающий сайт белка gp120 оболочки вируса и предотвращать его проникновение в клетки хозяина.
Ключевые слова
Об авторах
Д. А. ВоробьевБеларусь
Воробьев Данила Александрович, стажер младшего научного сотрудника
ул. Сурганова, 6, Минск, 220012
А. Д. Карпенко
Беларусь
Карпенко Анна Дмитриевна, научный сотрудник
ул. Сурганова, 6, Минск, 220012
А. В. Тузиков
Беларусь
Тузиков Александр Васильевич, член-корреспондент, доктор физико-математических наук, профессор, заведующий лабораторией математической кибернетики
ул. Сурганова, 6, Минск, 220012
А. М. Андрианов
Беларусь
Андрианов Александр Михайлович, доктор химических наук, профессор, главный научный сотрудник
ул. академика В. Ф. Купревича, 5, корп. 2, Минск, 220141
Список литературы
1. Li H., Sze K. H., Lu G., Ballester P. Machine-learning scoring functions for structure-based virtual screening. Wiley interdisciplinary reviews: Computational Molecular Science, 2020, vol. 11. Available at: https://wires.onlinelibrary.wiley.com/doi/10.1002/wcms.1478 (accessed 20.05.2024). https://doi.org/10.1002/wcms.1478
2. Xiong G. L., Ye W. L., Shen C., Lu A. P., Hou T. J., Cao D. S. Improving structure-based virtual screening performance via learning from scoring function components. Briefings in Bioinformatics, 2020. Available at: https://academic.oup.com/bib/article/22/3/bbaa094/5851268 (accessed 20.05.2024). https://doi.org/10.1093/bib/bbaa094
3. Stokes J. M., Yang K., Swanson K., Jin W., Cubillos-Ruiz A. A deep learning approach to antibiotic discovery. Cell, 2020, vol. 180, pp. 688−702. https://doi.org/10.1016/j.cell.2020.01.021
4. Timmons P. B., Hewage C. M. ENNAVIA is a novel method which employs neural networks for antiviral and anti-coronavirus activity prediction for therapeutic peptides. Briefings in Bioinformatics, 2021. Available at: https://academic.oup.com/bib/article/22/6/bbab258/6326528 (accessed 20.05.2024). https://doi.org/10.1093/bib/bbab258
5. Andrianov A. M., Nikolaev G. I., Shuldov N. A., Bosko I. P., Anischenko A. I., Tuzikov A. V. Application of deep learning and molecular modeling to identify small drug-like compounds as potential HIV-1 entry inhibitors. Journal of Biomolecular Structure and Dynamics, 2022, vol. 40, pp. 7555–7573. https://doi.org/10.1080/07391102.2021.1905559
6. Zhang Y., Ye T., Xi H., Juhas M., Li J. Deep learning driven drug discovery: Tackling Severe Acute Respiratory Syndrome Coronavirus 2. Frontiers in Microbiology, 2021. Available at: https://www.frontiersin.org/journals/microbiology/articles/10.3389/fmicb.2021.739684/full (accessed 20.05.2024). https://doi.org/10.3389/fmicb.2021.739684
7. Kinnings S. L., Liu N., Tonge P. J., Jackson R. M., Xie L., Bourne P. E. A Machine learning-based method to improve docking scoring functions and its application to drug repurposing. Journal of Chemical Information and Modeling, 2011, vol. 51, no. 5, pp. 1195–1197. https://doi.org/10.1021/ci2001346
8. Agastheeswaramoorthy K., Sevilimedu A. Drug REpurposing using AI/ML tools − for Rare Diseases (DREAM-RD): A case study with Fragile X Syndrome (FXS). bioRxiv, 2020. Available at: https://www.biorxiv.org/content/10.1101/2020.09.25.311142v1.full.pdf (accessed 20.05.2024). https://doi.org/10.1101/2020.09.25.311142
9. Heinzelmann G., Gilson M. K. Automation of absolute protein-ligand binding free energy calculations for docking refinement and compound evaluation. Scientific Reports, 2021, vol. 11, no. 1, p. 1116. https://doi.org/10.1038/s41598-020-80769-1
10. Meli R., Morris G. M., Biggin P. C. Scoring functions for protein-ligand binding affinity prediction using structure-based deep learning: A review. Frontiers in Bioinformatics, 2022, vol. 2. Available at: https://www.frontiersin.org/journals/bioinformatics/articles/10.3389/fbinf.2022.885983/full (accessed 20.05.2024). https://doi.org/10.3389/fbinf.2022.885983
11. Metcalf D. P., Glick Z. L., Bortolato A., Jiang A., Cheney D. L., Sherrill C. D. Directional ΔG neural network (Dr ΔG-Net): A modular neural network approach to binding free energy prediction. Journal of Chemical Information and Modeling, 2024, vol. 64, no. 6, pp. 1907–1918. https://doi.org/10.1021/acs.jcim.3c02054
12. Li Y., Fan Z., Rao J., Chen Z., Chu Q., …, Li X. An overview of recent advances and challenges in predicting compound-protein interaction (CPI). Medical Review, 2023, vol. 3, no. 6, pp. 465–486. https://doi.org/10.1515/mr-2023-0030
13. Zhavoronkov A., Ivanenkov Y. A., Aliper A., Veselov M. S., Aladinskiy V. A., …, Aspuru-Guzik A. Deep learning enables rapid identification of potent DDR1 kinase inhibitors. Nature Biotechnology, 2019, vol. 37, pp. 1038–1040. https://doi.org/10.1038/s41587-019-0224-x
14. Olivecrona M., Blaschke T., Engkvist O., Chen H. J. Molecular de-novo design through deep reinforcement learning. Journal of Cheminformatics, 2017, vol. 9, p. 48. https://doi.org/10.1186/s13321-017-0235-x
15. Blaschke T., Arús-Pous J., Chen H., Margreitter C., Tyrchan C., …, Patronov A. Reinvent 2.0: an AI tool for de novo drug design. Journal of Chemical Information and Modeling, 2020, vol. 60, no. 12, pp. 5918–5922. https://doi.org/10.1021/acs.jcim.0c00915
16. Loeffler H. H., He J., Tibo A., Janet J. P., Voronov A., …, Engkvist O. Reinvent 4: Modern AI–driven generative molecule design. Journal of Cheminformatics, 2024, vol. 16, no. 20. Available at: https://jcheminf.biomedcentral.com/articles/10.1186/s13321-024-00812-5 (accessed 20.05.2024). https://doi.org/10.1186/s13321-024-00812-5
17. Trott O., Olson A. J. AutoDock Vina: Improving the speed and accuracy of docking with a new scoring function, efficient optimization, and multithreading. Journal of Computational Chemistry, 2010, vol. 31, no. 2, pp. 455–461. https://doi.org/10.1002/jcc.21334
18. Guo J., Janet J. P., Bauer M. R., Voronov A., Mervin L. H., Engkvist O. DockStream: a docking wrapper to enhance de novo molecular design. Journal of Cheminformatics, 2021, vol. 13. Available at: https://jcheminf.biomedcentral.com/articles/10.1186/s13321-021-00563-7 (accessed 20.05.2024). https://doi.org/10.1186/s13321-021-00563-7
19. Tang S., Ding J., Zhu X., Wang Z., Zhao H., Wu J. Vina-GPU 2.1: towards further optimizing docking speed and precision of AutoDock Vina and its derivatives. bioRxiv, 2023. Available at: https://www.biorxiv.org/content/10.1101/2023.11.04.565429v1.full.pdf (accessed 20.05.2024). https://doi.org/10.1101/2023.11.04.565429
20. Svensson H., Tyrchan C., Engkvist O., Chehreghani M. H. Utilizing Reinforcement learning for de novo drug design. Machine-Mediated Learning, 2024, vol. 113, no. 2, pp. 4811–4843. https://doi.org/10.1007/s10994-024-06519-w
21. Weininger D. SMILES, a chemical language and information system. Journal of Chemical Information and Computer Sciences, 1998, vol. 28, pp. 31–36. https://doi.org/10.1021/ci00057a005
22. Mnih V., Badia A. P., Mirza M., Graves A., Lillicrap T. P., …, Kavukcuoglu K. Asynchronous methods for deep reinforcement learning. Proceedings of the 33rd International Conference on Machine Learning, New York, USA, 20–22 June 2016, vol. 48, pp. 1928–1937. https://proceedings.mlr.press/v48/mniha16.html
23. Berman H. M., Battistuz T., Bhat T. N., Bluhm W. F., Bourne P., …, Zardecki C. The protein data bank. Acta Crystallographica Section D: Biological Crystallography, 2002, vol. 58, no. 6, pp. 899–907. https://doi.org/10.1093/nar/28.1.235
24. Curreli F., Kwon Y. D., Nicolau I., Burgos G., Altieri A., …, Debnath A.K. Antiviral activity and crystal structures of HIV-1 gp120 antagonists. International Journal of Molecular Sciences, 2022, vol. 23, no. 24, p. 15999. https://doi.org/10.3390/ijms232415999
25. Pettersen E. F., Goddard T. D., Huang C. C., Couch G. S., …, Ferrin T. E. UCSF Chimera – A visualization system for exploratory research and analysis. Journal of Computational Chemistry, 2004, vol. 25, no. 13, pp. 1605–1612. https://doi.org/10.1002/jcc.20084
26. Kiefer F., Arnold K., Künzli M., Bordoli L., Schwede T. The Swiss-MODEL Repository and associated resources. Nucleic Acids Research, 2009, vol. 37, pp. 387–392. https://doi.org/10.1093/nar/gkn750
27. Benson M. L., Smith R. D., Khazanov N. A., Dimcheff B., Beaver J., …, Carlson H. A. Binding MOAD, a high-quality protein–ligand database. Nucleic Acids Research, 2007, vol. 36, pp. 674–678. https://doi.org/10.1093/nar/gkm911
28. Wójcikowski M., Ballester P. J., Siedlecki P. Performance of machine-learning scoring functions in structure-based virtual screening. Scientific Reports, 2017, vol. 7, no. 1, pp. 1–10. https://doi.org/10.1038/srep46710
29. Lipinski C. A., Lombardo F., Dominy B. W., Feeney P. J. Experimental and computational approaches to estimate solubility and permeability in drug discovery and development settings. Advanced Drug Delivery Reviews, 2001, vol. 46, no. 1−3, pp. 3–26. https://doi.org/10.1016/S0169-409X(00)00129-0
30. Daina A., Michielin O., Zoete V. SwissADME: a free web tool to evaluate pharmacokinetics, drug-likeness and medicinal chemistry friendliness of small molecules. Scientific Reports, 2017, vol. 7. Available at: https://www.nature.com/articles/srep42717 (accessed 20.05.2024). https://doi.org/10.1038/srep42717
31. Veber D. F., Johnson S. R., Cheng H. Y., Smith B. R., Ward K. W., Kopple K. D. Molecular properties that influence the oral bioavailability of drug candidates. Journal of Medicinal Chemistry, 2002, vol. 45, no. 12, pp. 2615–2623. https://doi.org/10.1021/jm020017n
Рецензия
Для цитирования:
Воробьев Д.А., Карпенко А.Д., Тузиков А.В., Андрианов А.М. Адаптация архитектуры нейронной сети REINVENT для генерации потенциальных ингибиторов проникновения ВИЧ-1. Информатика. 2024;21(3):80-93. https://doi.org/10.37661/1816-0301-2024-21-3-80-93
For citation:
Varabyeu D.A., Karpenko A.D., Tuzikov A.V., Andrianov A.M. Adaptation of the REINVENT neural network architecture to generate potential HIV-1 entry inhibitors. Informatics. 2024;21(3):80-93. (In Russ.) https://doi.org/10.37661/1816-0301-2024-21-3-80-93