Комплексный анализ данных при исследовании сложных биомолекулярных систем
https://doi.org/10.37661/1816-0301-2021-18-1-105-122
Аннотация
Развитие биомолекулярных технологий напрямую связано с разработкой эффективных методов и алгоритмов обработки большого объема информации, получаемой с помощью современного высокопроизводительного экспериментального оборудования. В числе приоритетных задач – разработка перспективных инструментов анализа и интерпретации биофизической информации с использованием методов анализа больших данных и компьютерных моделей.
Предложен комплексный подход к обработке больших наборов данных на основе методов интеллектуального анализа данных и имитационного моделирования, позволяющий определять параметры биофизических и оптических процессов, происходящих в сложных биомолекулярных системах. Идея комплексного подхода состоит в использовании имитационного моделирования биофизических процессов, протекающих в объекте исследования, сравнении отобранных методами снижения размерности смоделированных и наиболее информативных экспериментальных данных, определении характеристик исследуемых процессов с применением алгоритмов интеллектуального анализа данных.
Рассмотрено применение разработанного подхода для исследования бимолекулярных систем в экспериментах флуоресцентной спектроскопии. Эффективность алгоритмов подхода проверена в ходе анализа смоделированных и экспериментальных данных, представляющих системы молекул и белков. Применение комплексного анализа повышает эффективность исследования биофизических систем в ходе анализа больших данных.
Об авторах
Н. Н. ЯцковБеларусь
Яцков Николай Николаевич, кандидат физико-математических наук, доцент кафедры системного анализа и компьютерного моделирования, факультет радиофизики и компьютерных технологий
пр. Независимости, 4, 220030
В. В. Апанасович
Беларусь
Апанасович Владимир Владимирович, доктор физико-математических наук, профессор
пр. Независимости, 4, 220030
Список литературы
1. Компьютерные технологии и анализ данных (CTDA’2020) : материалы II Междунар. науч.-практ. конф., Минск, 23–24 апр. 2020 г. / Белорус. гос. ун-т ; редкол. : В. В. Скакун (отв. ред.) [и др.]. – Минск : БГУ, 2020. – 299 с.
2. Квантовая электроника : материалы XII Междунар. науч.-техн. конф., Минск, 18–22 нояб. 2019 г. / редкол. : М. М. Кугейко (отв. ред.) [и др.]. – Минск : РИВШ, 2019. – 320 с.
3. Информационные технологии и системы (ИТС 2019) : материалы Междунар. науч. конф., БГУИР, Минск, 30 окт. 2019 г. / редкол. : Л. Ю. Шилин [и др.]. – Минск : БГУИР, 2019. – 305 с.
4. Chen, J. Integrations between autonomous systems and modern computing techniques: a mini review / J. Chen, M. Abbod, J.-S. Shieh // Sensors. – September 2019. – Vol. 19, iss. 18. – Р. 3897.
5. Klinger, C. M. Small genomes and big data: adaptation of plastid genomics to the high-throughput era / C. M. Klinger, E. Richardson // Biomolecules. – July 2019. – Vol. 9, iss. 8. – Р. 299.
6. The potential use of big data in oncology / S. M. Willems [et al.] // Oral Oncology. – 2019. – Vol. 98. – P. 8–12.
7. Bramer, M. Principles of Data Mining / M. Bramer. – 2nd ed. – London : Springer, 2013. – 440 p.
8. Aggarwal, C. C. Data Mining: The Textbook / C. C. Aggarwal. – Gewerbestrasse : Springer, 2015. – 734 p.
9. Hastie, T. The Elements of Statistical Learning. Data Mining, Inference, and Prediction / T. Hastie, R. Tibshirani, J. Friedman. – 2nd ed. – N. Y. : Springer, 2009. – 739 p.
10. Machine learning approaches for the estimation of biological aging: the road ahead for population studies / A. Gialluisi [et al.] // Frontiers in Medicine. – July 2019. – Vol. 6. – P. 146.
11. Jiang, P. Big data approaches for modeling response and resistance to cancer drugs / P. Jiang, W. R. Sellers, X. S. Liu // Annual Review of Biomedical Data Science. – July 2018. – Vol. 1. – Р. 1–27.
12. Duran, J. M. Computer Simulations in Science and Engineering / J. M. Duran. – Springer International Publishing, 2018. – 209 p.
13. Zeigler, B. P. Theory of Modeling and Simulation / B. P. Zeigler, A. Muzy, E. Kofman. – 3rd ed. – Academic Press, 2018. – 692 p.
14. Toward computational modelling on immune system function / F. Pappalardo [et al.] // BMC Bioinformatics. – December 2019. – Vol. 20, suppl. 6. – Р. 622.
15. Computational models of epileptiform activity / F. Wendling [et al.] // J. of Neuroscience Methods. – 2016. – Vol. 260. – P. 233–251.
16. Physiologically based pharmacokinetic (PBPK) modeling and simulation approaches: a systematic review of published models, applications, and model verification / J. E. Sager [et al.] // Drug Metabolism and Disposition. – 2015. – Vol. 43. – P. 1823–1837.
17. Modelling the effect of compliance with nordic nutrition recommendations on cardiovascular disease and cancer mortality in the nordic countries / S. Saha [et al.] // Nutrients. – June 2019. – Vol. 11, no. 6. – Р. 1434.
18. Periyasamy, V. Advances in Monte Carlo simulation for light propagation in tissue / V. Periyasamy, M. Pramanik // IEEE Reviews in Biomedical Engineering. – 2017. – Vol. 10. – P. 122–135.
19. Subramanian, A. S. R. Modeling and simulation of energy systems: a review / A. S. R. Subramanian, T. Gundersen, T. A. Adams // Processes. – November 2018. – Vol. 6, iss. 12. – Р. 238.
20. Modeling and simulation as support for development of human health space exploration projects / A. G. Bruzzone [et al.] // Proc. of the 9th EUROSIM Congress on Modelling and Simulation, EUROSIM 2016, the 57th SIMS Conf. on Simulation and Modelling SIMS 2016, Oulu, Finland, 12–16 Sept. 2016. – Oulu, 2016. – P. 1109–1115.
21. Fluorescence Spectroscopy and Microscopy: Methods and Protocols. Methods in Molecular Biology / eds. Y. Engelborghs, A. J. W. G. Visser. – Heidelberg : Springer Science+Business Media, LLC, 2014. – 816 p.
22. Yatskou, M. Сomputer Simulation of Energy Relaxation and Transport in Organized Porphyrin Systems / M. Yatskou. – The Netherlands, Wageningen : Ponsen & Looijen Printing Establishment, 2001. – 176 p.
23. Комплексный анализ данных при исследовании сложных биомолекулярных систем / Н. Н. Яцков, В. В. Апанасович // Квантовая электроника : материалы XII Междунар. науч.-техн. конф., Минск, 18–22 нояб. 2019 г. – Минск : РИВШ, 2019. – С. 282–283.
24. Исследование биофизических систем с использованием алгоритмов интеллектуального анализа данных и имитационного моделирования / Н. Н. Яцков, В. В. Апанасович // Компьютерные технологии и анализ данных (CTDA’2020) : материалы II Междунар. науч.-практ. конф., Минск, 23–24 апр. 2020 г. – Минск : БГУ, 2020. – С. 120–123.
25. Tang, J. Simulation and Computational Red Teaming for Problem Solving / J. Tang, G. Leu, H. A. Abbass. – New Jersey : John Wiley & Sons, Inc., 2020. – 464 p.
26. Design and evaluation of actichip, a thematic microarray for the study of the actin cytoskeleton / J. Muller [et al.] // BMC Genomics. – Aug. 2007. – Vol. 8. – Р. 294.
27. Advanced spot quality analysis in two-colour microarray experiments / M. Yatskou [et al.] // BMC Research Notes. – Sept. 2008. – Vol. 1. – Р. 80.
28. Al-Ajlan, A. Feature selection for gene prediction in metagenomic fragments / A. Al-Ajlan, A. El Allali // BioData Mining. – 2018. – Vol. 11. – Р. 9.
29. Разработка алгоритмов и программных средств классификации кодирующих и некодирующих нуклеотидных последовательностей / В. Р. Закирова [и др.] // Информатика. – 2019. – Т. 16, № 2. – С. 111–120.
30. Яцков, Н. Н. Интеллектуальный анализ данных : пособие / Н. Н. Яцков. – Минск : БГУ, 2014. – 151 с.
31. Шакла, Н. Машинное обучение и TensorFlow / Н. Шакла. – СПб. : Питер, 2019. – 336 с.
32. Исследование методов классификации для анализа сегментированных объектов на люминесцентных изображениях раковых клеток / Е. В. Лисица [и др.] // Вестник Полоцкого гос. ун-та. Сер. C. Фундаментальные науки. – 2020. – № 4. – С. 15–22.
33. Изучение структуры Zn-порфиринов методами флуоресцентной спектроскопии / В. В. Апанасович [и др.] // Журнал прикладной спектроскопии. – 1999. – Т. 66, № 4. – C. 549–552.
34. Excitation energy migration in a photonic dye-zeolite antenna: computational techniques / M. Meyer [et al.] // J. of Computational Methods in Science and Engineering. – 2003. – Vol. 3. – P. 395–402.
35. Dimov, I. T. Monte Carlo Methods for Applied Scientists / I. T. Dimov. – Singapore : World Scientific Publishing Co. Pte. Ltd. – 2008. – 291 p.
36. Rubinstein, R. Y. Simulation and the Monte Carlo Method / R. Y. Rubinstein, D. P. Kroese. – 3rd ed. – New Jersey : John Wiley & Sons, Inc., 2017. – 414 p.
37. Binder, K. Monte Carlo Simulation in Statistical Physics / K. Binder, D. W. Heermann. – 6th ed. – Springer International Publishing, 2019. – 258 p.
38. A mathematical model of actin filament turnover for fitting FRAP data / A. A. Halavatyi [et al.] // European Biophysical J. – 2010 – Vol. 39, no. 4. – P. 669–677.
39. Apanasovich, V. V. Data analysis in time-resolved fluorescence spectroscopy using computer simulation / V. V. Apanasovich, E. G. Novikov, N. N. Yatskov // Proc. of SPIE. – 1997. – Vol. 2980. – P. 495–502.
40. Анализ кинетики затухания флуоресценции сложных молекулярных систем с использованием метода Монте-Карло / В. В. Апанасович, Е. Г. Новиков, Н. Н. Яцков // Журнал прикладной спектроскопии. – 2000. – Т. 67, № 5. – С. 612–618.
41. Вьюгин, В. В. Математические основы машинного обучения и прогнозирования / В. В. Вьюгин. – М. : МЦНМО, 2014. – 304 с.
42. Kohavi, R. A study of cross-validation and bootstrap for accuracy estimation and model selection / R. Kohavi // Proc. of the 14th Intern. Joint Conf. on Artificial Intelligence IJCAI'95, Montreal, Canada, 20–25 Aug. 1995. – Montreal, 1995. – Vol. 2. – P. 1137–1143.
43. Encyclopedia of Database Systems / Eds. L. Liu, M. T. Ozsu. – USA : Springer Science+Business Media, LLC, 2009. – 4355 p.
44. Lakowicz, J. R. Principles of Fluorescence Spectroscopy / J. R. Lakowicz. – 3rd ed. – N. Y. : Springer, 2006. – 954 p.
45. A study of energy transfer processes in zinc-porphyrin films using Monte Carlo simulation of fluorescence decay / M. М. Yatskou [et al.] // Chemical Physics Letters. – 2001. – Vol. 345, no. 1, 2. – P. 141–150.
46. Non-isotropic excitation energy transport in organized molecular systems: Monte Carlo simulation-based analysis of time-resolved fluorescence / M. М. Yatskou [et al.] // J. of Physical Chemistry A. – 2001. – Vol. 105, no. 41. – P. 9498–9508.
47. Molecular Cell Biology / ed. H. Lodish [et al.]. – 5th ed. – USA : W. H. Freeman Hardcover, 2003. – 973 p.
48. Molecular Biology of the Gene / J. D. Watson [et al.]. – 6th ed. – USA : Cold Spring Harbor Laboratory Press, 2007. – 880 p.
49. Льюин, Б. Гены / Б. Льюин ; пер. с 9-го англ. изд. – М. : БИНОМ. Лаборатория знаний, 2012. – 896 с.
50. Shendure, J. Next-generation DNA sequencing / J. Shendure, H. Ji // Nature Biotechnology. – 2008. – Vol. 26, no. 10. – P. 1135–1145.
51. Metzker, M. L. Sequencing technologies – the next generation / M. L. Metzker // Nature Reviews Genetics. – 2010. – Vol. 11, no. 1. – P. 31–46.
52. Классификация последовательностей РНК с помощью сверточных нейронных сетей / И. В. Климук [и др.] // Компьютерные технологии и анализ данных (CTDA’2020) : материалы II Междунар. науч.-практ. конф., Минск, 23–24 апр. 2020 г. – Минск : БГУ, 2020. – С. 142–146.
53. Яцков, Н. Н. Автоматическое определение открытых рамок считывания в молекулах РНК человека с использованием алгоритмов векторизации и классификации / Н. Н. Яцков, В. В. Скакун, В. В. Гринев // Информационные технологии и системы (ИТС 2019) : материалы Междунар. науч. конф., Минск, 30 окт. 2019 г. – Минск : БГУИР, 2019. – С. 292–293.
54. Яцков, Н. Н. Вычислительный подход и программный пакет RNAexploreR для группировки молекул РНК генов человека по их экзонным признакам / Н. Н. Яцков, В. В. Скакун, В. В. Гринев // Информатика. – 2019. – Т. 16, № 4. – С. 7–24.
55. Bumgarner, R. Overview of DNA microarrays: types, applications, and their future / R. Bumgarner // Current Protocols in Molecular Biology. – Jan. 2013. – Vol. 101, iss. 1. – Р. 22.1.1–22.1.11.
56. Giganti, A. The actin cytoskeleton as a therapeutic target: state of the art and future directions / A. Giganti, E. Friederich // Progress in Cell Cycle Research. – 2003. – Vol. 5. – P. 511–525.
57. Pollard, T. D. Actin and actin-binding proteins / T. D. Pollard // Cold Spring Harbor Perspectives in Biology. – Aug. 2016. – Vol. 8, no 8. – Р. a018226.
58. Kitamura, A. State-of-the-art fluorescence fluctuation-based spectroscopic techniques for the study of protein aggregation / A. Kitamura, M. Kinjo // Intern. J. of Molecular Sciences. – Mar. 2018. – Vol. 19, iss. 4. – Р. 964.
59. An integrative simulation model linking major biochemical reactions of actin-polymerization to structural properties of actin filaments / A. A. Halavatyi [et al.] // Biophysical Chemistry. – 2009 – Vol. 140. – P. 24–34.
60. Quantitative kinetic study of the actin-bundling protein l-plastin and of its impact on actin turn-over / Z. Al Tanoury [et al.] // Public Library of Science (PLoS) One. – 2010. – Vol. 5, no. 2. – Р. 669–677.
61. Имитационная модель трехканальных люминесцентных изображений популяций раковых клеток / Е. В. Лисица [и др.] // Журнал прикладной спектроскопии. – 2014. – Т. 81, № 6. – С. 907–913.
62. Алгоритм автоматической сегментации границ ядер раковых клеток на трехканальных люминесцентных изображениях / Е. В. Лисица [и др.] // Журнал прикладной спектроскопии. – 2015. – Т. 82, № 4. – С. 598–607
63. Яцков, Н. Н. Метод исследования флуоресценции молекулярных соединений с использованием алгоритмов интеллектуального анализа данных / Н. Н. Яцков, В. В. Скакун, В. В. Апанасович // Прикладные проблемы оптики, информатики, радиофизики и физики конденсированного состояния: материалы Пятой Междунар. науч.-практ. конф., Минск, 16–17 мая 2019 г. – Минск: Ин-т прикл. физ. проблем им. А. Н. Севченко БГУ, 2019. – С. 125–127.
64. Яцков, Н. Н. Метод обработки кинетических кривых затухания флуоресценции с использованием алгоритмов интеллектуального анализа данных / Н. Н. Яцков, В. В. Скакун, В. В. Апанасович // Журнал прикладной спектроскопии. – 2020. – Т. 87, № 2. – С. 311–322.
65. Электронные спектры и кинетика поляризации флуоресценции тонких пленок Zn-порфиринов / Н. Н. Яцков [и др.] // Журнал прикладной спектроскопии. – 2003. – Т. 70, № 3. – С. 335–339.
66. Excitation energy migration in a photonic dye-zeolite antenna / M. Yatskou [et al.] // European J. of Chemical Physics and Physical Chemistry. – 2003. – Vol. 4(6). – P. 567–587.
67. Яцков, Н. Н. Метод комплексного анализа спектров флуктуации флуоресценции молекулярных соединений / Н. Н. Яцков, В. В. Скакун, В. В. Апанасович // Прикладные проблемы оптики, информатики, радиофизики и физики конденсированного состояния: материалы Пятой Междунар. науч.-практ. конф., Минск, 16–17 мая 2019 г. – Минск : Ин-т прикл. физ. проблем им. А. Н. Севченко БГУ, 2019. – С. 122–124.
68. Комплексный анализ флуктуаций интенсивности флуоресценции молекулярных соединений / Н. Н. Яцков [и др.]. // Журнал прикладной спектроскопии. – 2020. – Т. 87, № 4. – С. 628–636.
Дополнительные файлы
Рецензия
Для цитирования:
Яцков Н.Н., Апанасович В.В. Комплексный анализ данных при исследовании сложных биомолекулярных систем. Информатика. 2021;18(1):105-122. https://doi.org/10.37661/1816-0301-2021-18-1-105-122
For citation:
Yatskou M.M., Apanasovich V.V. Data analysis in complex biomolecular systems. Informatics. 2021;18(1):105-122. (In Russ.) https://doi.org/10.37661/1816-0301-2021-18-1-105-122