Preview

Информатика

Расширенный поиск

Комплексный анализ данных при исследовании сложных биомолекулярных систем

https://doi.org/10.37661/1816-0301-2021-18-1-105-122

Полный текст:

Аннотация

Развитие биомолекулярных технологий напрямую связано с разработкой эффективных методов и алгоритмов обработки большого объема информации, получаемой с помощью современного высокопроизводительного экспериментального оборудования. В числе приоритетных задач – разработка перспективных инструментов анализа и интерпретации биофизической информации с использованием методов анализа больших данных и компьютерных моделей.

Предложен комплексный подход к обработке больших наборов данных на основе методов интеллектуального анализа данных и имитационного моделирования, позволяющий определять параметры биофизических и оптических процессов, происходящих в сложных биомолекулярных системах. Идея комплексного подхода состоит в использовании имитационного моделирования биофизических процессов, протекающих в объекте исследования, сравнении отобранных методами снижения размерности смоделированных и наиболее информативных экспериментальных данных, определении характеристик исследуемых процессов с применением алгоритмов интеллектуального анализа данных.

Рассмотрено применение разработанного подхода для исследования бимолекулярных систем в экспериментах флуоресцентной спектроскопии. Эффективность алгоритмов подхода проверена в ходе анализа смоделированных и экспериментальных данных, представляющих системы молекул и белков. Применение комплексного анализа повышает эффективность исследования биофизических систем в ходе анализа больших данных.

Об авторах

Н. Н. Яцков
Белорусский государственный университет
Беларусь

Яцков Николай Николаевич, кандидат физико-математических наук, доцент кафедры системного анализа и компьютерного моделирования, факультет радиофизики и компьютерных технологий

пр. Независимости, 4, 220030



В. В. Апанасович
Белорусский государственный университет
Беларусь

Апанасович Владимир Владимирович, доктор физико-математических наук, профессор

пр. Независимости, 4, 220030



Список литературы

1. Компьютерные технологии и анализ данных (CTDA’2020) : материалы II Междунар. науч.-практ. конф., Минск, 23–24 апр. 2020 г. / Белорус. гос. ун-т ; редкол. : В. В. Скакун (отв. ред.) [и др.]. – Минск : БГУ, 2020. – 299 с.

2. Квантовая электроника : материалы XII Междунар. науч.-техн. конф., Минск, 18–22 нояб. 2019 г. / редкол. : М. М. Кугейко (отв. ред.) [и др.]. – Минск : РИВШ, 2019. – 320 с.

3. Информационные технологии и системы (ИТС 2019) : материалы Междунар. науч. конф., БГУИР, Минск, 30 окт. 2019 г. / редкол. : Л. Ю. Шилин [и др.]. – Минск : БГУИР, 2019. – 305 с.

4. Chen, J. Integrations between autonomous systems and modern computing techniques: a mini review / J. Chen, M. Abbod, J.-S. Shieh // Sensors. – September 2019. – Vol. 19, iss. 18. – Р. 3897.

5. Klinger, C. M. Small genomes and big data: adaptation of plastid genomics to the high-throughput era / C. M. Klinger, E. Richardson // Biomolecules. – July 2019. – Vol. 9, iss. 8. – Р. 299.

6. The potential use of big data in oncology / S. M. Willems [et al.] // Oral Oncology. – 2019. – Vol. 98. – P. 8–12.

7. Bramer, M. Principles of Data Mining / M. Bramer. – 2nd ed. – London : Springer, 2013. – 440 p.

8. Aggarwal, C. C. Data Mining: The Textbook / C. C. Aggarwal. – Gewerbestrasse : Springer, 2015. – 734 p.

9. Hastie, T. The Elements of Statistical Learning. Data Mining, Inference, and Prediction / T. Hastie, R. Tibshirani, J. Friedman. – 2nd ed. – N. Y. : Springer, 2009. – 739 p.

10. Machine learning approaches for the estimation of biological aging: the road ahead for population studies / A. Gialluisi [et al.] // Frontiers in Medicine. – July 2019. – Vol. 6. – P. 146.

11. Jiang, P. Big data approaches for modeling response and resistance to cancer drugs / P. Jiang, W. R. Sellers, X. S. Liu // Annual Review of Biomedical Data Science. – July 2018. – Vol. 1. – Р. 1–27.

12. Duran, J. M. Computer Simulations in Science and Engineering / J. M. Duran. – Springer International Publishing, 2018. – 209 p.

13. Zeigler, B. P. Theory of Modeling and Simulation / B. P. Zeigler, A. Muzy, E. Kofman. – 3rd ed. – Academic Press, 2018. – 692 p.

14. Toward computational modelling on immune system function / F. Pappalardo [et al.] // BMC Bioinformatics. – December 2019. – Vol. 20, suppl. 6. – Р. 622.

15. Computational models of epileptiform activity / F. Wendling [et al.] // J. of Neuroscience Methods. – 2016. – Vol. 260. – P. 233–251.

16. Physiologically based pharmacokinetic (PBPK) modeling and simulation approaches: a systematic review of published models, applications, and model verification / J. E. Sager [et al.] // Drug Metabolism and Disposition. – 2015. – Vol. 43. – P. 1823–1837.

17. Modelling the effect of compliance with nordic nutrition recommendations on cardiovascular disease and cancer mortality in the nordic countries / S. Saha [et al.] // Nutrients. – June 2019. – Vol. 11, no. 6. – Р. 1434.

18. Periyasamy, V. Advances in Monte Carlo simulation for light propagation in tissue / V. Periyasamy, M. Pramanik // IEEE Reviews in Biomedical Engineering. – 2017. – Vol. 10. – P. 122–135.

19. Subramanian, A. S. R. Modeling and simulation of energy systems: a review / A. S. R. Subramanian, T. Gundersen, T. A. Adams // Processes. – November 2018. – Vol. 6, iss. 12. – Р. 238.

20. Modeling and simulation as support for development of human health space exploration projects / A. G. Bruzzone [et al.] // Proc. of the 9th EUROSIM Congress on Modelling and Simulation, EUROSIM 2016, the 57th SIMS Conf. on Simulation and Modelling SIMS 2016, Oulu, Finland, 12–16 Sept. 2016. – Oulu, 2016. – P. 1109–1115.

21. Fluorescence Spectroscopy and Microscopy: Methods and Protocols. Methods in Molecular Biology / eds. Y. Engelborghs, A. J. W. G. Visser. – Heidelberg : Springer Science+Business Media, LLC, 2014. – 816 p.

22. Yatskou, M. Сomputer Simulation of Energy Relaxation and Transport in Organized Porphyrin Systems / M. Yatskou. – The Netherlands, Wageningen : Ponsen & Looijen Printing Establishment, 2001. – 176 p.

23. Комплексный анализ данных при исследовании сложных биомолекулярных систем / Н. Н. Яцков, В. В. Апанасович // Квантовая электроника : материалы XII Междунар. науч.-техн. конф., Минск, 18–22 нояб. 2019 г. – Минск : РИВШ, 2019. – С. 282–283.

24. Исследование биофизических систем с использованием алгоритмов интеллектуального анализа данных и имитационного моделирования / Н. Н. Яцков, В. В. Апанасович // Компьютерные технологии и анализ данных (CTDA’2020) : материалы II Междунар. науч.-практ. конф., Минск, 23–24 апр. 2020 г. – Минск : БГУ, 2020. – С. 120–123.

25. Tang, J. Simulation and Computational Red Teaming for Problem Solving / J. Tang, G. Leu, H. A. Abbass. – New Jersey : John Wiley & Sons, Inc., 2020. – 464 p.

26. Design and evaluation of actichip, a thematic microarray for the study of the actin cytoskeleton / J. Muller [et al.] // BMC Genomics. – Aug. 2007. – Vol. 8. – Р. 294.

27. Advanced spot quality analysis in two-colour microarray experiments / M. Yatskou [et al.] // BMC Research Notes. – Sept. 2008. – Vol. 1. – Р. 80.

28. Al-Ajlan, A. Feature selection for gene prediction in metagenomic fragments / A. Al-Ajlan, A. El Allali // BioData Mining. – 2018. – Vol. 11. – Р. 9.

29. Разработка алгоритмов и программных средств классификации кодирующих и некодирующих нуклеотидных последовательностей / В. Р. Закирова [и др.] // Информатика. – 2019. – Т. 16, № 2. – С. 111–120.

30. Яцков, Н. Н. Интеллектуальный анализ данных : пособие / Н. Н. Яцков. – Минск : БГУ, 2014. – 151 с.

31. Шакла, Н. Машинное обучение и TensorFlow / Н. Шакла. – СПб. : Питер, 2019. – 336 с.

32. Исследование методов классификации для анализа сегментированных объектов на люминесцентных изображениях раковых клеток / Е. В. Лисица [и др.] // Вестник Полоцкого гос. ун-та. Сер. C. Фундаментальные науки. – 2020. – № 4. – С. 15–22.

33. Изучение структуры Zn-порфиринов методами флуоресцентной спектроскопии / В. В. Апанасович [и др.] // Журнал прикладной спектроскопии. – 1999. – Т. 66, № 4. – C. 549–552.

34. Excitation energy migration in a photonic dye-zeolite antenna: computational techniques / M. Meyer [et al.] // J. of Computational Methods in Science and Engineering. – 2003. – Vol. 3. – P. 395–402.

35. Dimov, I. T. Monte Carlo Methods for Applied Scientists / I. T. Dimov. – Singapore : World Scientific Publishing Co. Pte. Ltd. – 2008. – 291 p.

36. Rubinstein, R. Y. Simulation and the Monte Carlo Method / R. Y. Rubinstein, D. P. Kroese. – 3rd ed. – New Jersey : John Wiley & Sons, Inc., 2017. – 414 p.

37. Binder, K. Monte Carlo Simulation in Statistical Physics / K. Binder, D. W. Heermann. – 6th ed. – Springer International Publishing, 2019. – 258 p.

38. A mathematical model of actin filament turnover for fitting FRAP data / A. A. Halavatyi [et al.] // European Biophysical J. – 2010 – Vol. 39, no. 4. – P. 669–677.

39. Apanasovich, V. V. Data analysis in time-resolved fluorescence spectroscopy using computer simulation / V. V. Apanasovich, E. G. Novikov, N. N. Yatskov // Proc. of SPIE. – 1997. – Vol. 2980. – P. 495–502.

40. Анализ кинетики затухания флуоресценции сложных молекулярных систем с использованием метода Монте-Карло / В. В. Апанасович, Е. Г. Новиков, Н. Н. Яцков // Журнал прикладной спектроскопии. – 2000. – Т. 67, № 5. – С. 612–618.

41. Вьюгин, В. В. Математические основы машинного обучения и прогнозирования / В. В. Вьюгин. – М. : МЦНМО, 2014. – 304 с.

42. Kohavi, R. A study of cross-validation and bootstrap for accuracy estimation and model selection / R. Kohavi // Proc. of the 14th Intern. Joint Conf. on Artificial Intelligence IJCAI'95, Montreal, Canada, 20–25 Aug. 1995. – Montreal, 1995. – Vol. 2. – P. 1137–1143.

43. Encyclopedia of Database Systems / Eds. L. Liu, M. T. Ozsu. – USA : Springer Science+Business Media, LLC, 2009. – 4355 p.

44. Lakowicz, J. R. Principles of Fluorescence Spectroscopy / J. R. Lakowicz. – 3rd ed. – N. Y. : Springer, 2006. – 954 p.

45. A study of energy transfer processes in zinc-porphyrin films using Monte Carlo simulation of fluorescence decay / M. М. Yatskou [et al.] // Chemical Physics Letters. – 2001. – Vol. 345, no. 1, 2. – P. 141–150.

46. Non-isotropic excitation energy transport in organized molecular systems: Monte Carlo simulation-based analysis of time-resolved fluorescence / M. М. Yatskou [et al.] // J. of Physical Chemistry A. – 2001. – Vol. 105, no. 41. – P. 9498–9508.

47. Molecular Cell Biology / ed. H. Lodish [et al.]. – 5th ed. – USA : W. H. Freeman Hardcover, 2003. – 973 p.

48. Molecular Biology of the Gene / J. D. Watson [et al.]. – 6th ed. – USA : Cold Spring Harbor Laboratory Press, 2007. – 880 p.

49. Льюин, Б. Гены / Б. Льюин ; пер. с 9-го англ. изд. – М. : БИНОМ. Лаборатория знаний, 2012. – 896 с.

50. Shendure, J. Next-generation DNA sequencing / J. Shendure, H. Ji // Nature Biotechnology. – 2008. – Vol. 26, no. 10. – P. 1135–1145.

51. Metzker, M. L. Sequencing technologies – the next generation / M. L. Metzker // Nature Reviews Genetics. – 2010. – Vol. 11, no. 1. – P. 31–46.

52. Классификация последовательностей РНК с помощью сверточных нейронных сетей / И. В. Климук [и др.] // Компьютерные технологии и анализ данных (CTDA’2020) : материалы II Междунар. науч.-практ. конф., Минск, 23–24 апр. 2020 г. – Минск : БГУ, 2020. – С. 142–146.

53. Яцков, Н. Н. Автоматическое определение открытых рамок считывания в молекулах РНК человека с использованием алгоритмов векторизации и классификации / Н. Н. Яцков, В. В. Скакун, В. В. Гринев // Информационные технологии и системы (ИТС 2019) : материалы Междунар. науч. конф., Минск, 30 окт. 2019 г. – Минск : БГУИР, 2019. – С. 292–293.

54. Яцков, Н. Н. Вычислительный подход и программный пакет RNAexploreR для группировки молекул РНК генов человека по их экзонным признакам / Н. Н. Яцков, В. В. Скакун, В. В. Гринев // Информатика. – 2019. – Т. 16, № 4. – С. 7–24.

55. Bumgarner, R. Overview of DNA microarrays: types, applications, and their future / R. Bumgarner // Current Protocols in Molecular Biology. – Jan. 2013. – Vol. 101, iss. 1. – Р. 22.1.1–22.1.11.

56. Giganti, A. The actin cytoskeleton as a therapeutic target: state of the art and future directions / A. Giganti, E. Friederich // Progress in Cell Cycle Research. – 2003. – Vol. 5. – P. 511–525.

57. Pollard, T. D. Actin and actin-binding proteins / T. D. Pollard // Cold Spring Harbor Perspectives in Biology. – Aug. 2016. – Vol. 8, no 8. – Р. a018226.

58. Kitamura, A. State-of-the-art fluorescence fluctuation-based spectroscopic techniques for the study of protein aggregation / A. Kitamura, M. Kinjo // Intern. J. of Molecular Sciences. – Mar. 2018. – Vol. 19, iss. 4. – Р. 964.

59. An integrative simulation model linking major biochemical reactions of actin-polymerization to structural properties of actin filaments / A. A. Halavatyi [et al.] // Biophysical Chemistry. – 2009 – Vol. 140. – P. 24–34.

60. Quantitative kinetic study of the actin-bundling protein l-plastin and of its impact on actin turn-over / Z. Al Tanoury [et al.] // Public Library of Science (PLoS) One. – 2010. – Vol. 5, no. 2. – Р. 669–677.

61. Имитационная модель трехканальных люминесцентных изображений популяций раковых клеток / Е. В. Лисица [и др.] // Журнал прикладной спектроскопии. – 2014. – Т. 81, № 6. – С. 907–913.

62. Алгоритм автоматической сегментации границ ядер раковых клеток на трехканальных люминесцентных изображениях / Е. В. Лисица [и др.] // Журнал прикладной спектроскопии. – 2015. – Т. 82, № 4. – С. 598–607

63. Яцков, Н. Н. Метод исследования флуоресценции молекулярных соединений с использованием алгоритмов интеллектуального анализа данных / Н. Н. Яцков, В. В. Скакун, В. В. Апанасович // Прикладные проблемы оптики, информатики, радиофизики и физики конденсированного состояния: материалы Пятой Междунар. науч.-практ. конф., Минск, 16–17 мая 2019 г. – Минск: Ин-т прикл. физ. проблем им. А. Н. Севченко БГУ, 2019. – С. 125–127.

64. Яцков, Н. Н. Метод обработки кинетических кривых затухания флуоресценции с использованием алгоритмов интеллектуального анализа данных / Н. Н. Яцков, В. В. Скакун, В. В. Апанасович // Журнал прикладной спектроскопии. – 2020. – Т. 87, № 2. – С. 311–322.

65. Электронные спектры и кинетика поляризации флуоресценции тонких пленок Zn-порфиринов / Н. Н. Яцков [и др.] // Журнал прикладной спектроскопии. – 2003. – Т. 70, № 3. – С. 335–339.

66. Excitation energy migration in a photonic dye-zeolite antenna / M. Yatskou [et al.] // European J. of Chemical Physics and Physical Chemistry. – 2003. – Vol. 4(6). – P. 567–587.

67. Яцков, Н. Н. Метод комплексного анализа спектров флуктуации флуоресценции молекулярных соединений / Н. Н. Яцков, В. В. Скакун, В. В. Апанасович // Прикладные проблемы оптики, информатики, радиофизики и физики конденсированного состояния: материалы Пятой Междунар. науч.-практ. конф., Минск, 16–17 мая 2019 г. – Минск : Ин-т прикл. физ. проблем им. А. Н. Севченко БГУ, 2019. – С. 122–124.

68. Комплексный анализ флуктуаций интенсивности флуоресценции молекулярных соединений / Н. Н. Яцков [и др.]. // Журнал прикладной спектроскопии. – 2020. – Т. 87, № 4. – С. 628–636.


Дополнительные файлы

Для цитирования:


Яцков Н.Н., Апанасович В.В. Комплексный анализ данных при исследовании сложных биомолекулярных систем. Информатика. 2021;18(1):105-122. https://doi.org/10.37661/1816-0301-2021-18-1-105-122

For citation:


Yatskou M.M., Apanasovich V.V. Data analysis in complex biomolecular systems. Informatics. 2021;18(1):105-122. (In Russ.) https://doi.org/10.37661/1816-0301-2021-18-1-105-122

Просмотров: 129


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1816-0301 (Print)
ISSN 2617-6963 (Online)