Эксперыментальнае праграмнае забеспячэнне аўтаматызаванага распазнавання галасавых сігналаў птушак
Abstract
Мэты. Мэтай працы з’яўляецца стварэнне эксперыментальнага праграмнага забеспячэння аўтаматызаванага распазнавання галасавых сігналаў, якое валодае магчымасцямі доўгачасовага кругласутачнага і кругласезоннага маніторынгу відавой разнастайнасці жывёл у абраных месцапражываннях і экасістэмах.
Метады. У працы выкарыстоўваюцца метады глыбокага машыннага навучання скруткавых нейронных сетак, навучаных на падставе мел-спектраграм вакалізацый птушак, якія пабудаваны з дапамогай хуткага пераўтварэння Фур’е.
Вынікі. Апісаны працэс, метады і падыходы да трэніроўкі мадэлі глыбокага машыннага навучання для перспектыўнай сістэмы пасіўнага акустычнага маніторынгу папуляцый птушак на тэрыторыі Беларусі, а таксама ў ходзе тэсціравання прататыпа праграмнага забеспячэння выяўлены складанасці і дасягнуты вынікі.
Заключэнне. Прадстаўлены працоўны прататып праграмнага забеспячэння аўтаматызаванага распазнавання галасавых сігналаў птушак. Ён ажыццяўляе аналіз акустычных запісаў галасоў птушак з выдачай імавернаснай ацэнкі відавой прыналежнасці для прысутных на запісах вакалізацый жывёльнага паходжання. Праграмнае забеспячэнне накіравана на павышаную эфектыўнасць маніторынгу птушак, што забяспечвае выкананне прыродаахоўчых і даследчых мерапрыемстваў на аснове дакладных і актуальных даных відавога распаўсюджвання.
References
1. Priyadarshani N., Marsland S., Castro I. Automated birdsong recognition in complex acoustic environments: a review. Journal of Avian Biology, 2018, vol. 49, № 5, pp. 1–26.
2. Sharma S., Sato K., Gautam B. P. A Methodological Literature Review of Acoustic Wildlife Monitoring Using Artificial Intelligence Tools and Techniques. Sustainability 2023, 15, № 9, pp. 1–20. https://doi.org/10.3390/ su15097128.
3. Briggs, F., Raich, R., & Fern, X. Z. Audio Classification of Bird Species: A Statistical Manifold Approach. Data Mining, 2009. ICDM ’09. Ninth IEEE International Conference, Miami Beach, FL, USA, pp. 51–60.
4. Kahl St., Wood Connor M., Eibl M., Klinck H. BirdNET: A deep learning solution for avian diversity monitoring. Ecological Informatics, vol. 61, March 2021, pp. 1–10. https://doi.org/10.1016/j.ecoinf.2021.101236.
5. Miao Z., Gaynor K. M., Wang J., Liu Z., Muellerklein O., Norouzzadeh M.S. Insights and approaches using deep learning to classify wildlife. Scientific Reports, 2019, vol. 9, № 1, p. 10. https://doi.org/10.1038/s41598-019-44565-w.
6. Hetsevich Yu .S., Dydo O. V., Bialiauski D. A. Technologies of automatic speech processing and analysis using artificial intelligence. Doklady II Foruma IT-Akademgrada «Iskusstvennyj intellekt v Belarusi» [Reports of the II IT Academy Forum "Artificial Intelligence in Belarus", Minsk, October 12–13, 2023], Minsk, UIIP of NASB, 2023, pp. 71–78 104 (In Bel).
7. Klein D. J., Mckown M. W., Tershy B. R. Deep Learning for Large Scale Biodiversity Monitoring. Bloomberg Data for Good Exchange, Conference 28 Sept. 2015, New York City, , 2015. https://doi:10.13140/RG.2.1.1051.7201.
8. Ware L., Mahon C.L., McLeod L., Jetté J. F. Artificial intelligence (BirdNET) supplements manual methods to maximize bird species richness from acoustic data sets generated from regional monitoring. Can. J. Zool, 2023, vol. 101, № 12, pp. 1031–1051.
9. Stowell D., Plumbley M. D. An open dataset for research on audio field recording archives: freefield1010. arXiv:1309.5275. – 2013. https://doi.org/10.48550/arXiv.1309.5275.
10. Wood C.M., Kahl S., Rahaman A., Klinck H. The machine learning–powered BirdNET App reduces barriers to global bird research by enabling citizen science participation. PLoS Biol, 2022, Vol. 20, № 6. https://doi.org/10.48550/arXiv.1309.5275.
11. Karlionova N.V., Borodin A.V., Samusenko I.E., Nikiforov M.Y. The Belarusian list of bird species approved by the Belarusian Ornitho-Faunistic Commission for 2021 and 2022. Zoological readings, Grodno, GrGU, 2023, р. 113.
12. Xeno-canto – sharing wildlife sounds from around the world. Available at: https://xeno-canto.org/ (accessed 28 April 2024).
13. Gaidurov S. A., Latyshevich D. I, Bakunovich A. A., Kaigorodova L. I., Khokhlov V. A., Zianouka Ya. S, Hetsevich Yu. S. A database model for automated recognition of animal voice signals. Razvitie informatizacii i gosudarstvennoj sistemy nauchno-tehnicheskoj informacii RINTI-2022: materialy ХХI mezhdunarodnoj nauchno-tehnicheskoj konferencii [Collection of materials of the XXI International Scientific and Technical Conference “Development of Informatization and the State System of Scientific and Technical Information RINTI-2022”], United Institute of Informatics Problems, 2022, pp.236-240 (In Bel).
14. Stowell D. Computational bioacoustics with deep learning: a review and roadmap. PeerJ, 2022, vol. 10, 46 pp.
15. Fonseca E., Favory X., Pons J., Font F., Serra X. FSD50K: An Open Dataset of Human-Labeled Sound Events. ACM Transactions on Audio, Speech, and Language Processing, 2022, vol. 30, pp. 829–852.
16. Bota G, Manzano-Rubio R., Catalán L., Gómez-Catasús J., Pérez-Granados C. Hearing to the Unseen: AudioMoth and BirdNET as a Cheap and Easy Method for Monitoring Cryptic Bird Species. Sensors, 2023, 23, 7176. https:// doi.org/10.3390/s23167176.
17. Mingxing Tan, Quoc V. Le EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks. arXiv, 1905.11946v5, 2019. Available at: https://arxiv.org/abs/1905.11946 (аccessed 15 February 2024).
18. Wang, Y., Rosli, M. M., Musa, N., Feng, Li Multi-Class Imbalanced Data Classification: A Systematic Mapping Study / Y. Wang, M. M. Rosli, N. Musa, Feng Li // Engineering, Technology & Applied Science Research. – 2024. – Vol. 14. – P. 14183–14190. https://doi.org/10.48084/etasr.7206.
19. Mao Jun-Xiang, Hang Jun-Yi, Zhang Min-Ling Learning Label-Specific Multiple Local Metrics for Multi-Label Classification. Thirty-Third International Joint Conference on Artificial Intelligence {IJCAI-24}, August 2024, pp. 4742–4750. https://doi.org/10.24963/ijcai.2024/524.
20. Jia Bin-Bin, Liu Jun-Ying, Zhang Min-Ling Towards exploiting linear regression for multi-class/multi-label classification: an empirical analysis. International Journal of Machine Learning and Cybernetics, March 2024, pp. 1–30. https://doi.org/10.1007/s13042-024-02114-6.
21. Information and Analytical Center for continuous automated monitoring of rare, threatened and indicator species of animals (birds). Available at: https://bird-voice-iac.ssrlab.by/ (аccessed 6 June 2024).
22. ZianoukaYa., Bialiauski D., Kajharodava L., Chachlou V., Hetsevich Yu., Zahariev V., Zhaksylyk K. Developing Birds Sound Recognition System Using an Ontological Approach. Open Semantic Technologies for Intelligent Systems, Minsk, Belarusian State University of Informatics and Radioelectronics, 2023, issue 7, pp. 165–170.
Review
For citations:
, , , , . Informatics. 2024;21(4):58-71.