<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.3 20210610//EN" "JATS-journalpublishing1-3.dtd">
<article article-type="research-article" dtd-version="1.3" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xml:lang="ru"><front><journal-meta><journal-id journal-id-type="publisher-id">inform</journal-id><journal-title-group><journal-title xml:lang="ru">Информатика</journal-title><trans-title-group xml:lang="en"><trans-title>Informatics</trans-title></trans-title-group></journal-title-group><issn pub-type="ppub">1816-0301</issn><issn pub-type="epub">2617-6963</issn><publisher><publisher-name>UIIP NASB</publisher-name></publisher></journal-meta><article-meta><article-id pub-id-type="doi">10.37661/1816-0301-2024-21-1-105-120</article-id><article-id custom-type="elpub" pub-id-type="custom">inform-1279</article-id><article-categories><subj-group subj-group-type="heading"><subject>Research Article</subject></subj-group><subj-group subj-group-type="section-heading" xml:lang="ru"><subject>ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ</subject></subj-group><subj-group subj-group-type="section-heading" xml:lang="en"><subject>INFORMATION TECHNOLOGY</subject></subj-group></article-categories><title-group><article-title>Система комплексного анализа данных тематических сайтов ИСКАД ИИ</article-title><trans-title-group xml:lang="en"><trans-title>System of complex data analysis of thematic sites ISCAD IS</trans-title></trans-title-group></title-group><contrib-group><contrib contrib-type="author" corresp="yes"><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Пилецкий</surname><given-names>И. И.</given-names></name><name name-style="western" xml:lang="en"><surname>Piletski</surname><given-names>I. I.</given-names></name></name-alternatives><bio xml:lang="ru"><p>Пилецкий Иван Иванович, кандидат физико-математических наук, доцент кафедры информатики</p><p>ул. П. Бровки, 6, Минск, 220013</p></bio><bio xml:lang="en"><p>Ivan I. Piletski, Ph. D. (Phys.-Math.), Assoc. Prof. of the Department of Informatics</p><p>st. P. Brovki, 6, Minsk, 220013</p></bio><email xlink:type="simple">ianmenski@gmail.com</email><xref ref-type="aff" rid="aff-1"/></contrib><contrib contrib-type="author" corresp="yes"><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Батура</surname><given-names>М. П.</given-names></name><name name-style="western" xml:lang="en"><surname>Batura</surname><given-names>M. P.</given-names></name></name-alternatives><bio xml:lang="ru"><p>Батура Михаил Павлович, доктор технических наук, профессор, заведующий лабораторией «Новые обучающие технологии»</p><p>ул. П. Бровки, 6, Минск, 220013</p></bio><bio xml:lang="en"><p>Michal P. Batura, D. Sc. (Eng.), Prof., Head of the Laboratory "New Educational Technologies"</p><p>st. P. Brovki, 6, Minsk, 220013</p></bio><email xlink:type="simple">bmpbel@bsuir.by</email><xref ref-type="aff" rid="aff-1"/></contrib><contrib contrib-type="author" corresp="yes"><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Волорова</surname><given-names>Н. А.</given-names></name><name name-style="western" xml:lang="en"><surname>Volоrоva</surname><given-names>N. A.</given-names></name></name-alternatives><bio xml:lang="ru"><p>Волорова Наталья Алексеевна, кандидат технических наук, доцент, старший научный сотрудник лаборатории «Новые обучающие технологии»</p><p>ул. П. Бровки, 6, Минск, 220013</p></bio><bio xml:lang="en"><p>Natalia A. Volоrоva, Ph. D. (Eng.), Assoc. Prof., Senior Researcher of the Laboratory "New Educational Technologies"</p><p>st. P. Brovki, 6, Minsk, 220013</p></bio><email xlink:type="simple">volorova@bsuir.by</email><xref ref-type="aff" rid="aff-1"/></contrib><contrib contrib-type="author" corresp="yes"><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Зорко</surname><given-names>П. А.</given-names></name><name name-style="western" xml:lang="en"><surname>Zorko</surname><given-names>P. A.</given-names></name></name-alternatives><bio xml:lang="ru"><p>Зорко Полина Александровна, магистрант кафедры информатики</p><p>ул. П. Бровки, 6, Минск, 220013</p></bio><bio xml:lang="en"><p>Polina A. Zorko, Master's Student of the Department of Informatics</p><p>st. P. Brovki, 6, Minsk, 220013</p></bio><email xlink:type="simple">polina.zorko16@gmail.com</email><xref ref-type="aff" rid="aff-1"/></contrib><contrib contrib-type="author" corresp="yes"><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Кулевич</surname><given-names>А. О.</given-names></name><name name-style="western" xml:lang="en"><surname>Kulevich</surname><given-names>A. O.</given-names></name></name-alternatives><bio xml:lang="ru"><p>Кулевич Алексей Олегович, магистрант кафедры информатики</p><p>ул. П. Бровки, 6, Минск, 220013</p></bio><bio xml:lang="en"><p>Alexei O. Kulevich, Master's Student of the Department of Informatics</p><p>st. P. Brovki, 6, Minsk, 220013</p></bio><email xlink:type="simple">kulevich.01@gmail.com</email><xref ref-type="aff" rid="aff-1"/></contrib></contrib-group><aff-alternatives id="aff-1"><aff xml:lang="ru"><institution>Белорусский государственный университет информатики и радиоэлектроники</institution></aff><aff xml:lang="en"><institution>Belarusian State University of Informatics and Radioelectronics</institution></aff></aff-alternatives><pub-date pub-type="collection"><year>2024</year></pub-date><pub-date pub-type="epub"><day>29</day><month>03</month><year>2024</year></pub-date><volume>21</volume><issue>1</issue><fpage>105</fpage><lpage>120</lpage><permissions><copyright-statement>Copyright &amp;#x00A9; Пилецкий И.И., Батура М.П., Волорова Н.А., Зорко П.А., Кулевич А.О., 2024</copyright-statement><copyright-year>2024</copyright-year><copyright-holder xml:lang="ru">Пилецкий И.И., Батура М.П., Волорова Н.А., Зорко П.А., Кулевич А.О.</copyright-holder><copyright-holder xml:lang="en">Piletski I.I., Batura M.P., Volоrоva N.A., Zorko P.A., Kulevich A.O.</copyright-holder><license xml:lang="ru" license-type="creative-commons-attribution" xlink:href="https://creativecommons.org/licenses/by/4.0/" xlink:type="simple"><license-p>Данная работа распространяется под лицензией Creative Commons Attribution 4.0.</license-p></license><license xml:lang="en" license-type="creative-commons-attribution" xlink:href="https://creativecommons.org/licenses/by/4.0/" xlink:type="simple"><license-p>This work is licensed under a Creative Commons Attribution 4.0 License.</license-p></license></permissions><self-uri xlink:href="https://inf.grid.by/jour/article/view/1279">https://inf.grid.by/jour/article/view/1279</self-uri><abstract><sec><title>Цели</title><p>Цели. В настоящее время основным источником получения информации является Интернет. Огромный объем информации, доступной в сети, делает актуальной задачу всестороннего анализа данных из открытых интернет-источников. Цель работы заключается в создании многоцелевого, модифицируемого кластера для глубокого анализа данных интернет-источников, основными задачами которого являются выявление наиболее важных публикаций в некоторой предметной области и их тематический анализ, определение лидера научного направления и тенденций развития направлений деятельности и взаимодействия групп людей.</p></sec><sec><title>Методы</title><p>Методы. Для решения поставленной задачи была разработана методология построения многоцелевого кластера с использованием технологий быстрого построения тематической графовой базы данных, графа знаний, методов и моделей машинного обучения для глубокого анализа данных.</p></sec><sec><title>Результаты</title><p>Результаты. Разработана Система комплексного анализа данных тематических сайтов ИСКАД ИИ, апробированы методология быстрого построения тематической графовой базы данных и комплексная технология глубокого анализа данных интернет-источников и известных мировых сайтов.</p></sec><sec><title>Заключение</title><p>Заключение. Создана среда информационных технологий для быстрого построения тематических графовых баз данных. Результаты применения технологии быстрого построения графовых баз данных показаны на примерах работы ИСКАД ИИ.</p></sec></abstract><trans-abstract xml:lang="en"><sec><title>Objectives</title><p>Objectives. Currently, the main source of information is the Internet. The huge amount of information available on the Internet makes it urgent to comprehensively analyze data from open Internet sources.</p><p>The goal of this work is to create a multi-purpose, modifiable cluster for in-depth analysis of data from Internet sources, the main objectives of which are to identify the most important publications in a certain subject area, thematic analysis of these publications, identifying the leader of a scientific direction and determining trends in the development of areas and interaction of groups of people.</p></sec><sec><title>Methods</title><p>Methods. To solve this problem, a methodology was developed for constructing a multi-purpose cluster using technologies for quickly constructing a thematic graph database, a knowledge graph, methods and models of machine learning for in-depth analysis of data.</p></sec><sec><title>Results</title><p>Results. A system for comprehensive analysis of data from thematic sites ISKAD IS has been developed, a methodology for quickly constructing a thematic graph database and a comprehensive technology for in-depth analysis of data from Internet sources and analysis of data from the most important well-known world sites have been tested.</p></sec><sec><title>Conclusion</title><p>Conclusion. An IT environment has been created for the rapid construction of thematic graph databases. The results of using the technology for quickly constructing graph databases are shown using examples of the work of ISKAD IS.</p></sec></trans-abstract><kwd-group xml:lang="ru"><kwd>тематические сайты</kwd><kwd>большие данные</kwd><kwd>метод машинного обучения</kwd><kwd>анализ данных</kwd><kwd>графовая база данных</kwd><kwd>граф знаний</kwd><kwd>база данных Neo4j</kwd></kwd-group><kwd-group xml:lang="en"><kwd>thematic sites</kwd><kwd>Big Data</kwd><kwd>machine learning method</kwd><kwd>analysis of data</kwd><kwd>graph database</kwd><kwd>knowledge graph</kwd><kwd>database Neo4j</kwd></kwd-group></article-meta></front><back><ref-list><title>References</title><ref id="cit1"><label>1</label><citation-alternatives><mixed-citation xml:lang="ru">Интеллектуальная система комплексного анализа данных интернет-источников / М. П. Батура [и др.] // BIG DATA and Advanced Analytics = BIG DATA и анализ высокого уровня : сб. материалов VI Междунар. науч.-практ. конф., Минск, 20–21 мая 2020 г. : в 3 ч. Ч. 1 / редкол.: В. А. Богуш [и др.]. – Минск : Бестпринт, 2020. – С. 220–241.</mixed-citation><mixed-citation xml:lang="en">Batura M. P., Piletski I. I., Prytkov V. A., Volorova N. A. Intelligent system for comprehensive analysis of data from Internet sources. BIG DATA i analiz vysokogo urovnja : sbornik materialov VI Mezhdunarodnoj nauchno-prakticheskoj konferencii, Minsk, 20–21 maja 2020 g. : v 3 chastjah. Chast' 1 [BIG DATA and Advanced Analytics : Collection of Materials of the VI International Scientific and Practical Conference, Minsk, 20–21 May 2020 : in 3 Parts. Part 1]. Ed. board: V. A. Bogush [et al.]. Minsk, Bestprint, 2020, рр. 220–241 (In Russ.).</mixed-citation></citation-alternatives></ref><ref id="cit2"><label>2</label><citation-alternatives><mixed-citation xml:lang="ru">Пилецкий, И. И. Графовые технологии в интеллектуальной системе комплексного анализа данных интернет-источников / И. И. Пилецкий, М. П. Батура, Л. Ю. Шилин // Доклады БГУИР. – 2020. – Т. 18, № 5. – С. 89–97.</mixed-citation><mixed-citation xml:lang="en">Piletski I. I., Batura M. P., Shilin L. Yu. Graph technologies in an intelligent system for complex analysis of data from Internet sources. Doklady Belorusskogo gosudarstvennogo universiteta informatiki i radioèlektroniki [Doklady BGUIR], 2020, vol. 18, no. 5. рр. 89–97 (In Russ.).</mixed-citation></citation-alternatives></ref><ref id="cit3"><label>3</label><citation-alternatives><mixed-citation xml:lang="ru">Граф знаний и машинное обучение как ИТ-среда интеллектуального анализа данных интернетисточников / М. П. Батура [и др.] // BIG DATA and Advanced Analytics = BIG DATA и анализ высокого уровня : сб. науч. ст. VIII Междунар. науч.-практ. конф., Минск, 11–12 мая 2022 г. / Бел. гос. ун-т информатики и радиоэлектроники ; редкол.: В. А. Богуш [и др.]. – Минск, 2022. – С. 330–344.</mixed-citation><mixed-citation xml:lang="en">Batura M. P., Piletsky I. I., Volorova N. A., Zorko P. A., Kulevich A. O. Knowledge graph and machine learning as an IT environment for mining data from Internet sources. BIG DATA i analiz vysokogo urovnja : sbornik nauchnyh statej VIII Mezhdunarodnoj nauchno-prakticheskoj konferencii, Minsk, 11–12 maja 2022 g. [BIG DATA and Advanced Analytics : Collection of Scientific Articles of the VIII International Scientific and Practical Conference, Minsk, 11–12 May 2022]. Ed. board: V. A. Bogush [et al.]. Minsk, 2022, рр. 330–344 (In Russ.).</mixed-citation></citation-alternatives></ref><ref id="cit4"><label>4</label><citation-alternatives><mixed-citation xml:lang="ru">Diestel, R. Graph Theory / R. Diestel. – Berlin : Springer-Verlag, 2017. – 448 р.</mixed-citation><mixed-citation xml:lang="en">Diestel R. Graph Theory. Berlin, Springer-Verlag, 2017, 448 р.</mixed-citation></citation-alternatives></ref><ref id="cit5"><label>5</label><citation-alternatives><mixed-citation xml:lang="ru">Needham, M. Graph Algorithms / M. Needham, A. E. Hodler. – Sebastopol : O’Reilly Media, 2019. – 265 р.</mixed-citation><mixed-citation xml:lang="en">Needham M., Hodler A. E. Graph Algorithms. Sebastopol, O’Reilly Media, 2019, 265 р.</mixed-citation></citation-alternatives></ref><ref id="cit6"><label>6</label><citation-alternatives><mixed-citation xml:lang="ru">Hamilton, W. L. Representation learning on graphs: Methods and applications / W. L. Hamilton, R. Ying, J. Leskovec // IEEE Data Engineering Bulletin. – 2017. – Vol. 40, no. 3. – Р. 52–74.</mixed-citation><mixed-citation xml:lang="en">Hamilton W. L., Ying R., Leskovec J. Representation learning on graphs: Methods and applications. IEEE Data Engineering Bulletin, 2017, vol. 40, no. 3, рр. 52–74.</mixed-citation></citation-alternatives></ref><ref id="cit7"><label>7</label><citation-alternatives><mixed-citation xml:lang="ru">Ovcinnikova, J. Visual diagrammatic queries in ViziQuer: Overview and implementation / J. Ovcinnikova, A. Sostaks, K. Cerans // Baltic J. of Modern Computing. – 2023. – Vol. 11, no. 2. – Р. 317–350.</mixed-citation><mixed-citation xml:lang="en">Ovcinnikova J., Sostaks A., Cerans K. Visual diagrammatic queries in ViziQuer: Overview and implementation. Baltic Journal of Modern Computing, 2023, vol. 11, no. 2, рр. 317–350.</mixed-citation></citation-alternatives></ref><ref id="cit8"><label>8</label><citation-alternatives><mixed-citation xml:lang="ru">Portisch, J. Knowledge graph embedding for data mining vs. knowledge graph embedding for link prediction – two sides of the same coin? / J. Portisch, N. Heist, H. Paulheim // Semantic Web. – 2022. – Vol. 13, no. 3. – Р. 399–422. https://doi.org/10.3233/SW-212892</mixed-citation><mixed-citation xml:lang="en">Portisch J., Heist N., Paulheim H. Knowledge graph embedding for data mining vs. knowledge graph embedding for link prediction – two sides of the same coin? Semantic Web, 2022, vol. 13, no. 3, рр. 399–422. https://doi.org/10.3233/SW-212892</mixed-citation></citation-alternatives></ref><ref id="cit9"><label>9</label><citation-alternatives><mixed-citation xml:lang="ru">Barrasa, J. Knowledge Graphs / J. Barrasa, A. E. Hodler, J. Webber. – Sebastopol : O’Reilly Media, 2021. – 85 р.</mixed-citation><mixed-citation xml:lang="en">Barrasa J., Hodler A. E., Webber J. Knowledge Graphs. Sebastopol, O’Reilly Media, 2021, 85 р.</mixed-citation></citation-alternatives></ref></ref-list><fn-group><fn fn-type="conflict"><p>The authors declare that there are no conflicts of interest present.</p></fn></fn-group></back></article>
