Preview

Информатика

Расширенный поиск

Система комплексного анализа данных тематических сайтов ИСКАД ИИ

https://doi.org/10.37661/1816-0301-2024-21-1-105-120

Аннотация

Цели. В настоящее время основным источником получения информации является Интернет. Огромный объем информации, доступной в сети, делает актуальной задачу всестороннего анализа данных из открытых интернет-источников. Цель работы заключается в создании многоцелевого, модифицируемого кластера для глубокого анализа данных интернет-источников, основными задачами которого являются выявление наиболее важных публикаций в некоторой предметной области и их тематический анализ, определение лидера научного направления и тенденций развития направлений деятельности и взаимодействия групп людей.

Методы. Для решения поставленной задачи была разработана методология построения многоцелевого кластера с использованием технологий быстрого построения тематической графовой базы данных, графа знаний, методов и моделей машинного обучения для глубокого анализа данных.

Результаты. Разработана Система комплексного анализа данных тематических сайтов ИСКАД ИИ, апробированы методология быстрого построения тематической графовой базы данных и комплексная технология глубокого анализа данных интернет-источников и известных мировых сайтов.

Заключение. Создана среда информационных технологий для быстрого построения тематических графовых баз данных. Результаты применения технологии быстрого построения графовых баз данных показаны на примерах работы ИСКАД ИИ.

Об авторах

И. И. Пилецкий
Белорусский государственный университет информатики и радиоэлектроники
Беларусь

Пилецкий Иван Иванович, кандидат физико-математических наук, доцент кафедры информатики

ул. П. Бровки, 6, Минск, 220013



М. П. Батура
Белорусский государственный университет информатики и радиоэлектроники
Беларусь

Батура Михаил Павлович, доктор технических наук, профессор, заведующий лабораторией «Новые обучающие технологии»

ул. П. Бровки, 6, Минск, 220013



Н. А. Волорова
Белорусский государственный университет информатики и радиоэлектроники
Беларусь

Волорова Наталья Алексеевна, кандидат технических наук, доцент, старший научный сотрудник лаборатории «Новые обучающие технологии»

ул. П. Бровки, 6, Минск, 220013



П. А. Зорко
Белорусский государственный университет информатики и радиоэлектроники
Беларусь

Зорко Полина Александровна, магистрант кафедры информатики

ул. П. Бровки, 6, Минск, 220013



А. О. Кулевич
Белорусский государственный университет информатики и радиоэлектроники
Беларусь

Кулевич Алексей Олегович, магистрант кафедры информатики

ул. П. Бровки, 6, Минск, 220013



Список литературы

1. Интеллектуальная система комплексного анализа данных интернет-источников / М. П. Батура [и др.] // BIG DATA and Advanced Analytics = BIG DATA и анализ высокого уровня : сб. материалов VI Междунар. науч.-практ. конф., Минск, 20–21 мая 2020 г. : в 3 ч. Ч. 1 / редкол.: В. А. Богуш [и др.]. – Минск : Бестпринт, 2020. – С. 220–241.

2. Пилецкий, И. И. Графовые технологии в интеллектуальной системе комплексного анализа данных интернет-источников / И. И. Пилецкий, М. П. Батура, Л. Ю. Шилин // Доклады БГУИР. – 2020. – Т. 18, № 5. – С. 89–97.

3. Граф знаний и машинное обучение как ИТ-среда интеллектуального анализа данных интернетисточников / М. П. Батура [и др.] // BIG DATA and Advanced Analytics = BIG DATA и анализ высокого уровня : сб. науч. ст. VIII Междунар. науч.-практ. конф., Минск, 11–12 мая 2022 г. / Бел. гос. ун-т информатики и радиоэлектроники ; редкол.: В. А. Богуш [и др.]. – Минск, 2022. – С. 330–344.

4. Diestel, R. Graph Theory / R. Diestel. – Berlin : Springer-Verlag, 2017. – 448 р.

5. Needham, M. Graph Algorithms / M. Needham, A. E. Hodler. – Sebastopol : O’Reilly Media, 2019. – 265 р.

6. Hamilton, W. L. Representation learning on graphs: Methods and applications / W. L. Hamilton, R. Ying, J. Leskovec // IEEE Data Engineering Bulletin. – 2017. – Vol. 40, no. 3. – Р. 52–74.

7. Ovcinnikova, J. Visual diagrammatic queries in ViziQuer: Overview and implementation / J. Ovcinnikova, A. Sostaks, K. Cerans // Baltic J. of Modern Computing. – 2023. – Vol. 11, no. 2. – Р. 317–350.

8. Portisch, J. Knowledge graph embedding for data mining vs. knowledge graph embedding for link prediction – two sides of the same coin? / J. Portisch, N. Heist, H. Paulheim // Semantic Web. – 2022. – Vol. 13, no. 3. – Р. 399–422. https://doi.org/10.3233/SW-212892

9. Barrasa, J. Knowledge Graphs / J. Barrasa, A. E. Hodler, J. Webber. – Sebastopol : O’Reilly Media, 2021. – 85 р.


Дополнительные файлы

Рецензия

Для цитирования:


Пилецкий И.И., Батура М.П., Волорова Н.А., Зорко П.А., Кулевич А.О. Система комплексного анализа данных тематических сайтов ИСКАД ИИ. Информатика. 2024;21(1):105-120. https://doi.org/10.37661/1816-0301-2024-21-1-105-120

For citation:


Piletski I.I., Batura M.P., Volоrоva N.A., Zorko P.A., Kulevich A.O. System of complex data analysis of thematic sites ISCAD IS. Informatics. 2024;21(1):105-120. (In Russ.) https://doi.org/10.37661/1816-0301-2024-21-1-105-120

Просмотров: 109


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1816-0301 (Print)
ISSN 2617-6963 (Online)