Способы парсинга и обоснование целесообразности их применения к отдельной социальной сети

Авторы

  • О.Н. Панамарева Военный инновационный технополис «ЭРА»
  • В.Р. Хусаинов Военный инновационный технополис «ЭРА»
  • Н.В. Зайцев Войсковая часть 55060

Ключевые слова:

информация, парсинг, автоматизация, инновации, технологический и экономический суверенитет, безопасность

Аннотация

Объемы информации в цифровой форме растут экспоненциально, при этом существенно сокращается время на принятие управленческих решений, что сопровождается увеличением рисков, связанных с качеством и достаточностью данных, получаемых из различных источников. Особую роль в обеспечении безопасности, достижении устойчивости сложных организационно-технических систем, функционирующих как в гражданской, так и в военной сферах, в их развитии на сбалансированной инновационной основе, играет информация, содержащаяся и полученная в том числе и из социальных сетей. Контент, представленный в социальных сетях, может оказывать, наряду с положительным, и негативное влияние. Сегодня наблюдается большой интерес к его использованию со стороны агентов, хозяйствующих в различных отраслях экономики, а также в силовых ведомствах и в сфере ответственности оборонно-промышленного комплекса. В современных условиях обладание информацией, очищенной от излишнего шума и агрегированной, является залогом эффективности принимаемых решений, обеспечения устойчивости и безопасности. В данной научной работе раскрываются актуальные вопросы, связанные с автоматизированным сбором информации из такого рода источников. Обоснована актуальность парсинга новостных материалов из социальных сетей, представлены результаты анализа существующего инструментария парсинга. Сделан акцент на необходимости разработки отечественных решений в обозначенной области, что станет одной из важных составляющих фундамента обеспечения технологического и экономического суверенитета России. Выделены основные проблемы, возникающие при решении данной задачи, и способы их нивелирования. Приведены результаты оценки применимости средств автоматизированного сбора информации на примере социальной сети «Одноклассники».

Библиографические ссылки

Морозов А.В., Панамарев Г.Е., Гусеница Я.Н. Состояние и перспективы развития современной науки в области информационно-телекоммуникационных технологий в Военном инновационном технополисе «ЭРА» // Сб. статей II научно-технической конференции «Состояние и перспективы развития современной науки по направлению «ИТ-технологии». Т. 3. Высокопроизводительные вычислительные комплексы и суперкомпьютерное моделирование в военно-научном сопровождении жизненного цикла вооружения, военной и специальной техники. – Анапа: ВИТ «ЭРА». – 2023. – С. 7-18.

Морозов А.В., Панамарев Г.Е. Вопросы защиты информации при применении технологий искусственного интеллекта: опыт Военного инновационного технополиса «ЭРА» // Вопросы защиты информации при применении технологий искусственного интеллекта на аппаратно-программных платформах российского и иностранного производства: сб. материалов круглого стола научно-деловой программы Международного военно-технического форума «АРМИЯ-2024», Кубинка, Московская область, 13 августа 2024 года. – Анапа: ФГАУ «Военный инновационный технополис «ЭРА». – 2024. – С. 4-12.

Пучков А.А., Панамарев Г.Е., Сень Г.А., Ивановский В.С. Искусственный интеллект в информационной безопасности // Состояние и перспективы развития современной науки по направлению «АСУ, информационно-телекоммуникационные системы»: сб. статей II Всероссийской научно-технической конференции, Анапа, 18 июня 2020 года / Военный инновационный технополис «ЭРА». Т. 3. – Анапа: ФГАУ «Военный инновационный технополис «ЭРА». – 2020. – С. 8-11.

Панамарева О.Н., Панамарев Г.Е., Шафеев А.А. Технологии искусственного интеллекта в АСУ предприятиями и комплексами // Наука в современном обществе: закономерности и тенденции развития: сб. статей международной научно-практической конференции: в 2 частях, Пермь, 25 февраля 2017 года. – Том Часть 1. – Пермь: ООО «Аэтерна». – 2017. – С. 96-102.

Ракова Н.Г., Балашова Е.С. Инновационная экономика как фактор повышения устойчивости (технологической безопасности) страны и благополучия населения // Счисляевские чтения: актуальные проблемы экономики и управления. – 2024. – № 12 (12). – С. 300-303.

Санжина О.П., Смирнов А.Ю. Принципы формирования механизма управления инновациями в современных условиях // Естественно-гуманитарные исследования. – 2024. – № 2(52). – С. 228-230.

Смирнов А.Ю. Развитие инновационной деятельности в России и факторы, ей препятствующие // Актуальные проблемы экономики и менеджмента. – 2023. – № 2 (38). – С. 50-57.

Кох Л.В., Кох Ю.В., Санжина О.П. Стратегическое управление цифровой трансформацией интеллектуальной экономики и промышленности в новой реальности: монография. – СПб. – 2024. – С. 315-343.

Big Data Statistics 2025: Growth and Market Data. By Naveen Kumar . November 13, 2024. – URL: https://www.demandsage.com/big-data-statistics/ (дата обращения: 12.03.2025).

Дубовик Т.С., Березовская Е.М. Автоматизация сбора данных с веб-ресурсов // Молодежная наука в XXI веке: традиции, инновации, векторы развития: материалы Международной научно-исследовательской конференции молодых ученых, аспирантов, студентов и старшеклассников: в 3 ч. Самара-Оренбург, 05 апреля 2017 г. Том Часть 1. – Самара-Оренбург: ООО «Аэтерна». – 2017. – С. 202-203. – URL: https://www.elibrary.ru/item.asp?id=30036788 (дата обращения: 17.02.2025).

How Many Use The Internet in 2025 (Statistics). Naveen Kumar / January 22, 2025. – URL: https://www.demandsage.com/internet-user-statistics/ (дата обращения: 12.03.2025).

64 Social Media Statistics 2025 – Users & Growth. Naveen Kumar / December 26, 2024. . – URL: https://www.demandsage.com/social-media-marketing-statistics/ (дата обращения: 12.03.2025).

Закалин И.Ю. Автоматизация сбора информации в сети интернет // Вестник магистратуры. 2018. №5-4 (80). – URL: https://cyberleninka.ru/article/n/avtomatizatsiya-sbora-informatsii-v-seti-internet (дата обращения: 21.02.2025).

Социальные сети в России: цифры и тренды, осень 2024. – URL: https://brandanalytics.ru/blog/social-media-russia-autumn-2024 (дата обращения: 14.02.2025).

Костяшин Н.А., Колбина О.Н., Яготинцева Н.В. Применение автоматизированных средств сбора информации по сайтам // Информационные технологии и системы: управление, экономика, транспорт, право. – 2020. – № 3(39). – С. 11-17. – URL: https://www.elibrary.ru/item.asp?id=44383882 (дата обращения: 25.02.2025).

Меньшиков Я.С. Преимущества автоматического сбора данных в сети интернет над ручным сбором данных // Universum: технические науки: электрон. научн. журн. 2022. – URL: https://cyberleninka.ru/article/n/preimuschestva-avtomaticheskogo-sbora-dannyh-v-seti-internet-nad-ruchnym-sborom-dannyh/viewer (дата обращения: 19.01.2025).

Суханов А.А., Маратканов А.С. Анализ способов сбора социальных данных из сети Интернет // International scientific review. 2017. – URL: https://cyberleninka.ru/article/n/analiz-sposobov-sbora-sotsialnyh-dannyh-iz-seti-internet/viewer (дата обращения: 19.02.2025).

Что такое API и как он работает. – URL: https://skillbox.ru/media/code/chto_takoe_api/ (дата обращения: 12.03.2025).

Что такое API и что о нём нужно знать веб-разработчику. – URL: https://practicum.yandex.ru/blog/chto-takoe-api/ (дата обращения: 12.03.2025).

Веб-скрейпинг с нуля на Python: библиотека Beautiful Soup. – URL: https://nuancesprog.ru/p/14171/ (дата обращения: 12.03.2025).

Веб-скрейпинг с Python: Полное руководство. – URL: https://vc.ru/u/2726106-swift-stream/1012395-veb-skreiping-s-python-polnoe-rukovodstvo (дата обращения: 12.03.2025).

Москаленко А.А., Лапонина О.Р., Сухомлин В.А. Разработка приложения веб-скрапинга с возможностями обхода блокировок // Современные информационные технологии и ИТ-образование. 2019. – URL: https://cyberleninka.ru/article/n/razrabotka-prilozheniya-veb-skrapinga-s-vozmozhnostyami-obhoda-blokirovok (дата обращения: 19.02.2025).

Эшонкулов Х.И. Проблемы автоматизированного сбора информации // Вестник науки и образования. 2021. № 11-2 (114). – URL: https://cyberleninka.ru/article/n/problemy-avtomatizirovannogo-sbora-informatsii (дата обращения: 10.02.2025).

Коляда А.С., Гогунский В.Д. Извлечение информации из слабоструктурированных веб-страниц // ВЕЖПТ. 2014. № 9 (67). – URL: https://cyberleninka.ru/article/n/izvlechenie-informatsii-iz-slabostrukturirovannyh-veb-stranits (дата обращения: 12.02.2025).

Как ведут соцсети крупнейшие оборонные концерны. Исследование SMM-активностей в российском ОПК. – URL: https://www.cossa.ru/trends/324353/ (дата обращения: 12.02.2025).

Загрузки

Опубликован

2025-06-13

Как цитировать

Панамарева, О., Хусаинов, В., & Зайцев, Н. (2025). Способы парсинга и обоснование целесообразности их применения к отдельной социальной сети. Молодёжный вестник Новороссийского филиала Белгородского государственного технологического университета им. В. Г. Шухова, 5(2), 9–19. извлечено от https://rio-nb-bstu.science/ojs/index.php/vestnik-molod/article/view/344

Выпуск

Раздел

Отраслевая структура экономики, экономика и организация предприятия