Способы парсинга и обоснование целесообразности их применения к отдельной социальной сети
Ключевые слова:
информация, парсинг, автоматизация, инновации, технологический и экономический суверенитет, безопасностьАннотация
Объемы информации в цифровой форме растут экспоненциально, при этом существенно сокращается время на принятие управленческих решений, что сопровождается увеличением рисков, связанных с качеством и достаточностью данных, получаемых из различных источников. Особую роль в обеспечении безопасности, достижении устойчивости сложных организационно-технических систем, функционирующих как в гражданской, так и в военной сферах, в их развитии на сбалансированной инновационной основе, играет информация, содержащаяся и полученная в том числе и из социальных сетей. Контент, представленный в социальных сетях, может оказывать, наряду с положительным, и негативное влияние. Сегодня наблюдается большой интерес к его использованию со стороны агентов, хозяйствующих в различных отраслях экономики, а также в силовых ведомствах и в сфере ответственности оборонно-промышленного комплекса. В современных условиях обладание информацией, очищенной от излишнего шума и агрегированной, является залогом эффективности принимаемых решений, обеспечения устойчивости и безопасности. В данной научной работе раскрываются актуальные вопросы, связанные с автоматизированным сбором информации из такого рода источников. Обоснована актуальность парсинга новостных материалов из социальных сетей, представлены результаты анализа существующего инструментария парсинга. Сделан акцент на необходимости разработки отечественных решений в обозначенной области, что станет одной из важных составляющих фундамента обеспечения технологического и экономического суверенитета России. Выделены основные проблемы, возникающие при решении данной задачи, и способы их нивелирования. Приведены результаты оценки применимости средств автоматизированного сбора информации на примере социальной сети «Одноклассники».
Библиографические ссылки
Морозов А.В., Панамарев Г.Е., Гусеница Я.Н. Состояние и перспективы развития современной науки в области информационно-телекоммуникационных технологий в Военном инновационном технополисе «ЭРА» // Сб. статей II научно-технической конференции «Состояние и перспективы развития современной науки по направлению «ИТ-технологии». Т. 3. Высокопроизводительные вычислительные комплексы и суперкомпьютерное моделирование в военно-научном сопровождении жизненного цикла вооружения, военной и специальной техники. – Анапа: ВИТ «ЭРА». – 2023. – С. 7-18.
Морозов А.В., Панамарев Г.Е. Вопросы защиты информации при применении технологий искусственного интеллекта: опыт Военного инновационного технополиса «ЭРА» // Вопросы защиты информации при применении технологий искусственного интеллекта на аппаратно-программных платформах российского и иностранного производства: сб. материалов круглого стола научно-деловой программы Международного военно-технического форума «АРМИЯ-2024», Кубинка, Московская область, 13 августа 2024 года. – Анапа: ФГАУ «Военный инновационный технополис «ЭРА». – 2024. – С. 4-12.
Пучков А.А., Панамарев Г.Е., Сень Г.А., Ивановский В.С. Искусственный интеллект в информационной безопасности // Состояние и перспективы развития современной науки по направлению «АСУ, информационно-телекоммуникационные системы»: сб. статей II Всероссийской научно-технической конференции, Анапа, 18 июня 2020 года / Военный инновационный технополис «ЭРА». Т. 3. – Анапа: ФГАУ «Военный инновационный технополис «ЭРА». – 2020. – С. 8-11.
Панамарева О.Н., Панамарев Г.Е., Шафеев А.А. Технологии искусственного интеллекта в АСУ предприятиями и комплексами // Наука в современном обществе: закономерности и тенденции развития: сб. статей международной научно-практической конференции: в 2 частях, Пермь, 25 февраля 2017 года. – Том Часть 1. – Пермь: ООО «Аэтерна». – 2017. – С. 96-102.
Ракова Н.Г., Балашова Е.С. Инновационная экономика как фактор повышения устойчивости (технологической безопасности) страны и благополучия населения // Счисляевские чтения: актуальные проблемы экономики и управления. – 2024. – № 12 (12). – С. 300-303.
Санжина О.П., Смирнов А.Ю. Принципы формирования механизма управления инновациями в современных условиях // Естественно-гуманитарные исследования. – 2024. – № 2(52). – С. 228-230.
Смирнов А.Ю. Развитие инновационной деятельности в России и факторы, ей препятствующие // Актуальные проблемы экономики и менеджмента. – 2023. – № 2 (38). – С. 50-57.
Кох Л.В., Кох Ю.В., Санжина О.П. Стратегическое управление цифровой трансформацией интеллектуальной экономики и промышленности в новой реальности: монография. – СПб. – 2024. – С. 315-343.
Big Data Statistics 2025: Growth and Market Data. By Naveen Kumar . November 13, 2024. – URL: https://www.demandsage.com/big-data-statistics/ (дата обращения: 12.03.2025).
Дубовик Т.С., Березовская Е.М. Автоматизация сбора данных с веб-ресурсов // Молодежная наука в XXI веке: традиции, инновации, векторы развития: материалы Международной научно-исследовательской конференции молодых ученых, аспирантов, студентов и старшеклассников: в 3 ч. Самара-Оренбург, 05 апреля 2017 г. Том Часть 1. – Самара-Оренбург: ООО «Аэтерна». – 2017. – С. 202-203. – URL: https://www.elibrary.ru/item.asp?id=30036788 (дата обращения: 17.02.2025).
How Many Use The Internet in 2025 (Statistics). Naveen Kumar / January 22, 2025. – URL: https://www.demandsage.com/internet-user-statistics/ (дата обращения: 12.03.2025).
64 Social Media Statistics 2025 – Users & Growth. Naveen Kumar / December 26, 2024. . – URL: https://www.demandsage.com/social-media-marketing-statistics/ (дата обращения: 12.03.2025).
Закалин И.Ю. Автоматизация сбора информации в сети интернет // Вестник магистратуры. 2018. №5-4 (80). – URL: https://cyberleninka.ru/article/n/avtomatizatsiya-sbora-informatsii-v-seti-internet (дата обращения: 21.02.2025).
Социальные сети в России: цифры и тренды, осень 2024. – URL: https://brandanalytics.ru/blog/social-media-russia-autumn-2024 (дата обращения: 14.02.2025).
Костяшин Н.А., Колбина О.Н., Яготинцева Н.В. Применение автоматизированных средств сбора информации по сайтам // Информационные технологии и системы: управление, экономика, транспорт, право. – 2020. – № 3(39). – С. 11-17. – URL: https://www.elibrary.ru/item.asp?id=44383882 (дата обращения: 25.02.2025).
Меньшиков Я.С. Преимущества автоматического сбора данных в сети интернет над ручным сбором данных // Universum: технические науки: электрон. научн. журн. 2022. – URL: https://cyberleninka.ru/article/n/preimuschestva-avtomaticheskogo-sbora-dannyh-v-seti-internet-nad-ruchnym-sborom-dannyh/viewer (дата обращения: 19.01.2025).
Суханов А.А., Маратканов А.С. Анализ способов сбора социальных данных из сети Интернет // International scientific review. 2017. – URL: https://cyberleninka.ru/article/n/analiz-sposobov-sbora-sotsialnyh-dannyh-iz-seti-internet/viewer (дата обращения: 19.02.2025).
Что такое API и как он работает. – URL: https://skillbox.ru/media/code/chto_takoe_api/ (дата обращения: 12.03.2025).
Что такое API и что о нём нужно знать веб-разработчику. – URL: https://practicum.yandex.ru/blog/chto-takoe-api/ (дата обращения: 12.03.2025).
Веб-скрейпинг с нуля на Python: библиотека Beautiful Soup. – URL: https://nuancesprog.ru/p/14171/ (дата обращения: 12.03.2025).
Веб-скрейпинг с Python: Полное руководство. – URL: https://vc.ru/u/2726106-swift-stream/1012395-veb-skreiping-s-python-polnoe-rukovodstvo (дата обращения: 12.03.2025).
Москаленко А.А., Лапонина О.Р., Сухомлин В.А. Разработка приложения веб-скрапинга с возможностями обхода блокировок // Современные информационные технологии и ИТ-образование. 2019. – URL: https://cyberleninka.ru/article/n/razrabotka-prilozheniya-veb-skrapinga-s-vozmozhnostyami-obhoda-blokirovok (дата обращения: 19.02.2025).
Эшонкулов Х.И. Проблемы автоматизированного сбора информации // Вестник науки и образования. 2021. № 11-2 (114). – URL: https://cyberleninka.ru/article/n/problemy-avtomatizirovannogo-sbora-informatsii (дата обращения: 10.02.2025).
Коляда А.С., Гогунский В.Д. Извлечение информации из слабоструктурированных веб-страниц // ВЕЖПТ. 2014. № 9 (67). – URL: https://cyberleninka.ru/article/n/izvlechenie-informatsii-iz-slabostrukturirovannyh-veb-stranits (дата обращения: 12.02.2025).
Как ведут соцсети крупнейшие оборонные концерны. Исследование SMM-активностей в российском ОПК. – URL: https://www.cossa.ru/trends/324353/ (дата обращения: 12.02.2025).
Загрузки
Опубликован
Как цитировать
Выпуск
Раздел
Лицензия
Copyright (c) 2025 Молодёжный вестник Новороссийского филиала Белгородского государственного технологического университета им. В. Г. Шухова

Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial-NoDerivatives» («Атрибуция — Некоммерческое использование — Без производных произведений») 4.0 Всемирная.
Copyright information
Тексты данной электронной статьи защищены (cc) Creative Commons Attribution-NonCommercial-NoDerivs 3.0 Unported License.
Вы можете свободно:
Делиться (You are free: to Share) – копировать, распространять и передавать другим лицам данную электронную книгу при обязательном соблюдении следующих условий:
– Атрибуция (Attribution) – Вы должны атрибутировать произведения (указывать автора и источник) в порядке, предусмотренном автором или лицензиаром (но только так, чтобы никоим образом не подразумевалось, что они поддерживают вас или использование вами данного произведения).
– Некоммерческое использование (Noncommercial use) – Вы не можете использовать эти произведения в коммерческих целях.
– Без производных произведений – Вы не можете изменять, преобразовывать или брать за основу эту электронную книгу или отдельные произведения.
Licensed under the Creative Commons Attribution-NonCommercial-NoDerivs 3.0 Unported License.
To view a copy of this license, visit https://creativecommons.org/licenses/by-nc-nd/4.0/
or send a letter to Creative Commons, 444 Castro Street, Suite 900, Mountain View, California, 94041, USA.
You are free:
to Share — to copy, distribute and transmit the work
Under the following conditions:
Attribution — You must attribute the work in the manner specified by the author or licensor (but not in any way that suggests that they endorse you or your use of the work).
Non-commercial — You may not use this work for commercial purposes.
No Derivative Works — You may not alter, transform, or build upon this work.
Any of the above conditions can be waived if you get permission from the copyright holder.