Спасибо Вам за работу!
Подробнее о работе
Гарантия сервиса Автор24
Уникальность не ниже 50%
Технологии text mining растут из-за необходимости в анализе естественных языков. Они используются для чат-ботов, обработки текстов, определения темы и эмоций [1], [5]. В бакалаврской работе представлена система, анализирующая запросы пользователя в соцсетях с применением text mining [8].
Выбор темы обусловлен ростом популярности соцмедиа. По статистике Вконтакте, ее ежедневно посещает 54% россиян [4]. Чтобы удерживать интерес, важно понимать предпочтения пользователей.
Для определения интересов пользователя можно использовать как информацию, указанную им в своем профиле (например, место проживания, хобби и т.д.), так и статистические данные о страницах, которые он просматривал в социальных сетях (вроде тематических сообществ и групп).
В этом исследовании предлагается дополнить перечень источников данных о предпочтениях пользователя, включив в него информацию, извлеченную из анализа его поисковых запросов.
Одним из трудностей использования поисковых запросов для выявления интересов пользователя является их частое представление в текстовой форме без определенной структуры. Для получения нужной информации из такого текста требуется применение методов text mining [7].
Цель работы - создать систему анализа запросов для определения интересов пользователя.
Чтобы достичь поставленной цели, следует решить ряд задач:
- разработать модель процесса выявления интересов пользователя;
- спроектировать систему анализа поисковых запросов в социальных сетях;
- осуществить реализацию и провести тестирование созданной системы;
Используемые методы исследования включают в себя технологии анализа текстов (text mining), методы проектирования информационных систем и программные технологии.
Практическое значение этой бакалаврской работы связано с созданием программного решения для определения интересов пользователя, исходя из анализа его текстовых поисковых запросов. Работа включает в себя введение, три главы, заключение, список литературы и приложения.
В первой главе работы представлен обзор актуальных исследований в области text mining, рассматриваются вопросы удержания внимания пользователей социальных медиа, также проводится моделирование процесса выявления интересов пользователей с использованием нотации IDEF0.
Во второй главе акцент делается на дизайне системы анализа поисковых запросов в социальных сетях. Здесь представлена схема работы предлагаемого программного решения и детализирован алгоритм обработки текстовой информации.
Третья глава охватывает этапы создания программного продукта. В ней также демонстрируются исходы тестирования программного модуля на основе реальных поисковых запросов автора.
В заключении изложены итоги проведенной выпускной квалификационной работы.
В рамках бакалаврской работы будет разработано приложение на языке Python, обеспечивающее анализ текстовых поисковых запросов. Оно включает в себя функции: импорт и просмотр данных запросов, их первичную обработку, удаление стоп-слов, приведение слов к их основной форме, частотный анализ и визуализацию наиболее употребляемых слов в форме "облака тегов". Проведено тестирование программы на актуальных текстовых запросах.
Бакалаврская работа состоит из 40 страниц текста, 26 рисунков, и 20 источников.
Введение 3
Глава 1 Технологии анализа текстовых данных 6
1.1 Сферы использования технологий анализа текстовых данных 6
1.2 Моделирование метода выявления интересов пользователя 11
Глава 2 Разработка системы анализа поисковой активности в социальных сетях 15
2.1 Методика исследования поисковых запросов 15
2.2 Подробное описание алгоритма обработки текстовых данных из
поисковых запросов 19
Глава 3 Создание приложения для исследования поисковых запросов 23
3.1 Особенности выполнения программного блока 23
3.2. Результаты тестирования приложения 33
3.3. Расчет экономической эффективности 36
Заключение 38
Список используемой литературы и используемых источников 39
Тема бакалаврской работы - «Разработка информационной системы для анализа поисковых запросов в социальных сетях».
Исследование поисковых запросов помогает выявить основные темы, которые интересуют конкретного пользователя. Методы анализа запросов применяются для рекомендаций товаров и контента в соцсетях. Благодаря этим методам можно лучше понять интересы и предпочтения пользователя.
Актуальность работы заключается в разработке системы для анализа поисковых запросов и визуализации полученных результатов.
Объектом исследования бакалаврской работы является технологии анализа текстовых данных (text mining).
Предметом исследования бакалаврской работы является система для анализа и визуализации текстовых запросов.
Цель данной выпускной квалификационной работы - создание информационной системы для анализа поисковых запросов в социальных сетях с целью выявления интересов пользователя.
Методы исследования - технологии текстовых данных (text mining), технологии проектирования информационных систем, технологии программирования.
Данная работа состоит из введения, трех глав, заключения и списка используемой литературы.
В первой главе исследования рассматриваются характеристики анализа текстовых данных, в следующей главе представлены подходы к анализу поисковых запросов и визуализации полученных результатов, а в третьей главе подробно описана практическая реализация системы для анализа поисковых запросов в социальных сетях.
Бакалаврская работа состоит из 41 страницы текста, 27 рисунков и 20 источников.
1. Агеев М. С. Автоматическая рубрикация текстов: методы и проблемы / М.С. Агеев, Б.В. Доброе, Н.В. Лукашевич // Ученые записки казанского государственного университета, 2011. - №5. - с. 26-40
2. Григорьев Е.А. Разведочный анализ данных с помощью Python /
Григорьев Е.А., Климов Н.С. // E-Scio. 2021. №3 (42). URL:
https://cyberleninka.rU/article/n/razvedochnyy-analiz-dannyh-s-pomoschyu-python (дата обращения: 22.09.2023).
3. Гришков, Д.Ю. Язык высокого уровня программирования Python / Гришков Данила Юрьевич, Аусилова Назерке Мырзабековна // HMP/S&R. 2023. №1 (9). URL: https://cyberlemnka.ru/article/n/yazyk-vysokogo-urovnya- programmirovaniya-python (дата обращения: 22.09.2023).
4. а Ершов, В.Е. Тенденции развития рекламной деятельности в
социальных сетях / Ершов Вадим Евгеньевич // Вестник евразийской науки. 2017. №4 (31). URL: https://cyberleninka.ru/article/n/tendentsii-razvitiya-
reklamnoy-deyatelnosti-v-sotsialnyh-setyah (дата обращения: 22.09.2023).
5. Корелов, С.В. Предобработка текстов электронных писем в задаче обнаружения спама / С.В. Корелов, А.М. Петров, Л.Ю. Ротков, А.А. Горбунов // Труды учебных заведений связи, 2021. - №5. - с. 81-92
6. Леоненков А. В. Объектно-ориентированный анализ и проектирование с использованием UML и IBM Rational Rose [Электронный ресурс] : учебное пособие. М. : Интернет-Университет Информационных Технологий (ИНТУИТ), Ай Пи Ар Медиа, 2021. 218 с. [Электронный ресурс]. URL: https://www.iprbookshop.ru/97554.html (дата обращения: 06.09.2023).
7. Маннинг, К.Д. Введение в информационный поиск / Г Кристофер Д. Маннинг, Прабхакар Рагхаван, Хайнрих Шютце. : Пер. с англ. - М. : ООО “И.Д. Вильямс”, 2016 - 438c.
8. Мкртычев С.В., Гущина О.М., Очеповский А.В. Прикладная информатика. Бакалаврская работа [Электронный ресурс] : электрон. учеб- метод. пособие. Тольятти. ТГУ: Изд-во ТГУ, 2020. 2 оптический диск.
9. Тарасова А.Н. Сентиментальный анализ постов в социальных
сетях посредством Python / Тарасова А.Н., Иванов К.О. // Символ науки. 2023. №4-1. URL: https://cyberleninka.ru/article/n/sentimentalnyy-analiz-postov-v-
sotsialnyh-setyah-posredstvom-python (дата обращения: 22.09.2023).
10. Чибирова, М.Э. Анализ данных и регрессионное моделирование с применением языков программирования Python и R / Чибирова Марина Эльбрусовна // Научные записки молодых исследователей. 2020. №3. URL: https://cyberleninka.ru/article/n/analiz-dannyh-i-regressionnoe-modelirovanie-s- primeneniem-yazykov-programmirovaniya-python-i-r (дата обращения: 22.09.2023).
11. Amasaki, S. The Effects of Vectorization Methods on Non-Functional Requirements Classification / Sousuke Amasaki, Pattara Leelaprute // 2019 46th Euromicro Conference on Software Engineering and Advanced Applications (SEAA), 2019. - IEEE, Prague, Czech Republic, 2019. - pp.56-76.
12. Bird, S. Natural Language Processing with Python / Steven Bird, Ewan Klein, Edward Loper. - Published by O’Reilly Media, Inc., 2015. - 452p.
13. Bugueno, М. Learning to combine classifiers outputs with the transformer for text classification / Margarita Bugueno, Marcelo Mendoza // Intelligent Data Analysis, 2020 - № 24. - pp. 15-41
14. Business Process Model and Notation [Электронный ресурс]. URL: https://www.omg.org/spec/BPMN/3.0/About-BPMN/ (дата обращения: 22.09.2023).
15. Gao, G. Research on Routing Selection Algorithm Based on Genetic Algorithm / Guohong Gao, Baojian Zhang, Xueyong Li, Jinna Lv // International Conference on Intelligent Computing and Information Science - International Conference, ICICIS 2011, Chongqing, China, January 19-20, 2014. Proceedings,
Part II: Intelligent Computing and Information Science. - Springer-Verlag Berlin Heidelberg 2014. - pp. 253-258
16. Higuchi, T. Special Section on Nonparametric Approach to Time Series Analysis / Tomoyuki Higuchi, Genshiro Kitagawa // Annals of the Institute of Statistical Mathematics, 2008. - .№55 (135). - Springer Nature Switzerland AG 2006. - pp.103-114
17. Jurafsky, D. Speech and Languge Processing: An Introduction to Natural Language Proccerring, Computation Linguistics and Speech Recognition / Jurafsky, Daniel; H. James, Martin. - Stanford University, 2022. - 414 p.
18. Kowsari, K. Text Classification Algorithms: A Survey / Kamran Kowsari, Kiana Jafari Meimandi, Mojtaba Heidarysafa, Sanjana Mendu, Laura Barnes, Donald Brown // Machine Learning on Scientific Data and Information. - Cornell University, 2020. - pp. 101-165.
19. Srividhya, V. Evaluating Preprocessing Techniques in Text Categorization / V. Srividhya, R. Anitha // International Journal of Computer Science and Application Issue 2010. - pp. 52-53.
20. Sun, C. How to Fine-Tune BERT for Text Classification? / Chi Sun, Xipeng Qiu, Yige Xu, Xuanjing Huang // Computation and Language, 2021. - Cornell University, 2021. - pp. 25-35.
Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям
Технологии text mining растут из-за необходимости в анализе естественных языков. Они используются для чат-ботов, обработки текстов, определения темы и эмоций [1], [5]. В бакалаврской работе представлена система, анализирующая запросы пользователя в соцсетях с применением text mining [8].
Выбор темы обусловлен ростом популярности соцмедиа. По статистике Вконтакте, ее ежедневно посещает 54% россиян [4]. Чтобы удерживать интерес, важно понимать предпочтения пользователей.
Для определения интересов пользователя можно использовать как информацию, указанную им в своем профиле (например, место проживания, хобби и т.д.), так и статистические данные о страницах, которые он просматривал в социальных сетях (вроде тематических сообществ и групп).
В этом исследовании предлагается дополнить перечень источников данных о предпочтениях пользователя, включив в него информацию, извлеченную из анализа его поисковых запросов.
Одним из трудностей использования поисковых запросов для выявления интересов пользователя является их частое представление в текстовой форме без определенной структуры. Для получения нужной информации из такого текста требуется применение методов text mining [7].
Цель работы - создать систему анализа запросов для определения интересов пользователя.
Чтобы достичь поставленной цели, следует решить ряд задач:
- разработать модель процесса выявления интересов пользователя;
- спроектировать систему анализа поисковых запросов в социальных сетях;
- осуществить реализацию и провести тестирование созданной системы;
Используемые методы исследования включают в себя технологии анализа текстов (text mining), методы проектирования информационных систем и программные технологии.
Практическое значение этой бакалаврской работы связано с созданием программного решения для определения интересов пользователя, исходя из анализа его текстовых поисковых запросов. Работа включает в себя введение, три главы, заключение, список литературы и приложения.
В первой главе работы представлен обзор актуальных исследований в области text mining, рассматриваются вопросы удержания внимания пользователей социальных медиа, также проводится моделирование процесса выявления интересов пользователей с использованием нотации IDEF0.
Во второй главе акцент делается на дизайне системы анализа поисковых запросов в социальных сетях. Здесь представлена схема работы предлагаемого программного решения и детализирован алгоритм обработки текстовой информации.
Третья глава охватывает этапы создания программного продукта. В ней также демонстрируются исходы тестирования программного модуля на основе реальных поисковых запросов автора.
В заключении изложены итоги проведенной выпускной квалификационной работы.
В рамках бакалаврской работы будет разработано приложение на языке Python, обеспечивающее анализ текстовых поисковых запросов. Оно включает в себя функции: импорт и просмотр данных запросов, их первичную обработку, удаление стоп-слов, приведение слов к их основной форме, частотный анализ и визуализацию наиболее употребляемых слов в форме "облака тегов". Проведено тестирование программы на актуальных текстовых запросах.
Бакалаврская работа состоит из 40 страниц текста, 26 рисунков, и 20 источников.
Введение 3
Глава 1 Технологии анализа текстовых данных 6
1.1 Сферы использования технологий анализа текстовых данных 6
1.2 Моделирование метода выявления интересов пользователя 11
Глава 2 Разработка системы анализа поисковой активности в социальных сетях 15
2.1 Методика исследования поисковых запросов 15
2.2 Подробное описание алгоритма обработки текстовых данных из
поисковых запросов 19
Глава 3 Создание приложения для исследования поисковых запросов 23
3.1 Особенности выполнения программного блока 23
3.2. Результаты тестирования приложения 33
3.3. Расчет экономической эффективности 36
Заключение 38
Список используемой литературы и используемых источников 39
Тема бакалаврской работы - «Разработка информационной системы для анализа поисковых запросов в социальных сетях».
Исследование поисковых запросов помогает выявить основные темы, которые интересуют конкретного пользователя. Методы анализа запросов применяются для рекомендаций товаров и контента в соцсетях. Благодаря этим методам можно лучше понять интересы и предпочтения пользователя.
Актуальность работы заключается в разработке системы для анализа поисковых запросов и визуализации полученных результатов.
Объектом исследования бакалаврской работы является технологии анализа текстовых данных (text mining).
Предметом исследования бакалаврской работы является система для анализа и визуализации текстовых запросов.
Цель данной выпускной квалификационной работы - создание информационной системы для анализа поисковых запросов в социальных сетях с целью выявления интересов пользователя.
Методы исследования - технологии текстовых данных (text mining), технологии проектирования информационных систем, технологии программирования.
Данная работа состоит из введения, трех глав, заключения и списка используемой литературы.
В первой главе исследования рассматриваются характеристики анализа текстовых данных, в следующей главе представлены подходы к анализу поисковых запросов и визуализации полученных результатов, а в третьей главе подробно описана практическая реализация системы для анализа поисковых запросов в социальных сетях.
Бакалаврская работа состоит из 41 страницы текста, 27 рисунков и 20 источников.
1. Агеев М. С. Автоматическая рубрикация текстов: методы и проблемы / М.С. Агеев, Б.В. Доброе, Н.В. Лукашевич // Ученые записки казанского государственного университета, 2011. - №5. - с. 26-40
2. Григорьев Е.А. Разведочный анализ данных с помощью Python /
Григорьев Е.А., Климов Н.С. // E-Scio. 2021. №3 (42). URL:
https://cyberleninka.rU/article/n/razvedochnyy-analiz-dannyh-s-pomoschyu-python (дата обращения: 22.09.2023).
3. Гришков, Д.Ю. Язык высокого уровня программирования Python / Гришков Данила Юрьевич, Аусилова Назерке Мырзабековна // HMP/S&R. 2023. №1 (9). URL: https://cyberlemnka.ru/article/n/yazyk-vysokogo-urovnya- programmirovaniya-python (дата обращения: 22.09.2023).
4. а Ершов, В.Е. Тенденции развития рекламной деятельности в
социальных сетях / Ершов Вадим Евгеньевич // Вестник евразийской науки. 2017. №4 (31). URL: https://cyberleninka.ru/article/n/tendentsii-razvitiya-
reklamnoy-deyatelnosti-v-sotsialnyh-setyah (дата обращения: 22.09.2023).
5. Корелов, С.В. Предобработка текстов электронных писем в задаче обнаружения спама / С.В. Корелов, А.М. Петров, Л.Ю. Ротков, А.А. Горбунов // Труды учебных заведений связи, 2021. - №5. - с. 81-92
6. Леоненков А. В. Объектно-ориентированный анализ и проектирование с использованием UML и IBM Rational Rose [Электронный ресурс] : учебное пособие. М. : Интернет-Университет Информационных Технологий (ИНТУИТ), Ай Пи Ар Медиа, 2021. 218 с. [Электронный ресурс]. URL: https://www.iprbookshop.ru/97554.html (дата обращения: 06.09.2023).
7. Маннинг, К.Д. Введение в информационный поиск / Г Кристофер Д. Маннинг, Прабхакар Рагхаван, Хайнрих Шютце. : Пер. с англ. - М. : ООО “И.Д. Вильямс”, 2016 - 438c.
8. Мкртычев С.В., Гущина О.М., Очеповский А.В. Прикладная информатика. Бакалаврская работа [Электронный ресурс] : электрон. учеб- метод. пособие. Тольятти. ТГУ: Изд-во ТГУ, 2020. 2 оптический диск.
9. Тарасова А.Н. Сентиментальный анализ постов в социальных
сетях посредством Python / Тарасова А.Н., Иванов К.О. // Символ науки. 2023. №4-1. URL: https://cyberleninka.ru/article/n/sentimentalnyy-analiz-postov-v-
sotsialnyh-setyah-posredstvom-python (дата обращения: 22.09.2023).
10. Чибирова, М.Э. Анализ данных и регрессионное моделирование с применением языков программирования Python и R / Чибирова Марина Эльбрусовна // Научные записки молодых исследователей. 2020. №3. URL: https://cyberleninka.ru/article/n/analiz-dannyh-i-regressionnoe-modelirovanie-s- primeneniem-yazykov-programmirovaniya-python-i-r (дата обращения: 22.09.2023).
11. Amasaki, S. The Effects of Vectorization Methods on Non-Functional Requirements Classification / Sousuke Amasaki, Pattara Leelaprute // 2019 46th Euromicro Conference on Software Engineering and Advanced Applications (SEAA), 2019. - IEEE, Prague, Czech Republic, 2019. - pp.56-76.
12. Bird, S. Natural Language Processing with Python / Steven Bird, Ewan Klein, Edward Loper. - Published by O’Reilly Media, Inc., 2015. - 452p.
13. Bugueno, М. Learning to combine classifiers outputs with the transformer for text classification / Margarita Bugueno, Marcelo Mendoza // Intelligent Data Analysis, 2020 - № 24. - pp. 15-41
14. Business Process Model and Notation [Электронный ресурс]. URL: https://www.omg.org/spec/BPMN/3.0/About-BPMN/ (дата обращения: 22.09.2023).
15. Gao, G. Research on Routing Selection Algorithm Based on Genetic Algorithm / Guohong Gao, Baojian Zhang, Xueyong Li, Jinna Lv // International Conference on Intelligent Computing and Information Science - International Conference, ICICIS 2011, Chongqing, China, January 19-20, 2014. Proceedings,
Part II: Intelligent Computing and Information Science. - Springer-Verlag Berlin Heidelberg 2014. - pp. 253-258
16. Higuchi, T. Special Section on Nonparametric Approach to Time Series Analysis / Tomoyuki Higuchi, Genshiro Kitagawa // Annals of the Institute of Statistical Mathematics, 2008. - .№55 (135). - Springer Nature Switzerland AG 2006. - pp.103-114
17. Jurafsky, D. Speech and Languge Processing: An Introduction to Natural Language Proccerring, Computation Linguistics and Speech Recognition / Jurafsky, Daniel; H. James, Martin. - Stanford University, 2022. - 414 p.
18. Kowsari, K. Text Classification Algorithms: A Survey / Kamran Kowsari, Kiana Jafari Meimandi, Mojtaba Heidarysafa, Sanjana Mendu, Laura Barnes, Donald Brown // Machine Learning on Scientific Data and Information. - Cornell University, 2020. - pp. 101-165.
19. Srividhya, V. Evaluating Preprocessing Techniques in Text Categorization / V. Srividhya, R. Anitha // International Journal of Computer Science and Application Issue 2010. - pp. 52-53.
20. Sun, C. How to Fine-Tune BERT for Text Classification? / Chi Sun, Xipeng Qiu, Yige Xu, Xuanjing Huang // Computation and Language, 2021. - Cornell University, 2021. - pp. 25-35.
| Купить эту работу vs Заказать новую | ||
|---|---|---|
| 0 раз | Куплено | Выполняется индивидуально |
|
Не менее 40%
Исполнитель, загружая работу в «Банк готовых работ» подтверждает, что
уровень оригинальности
работы составляет не менее 40%
|
Уникальность | Выполняется индивидуально |
| Сразу в личном кабинете | Доступность | Срок 1—6 дней |
| 2500 ₽ | Цена | от 3000 ₽ |
Не подошла эта работа?
В нашей базе 55021 Дипломная работа — поможем найти подходящую