Создан заказ №4291959
24 октября 2019
Перспективы развития газомоторных автомобилей на территории России и его конкуренции с Электромобилями !
Как заказчик описал требования к работе:
Срочно нужно написать эссе по транспортным средствам ко вторнику. Список требований в файле.
Фрагмент выполненной работы:
ВВЕДЕНИЕ
В современном цифровом мире данные приобретают все большую и большую ценность. В основе любой задачи, которую предстоит сегодня решать машине или человеку, лежат данные. Для того чтобы эффективно работать с этой информацией, получать из нее пользу и реализовывать задачи, востребованные компаниями и людьми, данные нужно извлекать, обрабатывать, структурировать. То, что мы видим как веб-сайт с отзывом о фильме, для машины представляется сборищем разных «кусков» данных с непонятным назначением. (работа была выполнена специалистами Автор 24) Человек, взглянув на веб-страницу, сразу легко определяет нужный и значимый раздел, но для компьютера понимание того, какой именно текст следует обрабатывать, как отделить этот текст от рекламы, ненужных заголовков, ссылок является довольно сложной задачей[1].
Попробуем определить что из себя представляет неструктурированные данные. Неструктурированным называют данные, которые не имеют описанной внутренней структуры или определения, соответствующего задаче, которую предполагается решать[2].
Разработка и реализация качественных механизмов сбора информации является залогом успешной ее обработки и в этой курсовой работе дается руководство по подходам и методам решения этой задачи с помощью популярного языка программирования Python[3].
Natural Language Toolkit(NLTK) – это набор библиотек Python, предназначенный для поиска и тегирования частей речи в естественном (английском) тексте. Его разработка началась в 2000 году и в течение последних 15 лет десятки разработчиков по всему миру внесли свой вклад в этот проект[4].
В настоящее время интенсивно развивается направление математической лингвистики, называемое Natural Language Processing (англ. Обработка естественного текста). Главная цель этого научного направления – компьютерный анализ и синтез естественных языков. Для компьютерной обработки неструктурированных текстов существует значительное число программных продуктов и специальных библиотек, в том числе и для языка программирования Python[5].
Одним из наиболее важных факторов ранжирования сайтов является плотность ключевых слов. Плотность ключевых слов — это процентное соотношение количества ключевых слов к общему числу слов в тексте. То есть, если поисковый запрос упоминается в контенте страницы достаточное количество раз, то эта страница более релевантна данному запросу, чем страница, где ключевое слово встречается один раз или не встречается вовсе.
Цель настоящей работы: разработать программу для получения плотности ключевого слова английского неструктурированного текста. Для достижения поставленной цели необходимо решить следующие задачи:
Исследовать методы анализа неструктурированного текста
Изучить обработку неструктурированного текста с помощью библиотеки NLTK
Сбор HTML-данных c домена и парсинг данных с целью получения интересующей информации
Разработка программы для получения плотности ключевых слоПосмотреть предложения по расчету стоимости
Заказчик
заплатил
заплатил
200 ₽
Заказчик не использовал рассрочку
Гарантия сервиса
Автор24
Автор24
20 дней
Заказчик воспользовался гарантией для внесения правок на основе комментариев преподавателя
25 октября 2019
Заказ завершен, заказчик получил финальный файл с работой
5
Перспективы развития газомоторных автомобилей на территории России и его конкуренции с Электромобилями !.docx
2020-03-05 12:50
Последний отзыв студента о бирже Автор24
Общая оценка
4.2
Положительно
Благодарна! Быстро! Качественно! Автор всегда на связи, отвечает на вопросы интересующие! Огромное спасибо! всем рекомендую!