Создан заказ №4033160
20 мая 2019
Кластеризация и выделение тематики текстовых документов
Как заказчик описал требования к работе:
Кластеризация и выделение тематики текстовых документов на языке python
Нужно выбрать какой-нибудь датасет. Например, лента новостей, набор твитов(в датасете должен быть набор РУССКОЯЗЫЧНЫХ документов)
Программа должна определить тематики датасета(выполнить кластеризацию), разбить его на категории,
на подкатегории и оценить настроение автора текста
по сути программа должна выполнить следующее, если поэтапно:
1.выполнить предобработку текста(убрать цифры, запятые, пробелы и тд. - провести лемматизацию).
2.Извлечь признаки(алгоритмы LDA, LSA например)
3.Смоделировать тематику
на примере моего датасета(русскоязычные твиты) программа должна показать:
сообщения о политике
сообщения о играх
сообщения о погоде
....
....
....
сообщения о науке
когда заходишь в тематику показывает сколько из них позитивно настроены, сколько из них негативно настроены, сколько из них нейтрально настроены
т.е делит на множество категорий(тематик), в каждой из которой указан процент позитивных, процент негативных и процент нейтральных сообщени
подробнее
Заказчик
заплатил
заплатил
200 ₽
Заказчик не использовал рассрочку
Гарантия сервиса
Автор24
Автор24
20 дней
Заказчик принял работу без использования гарантии
21 мая 2019
Заказ завершен, заказчик получил финальный файл с работой
5
Кластеризация и выделение тематики текстовых документов.jpg
2019-12-17 19:42
Последний отзыв студента о бирже Автор24
Общая оценка
4.3
Положительно
Работа выполнена по всем требованиям и очень быстро. Советую именно этого автора, ведь разбирает все проблемы до мелочей, а потом расставляет всё по полочкам так, что вопросов по работе не остаётся.