Создан заказ №8831976
12 октября 2022
Mapreduce-алгоритм построения инвертированного индекса
Как заказчик описал требования к работе:
MapReduce-алгоритм построения инвертированного
индекса
Требуется построить инвертированный индекс (inverted index) для заданного корпуса
текстов (текстового файла).
Входные данные map:
(docid, content)
Результирующий инвертированный индекс должен иметь следующую структуру:
(word, [<docid1, TF-IDF1>,
<docid2, TF-IDF2>, ...])
• Статьи должны быть отсортированы в порядке убывания TF-IDF
(Term Frequency – Inverse Document Frequency)
• Для каждого слова ограничить список статей N наиболее релевантными
• Определить и исключить из индекса Top20 высокочастотных слов
При вычислении TF-IDF считаем, что:
• TF(t, d) — это число вхождений слова t в документ d (Wiki-статью)
• IDF(t, D) — обратная частота, с которой слово t встречается во множестве
документов D (Wiki-статьях):
Программы должны быть написаны на языке Java (Apache Hadoop Java API
подробнее
Заказчик
заплатил
заплатил
500 ₽
Заказчик не использовал рассрочку
Гарантия сервиса
Автор24
Автор24
20 дней
Заказчик воспользовался гарантией, чтобы исполнитель повысил уникальность работы
15 октября 2022
Заказ завершен, заказчик получил финальный файл с работой
5
Mapreduce-алгоритм построения инвертированного индекса.docx
2022-10-18 10:32
Последний отзыв студента о бирже Автор24
Общая оценка
4.3
Положительно
Данный автор мастер своего дела,сделал курсовую работу за 3 дня.Очень отзывчивый,помогает и объясняет.Всем советую