Создан заказ №10204188
24 октября 2023
Работа с ms word (google docs/etc), нкря, antconc и voyant tools
Как заказчик описал требования к работе:
Заключается в использовании MS Word (Google Docs/etc), НКРЯ, AntConc и Voyant Tools. 0.
Подробное описание в файле.
Создайте файл .docx, подпишите его в формате *ФИО_группа*, в начале файла создайте оглавление, для каждой части задания используйте оформление заголовков. Пронумеруйте страницы и офо
рмите верхний колонтитул. 1. В НКРЯ перейдите в газетный корпус, задайте подкорпус с 1 января 2015 по актуальную дату, проведите поиск по 3 выбранным вами словам (например, “нейросеть”). - Зафиксируйте, сколько раз это слово встретилось в подкорпусе за обозначенный период. - Перейдите в “график по годам” и сохраните скриншоты 3 графиков. Опишите тенденции, которые наблюдаете на графиках. Какие выводы можно сделать? - Подсчитайте IPM для каждого из 3 слов, зафиксируйте в виде таблицы, где названия колонок - слово, количество словоупотреблений, сколько слов в корпусе, участок корпуса, ipm. - Для этих же 3 слов воспользуйтесь поиском по грамматическим признакам и найдите по 5 конструкций, которые встречаются в корпусе рядом с этими словами (например, нейросеть + V - нейросеть позволяет…) 2. Соберите коллекцию из 10 текстов в формате txt. Назовите их в формате “год название статьи”. - Откройте его в AntConc, посмотрите самые частотные слова. - Добавьте список стоп-слов, повторите операцию. - Кликнув на 3 любых интересных для вас слова, посмотрите их конкордансы. - Постройте частотный список двух-, трех- и т.д. -словных словосочетаний (вкладка Cluster/N-Grams, поставьте галочку на N-Grams, укажите, сколько слов в ngram-е вы хотите видеть, например, Min:3, Max:3, установите порог вхождений в корпусе, например, 10). Кликнув на n-грам, вы также можете попасть в его конкорданс. - Постройте списки коллокатов выбранного вами слова (вкладка Collocates), указав границы окна справа / слева. Должно получиться несколько файлов: 1. Из окна Word - частотный список до применения стоп-фильтра и после (2 файла). 2. Из окна Concordance - достаточно 1 файл. 3. Из окна N-gram - 1 файл. 4. Из окна Collocate - 1 файл. Для справки прикрепляю инструкцию по работе с картинками, куда нажимать :) 3. В Voyant Tools используйте те же 10 документов, что и на предыдущем этапе. 1. Выведите топ-50 слов по всему корпусу (Cirrus - облако слов); добавьте новые стоп-слова (обратите внимание на формы глаголов речи, вспомогательные глаголы и сокращения неинформативные сокращения-аббревиатуры, «слова» без алфавитных символов); обновляйте список стоп-слов, пока топ-50 не покажется вам информативным. Сохраните изображение и добавьте в .docx. 2. Какой документ самый длинный? Какой самый короткий? Сколько в них словоупотреблений? 3. Назовите три документа с наименьшей лексической плотностью. Сколько она составляет? 4. Выберите на основе Cirrus три слова и проследите их динамику для всех документов
подробнее
Заказчик
заплатил
заплатил
200 ₽
Заказчик не использовал рассрочку
Гарантия сервиса
Автор24
Автор24
20 дней
Заказчик принял работу без использования гарантии
25 октября 2023
Заказ завершен, заказчик получил финальный файл с работой
5
Работа с ms word (google docs/etc), нкря, antconc и voyant tools.docx
2023-10-28 10:34
Последний отзыв студента о бирже Автор24
Общая оценка
4
Положительно
Хорошая работа с базами данных, сданы с небольшой задержкой, но результат того стоит