Студенческая работа на тему:

Работа с датасетом, проект по статическому анализу данных в питоне

Другое

Создан заказ №11243033

28 ноября 2024

Работа с датасетом, проект по статическому анализу данных в питоне

Как заказчик описал требования к работе:

1. For five variables calculate the appropriate measures of the central tendency (mode/median/mean), interpret them. Remember that for different variables, you can count different MCTs (for example, for age, at least you can count all three, but for color only mode). 2. Look at the outliers fo r three variables. Visualize them using a box plot (hint sns.boxplot()). Interpret the graphs. 3. For two variables, calculate the outliers using both the interquartile range and the standard deviation from the mean. Are the results different? Interpret them. 4. If there are outliers, delete them (if there is a lot of data) or replace them with the mean/median (if there is little data) and see how the measures of the central tendency in the variable under consideration have changed. 5. If there are missing values in the data, specify in which variables and how many of them. And fill them with the median/mean. 6. Build a correlation matrix (use seaborn.heatmap function) based only on those features for which the correlation can be calculated (If there are a lot of such pairs, build 5 of any) 7. Interpret each correlation value in the matrix 8. Plot the scatter plots based on these features (hint sns.pairplot()) 9. Define the problem task (whether it is regression or binary classification) depending on your target that you're going to predict "10. Apply machine learning algorithm (linear regression model for regression / logistic regression for classification) 10.1 1st experimental data: take all numeric and encoded categorical features 10.2 2nd experimental data: take top-3 (top-5) features with the highest correlation with target 11. For the 1st experimental and the 2nd experimental data separately: 11.1 Split your data into train and test into 80% and 20% proportion correspondingly 11.2 Train ML algorithm on train set 11.3 Make predictions on test set 11.4 calculate quality metrics (R^2, RMSE for regression; accuracy, recall, precision for classification) 12. compare results of two models (where the accuracy, precision, recall are higher (or RMSE is the lowest for regression task), the better model is)" 13. Conclusion (Interpreation of obtained results, comparison between two experiments and of the whole project in a free form) 14. Create zip archive with .ipynb file and .csv/.xlsx dataset (or separate files

подробнее

Заказчик
заплатил

100 ₽

Заказчик не использовал рассрочку

Гарантия сервиса
Автор24

20 дней

Заказчик принял работу без использования гарантии

29 ноября 2024

Заказ завершен, заказчик получил финальный файл с работой

Заказ выполнил

KINNEKT

Работа с датасетом, проект по статическому анализу данных в питоне.docx

2024-12-02 17:28

Последний отзыв студента о бирже Автор24

Общая оценка

Положительно

автор гений.работа прошла с первой проверки без доработок без нариканий. работу сдал раньше срока.вообще красавчик.советую всем

Хочешь такую же работу?

Скидка

100 ₽

на первый заказ

Оставляя свои контактные данные и нажимая «Создать задание», я соглашаюсь пройти процедуру регистрации на Платформе, принимаю условия Пользовательского соглашения и Политики конфиденциальности в целях заключения соглашения.

Тебя также могут заинтересовать

по этому предмету по этому типу и предмету

Реализ ация RTP протокола на языке C/C++(любой)

Курсовая работа

Программирование

Стоимость:

700 ₽

Разработка личного кабинета пользователя для сайта организации (диплом)

Выпускная квалификационная работа (ВКР)

Программирование

Доработка программы на языке программирования С# в Visual Studio

Контрольная работа

Программирование

Стоимость:

300 ₽

Создание программы в LabView. Обработка данных с термопары.

Задача по программированию

Программирование

1С:Предприятие - Разработка информационной базы

Курсовая работа

Программирование

Стоимость:

700 ₽

Информационные процессы в неживой природе

Реферат

Программирование

Стоимость:

300 ₽

Приложение на базе Android, взаимодействующее с ОС

Творческая работа

Программирование

Стоимость:

300 ₽

виртуальный прибор спектрофотометр в среде графического программирования LabView

Другое

Программирование

Стоимость:

300 ₽

Калькулятор больших чисел/Длинная арифметика

Творческая работа

Программирование

Стоимость:

300 ₽

Разработка информационной системы театра

Курсовая работа

Программирование

Стоимость:

700 ₽

Программирование сетевых приложений ; Сетевое приложение Оплата коммунальных услуг"

Контрольная работа

Программирование

Стоимость:

300 ₽

Оценка 3 методов сортировки одномерных массивов

Другое

Программирование

Стоимость:

300 ₽

Цветовая маркировка резисторов, C programming

Другое

Программирование

Стоимость:

300 ₽

виртуальный прибор спектрофотометр в среде графического программирования LabView

Другое

Программирование

Стоимость:

300 ₽

Реальная задача прогнозирования цен на недвижимость.

Другое

Программирование

Стоимость:

300 ₽

Создание программы. Нужно создать программу для подбора звукоизолирующей конструкции учитывая исходные данные.

Другое

Программирование

Стоимость:

300 ₽

сделать блок-схему для программного кода( консольное приложение С++ visual studio)

Другое

Программирование

Стоимость:

300 ₽

Программирование в Pascal. Выполнение заданий описанных в документе.

Другое

Программирование

Стоимость:

300 ₽

Генетический алгоритм составления расписания ВУЗа

Другое

Программирование

Стоимость:

300 ₽

Необходимо сделать базу данных состоящую из 6-8 таблиц

Другое

Программирование

Стоимость:

300 ₽

Реализация лабораторных работ на qt c++

Другое

Программирование

Стоимость:

300 ₽

Читай полезные статьи в нашем

Типы данных. Переменные и константы в Turbo Pfscal V.7.0

В Turbo Pascal все данные, которые используются в программе, принадлежат к какому-либо определенному типу.
Тип данных определяется:
Типы данных в Turbo Pascal подразделяют на 5 основных классов:
Остановимся более подробно на простых типах данных. Они, в свою очередь, бывают порядковые и вещественные.
К порядковому типу данных можно отнести следующие типы:
Значение целочисленного типа данных может быть ...

подробнее

Работа с рисунками на веб-страницах

Во времена зарождения службы WWW Web-страницы могли и обходились без рисунков, поскольку сама концепция гипертекста давала понять, насколько прогрессивна данная служба, ведь главное заключалось не в красоте, а в информативности и возможности навигации. В наше время без многообразия рисунков Web-страницы представить просто нельзя. Рисунки используются при создании Web-страниц не только в качестве и...

подробнее

Мультимедиа на веб-страницах

В настоящее время, используя Всемирную паутину, можно передавать не только текстовые данные и изображения, но и видео, звук и все то, что называется мультимедиа. Под термином «мультимедиа» понимают компьютерное представление информации, состоящее из более, чем одного типа данных, к которым можно отнести текст и звук, видео и звук. Основная масса мультимедийных элементов, которые встречаются в сети...

подробнее

Ruby, язык программирования

Ruby — язык программирования (ЯП), обладающий следующими особенностями:
Ruby относится к категориям высокоуровневых, рефлективных и интерпретируемых языков. В нем реализована концепция объектно-ориентированного программирования (классы с полями и методами, наследование, полиморфизм, инкапсуляция, примеси, методы-одиночки, итераторы, замыкания и т.д.).
К уникальным свойствам языка можно отнести:
В то ...

подробнее

Типы данных. Переменные и константы в Turbo Pfscal V.7.0

подробнее

Работа с рисунками на веб-страницах

подробнее

Мультимедиа на веб-страницах

подробнее

Ruby, язык программирования

подробнее

Главная Лента заказов Учебные задания Программирование Работа с датасетом, проект по статическому анализу данных в питоне