Создан заказ №10809293
26 апреля 2024
Анализ таблицы с kaggle (пишите сразу с ценой)
Как заказчик описал требования к работе:
Написать код, который преобразует табличные значения выбранного датасета в удобный вид для дальнейшей обработки.
Должны быть реализованы следующие операции:
1. Первичный анализ данных: сколько строчек и столбцов в таблице, какие типы используются у столбцов, дать математическое описание (describe)
для числовых и нечисловых столбцов, посчитать количество NaN значений для каждого столбца.
Если пустых значений изначально нет, то вначале обработать таблицу, чтобы 1% значений в ней был удалён. Пример кода для удаления значений:
for col in df.columns: df.loc[df.sample(frac=0.01).index, col] = np.nan
2. Обработка пустых (NaN) значений: либо удалением строчек, в которых они есть, либо с помощью наполнения какими-то значениями.
Удалить строчки со слишком большим числом отсутствующих значений. Удалить столбцы со значениями, из которых нельзя получить информацию.
3. Получение новых признаков и отбор признаков: преобразовать категориальные столбцы в бинарные (get_dummies), попытаться получить информацию из столбцов со строковой информацией, преобразовать числовые данные, чтобы привести их к стандартному виду (стандартизация, масштабирование до диапазона), получить аггрегированные столбцы, удалить столбцы со слишком большой корреляцией, удалить столбцы со слишком маденькой значимостью (по анализу LassoLarsCV), подобрать лучшее количество признаков и набор этих признаков (RFECV и RFE).
Сдать отчёт в виде сохранённого ноутбука (должен быть виден результат после каждого блока кода) в формате html (File - Save and Export Notebook As - HTML)
Также скинуть описание данных или ссылку на kaggle или откуда был взят датасет.
Явно укажите столбец, по которому будет произведена дальнейшая классификация (столбец с категориальными или бинарными значениями), и и столбец для регрессии (столбец с количественными значениями)
подробнее
Заказчик
заплатил
заплатил
100 ₽
Заказчик не использовал рассрочку
Гарантия сервиса
Автор24
Автор24
20 дней
Заказчик принял работу без использования гарантии
27 апреля 2024
Заказ завершен, заказчик получил финальный файл с работой
![](https://author24shop.ru/assets/img/avatars/size176x176/155/569755.jpg?1675764935)
5
![скачать](/assets/img/lenta2020/download_icon.png)
Анализ таблицы с kaggle (пишите сразу с ценой).docx
2024-04-30 13:12
Последний отзыв студента о бирже Автор24
Общая оценка
5
![](/assets/images/emoji/star-eyes.png)
Положительно
Автор внимателен к просьбам доработки, разъясняет некоторые детали, и сдает работу вовремя