Найди эксперта для помощи в учебе
Найти эксперта
+2
Пример заказа на Автор24
Студенческая работа на тему:
Анализ таблицы с kaggle (пишите сразу с ценой)
Создан заказ №10809293
26 апреля 2024

Анализ таблицы с kaggle (пишите сразу с ценой)

Как заказчик описал требования к работе:
Написать код, который преобразует табличные значения выбранного датасета в удобный вид для дальнейшей обработки. Должны быть реализованы следующие операции: 1. Первичный анализ данных: сколько строчек и столбцов в таблице, какие типы используются у столбцов, дать математическое описание (describe) для числовых и нечисловых столбцов, посчитать количество NaN значений для каждого столбца. Если пустых значений изначально нет, то вначале обработать таблицу, чтобы 1% значений в ней был удалён. Пример кода для удаления значений: for col in df.columns: df.loc[df.sample(frac=0.01).index, col] = np.nan 2. Обработка пустых (NaN) значений: либо удалением строчек, в которых они есть, либо с помощью наполнения какими-то значениями. Удалить строчки со слишком большим числом отсутствующих значений. Удалить столбцы со значениями, из которых нельзя получить информацию. 3. Получение новых признаков и отбор признаков: преобразовать категориальные столбцы в бинарные (get_dummies), попытаться получить информацию из столбцов со строковой информацией, преобразовать числовые данные, чтобы привести их к стандартному виду (стандартизация, масштабирование до диапазона), получить аггрегированные столбцы, удалить столбцы со слишком большой корреляцией, удалить столбцы со слишком маденькой значимостью (по анализу LassoLarsCV), подобрать лучшее количество признаков и набор этих признаков (RFECV и RFE). Сдать отчёт в виде сохранённого ноутбука (должен быть виден результат после каждого блока кода) в формате html (File - Save and Export Notebook As - HTML) Также скинуть описание данных или ссылку на kaggle или откуда был взят датасет. Явно укажите столбец, по которому будет произведена дальнейшая классификация (столбец с категориальными или бинарными значениями), и и столбец для регрессии (столбец с количественными значениями)
подробнее
Заказчик
заплатил
100 ₽
Заказчик не использовал рассрочку
Гарантия сервиса
Автор24
20 дней
Заказчик принял работу без использования гарантии
27 апреля 2024
Заказ завершен, заказчик получил финальный файл с работой
5
Заказ выполнил
user1004163
5
скачать
Анализ таблицы с kaggle (пишите сразу с ценой).docx
2024-04-30 13:12
Последний отзыв студента о бирже Автор24
Общая оценка
5
Положительно
Автор внимателен к просьбам доработки, разъясняет некоторые детали, и сдает работу вовремя

Хочешь такую же работу?

Оставляя свои контактные данные и нажимая «Создать задание», я соглашаюсь пройти процедуру регистрации на Платформе, принимаю условия Пользовательского соглашения и Политики конфиденциальности в целях заключения соглашения.
Хочешь написать работу самостоятельно?
Используй нейросеть
Мы создали собственный искусственный интеллект,
чтобы помочь тебе с учебой за пару минут 👇
Использовать нейросеть
Тебя также могут заинтересовать
Курсовой проект по дисциплине "Безопасность систем баз данных"
Курсовая работа
Базы данных
Стоимость:
700 ₽
Разработка базы данных для интернет-магазина
Курсовая работа
Базы данных
Стоимость:
700 ₽
111
Курсовая работа
Базы данных
Стоимость:
700 ₽
Проектирование баз данных
Курсовая работа
Базы данных
Стоимость:
700 ₽
Разработка БД в Mysql или Sql Server
Другое
Базы данных
Стоимость:
300 ₽
БД access профкома ВУЗа
Другое
Базы данных
Стоимость:
300 ₽
Разработать несколько запросов в Delphi7+DBD.
Другое
Базы данных
Стоимость:
300 ₽
Читай полезные статьи в нашем
Модели и типы данных
Обобщенные категории «данные» и «модель данных» являются одними из основополагающих в концепции баз данных.
Данные сами по себе не имеют определенной структуры. Они становятся информацией в том случае, когда пользователь им задаст определенную структуру, т.е. осознает их смысловое содержание. Таким образом, центральным понятием в базах данных является модель. Однозначно определить этот термин невоз...
подробнее
Язык SQL. Основы работы с реляционными СУБД. Основы языка SQL
Эдгаром Коддом была инициирована разработка языка SEQUEL, который позже переименовали в SQL (Structured Query Language – структурированный язык запросов). Язык создавался как простой непроцедурный язык, который мог бы использовать даже пользователь без навыков программирования.
Языки манипулирования данными, которые были созданы до появления реляционных БД и разработаны для многих систем управления...
подробнее
Символьные типы данных
Одним из самых распространенных типов данных является символьный тип CHAR. С помощью этого типа описываются такие символьные данные, как, например, адреса или имена.
Также используются символьные типы VARCHAR, SET ENUM TEXT и BLOB.

Типы данных CHAR и VARCHAR отличаются способами их извлечения и хранения.
Длина поля в столбце типа CHAR является постоянной и может содержать любые значения от 1 до 255 (...
подробнее
No-SQL СУБД
Основной целью NoSQL баз данных является предоставление дополнительного функционала.
СУБД являются специальными приложениями или набором библиотек для работы с разными базами данных.
Термин NoSQL изначально подразумевал избежание использования стандартов SQL. Впоследствии его стали применять в отношении нереляционных БД.
В NoSQL БД и СУБД не подразумеваются внутренние связи. Они не основаны на одной ...
подробнее
Модели и типы данных
Обобщенные категории «данные» и «модель данных» являются одними из основополагающих в концепции баз данных.
Данные сами по себе не имеют определенной структуры. Они становятся информацией в том случае, когда пользователь им задаст определенную структуру, т.е. осознает их смысловое содержание. Таким образом, центральным понятием в базах данных является модель. Однозначно определить этот термин невоз...
подробнее
Язык SQL. Основы работы с реляционными СУБД. Основы языка SQL
Эдгаром Коддом была инициирована разработка языка SEQUEL, который позже переименовали в SQL (Structured Query Language – структурированный язык запросов). Язык создавался как простой непроцедурный язык, который мог бы использовать даже пользователь без навыков программирования.
Языки манипулирования данными, которые были созданы до появления реляционных БД и разработаны для многих систем управления...
подробнее
Символьные типы данных
Одним из самых распространенных типов данных является символьный тип CHAR. С помощью этого типа описываются такие символьные данные, как, например, адреса или имена.
Также используются символьные типы VARCHAR, SET ENUM TEXT и BLOB.

Типы данных CHAR и VARCHAR отличаются способами их извлечения и хранения.
Длина поля в столбце типа CHAR является постоянной и может содержать любые значения от 1 до 255 (...
подробнее
No-SQL СУБД
Основной целью NoSQL баз данных является предоставление дополнительного функционала.
СУБД являются специальными приложениями или набором библиотек для работы с разными базами данных.
Термин NoSQL изначально подразумевал избежание использования стандартов SQL. Впоследствии его стали применять в отношении нереляционных БД.
В NoSQL БД и СУБД не подразумеваются внутренние связи. Они не основаны на одной ...
подробнее
Теперь вам доступен полный отрывок из работы
Также на e-mail вы получите информацию о подробном расчете стоимости аналогичной работы