Создан заказ №11246047
29 ноября 2024
Две лабораторные работы по Машиному обучению
Как заказчик описал требования к работе:
Лабораторная 5
Реализовать Q-network (DQN)+replay buffer+target network
Обучить на задаче cartpole-v0, так чтобы полностью решить задачу за 300 эпизодов или меньше. Должен быть код, который показывает, что обученный DQN c replay buffer может в течении 200 эпизодов работать без ошибок, то есть полно
стью решать задачу.
Лабораторная 6
Реализовать метод Policy Gradient
Обучить на задаче cartpole-v1, так чтобы полностью решить задачу меньше, чем за 3000 эпизодов. Должен быть код, который показывает, что обученный агент может в течении 200 эпизодов работать без ошибок, то есть полностью решать задачу.
Нужно выполнить (с комментариями) в файле ipynb.
Предмет «Методы машинного обучения в робототехнике». Pytho
подробнее
Заказчик
заплатил
заплатил
200 ₽
Заказчик не использовал рассрочку
Гарантия сервиса
Автор24
Автор24
20 дней
Заказчик принял работу без использования гарантии
30 ноября 2024
Заказ завершен, заказчик получил финальный файл с работой

5

Две лабораторные работы по Машиному обучению .jpg
2024-12-03 19:02
Последний отзыв студента о бирже Автор24
Общая оценка
5

Положительно
спасибо за отличную работу и огромное спасибо за терпение при ответе на мои бесконечные вопросы!)))