Автор24

Информация о работе

Подробнее о работе

Страница работы

Разработка парсера торговой площадки с выведением результатов в файл

  • 55 страниц
  • 2017 год
  • 237 просмотров
  • 1 покупка
Автор работы

Wednesday

Преподаю. Занимаюсь программированием в С# и php.

200 ₽

Работа будет доступна в твоём личном кабинете после покупки

Гарантия сервиса Автор24

Уникальность не ниже 50%

Фрагменты работ

Задача разбора и автоматического сбора данных иначе называется парсингом. Парсер – программа, реализующая парсинг заданных ресурсов с целью получения нужyых данных. Главной особенностью парсера является работа с синтаксисом. Назначение его может быть различным: получение заданной информации с тематических сайтов в автоматическом режиме, обработка данных с целью быстрого получения заданных выражений. Парсер способен распознать нужную информацию в остальном информационном массиве и обработать ее в соответствии с поставленной задачей.
Извлечения данных из интернет-источников специфично тем, что сайты и веб-страницы, несмотря на схожесть, довольно многообразны. Также отсутствует единый стандарт построения сайтов, и большинство имеющихся стандартов носит рекомендательный характер. Поэтому на структуру кода веб-страницы влияют такие факторы, как фантазия веб-дизайнера и умение веб-мастеров. Так же, как информация на ресурсе, так и его внешний вид постоянно изменяется. Поэтому построенные парсеры приходится периодически обновлять, так как изменение исходных ресурсов, с которых собирается информация, может сделать программу работающей некорректно или не работающей. Исходя из этого автоматический сбор и обработка данных являются постоянных и необходимым техническим процессом.

ВВЕДЕНИЕ 3
1 Обзор и анализ способов и средств парсинга интернет-ресурсов 5
1.1 Задача парсинга и ее направления и особенности 5
1.2 Анализ и выбор средств реализации парсера 10
1.3 Регулярные выражения и DOM-структура 16
2 Проектирование и реализация парсера торговой площадки 26
2.1 Техническое задание и определение системных требований 26
2.2 Структурный анализ 27
2.3 Функциональный анализ 29
2.4 Проектирование на языке программирования 29
2.5 Эксплуатация 31
2.6 Извлечение данных о товаре 32
2.7 Экспорт данных в файл Microsoft Excel 37
2.8 Обработка сайтов с java-script 40
2.9 Тестирование и отладка программы 43
3 Экономическая часть 47
3.1 Расход трудоемкости разработки программного продукта 47
3.2 Расход на оплату труда разработчика программы 49
3.3 Общие затраты на создание программного продукта 50
ЗАКЛЮЧЕНИЕ 51
Список использованных источников 53

Представленная работа посвящена парсингу данных о товарах торговой площадки Banggood, с выведением данных в файл Microsoft Excel. Разработана программа на языке php с использованием библиотек для html-разбора. Практическая ценность в сборе данных по товарам очевидна: собирая данные по стоимости и характеристикам различных товаров в сети, предприниматель может выбрать лучшие условия закупки, продажи, назначить собственному товару адекватную цену, быстро заполнить свои базы данных по товарам, конвертировать полученные данные на собственный сайт по продажам товара.
Работа защищалась в ДГТУ в 2017 году, оценка "отлично".
Содержит полный рабочий исходный код программы-парсера на php

Список использованных источников
1. Парсинг [Электронный ресурс]: Википедия, 2017. URL: wik-ihttp://ru.wikipedia.org/
2. Парсер. Редактирование постов [Электронный ресурс]: Wiki.dirty, 2017. URL: http://wiki.dirty.ru
3. Парсер внешних ссылок [Электронный ресурс]: Datacol, 2016, URL: http://www.datacol.ru
4. Найденов Н., Автоматический сбор информации из открытых Интер-нет-источников [Электронный ресурс]: Учреждение Российской ака-демии наук Вычислительный центр им. А.А.Дородницына РАН, 2014. URL: https://www.hse.ru
5. Way J., 30 лучших CSS техник для начинающих (пер.Бернацкого А.) [Электронный ресурс]: Студия Webformyself, 2017. URL: http://www.webformyself.com
6. Паклин Н.Б., Орешков В.И., Бизнес-аналитика: от данных к знаниям // Спб.: Питер, 2009 - 624 с.
7. Гражданский кодекс РФ (ГК РФ) от 21.10.1994 N 51-ФЗ (ст. 15, 16)
8. Получение информации с другого сайта. Законность [Электронный ресурс]: Форумы RSDN, 2012. URL: http://www.rsdn.ru/forum
9. Парсинг html на php. Парсинг от А до Я [Электронный ресурс]: Пар-синг и Я. Блоги, 2015, URL: http://parsing-and-i.blogspot.com
10. Силин Ю. Парсинг – что такое? [Электронный ресурс]: ИнетМаркет, 2012, URL: http://inetmkt.ru
11. Фридл Дж. Регулярные выражения. – 3-е изд., М.:Символ-Плюс,2008. -560 с.
12. Функции DOM [Электронный ресурс]: Форум PHP.SU, 2017, URL: http://www.php.su/
13. Языки программирования. Краткий обзор. [Электронный ресурс]: Программирование для всех, 2015, URL: http://programma-free.ru/
14. HtmlAgilityPack [Электронный ресурс]: Codeplex.com, 2014, URL: http://www. codeplex.com
15. Grab – python-библиотека для парсинга сайтов [Электронный ресурс]: Хабрахабр, 2015. URL: https://habrahabr.ru/
16. Чтение XML в Java с помощью DOM [Электронный ресурс]: Java Swing и другая Java, 2016, URL: http://javaswing.wordpress.com/
17. Парсинг html на Java [Электронный ресурс]: Java, 2014, URL: http://thejava.info/
18. Обзор основных языков программирования [Электронный ресурс]: 13 минут. Самый ценный совет, 2017, URL: http://www.13min.ru
19. PHP [Электронный ресурс]: РНР, 2017, URL: http://www.php.net/
20. Языки программирования. Perl [Электронный ресурс]: Информатик, 2017, URL: http://informat444.narod.ru/
21. Регулярные выражения в php в примерах и теории [Электронный ре-сурс]: РНР,2017, URL: http://www.php.net/
22. Русаков М., Что такое DOM? [Электронный ресурс]: Официальный сайт М.Русакова, 2017, URL: http://myrusakov.ru/
23. Савельева Н., Введение в XML [Электронный ресурс]: Интернет-университет INTUIT, 2016, URL: http://www.intuit.
24. Учимся парсить сайты с библиотекой PHP Simple HTML DOM Parser [Электронный ресурс]: Блог XDan, 2014, URL: http://xdan.ru
25. Русаков М., Основы РНР. Работа с файлами в PHP. [Электронный ресурс]:Официальный сайт М.Русакова, 2015, URL: http ://myrusakov.ru /
26. Как парсить контент, которого нет в коде страницы [Электронный ресурс]: Система помощи ContentDownloader, 2016, URL: http://sbfactory.ru
27. Простой способ выгрузки таблиц в Excel из php [Электронный ре-сурс]: Ответы на простые вопросы и не очень, 2017. URL: http://backnet.ru
28. Методические указания по выполнению экономической части ди-пломной работы. – Волгодонск, 2014.
29. СанПиН 2.2.2/2.4.1340-03 «Гигиенические требования к персональ-ным электронно-вычислительным машинам и организации работы», утвержденного Постановлением Главного санитарного врача Россий-ской Федерации от 03.06.2003 г. №118 (в редакции от 03.09.2010 г.).

Форма заказа новой работы

Не подошла эта работа?

Закажи новую работу, сделанную по твоим требованиям

Оставляя свои контактные данные и нажимая «Заказать Дипломную работу», я соглашаюсь пройти процедуру регистрации на Платформе, принимаю условия Пользовательского соглашения и Политики конфиденциальности в целях заключения соглашения.

Фрагменты работ

Задача разбора и автоматического сбора данных иначе называется парсингом. Парсер – программа, реализующая парсинг заданных ресурсов с целью получения нужyых данных. Главной особенностью парсера является работа с синтаксисом. Назначение его может быть различным: получение заданной информации с тематических сайтов в автоматическом режиме, обработка данных с целью быстрого получения заданных выражений. Парсер способен распознать нужную информацию в остальном информационном массиве и обработать ее в соответствии с поставленной задачей.
Извлечения данных из интернет-источников специфично тем, что сайты и веб-страницы, несмотря на схожесть, довольно многообразны. Также отсутствует единый стандарт построения сайтов, и большинство имеющихся стандартов носит рекомендательный характер. Поэтому на структуру кода веб-страницы влияют такие факторы, как фантазия веб-дизайнера и умение веб-мастеров. Так же, как информация на ресурсе, так и его внешний вид постоянно изменяется. Поэтому построенные парсеры приходится периодически обновлять, так как изменение исходных ресурсов, с которых собирается информация, может сделать программу работающей некорректно или не работающей. Исходя из этого автоматический сбор и обработка данных являются постоянных и необходимым техническим процессом.

ВВЕДЕНИЕ 3
1 Обзор и анализ способов и средств парсинга интернет-ресурсов 5
1.1 Задача парсинга и ее направления и особенности 5
1.2 Анализ и выбор средств реализации парсера 10
1.3 Регулярные выражения и DOM-структура 16
2 Проектирование и реализация парсера торговой площадки 26
2.1 Техническое задание и определение системных требований 26
2.2 Структурный анализ 27
2.3 Функциональный анализ 29
2.4 Проектирование на языке программирования 29
2.5 Эксплуатация 31
2.6 Извлечение данных о товаре 32
2.7 Экспорт данных в файл Microsoft Excel 37
2.8 Обработка сайтов с java-script 40
2.9 Тестирование и отладка программы 43
3 Экономическая часть 47
3.1 Расход трудоемкости разработки программного продукта 47
3.2 Расход на оплату труда разработчика программы 49
3.3 Общие затраты на создание программного продукта 50
ЗАКЛЮЧЕНИЕ 51
Список использованных источников 53

Представленная работа посвящена парсингу данных о товарах торговой площадки Banggood, с выведением данных в файл Microsoft Excel. Разработана программа на языке php с использованием библиотек для html-разбора. Практическая ценность в сборе данных по товарам очевидна: собирая данные по стоимости и характеристикам различных товаров в сети, предприниматель может выбрать лучшие условия закупки, продажи, назначить собственному товару адекватную цену, быстро заполнить свои базы данных по товарам, конвертировать полученные данные на собственный сайт по продажам товара.
Работа защищалась в ДГТУ в 2017 году, оценка "отлично".
Содержит полный рабочий исходный код программы-парсера на php

Список использованных источников
1. Парсинг [Электронный ресурс]: Википедия, 2017. URL: wik-ihttp://ru.wikipedia.org/
2. Парсер. Редактирование постов [Электронный ресурс]: Wiki.dirty, 2017. URL: http://wiki.dirty.ru
3. Парсер внешних ссылок [Электронный ресурс]: Datacol, 2016, URL: http://www.datacol.ru
4. Найденов Н., Автоматический сбор информации из открытых Интер-нет-источников [Электронный ресурс]: Учреждение Российской ака-демии наук Вычислительный центр им. А.А.Дородницына РАН, 2014. URL: https://www.hse.ru
5. Way J., 30 лучших CSS техник для начинающих (пер.Бернацкого А.) [Электронный ресурс]: Студия Webformyself, 2017. URL: http://www.webformyself.com
6. Паклин Н.Б., Орешков В.И., Бизнес-аналитика: от данных к знаниям // Спб.: Питер, 2009 - 624 с.
7. Гражданский кодекс РФ (ГК РФ) от 21.10.1994 N 51-ФЗ (ст. 15, 16)
8. Получение информации с другого сайта. Законность [Электронный ресурс]: Форумы RSDN, 2012. URL: http://www.rsdn.ru/forum
9. Парсинг html на php. Парсинг от А до Я [Электронный ресурс]: Пар-синг и Я. Блоги, 2015, URL: http://parsing-and-i.blogspot.com
10. Силин Ю. Парсинг – что такое? [Электронный ресурс]: ИнетМаркет, 2012, URL: http://inetmkt.ru
11. Фридл Дж. Регулярные выражения. – 3-е изд., М.:Символ-Плюс,2008. -560 с.
12. Функции DOM [Электронный ресурс]: Форум PHP.SU, 2017, URL: http://www.php.su/
13. Языки программирования. Краткий обзор. [Электронный ресурс]: Программирование для всех, 2015, URL: http://programma-free.ru/
14. HtmlAgilityPack [Электронный ресурс]: Codeplex.com, 2014, URL: http://www. codeplex.com
15. Grab – python-библиотека для парсинга сайтов [Электронный ресурс]: Хабрахабр, 2015. URL: https://habrahabr.ru/
16. Чтение XML в Java с помощью DOM [Электронный ресурс]: Java Swing и другая Java, 2016, URL: http://javaswing.wordpress.com/
17. Парсинг html на Java [Электронный ресурс]: Java, 2014, URL: http://thejava.info/
18. Обзор основных языков программирования [Электронный ресурс]: 13 минут. Самый ценный совет, 2017, URL: http://www.13min.ru
19. PHP [Электронный ресурс]: РНР, 2017, URL: http://www.php.net/
20. Языки программирования. Perl [Электронный ресурс]: Информатик, 2017, URL: http://informat444.narod.ru/
21. Регулярные выражения в php в примерах и теории [Электронный ре-сурс]: РНР,2017, URL: http://www.php.net/
22. Русаков М., Что такое DOM? [Электронный ресурс]: Официальный сайт М.Русакова, 2017, URL: http://myrusakov.ru/
23. Савельева Н., Введение в XML [Электронный ресурс]: Интернет-университет INTUIT, 2016, URL: http://www.intuit.
24. Учимся парсить сайты с библиотекой PHP Simple HTML DOM Parser [Электронный ресурс]: Блог XDan, 2014, URL: http://xdan.ru
25. Русаков М., Основы РНР. Работа с файлами в PHP. [Электронный ресурс]:Официальный сайт М.Русакова, 2015, URL: http ://myrusakov.ru /
26. Как парсить контент, которого нет в коде страницы [Электронный ресурс]: Система помощи ContentDownloader, 2016, URL: http://sbfactory.ru
27. Простой способ выгрузки таблиц в Excel из php [Электронный ре-сурс]: Ответы на простые вопросы и не очень, 2017. URL: http://backnet.ru
28. Методические указания по выполнению экономической части ди-пломной работы. – Волгодонск, 2014.
29. СанПиН 2.2.2/2.4.1340-03 «Гигиенические требования к персональ-ным электронно-вычислительным машинам и организации работы», утвержденного Постановлением Главного санитарного врача Россий-ской Федерации от 03.06.2003 г. №118 (в редакции от 03.09.2010 г.).

Купить эту работу

Разработка парсера торговой площадки с выведением результатов в файл

200 ₽

или заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 3000 ₽

Гарантии Автор24

Изображения работ

Страница работы
Страница работы
Страница работы

Понравилась эта работа?

или

9 марта 2018 заказчик разместил работу

Выбранный эксперт:

Автор работы
Wednesday
4.9
Преподаю. Занимаюсь программированием в С# и php.
Купить эту работу vs Заказать новую
1 раз Куплено Выполняется индивидуально
Не менее 40%
Исполнитель, загружая работу в «Банк готовых работ» подтверждает, что уровень оригинальности работы составляет не менее 40%
Уникальность Выполняется индивидуально
Сразу в личном кабинете Доступность Срок 1—6 дней
200 ₽ Цена от 3000 ₽

5 Похожих работ

Дипломная работа

Разработка инфокоммуникационной системы управления крупным радиотелескопом

Уникальность: от 40%
Доступность: сразу
3300 ₽
Дипломная работа

Разработка комплекса рекомендаций по технической защите конфиденциальной информации хозяйствующего субъекта- мед.центра (на конкретном примере)

Уникальность: от 40%
Доступность: сразу
3300 ₽
Дипломная работа

Разработка мультисервисной сети городского микрорайона

Уникальность: от 40%
Доступность: сразу
2800 ₽
Дипломная работа

Разработка автоматизированной системы учета пациентов

Уникальность: от 40%
Доступность: сразу
3750 ₽
Дипломная работа

Разработка Автоматизированной Системы Ведения Электронного Архива

Уникальность: от 40%
Доступность: сразу
2000 ₽

Отзывы студентов

Отзыв михаил об авторе Wednesday 2014-04-27
Дипломная работа

Автор молодец выполнил работу раньше срока. Спасибо

Общая оценка 5
Отзыв Геннадий Полушкин об авторе Wednesday 2016-06-03
Дипломная работа

Спасибо!

Общая оценка 5
Отзыв user9445 об авторе Wednesday 2016-05-18
Дипломная работа

Ребята, Автор - просто бомба! Как же мне с ним повезло!!! Инициативный, грамотный, всегда на связи! Gigavector даже после окончания гарантийного срока дорабатывает расчеты к моей дипломной работе "Разработка информационной системы для объектов дорожной сети" по замечаниям моего придирчивого препода! Надеюсь на благополучную защиту!!!

Общая оценка 5
Отзыв Вера302 об авторе Wednesday 2017-05-24
Дипломная работа

Все отлично! Спасибо за продуктивную работу и подробные пояснения что и как!

Общая оценка 5

другие учебные работы по предмету

Готовая работа

Высокоскоростная корпоративная, локальная вычислительная сеть предприятия

Уникальность: от 40%
Доступность: сразу
1490 ₽
Готовая работа

Программный комплекс задач поддержки процесса использования смарт-карт клиентами АЗС

Уникальность: от 40%
Доступность: сразу
2000 ₽
Готовая работа

Защита локальной сети программными средствами microsoft

Уникальность: от 40%
Доступность: сразу
1000 ₽
Готовая работа

Разработка мобильного приложения для планирования и организации задач пользователя

Уникальность: от 40%
Доступность: сразу
2400 ₽
Готовая работа

Информационная веб-система организации процесса чартеринга яхт

Уникальность: от 40%
Доступность: сразу
2000 ₽
Готовая работа

Обзор рынка программных средств self-service BI инструментов

Уникальность: от 40%
Доступность: сразу
600 ₽
Готовая работа

Разработка голосового чата для локальной сети

Уникальность: от 40%
Доступность: сразу
1800 ₽
Готовая работа

Конфигурирование поисковых серверов для сети Интернет и локальной сети

Уникальность: от 40%
Доступность: сразу
1000 ₽
Готовая работа

Коммутации в телеграфных сетях

Уникальность: от 40%
Доступность: сразу
1500 ₽
Готовая работа

Динамические структуры данных

Уникальность: от 40%
Доступность: сразу
600 ₽
Готовая работа

Разработка и интегрирование в технические компании информационных веб-ресурсов

Уникальность: от 40%
Доступность: сразу
2000 ₽
Готовая работа

Разработка системы "Умный дом" для использования в загородном доме

Уникальность: от 40%
Доступность: сразу
1000 ₽