Создать парсер сайтов
Необходимо создать парсер сайтов (скорее всего на python), который позволит парсить информацию с сайтов.
Что должно парситься:
0) URL страницы товара
1) Хлебные крошки, чтобы понимать к какому разделу относится товар
2) Название товара (h1)
3) Базовая цена товара
4) Цены торговых предложений на товар (множественное значение)
3) Размеры товара
4) Количество в упаковке (Если есть)
5) Материал
6) Марка (тип) картона
6) Цвет
7) Плотность (если есть)
8) Код по каталогу FEFCO (если есть)
Цены и данные при парсинге не должны захватывать лишнюю информацию и не должны иметь пробелы спереди и сзади значений.
Пример верстки когда может захватываться лишнее:
4500
Р
Из данного блока нам надо выцепить только стоимость 4500, но в данном примере может дополнительно подтягиваться с символом рубля, он не нужен.
Ссылка на пример карточки и характеристик которые необходимы для парсинга - https://www.antech.ru/catalog/cartonnye-korobki/215_d_kh_160_sh_kh_160_v_kartonnaya_korobka_upakovochnaya_gofrokarton_buryy_trekhsloynyy_t_24_b/
Во вложении файл для примера в каком виде должна собираться информация
Цена на разработку парсера обговаривается.
Что должно парситься:
0) URL страницы товара
1) Хлебные крошки, чтобы понимать к какому разделу относится товар
2) Название товара (h1)
3) Базовая цена товара
4) Цены торговых предложений на товар (множественное значение)
3) Размеры товара
4) Количество в упаковке (Если есть)
5) Материал
6) Марка (тип) картона
6) Цвет
7) Плотность (если есть)
8) Код по каталогу FEFCO (если есть)
Цены и данные при парсинге не должны захватывать лишнюю информацию и не должны иметь пробелы спереди и сзади значений.
Пример верстки когда может захватываться лишнее:
4500
Р
Из данного блока нам надо выцепить только стоимость 4500, но в данном примере может дополнительно подтягиваться с символом рубля, он не нужен.
Ссылка на пример карточки и характеристик которые необходимы для парсинга - https://www.antech.ru/catalog/cartonnye-korobki/215_d_kh_160_sh_kh_160_v_kartonnaya_korobka_upakovochnaya_gofrokarton_buryy_trekhsloynyy_t_24_b/
Во вложении файл для примера в каком виде должна собираться информация
Цена на разработку парсера обговаривается.
Предложения фрилансеров (0)
Предложений нет
Оставлять свои предложения по проекту могут только зарегистрированные пользователи с аккаунтом специалиста.
Зарегистрируйтесь или войдите на сайт под своим именем.
Зарегистрируйтесь или войдите на сайт под своим именем.