Главная
Парсеры для внутреннего пользования в NovikovTV
Цель проекта
Разработка парсера для извлечения данных из следующих источников:
2GIS
Cоциальные сети
Парсер по ключевым запросам: поиск по сайтам по адресной строке
Задачи проекта:
Извлечение данных из источника данных в соответствии с требованиями.
Сохранение извлечённых данных в формате, удобном для дальнейшей обработки.
Обеспечение безопасности и конфиденциальности при работе с данными.
Требования к парсеру:
Требования к данным: В финальном файле после выгрузки должны быть следующие поля: URL сайта, название компании, email, телефон, ссылки на мессенджеры, адрес/местоположение, сфера деятельности, ФИО
Требования к формату данных: CSV, XLSX.
Безопасность: обеспечение безопасности при работе с данными (например, шифрование).
Тестирование:
Устранение ошибок и недочётов.
Документация:
Составление документации к парсерам.