Если программирование напоминает волшебство, то веб-скрапинг — это очень сильное колдунство. Написав простую автоматизированную программу, можно отправлять запросы на веб-серверы, запрашивать с них данные, а затем анализировать их и извлекать необходимую информацию. Новое расширенное издание книги знакомит не только с веб-скрапингом, но и поможет собрать любого вида данные в современном Интернете.В части I основное внимание уделено механике веб-скрапинга: как с помощью Python запрашивать информацию с веб-сервера, производить базовую обработку серверного отклика и организовать автоматизированное взаимодействие с сайтами. В части II исследованы более специфичные инструменты и приложения, которые пригодятся при любом сценарии веб-скрапинга.- Разбирайте сложные HTML-страницы.- Разрабатывайте поисковые роботы с помощью фреймворка Scrapy.- Изучайте методы хранения данных, полученных с помощью скрапинга.- Считывайте и извлекайте данные из документов.- Очищайте и нормализуйте плохо отформатированные данные.- Читайте и пишите информацию на естественных языках.- Освойте поиск по формам и логинам.- Изучите скрапинг JavaScript и работу с API.- Используйте и пишите программы для преобразования изображений в текст.- Учитесь обходить скрапинговые ловушки и блокаторы ботов.- Протестируйте собственный сайт с помощью скрапинга.
Современный скрапинг веб-сайтов с помощью Python. 2-е межд. издание
Искусство и искусствоведениеАвтоматизация сбора данных с интернет-сайтов при помощи языка Python
$0.00
Нет в наличии
Вес | 18 унция |
---|---|
Габариты | 8.5 × 5.7 × 1.0 дюйм |
Формат | 70×100/16 |
Издательство | |
Серия | |
Переплет | Мягкий переплет |
Автор | |
Стандарт | 6 |
Дата получения | 11.06.2021 |
Год выпуска | |
Количество страниц | 336 |
SKU | 9655190 |
Формат, мм | 165x233x16 |
Тираж | 650 |