Рубрика
- Антикварные книги
- Аудиокниги
- Бизнес и экономика
- Детская литература
- Дом, семья, быт
- Журналы и газеты
- Календари
- Книги
- Компьютеры и интернет
- Культура и искусство
- Литература на иностранных языках
- Медицина
- Наука и образование
- Прочее (Книги)
- Словари, справочники и энциклопедии
- Техническая литература
- Художественная литература
- Эзотерика
- Юридическая литература
Если программирование напоминает волшебство, то веб-скрапинг — это очень сильное колдунство. Написав простую автоматизированную программу, можно отправлять запросы на веб-серверы, запрашивать с них данные, а затем анализировать их и извлекать необходимую информацию. Новое расширенное издание книги знакомит не только с веб-скрапингом, но и поможет собрать любого вида данные в современном Интернете. В части I основное внимание уделено механике веб-скрапинга: как с помощью Python запрашивать информацию с веб-сервера, производить базовую обработку серверного отклика и организовать автоматизированное взаимодействие с сайтами. В части II исследованы более специфичные инструменты и приложения, которые пригодятся при любом сценарии веб-скрапинга.- Разбирайте сложные HTML-страницы.- Разрабатывайте поисковые роботы с помощью фреймворка Scrapy.- Изучайте методы хранения данных, полученных с помощью скрапинга.- Считывайте и извлекайте данные из документов.- Очищайте и нормализуйте плохо отформатированные данные.- Читайте и пишите информацию на естественных языках.- Освойте поиск по формам и логинам.- Изучите скрапинг JavaScript и работу с API.- Используйте и пишите программы для преобразования изображений в текст.- Учитесь обходить скрапинговые ловушки и блокаторы ботов.- Протестируйте собственный сайт с помощью скрапинга.
ISBN | 978-5-4461-1693-5 |
---|---|
Производитель |
Похожие товары
-
Веб-мастеринг на 100%
366₽Купить товарДанная книга предназначена для тех, кто хочет научиться веб-мастерингу и стать специалистом по созданию веб-сайтов на профессиональном уровне. В издании описываются самые популярные и востребованные веб-технологии — HTML5, CSS3, JavaScript, jQuery, Ajax, PHP, а также приемы работы с системой управления содержимым сайта CMS Drupal и секреты раскрутки сайта (SEO). С помощью этих средств вы сможете …
-
ASP.NET 2.0 Теория и практика (мягк). Гробов И. (Икс)
280₽Купить товарКнига посвящена последней версии ASP.NET 2.0, которая предлагает перспективную серверную технологию для создания динамических Web-сайтов. Книга охватывает материал предыдущих версий, и поэтому для чтения книги знание предварительных версий ASP.NET 1.x не требуется. В книге содержится множество примеров, которые исключительно лаконичны, тщательно подобраны, сопровождаются подробными комментариями и, несомненно, помогут лучше изучить предлагаемый материал. Книга рассчитана на …
ASP.NET 2.0 Теория и практика (мягк). Гробов И. (Икс)Читайте далее
-
Тайная жизнь программ. Как создать код, который понравится вашему компьютеру
2,350₽Купить товарЗнакомы ли вы с технологиями, лежащими в основе вашей собственной программы? Почему «правильный» код не хочет работать? Истина проста и банальна — нужно сразу создавать код, который будет работать хорошо и не будет прятать в себе трудноуловимые ошибки. Для этого Джонатан Стейнхарт исследует фундаментальные концепции, лежащие в основе работы компьютеров. Он рассматривает аппаратное обеспечение, поведение …
Тайная жизнь программ. Как создать код, который понравится вашему компьютеруЧитайте далее
Максим Смирнов
Я, Максим Смирнов, в свободное время пишу статья для сайта bookpatriot.ru. Все данные для своих статей беру из открытых источников. Стараюсь писать только на самые актуальные темы с максимально свежими данными. Я профессиональный блогер.
Отзывы
Отзывов пока нет.