Рубрика
- Антикварные книги
- Аудиокниги
- Бизнес и экономика
- Детская литература
- Дом, семья, быт
- Журналы и газеты
- Календари
- Книги
- Компьютеры и интернет
- Культура и искусство
- Литература на иностранных языках
- Медицина
- Наука и образование
- Прочее (Книги)
- Словари, справочники и энциклопедии
- Техническая литература
- Художественная литература
- Эзотерика
- Юридическая литература
Если программирование напоминает волшебство, то веб-скрапинг — это очень сильное колдунство. Написав простую автоматизированную программу, можно отправлять запросы на веб-серверы, запрашивать с них данные, а затем анализировать их и извлекать необходимую информацию. Новое расширенное издание книги знакомит не только с веб-скрапингом, но и поможет собрать любого вида данные в современном Интернете. В части I основное внимание уделено механике веб-скрапинга: как с помощью Python запрашивать информацию с веб-сервера, производить базовую обработку серверного отклика и организовать автоматизированное взаимодействие с сайтами. В части II исследованы более специфичные инструменты и приложения, которые пригодятся при любом сценарии веб-скрапинга.- Разбирайте сложные HTML-страницы.- Разрабатывайте поисковые роботы с помощью фреймворка Scrapy.- Изучайте методы хранения данных, полученных с помощью скрапинга.- Считывайте и извлекайте данные из документов.- Очищайте и нормализуйте плохо отформатированные данные.- Читайте и пишите информацию на естественных языках.- Освойте поиск по формам и логинам.- Изучите скрапинг JavaScript и работу с API.- Используйте и пишите программы для преобразования изображений в текст.- Учитесь обходить скрапинговые ловушки и блокаторы ботов.- Протестируйте собственный сайт с помощью скрапинга.
ISBN | 978-5-4461-1693-5 |
---|---|
Производитель |
Похожие товары
-
Linux. Командная строка. Лучшие практики
1,000₽Купить товарПерейдите на новый уровень работы в Linux! Если вы системный администратор, разработчик программного обеспечения, SRE-инженер или пользователь Linux, книга поможет вам работать быстрее, элегантнее и эффективнее. Вы научитесь создавать и запускать сложные команды, которые решают реальные бизнес-задачи, обрабатывать и извлекать информацию, а также автоматизировать ручную работу.Узнайте, что происходит внутри командной оболочки Linux. Вне зависимости от …
-
ASP.NET 2.0 Теория и практика (мягк). Гробов И. (Икс)
280₽Купить товарКнига посвящена последней версии ASP.NET 2.0, которая предлагает перспективную серверную технологию для создания динамических Web-сайтов. Книга охватывает материал предыдущих версий, и поэтому для чтения книги знание предварительных версий ASP.NET 1.x не требуется. В книге содержится множество примеров, которые исключительно лаконичны, тщательно подобраны, сопровождаются подробными комментариями и, несомненно, помогут лучше изучить предлагаемый материал. Книга рассчитана на …
ASP.NET 2.0 Теория и практика (мягк). Гробов И. (Икс)Читайте далее
-
Модернизация Java Enterprise: облачные технологии для разработчиков
1,490₽Купить товарВ разговорах о технологиях постоянно упоминаются контейнеры, микросервисы и распределенные системы, однако большинство приложений по-прежнему работают на базе монолитных архитектур, основанных на традиционных процессах разработки. Давайте поближе познакомимся с хорошо зарекомендовавшими себя моделями на основе Java и разберемся, как перенести эти монолитные приложения в будущее.Опираясь на многолетний опыт модернизации приложений, Маркус Эйзеле и Натале Винто …
Модернизация Java Enterprise: облачные технологии для разработчиковЧитайте далее
-
React. Быстрый старт, 2-е изд.
1,399₽Купить товарНезаменимая книга по React — технологии с открытым исходным кодом для быстрого создания многофункциональных веб-приложений. Второе издание, обновленное с учетом последней версии React, показывает, как создавать компоненты React и организовывать их в удобные для сопровождения крупномасштабные приложения. Если вы знаете синтаксис JavaScript, то сразу можете приступать к работе.По ходу чтения разработчики и программисты создадут полноценное …
Максим Смирнов
Я, Максим Смирнов, в свободное время пишу статья для сайта bookpatriot.ru. Все данные для своих статей беру из открытых источников. Стараюсь писать только на самые актуальные темы с максимально свежими данными. Я профессиональный блогер.
Отзывы
Отзывов пока нет.