Pcasowanie za pomocą Pythona. Web scraping w akcji Jeśli programowanie to magia, to web scraping to prawdziwa czarodziejska sztuka. Napisanie prostej automatyzowanej aplikacji pozwala na wysyłanie zapytań do serwerów internetowych, otrzymywanie odpowiedzi z danymi, a następnie analizowanie tych danych i... wydobywanie potrzebnych informacji. To zaktualizowane trzecie wydanie książki nie tylko zapozna cię z web scrapingiem, ale także stanie się wyczerpującym przewodnikiem po zbieraniu praktycznie wszelkiego rodzaju danych w nowoczesnym Internecie. W części I główny nacisk kładzie się na mechanikę web scrapingu: jak za pomocą Pythona wysyłać zapytania do serwerów, przetwarzać odpowiedzi i automatyzować interakcje z witrynami. W części II badane są bardziej konkretne narzędzia i aplikacje, które będą przydatne w każdym scenariuszu web scrapingu. Książka pokaże, jak: • analizować skomplikowane strony HTML; • projektować web skanery za pomocą frameworka Scrapy; • przechowywać dane uzyskane dzięki scrapingowi; • czytać i wydobywać dane z dokumentów; • oczyszczać i normalizować źle sformatowane dane; • czytać i zapisywać informacje w naturalnych językach; • wyszukiwać w formularzach i na stronach logowania; • wykonywać scraping kodu JavaScript i pracować z API; • pisać i używać programy do konwersji obrazów na tekst; • omijać pułapki przeciwdziałające scrapingowi i blokady botów; • testować swoje strony internetowe za pomocą scrapingu.
Autor: Райан Митчелл
Wydawnictwo: piter
Seria: Bestsellery O'Reilly
Ograniczenia wiekowe: 16+
Rok wydania: 2025
ISBN: 9786010845701
Liczba stron: 352
Rozmiar: 233х165х19 mm
Typ osłony: Soft
Waga: 550 g
ID: 1704633