Pcasowanie za pomocą Pythona. Web scraping w akcji Jeśli programowanie to magia, to web scraping to prawdziwa czarodziejska sztuka. Napisanie prostej automatyzowanej aplikacji pozwala na wysyłanie zapytań do serwerów internetowych, otrzymywanie odpowiedzi z danymi, a następnie analizowanie tych danych i wydobywanie potrzebnych informacji. To zaktualizowane trzecie wydanie książki nie tylko zapozna cię z web scrapingiem, ale także stanie się wyczerpującym przewodnikiem po zbieraniu praktycznie wszelkiego rodzaju danych w nowoczesnym Internecie. W części I główny nacisk kładzie się na mechanikę web scrapingu: jak za pomocą Pythona wysyłać zapytania do serwerów, przetwarzać odpowiedzi i automatyzować interakcje z witrynami. W części II badane są bardziej konkretne narzędzia i aplikacje, które będą przydatne w każdym scenariuszu web scrapingu.
Książka pokaże, jak:
• analizować skomplikowane strony HTML;
• projektować web skanery za pomocą frameworka Scrapy;
• przechowywać dane uzyskane dzięki scrapingowi;
• czytać i wydobywać dane z dokumentów;
• oczyszczać i normalizować źle sformatowane dane;
• czytać i zapisywać informacje w naturalnych językach;
• wyszukiwać w formularzach i na stronach logowania;
• wykonywać scraping kodu JavaScript i pracować z API;
• pisać i używać programy do konwersji obrazów na tekst;
• omijać pułapki przeciwdziałające scrapingowi i blokady botów;
• testować swoje strony internetowe za pomocą scrapingu.