Parsings ar Python palīdzību. Web-skrāpēšana darbībā Ja programmēšana ir maģija, tad web-skrāpēšana ir īsta burvība. Uzrakstot vienkāršu automatizētu programmu, var sūtīt pieprasījumus web-serveriem, saņemt atbildes ar datiem un pēc tam analizēt šos datus un izvilkt nepieciešamo informāciju. Šis atjaunotais trešais... izdevums ne tikai iepazīstinās jūs ar web-skrāpēšanu, bet arī kalpos par izsmeļošu ceļvedi datu vākšanai praktiski jebkura veida informācijai mūsdienu internetā. I daļā galvenā uzmanība tiek pievērsta web-skrāpēšanas mehānikai: kā ar Python sūtīt pieprasījumus web-serveriem, apstrādāt atbildes un automatizēt mijiedarbību ar vietnēm. II daļā tiek pētīti konkrētāki rīki un lietojumprogrammas, kas noderēs jebkurā web-skrāpēšanas scenārijā. Grāmata parādīs, kā: • analizēt sarežģītas HTML lapas; • izstrādāt web skenerus, izmantojot Scrapy ietvaru; • glabāt datus, kas iegūti ar skrāpēšanu; • lasīt un izvilkt datus no dokumentiem; • attīrīt un normalizēt slikti formatētus datus; • lasīt un rakstīt informāciju dabiskajās valodās; • veikt meklēšanu formās un pieteikšanās lapās; • veikt skrāpēšanu JavaScript kodā un strādāt ar API; • rakstīt un izmantot programmas, lai pārvērstu attēlus tekstā; • apiet pret-skrāpēšanas slazdus un botu bloķētājus; • testēt savas vietnes, izmantojot skrāpēšanu.
Autors: Rajan Mitčell
Izdevniecība: piter
Sērija: O'Reilly bestsellers
Vecuma ierobežojumi: 16+
Izdošanas gads: 2025
ISBN: 9786010845701
Lappušu skaits: 352
Izmērs: 233h165h19 mm
Vāka tips: mīksts vāks
Svars: 550 g
ID: 1704633
21 augusts (C.)
bez maksas
20 augusts (T.)
€ 9.99
bez maksas no € 80.00
21 augusts (C.)
bez maksas
20 augusts (T.)
€ 9.99
bez maksas no € 80.00