Hodnocení:
Kniha o web scrapingu je převážně dobře hodnocena, zejména mezi těmi, kteří mají základní znalosti jazyka Python. Je chválena za to, že se snadno čte, je informativní a dobře strukturovaná. Upozorňuje se však, že kniha předpokládá předchozí technické znalosti, takže je náročná pro úplné začátečníky. Někteří uživatelé také vyjadřují zklamání z konkrétních detailů a příkladů uvedených v textu.
Klady:⬤ Snadno čtivá
⬤ informativní
⬤ dobře organizovaná struktura
⬤ vhodná pro ty, kteří mají základní znalosti jazyka Python
⬤ praktický návod na různorodé aplikace web scrapingu
⬤ poskytuje užitečné odkazy a drobné příklady kódu
⬤ mnoha čtenářům se zdála užitečná pro jejich projekty.
⬤ Není vhodná pro úplné začátečníky vzhledem k předpokladu předchozích znalostí jazyka Python a webových technologií
⬤ některé příklady kódu mohou být složité a nedostatečně vysvětlené
⬤ některá témata mohou být zastaralá nebo nadbytečná
⬤ smíšené hodnocení hloubky pokrytí různých témat.
(na základě 33 hodnocení čtenářů)
Web Scraping with Python: Collecting More Data from the Modern Web
Pokud je programování magií, pak je web scraping jistě formou kouzelnictví. Napsáním jednoduchého automatizovaného programu můžete zadat dotaz na webové servery, vyžádat si data a analyzovat je tak, abyste získali potřebné informace. Rozšířené vydání této praktické knihy vás nejen seznámí s web scrapingem, ale poslouží vám také jako komplexní průvodce scrapingem téměř všech typů dat z moderního webu.
Část I se zaměřuje na mechaniku web scrapingu: použití jazyka Python k vyžádání informací z webového serveru, provedení základního zpracování odpovědi serveru a automatizovanou interakci s weby. Část II zkoumá řadu konkrétnějších nástrojů a aplikací, které se hodí pro jakýkoli scénář scrapování webu, s nímž se pravděpodobně setkáte.
⬤ Rozbor složitých stránek HTML.
⬤ Vyvíjejte crawlery pomocí frameworku Scrapy.
⬤ Zjistěte, jak ukládat data, která jste nascrapovali.
⬤ Číst a získávat data z dokumentů.
⬤ Čištění a normalizace špatně formátovaných dat.
⬤ Číst a zapisovat přirozené jazyky.
⬤ Prohledávat formuláře a přihlašovací údaje.
⬤ Scrapovat JavaScript a procházet rozhraní API.
⬤ Používat a psát software pro převod obrázků na text.
⬤ Vyhýbat se scrapovacím pastem a blokátorům botů.
⬤ Používejte scrapery k testování svých webových stránek.
© Book1 Group - všechna práva vyhrazena.
Obsah těchto stránek nesmí být kopírován ani použit, a to ani částečně ani úplně, bez písemného svolení vlastníka.
Poslední úprava: 2024.11.08 20:25 (GMT)