Hodnocení:
Aktuálně nejsou k dispozici žádné recenze čtenářů. Hodnocení je založeno na 8 hlasů.
Learning Apache Drill: Query and Analyze Distributed Data Sources with SQL
Získejte rychlost s Apache Drill, rozšiřitelným distribuovaným dotazovacím enginem SQL, který čte rozsáhlé datové sady v mnoha populárních formátech souborů, jako jsou Parquet, JSON a CSV. Drill čte data v systému HDFS nebo v cloudovém úložišti, jako je S3, a spolupracuje s metaúložištěm Hive spolu s distribuovanými databázemi, jako jsou HBase, MongoDB a relační databáze. Drill funguje všude: na vašem notebooku nebo v největším clusteru.
V této praktické knize autoři projektu Drill Charles Givre a Paul Rogers ukazují analytikům a datovým vědcům, jak se pomocí tohoto výkonného nástroje dotazovat a analyzovat nezpracovaná data. Datoví vědci dnes tráví přibližně 80 % svého času pouze shromažďováním a čištěním dat. Díky této knize se dozvíte, jak vám Drill pomůže analyzovat data efektivněji a zkrátit tak dobu potřebnou k získání poznatků.
⬤ Pomocí nástroje Drill vyčistíte, připravíte a shrnete ohraničená data pro další analýzu.
⬤ Vyhledávat typy souborů včetně souborů protokolů, parquet, JSON a dalších složitých formátů.
⬤ Vyhledávání v Hadoopu, relačních databázích, MongoDB a Kafce pomocí standardního jazyka SQL.
⬤ Programové připojení k Drillu pomocí různých jazyků.
⬤ Používejte Drill i s náročnými nebo nejednoznačnými formáty souborů.
⬤ Provádějte sofistikované analýzy rozšířením funkcí Drillu o uživatelsky definované funkce.
⬤ Usnadněte analýzu dat pro zabezpečení sítě, metadata obrázků a strojové učení.
© Book1 Group - všechna práva vyhrazena.
Obsah těchto stránek nesmí být kopírován ani použit, a to ani částečně ani úplně, bez písemného svolení vlastníka.
Poslední úprava: 2024.11.08 20:25 (GMT)