Hodnocení:
Kniha 'Querying Databricks with Spark SQL' nabízí důkladné pokrytí základních i pokročilých konceptů Spark SQL. Je dobře strukturovaná, obsahuje obchodní scénáře pro představení dotazů SQL a poskytuje jasná vysvětlení. Někteří čtenáři však narazili na problémy s návody a organizací.
Klady:⬤ Komplexní pokrytí jazyka Spark SQL, vhodné pro začátečníky i pokročilé uživatele
⬤ přehledná struktura a vysvětlení
⬤ dobře navržená ukázková databáze
⬤ cenná část „Triky a pasti“
⬤ uspokojivé čtení pro odborníky na SQL, kteří hledají pokročilá témata.
⬤ Pokyny pro nastavení datové sady byly nejasné
⬤ zdroje na GitHubu byly špatně uspořádané
⬤ kvalita vazby knihy by se mohla zlepšit
⬤ chyběla témata, jako jsou příkazy SQL MERGE, UPDATE, DELETE
⬤ počáteční zádrhel s pokyny pro import datových souborů.
(na základě 2 hodnocení čtenářů)
Querying Databricks with Spark SQL
Praktický průvodce používáním jazyka Spark SQL k provádění složitých dotazů na data Databricks
Klíčové vlastnosti
● Naučte se SQL od základů, bez nutnosti předchozích znalostí programování nebo SQL.
● Postupně rozšiřujte své znalosti a dovednosti od základních dotazů na data až po komplexní analýzy.
● Získejte praktické zkušenosti s jazykem SQL, které pokrývají všechny úrovně znalostí od začátečníka po experta.
Popis
Databricks vyniká jako široce přijímaná platforma určená k vytváření datových jezer. V jejím rámci rozšiřuje podporu specializované verze strukturovaného dotazovacího jazyka (SQL) známého jako Spark SQL. Pokud máte zájem dozvědět se více o tom, jak používat Spark SQL k analýze dat v datovém jezeře, pak je tato kniha určena právě vám.
Kniha pokrývá vše od základních dotazů až po složité úlohy zpracování dat. Začíná úvodem do SQL a Sparku. Poté se zabývá základy jazyka SQL, včetně datových typů, operátorů a klauzulí. Několik dalších kapitol se zaměřuje na filtrování, agregaci a výpočty. Dále se zabývá daty a časy, formátováním výstupů a používáním logiky v dotazech. Zabývá se také spojováním tabulek, poddotazy, odvozenými tabulkami a běžnými tabulkovými výrazy. Dále se zabývá korelovanými poddotazy, spojováním a filtrováním datových sad, používáním jazyka SQL při výpočtech, segmentací a klasifikací dat, klouzavou analýzou a analýzou dat v čase. Knihu uzavírá kapitola o pokročilé prezentaci dat.
Na konci knihy budete schopni používat jazyk Spark SQL k provádění komplexních úloh analýzy dat na datových jezerech.
Co se naučíte
● Používat jazyk Spark SQL ke čtení dat z datového jezera.
● Naučit se filtrovat, agregovat a počítat data pomocí Spark SQL.
● Naučit se spojovat tabulky, používat poddotazy a vytvářet odvozené tabulky v jazyce Spark SQL.
● Analyzujte data v čase pomocí Spark SQL a sledujte trendy a identifikujte vzory v datech.
● Prezentovat data vizuálně atraktivním způsobem pomocí Spark SQL.
Pro koho je tato kniha určena
Tato kniha je určena všem, kteří se chtějí naučit používat jazyk SQL k analýze velkých dat. Ať už jste datový analytik, student, databázový vývojář, účetní, obchodní analytik, datový vědec nebo kdokoli jiný, kdo potřebuje získat poznatky z velkých datových souborů, tato kniha vás naučí dovednostem, které potřebujete k tomu, abyste tuto práci zvládli.
Obsah
1. Psaní základních dotazů SQL
2. Filtrování dat
3. Použití složitých filtrů na dotazy
4. Jednoduché výpočty
5. Agregace výstupů
6. Práce s daty v Databricks
7. Formátování textu ve výstupu dotazu
8. Formátování čísel a dat
9. Použití základní logiky k vylepšení analýzy
10. Použití více tabulek při dotazování na data
11. Používání pokročilého spojování tabulek
12. Dílčí dotazy
13. Odvozené tabulky
14. Běžné tabulkové výrazy
15. Související poddotazy
16. Manipulace s datovými sadami
17. Použití jazyka SQL pro pokročilejší výpočty
18. Segmentace a klasifikace dat
19. Klouzavá analýza
20. Analýza dat v čase
21. Komplexní výstup dat
© Book1 Group - všechna práva vyhrazena.
Obsah těchto stránek nesmí být kopírován ani použit, a to ani částečně ani úplně, bez písemného svolení vlastníka.
Poslední úprava: 2024.11.08 20:25 (GMT)