Skip to content
  • Home
  • Přehled
  • O mně
  • Zásady cookies
DWHGuRuX

Datový sklad (DWH), BI (Business Inteligence) a SQL

  • Home
  • Přehled
  • O mně
  • Home
  • Přehled
  • O mně

Kategorie

  • DWH
  • DWH

    Optimalizace – 13. díl

    30. 1. 2024

    Optimalizace je velmi důležité téma a optimalizace v datovém skladu může být občas trochu odlišná od optimalizace v OLTP systémech. Důležité je zmínit exekuční plán, statistiky, způsoby joinování, materializaci, indexy a partitioning. Toto je jedna z náročnějších kapitol na čtení a je poměrně obsáhlá – hodí se mít vhled do teorie grafů. Exekuční plán Když vytvořím databázový dotaz. Existuje k němu několik exekučních plánů. Databáze je vytvoří na pozadí a vybere z nich ten, o kterém si myslí, že je nejlepší (A né vždy si to myslí správně a je jí potřeba popostrčením navést ke správnému řešení). Každý plán má určitou cenu, kterou databáze vypočte na základě statistik, které si…

    Číst více
    SQLGuRuX Žádné komentáře

    Related Posts

    Star schéma v datovém skladu (DWH)

    Dimenze v datovém skladu (DWH) – 6. díl

    2. 11. 2023
    Struktura datového skladu. Vstupní systémy, vrstvy DWH a vizualizace.

    Co je to datový sklad (DWH)? – 1. díl

    28. 9. 2023
    Star schéma v datovém skladu (DWH)

    3 vrstvy datového skladu (DWH) – 3. díl

    12. 10. 2023
  • DWH

    Tipy & Triky – 12. díl

    14. 12. 2023

    Tentokrát projdu moje tipy a triky, které by se mohly někomu hodit. Jde o spíš o maličkosti, které ulehčují práci. Rychlá záloha tabulky Prvním tipem je rychlá záloha tabulky. /* Zazálohování tabulky do schématu bck*/ SELECT * INTO bck.BACKUP_DIM_CALENDAR_20231124 FROM l2.DIM_CALENDAR;   SELECT * FROM bck.BACKUP_DIM_CALENDAR_20231124/* Zazálohování tabulky do schématu bck*/ SELECT * INTO bck.BACKUP_DIM_CALENDAR_20231124 FROM l2.DIM_CALENDAR; SELECT * FROM bck.BACKUP_DIM_CALENDAR_20231124 Kontrola že jsem nic nepokazil Když dělám, nějakou změnu a ovlivní jen určitou část tabulky. Kontroluji si, že jsem nezměnil počet řádků a sedí na sebe hodnoty. Ukážu to na tabulce vytvořené v minulém kroku. /* Kontrola na počet záznamů */ SELECT COUNT(1) AS CNT FROM l2.DIM_CALENDAR;   SELECT…

    Číst více
    SQLGuRuX Žádné komentáře

    Related Posts

    Star schéma v datovém skladu (DWH)

    3 vrstvy datového skladu (DWH) – 3. díl

    12. 10. 2023
    Množinové příklady nejpoužívanějších joinů v SQL

    SELECT – 4. díl

    19. 10. 2023
    Struktura datového skladu. Vstupní systémy, vrstvy DWH a vizualizace.

    Co je to datový sklad (DWH)? – 1. díl

    28. 9. 2023
  • DWH

    Surrogate keys v DWH – 11. díl

    7. 12. 2023

    V tomto článku se zabývám konceptem surrogate keys v datovém skladu. Definici, výhody oproti přirozeným klíčům a metody generování. Surrogate key je unikátní identifikátor záznamu (id). Je uměle generovaný a nemá žádný vztah k obsahu. Oproti tomu přirozený (složený) klíč má vazbu na existující data. Na generovávání surrogate key existují různé techniky jako auto inkrement, sekvence, UUID, hash, a pod. Generování surrogate key Auto-Increment,Identity Většina databází umožňuje generování pomocí auto-incrementu nebo identity automaticky. Na pozadí bude většinou použita sekvence. V Postgres lze použít GENERATED AS IDENTITY. CREATE TABLE SURROGATE_KEY_AUTO ( ID INT GENERATED ALWAYS AS IDENTITY, VAL VARCHAR(10) );CREATE TABLE SURROGATE_KEY_AUTO ( ID int GENERATED ALWAYS AS IDENTITY, VAL varchar(10)…

    Číst více
    SQLGuRuX Žádné komentáře

    Related Posts

    Množinové příklady nejpoužívanějších joinů v SQL

    SELECT – 4. díl

    19. 10. 2023
    Star schéma v datovém skladu (DWH)

    3 vrstvy datového skladu (DWH) – 3. díl

    12. 10. 2023
    Struktura datového skladu. Vstupní systémy, vrstvy DWH a vizualizace.

    Co je to datový sklad (DWH)? – 1. díl

    28. 9. 2023
  • DWH

    Pokročilé agregační funkce – 10. díl

    30. 11. 2023

    V nadcházejícím článku se zaměřím na windowed funkce. Ty provádějí pokročilé agregace nad specifickým "oknem" řádků, což rozšiřuje možnosti analýz. Věnuji si funkcím ROW_NUMBER, RANK, LEAD, LAG, FIRST_VALUE a dalším. Ukážu konkrétní příklady využití.

    Číst více
    SQLGuRuX Žádné komentáře

    Related Posts

    Star schéma v datovém skladu (DWH)

    Dimenze v datovém skladu (DWH) – 6. díl

    2. 11. 2023
    Struktura datového skladu. Vstupní systémy, vrstvy DWH a vizualizace.

    Co je to datový sklad (DWH)? – 1. díl

    28. 9. 2023
    Star schéma v datovém skladu (DWH)

    Fakta v datovém skladu (DWH) – 7. díl

    9. 11. 2023
  • DWH

    Orchestrace (noční load) – 9. díl

    23. 11. 2023

    Orchestrace – co to je, jak vypadá, paralelizace jobů, příklady. Nástroje umožňující orchestraci (Jenkins, Data Factory, …). Orchestrace Orchestrace je uspořádání načítání jednotlivých tabulek do DWH a uvnitř DWH, případně i z DWH ven. Tato operace se většinou děje v noci nebo brzo ráno, protože je časově náročná. Typicky jsou loady jednotlivých tabulek shlukovány do jobů dle návaznosti nápočtu. Jednotlivé joby jsou pak spouštěny orchestračním nástrojem jako je například Jenkins. Na předchozím obrázku jsem znázornil větší detail datového skladu ve vrstvách. Orchestrace takového datového skladu by mohla vypadat následujícím způsobem. Jednotlivé joby loadující data z externích aplikací jako CRM, ERP jsou spouštěny zároveň (nijak se neovlivňují lze paralelizovat). Po jejich…

    Číst více
    SQLGuRuX Žádné komentáře

    Related Posts

    Star schéma v datovém skladu (DWH)

    Dimenze v datovém skladu (DWH) – 6. díl

    2. 11. 2023
    Struktura datového skladu. Vstupní systémy, vrstvy DWH a vizualizace.

    Co je to datový sklad (DWH)? – 1. díl

    28. 9. 2023
    Star schéma v datovém skladu (DWH)

    Fakta v datovém skladu (DWH) – 7. díl

    9. 11. 2023
  • DWH

    Pojmenovávání a dokumentace – 8. díl

    16. 11. 2023

    Půjde o pojmenovávání a dokumentaci. Je extrémně důležité vést k celému projektu dokumentaci, správně pojmenovávat a dobře komunikovat. Ne vždy se tato aktivita setkává s pochopením, ale je nesmírně důležitá. Lidé si na to časem zvyknou a ve finále je daleko lepší provoz, někdy dokonce i levnější. Jak už komentovat kód, tak stejným stylem pojmenovávat objekty, používat jednotný code style. Uvedu tu několik dobrých principů, kterých se držet, aby Vám práce šla lépe.

    Číst více
    SQLGuRuX Žádné komentáře

    Related Posts

    Star schéma v datovém skladu (DWH)

    Fakta v datovém skladu (DWH) – 7. díl

    9. 11. 2023
    Struktura datového skladu. Vstupní systémy, vrstvy DWH a vizualizace.

    Co je to datový sklad (DWH)? – 1. díl

    28. 9. 2023
    Star schéma v datovém skladu (DWH)

    3 vrstvy datového skladu (DWH) – 3. díl

    12. 10. 2023
  • Star schéma v datovém skladu (DWH)
    DWH

    Fakta v datovém skladu (DWH) – 7. díl

    9. 11. 2023

    V tomto článku se věnuji faktovým tabulkám. Ukážu příklad na fakturách, dále se věnuji propojení faktových tabulek s dimenzemi, zmíním se o periodě loadu. K článku přikládám v odkazech i link na příklady v SQL, které si můžete při čtení zkoušet.

    Číst více
    SQLGuRuX Žádné komentáře

    Related Posts

    Množinové příklady nejpoužívanějších joinů v SQL

    SELECT – 4. díl

    19. 10. 2023
    Star schéma v datovém skladu (DWH)

    Dimenze v datovém skladu (DWH) – 6. díl

    2. 11. 2023
    Struktura datového skladu. Vstupní systémy, vrstvy DWH a vizualizace.

    Co je to datový sklad (DWH)? – 1. díl

    28. 9. 2023
  • Star schéma v datovém skladu (DWH)
    DWH

    Dimenze v datovém skladu (DWH) – 6. díl

    2. 11. 2023

    V tomto článku se podívám podrobněji na dimenze, jejich typy - STAR/SNOWFLAKE/CONSTELLATION, jejich plnění, úrovně historizace a typické dimenze v datovém skladu.

    Číst více
    SQLGuRuX Žádné komentáře

    Related Posts

    Star schéma v datovém skladu (DWH)

    Fakta v datovém skladu (DWH) – 7. díl

    9. 11. 2023
    Množinové příklady nejpoužívanějších joinů v SQL

    SELECT – 4. díl

    19. 10. 2023
    Struktura datového skladu. Vstupní systémy, vrstvy DWH a vizualizace.

    Co je to datový sklad (DWH)? – 1. díl

    28. 9. 2023
  • DWH

    SQL funkce a DML – 5. díl

    26. 10. 2023

    Rychle prolétnu zajímavé funkce, příkazy z SQL a zbylé DML operace INSERT, UPDATE, DELETE a MERGE. Pokud se na to cítíte můžete určitě článek přeskočit. V příštím už se konečně dostaneme k věcem bližším DWH.

    Číst více
    SQLGuRuX Žádné komentáře

    Related Posts

    Množinové příklady nejpoužívanějších joinů v SQL

    SELECT – 4. díl

    19. 10. 2023
    Star schéma v datovém skladu (DWH)

    Dimenze v datovém skladu (DWH) – 6. díl

    2. 11. 2023
    Star schéma v datovém skladu (DWH)

    Fakta v datovém skladu (DWH) – 7. díl

    9. 11. 2023
  • Množinové příklady nejpoužívanějších joinů v SQL
    DWH

    SELECT – 4. díl

    19. 10. 2023

    Tentokrát se věnuji klauzuli SELECT, a jejím příkazům, podrobněji se podívám na JOINy a jejich typy. Jelikož SELECT a JOINy jsou pro DWH stěžějní je potřeba se u nich pozastavit.

    Číst více
    SQLGuRuX Žádné komentáře

    Related Posts

    Struktura datového skladu. Vstupní systémy, vrstvy DWH a vizualizace.

    Co je to datový sklad (DWH)? – 1. díl

    28. 9. 2023
    Star schéma v datovém skladu (DWH)

    Fakta v datovém skladu (DWH) – 7. díl

    9. 11. 2023
    Star schéma v datovém skladu (DWH)

    Dimenze v datovém skladu (DWH) – 6. díl

    2. 11. 2023
 Starší příspěvky

Nedávno

  • Optimalizace – 13. díl
  • Tipy & Triky – 12. díl
  • Surrogate keys v DWH – 11. díl
  • Pokročilé agregační funkce – 10. díl
  • Orchestrace (noční load) – 9. díl

Komentáře

Žádné komentáře.
Savona od Optima Themes
Manage Cookie Consent
To provide the best experiences, we use technologies like cookies to store and/or access device information. Consenting to these technologies will allow us to process data such as browsing behavior or unique IDs on this site. Not consenting or withdrawing consent, may adversely affect certain features and functions.
Functional Vždy aktivní
The technical storage or access is strictly necessary for the legitimate purpose of enabling the use of a specific service explicitly requested by the subscriber or user, or for the sole purpose of carrying out the transmission of a communication over an electronic communications network.
Předvolby
Technické uložení nebo přístup je nezbytný pro legitimní účel ukládání preferencí, které nejsou požadovány odběratelem nebo uživatelem.
Statistics
Technické uložení nebo přístup, který se používá výhradně pro statistické účely. The technical storage or access that is used exclusively for anonymous statistical purposes. Without a subpoena, voluntary compliance on the part of your Internet Service Provider, or additional records from a third party, information stored or retrieved for this purpose alone cannot usually be used to identify you.
Marketing
The technical storage or access is required to create user profiles to send advertising, or to track the user on a website or across several websites for similar marketing purposes.
Spravovat možnosti Spravovat služby Správa {vendor_count} prodejců Přečtěte si více o těchto účelech
View preferences
{title} {title} {title}