logo

Čo je to Redshift?

  • Redshift je rýchla a výkonná, plne spravovaná služba dátového skladu v rozsahu petabajtov v cloude.
  • Zákazníci môžu používať Redshift len ​​za 0,25 USD za hodinu bez záväzkov alebo vopred a škálovať na petabajt alebo viac za 1 000 USD za terabajt ročne.

OLAP

OLAP je Online systém spracovania analýzy používa Červený posun .

Príklad transakcie OLAP:

Predpokladajme, že chceme vypočítať čistý zisk pre EMEA a Tichomorie pre produkt digitálneho rádia. To si vyžaduje vytiahnuť veľké množstvo záznamov. Nasledujú záznamy potrebné na výpočet čistého zisku:

  • Súčet rádií predaných v EMEA.
  • Súčet rádií predaných v Tichomorí.
  • Jednotkové náklady na rádio v každom regióne.
  • Predajná cena každého rádia
  • Predajná cena – jednotkové náklady

Na získanie vyššie uvedených záznamov sú potrebné zložité dotazy. Databázy Data Warehousing využívajú architektúru rôznych typov tak z hľadiska databázy, ako aj z hľadiska infraštruktúry.

Konfigurácia červeného posunu

Červený posun

Červený posun pozostáva z dvoch typov uzlov:

    Jediný uzol Viacuzlový

Jeden uzol: Jeden uzol ukladá až 160 GB.

Viac uzlov: Viacuzlový je uzol, ktorý pozostáva z viac ako jedného uzla. Je dvoch typov:

    Vedúci uzol
    Spravuje pripojenia klientov a prijíma dotazy. Vedúci uzol prijíma dotazy z klientskych aplikácií, analyzuje dotazy a vyvíja plány vykonávania. Koordinuje sa s paralelným vykonávaním týchto plánov s výpočtovým uzlom a kombinuje medzivýsledky všetkých uzlov a potom vracia konečný výsledok klientskej aplikácii.Výpočtový uzol
    Výpočtový uzol vykoná plány vykonávania a potom sa priebežné výsledky odošlú vedúcemu uzlu na agregáciu pred odoslaním späť do klientskej aplikácie. Môže mať až 128 výpočtových uzlov.

Poďme pochopiť koncept vodiaceho uzla a výpočtových uzlov prostredníctvom príkladu.

Červený posun

Sklad Redshift je kolekcia výpočtových zdrojov známych ako uzly a tieto uzly sú organizované v skupine známej ako klaster. Každý klaster beží v Redshift Engine, ktorý obsahuje jednu alebo viac databáz.

Keď spustíte inštanciu Redshift, začne s jedným uzlom s veľkosťou 160 GB. Keď chcete rásť, môžete pridať ďalšie uzly a využiť výhody paralelného spracovania. Máte vedúci uzol, ktorý spravuje viaceré uzly. Uzol Leader sa stará o pripojenie klienta, ako aj o výpočtové uzly. Uloží dáta do výpočtových uzlov a vykoná dotaz.

Prečo je Redshift 10-krát rýchlejší

Červený posun je 10-krát rýchlejší z nasledujúcich dôvodov:

    Stĺpcové ukladanie údajov
    Namiesto ukladania údajov ako série riadkov, Amazon Redshift organizuje údaje podľa stĺpcov. Systémy založené na riadkoch sú ideálne na spracovanie transakcií, zatiaľ čo systémy založené na stĺpcoch sú ideálne na ukladanie údajov a analýzu, kde dotazy často zahŕňajú súhrny vykonávané cez veľké súbory údajov. Keďže sa spracúvajú iba stĺpce zahrnuté v dotazoch a stĺpcové údaje sa ukladajú na pamäťové médium postupne, systémy založené na stĺpcoch vyžadujú menej I/O, čím sa zlepšuje výkon dotazov.Pokročilá kompresia
    Stĺpcové dátové úložiská môžu byť komprimované oveľa viac ako riadkové dátové úložiská, pretože podobné dáta sa ukladajú postupne na disk. Amazon Redshift využíva viacero techník kompresie a často dokáže dosiahnuť významnú kompresiu v porovnaní s tradičnými relačnými dátovými skladmi.
    Amazon Redshift nevyžaduje indexy ani materializované zobrazenia, takže vyžaduje menej miesta ako tradičné relačné databázové systémy. Pri načítavaní údajov do prázdnej tabuľky Amazon Redshift automaticky vzorkuje vaše údaje a vyberie najvhodnejšiu techniku ​​kompresie.Masívne paralelné spracovanie
    Amazon Redshift automaticky distribuuje údaje a načítava dotaz cez rôzne uzly. Amazon Redshift uľahčuje pridávanie nových uzlov do vášho dátového skladu, čo nám umožňuje dosahovať rýchlejší výkon dopytov, keď sa váš dátový sklad rozrastá.

Funkcie červeného posunu

Vlastnosti Redshift sú uvedené nižšie:

reťazec podreťazec
Červený posun
    Jednoduché nastavenie, nasadenie a správa
      Automatizované poskytovanie
      Redshift sa jednoducho nastavuje a ovláda. Nový dátový sklad môžete nasadiť len niekoľkými kliknutiami v konzole AWS a Redshift automaticky zabezpečí infraštruktúru za vás. V AWS sú všetky administratívne úlohy automatizované, ako napríklad zálohovanie a replikácia, musíte sa sústrediť na svoje dáta, nie na správu.Automatické zálohy
      Redshift automaticky zálohuje vaše dáta do S3. Môžete tiež replikovať snímky v S3 v inej oblasti pre akúkoľvek obnovu po havárii.
    Nákladovo efektívne
      Žiadne poplatky vopred, plaťte priebežne
      Amazon Redshift je cenovo najefektívnejšia služba dátového skladu, pretože musíte platiť iba za to, čo používate.
      Jeho náklady začínajú na 0,25 USD za hodinu bez viazanosti a žiadnych nákladov vopred a môžu sa rozšíriť na 250 USD za terabajt za rok.
      Amazon Redshift je jediná služba dátového skladu, ktorá ponúka ceny na vyžiadanie bez počiatočných nákladov, a ponúka aj ceny za vyhradené inštancie, ktoré ušetria až 75 % poskytovaním 1-3 ročného obdobia.Vyberte typ uzla.
      Môžete si vybrať jeden z dvoch uzlov na optimalizáciu červeného posunu.
        Hustý výpočtový uzol
        Hustý výpočtový uzol dokáže vytvoriť vysokovýkonné dátové sklady pomocou rýchlych CPU, veľkého množstva pamäte RAM a SSD diskov.Hustý úložný uzol
        Ak chcete znížiť náklady, môžete použiť uzol Dense storage. Vytvára nákladovo efektívny dátový sklad pomocou väčšieho pevného disku.
    Rýchlo sa prispôsobte vašim potrebám.
      Dátové sklady v rozsahu petabajtov
      Amazon Redshift automaticky zväčšuje alebo znižuje uzly podľa potreby zmien. Len niekoľkými kliknutiami v konzole AWS alebo jedným volaním API môžete ľahko zmeniť počet uzlov v dátovom sklade.Analýza dátových jazier v exabajtovom rozsahu
      Je to funkcia Redshift, ktorá vám umožňuje spúšťať dotazy proti exabajtom údajov v Amazon S3. Amazon S3 je bezpečné a cenovo výhodné dáta na ukladanie neobmedzených dát v otvorenom formáte.Neobmedzená súbežnosť
      Je to funkcia Redshift, čo znamená, že viaceré dotazy môžu pristupovať k rovnakým údajom v Amazon S3. Umožňuje vám spúšťať dotazy naprieč viacerými uzlami bez ohľadu na zložitosť dotazu alebo množstvo údajov.
    Dopytujte svoje dátové jazero
    Amazon Redshift je jediný dátový sklad, ktorý sa používa na dopytovanie dátového jazera Amazon S3 bez načítania údajov. To poskytuje flexibilitu ukladaním často používaných údajov v Redshift a neštruktúrovaných alebo zriedkavo prístupných údajov v Amazon S3.Zabezpečiť
    Pomocou niekoľkých nastavení parametrov môžete nastaviť Redshift na používanie SSL na zabezpečenie vašich údajov. Môžete tiež povoliť šifrovanie, všetky údaje zapísané na disk budú šifrované.Rýchlejší výkon
    Amazon Redshift poskytuje stĺpcové ukladanie údajov, kompresiu a paralelné spracovanie na zníženie množstva I/O potrebných na vykonávanie dotazov. To zlepšuje výkon dotazov.