- Redshift je rýchla a výkonná, plne spravovaná služba dátového skladu v rozsahu petabajtov v cloude.
- Zákazníci môžu používať Redshift len za 0,25 USD za hodinu bez záväzkov alebo vopred a škálovať na petabajt alebo viac za 1 000 USD za terabajt ročne.
OLAP
OLAP je Online systém spracovania analýzy používa Červený posun .
Príklad transakcie OLAP:
Predpokladajme, že chceme vypočítať čistý zisk pre EMEA a Tichomorie pre produkt digitálneho rádia. To si vyžaduje vytiahnuť veľké množstvo záznamov. Nasledujú záznamy potrebné na výpočet čistého zisku:
- Súčet rádií predaných v EMEA.
- Súčet rádií predaných v Tichomorí.
- Jednotkové náklady na rádio v každom regióne.
- Predajná cena každého rádia
- Predajná cena – jednotkové náklady
Na získanie vyššie uvedených záznamov sú potrebné zložité dotazy. Databázy Data Warehousing využívajú architektúru rôznych typov tak z hľadiska databázy, ako aj z hľadiska infraštruktúry.
Konfigurácia červeného posunu
Červený posun pozostáva z dvoch typov uzlov:
Jeden uzol: Jeden uzol ukladá až 160 GB.
Viac uzlov: Viacuzlový je uzol, ktorý pozostáva z viac ako jedného uzla. Je dvoch typov:
Spravuje pripojenia klientov a prijíma dotazy. Vedúci uzol prijíma dotazy z klientskych aplikácií, analyzuje dotazy a vyvíja plány vykonávania. Koordinuje sa s paralelným vykonávaním týchto plánov s výpočtovým uzlom a kombinuje medzivýsledky všetkých uzlov a potom vracia konečný výsledok klientskej aplikácii.
Výpočtový uzol vykoná plány vykonávania a potom sa priebežné výsledky odošlú vedúcemu uzlu na agregáciu pred odoslaním späť do klientskej aplikácie. Môže mať až 128 výpočtových uzlov.
Poďme pochopiť koncept vodiaceho uzla a výpočtových uzlov prostredníctvom príkladu.
Sklad Redshift je kolekcia výpočtových zdrojov známych ako uzly a tieto uzly sú organizované v skupine známej ako klaster. Každý klaster beží v Redshift Engine, ktorý obsahuje jednu alebo viac databáz.
Keď spustíte inštanciu Redshift, začne s jedným uzlom s veľkosťou 160 GB. Keď chcete rásť, môžete pridať ďalšie uzly a využiť výhody paralelného spracovania. Máte vedúci uzol, ktorý spravuje viaceré uzly. Uzol Leader sa stará o pripojenie klienta, ako aj o výpočtové uzly. Uloží dáta do výpočtových uzlov a vykoná dotaz.
Prečo je Redshift 10-krát rýchlejší
Červený posun je 10-krát rýchlejší z nasledujúcich dôvodov:
Namiesto ukladania údajov ako série riadkov, Amazon Redshift organizuje údaje podľa stĺpcov. Systémy založené na riadkoch sú ideálne na spracovanie transakcií, zatiaľ čo systémy založené na stĺpcoch sú ideálne na ukladanie údajov a analýzu, kde dotazy často zahŕňajú súhrny vykonávané cez veľké súbory údajov. Keďže sa spracúvajú iba stĺpce zahrnuté v dotazoch a stĺpcové údaje sa ukladajú na pamäťové médium postupne, systémy založené na stĺpcoch vyžadujú menej I/O, čím sa zlepšuje výkon dotazov.
Stĺpcové dátové úložiská môžu byť komprimované oveľa viac ako riadkové dátové úložiská, pretože podobné dáta sa ukladajú postupne na disk. Amazon Redshift využíva viacero techník kompresie a často dokáže dosiahnuť významnú kompresiu v porovnaní s tradičnými relačnými dátovými skladmi.
Amazon Redshift nevyžaduje indexy ani materializované zobrazenia, takže vyžaduje menej miesta ako tradičné relačné databázové systémy. Pri načítavaní údajov do prázdnej tabuľky Amazon Redshift automaticky vzorkuje vaše údaje a vyberie najvhodnejšiu techniku kompresie.
Amazon Redshift automaticky distribuuje údaje a načítava dotaz cez rôzne uzly. Amazon Redshift uľahčuje pridávanie nových uzlov do vášho dátového skladu, čo nám umožňuje dosahovať rýchlejší výkon dopytov, keď sa váš dátový sklad rozrastá.
Funkcie červeného posunu
Vlastnosti Redshift sú uvedené nižšie:
reťazec podreťazec
Redshift sa jednoducho nastavuje a ovláda. Nový dátový sklad môžete nasadiť len niekoľkými kliknutiami v konzole AWS a Redshift automaticky zabezpečí infraštruktúru za vás. V AWS sú všetky administratívne úlohy automatizované, ako napríklad zálohovanie a replikácia, musíte sa sústrediť na svoje dáta, nie na správu.
Redshift automaticky zálohuje vaše dáta do S3. Môžete tiež replikovať snímky v S3 v inej oblasti pre akúkoľvek obnovu po havárii.
Amazon Redshift je cenovo najefektívnejšia služba dátového skladu, pretože musíte platiť iba za to, čo používate.
Jeho náklady začínajú na 0,25 USD za hodinu bez viazanosti a žiadnych nákladov vopred a môžu sa rozšíriť na 250 USD za terabajt za rok.
Amazon Redshift je jediná služba dátového skladu, ktorá ponúka ceny na vyžiadanie bez počiatočných nákladov, a ponúka aj ceny za vyhradené inštancie, ktoré ušetria až 75 % poskytovaním 1-3 ročného obdobia.
Môžete si vybrať jeden z dvoch uzlov na optimalizáciu červeného posunu.
Hustý výpočtový uzol dokáže vytvoriť vysokovýkonné dátové sklady pomocou rýchlych CPU, veľkého množstva pamäte RAM a SSD diskov.
Ak chcete znížiť náklady, môžete použiť uzol Dense storage. Vytvára nákladovo efektívny dátový sklad pomocou väčšieho pevného disku.
Amazon Redshift automaticky zväčšuje alebo znižuje uzly podľa potreby zmien. Len niekoľkými kliknutiami v konzole AWS alebo jedným volaním API môžete ľahko zmeniť počet uzlov v dátovom sklade.
Je to funkcia Redshift, ktorá vám umožňuje spúšťať dotazy proti exabajtom údajov v Amazon S3. Amazon S3 je bezpečné a cenovo výhodné dáta na ukladanie neobmedzených dát v otvorenom formáte.
Je to funkcia Redshift, čo znamená, že viaceré dotazy môžu pristupovať k rovnakým údajom v Amazon S3. Umožňuje vám spúšťať dotazy naprieč viacerými uzlami bez ohľadu na zložitosť dotazu alebo množstvo údajov.
Amazon Redshift je jediný dátový sklad, ktorý sa používa na dopytovanie dátového jazera Amazon S3 bez načítania údajov. To poskytuje flexibilitu ukladaním často používaných údajov v Redshift a neštruktúrovaných alebo zriedkavo prístupných údajov v Amazon S3.
Pomocou niekoľkých nastavení parametrov môžete nastaviť Redshift na používanie SSL na zabezpečenie vašich údajov. Môžete tiež povoliť šifrovanie, všetky údaje zapísané na disk budú šifrované.
Amazon Redshift poskytuje stĺpcové ukladanie údajov, kompresiu a paralelné spracovanie na zníženie množstva I/O potrebných na vykonávanie dotazov. To zlepšuje výkon dotazov.