Proces prevodu údajov z jednej formy do inej formy je známy ako kódovanie. Používa sa na transformáciu údajov tak, aby údaje mohli byť podporované a používané rôznymi systémami. Kódovanie funguje podobne ako pri prevode teploty zo stupňov Celzia na Fahrenheita, pretože sa len prevedie v inej forme, ale pôvodná hodnota zostáva vždy rovnaká. Kódovanie sa používa hlavne v dvoch oblastiach:
Poznámka: Kódovanie sa líši od šifrovania, pretože jeho hlavným účelom nie je skryť údaje, ale previesť ich do formátu, aby sa dali správne spotrebovať.
V tejto téme budeme diskutovať o rôznych typoch kódovacích techník, ktoré sa používajú vo výpočtovej technike.
Typ kódovacej techniky
Kódovanie znakov
Kódovanie znakov kóduje znaky do bajtov . Informuje počítače, ako interpretovať nulu a jednotky na skutočné znaky, čísla a symboly. Počítač rozumie iba binárnym údajom; preto je potrebné tieto znaky previesť na číselné kódy. Aby sa to dosiahlo, každý znak sa prevedie na binárny kód, a preto sa textové dokumenty uložia s typmi kódovania. Dá sa to urobiť párovaním čísel so znakmi. Ak nepoužijeme kódovanie znakov, naša webová stránka nezobrazí znaky a text v správnom formáte. Tým sa zníži čitateľnosť a stroj nebude schopný správne spracovať údaje. Okrem toho kódovanie znakov zabezpečuje, že každý znak má správnu reprezentáciu v počítačovom alebo binárnom formáte.
Existujú rôzne typy techník kódovania znakov, ktoré sú uvedené nižšie:
Kódovanie HTML
Kódovanie HTML sa používa na zobrazenie stránky HTML v správnom formáte. Pomocou kódovania sa webový prehliadač dozvie, ktorá znaková sada sa má použiť.
V HTML sa v značkách HTML používajú rôzne znaky, ako napríklad . Aby sme tieto znaky zakódovali ako obsah, musíme použiť kódovanie.
Kódovanie URL
URL (Uniform resource locator) Kódovanie sa používa na konvertovať znaky v takom formáte, aby ich bolo možné prenášať cez internet . Je tiež známy ako kódovanie percent. Kódovanie adresy URL sa vykonáva na odoslanie adresy URL na internet pomocou znakovej sady ASCII. Znaky iné ako ASCII sú nahradené percentom, za ktorým nasledujú hexadecimálne číslice.
Kódovanie UNICODE
Unicode je kódovací štandard pre univerzálnu znakovú sadu. Umožňuje kódovanie, reprezentáciu a spracovanie textu reprezentovaného vo väčšine jazykov alebo systémov písania, ktoré sú dostupné na celom svete. Poskytuje kódový bod alebo číslo pre každý znak v každom podporovanom jazyku. Môže reprezentovať približne všetky možné znaky vo všetkých jazykoch. Konkrétna sekvencia bitov je známa ako kódovacia jednotka.
Štandard UNICODE môže na reprezentáciu znakov používať 8, 16 alebo 32 bitov.
Štandard Unicode definuje formát Unicode Transformation Format (UTF) na kódovanie bodov kódu.
Štandard kódovania UNICODE má nasledujúce schémy UTF:
UTF8 je definovaný štandardom UNICODE, čo je kódovanie znakov s premenlivou šírkou používané v elektronickej komunikácii. UTF-8 je schopný zakódovať všetkých 1 112 064 platných znakov kódu v Unicode pomocou jednej až štyroch jednobajtových (8-bitových) kódových jednotiek.
Kódovanie UTF16 predstavuje body kódu znaku pomocou jedného z dvoch 16-bitových celých čísel.
Kódovanie UTF32 predstavuje každý bod kódu ako 32-bitové celé čísla.
Kódovanie Base64
Kódovanie Base64 sa používa na kódovanie binárnych údajov do ekvivalentných znakov ASCII. Kódovanie Base64 sa používa v poštovom systéme, pretože poštové systémy, ako je SMTP, nemôžu pracovať s binárnymi údajmi, pretože akceptujú iba textové údaje ASCII. Používa sa tiež pri jednoduchej autentifikácii HTTP na kódovanie poverení. Okrem toho sa tiež používa na prenos binárnych údajov do súborov cookie a iných parametrov, aby sa údaje stali nečitateľnými, aby sa zabránilo neoprávnenej manipulácii. Ak sa obrázok alebo iný súbor prenesie bez kódovania Base64, poškodí sa, pretože poštový systém nie je schopný pracovať s binárnymi údajmi.
Base64 predstavuje dáta do blokov po 3 bajtoch, kde každý bajt obsahuje 8 bitov; teda predstavuje 24 bitov. Týchto 24 bitov je rozdelených do štyroch skupín po 6 bitoch. Každá z týchto skupín alebo častí sa prevedie na ekvivalentnú hodnotu Base64.
Kódovanie ASCII
Americký štandardný kód pre výmenu informácií (ASCII) je typ kódovania znakov. Bol to prvý štandard kódovania znakov vydaný v roku 1963.
ASCII kód sa používa na reprezentáciu anglických znakov ako čísla, pričom každému písmenu je priradené číslo od 0 až 127. Väčšina moderných schém kódovania znakov je založená na ASCII, aj keď podporujú mnoho ďalších znakov. Ide o jednobajtové kódovanie iba pomocou spodných 7 bitov. V súbore ASCII je každý abecedný, číselný alebo špeciálny znak reprezentovaný 7-bitovým binárnym číslom. Každý znak klávesnice má ekvivalentnú hodnotu ASCII.
Kódovanie obrazu a zvuku a videa
Kódovanie obrazu a zvuku a videa sa vykonáva, aby sa ušetril úložný priestor. Mediálny súbor, ako je obrázok, zvuk a video, sú zakódované, aby sa uložili v efektívnejšom a komprimovanom formáte.
Tieto kódované súbory obsahujú rovnaký obsah vo zvyčajne podobnej kvalite, ale v komprimovanej veľkosti, takže ich možno uložiť na menšom priestore, ľahko preniesť poštou alebo stiahnuť do systému.
Môžeme to chápať ako . Zvukový súbor WAV sa skonvertuje na súbor .MP3, aby sa jeho veľkosť zmenšila o 1/10thdo pôvodnej veľkosti.