Databáza pozostáva z obrovského množstva údajov. Údaje sú zoskupené v tabuľke v RDBMS a každá tabuľka má súvisiace záznamy. Používateľ môže vidieť, že údaje sú uložené vo forme tabuliek, ale v skutočnosti je toto obrovské množstvo údajov uložené vo fyzickej pamäti vo forme súborov.
Čo je a Súbor?
Súbor sa nazýva zbierka súvisiacich informácií, ktoré sú zaznamenané na sekundárnom úložisku, ako napr magnetické disky , magnetické pásky, a optické disky .
Čo je organizácia súborov?
Organizácia súboru sa vzťahuje na logické vzťahy medzi rôznymi záznamami, ktoré tvoria súbor, najmä s ohľadom na prostriedky identifikácie a prístupu k akémukoľvek konkrétnemu záznamu. Jednoducho povedané, ukladanie súborov v určitom poradí sa nazýva organizácia súborov. Štruktúra súboru sa vzťahuje na formát štítku a dátových blokov a akéhokoľvek logického riadiaceho záznamu.
Cieľ organizácie súborov
- Pomáha pri rýchlejšom výbere záznamov, t.j. urýchľuje proces.
- Rôzne operácie ako vkladanie, mazanie a aktualizácia rôznych záznamov sú rýchlejšie a jednoduchšie.
- Bráni nám to vkladať duplicitné záznamy cez rôzne operácie.
- Pomáha pri ukladaní záznamov alebo údajov veľmi efektívne pri minimálnych nákladoch
Typy súborových organizácií
Na organizovanie súborov boli zavedené rôzne metódy. Tieto konkrétne metódy majú výhody a nevýhody na základe prístupu alebo výberu. Je teda len na programátorovi, aby sa rozhodol pre najvhodnejšiu metódu organizácie súboru podľa svojich požiadaviek.
Niektoré typy organizácie súborov sú:
tiger v porovnaní s levom
- Sekvenčná organizácia súborov
- Organizácia súborov haldy
- Organizácia hash súboru
- Organizácia súborov stromu B+
- Usporiadanie klastrovaných súborov
- ISAM (metóda indexovaného sekvenčného prístupu)
O každej organizácii súborov budeme diskutovať v ďalších súboroch tohto článku spolu s rozdielmi a výhodami/nevýhodami každej metódy organizácie súborov.
Sekvenčná organizácia súborov
Najjednoduchšou metódou organizácie súborov je sekvenčná metóda. Pri tejto metóde sa súbor ukladá jeden po druhom sekvenčným spôsobom. Existujú dva spôsoby implementácie tejto metódy:
1. Metóda pilového súboru
Táto metóda je pomerne jednoduchá, ukladáme záznamy v poradí, t.j. jeden po druhom v poradí, v akom sú vložené do tabuliek.
Metóda pilového súboru
Vloženie nového záznamu: Nech R1, R3 a tak ďalej až po R5 a R4 sú štyri záznamy v poradí. Záznamy tu nie sú nič iné ako riadok v akejkoľvek tabuľke. Predpokladajme, že do sekvencie je potrebné vložiť nový záznam R2, potom sa jednoducho umiestni na koniec súboru.
tcp vs udp
Vloženie nového záznamu
2. Metóda triedeného súboru
Pri tejto metóde, ako už názov napovedá, vždy, keď je potrebné vložiť nový záznam, vždy sa vloží zoradené (vzostupne alebo zostupne). Triedenie záznamov môže byť založené na ľubovoľnom primárny kľúč alebo akýkoľvek iný kľúč.
Metóda triedeného súboru
Vloženie nového záznamu: Predpokladajme, že už existuje triedená postupnosť štyroch záznamov R1, R3 atď. až po R7 a R8. Predpokladajme, že do sekvencie musí byť vložený nový záznam R2, potom sa vloží na koniec súboru a potom zoradí sekvenciu.
vloženie nového záznamu
Výhody sekvenčnej organizácie súborov
- Rýchla a efektívna metóda pre veľké množstvo dát.
- Jednoduchý dizajn.
- Súbory sa dajú jednoducho ukladať magnetické pásky t.j. lacnejší skladovací mechanizmus.
Nevýhody sekvenčnej organizácie súborov
- Strata času, pretože nemôžeme skočiť na konkrétny záznam, ktorý je potrebný, ale musíme sa pohybovať postupne, čo nám zaberá čas.
- Metóda triedeného súboru je neefektívna, pretože zaberá čas a priestor na triedenie záznamov.
Organizácia súborov haldy
Organizácia súborov haldy pracuje s dátovými blokmi. Pri tejto metóde sa záznamy vkladajú na koniec súboru do dátových blokov. Pri tejto metóde nie je potrebné žiadne triedenie ani objednávanie. Ak je dátový blok plný, nový záznam je uložený v inom bloku. Tu druhý dátový blok nemusí byť úplne nasledujúci dátový blok, ale môže to byť ktorýkoľvek blok v pamäti. Za uloženie a správu nových záznamov je zodpovedný DBMS.
Organizácia súborov haldy
Vloženie nového záznamu: Predpokladajme, že máme štyri záznamy v halde R1, R5, R6, R4 a R3 a predpokladajme, že do haldy je potrebné vložiť nový záznam R2, keďže posledný dátový blok, t. j. dátový blok 3 je plný, bude vložený do ktorýkoľvek z dátových blokov vybraných DBMS, povedzme dátový blok 1.
Vloženie nového záznamu
Ak chceme hľadať, mazať alebo aktualizovať dáta v haldovom súbore Organizácia, prejdeme dátami od začiatku súboru, až kým nezískame požadovaný záznam. Ak je teda databáza veľmi veľká, vyhľadávanie, mazanie alebo aktualizácia záznamu zaberie veľa času.
Výhody organizácie haldových súborov
- Získavanie a získavanie záznamov je rýchlejšie ako sekvenčné záznamy, ale iba v prípade malých databáz.
- Keď existuje veľké množstvo údajov, ktoré je potrebné načítať do databázy naraz, potom je tento spôsob organizácie súborov najvhodnejší.
Nevýhody organizácie haldových súborov
- Problém nevyužitých pamäťových blokov.
- Neefektívne pre väčšie databázy.
Záver
Na záver je dôležité vybrať si vhodnú organizáciu súborov v a systém správy databáz (DBMS) . Zatiaľ čo náhodná štruktúra ponúka flexibilitu, ale môže viesť k fragmentácii, sekvenčné usporiadanie je lepšie pre objednaný prístup. Indexovanie nachádza rovnováhu, klastrovanie zlepšuje efektivitu pre konkrétne dotazy a hašované štruktúry maximalizujú rýchly prístup. Trvalá účinnosť si vyžaduje pravidelnú údržbu. Výber by mal byť založený na požiadavkách konkrétnej aplikácie; pre najlepší výkon DBMS môže byť potrebná starostlivá kombinácia stratégií.
Časté otázky o organizácii súborov
Otázka 1: Čo je organizácia súborov?
odpoveď:
Organizácia súboru je v podstate vzťah medzi rôznymi záznamami, ktorý uľahčuje identifikáciu súboru a prístup k nemu.
Otázka 2: Aké sú štyri metódy organizácie súborov?
odpoveď:
Metódy organizácie súborov sú
- Sekvenčné
- Náhodný
- Serial
- Indexované sekvenčné
Otázka 3: Aký je rozdiel medzi sekvenčnou organizáciou súborov a organizáciou haldových súborov?
odpoveď:
Jednoduchý rozdiel medzi organizáciou sekvenčných súborov a organizáciou súborov haldy je v tom, že organizácia sekvenčných súborov umiestňuje údaje v správnom poradí, zatiaľ čo organizácia súborov haldy umiestňuje údaje v ľubovoľnom poradí.
zoznam šípok
Ďalšie informácie nájdete v časti Organizácia súborov DBMS – sada 2 | Hašovanie v DBMS .