Strojové učenie je podmnožinou AI, ktorá umožňuje stroju automaticky sa učiť z údajov, zlepšovať výkon z minulých skúseností a vytvárať predpovede. . Strojové učenie obsahuje sadu algoritmov, ktoré pracujú s obrovským množstvom údajov. Údaje sa privádzajú do týchto algoritmov, aby ich trénovali, a na základe školenia zostavujú model a vykonávajú konkrétnu úlohu.
Tieto algoritmy ML pomáhajú riešiť rôzne obchodné problémy, ako je regresia, klasifikácia, prognózovanie, zoskupovanie a asociácie atď.
Na základe metód a spôsobu učenia sa strojové učenie delí najmä na štyri typy, ktorými sú:
- Strojové učenie pod dohľadom
- Strojové učenie bez dozoru
- Čiastočne riadené strojové učenie
- Posilňovacie učenie
V tejto téme poskytneme podrobný popis typov strojového učenia spolu s ich príslušnými algoritmami:
1. Strojové učenie pod dohľadom
Ako napovedá jej názov, Strojové učenie pod dohľadom je založená na supervízii. To znamená, že v technike učenia pod dohľadom trénujeme stroje pomocou „označeného“ súboru údajov a na základe tréningu stroj predpovedá výstup. Označené údaje tu špecifikujú, že niektoré zo vstupov sú už namapované na výstup. Ešte vzácnejšie, môžeme povedať; najprv stroj natrénujeme so vstupom a zodpovedajúcim výstupom a potom požiadame stroj, aby predpovedal výstup pomocou testovacej množiny údajov.
Poďme pochopiť vyučovanie pod dohľadom na príklade. Predpokladajme, že máme vstupný súbor obrázkov mačiek a psov. Najprv teda poskytneme stroju školenie na pochopenie obrázkov, ako napr tvar a veľkosť chvosta mačky a psa, tvar očí, farba, výška (psi sú vyšší, mačky sú menšie) atď. Po ukončení tréningu vložíme obrázok mačky a požiadame stroj, aby identifikoval objekt a predpovedal výstup. Teraz je stroj dobre vycvičený, takže skontroluje všetky vlastnosti objektu, ako je výška, tvar, farba, oči, uši, chvost atď., a zistí, že je to mačka. Takže to zaradí do kategórie Cat. Toto je proces, ako stroj identifikuje objekty v Supervised Learning.
Hlavným cieľom techniky supervidovaného učenia je mapovanie vstupnej premennej (x) s výstupnou premennou (y). Niektoré aplikácie riadeného učenia v reálnom svete sú Posúdenie rizika, Detekcia podvodov, Filtrovanie spamu, atď.
transformovať reťazec na int
Kategórie riadeného strojového učenia
Strojové učenie pod dohľadom možno rozdeliť do dvoch typov problémov, ktoré sú uvedené nižšie:
a) Klasifikácia
Klasifikačné algoritmy sa používajú na riešenie klasifikačných problémov, v ktorých je výstupná premenná kategorická, ako napr. Áno alebo Nie, Muž alebo Žena, Červená alebo Modrá atď . Algoritmy klasifikácie predpovedajú kategórie prítomné v súbore údajov. Niektoré príklady klasifikačných algoritmov v reálnom svete sú Detekcia spamu, filtrovanie e-mailov atď.
Niektoré populárne klasifikačné algoritmy sú uvedené nižšie:
b) Regresia
Regresné algoritmy sa používajú na riešenie regresných problémov, v ktorých existuje lineárny vzťah medzi vstupnými a výstupnými premennými. Používajú sa na predpovedanie nepretržitých výstupných premenných, ako sú trendy na trhu, predpoveď počasia atď.
previesť int na reťazec v jazyku Java
Niektoré populárne regresné algoritmy sú uvedené nižšie:
Výhody a nevýhody vyučovania pod dohľadom
Výhody:
- Keďže učenie pod dohľadom pracuje s označeným súborom údajov, takže môžeme mať presnú predstavu o triedach objektov.
- Tieto algoritmy sú užitočné pri predpovedaní výstupu na základe predchádzajúcich skúseností.
Nevýhody:
- Tieto algoritmy nie sú schopné riešiť zložité úlohy.
- Môže predpovedať nesprávny výstup, ak sa testovacie údaje líšia od trénovacích údajov.
- Natrénovanie algoritmu si vyžaduje veľa výpočtového času.
Aplikácie kontrolovaného učenia
Niektoré bežné aplikácie supervidovaného učenia sú uvedené nižšie:
Pri segmentácii obrazu sa používajú algoritmy supervizovaného učenia. V tomto procese sa klasifikácia obrazu vykonáva na rôznych obrazových dátach s preddefinovanými štítkami.
Riadené algoritmy sa používajú aj v lekárskej oblasti na diagnostické účely. Robí sa to pomocou lekárskych obrázkov a minulých označených údajov so štítkami pre chorobné stavy. Pomocou takéhoto procesu môže stroj identifikovať ochorenie pre nových pacientov.
2. Strojové učenie bez dozoru
Učenie bez dozoru g sa líši od techniky učenia pod dohľadom; ako už názov napovedá, nie je potrebný dohľad. To znamená, že v strojovom učení bez dozoru je stroj trénovaný pomocou neoznačeného súboru údajov a stroj predpovedá výstup bez akéhokoľvek dohľadu.
Pri učení bez dozoru sú modely trénované s údajmi, ktoré nie sú klasifikované ani označené, a model na základe týchto údajov funguje bez akéhokoľvek dohľadu.
Hlavným cieľom algoritmu učenia bez dozoru je zoskupiť alebo zaradiť netriedený súbor údajov do skupín podľa podobností, vzorov a rozdielov. Stroje dostanú pokyn, aby našli skryté vzory zo vstupného súboru údajov.
Zoberme si príklad, aby sme to lepšie pochopili; Predpokladajme, že existuje košík s obrázkami ovocia a vložíme ho do modelu strojového učenia. Obrázky sú pre model úplne neznáme a úlohou stroja je nájsť vzory a kategórie objektov.
Takže teraz stroj objaví svoje vzory a rozdiely, ako je rozdiel vo farbe, rozdiel v tvare, a predpovedá výstup, keď je testovaný s testovacím súborom údajov.
zlučovací druh
Kategórie strojového učenia bez dozoru
Učenie bez dozoru možno ďalej rozdeliť do dvoch typov, ktoré sú uvedené nižšie:
1) Zhlukovanie
Technika zhlukovania sa používa, keď chceme z údajov nájsť inherentné skupiny. Je to spôsob, ako zoskupiť objekty do zhluku tak, aby objekty s najväčšou podobnosťou zostali v jednej skupine a mali menej alebo žiadne podobnosti s objektmi iných skupín. Príkladom klastrovacieho algoritmu je zoskupovanie zákazníkov podľa ich nákupného správania.
Niektoré z populárnych klastrovacích algoritmov sú uvedené nižšie:
2) Združenie
Učenie asociačných pravidiel je technika učenia bez dozoru, ktorá nachádza zaujímavé vzťahy medzi premennými v rámci veľkého súboru údajov. Hlavným cieľom tohto učiaceho sa algoritmu je nájsť závislosť jednej údajovej položky na inej údajovej položke a podľa toho zmapovať tieto premenné tak, aby mohol generovať maximálny zisk. Tento algoritmus sa používa hlavne v Analýza trhového koša, ťažba z používania webu, nepretržitá produkcia , atď.
Niektoré populárne algoritmy učenia sa asociačných pravidiel sú Apriori algoritmus, Eclat, FP-rastový algoritmus.
Výhody a nevýhody algoritmu učenia bez dozoru
Výhody:
- Tieto algoritmy môžu byť použité pre komplikované úlohy v porovnaní s kontrolovanými, pretože tieto algoritmy pracujú na neoznačenom súbore údajov.
- Algoritmy bez dozoru sú vhodnejšie pre rôzne úlohy, pretože získanie neoznačeného súboru údajov je jednoduchšie v porovnaní s označeným súborom údajov.
Nevýhody:
- Výstup algoritmu bez dozoru môže byť menej presný, pretože množina údajov nie je označená a algoritmy nie sú vopred trénované s presným výstupom.
- Práca s učením bez dozoru je náročnejšia, pretože pracuje s neoznačenou množinou údajov, ktorá sa nezmapuje s výstupom.
Aplikácie učenia bez dozoru
3. Semi-supervised learning
Semi-supervised learning je typ algoritmu strojového učenia, ktorý leží medzi strojovým učením pod dohľadom a bez dozoru. . Predstavuje prechod medzi algoritmami kontrolovaného (s označenými tréningovými údajmi) a učenia bez dozoru (bez označených tréningových údajov) a používa kombináciu označených a neoznačených súborov údajov počas tréningového obdobia.
A Hoci učenie sa čiastočne pod dohľadom je strednou cestou medzi učením pod dohľadom a učením bez dozoru a funguje na údajoch, ktoré pozostávajú z niekoľkých štítkov, väčšinou pozostávajú z neoznačených údajov. Keďže štítky sú drahé, ale na firemné účely môžu mať málo štítkov. Je úplne odlišné od učenia pod dohľadom a bez dozoru, pretože sú založené na prítomnosti a neprítomnosti označení.
Na prekonanie nedostatkov učenia pod dohľadom a algoritmov učenia bez dozoru sa zaviedol koncept učenia pod dohľadom. . Hlavným cieľom učenia sa pod dohľadom je efektívne využívať všetky dostupné údaje, a nie iba označené údaje, ako je to pri vyučovaní pod dohľadom. Na začiatku sú podobné údaje zoskupené spolu s algoritmom učenia bez dozoru a ďalej to pomáha označiť neoznačené údaje do označených údajov. Je to preto, že označené údaje sú porovnateľne drahšie získavanie ako neoznačené údaje.
Tieto algoritmy si môžeme predstaviť na príklade. Učenie pod dohľadom je miesto, kde je študent pod dohľadom inštruktora doma a na vysokej škole. Ďalej, ak tento študent sám analyzuje rovnaký koncept bez akejkoľvek pomoci od inštruktora, spadá to pod učenie bez dozoru. V rámci výučby s čiastočným dohľadom sa študent musí po analýze rovnakého konceptu pod vedením inštruktora na vysokej škole prehodnotiť.
zoznam fontov v gimp
Výhody a nevýhody učenia s čiastočným dohľadom
Výhody:
- Je to jednoduché a ľahké na pochopenie algoritmu.
- Je vysoko efektívny.
- Používa sa na riešenie nedostatkov algoritmov učenia pod dohľadom a bez dozoru.
Nevýhody:
- Výsledky iterácií nemusia byť stabilné.
- Tieto algoritmy nemôžeme použiť na údaje na úrovni siete.
- Presnosť je nízka.
4. Posilňovacie vzdelávanie
Posilňovacie učenie funguje na procese založenom na spätnej väzbe, v ktorom agent AI (softvérový komponent) automaticky skúma svoje okolie údermi a stopami, podnikaním krokov, učením sa zo skúseností a zlepšovaním svojho výkonu. Agent dostane odmenu za každú dobrú akciu a bude potrestaný za každú zlú akciu; preto cieľom posilňovacieho vzdelávacieho agenta je maximalizovať odmeny.
V posilňovacom vzdelávaní neexistujú žiadne označené údaje ako učenie pod dohľadom a agenti sa učia iba zo svojich skúseností.
Proces posilňovacieho učenia je podobný ľudskej bytosti; napríklad, dieťa sa učí rôzne veci skúsenosťami v jeho každodennom živote. Príkladom posilňovacieho učenia je hranie hry, kde Hra je prostredie, pohyby agenta v každom kroku definujú stavy a cieľom agenta je získať vysoké skóre. Agent dostáva spätnú väzbu v zmysle trestov a odmien.
Posilňovacie učenie sa vďaka svojmu spôsobu práce využíva v rôznych oblastiach ako napr Teória hier, operačný výskum, teória informácie, multiagentové systémy.
Problém učenia posilňovania môže byť formalizovaný pomocou Markovov rozhodovací proces (MDP). V MDP agent neustále interaguje s prostredím a vykonáva akcie; pri každej akcii okolie reaguje a generuje nový stav.
Kategórie posilňovacieho vzdelávania
Posilňovacie učenie sa kategorizuje hlavne do dvoch typov metód/algoritmov:
linux ktorý
Prípady použitia posilňovacieho vzdelávania v reálnom svete
Algoritmy RL sú veľmi populárne v herných aplikáciách. Používa sa na získanie nadľudského výkonu. Niektoré populárne hry, ktoré používajú RL algoritmy, sú AlphaGO a AlphaGO Zero .
Dokument 'Resource Management with Deep Reinforcement Learning' ukázal, ako používať RL v počítači na automatické učenie a plánovanie zdrojov na čakanie na rôzne úlohy, aby sa minimalizovalo priemerné spomalenie úlohy.
RL sa široko používa v aplikáciách robotiky. Roboty sa používajú v priemyselnej a výrobnej oblasti a tieto roboty sú výkonnejšie vďaka posilňovaniu. Existujú rôzne odvetvia, ktoré majú svoju víziu budovania inteligentných robotov pomocou AI a technológie strojového učenia.
Text-mining, jedna z veľkých aplikácií NLP, sa teraz implementuje s pomocou Reinforcement Learning od spoločnosti Salesforce.
Výhody a nevýhody posilňovacieho vzdelávania
Výhody
- Pomáha pri riešení zložitých problémov v reálnom svete, ktoré je ťažké vyriešiť všeobecnými technikami.
- Učebný model RL je podobný učeniu sa ľudí; možno teda nájsť najpresnejšie výsledky.
- Pomáha pri dosahovaní dlhodobých výsledkov.
Nevýhoda
- RL algoritmy nie sú preferované pre jednoduché problémy.
- Algoritmy RL vyžadujú obrovské množstvo údajov a výpočtov.
- Príliš veľa posilňujúceho učenia môže viesť k preťaženiu stavov, čo môže oslabiť výsledky.
Kliatba dimenzionality obmedzuje učenie sa posilňovania pre skutočné fyzikálne systémy.