logo

Typy strojového učenia

Strojové učenie je podmnožinou AI, ktorá umožňuje stroju automaticky sa učiť z údajov, zlepšovať výkon z minulých skúseností a vytvárať predpovede. . Strojové učenie obsahuje sadu algoritmov, ktoré pracujú s obrovským množstvom údajov. Údaje sa privádzajú do týchto algoritmov, aby ich trénovali, a na základe školenia zostavujú model a vykonávajú konkrétnu úlohu.

Typy strojového učenia

Tieto algoritmy ML pomáhajú riešiť rôzne obchodné problémy, ako je regresia, klasifikácia, prognózovanie, zoskupovanie a asociácie atď.

Na základe metód a spôsobu učenia sa strojové učenie delí najmä na štyri typy, ktorými sú:

  1. Strojové učenie pod dohľadom
  2. Strojové učenie bez dozoru
  3. Čiastočne riadené strojové učenie
  4. Posilňovacie učenie
Typy strojového učenia

V tejto téme poskytneme podrobný popis typov strojového učenia spolu s ich príslušnými algoritmami:

1. Strojové učenie pod dohľadom

Ako napovedá jej názov, Strojové učenie pod dohľadom je založená na supervízii. To znamená, že v technike učenia pod dohľadom trénujeme stroje pomocou „označeného“ súboru údajov a na základe tréningu stroj predpovedá výstup. Označené údaje tu špecifikujú, že niektoré zo vstupov sú už namapované na výstup. Ešte vzácnejšie, môžeme povedať; najprv stroj natrénujeme so vstupom a zodpovedajúcim výstupom a potom požiadame stroj, aby predpovedal výstup pomocou testovacej množiny údajov.

Poďme pochopiť vyučovanie pod dohľadom na príklade. Predpokladajme, že máme vstupný súbor obrázkov mačiek a psov. Najprv teda poskytneme stroju školenie na pochopenie obrázkov, ako napr tvar a veľkosť chvosta mačky a psa, tvar očí, farba, výška (psi sú vyšší, mačky sú menšie) atď. Po ukončení tréningu vložíme obrázok mačky a požiadame stroj, aby identifikoval objekt a predpovedal výstup. Teraz je stroj dobre vycvičený, takže skontroluje všetky vlastnosti objektu, ako je výška, tvar, farba, oči, uši, chvost atď., a zistí, že je to mačka. Takže to zaradí do kategórie Cat. Toto je proces, ako stroj identifikuje objekty v Supervised Learning.

Hlavným cieľom techniky supervidovaného učenia je mapovanie vstupnej premennej (x) s výstupnou premennou (y). Niektoré aplikácie riadeného učenia v reálnom svete sú Posúdenie rizika, Detekcia podvodov, Filtrovanie spamu, atď.

transformovať reťazec na int

Kategórie riadeného strojového učenia

Strojové učenie pod dohľadom možno rozdeliť do dvoch typov problémov, ktoré sú uvedené nižšie:

    Klasifikácia Regresia

a) Klasifikácia

Klasifikačné algoritmy sa používajú na riešenie klasifikačných problémov, v ktorých je výstupná premenná kategorická, ako napr. Áno alebo Nie, Muž alebo Žena, Červená alebo Modrá atď . Algoritmy klasifikácie predpovedajú kategórie prítomné v súbore údajov. Niektoré príklady klasifikačných algoritmov v reálnom svete sú Detekcia spamu, filtrovanie e-mailov atď.

Niektoré populárne klasifikačné algoritmy sú uvedené nižšie:

    Náhodný lesný algoritmus Algoritmus rozhodovacieho stromu Logistický regresný algoritmus Podpora vektorového strojového algoritmu

b) Regresia

Regresné algoritmy sa používajú na riešenie regresných problémov, v ktorých existuje lineárny vzťah medzi vstupnými a výstupnými premennými. Používajú sa na predpovedanie nepretržitých výstupných premenných, ako sú trendy na trhu, predpoveď počasia atď.

previesť int na reťazec v jazyku Java

Niektoré populárne regresné algoritmy sú uvedené nižšie:

    Jednoduchý algoritmus lineárnej regresie Algoritmus mnohorozmernej regresie Algoritmus rozhodovacieho stromu Regresia lasa

Výhody a nevýhody vyučovania pod dohľadom

Výhody:

  • Keďže učenie pod dohľadom pracuje s označeným súborom údajov, takže môžeme mať presnú predstavu o triedach objektov.
  • Tieto algoritmy sú užitočné pri predpovedaní výstupu na základe predchádzajúcich skúseností.

Nevýhody:

  • Tieto algoritmy nie sú schopné riešiť zložité úlohy.
  • Môže predpovedať nesprávny výstup, ak sa testovacie údaje líšia od trénovacích údajov.
  • Natrénovanie algoritmu si vyžaduje veľa výpočtového času.

Aplikácie kontrolovaného učenia

Niektoré bežné aplikácie supervidovaného učenia sú uvedené nižšie:

    Segmentácia obrázka:
    Pri segmentácii obrazu sa používajú algoritmy supervizovaného učenia. V tomto procese sa klasifikácia obrazu vykonáva na rôznych obrazových dátach s preddefinovanými štítkami.Lekárska diagnóza:
    Riadené algoritmy sa používajú aj v lekárskej oblasti na diagnostické účely. Robí sa to pomocou lekárskych obrázkov a minulých označených údajov so štítkami pre chorobné stavy. Pomocou takéhoto procesu môže stroj identifikovať ochorenie pre nových pacientov.Detekcia podvodov -Algoritmy klasifikácie kontrolovaného učenia sa používajú na identifikáciu podvodných transakcií, podvodných zákazníkov atď. Vykonáva sa pomocou historických údajov na identifikáciu vzorov, ktoré môžu viesť k možnému podvodu.Detekcia spamu -Pri detekcii a filtrovaní spamu sa používajú klasifikačné algoritmy. Tieto algoritmy klasifikujú e-mail ako spam alebo nie. Spamové e-maily sa odosielajú do priečinka spam.Rozpoznávanie reči -Algoritmy učenia pod dohľadom sa používajú aj pri rozpoznávaní reči. Algoritmus je trénovaný s hlasovými údajmi a pomocou nich je možné vykonať rôzne identifikácie, ako sú heslá aktivované hlasom, hlasové príkazy atď.

2. Strojové učenie bez dozoru

Učenie bez dozoru g sa líši od techniky učenia pod dohľadom; ako už názov napovedá, nie je potrebný dohľad. To znamená, že v strojovom učení bez dozoru je stroj trénovaný pomocou neoznačeného súboru údajov a stroj predpovedá výstup bez akéhokoľvek dohľadu.

Pri učení bez dozoru sú modely trénované s údajmi, ktoré nie sú klasifikované ani označené, a model na základe týchto údajov funguje bez akéhokoľvek dohľadu.

Hlavným cieľom algoritmu učenia bez dozoru je zoskupiť alebo zaradiť netriedený súbor údajov do skupín podľa podobností, vzorov a rozdielov. Stroje dostanú pokyn, aby našli skryté vzory zo vstupného súboru údajov.

Zoberme si príklad, aby sme to lepšie pochopili; Predpokladajme, že existuje košík s obrázkami ovocia a vložíme ho do modelu strojového učenia. Obrázky sú pre model úplne neznáme a úlohou stroja je nájsť vzory a kategórie objektov.

Takže teraz stroj objaví svoje vzory a rozdiely, ako je rozdiel vo farbe, rozdiel v tvare, a predpovedá výstup, keď je testovaný s testovacím súborom údajov.

zlučovací druh

Kategórie strojového učenia bez dozoru

Učenie bez dozoru možno ďalej rozdeliť do dvoch typov, ktoré sú uvedené nižšie:

    Zhlukovanie asociácie

1) Zhlukovanie

Technika zhlukovania sa používa, keď chceme z údajov nájsť inherentné skupiny. Je to spôsob, ako zoskupiť objekty do zhluku tak, aby objekty s najväčšou podobnosťou zostali v jednej skupine a mali menej alebo žiadne podobnosti s objektmi iných skupín. Príkladom klastrovacieho algoritmu je zoskupovanie zákazníkov podľa ich nákupného správania.

Niektoré z populárnych klastrovacích algoritmov sú uvedené nižšie:

    Algoritmus klastrovania K-Means Algoritmus stredného posunu Algoritmus DBSCAN Analýza hlavných komponentov Nezávislá analýza komponentov

2) Združenie

Učenie asociačných pravidiel je technika učenia bez dozoru, ktorá nachádza zaujímavé vzťahy medzi premennými v rámci veľkého súboru údajov. Hlavným cieľom tohto učiaceho sa algoritmu je nájsť závislosť jednej údajovej položky na inej údajovej položke a podľa toho zmapovať tieto premenné tak, aby mohol generovať maximálny zisk. Tento algoritmus sa používa hlavne v Analýza trhového koša, ťažba z používania webu, nepretržitá produkcia , atď.

Niektoré populárne algoritmy učenia sa asociačných pravidiel sú Apriori algoritmus, Eclat, FP-rastový algoritmus.

Výhody a nevýhody algoritmu učenia bez dozoru

Výhody:

  • Tieto algoritmy môžu byť použité pre komplikované úlohy v porovnaní s kontrolovanými, pretože tieto algoritmy pracujú na neoznačenom súbore údajov.
  • Algoritmy bez dozoru sú vhodnejšie pre rôzne úlohy, pretože získanie neoznačeného súboru údajov je jednoduchšie v porovnaní s označeným súborom údajov.

Nevýhody:

  • Výstup algoritmu bez dozoru môže byť menej presný, pretože množina údajov nie je označená a algoritmy nie sú vopred trénované s presným výstupom.
  • Práca s učením bez dozoru je náročnejšia, pretože pracuje s neoznačenou množinou údajov, ktorá sa nezmapuje s výstupom.

Aplikácie učenia bez dozoru

    Analýza siete:Učenie bez dozoru sa používa na identifikáciu plagiátov a autorských práv pri sieťovej analýze textových údajov pre odborné články.Systémy odporúčaní:Systémy odporúčaní vo veľkej miere využívajú techniky učenia bez dozoru na vytváranie odporúčacích aplikácií pre rôzne webové aplikácie a webové stránky elektronického obchodu.Detekcia anomálií:Detekcia anomálií je populárna aplikácia učenia bez dozoru, ktorá dokáže identifikovať neobvyklé dátové body v rámci súboru údajov. Používa sa na odhaľovanie podvodných transakcií.Dekompozícia singulárnej hodnoty:Singulárna hodnota rozkladu alebo SVD sa používa na extrahovanie konkrétnych informácií z databázy. Napríklad extrahovanie informácií o každom používateľovi, ktorý sa nachádza na určitom mieste.

3. Semi-supervised learning

Semi-supervised learning je typ algoritmu strojového učenia, ktorý leží medzi strojovým učením pod dohľadom a bez dozoru. . Predstavuje prechod medzi algoritmami kontrolovaného (s označenými tréningovými údajmi) a učenia bez dozoru (bez označených tréningových údajov) a používa kombináciu označených a neoznačených súborov údajov počas tréningového obdobia.

A Hoci učenie sa čiastočne pod dohľadom je strednou cestou medzi učením pod dohľadom a učením bez dozoru a funguje na údajoch, ktoré pozostávajú z niekoľkých štítkov, väčšinou pozostávajú z neoznačených údajov. Keďže štítky sú drahé, ale na firemné účely môžu mať málo štítkov. Je úplne odlišné od učenia pod dohľadom a bez dozoru, pretože sú založené na prítomnosti a neprítomnosti označení.

Na prekonanie nedostatkov učenia pod dohľadom a algoritmov učenia bez dozoru sa zaviedol koncept učenia pod dohľadom. . Hlavným cieľom učenia sa pod dohľadom je efektívne využívať všetky dostupné údaje, a nie iba označené údaje, ako je to pri vyučovaní pod dohľadom. Na začiatku sú podobné údaje zoskupené spolu s algoritmom učenia bez dozoru a ďalej to pomáha označiť neoznačené údaje do označených údajov. Je to preto, že označené údaje sú porovnateľne drahšie získavanie ako neoznačené údaje.

Tieto algoritmy si môžeme predstaviť na príklade. Učenie pod dohľadom je miesto, kde je študent pod dohľadom inštruktora doma a na vysokej škole. Ďalej, ak tento študent sám analyzuje rovnaký koncept bez akejkoľvek pomoci od inštruktora, spadá to pod učenie bez dozoru. V rámci výučby s čiastočným dohľadom sa študent musí po analýze rovnakého konceptu pod vedením inštruktora na vysokej škole prehodnotiť.

zoznam fontov v gimp

Výhody a nevýhody učenia s čiastočným dohľadom

Výhody:

  • Je to jednoduché a ľahké na pochopenie algoritmu.
  • Je vysoko efektívny.
  • Používa sa na riešenie nedostatkov algoritmov učenia pod dohľadom a bez dozoru.

Nevýhody:

  • Výsledky iterácií nemusia byť stabilné.
  • Tieto algoritmy nemôžeme použiť na údaje na úrovni siete.
  • Presnosť je nízka.

4. Posilňovacie vzdelávanie

Posilňovacie učenie funguje na procese založenom na spätnej väzbe, v ktorom agent AI (softvérový komponent) automaticky skúma svoje okolie údermi a stopami, podnikaním krokov, učením sa zo skúseností a zlepšovaním svojho výkonu. Agent dostane odmenu za každú dobrú akciu a bude potrestaný za každú zlú akciu; preto cieľom posilňovacieho vzdelávacieho agenta je maximalizovať odmeny.

V posilňovacom vzdelávaní neexistujú žiadne označené údaje ako učenie pod dohľadom a agenti sa učia iba zo svojich skúseností.

Proces posilňovacieho učenia je podobný ľudskej bytosti; napríklad, dieťa sa učí rôzne veci skúsenosťami v jeho každodennom živote. Príkladom posilňovacieho učenia je hranie hry, kde Hra je prostredie, pohyby agenta v každom kroku definujú stavy a cieľom agenta je získať vysoké skóre. Agent dostáva spätnú väzbu v zmysle trestov a odmien.

Posilňovacie učenie sa vďaka svojmu spôsobu práce využíva v rôznych oblastiach ako napr Teória hier, operačný výskum, teória informácie, multiagentové systémy.

Problém učenia posilňovania môže byť formalizovaný pomocou Markovov rozhodovací proces (MDP). V MDP agent neustále interaguje s prostredím a vykonáva akcie; pri každej akcii okolie reaguje a generuje nový stav.

Kategórie posilňovacieho vzdelávania

Posilňovacie učenie sa kategorizuje hlavne do dvoch typov metód/algoritmov:

linux ktorý
    Pozitívne posilňovanie učenia:Učenie sa pozitívneho posilnenia špecifikuje zvýšenie tendencie, že by sa požadované správanie znovu objavilo pridaním niečoho. Zvyšuje silu správania agenta a pozitívne ho ovplyvňuje.Negatívne posilňovacie učenie:Negatívne posilňovacie učenie funguje presne opačne ako pozitívne RL. Zvyšuje tendenciu, že by sa špecifické správanie znovu objavilo tým, že sa vyhne negatívnemu stavu.

Prípady použitia posilňovacieho vzdelávania v reálnom svete

    Video hry:
    Algoritmy RL sú veľmi populárne v herných aplikáciách. Používa sa na získanie nadľudského výkonu. Niektoré populárne hry, ktoré používajú RL algoritmy, sú AlphaGO a AlphaGO Zero .Riadenie zdrojov:
    Dokument 'Resource Management with Deep Reinforcement Learning' ukázal, ako používať RL v počítači na automatické učenie a plánovanie zdrojov na čakanie na rôzne úlohy, aby sa minimalizovalo priemerné spomalenie úlohy.Robotické:
    RL sa široko používa v aplikáciách robotiky. Roboty sa používajú v priemyselnej a výrobnej oblasti a tieto roboty sú výkonnejšie vďaka posilňovaniu. Existujú rôzne odvetvia, ktoré majú svoju víziu budovania inteligentných robotov pomocou AI a technológie strojového učenia.Ťažba textu
    Text-mining, jedna z veľkých aplikácií NLP, sa teraz implementuje s pomocou Reinforcement Learning od spoločnosti Salesforce.

Výhody a nevýhody posilňovacieho vzdelávania

Výhody

  • Pomáha pri riešení zložitých problémov v reálnom svete, ktoré je ťažké vyriešiť všeobecnými technikami.
  • Učebný model RL je podobný učeniu sa ľudí; možno teda nájsť najpresnejšie výsledky.
  • Pomáha pri dosahovaní dlhodobých výsledkov.

Nevýhoda

  • RL algoritmy nie sú preferované pre jednoduché problémy.
  • Algoritmy RL vyžadujú obrovské množstvo údajov a výpočtov.
  • Príliš veľa posilňujúceho učenia môže viesť k preťaženiu stavov, čo môže oslabiť výsledky.

Kliatba dimenzionality obmedzuje učenie sa posilňovania pre skutočné fyzikálne systémy.