logo

Strojové učenie pod dohľadom

Riadené učenie je typ strojového učenia, v ktorom sú stroje trénované pomocou dobre „označených“ tréningových údajov a na základe týchto údajov stroje predpovedajú výstup. Označené údaje znamenajú, že niektoré vstupné údaje sú už označené správnym výstupom.

apache

Pri učení pod dohľadom fungujú tréningové dáta poskytované strojom ako supervízor, ktorý učí stroje správne predpovedať výstup. Uplatňuje rovnaký koncept, ako sa študent učí pod dohľadom učiteľa.

Riadené učenie je proces poskytovania vstupných údajov, ako aj správnych výstupných údajov do modelu strojového učenia. Cieľom algoritmu učenia pod dohľadom je nájsť mapovaciu funkciu na mapovanie vstupnej premennej (x) s výstupnou premennou (y) .

V reálnom svete je možné použiť učenie pod dohľadom Hodnotenie rizika, klasifikácia obrázkov, detekcia podvodov, filtrovanie spamu , atď.

Ako funguje vyučovanie pod dohľadom?

V riadenom učení sa modely trénujú pomocou označeného súboru údajov, kde sa model dozvie o každom type údajov. Po dokončení tréningového procesu sa model testuje na základe testovacích údajov (podmnožina tréningovej množiny) a následne predpovedá výstup.

Fungovanie supervízneho učenia sa dá ľahko pochopiť pomocou nižšie uvedeného príkladu a diagramu:

Strojové učenie pod dohľadom

Predpokladajme, že máme súbor údajov rôznych typov tvarov, ktorý zahŕňa štvorec, obdĺžnik, trojuholník a mnohouholník. Teraz prvým krokom je, že musíme trénovať model pre každý tvar.

  • Ak má daný tvar štyri strany a všetky strany sú rovnaké, bude označený ako a Námestie .
  • Ak má daný tvar tri strany, bude označený ako a trojuholník .
  • Ak má daný tvar šesť rovnakých strán, bude označený ako šesťuholník .

Teraz, po tréningu, testujeme náš model pomocou testovacej sady a úlohou modelu je identifikovať tvar.

Stroj je už naučený na všetky typy tvarov a keď nájde nový tvar, klasifikuje tvar na základe niekoľkých strán a predpovedá výstup.

Kroky zahrnuté v kontrolovanom učení:

  • Najprv určite typ tréningového súboru údajov
  • Zbierajte/zhromažďujte označené tréningové údaje.
  • Rozdeľte tréningový súbor údajov na tréning súbor údajov, testovací súbor údajov a súbor údajov overenia .
  • Určite vstupné vlastnosti trénovacieho súboru údajov, ktorý by mal mať dostatok vedomostí, aby model mohol presne predpovedať výstup.
  • Určite vhodný algoritmus pre model, ako napríklad podporný vektorový stroj, rozhodovací strom atď.
  • Vykonajte algoritmus na tréningovom súbore údajov. Niekedy potrebujeme validačné množiny ako riadiace parametre, ktoré sú podmnožinou trénovacích množín údajov.
  • Vyhodnoťte presnosť modelu poskytnutím testovacej sady. Ak model predpovedá správny výstup, znamená to, že náš model je presný.

Typy kontrolovaných algoritmov strojového učenia:

Učenie pod dohľadom možno ďalej rozdeliť na dva typy problémov:

Strojové učenie pod dohľadom

1. Regresia

Regresné algoritmy sa používajú, ak existuje vzťah medzi vstupnou premennou a výstupnou premennou. Používa sa na predpovedanie kontinuálnych premenných, ako sú predpovede počasia, trendy trhu atď. Nižšie sú uvedené niektoré populárne regresné algoritmy, ktoré spadajú pod dohľad:

ak rudyardom kiplingom súhrn
  • Lineárna regresia
  • Regresné stromy
  • Nelineárna regresia
  • Bayesovská lineárna regresia
  • Polynomiálna regresia

2. Klasifikácia

Klasifikačné algoritmy sa používajú, keď je výstupná premenná kategorická, čo znamená, že existujú dve triedy, ako napríklad áno-nie, muž-žena, pravda-nepravda atď.

Filtrovanie spamu,

  • Náhodný les
  • Rozhodovacie stromy
  • Logistická regresia
  • Podporné vektorové stroje

Poznámka: Tieto algoritmy podrobne rozoberieme v ďalších kapitolách.

Výhody kontrolovaného vzdelávania:

  • Pomocou učenia pod dohľadom môže model predpovedať výstup na základe predchádzajúcich skúseností.
  • Pri učení pod dohľadom môžeme mať presnú predstavu o triedach predmetov.
  • Model supervidovaného učenia nám pomáha riešiť rôzne reálne problémy ako napr detekcia podvodov, filtrovanie spamu , atď.

Nevýhody učenia pod dohľadom:

  • Modely učenia pod dohľadom nie sú vhodné na zvládnutie zložitých úloh.
  • Riadené učenie nemôže predpovedať správny výstup, ak sa testovacie údaje líšia od trénovacieho súboru údajov.
  • Školenie si vyžadovalo veľa výpočtového času.
  • Pri učení pod dohľadom potrebujeme dostatok vedomostí o triedach predmetov.