logo

Modely strojového učenia

Model strojového učenia je definovaný ako matematická reprezentácia výstupu tréningového procesu. Strojové učenie je štúdium rôznych algoritmov, ktoré sa môžu automaticky zlepšovať prostredníctvom skúseností a starých údajov a zostavovať model. Model strojového učenia je podobný počítačovému softvéru určenému na rozpoznávanie vzorcov alebo správania na základe predchádzajúcich skúseností alebo údajov. Algoritmus učenia objavuje vzory v rámci trénovacích údajov a vytvára ML model, ktorý zachytáva tieto vzorce a robí predpovede na nových údajoch.

Modely strojového učenia

Poďme pochopiť príklad modelu ML, kde vytvárame aplikáciu na rozpoznávanie emócií používateľa na základe výrazov tváre. Vytvorenie takejto aplikácie je teda možné pomocou modelov strojového učenia, kde budeme model trénovať napájaním obrázkov tvárí s rôznymi emóciami. Kedykoľvek sa táto aplikácia používa na určenie nálady používateľa, načíta všetky údaje o kŕmení a potom určí náladu každého používateľa.

Jednoducho povedané, môžeme povedať, že a model strojového učenia je zjednodušená reprezentácia niečoho alebo procesu. V tejto téme budeme diskutovať o rôznych modeloch strojového učenia a ich technikách a algoritmoch .

Čo je to model strojového učenia?

Modely strojového učenia možno chápať ako program, ktorý bol trénovaný na hľadanie vzorov v nových údajoch a vytváranie predpovedí. Tieto modely sú reprezentované ako matematická funkcia, ktorá prijíma požiadavky vo forme vstupných údajov, robí predpovede na vstupných údajoch a potom poskytuje výstup ako odpoveď. Najprv sa tieto modely natrénujú na súbore údajov a potom sa im poskytne algoritmus na zdôvodnenie údajov, extrahovanie vzoru z údajov informačného kanála a učenie sa z týchto údajov. Keď sa tieto modely natrénujú, môžu sa použiť na predpovedanie neviditeľného súboru údajov.

K dispozícii sú rôzne typy modelov strojového učenia na základe rôznych obchodných cieľov a súborov údajov.

Klasifikácia modelov strojového učenia:

Na základe rôznych obchodných cieľov a súborov údajov existujú tri modely učenia pre algoritmy. Každý algoritmus strojového učenia sa usadí v jednom z troch modelov:

  • Učenie pod dohľadom
  • Učenie bez dozoru
  • Posilňovacie učenie
Modely strojového učenia

Riadené vzdelávanie sa ďalej delí na dve kategórie:

  • Klasifikácia
  • Regresia

Učenie bez dozoru je tiež rozdelené do nasledujúcich kategórií:

  • Zhlukovanie
  • Asociačné pravidlo
  • Zníženie rozmerov

1. Modely strojového učenia pod dohľadom

Supervised Learning je najjednoduchší model strojového učenia na pochopenie toho, ktoré vstupné dáta sa nazývajú tréningové dáta a majú známy štítok alebo výsledok ako výstup. Funguje teda na princípe vstupno-výstupných párov. Vyžaduje vytvorenie funkcie, ktorú je možné trénovať pomocou množiny trénovacích údajov, a potom sa aplikuje na neznáme údaje a vytvorí určitý prediktívny výkon. Učenie pod dohľadom je založené na úlohách a testuje sa na označených súboroch údajov.

Dokážeme implementovať model učenia pod dohľadom na jednoduché problémy zo skutočného života. Napríklad máme súbor údajov pozostávajúci z veku a výšky; potom môžeme vytvoriť model učenia pod dohľadom, aby sme predpovedali výšku osoby na základe jej veku.

Modely kontrolovaného učenia sa ďalej delia do dvoch kategórií:

Regresia

Pri regresných problémoch je výstupom spojitá premenná. Niektoré bežne používané regresné modely sú nasledovné:

a) Lineárna regresia

Lineárna regresia je najjednoduchší model strojového učenia, v ktorom sa snažíme predpovedať jednu výstupnú premennú pomocou jednej alebo viacerých vstupných premenných. Reprezentácia lineárnej regresie je lineárna rovnica, ktorá kombinuje množinu vstupných hodnôt (x) a predpovedaného výstupu (y) pre množinu týchto vstupných hodnôt. Je znázornený vo forme čiary:

Y = bx + c.

Modely strojového učenia

Hlavným cieľom lineárneho regresného modelu je nájsť najvhodnejšiu líniu, ktorá najlepšie zodpovedá dátovým bodom.

Lineárna regresia je rozšírená na viacnásobnú lineárnu regresiu (nájdite rovinu najlepšieho prispôsobenia) a polynomickú regresiu (nájdite krivku najlepšieho prispôsobenia).

b) Rozhodovací strom

java concat reťazce

Rozhodovacie stromy sú populárne modely strojového učenia, ktoré možno použiť pre regresné aj klasifikačné problémy.

Rozhodovací strom využíva stromovú štruktúru rozhodnutí spolu s ich možnými dôsledkami a výsledkami. V tomto sa každý vnútorný uzol používa na reprezentáciu testu atribútu; každá vetva sa používa na vyjadrenie výsledku testu. Čím viac uzlov má rozhodovací strom, tým presnejší bude výsledok.

Výhodou rozhodovacích stromov je, že sú intuitívne a ľahko implementovateľné, no chýba im presnosť.

Rozhodovacie stromy sú široko používané v operačný výskum, konkrétne v rozhodovacej analýze, strategickom plánovaní a hlavne v strojovom učení.

c) Náhodný les

Random Forest je súborová metóda učenia, ktorá pozostáva z veľkého počtu rozhodovacích stromov. Každý rozhodovací strom v náhodnom lese predpovedá výsledok a za výsledok sa považuje predpoveď s väčšinou hlasov.

Náhodný model lesa možno použiť pre regresné aj klasifikačné problémy.

Pre klasifikačnú úlohu sa výsledok náhodného lesa vyberie z väčšiny hlasov. Zatiaľ čo v regresnej úlohe sa výsledok berie z priemeru alebo priemeru predpovedí generovaných každým stromom.

d) Neurónové siete

Neurónové siete sú podmnožinou strojového učenia a sú známe aj ako umelé neurónové siete. Neurónové siete sú tvorené umelými neurónmi a sú navrhnuté spôsobom, ktorý pripomína štruktúru a fungovanie ľudského mozgu. Každý umelý neurón sa spája s mnohými ďalšími neurónmi v neurónovej sieti a takéto milióny prepojených neurónov vytvárajú sofistikovanú kognitívnu štruktúru.

Modely strojového učenia

Neurónové siete pozostávajú z viacvrstvovej štruktúry, ktorá obsahuje jednu vstupnú vrstvu, jednu alebo viac skrytých vrstiev a jednu výstupnú vrstvu. Keďže každý neurón je spojený s iným neurónom, prenáša údaje z jednej vrstvy do druhého neurónu ďalších vrstiev. Nakoniec sa dáta dostanú do poslednej vrstvy alebo výstupnej vrstvy neurónovej siete a generujú výstup.

Neurónové siete závisia od tréningových údajov, aby sa naučili a zlepšili ich presnosť. Dokonale vyškolená a presná neurónová sieť však dokáže rýchlo zoskupiť údaje a stať sa výkonným nástrojom strojového učenia a AI. Jednou z najznámejších neurónových sietí je Algoritmus vyhľadávania Google.

Klasifikácia

Klasifikačné modely sú druhým typom techník supervizovaného učenia, ktoré sa používajú na generovanie záverov z pozorovaných hodnôt v kategorickej forme. Klasifikačný model môže napríklad identifikovať, či je e-mail spam alebo nie; kupujúci si produkt kúpi alebo nie, atď. Klasifikačné algoritmy sa používajú na predpovedanie dvoch tried a kategorizáciu výstupu do rôznych skupín.

Pri klasifikácii je navrhnutý model klasifikátora, ktorý klasifikuje súbor údajov do rôznych kategórií a každej kategórii je priradený štítok.

V strojovom učení existujú dva typy klasifikácií:

    Binárna klasifikácia: Ak má problém iba dve možné triedy, nazývané binárny klasifikátor. Napríklad mačka alebo pes, áno alebo nie,Viactriedna klasifikácia: Ak má problém viac ako dve možné triedy, ide o klasifikátor viacerých tried.

Niektoré populárne klasifikačné algoritmy sú uvedené nižšie:

a) Logistická regresia

Logistická regresia sa používa na riešenie klasifikačných problémov v strojovom učení. Sú podobné lineárnej regresii, ale používajú sa na predpovedanie kategorických premenných. Môže predpovedať výstup buď Áno alebo Nie, 0 alebo 1, Pravda alebo Nepravda, atď. Avšak namiesto udávania presných hodnôt poskytuje pravdepodobnostné hodnoty medzi 0 a 1.

b) Podporte vektorový stroj

Podporný vektorový stroj alebo SVM je populárny algoritmus strojového učenia, ktorý sa široko používa na klasifikačné a regresné úlohy. Konkrétne sa však používa na riešenie klasifikačných problémov. Hlavným cieľom SVM je nájsť najlepšie rozhodovacie hranice v N-rozmernom priestore, ktorý dokáže rozdeľovať dátové body do tried a najlepšia rozhodovacia hranica je známa ako Hyperplane. SVM vyberie extrémny vektor na nájdenie nadroviny a tieto vektory sú známe ako podporné vektory.

Modely strojového učenia

c) Naivný Bayes

Naïve Bayes je ďalší populárny klasifikačný algoritmus používaný v strojovom učení. Nazýva sa tak, pretože je založený na Bayesovej vete a riadi sa naivným (nezávislým) predpokladom medzi vlastnosťami, ktorý je daný ako:

Modely strojového učenia

Každý naivný Bayesov klasifikátor predpokladá, že hodnota špecifickej premennej je nezávislá od akejkoľvek inej premennej/funkcie. Napríklad, ak je potrebné ovocie klasifikovať na základe farby, tvaru a chuti. Takže žltá, oválna a sladká bude uznaná ako mango. Tu je každá funkcia nezávislá od ostatných funkcií.

2. Modely strojového učenia bez dozoru

Modely strojového učenia bez dozoru implementujú proces učenia opačným ako učenie pod dohľadom, čo znamená, že umožňuje modelu učiť sa z neoznačeného súboru údajov o tréningu. Na základe neoznačeného súboru údajov model predpovedá výstup. Pomocou učenia bez dozoru sa model sám bez dozoru učí skryté vzorce zo súboru údajov.

Modely učenia bez dozoru sa používajú hlavne na vykonávanie troch úloh, ktoré sú nasledovné:

    Zhlukovanie
    Klastrovanie je technika učenia bez dozoru, ktorá zahŕňa zoskupovanie alebo tápanie údajových bodov do rôznych zhlukov na základe podobností a rozdielov. Objekty s najväčšou podobnosťou zostávajú v rovnakej skupine a nemajú žiadne alebo len veľmi málo podobností s inými skupinami.
    Klastrovacie algoritmy môžu byť široko používané v rôznych úlohách, ako napr Segmentácia obrazu, Štatistická analýza údajov, Segmentácia trhu , atď.
    Niektoré bežne používané klastrovacie algoritmy sú K-znamená klastrovanie, hierarchické klastrovanie, DBSCAN , atď.
    Modely strojového učenia Učenie sa pravidiel asociácie
    Učenie asociačných pravidiel je technika učenia bez dozoru, ktorá nachádza zaujímavé vzťahy medzi premennými v rámci veľkého súboru údajov. Hlavným cieľom tohto učiaceho sa algoritmu je nájsť závislosť jednej údajovej položky na inej údajovej položke a podľa toho zmapovať tieto premenné tak, aby mohol generovať maximálny zisk. Tento algoritmus sa používa hlavne v Analýza trhového koša, ťažba z používania webu, nepretržitá produkcia , atď.
    Niektoré populárne algoritmy učenia sa asociačných pravidiel sú Apriori algoritmus, Eclat, FP-rastový algoritmus. Zníženie rozmerov
    Počet funkcií/premenných prítomných v súbore údajov je známy ako dimenzionalita súboru údajov a technika použitá na zníženie dimenzionality je známa ako technika znižovania rozmerov.
    Aj keď viac údajov poskytuje presnejšie výsledky, môže to tiež ovplyvniť výkon modelu/algoritmu, ako napríklad problémy s nadmernou montážou. V takýchto prípadoch sa používajú techniky znižovania rozmerov.
    ' Ide o proces konverzie množiny údajov vyšších dimenzií na množinu údajov s menšou dimenziou, ktorá zabezpečuje, že poskytuje podobné informácie .'
    Rôzne metódy redukcie rozmerov, napr ako PCA (analýza hlavných komponentov), ​​dekompozícia singulárnej hodnoty atď.

Posilňovacie učenie

Pri posilňovacom učení sa algoritmus učí akcie pre daný súbor stavov, ktoré vedú k cieľovému stavu. Je to model učenia založený na spätnej väzbe, ktorý prijíma signály spätnej väzby po každom stave alebo akcii prostredníctvom interakcie s prostredím. Táto spätná väzba funguje ako odmena (pozitívna za každú dobrú akciu a negatívna za každú zlú akciu) a cieľom agenta je maximalizovať pozitívne odmeny na zlepšenie ich výkonu.

Správanie modelu v posilňovacom učení je podobné ľudskému učeniu, pretože ľudia sa učia veci skúsenosťami ako spätnou väzbou a interagujú s prostredím.

Nižšie sú uvedené niektoré populárne algoritmy, ktoré patria do posilňovacieho učenia:

    Q-learning:Q-learning je jedným z populárnych bezmodelových algoritmov posilňovacieho učenia, ktorý je založený na Bellmanovej rovnici.

Jeho cieľom je naučiť sa politiku, ktorá môže pomôcť agentovi AI podniknúť najlepšie kroky na maximalizáciu odmeny za konkrétnych okolností. Zahŕňa hodnoty Q pre každý pár stav-akcia, ktoré označujú odmenu za sledovanie danej cesty stavu, a snaží sa maximalizovať hodnotu Q.

    State-Action-Reward-State-Action (SARSA):SARSA je On-policy algoritmus založený na Markovovom rozhodovacom procese. Používa akciu vykonanú aktuálnou politikou na zistenie hodnoty Q. Algoritmus SARSA platí pre State Action Odmena State Action, ktorá symbolizuje n-ticu (s, a, r, s', a'). Deep Q Network:DQN alebo Deep Q Neurónová sieť je Q-learning v rámci neurónovej siete. V podstate sa používa v prostredí veľkého stavového priestoru, kde by definovanie tabuľky Q bolo zložitou úlohou. Takže v takom prípade neurónová sieť používa Q-hodnoty namiesto použitia Q-tabuľky pre každú akciu na základe stavu.

Tréningové modely strojového učenia

Keď je model strojového učenia vytvorený, je trénovaný, aby sa dosiahli vhodné výsledky. Na trénovanie modelu strojového učenia človek potrebuje obrovské množstvo vopred spracovaných dát. Vopred spracované údaje tu znamenajú údaje v štruktúrovanej forme so zníženými hodnotami null atď. Ak neposkytneme predspracované údaje, potom je veľká šanca, že náš model bude fungovať hrozne.

Ako si vybrať najlepší model?

Vo vyššie uvedenej časti sme diskutovali o rôznych modeloch a algoritmoch strojového učenia. Ale jedna najviac mätúca otázka, ktorá môže vzniknúť každému začiatočníkovi, že „aký model si mám vybrať?“. Takže odpoveď je, že to závisí hlavne od obchodnej požiadavky alebo požiadavky projektu. Okrem toho záleží aj na pridružených atribútoch, objeme dostupnej množiny údajov, počte funkcií, zložitosti atď. V praxi sa však odporúča, aby sme vždy začali s najjednoduchším modelom, ktorý je možné aplikovať problém a potom postupne zvyšovať zložitosť a testovať presnosť pomocou ladenia parametrov a krížovej validácie.

Rozdiel medzi modelom strojového učenia a algoritmami

Jednou z najviac mätúcich otázok medzi začiatočníkmi je, že ide o modely strojového učenia a algoritmy sú rovnaké? Pretože v rôznych prípadoch strojového učenia a vedy o údajoch sa tieto dva pojmy používajú zameniteľne.

Odpoveď na túto otázku je Nie a model strojového učenia nie je rovnaký ako algoritmus. Jednoduchým spôsobom, an Algoritmus ML je ako postup alebo metóda, ktorá beží na údajoch, aby z nich objavila vzory a vygenerujte model. Zároveň a model strojového učenia je ako počítačový program, ktorý generuje výstup alebo robí predpovede . Presnejšie povedané, keď trénujeme algoritmus s údajmi, stáva sa modelom.

 Machine Learning Model = Model Data + Prediction Algorithm