A machine learning, vagyis gépi tanulás elsőre bonyolult kifejezésnek tűnhet, pedig az alapötlete meglepően egyszerű. Arról van szó, hogy a számítógépet nem minden egyes lépésre külön programozzuk be, hanem sok adat alapján „megtanítjuk” arra, hogy mintákat ismerjen fel, és ezekből következtetéseket vonjon le. Így képes lehet például megkülönböztetni a spam e-maileket a normál levelektől, ajánlani egy filmet, vagy felismerni egy arcot a fotón.
A gépi tanulás azért lett ennyire fontos, mert ma már hatalmas mennyiségű adat áll rendelkezésre, amit az emberek egyedül nehezen tudnának átlátni. A machine learning ebben segít: gyorsan feldolgozza az adatokat, és idővel egyre pontosabb döntéseket hoz. Fontos azonban tudni, hogy a gép nem úgy „gondolkodik”, mint az ember, hanem statisztikai mintákból dolgozik.
Ebben a cikkben egyszerűen, hétköznapi példákon keresztül nézzük meg, mi az a machine learning, hol találkozunk vele a mindennapokban, milyen fő típusai vannak, és hogyan „tanul” valójában egy gép.
Mit jelent egyszerűen a machine learning?
A machine learning egyszerűen azt jelenti, hogy a számítógép példákból tanul. Nem úgy működik, hogy valaki minden lehetséges helyzetre külön szabályt ír neki, hanem sok adatot kap, és ezek alapján próbál mintákat felfedezni. Ha elég jó példákat lát, később új helyzetekben is tud viszonylag jó döntést hozni.
Vegyünk egy egyszerű példát: szeretnénk, hogy a gép felismerje, melyik képen van kutya. Ahelyett, hogy részletesen megmondanánk neki, milyen a kutya füle, szőre vagy orra, megmutatunk neki rengeteg kutyás és nem kutyás képet. A rendszer ezekből megtanulja, milyen jellemzők utalnak arra, hogy egy képen valóban kutya látható.
Ezért a gépi tanulás lényege röviden az, hogy adatokból tanuló rendszer. Minél jobb minőségű és megfelelő mennyiségű adatot kap, általában annál hasznosabb eredményt tud adni. Ugyanakkor nem varázslat: ha rossz vagy félrevezető adatokból tanul, akkor hibás következtetésekre is juthat.
Hol találkozunk vele a hétköznapokban?
A legtöbben úgy használják a machine learninget nap mint nap, hogy észre sem veszik. Amikor egy videós platform új tartalmakat ajánl, egy webshop termékeket javasol, vagy egy zenehallgató alkalmazás lejátszási listát állít össze, nagyon gyakran gépi tanulási modellek dolgoznak a háttérben. Ezek azt figyelik, mit néztél, mire kattintottál, mit hallgattál, és ezek alapján próbálnak neked releváns ajánlásokat adni.
A levelezőrendszerek spam-szűrői is tipikus példák. A rendszer megtanulja, hogy mely üzenetek hasonlítanak kéretlen reklámokra vagy csalási kísérletekre. Ehhez olyan mintákat vesz figyelembe, mint bizonyos szavak gyakorisága, a feladó jellemzői vagy a levél szerkezete. Így képes kiszűrni sok olyan e-mailt, amit te valószínűleg nem szeretnél a bejövő levelek között látni.
Az okostelefonokban is sok helyen jelen van a machine learning. Ilyen például az arcfelismerés, a beszédfelismerés, a fotók automatikus javítása vagy a prediktív szövegbevitel. Néhány hétköznapi felhasználási terület:
- ajánlórendszerek filmekhez, zenékhez, termékekhez
- spam-szűrés az e-mailekben
- navigációs alkalmazások forgalom-előrejelzése
- hangalapú asszisztensek működése
- banki csalásfelderítés
- közösségi médiás tartalmak rangsorolása
Fő típusai röviden, példákkal és listában
A machine learningnek több fő típusa van, de kezdőként elég három alapfogalmat megérteni. Az első a felügyelt tanulás, amikor a gép címkézett példákból tanul. Ez azt jelenti, hogy az adatokhoz tartozik helyes válasz is. Például sok olyan e-mailt mutatunk neki, amelyekről tudjuk, hogy spam vagy nem spam, és a rendszer ebből megtanulja a különbséget.
A második a felügyelet nélküli tanulás, amikor nincs megadva a helyes válasz, a gépnek magának kell mintákat és csoportokat találnia. Erre jó példa, amikor egy webáruház a vásárlók viselkedése alapján különféle vásárlói csoportokat azonosít. Ilyenkor nem azt mondjuk meg előre, hogy ki melyik csoportba tartozik, hanem a rendszer próbál hasonlóságokat keresni.
A harmadik a megerősítéses tanulás, ahol a gép próbálkozik, és jutalmat vagy büntetést kap a döntései alapján. Ilyen megközelítést használnak például játékokban, robotikában vagy bizonyos optimalizálási feladatoknál. Röviden a fő típusok:
-
Felügyelt tanulás
- címkézett adatokból tanul
- példa: spam-szűrés, árbecslés, képfelismerés
-
Felügyelet nélküli tanulás
- rejtett mintákat, csoportokat keres
- példa: vásárlói szegmentálás, hasonló tartalmak csoportosítása
-
Megerősítéses tanulás
- próbálkozás és visszajelzés alapján fejlődik
- példa: játékot játszó algoritmusok, robotmozgás tanítása
Egyszerű táblázat: hogyan tanul a gép?
A gépi tanulás folyamata leegyszerűsítve úgy képzelhető el, mint amikor valaki sok példán keresztül gyakorol. Először adatokat gyűjtünk, majd ezeket előkészítjük, utána egy modellt „betanítunk” rajtuk. A tanítás során a modell megpróbál minél jobb kapcsolatot találni a bemenetek és a kívánt kimenetek között.
Ezután meg kell nézni, mennyire működik jól a modell új adatokon is. Ez nagyon fontos, mert attól, hogy valami a tanító adatokon jól teljesít, még lehet, hogy a valóságban gyenge lesz. A cél nem az, hogy bemagolja a példákat, hanem az, hogy új esetekben is jól tudjon becslést vagy döntést adni.
Az alábbi táblázat egyszerűen összefoglalja a folyamatot:
| Lépés | Mi történik? | Egyszerű példa |
|---|---|---|
| Adatgyűjtés | A rendszer sok példát kap | E-mailek összegyűjtése |
| Előkészítés | Az adatokat rendezik, tisztítják | Spam és nem spam levelek szétválasztása |
| Tanítás | A modell mintákat keres | Megtanulja, milyen szavak gyakoriak spamnél |
| Tesztelés | Kipróbálják új adatokon | Új e-maileknél ellenőrzik a pontosságot |
| Finomítás | Javítanak a modellen vagy az adatokon | Pontosabb szűrő készül |
| Használat | A rendszer élesben működik | Automatikusan kiszűri a kéretlen leveleket |
Összefoglalva, a machine learning egyszerűen olyan módszer, amelynek segítségével a gépek adatokból tanulnak, és nem kizárólag előre megírt szabályok alapján működnek. Ettől lesznek képesek ajánlani, felismerni, szűrni vagy előre jelezni bizonyos dolgokat. Bár a háttérben komoly matematikai modellek dolgoznak, az alapelv hétköznapi szemmel is érthető: sok példa alapján egyre jobb döntések születnek.
A jövőben valószínűleg még több területen találkozunk majd vele, az egészségügytől kezdve az oktatáson át a közlekedésig. Éppen ezért hasznos legalább alap szinten megérteni, mi az a machine learning egyszerűen, hiszen már most is a digitális életünk egyik fontos része.