Mi az arcfelismerés, és hogyan működik?
Az arcfelismerés technológiája mára hétköznapi fogalommá vált – elég csak a telefonunk feloldására vagy a reptéri beléptetőkapukra gondolni. De mit jelent pontosan az „arcfelismerés”? És hogyan jut el egy rendszer odáig, hogy felismerje az arcunkat? Ebben a blogposztban bemutatjuk, hogyan működik a kép- és videóalapú arcfelismerés a gyakorlatban.
Nem minden arcfelismerés ugyanaz
Elsőként érdemes tisztázni: az arcfelismerés nem egy egységes módszer, hanem egy technológiai eszköztár, többféle eszközzel és megközelítési móddal.
Hogyan történik az arcfelismerés?
- Egyszerű kép alapú arcfelismerés: csak egyetlen képkockával dolgozik – ez lehet egy fotó vagy egy videó pillanatképe. Gyors, de érzékeny a minőségre és a külső körülményekre (pl. fényviszonyok, elforduló arc).
- Videóból több képre építő megközelítés: a rendszer nem egy képkockát használ, hanem egy rövid videórészletet, így több arcpozícióból, szögből dolgozik. Ezáltal a körülményekre kevésbé lesz érzékeny a módszer, továbbá lehetővé teszi az élőség detektálását is – azaz, hogy élő emberrel van-e dolgunk, nem egy fényképpel.
- 3D vagy lidar-alapú arcfelismerés: például az iPhone-ok Face ID rendszere, amely nemcsak a kameraképet, hanem a mélységi információkat is feldolgozza. Ez a technológia különösen biztonságos, de hardverigényes.
A kép- és videóalapú arcfelismerés folyamata
A legtöbb kereskedelmi és ipari megoldás ma kamera alapú arcfelismerést használ. Ennek a működése a következő néhány lépésben írható le:
1. Arcdetektálás: a rendszer először megtalálja az arcokat a képen – több is lehet, akár mozgásban is.
2. Arc kivágása és igazítása: az adott arcot kiemeli, elforgatja, méretarányosítja, hogy standard formátumot kapjunk (pl. egyenes nézet).
3. Arclenyomat kinyerése: az előkészített arc alapján a rendszer egy ún. arclenyomatot készít (ami technikai kifejezéssel egy embedding). Az arclenyomat egy számhalmaz – egy jellemzőket tartalmazó vektor, amit az algoritmus készít az arc alapján. Emberi szemmel ez nem értelmezhető, de a rendszer számára ez az arc egyedi „ujjlenyomata”.

Az arcfelismerés folyamata: arc detektálása, kivágása és átalakítása, majd mély neurális hálózattal arclenyomattá alakítása. Az arclenyomatok programokkal már összehasonlítható és osztályozható adatok. (forrás)
Ez az arclenyomat azokat az arcra jellemző adatokat tartalmazza, amit a program fontosnak gondol ahhoz, hogy az azonosítás megtörténhessen. Azaz az adott személy fotóinál az arclenyomatok egymásra inkább hasonlítsanak, míg más személytől pedig inkább különbözőek legyenek.
Egy ilyen lenyomat például így nézhet ki:
[0.12, -0.85, 0.46, …, 1.03]
Ez a sorozat akár több száz számot is tartalmazhat, jellemzően pl. 128, 256 vagy 512 hosszúságúak szoktak lenni, és minden egyes arcra más és más lesz, még akkor is, ha a fényképek csak egy kicsit térnek el egymástól. Így elérhető az a cél, hogy ezek között az arclenyomatok között tudjunk összehasonlítást végezni, ami az azonosítás kulcs lépése.
A következő részben azt vizsgáljuk meg, hogyan használhatjuk, s mire, például üzleti környezetben.
Szolgáltatásodban szívesen használnál arcfelismerést? Ismerd meg VeriDome szolgáltatásunkat, és engedd meg, hadd vegyük fel veled a kapcsolatot!
