Az ERPA azaz a 2020-1.1.2-PIACI-KFI-2020-00165 projekt a Miskolci Egyetem Gépészmérnöki és Informatikai Karának Informatikai és Matematikai Intézeteiben végzett projekt.
Az adminisztratív és informatikai folyamatoknál a hatékonyság növelés egyik fő eszköze a folyamatautomatizálás minél szélesebb körben történő megvalósítása. A robotizált folyamat automatizálás (RPA, Robotic Process Automation) célja az üzleti folyamatok magas szintű automatizálása szoftverrobotok (botok) létrehozásával és futtatásával. Az ilyen robotok a nagy volumenű, ismétlődő feladatokat nagyobb pontossággal és hatékonysággal végzik el, mint az ember. Az RPA eszközöket a rutinfeladatok automatizálására tervezték, amelyek strukturált adatokat tartalmaznak és amelyeknek determinisztikus eredményei vannak, a végrehajtandó lépéseket pedig szabályok vezérlik. Emellett fontos jellemzőjük, hogy az RPA eszközök képesek felhasználói interakciókat végrehajtani az ezzel járó adatkezelési műveletekkel együtt. A robotizált folyamatbányászat (RPM, Robotic Process Mining) célja az automatizálható folyamatok feltárása gépi tanulási eszközökkel. A folyamat bányászó módszerek kifejlesztése egy egyelőre nagyrészt még felderítetlen problémakör. Az egyik legígéretesebb megközelítési módszer a tevékenységnaplók alapján történő eseményfeltárás.
A projekten dolgozó kutató csapatnak több főbb feladatkört is le kellett fednie. Egyrészt meg kellett vizsgálnia, hogy az egyes eseménynapló modell formátumok milyen mértékben alkalmasak az igényelt információk kiemelésére. A második részproblémakör a rugalmas napló előfeldolgozó keretrendszer kidolgozása volt, mely a különböző formátumú napló állományokat egy egységes objektum szerkezetre hozza. A harmadik lépés az esemény gráf sémák feltárásának klasszikus, automata alapú módszerének a kidolgozása volt. Ennek során új funkciók kerültek be az alap eljárásba, jelentősen növelve annak hatékonyságát. Mivel a kutatás egy további célja a neurális háló alapú séma feltárás elemzése volt, itt elsőként a klasszikus eseménysor előre jelző neurális hálók értékelését végeztük el. Az eredmények alapján az MLP és LSTM hálók kerültek kiválasztásra a további vizsgálatokhoz. A kutatás egy további fázisában olyan új neurális háló architektúra és feldolgozási modell került kidolgozásra, amely már alkalmas az XOR és AND típusú séma elágazások felderítésére is. A projekt keretében emellett, a következő időszak kutatásait előkészítendő, elemzéseket végeztünk a GAN hálótípus alkalmazhatóságára és a magyar nyelvű szöveget tartalmazó dokumentumok NLP alapú témakör azonosítására vonatkozólag is. A projekt keretében kidolgozott mintarendszereket Python nyelven fejlesztettük ki.
A projekt lehetőséget adott egy hatékonyan együttműködö csapat kiépítésére is, amely több különböző szakterület képviselőit fogja össze. A csoport tagjai:
Dr. Baksáné dr. Varga Erika, kutatási terület: adatelemzés, adatbányászat
Csépányi Fürjes László, kutatási terület: számítógépes nyelvészet
Dr. Kovács László, kutatási terület: adatbányászat, szemantikai modellek
Dr. Mileff Péter, kutatási terület: szoftverfejlesztés, adatelemzés
Dr. Radeleczki Sándor, kutatási terület: automaták, logika
Dr. Samad Dadvandipour, kutatási terület: adatelemzés, adatbányászat
A különböző szakterületek képviselőinek együttműködése számos érdekes megközelítést bontakoztatott ki.