Saját részvételű cikkek listája
(ERPA)
Dávid Gégény, Sándor Radeleczki: Analysis of the Maximal Pattern Mining method and its variants, Production Systems and Information Engineering 10. pp. 99-113, (2022).
A feladat és a munka rövid ismertetése
Az ERPA projekt keretében megadott kutatási célok közül a feladatom az alábbi pontokhoz kapcsolódott:
A klasszikus (nem NN alapú) mintafeltáró módszerek (pl. alfa-módszer) elemzése és rendszerezése.
A gyakori műveletsorok feltárása a tevékenységnapló adatai alapján. A feltárandó tevékenység folyamnál meg kellett határozni:
• a vezérlés fő ágát (a fő tevékenységsort),
• a lehetséges elágazásokat,
• a gyakorisági paramétereket,
• a „triggerelési” műveleti elemeket.
A gráf/hálózat alapú folyamatfeltárás területén az alábbi feladatokkal foglalkoztam:
• Kutatási feladatok ellátása a gráf, háló és automata alapú folyamatfeltárás és folyamatvalidáció területen;
• Az automata alapú módszer adaptálása valós eseménysor szekvenciák esetére;
• Kísérletek elvégzése a kidolgozott modell hatékonyságának az elemzésére elemi és összetett szekvenciák esetén;
• A kidolgozott automata alapú folyamatfeltárási módszer tulajdonságainak az értékelése;
• Az elvégzett automata-elemzések és értékelések dokumentálása, rendszeres beszámolás az elvégzett feladatokról és tevékenységekről.
A Maximal Pattern Mining algoritmus elemzése során a 2006-ban megjelent cikkben nem részletezett lépéseket is külön megvizsgáltuk, ezáltal tökéletesítve magát az algoritmust. Az implementáció Python nyelven történt, az algoritmus fő célja pedig az eseménynaplóban található nyomokban található minták feltárása. A minták egyszerű eseményekből, hurkokból, párhuzamos eseményekből és opcionális (alternatív) eseménysorozatokból állhatnak. Az algoritmus eredményeképpen az eseménynaplóhoz tartozó maximális mintákat és a hozzájuk tartozó véges automatákat kapjuk meg. Az algoritmus hatékonyságát, alkalmazhatóságát többféle módon is ellenőriztük, mindegyik tesztet a k-szoros keresztvalidáció módszerével végrehajtva. Megvizsgáltuk, hogy új (eddig ismeretlen) nyomok milyen mértékben illeszkednek megfelelően a meghatározott mintákra. Továbbá azt is ellenőriztük a tesztekkel, hogy a kapott mintákból generált nyomok mennyire vannak átfedésben a teszthalmazban szereplő nyomokkal. Ezen felül azt is vizsgáltuk, hogy a generált nyomokból előállított minták mennyire hasonlítanak az eredeti mintákhoz. A tesztelési eredmények számszerűsítésére többféle mérőszámot is alkalmaztunk, pl. Precision, Recall, Accuracy, F-measure.
Javasolt irodalom a szakmai háttér áttekintéséhez
[1] van der Aalst, W.M.P.: Process Mining: Overview and Opportunities, ACM Transactions on Management Information Systems, 2012, vol. 3, no. 2, article 7.
[2] Agrawal, R., Gunopulos, D., Leymann, F.: Mining process models from workflow logs, in: Proceedings of the 6th International Conference on Extending Database Technology (EDBT'98), 1998, LNCS 1377, pp. 469-483.
[3] Cook, J., Wolf, A.: Discovering models of software processes from event-based data, ACM Transactions on Software Engineering and Methodology, 1998 (7), pp. 215–249.
[4] Datta, A.: Automating the discovery of AS-IS business process models: probabilistic and algorithmic approaches, Information Systems Research, 1998, vol. 9, pp. 275–301.
[5] Mannila, H., Meek, C.: Global partial orders from sequential data, in: Proceedings of the 6th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD ’00), 2000, pp. 161–168.
[6] van der Aalst, W.M.P., Weijters, A.J.M.M., Maruster, L.: Workflow mining: discovering process models from event logs, IEEE Transactions on Knowledge and Data Engineering, 2004, vol. 16, pp. 1128–1142.
[7] Alves de Medeiros, A.K., van Dongen, B.F., van der Aalst, W.M.P. and Weijters, A.J.M.M.: Process Mining: Extending the Alpha-Algorithm to Mine Short Loops, BETA Working Paper Series, TU Eindho- ven, 2004, vol. 113.
[8] Wen, L., Wang, J., van der Aalst, W.M.P., Huang, B., Sun, J.: A novel approach for process mining based on event types, Journal of Intelligent Information Systems, 2009, vol. 32, pp. 163–190.
[9] Weijters, A.J.M.M., van der Aalst, W.M.P., Alves de Medeiros, A.K.: Process Mining with the Heuristics Miner algorithm, BETA Working Paper Series, 2006, TU Eindhoven, vol. 166.
[10] Günther, C.W., van der Aalst, W.M.P.: Fuzzy mining - adaptive process simplification based on multi-perspective metrics, in: Proceedings of the 5th
[11] International Conference on Business Process Management (BPM), 2007, LNCS 4714, pp. 328–343.
[12] Graves, A. (2013). Generating sequences with recurrent neural network,.arXiv preprint arXiv:1308.0850.
[13] Folino, F., Greco, G., Guzzo, A., Pontieri, L.: Discovering expressive process models from noised log data, in: Proceedings of the 2009 International Database Engineering & Applications Symposium, 2009, ACM, pp.162–172.
[14] Islam, M. S., Mousumi, S. S., Abujar, S.,and Hossain, S. A. (2019). Sequence-to-sequence Bangla sentence generation with LSTM recurrent neural networks. Procedia Computer Science, 152, 51-58.
[15] Ferreira, H., Ferreira, D.: An integrated life cycle for workflow management based on learning and planning, International Journal of Cooperative Information Systems, 2006, vol. 15, pp. 485–505.
[16] Burattin, A., and Sperduti, A. (2010, September). PLG: a framework for the generation of business process models and their execution logs. In International Conference on Business Process Management (pp. 214-219). Springer, Berlin, Heidelberg.
[17] Liesaputra, V., Yongchareon, S., and Chaisiri, S.: (2016, Sept.) Efficient process model discovery using maximal pattern mining. In International Conference on Business Process Management, pp. 441-456), Springer, Cham.
[18] Alves de Medeiros, A.K., Weijters, A.J.M.M., van der Aalst, W.M.P.: Genetic process mining: an experimental evaluation, Data Mining and Knowledge Discovery, 2007, vol. 14, pp. 245–304.
[19] Oncina, J., García, P., and Vidal, E. (1993). Learning subsequential transducers for pattern recognition interpretation tasks, IEEE Transactions on Pattern Analysis and Machine Intelligence,15(5), 448-458 .
[20] Sutskever, I., Martens, J., and Hinton, G. E.: Generating text with recurrent neural networks. In ICML (2011, Jan.)
[21] Kuo, C. Y., & Chien, J. T. (2018, September). Markov recurrent neural networks. In 2018 IEEE 28th International Workshop on Machine Learning for Signal Processing (MLSP) (pp. 1-6). IEEE.
[22] van der Aalst, W.M.P., Rubin, V., Verbeek, H.M.W., van Dongen, B.F., Kindler, Günther, C.W.: Process mining: a two-step approach to balance between underfitting and overfitting, Software and System Modeling, 2010 (9), pp. 87–111.
[23] Hoschele, M. and Zeller, A. (2017, May): Mining input grammars with AUTOGRAM. In 2017 IEEE/ACM 39th International Conference on Software Engineering Companion (pp. 31-34). IEEE.
[24] Hanga, K.M., Kovalchuk, Y.,and Gaber, M.M. (2020). A Graph-Based Approach to Interpreting Recurrent Neural Networks in Process Mining.IEEE Access,8, 172923-172938.
[25] Yunhao, T. Agrawal, S. and Faenza. S. Reinforcement learning for integer programming: Learning to ’’cut". International Conference on Machine Learning. PMLR, 2020.
[26] Agrawal, S. IEOR 8100: Reinforcement learning lectures.
[27] Skansi, S. (2018). Introduction to Deep Learning: from logical calculus to artificial intelligence. Springer.
[28] Ritter, G. X., and Urcid, G. (2021). Introduction to Lattice Algebra: With Applications in AI, Pattern Recognition, Image Analysis, and Biomimetic Neural Networks.
[29] .Antunes, C., & Oliveira, A. (2002, July). Using context-free grammars to constrain apriori-based algorithms for mining temporal association rules. In Proc. Workshop on Temporal Data Mining.
or reload the browser