A generatív MI a gépi tanulás (Machine Learning, ML) egyik speciális ágára, mélytanulási algoritmusokra (Deep Learning, DL) támaszkodik, amelyek neurális hálózatokat (Neural Networks) alkalmaznak az adatokban rejlő mintázatok felismerésére és hasznosítására. A jelentős mennyiségű adat feldolgozása révén ezek az algoritmusok képesek a meglévő tudás szintetizálására és annak kreatív alkalmazására. Ezáltal a generatív MI olyan természetesnyelv-feldolgozási (Natural Language Processing, NLP) feladatok elvégzésére használható (Yenduri et al. 2024, 54609), mint például az érzelmek felismerése, szövegek összegzése, több szövegforrás összehasonlítása szemantikai hasonlóság szempontjából, új szövegek generálása.
A generatív MI-nek nincs egy általánosan elfogadott definíciója, gyakran gyűjtőfogalomként funkcionál. Bár technikailag minden olyan modellt, amely valamilyen kimenetet generál, generatívnak lehet tekinteni, az MI-kutatóközösség gyakran fenntartja a kifejezést olyan összetett modellek számára, amelyek magas színvonalú, az ember által generálthoz hasonló tartalmakat hoznak létre (García-Peñalvo & Vázquez-Ingelmo 2023, 7). A generatív MI olyan MI technikák és modellek összessége, amelyet arra fejlesztettek, hogy megtanulja egy adatállomány rejtett, mögöttes struktúráját és új adatpontokat generáljon, amelyek valószínűleg illeszkednének az eredeti adatállományba (Pinaya et al. 2023, 2). A generatív MI elsősorban generatív modellezésen (a bemenetek és kimenetek együttes eloszlásának meghatározása) alapul, amely célja, hogy valamilyen tényleges adateloszlásra következtessen.
Egy generatív mesterséges intelligencia rendszer magában foglalja a teljes infrastruktúrát, beleértve a modellt, az adatfeldolgozást és a felhasználói felület komponenseit. A modell a rendszer központi komponenseként szolgál, amely megkönnyíti az interakciót és az alkalmazást (Feuerriegel et al. 2024, 112). A generatív MI fogalma tehát túllép a generatív modellek tisztán technikai alapjain, és magában foglalja az egyes AI-rendszerek további, funkcionálisan releváns jellemzőit (Feuerriegel et al. 2024). A szakirodalom jelenlegi állása szerint, tágabb kontextusban a generatív MI kifejezést általában a kézzelfogható szintetikus tartalom MI-alapú eszközökkel történő létrehozására használjuk (García-Peñalvo & Vázquez-Ingelmo 2023, 14). Szűkebb értelemben az MI-kutatóközösség elsősorban a generatív alkalmazásokat vizsgálja a felhasznált modellekre összpontosítva és nem feltétlenül sorolják munkájukat a generatív MI kifejezés alá (Ronge, Maier, & Rathgeber 2024, 1).
Összefoglalva, a generatív MI a mesterséges intelligencia egy speciális ága, amely fejlett gépi tanulási technikákat, különösen neurális hálózatokra épülő mély tanulási modelleket, például transzformátor architektúrákat használ. A transzformátor architektúrákon belül helyezkednek el a nagy nyelvi modellek (Large Language Models, LLMs), amelyek hatalmas nyelvi adathalmazokon előtanultak, lehetővé téve a generatív MI számára, hogy új, korábban nem látott szintetikus tartalmakat állítson elő különböző formákban, valamint támogatást nyújtson különféle feladatokhoz generatív modellezéssel. Ennek a felépítésnek a szemléltetéséhez lásd az alábbi ábrát.
Felhasznált irodalom:
1.Feuerriegel, Stefan, Jochen Hartmann, Christian Janiesch, and Patrick Zschech. 2024. ‘Generative AI’. Business & Information Systems Engineering 66 (1): 111–26. doi:10.1007/s12599-023-00834-7 – ^ Vissza
2. García-Peñalvo, Francisco, and Andrea Vázquez-Ingelmo. 2023. ‘What Do We Mean by GenAI? A Systematic Mapping of The Evolution, Trends, and Techniques Involved in Generative AI’. International Journal of Interactive Multimedia and Artificial Intelligence 8 (4): 7. doi:10.9781/ijimai.2023.07.006 – ^ Vissza
3. Pinaya, Walter H. L., Mark S. Graham, Eric Kerfoot, Petru-Daniel Tudosiu, Jessica Dafflon, Virginia Fernandez, Pedro Sanchez, et al. 2023. ‘Generative AI for Medical Imaging: Extending the MONAI Framework’. arXiv. doi:10.48550/ARXIV.2307.15208 – ^ Vissza
4. Ronge, Raphael, Markus Maier, and Benjamin Rathgeber. 2024. ‘Defining Generative Artificial Intelligence: An Attempt to Resolve the Confusion about Diffusion’. (Kézirat). ^ Vissza
5. Varga, László, and Yulia Akhulkova. 2023. ‘The Language AI Alphabet: Transformers, LLMs, Generative AI, and ChatGPT’. Nimdzi. https://www.nimdzi.com/the-language-ai-alphabet-transformers-llms-generative-ai-and-chatgpt/ – ^ Vissza
6. Yenduri, Gokul, M. Ramalingam, G. Chemmalar Selvi, Y. Supriya, Gautam Srivastava, Praveen Kumar Reddy Maddikunta, G. Deepti Raj, et al. 2024. ‘GPT (Generative Pre-Trained Transformer)— A Comprehensive Review on Enabling Technologies, Potential Applications, Emerging Challenges, and Future Directions’. IEEE Access 12: 54608–49. doi:10.1109/ACCESS.2024.3389497 – ^ Vissza