A magyar nyelv szempontjából történelmi léptékű kötelezettségvállalást ért el a Gazdasági Versenyhivatal a Microsofttal szemben folytatott eljárásában. A globális technológiai óriásvállalat 10 milliárd magyar szó felhasználásával fejleszti saját AI alapú rendszereit, és az adatokat más fejlesztők számára is ingyenesen hozzáférhetővé teszi.
A Gazdasági Versenyhivatal (GVH) 2023 júliusában indított eljárást a Microsoft Ireland Operations Limited ellen, azt vizsgálva, hogy a vállalat megfelelően tájékoztatta-e a magyar felhasználókat a 2023 februárjában elindított mesterséges intelligencia alapú Bing szolgáltatásáról. A vizsgálat eredményeként a Microsoft átfogó kötelezettségvállalást nyújtott be, amelynek legfontosabb eleme egy legalább 10 milliárd magyar szót tartalmazó adatbázis létrehozása. Az előkészített (tisztított, deduplikált, formázott) adatállományt a cég nemcsak saját AI rendszereibe integrálja, hanem más fejlesztők számára is hozzáférhetővé teszi. Összehasonlításképpen: az OpenAI ChatGPT rendszere mindössze 120-130 millió magyar szóból tanult, ami töredéke a most vállalt korpusznak.
A Microsoft vállalása kiterjed oktatási programok szervezésére is magyar köztisztviselők, KKV-k és fogyasztók számára, amelyek célja a mesterséges intelligencia lehetőségeinek és kockázatainak jobb megértése. Palkovics László mesterséges intelligenciáért felelős kormánybiztos az Indexnek nyilatkozva hangsúlyozta, hogy a magyar nyelvű mesterségesintelligencia-rendszerek fejlesztése nemcsak technológiai kihívás, hanem nemzeti érdek is. Szűts Zoltán egyetemi tanár szerint a döntés kulturális mérföldkő is, mivel a magyar nyelv és kulturális örökség megmaradásához nem csupán magyarul beszélő, de magyarul gondolkodó mesterséges intelligenciára van szükség. A GVH-eljárás eredményeként létrejövő adatbázis jelentősen javíthatja a magyar nyelvű AI-alapú alkalmazások pontosságát és megbízhatóságát, ezzel elősegítve Magyarország digitális szuverenitását.
Források:
1.

2.

3.
