EN

A Microsoft 10 milliárd magyar szóval fejleszti MI rendszereit és az adatokat ingyenesen megosztja a GVH eljárása nyomán

A Microsoft 10 milliárd magyar szóval fejleszti MI rendszereit és az adatokat ingyenesen megosztja a GVH eljárása nyomán
Source: Tyler Lahti, CC BY-SA 4.0 https://creativecommons.org/licenses/by-sa/4.0, via Wikimedia Commons

A magyar nyelv szempontjából történelmi léptékű kötelezettségvállalást ért el a Gazdasági Versenyhivatal a Microsofttal szemben folytatott eljárásában. A globális technológiai óriásvállalat 10 milliárd magyar szó felhasználásával fejleszti saját AI alapú rendszereit, és az adatokat más fejlesztők számára is ingyenesen hozzáférhetővé teszi.

A Gazdasági Versenyhivatal (GVH) 2023 júliusában indított eljárást a Microsoft Ireland Operations Limited ellen, azt vizsgálva, hogy a vállalat megfelelően tájékoztatta-e a magyar felhasználókat a 2023 februárjában elindított mesterséges intelligencia alapú Bing szolgáltatásáról. A vizsgálat eredményeként a Microsoft átfogó kötelezettségvállalást nyújtott be, amelynek legfontosabb eleme egy legalább 10 milliárd magyar szót tartalmazó adatbázis létrehozása. Az előkészített (tisztított, deduplikált, formázott) adatállományt a cég nemcsak saját AI rendszereibe integrálja, hanem más fejlesztők számára is hozzáférhetővé teszi. Összehasonlításképpen: az OpenAI ChatGPT rendszere mindössze 120-130 millió magyar szóból tanult, ami töredéke a most vállalt korpusznak.

A Microsoft vállalása kiterjed oktatási programok szervezésére is magyar köztisztviselők, KKV-k és fogyasztók számára, amelyek célja a mesterséges intelligencia lehetőségeinek és kockázatainak jobb megértése. Palkovics László mesterséges intelligenciáért felelős kormánybiztos az Indexnek nyilatkozva hangsúlyozta, hogy a magyar nyelvű mesterségesintelligencia-rendszerek fejlesztése nemcsak technológiai kihívás, hanem nemzeti érdek is. Szűts Zoltán egyetemi tanár szerint a döntés kulturális mérföldkő is, mivel a magyar nyelv és kulturális örökség megmaradásához nem csupán magyarul beszélő, de magyarul gondolkodó mesterséges intelligenciára van szükség. A GVH-eljárás eredményeként létrejövő adatbázis jelentősen javíthatja a magyar nyelvű AI-alapú alkalmazások pontosságát és megbízhatóságát, ezzel elősegítve Magyarország digitális szuverenitását.

Források:

1.

Magyarul tanítja a Microsoft a mesterséges intelligenciát a GVH eljárása miatt – Jogászvilág
A globális technológiai óriásvállalat 10 milliárdnyi magyar szó felhasználásával fejleszti saját MI alapú rendszereit, és az adatokat más fejlesztők számára is ingyenesen hozzáférhetővé teszi.

2.

Váratlan magyar AI-siker, ami mindent megváltoztat
Palkovics László szerint ami technológiai kihívást jelent, az most nemzeti érdek is egyben.

3.

Kitűnőre vizsgázna magyarból a Microsoft
Noha nem feltétlenül ez volt az eredeti cél, jelentős mértékben javulhat a magyar nyelvű találatok nyelvi pontossága a Microsoft AI-alapú rendszereiben egy versenyhatósági vizsgálat folyományaként.