A Cloudflare 2025 augusztusában közzétett jelentésében azzal vádolta meg a Perplexity AI-t, hogy szándékosan kijátszotta a weboldalak tartalomgyűjtést tiltó védelmi rendszereit és technikai korlátozásait, amelyek célja, hogy megakadályozzák tartalmaik AI-képzési célú felhasználását. A vállalat három hónap alatt több mint 32 ezer oldalon azonosított gyanús tevékenységet. A Perplexity botjai álcázott digitális azonosítókkal és közvetítő szerverekkel férhettek hozzá olyan tartalmakhoz is, amelyeket a tulajdonosok kifejezetten letiltottak, beleértve a fizetőfal mögötti anyagokat. Ez különösen aggasztja a kiadókat, akik üzleti modellje a prémium tartalmak értékesítésére épül.
A jelentés szerint a problémás adatgyűjtés közvetlenül a Perplexity Pro Search áprilisi bevezetése után ugrott meg. Májusban a botok naponta átlagosan 1,7 millió tiltott oldalt látogattak meg. A Cloudflare júniusban bevezetett új védelmi rendszere 119 millió jogosulatlan próbálkozást blokkolt, ezekből 78 milliót a Perplexity botjai kezdeményeztek. A Perplexity a vádakat tagadja, de új technológiai igazgatója, Mike Schroepfer augusztus elején elismerte, hogy előfordulhattak technikai hibák, és átfogó vizsgálatot ígért, valamint egy egyszerűbb tiltórendszer bevezetését javasolta a kiadók számára.
Az ügy jól mutatja az AI tanítóadatok gyűjtésével kapcsolatos szabályozási hiányosságokat. Számos nagy kiadó – köztük a New York Times, a The Guardian és a Washington Post – megerősítette, hogy a Perplexity a tiltások ellenére is hozzáfért tartalmaikhoz. Mindez illeszkedik a tágabb iparági konfliktusba, amelyben a tartalomtulajdonosok jogi úton is egyre gyakrabban lépnek fel az AI-vállalatokkal szemben. Bár a Perplexity júliusban már 15,2 millió havi aktív felhasználót ért el, a botrány komoly reputációs kockázatot jelent számára, különösen az adatvédelem és AI-etika fokozódó jelentősége mellett.
Források:


