EN

A Cloudflare azzal vádolja a Perplexity AI-t, hogy megszegte a weboldalak tartalomgyűjtést tiltó védelmi szabályait

A Cloudflare azzal vádolja a Perplexity AI-t, hogy megszegte a weboldalak tartalomgyűjtést tiltó védelmi szabályait
Forrás: unsplash - Markus Winkler

A Cloudflare 2025 augusztusában közzétett jelentésében azzal vádolta meg a Perplexity AI-t, hogy szándékosan kijátszotta a weboldalak tartalomgyűjtést tiltó védelmi rendszereit és technikai korlátozásait, amelyek célja, hogy megakadályozzák tartalmaik AI-képzési célú felhasználását. A vállalat három hónap alatt több mint 32 ezer oldalon azonosított gyanús tevékenységet. A Perplexity botjai álcázott digitális azonosítókkal és közvetítő szerverekkel férhettek hozzá olyan tartalmakhoz is, amelyeket a tulajdonosok kifejezetten letiltottak, beleértve a fizetőfal mögötti anyagokat. Ez különösen aggasztja a kiadókat, akik üzleti modellje a prémium tartalmak értékesítésére épül.

A jelentés szerint a problémás adatgyűjtés közvetlenül a Perplexity Pro Search áprilisi bevezetése után ugrott meg. Májusban a botok naponta átlagosan 1,7 millió tiltott oldalt látogattak meg. A Cloudflare júniusban bevezetett új védelmi rendszere 119 millió jogosulatlan próbálkozást blokkolt, ezekből 78 milliót a Perplexity botjai kezdeményeztek. A Perplexity a vádakat tagadja, de új technológiai igazgatója, Mike Schroepfer augusztus elején elismerte, hogy előfordulhattak technikai hibák, és átfogó vizsgálatot ígért, valamint egy egyszerűbb tiltórendszer bevezetését javasolta a kiadók számára.

Az ügy jól mutatja az AI tanítóadatok gyűjtésével kapcsolatos szabályozási hiányosságokat. Számos nagy kiadó – köztük a New York Times, a The Guardian és a Washington Post – megerősítette, hogy a Perplexity a tiltások ellenére is hozzáfért tartalmaikhoz. Mindez illeszkedik a tágabb iparági konfliktusba, amelyben a tartalomtulajdonosok jogi úton is egyre gyakrabban lépnek fel az AI-vállalatokkal szemben. Bár a Perplexity júliusban már 15,2 millió havi aktív felhasználót ért el, a botrány komoly reputációs kockázatot jelent számára, különösen az adatvédelem és AI-etika fokozódó jelentősége mellett.

Források:

Cloudflare Accuses Perplexity of Bypassing Anti-Scraping Rules - Futureweek
Cloudflare has accused AI startup Perplexity of scraping website content without permission and is bypassing crawler blocks.
Cloudflare vs Perplexity: The Battle Over AI Web Scraping Heats Up
Cloudflare vs Perplexity exposes AI scraping controversy, sparking paywalled content, publisher mistrust, and shifting web monetization
Perplexity accused of scraping websites that explicitly blocked AI scraping | TechCrunch
Internet giant Cloudflare says it detected Perplexity crawling and scraping websites, even after customers had added technical blocks telling Perplexity not to scrape their pages.