Nieuws SEO en generatieve AI: in een 'parasitaire relatie'

Er zijn berichten verschenen dat het AI-onderzoekslaboratorium OpenAI nieuwsberichten van media zoals de Wall Street Journal en CNN gebruikt om zijn ChatGPT-chatbot te trainen. Dit roept de vraag op hoe mediakanalen verkeer, inkomsten en relevantie kunnen behouden in het tijdperk van generatieve AI.

Journalisten zijn al lang bezorgd over AI-gegenereerd nieuws. In 2016 gaf de Britse Press Association aan AI te willen gebruiken voor bepaalde sport- en verkiezingsverhalen. In de VS zijn er recentere voorbeelden te zien, zoals deze NHL-roundup van de Associated Press, samengesteld met technologie van sportcontentautomatiseringsbedrijf Data Skrive.

De CEO van mediabedrijf Axel Springer, eigenaar van titels als Business Insider en Politico, heeft onlangs gezegd dat AI journalisten volledig kan vervangen. Naar verluidt schreef Springer in een brief aan werknemers dat alleen degenen die de beste originele inhoud creëren, zullen overleven.

Onbekende problemen met auteursrechten

Er zijn al problemen opgedoken rondom auteursrechten en potentiële juridische problemen in Frankrijk en Spanje, zo blijkt uit een artikel over OpenAI’s gebruik van nieuwsberichten om zijn ChatGPT-chatbot te trainen. Marcus Tober, senior vice-president van enterprise solutions bij marketingplatform Semrush, zegt dat als OpenAI zijn model wil verbeteren met actuele inhoud zonder verkeer naar de oorspronkelijke bron te sturen, er een debat zal ontstaan over wie de rechten heeft op de inhoud. OpenAI heeft al enkele auteursrechtschendingen gezien en het hoofd van SEO bij sportweddenschappenplatform Betsperts Media and Technology Group, Dan Smullen, zegt dat we binnenkort meer kunnen verwachten.

Hij voegt eraan toe dat ondanks het feit dat sommige uitgevers AI-ondersteunde inhoud zijn gaan gebruiken in de nieuwsredactie, redactieteams het gebruik van de output van OpenAI niet comfortabel vinden vanwege de onbekende auteursrechtproblemen.

OpenAI heeft stappen genomen om deze bezorgdheid aan te pakken, zoals het toestaan van uitgevers om zich af te melden voor het gebruik van hun inhoud en het geven van attributie wanneer zijn algoritmen informatie van nieuwssites schrapen. Toch maken SEO’s in de mediabranche zich zorgen dat dit systeem mogelijk niet voldoende beschermt tegen auteursrechtelijke en intellectuele eigendomskwesties. Daarom zouden nieuwsorganisaties het gebruik van nieuwsgegevens door OpenAI moeten blijven volgen en ervoor moeten zorgen dat hun inhoud op verantwoorde wijze wordt gebruikt.

Een mogelijke oplossing zou zijn om voetnoten toe te voegen die linken naar bronnen, vergelijkbaar met wat ChatGPT doet in Bing. Volgens Smullen kunnen we iets soortgelijks verwachten met Google’s conversatie-AI-service Bard.

Verval van de waarheid

De opkomst van AI in de nieuwsindustrie zou uiteindelijk de consumptie van nieuws kunnen verstoren en de controle die nieuwsorganisaties decennialang hebben gehad, bedreigen, aldus Ben Poulton, SEO-consultant en oprichter van het SEO-bureau Intellar. Volgens Poulton zouden bedrijven die AI gebruiken om geschraapte gegevens te verzamelen, een bedreiging vormen voor de gecureerde controle van nieuwsorganisaties, wat kan leiden tot een verdere aantasting van de journalistieke integriteit.

Dan Smullen, hoofd SEO bij Betsperts Media and Technology Group, voegde toe dat een gebrek aan compensatie voor trainingsgegevens kan leiden tot een toekomst waarin uitgevers OpenAI en andere AI-tools blokkeren, wat op zijn beurt kan leiden tot een groter probleem met nepnieuws en de verspreiding van onjuiste en bevooroordeelde informatie. Om dit te voorkomen, roept Smullen op tot compensatie van uitgevers voor hun cruciale rol in de nieuwsindustrie.

Cameron Conaway, een voormalig onderzoeksjournalist, is het daarmee eens en vraagt zich af of dit het verval van de waarheid en het wantrouwen van de samenleving in legitieme nieuwsbronnen kan verdiepen. Hij vraagt zich ook af welke impact dit kan hebben op de democratie als de meeste informatie bronloos is en wie dan de macht zal hebben.

Desastreuze implicaties

Barry Adams, gespecialiseerd SEO-consultant bij SEO-bedrijf Polemic Digital, merkt echter op dat generatieve AI-systemen het nieuws niet kunnen voorspellen, dus hij voorziet geen onmiddellijke problemen. Hij gelooft dat AI de journalistiek niet zal vervangen als het gaat om het verslaan van het nieuws, het onderzoeken van verhalen en het ter verantwoording roepen van de macht.

Gevolgen van AI voor lokale nieuwsberichtgeving Aan de andere kant zou AI lokale nieuwsberichten kunnen herformuleren zonder citaten terwijl het zijn eigen versies uitspuugt.

Dit zou op zijn beurt het verkeer en de daarmee samenhangende inkomsten van nieuwssites wegnemen, wat bijzonder schadelijk is voor lokale nieuwssites die vooral afhankelijk zijn van advertentieverkeer, aldus Conaway. Bovendien kan herformulering de oorspronkelijke betekenis van de berichtgeving veranderen. Conaway waarschuwt voor de combinatie van schraperige en financieel kwetsbare lokale nieuwsredacties, algemene mediamijding en wantrouwen en de opkomst van AI als primaire bron.

Mogelijke voordelen van AI voor nieuwsorganisaties “Aan de positieve kant voor nieuwsorganisaties: mensen zullen altijd nieuws consumeren.

Het is alleen het medium dat verandert,” zei Poulton. Hij gelooft dat als ChatGPT bijvoorbeeld vijf verhalen over hetzelfde onderwerp van vijf verschillende outlets in vijf seconden kan samenvatten, dit een goed product zou zijn. ChatGPT zou mogelijk kunnen worden gebruikt op nieuwssites om gebruikers snel de gewenste informatie te vinden.

Een parasitaire verhouding

De kwestie van verkeer en inkomsten moet als eerste worden aangepakt voordat generatieve AI-systemen zoals OpenAI de productie van nieuws helemaal automatiseren. Barry Adams, gespecialiseerd SEO-consultant bij SEO-bedrijf Polemic Digital, merkte echter op dat generatieve AI-systemen het nieuws niet kunnen voorspellen, dus hij voorziet geen onmiddellijke problemen. “AI zal de journalistiek niet vervangen als het gaat om het verslaan van het nieuws, het onderzoeken van verhalen en het ter verantwoording roepen van de macht”, voegde hij eraan toe.

Aan de andere kant zou AI lokale nieuwsberichten kunnen herformuleren zonder citaten terwijl het zijn eigen versies uitspuugt. Dit zou op zijn beurt het verkeer en de daarmee samenhangende inkomsten van nieuwssites wegnemen, wat bijzonder schadelijk is voor lokale nieuwssites die vooral afhankelijk zijn van advertentieverkeer, aldus Conaway. En herformulering kan de oorspronkelijke betekenis van de berichtgeving veranderen. “De combinatie van schraperige en financieel kwetsbare lokale nieuwsredacties, algemene mediamijding en wantrouwen en de opkomst van AI als primaire bron kan rampzalige gevolgen hebben,” voegde hij eraan toe.

Maar eerst moeten de partijen de kwestie van verkeer en inkomsten aanpakken. Adams zei dat het gebrek aan attributie bij de eerste versies van Bing ChatGPT en Google’s Language Model for Dialogue Applications, of LaMDA, hem hier het meest zorgen baart. “Dit ondermijnt een fundamenteel contract van het web, waarbij zoekmachines en websites met inhoud in een symbiotische staat bestaan,” zei hij. “Generatieve AI verandert deze symbiose in een parasitaire relatie, waarbij de zoekmachines alles afnemen van de makers van inhoud (d.w.z. de inhoud die nodig is om [grote taalmodellen (LLM’s)] op te trainen) en niets teruggeven.”

Google-owned YouTube hanteert echter al een meer symbiotisch model waarbij content creators delen in de inkomsten die het platform genereert. “Er is geen reden waarom een soortgelijk model niet zou kunnen worden ingevoerd voor zoekmachines en het web, behalve dat het Google minder een geldmachine zou maken en wat aandeelhouderswaarde zou verliezen,” voegde Adams eraan toe. Smullen was het ermee eens dat de oplossing ligt in het betalen van uitgevers voor trainingsgegevens. “Net als Google zal het zijn machtspositie misbruiken totdat overheden in actie komen en de legaliteit van zijn bedrijfsmodel vanuit auteursrechtelijk oogpunt ter discussie stellen,” zei Smullen. “Het is alleen maar eerlijk dat uitgevers worden gecompenseerd voor hun rol in het mogelijk maken van de volgende generatie AI.”

Waakzaam blijven

Volgens Julian Scott, content strateeg bij social media management en automatiseringstool Socialbu, hebben sommige nieuwsorganisaties al gereageerd op het gebruik van hun inhoud zonder toereikende attributie door striktere licentieovereenkomsten, strengere regels voor het verzamelen en gebruiken van gegevens en de toepassing van auteursrechtenbescherming software. Echter, volgens Scott zijn deze maatregelen wellicht niet voldoende om volledige bescherming van hun inhoud te waarborgen.

Binnen de media-industrie worden betere tools gevraagd binnen het OpenAI-model, die zorgen voor de juiste credits, aldus Daniel Chabert, CEO en oprichter van web- en softwareontwikkelingsbureau PurpleFire. “Ze hopen dat OpenAI transparanter zal zijn in hun gebruik van nieuwsgegevens en proactiever in het waarschuwen van auteurs en uitgevers wanneer hun content wordt gebruikt”, voegde hij eraan toe.

In de tussentijd zouden nieuwsorganisaties er verstandig aan doen om te investeren in betere controlesystemen om fouten of vertekeningen op te sporen in de gegevens die door de OpenAI-modellen worden gegenereerd. “Nieuwsorganisaties moeten waakzaam blijven over het gebruik van nieuwsgegevens door OpenAI en de nodige stappen ondernemen om hun inhoud te beschermen en de nauwkeurigheid en kwaliteit te garanderen”, voegde Chabert eraan toe.

Een eerste-stop bestemming

Websites moeten nadenken over een “post-Google toekomst” en sterke merken opbouwen die hun publiek rechtstreeks aan hen binden, merkte Adams op. Sommige uitgevers hebben hier veel succes mee gehad door merken op te bouwen die bijna immuun zijn voor de grillen van zoekmachines. Het doel is om een first-stop bestemming te worden voor het publiek, waarbij lezers direct naar de website gaan zonder tussenkomst van Google of Facebook.

Naarmate de stimulans om door te klikken naar originele bronnen afneemt, moeten websites volgens Matt Greenwood, SEO-manager bij zoekbureau Reflect Digital, “informatie en ervaringen bieden die waardevoller zijn dan kan worden samengevat in een paar regels automatisch gegenereerde tekst, om consumenten een reden te geven onze sites nog steeds te bezoeken en onze originele inhoud te lezen.”

Nieuws SEO en generatieve AI: in een ‘parasitaire relatie’