Het moederbedrijf van Tumblr en WordPress.com, Automattic, bevindt zich volgens bronnen in gesprekken met Midjourney en OpenAI om trainingsdata te leveren afkomstig van gebruikersposts. Een cruciaal aspect van deze mogelijke samenwerking is de vereiste implementatie van een opt-outoptie voor gebruikers.
Licentiedeal
404 Media beweert op basis van een anonieme bron dat Automattic op het punt staat een licentiedeal te sluiten met de twee AI-bedrijven. Het doel is naar verluidt het verkopen van gebruikersgegevens van hun platforms als een nieuwe inkomstenbron. De exacte financiële details van de deal en de specifieke gegevens die verkocht zullen worden, blijven echter onduidelijk.
Data
Volgens 404 Media heeft Automattic in de ‘initiële datadump’ per abuis veel Tumblr-posts verzameld die niet behoorden tot de beoogde dataset. Publieke posts van 2014 tot en met 2023, inclusief privéposts op publieke blogs, verwijderde blogs en expliciete content, zouden zijn meegenomen. Het is momenteel niet bekend of deze onbedoelde gegevens al zijn overgedragen aan Midjourney en OpenAI.
Automattic
Na de publicatie van het artikel heeft Automattic gereageerd met een blogpost. Het bedrijf bevestigt de samenwerking met ‘bepaalde AI-bedrijven’, zonder specifieke namen te noemen.
Automattic meldt de toevoeging van een instelling op Tumblr en WordPress.com waarmee gebruikers kunnen ‘ontmoedigen’ dat AI-bedrijven hun posts en websites crawlen. Het bedrijf waarschuwt echter dat bedrijven niet verplicht zijn zich aan deze instelling te houden, omdat er momenteel geen wet is die crawling verbiedt.
Afmeldmogelijkheid
Automattic belooft dat de samenwerkende bedrijven de voorkeuren van gebruikers zullen respecteren. Indien een gebruiker ervoor kiest zich later af te melden, garandeert Automattic dat de content uit de trainingsdata van de betrokken AI-bedrijven zal worden verwijderd.