Musique utilisée pour l'IA : 12 millions de morceaux exposés
Alex Reisner a découvert quatre ensembles de données musicaux utilisés pour entraîner des modèles d'IA, dont deux contiennent 12 et 9 millions de morceaux. Google et Stability ont confirmé leur utilisation, bien que certains outils violent les conditions d'utilisation des plateformes.
« Three of the datasets I found are distributed as a list of links to songs on YouTube or Spotify. » — The Verge AI
Que faut-il retenir ?
- Deux ensembles de données contiennent 12 millions et 9 millions de morceaux.
- Google et Stability ont confirmé utiliser ces ensembles dans leurs recherches.
- Certains outils utilisés violent les conditions d'utilisation des plateformes comme YouTube et Spotify.
- Les ensembles incluent des artistes comme Lady Gaga, Radiohead et Aphex Twin.
Pourquoi cette nouvelle compte-t-elle ?
Cette révélation soulève des questions sur l'utilisation éthique des données musicales pour l'IA. Les professionnels doivent être conscients des implications légales et éthiques de l'utilisation de ces ensembles de données, surtout lorsque des outils violent les conditions d'utilisation des plateformes.
12 millions de morceaux dans un des ensembles de données
💬 Alex Reisner, Reporter pour The Atlantic
Public concerné : développeurs, entreprises
Quels sont les risques légaux d'utiliser ces ensembles de données musicaux pour l'IA ?
L'utilisation de ces ensembles peut violer les conditions d'utilisation des plateformes comme YouTube et Spotify, exposant les développeurs à des risques légaux. De plus, certains morceaux nécessitent des licences pour des applications commerciales.