OpenAI hat kürzlich Jukebox vorgestellt, ein neuronales Netzwerk, das Musik, einschließlich rudimentärer Gesangsstimmen, in verschiedenen Genres und Stilen von Künstlern generiert. Das Modell kann Musik direkt als Rohaudio generieren, was es von anderen Ansätzen unterscheidet, die Musik symbolisch in Form von Noten oder MIDI-Dateien erzeugen.
Jukebox verwendet eine Kombination aus Autoencodern und Transformern, um Musik zu generieren. Der Autoencoder komprimiert das Rohaudio in einen niedrigdimensionalen Raum, indem er einige der wahrnehmungsrelevanten Informationen entfernt. Anschließend wird ein Transformer trainiert, um Musik in diesem komprimierten Raum zu generieren. Schließlich wird das generierte Audio wieder auf das Rohaudio aufgesampelt.
Jukebox hat einige Vorteile gegenüber anderen Ansätzen der Musikgenerierung. Da es Musik direkt als Rohaudio generiert, kann es menschliche Stimmen und andere subtile Timbres, Dynamiken und Ausdrucksformen erfassen, die für Musik essentiell sind. Darüber hinaus kann Jukebox Musik in verschiedenen Genres und Stilen von Künstlern generieren, was es zu einem flexiblen Werkzeug für Musikproduzenten und Künstler macht.
OpenAI hat einige Beispiele für Musikstücke bereitgestellt, die mit Jukebox generiert wurden. Diese Beispiele umfassen verschiedene Genres, wie Pop, Rock und Hip-Hop, und zeigen die Fähigkeit von Jukebox, Musik in verschiedenen Stilen zu generieren.
OpenAI hat die Modellgewichte und den Code für Jukebox veröffentlicht, zusammen mit einem Tool, um die generierten Musikstücke zu erkunden. Dies ermöglicht es anderen Forschern und Entwicklern, Jukebox zu nutzen und zu erweitern.
Jukebox ist ein wichtiger Schritt vorwärts in der Forschung zur Musikgenerierung. Durch die Fähigkeit, Musik direkt als Rohaudio zu generieren, bietet Jukebox neue Möglichkeiten für Musikproduzenten und Künstler. Wir sind gespannt, wie Jukebox in Zukunft eingesetzt wird und welche neuen Möglichkeiten es für die Musikindustrie bietet.
* KI-Zusammenfassungen können Fehler enthalten. Alle Angaben ohne Gewähr.