Detailseite
Projekt Druckansicht

Quellentrennung und Wiederherstellung von Klangkomponenten in Musikaufnahmen

Fachliche Zuordnung Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Datenmanagement, datenintensive Systeme, Informatik-Methoden in der Wirtschaftsinformatik
Förderung Förderung von 2016 bis 2025
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 328416299
 
Erstellungsjahr 2024

Zusammenfassung der Projektergebnisse

Das SeReCo-Projekt hat Methoden des maschinellen Lernens zur Trennung und Wiederherstellung von Klangkomponenten in komplexen Musikaufnahmen weiterentwickelt. Ursprünglich auf Schlagzeugaufnahmen ausgerichtet, wurden die Zielsetzungen des Projekts erweitert, um auch andere anspruchsvolle Musikszenarien wie Klavier- und Streichmusik zu berücksichtigen. Ein zentraler Aspekt lag auf der Trennung von Klavierkonzerten in eine Klavier- und eine Orchesterstimme, ein Szenario, das aufgrund des komplexen Zusammenspiels zwischen den Instrumenten besondere Herausforderungen mit sich bringt. Diese neuartige Aufgabenstellung wurde im Forschungsbereich des Music Information Retrieval (MIR) erstmals untersucht und ging über den traditionellen Fokus auf die Quellentrennung von populärer Musik hinaus. Das SeReCo-Projekt leistete wesentliche Beiträge in technischer, konzeptioneller und praktischer Hinsicht und erforschte das Potenzial von Deep-Learning-Techniken im musikalischen Kontext. Dabei wurden zunächst neuartige, datengetriebene maschinelle Lernalgorithmen für die Quellentrennung und Audiozerlegung entwickelt, die durch musikalisches Wissen und klassische Signalverarbeitungsmethoden erweitert wurden. Aufbauend auf diesen Grundlagen widmete sich das Projekt der anspruchsvollen Aufgabe, Klavierkonzerte in einzelne Klavier- und Orchesterspuren zu trennen. Um das Problem begrenzter oder fehlender Trainingsdaten für Deep-Learning-Modelle zu lösen, führte das Projekt musikalisch motivierte Datenaugmentierungstechniken ein, die die Leistung von Quellentrennungsalgorithmen, insbesondere in Szenarien mit hohen frequenzzeitlichen Korrelationen, erheblich verbesserten. Für Evaluierungszwecke erstellte das Projekt einen Multitrack-Datensatz für Klavierkonzerte, der synchronisierte Orchester- und sowohl von professionellen als auch von Amateurpianisten eingespielte Klaviertracks enthält. Dieser Datensatz diente als Grundlage zur Bewertung von Quellentrennungsmodellen, ermöglicht aber auch eine Reihe weiterer Anwendungen im MIR Bereich. Darüber hinaus setzte das Projekt Techniken der notentext-informierten nichtnegativen Matrixfaktorisierung (NMF) ein, um ein Maß für das notenweise Signal-zu-Verzerrungsverhältnis (SDR) abzuleiten, das tiefere Einblicke in verschiedene Quellentrennungsartefakte bietet. Der Einfluss des SeReCo-Projekts reicht über seine technischen Innovationen hinaus. Es entstand eine umfangreiche Sammlung von Open-Source-Ressourcen, darunter gut dokumentierte Python­Toolboxes, Datensätze sowie ergänzende Materialien wie Audio-Beispiele und Implementierungen. Darüber hinaus stellt das Projekt Demonstratoren bereit, die potenzielle Anwendungen und Werkzeuge zur automatischen Erstellung von Orchesterbegleitungen veranschaulichen und bereitstellen. Insgesamt ist das Projekt nicht nur eine neuartige Herausforderung in den Bereichen des MIR und der Audiosignalverarbeitung angegangen, sondern hat auch die lnteraktionsmöglichkeiten von Pianisten mit bestehenden klassischen Musikaufnahmen deutlich erweitert.

Projektbezogene Publikationen (Auswahl)

 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung