# Sonoj Köln 17. Juni 2026, 19-21 Uhr Anwesenheit: nils, ikaria36, darko, jan, georg, julian, karl, flo, manou, robert ## Thema: Raushören von Musik - Veantwortlich: [name=nils] "Musik handhabbar machen -> Verstehen -> Selbst gestalten" Ausgangspunkt können eigene Aufnahmen, Jam-Sessions, Skizzen oder fertige Produktionen anderer sein. Ziel ist es, herauszufinden, was dort passiert, um es selbst nachspielen, nachbauen oder weiterentwickeln zu können: Form, Instrumente, Melodieverläufe, Akkorde und mehr. Welche Fähigkeiten muss man haben um analytisch Hören zu können und welche Software unterstützt dabei, etwa durch Verlangsamen, Transponieren oder das Isolieren einzelner Instrumente. Selbstverständlich ist alle vorgestellte Software kostenlos und frei zugänglich und teilbar. Natürlich ist vor Ort nur begrenzt Zeit, es geht also um einen groben Überblick und "Was müsste ich können? Was kann man wie üben? Was macht der Computer für mich?" ### Reihenfolge: Nicht alles muss herausgefunden werden. Man konzentriere sich auf das Besondere. Am besten hat man ein Akkordinstrument zur Hand (z.B. Klavier). Grundprinzip: Musik benutzt etablierte Muster und bedient Erwartungshaltungen. Je mehr man diese kennt, desto einfacher ist es zu hören und zu abstrahieren. Insbesondere innerhalb eines Stils. z.B. Typische Formteile, Quintfallsequenzen, 3-3-2 Aufteilung des 4er Takts. Von Groß nach Klein: - Einfach: Tempo, Taktart(en), Instrumente, Form - Akkorde - System egal: "Jazz-Akkorde", Stufen, Funktionen, Generalbass… - Wie transponiere ich? (Quintenreihe) - Bass und Melodie: Aufteilen in Rhythmus und Melos - Skala raushören (erstmal von einer festen ausgehen) - Richtung mit Pfeilen aufschreiben vor spezifischen Tonhöhen - Innenstimmen und Füllmaterial - Weitere Gesichtspunkte: - Wie ist das Instrument auf der Aufnahme modifiziert und gestimmt - Evtl. Unterschied zwischen "trivial" und "unspielbar" ### Software - Normalisierte und bereinigte Aufahme (z.B. eigene Jam Session) - Isolieren oder Splitten - Verlangsamen, Nachstimmen - Automatisches Transkribieren in Noten und MIDI? ### Exkurs: Stem Separators Ein "Stem" ist eine Spur (meist ein individuelles Instrument). Es ist der Track mit allen Effekten, nicht eine unbearbeitete Originalaufnahme. Man sollte vorher schon wissen (per Ohr) welche Instrumente in der Aufnahme sind. Anspruch hier: Transkription, nicht Remix-Produktion. - Schauen ob es die Original-Stems direkt von "Upstream" gibt. - EQ mit gnademlosen Cutoff - Spezialisierte Machine Learning Software. - Fallbeispiel: https://ultimatevocalremover.com/ - https://github.com/Anjok07/ultimatevocalremovergui - MDX Modelle Downloaden (in der Software) - MDX-Net: Kim Vocal 2 - Nur Vocals - MDX-Net: MDX23XC instvoc hq - Nur Instrumente (invers von Vocal Isolation) - MDX-Net: kuilab_b_drums - Modelle sind für bestimmte Musikstile und Besetzungen geeignet (vergl. Toto mit Greensleeves). Eigene Modelle trainieren? - Single Mode - Ensemble Mode - Arbeitet in komplementären Paaren - Immer das was man will und dann den Rest. Das heißt nicht das der "Rest" dann genausogut ist wie der Primärtrack. Beides zusammen ergibt halt das Original. Generell ist es besser ein Modell für das zu nehmen was man hören will. Recherche: - Youtube ist eine KI Sponsored AI ShitShow geworden - https://www.youtube.com/watch?v=qYK_8xkIIOw Verzeichnis benutzter Software und Quellen: - https://imslp.org/ (Noten) - https://veltzer.org/openbook/ (Noten) - https://www.sonicvisualiser.org/ "Visualisation, analysis, and annotation of music audio recordings" - https://29a.ch/fix-tuning/ (Web) - https://29a.ch/timestretch/ (Web - Nachfolger von "Play It Slowly") - https://hilbricht.net/metronome/ (Web - Keine Analyse außer Tap) - https://f-droid.org/packages/de.moekadu.tuner/ (Android APP, ein Stimmgerät unter vielen) - https://f-droid.org/de/packages/de.moekadu.metronome/ (Android APP, ein Metronom unter vielen) - https://mixxx.org/ (DJ Software oder sehr guter Audioplayer) - Analysiert Tempo, Tonart und Takte - Stem Split GSOC WIP im Code - Sonic Visualizer - Schöne Grafiken - Korrektheit (je nach Plugin?). z.B. Beat Detection - Ein Programm, das man lernen muss. - Evtl. sind Plugins in der DAW aber sinnvoller ### Weiteres Vielleicht alles automatisch? Aufnahme in ein Programm und dann kommt MIDI oder Noten raus, oder ein Leadsheet? Oder schon die fertig produzierte Cover-Version? Ein paar Thesen: - Ist es das was man will, oder will man nicht eher eine abstrahierte, vereinfachte Version haben um die Kernideen und Konzepte zu benutzen? Wenn ich einen 100% Reproduktion mit allen Details haben will kann ich mir einfach das Original anhören. - Man wird durch "KI macht das schon" kein besserer Musiker. Der Prozess der Analyse ist der eigentliche Wert. ### Beispiele: - Born in the U.S.A. Akkorde und Bass https://www.youtube.com/watch?v=MUx5Vu2XRqA - Greensleeves https://www.youtube.com/watch?v=uiGRdO4l5Vg - Self Defense Übergang Rhythmus 2:38min https://youtu.be/WlMLOZcKeEE?si=eViuaJwJ2OYF9I5e&t=156 - Bach WTK 1, Nr 21 B-Dur: https://www.youtube.com/watch?v=U0v4CckNE68 - Eigentlich: Die Noten gibt es schon. - Langsamer, C-Dur - Toto: Africa