Künstliche Intelligenz, maschinelles Lernen und Computerwahrnehmung: Kann man Maschinen beibringen, Musik zu verstehen? (Und wozu sollte man das tun?)

Gerhard Widmer, Wittgenstein-Preis 2009
Johannes Kepler Universität Linz
Institut für Computational Perception
www.cp.jku.at

Dieser Vortrag muss leider entfallen.

nepTune: Neuartige Computer-Interfaces zum intuitiven Durchsuchen von Musiksammlungen

nepTune: Neuartige Computer-Interfaces
zum intuitiven Durchsuchen von Musiksammlungen

Ort Atominstitut, TU-Wien, Stadionallee 2, 1020 Wien
Datum 18.06.2014
PDF Widmer_flyer

Die menschliche Sinneswahrnehmung (Sehen, Hören, Spüren, …) ist eine ganz erstaunliche Fähigkeit, die in komplexem Wechselspiel zwischen Sinnesorganen, Nervensystem und Gehirn Leistungen vollbringt, die die Wissenschaft bis heute nicht restlos versteht. Gleichzeitig ist Wahrnehmung auch ein ganz grundlegender Pfeiler und Bestandteil (menschlicher und tierischer) Intelligenz. Deshalb ist sie auch ein zentrales Thema für die Künstliche Intelligenz (Artificial Intelligence, AI), den Zweig der Computerwissenschaft, der sich mit der Entwicklung „intelligenter“ Maschinen beschäftigt.
In unserer Arbeit befassen wir uns vor allem mit Versuchen, Computern Musikwahrnehmung beizubringen – die Fähigkeit, Musik zu hören und dabei Dinge wie Rhythmus, Takt, Melodie, usw. zu erkennen, aber auch Instrumente oder Stilrichtungen (Pop, Rock, Rap, Jazz, …) unterscheiden zu lernen oder zu „hören“, ob ein Song ruhig oder aggressiv oder ähnlich zu einem anderen klingt – all die Dinge eben, die wir Menschen scheinbar so mühelos wahrnehmen (und die, wie wir sehen werden, für Maschinen sehr schwierig sein können).
Wir werden uns anschauen (und anhören), was Musik und Sound überhaupt ist, warum Musikwahrnehmung so schwierig ist, wie man Computern diese trotzdem (bis zu einem gewissen Grad) beibringen kann, was uns die Forschungsergebnisse über Musik und Wahrnehmung selbst sagen, und was man mit solchen musikalischen Maschinen in der großen Welt der digitalen Musik heute schon praktisch anfangen kann.
Und wir werden in den FM4 Soundpark hineinschauen …

Vorbereitende Fragen:

  • Was ist Klang, was ist eine Schallwelle?
  • Was ist in einer .wav oder einer .mp3-Datei gespeichert?
  • Was wisst Ihr darüber, wie das Hören funktioniert?
  • Könntet Ihr in 3 Sätzen beschreiben, nach welchen Kriterien Ihr beim Musikhören entscheidet, wo der Beat ist (z.B. zwecks Mittanzen oder Fingerschnippen)? Kann man das überhaupt rational erklären?
  • Wann würdet Ihr eine Maschine als „intelligent“ bezeichnen?
  • Was heißt es, zu „lernen“?
  • Was ist ein Neuronales Netz (NN) (ein künstliches, nicht das Gehirn), und wie werden NNs in den Medien dargestellt?
  • Wer von Euch hat den Film „Her“ gesehen? Glaubt Ihr, dass so etwas irgendwann einmal möglich sein wird?
  • Haltet Ihr den Begriff „Künstliche Intelligenz“ für Sinnvoll? Irreführend? Gefährlich? Großspurig? Interessant? Idiotisch? Reizvoll?
  • (Weitere Begriffe nehme ich auf Wunsch jederzeit gerne in die Liste auf)
  • Gibt es andere Fragen zu AI / Computerwissenschaft / Wissenschaft ganz allgemein, die Ihr gern diskutieren würdet?

Startpunkte im Internet:
Künstliche Intelligenz:
http://de.wikipedia.org/wiki/Künstliche_Intelligenz (nicht sehr gut …)
http://en.wikipedia.org/wiki/Artificial_intelligence
Wahrnehmung: http://de.wikipedia.org/wiki/Wahrnehmung
Hören: http://de.wikipedia.org/wiki/Auditive_Wahrnehmung
Computerwahrnehmung: http://en.wikipedia.org/wiki/Machine_perception
Kurzer Artikel – Presse, 5.5.2013: www.cp.jku.at/media/PRESSE_20130505_SEITE_19_presseso.pdf
Mehr Presseartikel zu unserer Arbeit: www.cp.jku.at/PR.html