Vogelstimmen mithilfe von KI erkennen

Vogelstimmen mithilfe von KI erkennen

Mithilfe von Künstlicher Intelligenz entwickeln Chemnitzer Forscher eine Software, die Vogelstimmen erkennt. Eine App für Jedermann ist auch schon in Arbeit.

Star ist ein virtuoser Singvogel.
Der Star ist ein virtuoser Singvogel, der auch gerne andere Vögel imitiert.

Trotz kaltem März ist das Konzert der Vögel nun wieder in vollem Gange. Doch selbst bekannte Singvogelarten wie Amsel, Drossel, Buchfink und Star nur an deren Stimmen zu erkennen, fällt selbst manchem Ornithologen nicht immer leicht. Eine schnelle Erfassung der Vogel-Vielfalt in einem Lebensraum bleibt daher bisher ein bisweilen mühsames Unterfangen. Stefan Kahl, Doktorand an der Stiftungsjuniorprofessur Media Computing an der Fakultät für Informatik der Technischen Universität Chemnitz, will das ändern. Sein Ziel: eine Software zu entwickeln, die anhand von Tonaufnahmen Vogelstimmen den Arten zuordnet und automatisch erkennt. Sein Projekt wird vom Europäische Sozialfond (ESF) über einen Zeitraum von drei Jahren mit insgesamt 57.600 Euro gefördert.

Neuronale Netze auf Vogelstimmen trimmen

„Die entwickelte Software ist darauf geeicht, die Audiosignale in Bilder zu konvertieren, in so genannte Spektrogramme. Diese bildhaften Repräsentationen der Audiosignale haben sich als besonders geeignet für die Detektion und Klassifikation von akustischen Events herausgestellt“, erklärt Stefan Kahl. Diese Spektrogramme nutzt Kahl zur Erkennung der Arten. Das künstliche neuronale Netz muss hierfür aber so trainiert werden, dass es bestmöglich den Vogelstimmen angepasst ist. Damit das Programm irgendwann die Stimmen erkennt, muss die Software zunächst mit entsprechenden Aufnahmen gefüttert und die Daten ausgewertet werden. „Die Verarbeitung von Audio-Rohdaten ist aufgrund der Länge der Signale nicht einfach für die Detektion und Klassifikation von akustischen Events geeignet. Es muss daher eine Repräsentation gefunden werden, die die Signale vereinfacht“, erläutert der Medieninformatiker.

US-Forscher und Vogelfreunde liefern Aufnahmen

Bei dem ambitionierten Vorhaben wird der Medieninformatiker vom Cornell Lab of Ornithology der Cornell University in Ithaca/New York unterstützt. Die US-Forscher liefern Tonaufnahmen und hochwertige Archiv-Aufnzeichnungen zur teilautomatisierten Programmierung. Damit werden in Chemnitz Sets von Trainingsdaten erstellt. Neben der professionellen Unterstützung kann sich Kahl auch auf die Hilfe von Vogelliebhabern verlassen. „Ohne die Aufnahmen der, mitunter schon semi-professionell agierenden, Vogel-Freunde wäre das Vorhaben kaum zu realisieren“, betont er.

Vogelstimmen-App für Jedermann

Erste Erfolge kann das Chemnitzer Team bereits verzeichnen. 2017 belegte die Gruppe um Kahl beim wissenschaftlichen Wettbewerb „ImageCLEF 2017“ den zweiten Platz. Seither konnte das Programm Kahl zufolge weiter deutlich verbessert werden, so dass beispielsweise Beispiel das Programm monophone Aufnahmen von Nord-Amerikanischen Vogelarten mit einer Genauigkeit von 85% erkennt. Derzeit arbeiten die Chemnitzer auch an einer entsprechenden App, mit deren Hilfe jedermann Vogelstimmen in freier Natur erkennen kann. Das große Ziel von Stefan Kahl ist jedoch: Die Software für eine Echtzeiterkennung der Vogelstimmen fit zu machen.

bb