^

 

 Suche  | Sitemap  | Mediadaten  | Kontakt  | Impressum  | Datenschutz
       
Freitag, 29. März 2024
   
 

Hören mit KI

Im Gespräch mit Dagmar Schuller, Geschäftsführerin der audEERING GmbH

1 2 3 4 5 Next »

Maschinen, die lernen, und Roboter, die denken können… - das Thema Künstliche Intelligenz ist in aller Munde. Und KI wird auch die Möglichkeiten audiologischer Technik erweitern. Doch wohin genau geht die Reise? Was kann Künstliche Intelligenz im Audio-Bereich? Wo sind ihre Grenzen, Chancen, Risiken?

Wir fragten Dagmar Schuller, Geschäftsführerin der audEERING GmbH. Das junge Münchner Unternehmen gilt weltweit als der Innovationstreiber für Audio Intelligence. Und audEERING ist strategischer Partner des dänischen GN Konzerns.

Frau Schuller, könnten Sie uns audEERING bitte kurz vorstellen. Worum geht es bei Audio Intelligence?
Dagmar Schuller:
Im Kern geht es darum, dass nicht nur zählt, was man sagt, sondern auch, wie man es sagt. Wir lesen mithilfe intelligenter Audio-Analyse Emotionen aus der menschlichen Stimme heraus. Entstanden ist audEERING 2012 als Ausgründung aus der TU München. Unser Ursprung war eine Forschungsgruppe um Professor Björn Schuller. Basis für die Arbeit ist OpenSMILE, eine Software zur automatischen Extraktion von Merkmalen aus Audiosignalen sowie zur Klassifikation von Sprach- und Musiksignalen. Unser System ist heute in der Lage, anhand von wenigen Sekunden Sprachmaterial ungefähr 50 Emotionsklassen zu erkennen. OpenSMILE steht auch als Open Source zur Verfügung. Im Auftrag unserer Kunden – also beispielsweise auch für GN – wird sie dann für konkrete Anwendungen weiterentwickelt.

Das Schlagwort Künstliche Intelligenz ist heute schwer in Mode. Um welche Art Intelligenz geht es da eigentlich?
Dagmar Schuller:
Ich würde nicht sagen, dass KI ein Modewort ist. Aktuell erlebt der Begriff eher eine Art Renaissance. KI war schon vor 30 Jahren nichts Ungewöhnliches. Nur hatten die neuronalen Netze, mit denen man auch heute beim Machine Learning arbeitet, nur eine Ebene. Bestenfalls gab es zwei Schichten; mehr ging nicht. Heute sind diese neuronalen Netze vielschichtiger.

Unter dem KI-Begriff tummeln sich jetzt eine Reihe neuer Modeworte, beispielsweise Deep Learning. Das heißt eigentlich nur, dass ich ein neuronales Netz mit vielen Schichten habe, sozusagen eine Art Lang- und Kurzzeitgedächtnis abbilden kann. Man muss KI jedoch größer sehen, als es die meisten heute tun. Größer im statistisch-mathematischen und auch im kreativen Sinne. Es geht nicht um einen intelligenten Algorithmus – also nicht um klassisches Machine Learning, das KI überhaupt möglich macht. Es geht vielmehr um ein Zusammenspiel unterschiedlicher Einflussfaktoren. Die ermöglichen ein System, das so ähnlich handelt, wie es ein Mensch tun würde. Aufgrund des von Menschen Gelernten kann dieses System überspitzt ausgedrückt „eigene Gedanken“ entwickeln. Es kann zu Ergebnissen gelangen, zu denen ein Mensch so vielleicht nicht gekommen wäre. Und zwar, weil ich so ein System mit einer Fülle von Daten füttern kann, die ein Mensch gar nicht analysieren könnte. Menschen haben hingegen andere perzeptive Möglichkeiten, die schnellere Schlüsse oder andere Optionen eröffnen. Das ist der große Unterschied zwischen Mensch und KI.


In sehr vielen Branchen hört man derzeit, dass Unternehmen bereits KI einsetzen…
Dagmar Schuller:
Meist ist das jedoch gar keine KI, sondern eine statistische Methode. Bestenfalls werden noch zwei Methoden kombiniert. Man muss also genau nachfragen, was dort geschieht. Mit welcher anderen Methode wird die eigene verglichen, um zu sehen, dass man auch das beste Ergebnis hat? Hier trennt sich die Spreu vom Weizen. Alles ist stark Daten-getrieben. Und nur bestimmte Daten mit einer bestimmten Qualität ermöglichen es dem System, in einer bestimmten Qualität zu erkennen.

Das ist nicht anders als bei einem Kind. Sie können ihm Wissen systematisch oder völlig unsystematisch vermitteln. Sie können ihm z. B. systematisch vermitteln: das ist ein Buch, das eine Zeitschrift, das ein Heft. Fehlt diese Systematik, lernt das Kind zwar immer noch was. Aber es weiß dann vielleicht nicht: Buch, Zeitschrift, Heft. Es weiß nur: Das sind alles Sachen, in denen man lesen kann; und sie schauen unterschiedlich aus.


Wie trainieren Sie Ihr System, damit es lernt, Sprecher zu analysieren?
Dagmar Schuller:
Geht es z. B. um die Wahrnehmung einer bestimmten Emotion, die in der Stimme mitschwingt, so werden viele Menschen diese Emotion gleich beurteilen. Sie stellen fest: Das klingt glücklich, verärgert usw. Wir lassen unsere Daten auch von Menschen annotieren bzw. einordnen. Wir haben ein großes Team aus Annotatoren. Aus ihrem Urteil bilden wir ein Mittel. Und anhand dessen wird dann die KI trainiert.

Dieses Systematisieren, das Labeln der Daten, ist extrem wichtig. Nur so kommt man überhaupt zu einer guten Methode. Es wird zwar auch heute schon darüber gesprochen, die Generierung und das Labeln der Daten komplett den Maschinen zu überlassen. Aber dieses sogenannte Automated Machine Learning steckt noch in den Kinderschuhen. Aktuell muss das noch komplett von Menschen übernommen werden, um dann Algorithmen entwickeln zu können, die aus den Daten das Bestmögliche herausholen.

 

Veröffentlicht am: 08.09.2019

AusdruckenArtikel drucken

LesenzeichenLesezeichen speichern

FeedbackMit uns Kontakt aufnehmen

FacebookTeile diesen Beitrag auf Facebook

Nächsten Artikel lesen

Vorherigen Artikel lesen

 

Neu:


 

 

 

 

Werbung

Werbung

 

 

 

Werbung

             

 

Besuchen Sie auch diese Seiten in unserem Netzwerk:
| Börsen-Lexikon
| Fotograf Fotomensch Berlin
| Geld & Genuss
| gentleman today
| genussmaenner.de
| geniesserinnen.de
| instock.de
| marketingmensch | Agentur für Marketing, Werbung & Internet
| Unter der Lupe

© 2024 by frauenfinanzseite.de, Groß-Schacksdorf. Alle Rechte vorbehalten.