Skip to main content
Ein Mann schaut in einen kleinen Spiegel, der über Sonnenbrillen platziert ist

Die Richtwirkung der Hörsystemmikrofone im Zusammenhang mit Umgebungsklassifizierung und Sprachlokalisierung

Mittwoch, November 1, 2023
Unitron
  • Whitepaper
  • Blu

Einführung

Im Alltag erleben Menschen eine Vielzahl von akustischen Umgebungen: ruhige Gespräche zu Hause, Mittagessen mit Freunden in einem lauten Restaurant oder die Frage nach dem Weg an einer geschäftigen Straßenecke. Die akustischen Parameter in diesen verschiedenen Umgebungen können stark variieren und sich dynamisch verändern. Das Hörerlebnis eines Hörsystemträgers hängt davon ab, wie gut die Einstellungen des Hörsystems zur akustischen Umgebung passen. Da sich ihre Klangkulisse ändern kann, muss die Ansprache der Hörsysteme gegebenenfalls an die neue Umgebung angepasst werden. Das kann manuell durch den Träger oder automatisch durch die Hörsysteme erfolgen. Damit die Hörsysteme sich automatisch anpassen, müssen sie in der Lage sein, die sich verändernde Umgebung richtig zu erkennen und dann die entsprechenden Anpassungen vorzunehmen.

Unitrons Signalverarbeitungsphilosophie

„Wir bei Unitron sind der Meinung, dass ein ausgeklügeltes automatisches Programm, das in der Lage ist, das Hörszenario zu charakterisieren und die Leistung entsprechend anzupassen, den Vorteil von Benutzerfreundlichkeit bietet und das Risiko für mögliche Fehler senkt, wie z.B. die Auswahl des falschen manuellen Programms oder gar keine Änderung des aktiven Programms.“

(Cornelisse, 2017)

Hörsysteme von Unitron sind seit Jahren in der Lage, die akustischen Umgebungen präzise zu klassifizieren. Die Technologie der Klangverarbeitung hat sich ständig weiterentwickelt, um den Klang in verschiedenen Umgebungen zu optimieren. Der Richtmikrofonmodus ist eine der Funktionen, die die größte Auswirkung auf die Soundperformance hat, insbesondere in Hörumgebungen mit hoher Komplexität. Seit Jahren nutzt Unitron die direktionale Richtcharakteristik gemäß der klassifizierten Hörumgebung und optimiert diese stetig. Mit der Vivante Plattform wurde die Fähigkeit der Unitron Hörsysteme, ihre direktionale Richtwirkung auf der Grundlage der akustischen Umgebung des Trägers anzupassen, mit der Ergänzung von HyperFocus weiter verbessert. HyperFocus bietet die größtmögliche Anhebung des Signal-Rausch-Verhältnisses (SNR) in Umgebungen mit höchster Komplexität.

Umgebungsklassifizierung

Zur Umsetzung der Unitron-Philosophie ist der erste Schritt die genaue Identifizierung des Hörszenarios, das durch mehrere Aspekte der akustischen Umgebung charakterisiert werden kann, zum Beispiel Gesamtlautstärkepegel, Vorhandensein oder Nichtvorhandensein von Sprache und/oder Hintergrundgeräuschen, SNR sowie die Verortung der Sprache im Verhältnis zum Hörgeräteträger. Cornelisse (2017) beschrieb, wie jedes Hörszenario anhand drei Schlüsseldimensionen quantifiziert werden kann: 1) Gesamtlautstärkepegel, 2) Art des Störgeräusches und 3) SNR.

Graphics: 3-dimensional world of sound

Hayes (2021) verglich die Leistung des Unitron Conversational Classifier (Gesprächsklassifikator) mit dem eines normal hörenden Menschen und fand heraus, dass das Klassifizierungssystem sowohl einfache als auch komplexe Hörumgebungen präzise kategorisieren konnte. In dieser Studie wurden 26 verschiedene akustische Umgebungen zuerst von 20 normal hörenden Menschen klassifiziert, um einen Ausgangswert festzulegen. Die Leistung der Klassifikatoren, die in Premium Hörsystemen von Unitron sowie von vier anderen großen Herstellern verwendet wird, wurde anschließend mit der Leistung des durch die normal hörenden Menschen festgelegten Ausgangswerts verglichen. Die Leistung des Unitron Klassifikators stimmte in hohem Maße mit der Leistung von normal hörenden Menschen überein.


Graph presenting Unitron hearing aids confronted with competitors in the One talker in quiet environment
Graphics illustrating the subway hearing aids classifier

Die drei von Cornelisse (2017) beschriebenen Dimensionen bilden die Grundlage des Conversational Classifiers. Das Klassifizierungssystem wurde im Laufe der Zeit weiterentwickelt. Die Vivante Hörsysteme sind nun in der Lage, bis zu acht Hörumgebungen einschließlich der neusten Ergänzung – Gespräch im lauten Störgeräusch – die den HyperFocus Mikrofonmodus aktiviert, zu klassifizieren:

  1. Gespräch in ruhiger Umgebung
  2. Gespräch in kleiner Gruppe
  3. Gespräch in großer Gruppe
  4. Gespräch im Störgeräusch
  5. Gespräch im lauten Störgeräusch
  6. Ruhige Umgebung
  7. Störgeräusch
  8. Musik

Position der Sprache

Es reicht nicht aus, nur die akustische Umgebung zu identifizieren, egal wie genau das System arbeitet. Wenn ein Gespräch in einer geräuschvollen Umgebung festgestellt wird, ist es immer noch unerlässlich, die Position des Gesprächspartners zu bestimmen, um die richtige Richtcharakteristik anzuwenden. Walden et al. (2004) berichtete, dass in 20 % der Hörsituationen der Zuhörer dem Sprecher nicht zugewandt ist. Ebenso berichtete Hayes (2022), dass Menschen in komplexen Hörsituationen fast genauso oft nicht in die Sprechrichtung blicken (25 % der Zeit) wie sie es tun (30 % der Zeit). Hayes (2022) berichtete weiter, dass der Prozentsatz der Zeit, in der kein Zielsprecher anwesend war, stark mit der Zeit korrelierte, die vom Unitron Klassifizierer nur als Störgeräusch klassifiziert wurde. 

Illustration: Target speech location

Direktionale Richtmikrofone

Bevor besprochen wird, wie Vivante Hörsysteme ihre Richtwirkung an die klassifizierte Umgebung und den Ort der Sprache anpassen, ist es wichtig, einige Grundlagen des Richtmikrofons zu verstehen. Die Richtcharakteristik moderner Hörsysteme wird erzeugt, indem der Eingang von zwei oder mehreren verschiedenen Mikrofonen kombiniert wird, die sich an unterschiedlichen Stellen des Hörsystems befinden. Das wird als Richtmikrofon bezeichnet.


Vor der Einführung der Vivante Plattform verwendeten die Hörsysteme von Unitron einen herkömmlichen Beamforming-Modus, in dem zwei Mikrofone von einem einzelnen Hörsystem verwendet wurden, um eine Richtcharakteristik zu erzeugen. Die Signale der beiden Mikrofonen wurden kombiniert. Aufgrund einer Verzögerung zwischen den Mikrofonen (extern verursacht durch die physische Entfernung und intern während der Signalverarbeitung) variiert die Empfindlichkeit für Eingänge aus verschiedenen Positionen (Ricketts, 2005). Da die Richtcharakteristik mit den Mikrofonen eines einzelnen Hörsystems erzeugt wird, spricht man von einem monauralen Beamformer.

In einer binauralen Anpassung wird der Datenaustausch zwischen zwei Hörsystemen verwendet, um die Richtcharakteristik jedes Hörsystems zu koordinieren. Dadurch kann die Richtcharakteristik eines Hörgerätepaares als binaurales System zusammenarbeiten.

Mit der Einführung von Vivante verfügt Unitron nun über einen binauralen Mikrofon-Modus namens HyperFocus. Dieser Richtmikrofoneffekt wird erzeugt, indem das Audiosignal aus allen vier Mikrofonen der beiden Hörsystemen kombiniert wird. Dies ist anders als der historisch verwendete Datenaustausch. Das vollständige Audiosignal wird zwischen den beiden Hörgeräten ausgetauscht, um eine engere Richtwirkung zu erzeugen, als dies mit einem traditionellen monauralen Beamformer möglich ist.

Was die Wahrnehmung betrifft, führt die Mischung aus linken und rechten Hörsystemsignalen zu dem Eindruck, dass sich alle Sprachquellen an einem Ort, nämlich vorne, befinden, und wird als enge Richtwirkung mit geringeren störenden Geräuschen aus dem Hintergrund und insbesondere von den Seiten erlebt (Derleth et al., 2021).

Image: Binaural beamforming mode

Richtwirkung im Zusammenhang mit Umgebungsklassifizierung und Sprachlokalisation

Das System von Unitron kann die akustische Umgebung des Hörgeräteträgers präzise klassifizieren sowie die Position der Sprache erkennen. Hayes (2022) fand heraus, dass Menschen im Durchschnitt etwa 26 % ihrer Zeit in komplexen Umgebungen verbringen. Wir wissen, ob sich der Hörgerätenutzer in einer einfachen oder komplexen Umgebung befindet. Befindet sich der Benutzer in einer komplexen Umgebung, wissen wir, ob Sprache vorhanden ist oder nicht, und sofern Sprache vorhanden ist, wissen wir, aus welcher Richtung sie kommt.

Integra OS ist die Bezeichnung des fortschrittlichen Automatiksystems der Vivante Plattform. Es passt zahlreiche Parameter in den Hörsystemen als Reaktion auf Änderungen in der akustischen Umgebung an. Einer der Parameter, den es automatisch anpasst, ist die Richtwirkung der Hörsysteme.

Umgebungen mit geringer Komplexität

Das Ziel in Hörumgebungen mit geringer Komplexität ist es, die Wahrnehmung von Umgebungsgeräuschen zu ermöglichen und gleichzeitig die für das Richtungshören erforderlichen akustischen Hinweise zu erhalten. Wenn das SNR hoch ist, muss es von dem Richtungssystem nicht erhöht werden. Wenn eine Umgebung mit geringer Komplexität erkannt wird, wird der Mikrofonmodus Pinna Effekt 2 von den Vivante Hörsystemen angewandt. Pinna Effekt 2 wurde entwickelt, um das Richtungshören des durchschnittlichen menschlichen Ohrs zu rekonstruieren. Wie beim menschlichen Ohr ist der direktionale Ausgleich zwischen dem linken und rechten Hörsystem unterschiedlich, also ist Pinna Effekt 2 nur für Hörsysteme verfügbar, die paarweise angepasst werden. Pinna Effekt 2 wurde speziell dazu entwickelt, bestimmte Signale beizubehalten, die normalerweise bei Hörsystemen verloren gehen, die aber für die Lokalisierung von Geräuschen enorm wichtig sind.


Umgebungen mit hoher Komplexität

In einer Umgebung mit hoher Komplexität hängt das Ziel von der An- oder Abwesenheit von Sprache in der Umgebung ab. Wenn Sprache erkannt wird, möchten wir, dass der direktionale Ausgleich das SNR des Zielsprechers erhöht. Wenn jedoch keine Sprache erkannt wird, möchten wir, dass eine leichte Richtwirkung angewandt wird, um einige Hintergrundgeräusche zu reduzieren und gleichzeitig die Wahrnehmung der Umgebung beizubehalten. Bei den Vivante Hörsystemen wird dies automatisch durch Integra OS erreicht, welches den AutoFocus 360 Mikrofonmodus aktiviert.

Kein Zielsprecher

Wenn in einer komplexen Umgebung keine Sprache erkannt wird, wendet AutoFocus 360 eine symmetrische, nach vorne gerichtete Richtwirkung „Fix Direktional weit“ an. Das Beamforming-Muster dient dazu, die Hintergrundgeräusche von hinten zu reduzieren, während die Wahrnehmung der Umgebung von vorne und von den Seiten beibehalten wird. Im Vergleich zum Pinna Effekt 2 reduziert dieser Modus die Umgebungsgeräusche, allerdings nicht so stark wie ein vollständig aktiviertes, nach vorne gerichtetes Richtmikrofon.

Image representing a talker form the side

Sprecher von der Seite

Wenn in einer komplexen Umgebung die Sprache entweder von links oder rechts geortet wird, wird eine asymmetrische Charakteristik angewandt. Auf der Seite, auf der Sprache erkannt wird, wird ein zur Seite gerichtetes Beamforming-Muster angewandt, um Sprache von der gleichen Seite hervorzuheben. Auf der anderen Seite wird ein adaptives nach vorne gerichtetes Beamforming-Muster angewandt, um Störgeräusche von der Seite und hinten zu reduzieren. Wenn beispielsweise Sprache von rechts geortet wird, legt das rechte Hörsystem den Fokus nach rechts und das linke Hörsystem nach vorne. Der Effekt ist dann eine stärkere Hervorhebung des Sprechers von der Seite, während die Umgebungsgeräusche insgesamt reduziert werden.

Sprecher von hinten

Wenn in einer komplexen Umgebung Sprache von hinten geortet wird, wenden beide Hörsysteme eine nach hinten gerichtete Richtwirkung an. Die nach hinten gerichtete Richtwirkung fokussiert sich auf den hinteren Bereich, während die Geräusche von vorne weiterhin gut hörbar sind. 

Der Effekt ist eine stärkere Hervorhebung des Sprechers von hinten, während die Umgebungsgeräusche aus anderen Richtungen insgesamt reduziert werden. In diesem Fall werden die Signale von vorne zwar reduziert, sind aber immer noch hörbar, um ein Gleichgewicht zwischen der Fokussierung auf den Sprecher von hinten und der Wahrnehmung anderer Geräusche abseits- insbesondere bei Geräuschen von vorne, beizubehalten.

Image showing a talker from back
Image showing a talker from the front

Sprecher von vorne

Wenn in einer komplexen Umgebung Sprache von vorne geortet wird, ist die gewählte Richtcharakteristik der Vivante Hörsysteme von dem Gesamtlautstärkepegel der Umgebung abhängig. In moderat lauten Umgebungen wird für beide Hörsysteme eine herkömmliche Richtwirkung mit einem adaptiv nach vorne gerichteten Muster angewandt.

Wenn die Umgebung sehr laut ist, aktiviert eine spezielle Integra OS Umgebung automatisch HyperFocus, das binaurale Richtmikrofon. Es wird eingesetzt, um eine maximale Richtwirkung zu erzielen. Bei Akku-Hörsystemen mit einem eingebauten Beschleunigungssensor hängt die Einstellung auch davon ab, ob der Hörsystemträger sich bewegt. HyperFocus wird nicht aktiviert, wenn die Hörsysteme erkennen, dass der Träger in Bewegung ist.

Sprecher von vorne im lauten Störgeräusch

Mit der Ergänzung von HyperFocus zur Vivante Plattform weist Integra OS nun einen zusätzlichen Mikrofonmodus auf, um Hörgeräteträger in den herausforderndsten Umgebungen zu unterstützen. Mit allen Funktionen in der Standardeinstellung kann HyperFocus eine durchschnittliche SNR-Verbesserung über die audiometrischen Frequenzen (250–8000 Hz) von 2,8 dB im Vergleich zum Mikrofonmodus "Fix weit direktional" und eine Verbesserung von 1,2 dB im Vergleich zu AutoFocus 360 für Sprache, die von vorne geortet wird, bieten (Unitron, 2023). Der SNR-Vorteil wurde unter Verwendung einer von Hagerman und Olofsson (2004) beschriebenen Signalinversionstechnik geschätzt.

Image showing a talker from the front

Graphic: Average SNR benefit by mic mode

Wenn HyperFocus doch die maximale Richtwirkung bietet, warum sollte man ihn bei Sprache von vorne nicht immer verwenden? Dafür gibt es mehrere Gründe. Binaurale Richtmikrofone verbrauchen mehr Strom als herkömmliche Richtmikrofone, da ein vollständiger Audioaustausch zwischen den beiden Hörsystemen erforderlich ist, um diesen Beamforming-Modus zu erzeugen. Ein binaurales Richtmikrofon wird erzeugt, indem die Eingangssignale aus allen vier Mikrofonen der beiden Hörsysteme kombiniert werden. Das bedeutet, dass beide Hörsysteme als Paar das gleiche Signal ausgeben, was sich auf die Lokalisierungshinweise auswirkt (Derleth et al., 2021). Obwohl ein binaurales Richtmikrofon die beste Verbesserung des SNR für einen Sprecher direkt vor dem Hörer bietet, reduziert es die Wahrnehmung von Geräuschen, die von abseits kommen, was weniger wünschenswert ist, wenn kein Gespräch stattfindet.

HyperFocus ist nur als Teil des Automatik-Programms für Vivante Hörsysteme der Technologieebene 9 verfügbar. HyperFocus ist in einem manuellen Programm sowohl für Technologieebene 9 als auch 7 verfügbar. Innerhalb eines manuellen Programms kann die Intensität von HyperFocus eingestellt werden. Bei maximaler Intensität beträgt der SNR-Vorteil HyperFocus 3,7dB, was einem zusätzlichen SNR-Vorteil von 0,5 dB im Vergleich zur Standardeinstellung entspricht (Unitron, 2023).


Zusammenfassung

Die Philosophie von Unitron besteht darin, ein fortschrittliches Automatiksystem zu entwickeln, das in der Lage ist, ein Hörszenario zu charakterisieren und sich entsprechend anzupassen, um die Benutzerfreundlichkeit zu erhöhen und potenzielle Fehler zu reduzieren. Unser Klassifizierungssystem kann sowohl einfache als auch komplexe Hörumgebungen präzise klassifizieren. Unitron Hörsysteme können die An- oder Abwesenheit von Sprache in der Umgebung, und wenn Sprache vorhanden ist, ihre Richtung erkennen. Integra OS und AutoFocus 360 ermöglichen es Vivante-Hörgeräten, die Umgebung zu nutzen

Klassifizierung und Sprachlokalisierung, um ihre Richtantwort intelligent an die akustische Umgebung des Trägers anzupassen. Die Leistung für jede Zielausrichtung ist immer ein Gleichgewicht zwischen der Fokussierung auf die gewünschte Sprache, der Reduzierung des Gesamtlautstärkepegels der Hintergrundgeräusche, der Aufrechterhaltung der Wahrnehmung von Geräuschen von außerhalb und der Reduzierung der hörbaren Übergänge, wenn sich die Zielposition ändert. Durch das Hinzufügen von HyperFocus, unserem schärfsten binauralen Mikrofonmodus, kann Integra OS auch in den komplexesten Hörumgebungen besser reagieren.