Skip to main content
Een man kijkt naar een kleine spiegel boven een zonnebril

Richtingreacties op omgevingsclassificatie en spraaklocatie

woensdag, november 1, 2023
Unitron
  • Whitepapers
  • Blu

Introductie

In het dagelijks leven ervaren mensen een veelheid aan akoestische omgevingen: stille gesprekken thuis, lunchen met een vriend in een lawaaierig restaurant, of de weg vragen op een drukke straathoek. De akoestische parameters in deze verschillende omgevingen kunnen aanzienlijk variëren en dynamisch veranderen. De luisterervaring van een hoortoesteldrager hangt af van hoe goed de instellingen van hun hoortoestel overeenkomen met hun akoestische omgeving. Naarmate hun geluidsomgeving verandert, moet de respons van hun hoortoestellen mogelijk worden aangepast aan de nieuwe omgeving. Dit kan handmatig door de drager worden gedaan of automatisch door de hoortoestellen. Opdat de hoortoestellen zich automatisch kunnen aanpassen, moeten ze in staat zijn om de veranderende omgeving correct te identificeren en vervolgens de juiste aanpassingen te maken.

Unitron's signaalverwerkingsfilosofie

“Bij Unitron geloven we dat een geavanceerd automatisch programma, dat in staat is om het luisterscenario te karakteriseren en de prestaties dienovereenkomstig aan te passen, het voordeel biedt van gebruiksgemak en het risico op potentiële fouten vermindert, zoals het selecteren van het verkeerde handmatige programma of het helemaal niet wijzigen van het actieve programma.”

(Cornelisse, 2017)

Unitron hoortoestellen zijn al jaren in staat om akoestische omgevingen nauwkeurig te classificeren. De geluidsverwerkingstechnologie van Unitron is blijven evolueren om het geluid in verschillende omgevingen beter te optimaliseren. De richtmicrofoonmodus is een van de functies die de grootste impact op de prestaties kan hebben, vooral in omgevingen met hoge complexiteit. Unitron heeft jarenlang de richtingsgevoeligheid aangepast aan de geclassificeerde omgeving. Met het Vivante-platform is het vermogen van Unitron-hoortoestellen om hun richtingsgevoeligheid aan te passen op basis van de akoestische omgeving van de drager verder verbeterd met de toevoeging van HyperFocus. HyperFocus biedt de grootste potentiële verhoging van de signaal-ruisverhouding (SNR) in de meest complexe omgevingen.

Omgevingsclassificatie

Om de filosofie van Unitron te implementeren, is de eerste stap het nauwkeurig identificeren van het luisterscenario, dat kan worden gekarakteriseerd over meerdere aspecten van de akoestische omgeving, bijvoorbeeld het algehele geluidsniveau, de aanwezigheid of afwezigheid van spraak en/of achtergrondgeluid, de SNR en de locatie van spraak ten opzichte van de luisteraar. Cornelisse (2017) beschreef hoe elk luisterscenario kan worden gekwantificeerd langs drie belangrijke dimensies: 1) algemeen niveau, 2) type geluid, en 3) SNR.

Graphics: 3-dimensional world of sound

Hayes (2021) vergeleek de prestaties van Unitron's Conversational Classifier met die van normaalhorende luisteraars en ontdekte dat Unitron's classificatiesysteem zowel eenvoudige als complexe luisteromgevingen nauwkeurig kon classificeren. In deze studie werden 26 verschillende akoestische omgevingen eerst geclassificeerd door 20 normaal horende luisteraars om een basislijn vast te stellen. De prestaties van de classificatoren die worden gebruikt in de premium hoortoestellen van Unitron en vier andere grote fabrikanten werden vervolgens vergeleken met de prestaties van de basislijn die is vastgesteld door normaalhorende luisteraars. De prestaties van de classifier van Unitron waren zeer consistent met die van normaalhorende luisteraars.


Graph presenting Unitron hearing aids confronted with competitors in the One talker in quiet environment
Graphics illustrating the subway hearing aids classifier

De drie dimensies beschreven door Cornelisse (2017) vormen de basis van Unitron's conversatieclassificator. Dit classificatiesysteem is in de loop der tijd geëvolueerd, en Vivante-hoortoestellen zijn nu in staat om tot acht luisteromgevingen te classificeren, inclusief de meest recente toevoeging, gesprek in luid lawaai dat de HyperFocus-microfoonmodus gebruikt:

  1. Gesprek in rust
  2. Gesprek in een kleine groep
  3. Gesprek in een grote groep
  4. Gesprek in lawaai
  5. Gesprek in veel lawaai
  6. Rustig
  7. Lawaai
  8. Muziek

Locatie van spraak

Hoe nauwkeurig ook, alleen het identificeren van de akoestische omgeving is niet genoeg. Als een gesprek in een lawaaierige omgeving wordt geïdentificeerd, is het nog steeds van vitaal belang om de locatie van de gesprekspartner te bepalen om de juiste richtingsreactie toe te passen. Walden et al. (2004) meldden dat in 20% van de luistersituaties de luisteraar de spreker niet aankijkt. Evenzo meldde Hayes (2022) dat mensen in complexe luistersituaties niet in de richting van de spraak kijken (25% van de tijd) bijna net zo vaak als ze dat wel doen (30% van de tijd). Hayes (2022) meldde ook dat het percentage tijd zonder doelspreker sterk gecorreleerd was met de tijd die door Unitron's classifier als alleen ruis werd geclassificeerd. 

Illustration: Target speech location

Richtinggevoelige bundelvorming

Voordat we bespreken hoe Vivante-hoortoestellen hun directionele werking aanpassen op basis van de geclassificeerde omgeving en de locatie van spraak, is het belangrijk om enkele basisprincipes van directionele microfoons te begrijpen. De richtingsgevoeligheid van moderne hoortoestellen wordt gecreëerd door de input van twee of meer verschillende microfoons te combineren die zich op verschillende fysieke locaties op het hoortoestel bevinden. Dit wordt aangeduid als de directionele beamformer.


Vóór de lancering van het Vivante-platform gebruikten Unitron-hoortoestellen een traditionele beamforming-modus die de twee microfoons van een enkel hoortoestel gebruikte om de directionele respons te creëren. De signalen van de twee microfoons worden gecombineerd en door een vertraging tussen de microfoons (extern veroorzaakt door fysieke afstand en intern toegepast tijdens signaalverwerking) zal de gevoeligheid voor invoer van verschillende locaties variëren (Ricketts, 2005). Aangezien de richtingsgevoeligheid wordt gecreëerd met behulp van de microfoons van een enkel hoortoestel, wordt dit een monaurale beamformer genoemd.

Bij een binaurale aanpassing wordt gegevensuitwisseling tussen de twee hoortoestellen gebruikt om de richtingsgevoeligheid van elk hoortoestel te coördineren. Dit stelt de richtingsgevoeligheid van een paar Unitron-hoortoestellen in staat om samen te werken als een binauraal systeem.

Met de lancering van Vivante heeft Unitron nu een binaurale beamforming-modus genaamd HyperFocus. Dit directionele microfooneffect wordt gecreëerd door de audio van alle vier de microfoons in een paar hoortoestellen te combineren. Dit is anders dan de gegevensuitwisseling die historisch werd gebruikt. Het volledige audiosignaal wordt uitgewisseld tussen de twee hoortoestellen om een nauwere richtingsgevoeligheid te creëren dan mogelijk is met een traditionele monaurale beamformer

Perceptueel leidt deze mix tussen linker- en rechterhoortoestelsignalen tot de indruk dat alle bronnen zich op één locatie bevinden, aan de voorkant, en wordt ervaren als een smalle straal met minder storend geluid van achteren en vooral van de zijkanten (Derleth et al., 2021).

Image: Binaural beamforming mode

Richting gebaseerd op omgeving en locatie van spraak

Het systeem van Unitron kan de akoestische omgeving van de gebruiker nauwkeurig classificeren en kan ook de locatie van spraak detecteren. Hayes (2022) vond dat mensen gemiddeld ongeveer 26% van hun tijd in complexe omgevingen doorbrengen. We weten of de gebruiker zich in een eenvoudige of complexe omgeving bevindt. Als de gebruiker zich in een complexe omgeving bevindt, weten we of er spraak is of niet, en als er spraak aanwezig is, weten we uit welke richting het komt.

Integra OS is de naam van het geavanceerde automatische systeem binnen het Vivante-platform dat meerdere parameters binnen de hoortoestellen aanpast in reactie op veranderingen in de akoestische omgeving. Een van de parameters die het automatisch aanpast, is de richtingsgevoeligheid van de hoortoestellen.

Omgevingen met lage complexiteit

Het doel in omgevingen met lage complexiteit is om bewustzijn van omgevingsgeluiden te bieden terwijl de akoestische aanwijzingen die nodig zijn voor geluidslokalisatie behouden blijven. Wanneer de SNR hoog is, hoeft deze niet te worden verhoogd door het directionele systeem. Wanneer een omgeving met lagere complexiteit wordt gedetecteerd, is de microfoonmodus die door Unitron Vivante-producten wordt gebruikt Pinna Effect 2. Pinna Effect 2 is ontwikkeld om de directionele respons van het gemiddelde menselijk oor na te bootsen. Net als een menselijk oor is de richtingsgevoeligheid verschillend tussen het linker- en rechterhoortoestel, dus Pinna Effect 2 is alleen beschikbaar voor hoortoestellen die in een paar worden gedragen. Pinna Effect 2 is ontworpen om te compenseren voor signalen die typisch verloren gaan met hoortoestellen, die nodig zijn voor lokalisatie.


Omgevingen met hoge complexiteit

In een complexe omgeving hangt het doel af van de aanwezigheid of afwezigheid van spraak in de omgeving. Als spraak wordt gedetecteerd, willen we dat de directionele respons de SNR van de doelspreker verhoogt, maar als er geen spraak wordt gedetecteerd, willen we milde directionaliteit toepassen om een deel van het achtergrondgeluid te verminderen terwijl we de omgevingsbewustheid behouden. In Vivante hoortoestellen wordt dit automatisch bereikt binnen Integra OS, dat de AutoFocus 360 microfoonmodus activeert.

Geen doelspreker

Wanneer er geen spraak wordt gedetecteerd in een complexe omgeving, past AutoFocus 360 een symmetrische vaste brede voorwaartse gerichte respons toe. Het beamforming-patroon is bedoeld om achtergrondgeluid van de achterkant te verminderen, terwijl het omgevingsbewustzijn van de voorkant en zijkanten behouden blijft. Vergeleken met Pinna Effect 2, vermindert deze modus het omgevingsgeluid, maar niet zo veel als een volledig ingeschakelde naar voren gerichte beamformer.

Image representing a talker form the side

Spraak van de zijkant

Wanneer spraak zich aan de rechter- of linkerkant in een complexe omgeving bevindt, wordt een asymmetrische respons toegepast. Aan de kant waar spraak wordt gedetecteerd, wordt een zijwaarts gericht beamformer-patroon toegepast om spraak van dezelfde kant te benadrukken. Aan de andere kant wordt een adaptief voorwaarts bundelvormingspatroon toegepast om het geluid van die kant en de achterkant te verminderen. Als bijvoorbeeld spraak zich aan de rechterkant bevindt, zal het rechter hoortoestel zich op rechts richten en het linker hoortoestel zich op de voorkant richten. Het effect is een verhoogde opvallendheid van de spreker aan de zijkant, terwijl er een algehele vermindering van het omgevingsgeluid wordt geboden.

Spraak van achteren

Wanneer spraak zich aan de achterkant bevindt in een complexe omgeving, passen beide hoortoestellen een naar achteren gerichte directionele straal toe. De naar achteren gerichte richtstraal richt zich naar achteren terwijl hij enige hoorbaarheid voor geluiden van voren behoudt. 

Het effect is een verhoogde opvallendheid van de spreker naar de achterkant, terwijl er een algehele vermindering van omgevingsgeluid uit andere richtingen wordt geboden. In dit geval, hoewel signalen van voren worden verminderd, zijn ze nog steeds hoorbaar om een balans te behouden tussen de focus van de spreker naar achteren en het bewustzijn van andere off-axis geluiden – vooral voor geluiden van voren.

Image showing a talker from back
Image showing a talker from the front

Spraak van voren

Wanneer spraak zich aan de voorkant bevindt in een complexe omgeving, hangt de richtingsgevoeligheid van Vivante-hoortoestellen af van het algehele niveau van de omgeving. In matig luide omgevingen is de richtingsgevoeligheid van beide hoortoestellen een traditionele beamformer met een adaptief voorpatroon.

Als de omgeving erg luid is, zal een speciale Integra OS-omgeving automatisch HyperFocus, de binaurale beamformer, inschakelen. Het wordt toegepast om maximale richtingsprestaties te bieden. Voor oplaadbare producten met een ingebouwde versnellingsmeter hangt de respons ook af van of de drager van het hoortoestel beweegt of niet. HyperFocus zal niet inschakelen als de hoortoestellen detecteren dat de drager loopt.

Spraak van voren in luid lawaai

Met de toevoeging van HyperFocus aan het Vivante-platform heeft Integra OS nu een extra microfoonmodus om dragers te helpen in hun meest uitdagende omgevingen. Met alle functies op standaardsterkte kan HyperFocus een gemiddelde SNR-verbetering bieden over de audiometrische frequenties (250-8000 Hz) van 2,8 dB vergeleken met de modus voor vaste brede microfoon en een verbetering van 1,2 dB vergeleken met AutoFocus 360 voor spraak die zich aan de voorkant bevindt (Unitron, 2023). Het SNR-voordeel werd geschat met behulp van een signaalinversietechniek beschreven door Hagerman en Olofsson (2004).

Image showing a talker from the front

Graphic: Average SNR benefit by mic mode

Aangezien HyperFocus maximale richtingsgevoeligheid biedt, waarom zou je het niet altijd gebruiken wanneer spraak van voren komt? Dit is om een aantal redenen. Binaurale beamformers gebruiken meer stroom dan traditionele beamformers vanwege de volledige audio-uitwisseling tussen het paar hoortoestellen die nodig is om deze beamforming-modus te creëren. Een binaurale beamformer wordt gecreëerd door de ingangssignalen van alle vier de microfoons in een paar hoortoestellen te combineren. Dit betekent dat beide hoortoestellen in het paar hetzelfde signaal uitsturen, wat invloed heeft op lokalisatie-aanwijzingen (Derleth et al., 2021). Hoewel een binaurale beamformer de beste verbetering in SNR biedt voor een spreker direct voor de luisteraar, vermindert het de bewustwording van geluiden die buiten de as liggen, wat minder wenselijk is als er geen gesprek plaatsvindt.

HyperFocus is alleen beschikbaar als onderdeel van het automatische programma voor Vivante hoortoestellen op technologieniveau 9. HyperFocus is beschikbaar in een handmatig programma op zowel de 9 als 7 technologieniveaus. Binnen een handmatig programma kan de sterkte van HyperFocus worden aangepast. Bij maximale sterkte is het SNR-voordeel dat door HyperFocus wordt geboden 3,7 dB, een extra 0,5 dB SNR-voordeel vergeleken met de standaardinstelling (Unitron, 2023).


Samenvatting

De filosofie van Unitron is om een verfijnd automatisch systeem te creëren dat in staat is een luisterscenario te karakteriseren en zich dienovereenkomstig aan te passen met als doel het gebruiksgemak te vergroten en potentiële fouten te verminderen. Ons classificatiesysteem kan zowel eenvoudige als complexe luisteromgevingen nauwkeurig classificeren. Unitron hoortoestellen kunnen de aanwezigheid of afwezigheid van spraak detecteren, en wanneer spraak aanwezig is, de richting ervan detecteren. Integra OS en AutoFocus 360 stellen Vivante hoortoestellen in staat om de omgeving te gebruiken

classificatie en spraaklocatie om hun richtingsgevoeligheid intelligent aan te passen aan de akoestische omgeving van de drager. De prestatie voor elke doel locatie is een balans tussen focus op de doel locatie, vermindering van het algehele niveau van omgevingsgeluid, behoud van bewustzijn van off-axis geluiden en vermindering van hoorbare overgangen als de doel locatie verandert. De toevoeging van HyperFocus, onze meest agressieve, binaurale microfoonmodus, stelt Integra OS in staat beter te reageren in de meest complexe luisteromgevingen.