Um homem olha para um pequeno espelho colocado acima dos óculos de sol

Directional responses to environment classification and speech location

quarta-feira, novembro 1, 2023

Unitron

Documentos técnicos
Blu

Introdução

Na vida cotidiana, as pessoas vivenciam uma infinidade de ambientes acústicos: conversas tranquilas em casa, almoço com um amigo em um restaurante barulhento ou pedir direções em uma esquina movimentada. Os parâmetros acústicos nesses diferentes ambientes podem variar significativamente e mudar dinamicamente. A experiência auditiva de um usuário de aparelho auditivo depende de quão bem as configurações do aparelho auditivo correspondem ao seu ambiente acústico. À medida que a cena sonora muda, a resposta de seus aparelhos auditivos pode precisar ser adaptada ao novo ambiente. Isso pode ser feito manualmente pelo usuário ou automaticamente pelos aparelhos auditivos. Para que os aparelhos auditivos se adaptem automaticamente, eles precisam ser capazes de identificar corretamente o ambiente em mudança e, em seguida, fazer os ajustes apropriados.

A filosofia de processamento de sinal da Unitron

"Na Unitron, acreditamos que um programa automático sofisticado, capaz de caracterizar o cenário de escuta e ajustar o desempenho de acordo, oferece a vantagem de facilidade de uso e reduz o risco de erros potenciais, como selecionar o programa manual errado ou não mudar o programa ativo de forma alguma."

(Cornelisse, 2017)

Os aparelhos auditivos da Unitron têm sido capazes de classificar com precisão os ambientes acústicos há anos. A tecnologia de processamento de som da Unitron continuou a evoluir para otimizar melhor o som em diferentes ambientes. O modo de microfone direcional é uma das funcionalidades que pode ter o maior impacto no desempenho, particularmente em ambientes de alta complexidade. Por anos, a Unitron tem se envolvido e ajustado a resposta direcional de acordo com o ambiente classificado. Com a plataforma Vivante^{^™}, a capacidade dos aparelhos auditivos Unitron de adaptar sua resposta direcional com base no ambiente acústico do usuário foi ainda mais aprimorada com a adição do HyperFocus. HyperFocus oferece o maior potencial de aumento na relação sinal-ruído (SNR) nos ambientes mais complexos.

Classificação do ambiente

Para implementar a filosofia da Unitron, o primeiro passo é identificar com precisão o cenário de escuta, que pode ser caracterizado em vários aspectos do ambiente acústico, por exemplo, o nível geral de som, a presença ou ausência de fala e/ou ruído de fundo, o SNR e a localização da fala em relação ao ouvinte. Cornelisse (2017) descreveu como qualquer cenário de escuta pode ser quantificado em três dimensões principais: 1) nível geral, 2) tipo de ruído e 3) SNR.

Figura 1. Um exemplo de como diferentes cenários de escuta
podem ser mapeados dentro do espaço acústico definido pelas três dimensões principais (Cornelisse, 2017).

Hayes (2021) comparou o desempenho do Classificador Conversacional da Unitron com o de ouvintes normais e descobriu que o sistema de classificação da Unitron foi capaz de classificar com precisão tanto ambientes de escuta simples quanto complexos. Neste estudo, 26 diferentes ambientes acústicos foram inicialmente classificados por 20 ouvintes com audição normal para estabelecer uma linha de base. O desempenho dos classificadores usados nos aparelhos auditivos premium da Unitron e de quatro outros grandes fabricantes foi então comparado ao desempenho da linha de base estabelecida por ouvintes com audição normal. O desempenho do classificador da Unitron foi altamente consistente com o dos ouvintes normais.

Graph presenting Unitron hearing aids confronted with competitors in the One talker in quiet environment

Graphics illustrating the subway hearing aids classifier

Figura 2. Um exemplo dos resultados da classificação
de Hayes (2021) para um ambiente simples e complexo.

As três dimensões descritas por Cornelisse (2017) são a base do classificador conversacional da Unitron. Este sistema de classificação evoluiu ao longo do tempo, e os aparelhos auditivos Vivante agora são capazes de classificar até oito ambientes de escuta, incluindo a adição mais recente, conversa em ruído alto, que emprega o modo de microfone HyperFocus:

Conversa no silêncio
Conversa em um grupo pequeno
Conversa em uma multidão
Conversa no ruído
Conversa em ruído forte
Silêncio
Ruído
Música

Localização do discurso

Não importa quão preciso, apenas identificar o ambiente acústico não é suficiente. Se uma conversa em um ambiente barulhento for identificada, ainda é vital determinar a localização do parceiro de conversa para aplicar a resposta direcional correta. Walden et al. (2004) relataram que em 20% das situações de escuta o ouvinte não está de frente para o falante. Da mesma forma, Hayes (2022) relatou que em situações de escuta complexas as pessoas não estão voltadas para a direção da fala (25% do tempo) quase tão frequentemente quanto estão (30% do tempo). Hayes (2022) também relatou que a porcentagem de tempo sem falante alvo foi altamente correlacionada com o tempo classificado como Apenas Ruído pelo classificador da Unitron.

Figura 3. A mediana e os intervalos interquartis
para fala da frente, dos lados ou de trás em
percentual de tempo relatado por Hayes (2022).

Formação de feixe direcional

Antes de discutir como os aparelhos auditivos Vivante adaptam sua direcionalidade com base no ambiente classificado e na localização da fala, é importante entender alguns conceitos básicos de microfones direcionais. A resposta direcional dos instrumentos auditivos modernos é criada combinando a entrada de dois ou mais microfones diferentes que estão localizados em diferentes locais físicos no instrumento auditivo. Isso será referido como o beamformer direcional.

Antes do lançamento da plataforma Vivante, os aparelhos auditivos da Unitron usavam um modo de formação de feixe tradicional que utilizava os dois microfones de um único aparelho auditivo para criar a resposta direcional. Os sinais dos dois microfones são combinados e, devido a um atraso entre os microfones (externo causado pela distância física e interno aplicado durante o processamento do sinal), a sensibilidade a entradas de diferentes locais irá variar (Ricketts, 2005). Como a resposta direcional é criada usando os microfones de um único aparelho auditivo, isso é referido como um formador de feixe monoaural.

Em um ajuste binaural, a troca de dados entre os dois aparelhos auditivos é usada para coordenar a resposta direcional de cada aparelho auditivo. Isso permite que a resposta direcional de um par de aparelhos auditivos Unitron trabalhe em conjunto como um sistema binaural.

Com o lançamento do Vivante, a Unitron agora tem um modo de formação de feixe binaural chamado HyperFocus. Este efeito de microfone direcional é criado combinando o áudio de todos os quatro microfones em um par de aparelhos auditivos. Isso é diferente da troca de dados historicamente usada. O sinal de áudio completo é trocado entre os dois aparelhos auditivos para criar uma resposta direcional mais estreita do que é possível com um formador de feixe monoaural tradicional

Perceptualmente, essa mistura entre os sinais dos instrumentos auditivos esquerdo e direito leva à impressão de que todas as fontes estão localizadas em um único local, à frente, e é experimentada como um feixe estreito com menos ruído interferente vindo de trás e, particularmente, dos lados (Derleth et al., 2021).

Figura 4. Uma ilustração da troca de áudio usada para criar HyperFocus.

Direcionalidade baseada no ambiente e localização da fala

O sistema da Unitron pode classificar com precisão o ambiente acústico do usuário e também pode detectar a localização da fala. Hayes (2022) descobriu que, em média, as pessoas passam cerca de 26% do seu tempo em ambientes complexos. Sabemos se o usuário está em um ambiente simples ou complexo. Se o usuário estiver em um ambiente complexo, sabemos se há fala ou não, e se houver fala presente, sabemos de que direção ela está vindo.

Integra OS é o nome do sofisticado sistema automático dentro da plataforma Vivante que ajusta múltiplos parâmetros nos instrumentos auditivos em resposta a mudanças no ambiente acústico. Um dos parâmetros que ajusta automaticamente é a resposta direcional dos aparelhos auditivos.

Ambientes de baixa complexidade

O objetivo em ambientes de escuta de baixa complexidade é fornecer consciência dos sons ambientais enquanto mantém as pistas acústicas necessárias para a localização do som. Quando a SNR é alta, não precisa ser aumentada pelo sistema direcional. Quando um ambiente de menor complexidade é detectado, o modo de microfone usado pelos produtos Unitron Vivante é o Efeito Pinna 2. O Efeito Pinna 2 foi desenvolvido para recriar a resposta direcional do ouvido humano médio. Como uma orelha humana, a resposta direcional é diferente entre os aparelhos auditivos esquerdo e direito, portanto, o Efeito Pinna 2 está disponível apenas para aparelhos auditivos ajustados em par. O Efeito Pinna 2 foi projetado para compensar as pistas tipicamente perdidas com instrumentos auditivos, que são necessárias para localização.

Ambientes de alta complexidade

Em um ambiente complexo, o objetivo depende da presença ou ausência de fala no ambiente. Se a fala for detectada, queremos que a resposta direcional aumente a SNR do falante alvo, mas se a fala não for detectada, queremos aplicar uma direcionalidade suave para diminuir parte do ruído de fundo enquanto mantemos a consciência ambiental. Nos aparelhos auditivos Vivante, isso é alcançado automaticamente dentro do Integra OS, que ativa o modo de microfone AutoFocus 360.

Nenhum falante alvo

Quando nenhum discurso é detectado em um ambiente complexo, o AutoFocus 360 aplica uma resposta direcional simétrica fixa e ampla voltada para frente. O padrão de formação de feixe é projetado para reduzir o ruído de fundo da parte traseira, enquanto mantém a consciência ambiental da frente e dos lados. Comparado ao Efeito Pinna 2, este modo reduz o ruído de fundo ambiente, mas não tanto quanto um beamformer frontal totalmente engajado.

Image representing a talker form the side

Falador de lado

Quando a fala está localizada à direita ou à esquerda em um ambiente complexo, uma resposta assimétrica é aplicada. No lado em que a fala é detectada, um padrão de feixe voltado para o lado é aplicado para enfatizar a fala do mesmo lado. Do outro lado, um padrão de formação de feixe frontal adaptativo é aplicado para reduzir o ruído desse lado e de trás. Por exemplo, se a fala estiver localizada à direita, o aparelho auditivo direito se concentrará à direita e o aparelho auditivo esquerdo se concentrará à frente. O efeito é o aumento da saliência do falante ao lado, enquanto proporciona uma redução geral do ruído de fundo ambiente.

Falador de trás

Quando a fala está localizada para trás em um ambiente complexo, ambos os aparelhos auditivos aplicam um feixe direcional voltado para trás. O feixe direcional voltado para trás foca-se na parte traseira enquanto mantém alguma audibilidade para sons da frente.

O efeito é o aumento da saliência do falante para o fundo, enquanto proporciona uma redução geral do ruído de fundo ambiente de outras direções. Neste caso, embora os sinais da frente sejam reduzidos, eles ainda são audíveis para manter um equilíbrio entre o foco do falante para trás e a consciência de outros sons fora do eixo – especialmente para sons da frente.

Falador de frente

Quando a fala está localizada à frente em um ambiente complexo, a resposta direcional dos aparelhos auditivos Vivante depende do nível geral do ambiente. Em ambientes moderadamente barulhentos, a resposta direcional de ambos os aparelhos auditivos é um formador de feixe tradicional com um padrão frontal adaptativo.

Se o ambiente estiver muito barulhento, um ambiente dedicado do Integra OS ativará automaticamente o HyperFocus, o beamformer binaural. É aplicado para fornecer desempenho direcional máximo. Para produtos recarregáveis com um acelerômetro embutido, a resposta também depende de se o usuário do aparelho auditivo está se movendo ou não. O HyperFocus não será ativado se os aparelhos auditivos detectarem que o usuário está andando.

Falante da frente em alto ruído

Com a adição do HyperFocus à plataforma Vivante, o Integra OS agora possui um modo de microfone adicional para ajudar os usuários em seus ambientes mais desafiadores. Com todos os recursos na força padrão, o HyperFocus pode fornecer uma melhoria média de SNR nas frequências audiométricas (250-8000 Hz) de 2,8 dB em comparação com o modo de microfone Fixed Wide e uma melhoria de 1,2 dB em comparação com o AutoFocus 360 para fala localizada à frente (Unitron, 2023). O benefício de SNR foi estimado usando uma técnica de inversão de sinal descrita por Hagerman e Olofsson (2004).

Graphic: Average SNR benefit by mic mode

Figura 5. Esses valores foram derivados de gravações
feitas com base em uma perda auditiva plana de 60 dB HL (apenas AC) usando dispositivos Moxi Vivante RIC no KEMAR em um arranjo de 10 alto-falantes. Receptores M e cúpulas de potência foram usados e o acoplamento no TrueFit foi configurado para Cúpula de Potência. O estímulo de fala foi apresentado pela frente e o ruído de banda larga foi apresentado a ±30, ±45, ±90, ±135 e 180 graus. O nível geral foi de 83 dB SPL com um SNR de 0 dB. O estímulo de fala foi o Sinal de Teste de Fala Internacional (ISTS) e o ruído de banda larga foi o Ruído Feminino Internacional (IFnoise). Os recursos adaptativos estavam nas configurações padrão. (Unitron, 2023).

Como o HyperFocus fornece máxima direcionalidade, por que não usá-lo sempre quando a fala vem da frente? Isso é por uma série de razões. Formadores de feixe binaurais usam mais corrente do que formadores de feixe tradicionais devido à troca completa de áudio entre o par de aparelhos auditivos necessária para criar este modo de formação de feixe. Um beamformer binaural é criado combinando os sinais de entrada de todos os quatro microfones em um par de aparelhos auditivos. Isso significa que ambos os aparelhos auditivos do par emitem o mesmo sinal, o que impacta as pistas de localização (Derleth et al., 2021). Embora um beamformer binaural forneça a melhor melhoria no SNR para um falante diretamente à frente do ouvinte, ele reduz a percepção de sons que estão fora do eixo, o que é menos desejável, se uma conversa não estiver ocorrendo.

HyperFocus está disponível apenas como parte do programa automático para aparelhos auditivos Vivante no nível de tecnologia 9. HyperFocus está disponível em um programa manual nos níveis de tecnologia 9 e 7. Dentro de um programa manual, a força do HyperFocus pode ser ajustada. Na força máxima, o benefício de SNR fornecido pelo HyperFocus é de 3,7 dB, um adicional de 0,5 dB de benefício de SNR quando comparado à configuração padrão (Unitron, 2023).

Resumo

A filosofia da Unitron é criar um sistema automático sofisticado que seja capaz de caracterizar um cenário de escuta e ajustar-se de acordo com o objetivo de aumentar a facilidade de uso e reduzir potenciais erros. Nosso sistema de classificação pode classificar com precisão tanto ambientes de escuta simples quanto complexos. Os aparelhos auditivos Unitron podem detectar a presença ou ausência de fala e, quando a fala está presente, detectar sua direção. Integra OS e AutoFocus 360 permitem que os aparelhos auditivos Vivante usem o ambiente

classificação e localização da fala para adaptar inteligentemente sua resposta direcional ao ambiente acústico do usuário. O desempenho para cada local de destino é um equilíbrio entre o foco no local de destino, a redução do nível geral de ruído de fundo ambiente, a manutenção da consciência dos sons fora do eixo e a redução das transições audíveis à medida que o local de destino muda. A adição do HyperFocus, nosso modo de microfone binaural mais agressivo, permite que o Integra OS responda melhor nos ambientes de escuta mais complexos.

Referências

Cornelisse, L. (2017). Uma estrutura conceitual para alinhar o desempenho sonoro com as necessidades e preferências do ouvinte para alcançar o mais alto nível de satisfação com a amplificação. http://dx.doi.org/10.13140/RG.2.2.10315.08486

Derleth, P., Georganti, E., Latzel, M., Courtois, G., Hofbauer, M., Raether, J., & Kuehnel, V. (2021). Processamento de Sinal Binaural em Aparelhos Auditivos. Seminários em audição, 42(3), 206–223. https://doi.org/10.1055/s-0041-1735176

Hagerman, B. & Olofsson, A. (2004). Um método para medir o efeito dos algoritmos de redução de ruído usando fala e ruído simultâneos. Acta Acustica united with Acustica. 90, 356-361.

Hayes, D. (2021). Classificação Ambiental em Aparelhos Auditivos. Seminars in Hearing, 42(3), 186-205. https://doi.org/10.1055/s-0041-1735175

Hayes, D. (2022). Olá! Estou aqui: Log It All e a direção da fala Unitron. https://www.unitron.com/content/dam/echo/en_us/learn/UH_FieldStudyNews_LogIt_AllDirectionOfSpeech_EN.pdf

Ricketts T. A. (2005). Aparelhos auditivos direcionais: antes e agora. Journal of rehabilitation research and development, 42(4 Suppl 2), 133–144.

Unitron (2023). Relatório de Verificação 23EQ - Desempenho Direcional Moxi V9 R RIC. PDL-13831 [2]. Documento interno não publicado da empresa.

Walden, B. E., Surr, R. K., Cord, M. T., & Dyrlund, O. (2004). Prevendo a preferência de microfone de instrumento auditivo na escuta cotidiana. J Am Acad Audiol, 15(5), 365-396. https://doi.org/10.3766/jaaa.15.5.4