Tecnologia Científica

A IA reduz o 'gap de comunicação' para pessoas não verbais em atémetade
Os pesquisadores usaram a inteligaªncia artificial para reduzir a “lacuna de comunicaça£o” para pessoas não-verbais com deficiência motora que dependem de computadores para conversar com outras pessoas.
Por Sarah Collins - 16/06/2020


Bala£o de fala - Crédito: Foto de Volodymyr Hryshchenko no Unsplash

A equipe, da Universidade de Cambridge e da Universidade de Dundee, desenvolveu um novo manãtodo de reconhecimento de contexto que reduz essa lacuna de comunicação, eliminando entre 50% e 96% das teclas digitadas que a pessoa precisa digitar para se comunicar.

O sistema évoltado especificamente para pessoas não verbais e usa uma sanãrie de 'pistas' de contexto - como a localização do usua¡rio, a hora do dia ou a identidade do parceiro que fala o usua¡rio - para ajudar a sugerir frases mais relevantes para o usua¡rio. .

"Esse manãtodo nos da¡ esperana§a de sistemas com infusão de IA mais inovadores para ajudar as pessoas com deficiências motoras a se comunicarem no futuro"

Per Ola Kristensson

Pessoas não-verbais com deficiência motora costumam usar um computador com saa­da de fala para se comunicar com outras pessoas. No entanto, mesmo sem uma deficiência física que afeta o processo de digitação, esses meios de comunicação são muito lentos e propensos a erros para uma conversa significativa: as taxas tipicas de digitação são entre cinco e 20 palavras por minuto, enquanto uma taxa ta­pica de fala estãona faixa de 100 140 palavras por minuto.

"Essa diferença nas taxas de comunicação éconhecida como lacuna na comunicação", disse o professor Per Ola Kristensson, do Departamento de Engenharia de Cambridge, principal autor do estudo. "A diferença étipicamente entre 80 e 135 palavras por minuto e afeta a qualidade das interações dia¡rias para as pessoas que dependem dos computadores se comunicarem".

O manãtodo desenvolvido por Kristensson e seus colegas usa inteligaªncia artificial para permitir que um usua¡rio recupere rapidamente sentena§as digitadas no passado. Pesquisas anteriores mostraram que as pessoas que confiam na sa­ntese da fala, assim como todos os outros, tendem a reutilizar muitas das mesmas frases e frases na conversa cotidiana. No entanto, a recuperação dessas frases e sentena§as éum processo demorado para os usuários das tecnologias de sa­ntese de fala existentes, diminuindo ainda mais o fluxo da conversa.

No novo sistema, enquanto a pessoa digita, o sistema usa algoritmos de recuperação de informações para recuperar automaticamente as frases anteriores mais relevantes com base no texto digitado e no contexto em que a pessoa estãoenvolvida. O contexto inclui informações sobre a conversa, como o localização, hora do dia e identificação automa¡tica do rosto do parceiro que fala. O outro orador éidentificado usando um algoritmo de visão computacional treinado para reconhecer rostos humanos de uma ca¢mera montada na frente.

O sistema foi desenvolvido usando manãtodos de engenharia de projeto normalmente usados ​​para motores a jato ou dispositivos médicos. Os pesquisadores identificaram primeiro as funções cra­ticas do sistema, como a palavra função de preenchimento automa¡tico e a função de recuperação de sentena§as. Apa³s a identificação dessas funções, os pesquisadores simularam uma pessoa não verbal digitando um grande conjunto de frases a partir de um conjunto de frases representativo do tipo de texto que uma pessoa não verbal gostaria de comunicar.

Essa análise permitiu que os pesquisadores entendessem o melhor manãtodo para recuperar sentena§as e o impacto de uma sanãrie de parametros no desempenho, como a precisão do preenchimento automa¡tico de palavras e o impacto do uso de muitas tags de contexto. Por exemplo, essa análise revelou que apenas duas tags de contexto razoavelmente precisas são necessa¡rias para fornecer a maior parte do ganho. O preenchimento automa¡tico de palavras fornece uma contribuição positiva, mas não éessencial para a realização da maior parte do ganho. As frases são recuperadas usando algoritmos de recuperação de informações, semelhantes a  pesquisa na web. Tags de contexto são adicionadas a s palavras que o usua¡rio digita para formar uma consulta.

O estudo éo primeiro a integrar a recuperação de informações sensa­veis ao contexto com dispositivos geradores de fala para pessoas com deficiências motoras, demonstrando como a inteligaªncia artificialsensívelao contexto pode melhorar a vida das pessoas com deficiências motoras.

"Esse manãtodo nos da¡ esperana§a de sistemas mais inovadores, com infusão de IA, para ajudar as pessoas com deficiências motoras a se comunicarem no futuro", disse Kristensson. "Mostramos que épossí­vel reduzir o custo de oportunidade de não realizar pesquisas inovadoras com interfaces de usua¡rio com infusão de IA que desafiam o mantra e os processos tradicionais de design de interface de usua¡rio".

O trabalho de pesquisa foi publicado no CHI 2020.

A pesquisa foi financiada pelo Conselho de Pesquisa em Engenharia e Ciências Fa­sicas.

 

.
.

Leia mais a seguir