Os pesquisadores usaram a inteligaªncia artificial para reduzir a “lacuna de comunicaça£o†para pessoas não-verbais com deficiência motora que dependem de computadores para conversar com outras pessoas.
Bala£o de fala -Â Crédito: Foto de Volodymyr Hryshchenko no Unsplash
A equipe, da Universidade de Cambridge e da Universidade de Dundee, desenvolveu um novo manãtodo de reconhecimento de contexto que reduz essa lacuna de comunicação, eliminando entre 50% e 96% das teclas digitadas que a pessoa precisa digitar para se comunicar.
O sistema évoltado especificamente para pessoas não verbais e usa uma sanãrie de 'pistas' de contexto - como a localização do usua¡rio, a hora do dia ou a identidade do parceiro que fala o usua¡rio - para ajudar a sugerir frases mais relevantes para o usua¡rio. .
"Esse manãtodo nos da¡ esperana§a de sistemas com infusão de IA mais inovadores para ajudar as pessoas com deficiências motoras a se comunicarem no futuro"
Per Ola Kristensson
Pessoas não-verbais com deficiência motora costumam usar um computador com saada de fala para se comunicar com outras pessoas. No entanto, mesmo sem uma deficiência física que afeta o processo de digitação, esses meios de comunicação são muito lentos e propensos a erros para uma conversa significativa: as taxas tipicas de digitação são entre cinco e 20 palavras por minuto, enquanto uma taxa tapica de fala estãona faixa de 100 140 palavras por minuto.
"Essa diferença nas taxas de comunicação éconhecida como lacuna na comunicação", disse o professor Per Ola Kristensson, do Departamento de Engenharia de Cambridge, principal autor do estudo. "A diferença étipicamente entre 80 e 135 palavras por minuto e afeta a qualidade das interações dia¡rias para as pessoas que dependem dos computadores se comunicarem".
O manãtodo desenvolvido por Kristensson e seus colegas usa inteligaªncia artificial para permitir que um usua¡rio recupere rapidamente sentena§as digitadas no passado. Pesquisas anteriores mostraram que as pessoas que confiam na santese da fala, assim como todos os outros, tendem a reutilizar muitas das mesmas frases e frases na conversa cotidiana. No entanto, a recuperação dessas frases e sentena§as éum processo demorado para os usuários das tecnologias de santese de fala existentes, diminuindo ainda mais o fluxo da conversa.
No novo sistema, enquanto a pessoa digita, o sistema usa algoritmos de recuperação de informações para recuperar automaticamente as frases anteriores mais relevantes com base no texto digitado e no contexto em que a pessoa estãoenvolvida. O contexto inclui informações sobre a conversa, como o localização, hora do dia e identificação automa¡tica do rosto do parceiro que fala. O outro orador éidentificado usando um algoritmo de visão computacional treinado para reconhecer rostos humanos de uma ca¢mera montada na frente.
O sistema foi desenvolvido usando manãtodos de engenharia de projeto normalmente usados ​​para motores a jato ou dispositivos médicos. Os pesquisadores identificaram primeiro as funções craticas do sistema, como a palavra função de preenchimento automa¡tico e a função de recuperação de sentena§as. Apa³s a identificação dessas funções, os pesquisadores simularam uma pessoa não verbal digitando um grande conjunto de frases a partir de um conjunto de frases representativo do tipo de texto que uma pessoa não verbal gostaria de comunicar.
Essa análise permitiu que os pesquisadores entendessem o melhor manãtodo para recuperar sentena§as e o impacto de uma sanãrie de parametros no desempenho, como a precisão do preenchimento automa¡tico de palavras e o impacto do uso de muitas tags de contexto. Por exemplo, essa análise revelou que apenas duas tags de contexto razoavelmente precisas são necessa¡rias para fornecer a maior parte do ganho. O preenchimento automa¡tico de palavras fornece uma contribuição positiva, mas não éessencial para a realização da maior parte do ganho. As frases são recuperadas usando algoritmos de recuperação de informações, semelhantes a pesquisa na web. Tags de contexto são adicionadas a s palavras que o usua¡rio digita para formar uma consulta.
O estudo éo primeiro a integrar a recuperação de informações sensaveis ao contexto com dispositivos geradores de fala para pessoas com deficiências motoras, demonstrando como a inteligaªncia artificialsensívelao contexto pode melhorar a vida das pessoas com deficiências motoras.
"Esse manãtodo nos da¡ esperana§a de sistemas mais inovadores, com infusão de IA, para ajudar as pessoas com deficiências motoras a se comunicarem no futuro", disse Kristensson. "Mostramos que épossível reduzir o custo de oportunidade de não realizar pesquisas inovadoras com interfaces de usua¡rio com infusão de IA que desafiam o mantra e os processos tradicionais de design de interface de usua¡rio".
O trabalho de pesquisa foi publicado no CHI 2020.
A pesquisa foi financiada pelo Conselho de Pesquisa em Engenharia e Ciências Fasicas.