Inovação: Tradução de pensamento em voz

    Neuroengenheiros criaram um programa de computador que traduz o "pensamento" em fala inteligível.

    O "pensamento" na verdade são sinais neurais lidos por uma interface implantada no cérebro de pacientes que estão sendo tratados de epilepsia.

    Monitorando a atividade cerebral desses pacientes, o programa conseguiu reconstruir algumas palavras - os nomes dos números - que uma pessoa ouve com uma clareza notável.

    Esse avanço, que aproveita o poder dos sintetizadores de voz e da inteligência artificial, promete novas formas de interface com a tecnologia, permitindo que, no futuro, os computadores se comuniquem diretamente com o cérebro dos usuários, por exemplo.

    Há grande esperança também de ajudar as pessoas que não podem falar - como as que vivem com esclerose lateral amiotrófica (ELA) ou se recuperando de um derrame - a recuperar sua capacidade de se comunicar com o mundo exterior.

  • Vocoder
   Várias pesquisas mostram que, quando falamos - ou mesmo imaginamos falar -, emergem em nossos cérebros padrões de atividade muito característicos. Padrões de sinais diferentes, mas reconhecíveis, emergem também quando ouvimos alguém falar - ou imaginamos ouvir.

     Mas gravar e decodificar esses padrões, para efetivamente "ler os pensamentos", tem-se mostrado uma tarefa mais difícil do que parecia à primeira vista.

  Os primeiros esforços para decodificar os sinais neurais se concentraram em modelos computacionais simples que analisavam espectrogramas, que são representações visuais de frequências sonoras. Mas essa abordagem não conseguiu produzir nada que se assemelhe à fala inteligível.

    Hassan Akbari e seus colegas da Universidade de Colúmbia, nos EUA, voltaram-se então para outra técnica, conhecida como vocoder, um codificador de voz, na verdade um algoritmo de computador que pode sintetizar a fala depois de ser treinado com gravações de pessoas falando - aparelhos como Amazon Echo e Apple Siri usam vocoders para responder perguntas.

     Bons resultados com números      

     O resultado final foi uma "voz robótica" recitando palavras e uma sequência de números.

     Os pesquisadores decidiram usar apenas os números para testar a precisão da gravação, devido aos melhores resultados. As pessoas deviam ouvir a gravação e relatar o que ouviram. Elas entenderam a tradução dos seus próprios sinais cerebrais em 75% das vezes.

     A equipe planeja a seguir começar a trabalhar com palavras e tentar voltar às sentenças, além de realizar os mesmos testes em sinais cerebrais emitidos quando uma pessoa fala ou imagina a fala.

      Ondas cerebrais são lidas e transformadas em texto

      O sonho ou o pesadelo, de acordo com o ponto de vista, de ler a mente está um pouco mais próximo. Pesquisadores europeus conseguiram registrar ondas cerebrais e transformá-las em letras, palavras e até frases completas. O sistema, formado por uma interface cérebro-máquina, pôde reconstruir 50% das palavras de uma frase, índice muito bom. A notícia ruim é que para consegui-lo é preciso abrir a cabeça para colocar os eletrodos diretamente no cérebro.

      Atrás de cada pensamento, emoção e ação existe uma torrente eletroquímica nos neurônios do cérebro. Esses sinais elétricos podem ser registrados e os neurocientistas há décadas estudam as ondas cerebrais buscando o significado de cada sinal. Criaram gorros cheios de eletrodos que, colocados sobre a cabeça, permitem, por exemplo, uma espécie de comunicação telepática. Dessa forma, em 2014, pesquisadores norte-americanos conectaram dois cérebros à distância. Mas é possível ler a mente de uma pessoa em coma? Os humanos poderão se comunicar com as máquinas somente com o pensamento?

      Um grupo de pesquisadores alemães e norte-americanos não conseguiu ler a mente, mas foi bem-sucedido em transformar as ondas cerebrais em texto com um alto grau de acerto. Projetaram uma interface cérebro-máquina que registra as mudanças de potência nos sinais elétricos do cérebro. Mediante uma técnica de inteligência artificial (aprendizagem de máquinas), o sistema foi sendo afinado até fazer com que cada mudança elétrica correspondesse a um fone, segmento básico do som e que pode ser equiparado a uma letra. Após o treinamento, a interface conseguiu decodificar palavras e até frases.

    “Nosso sistema decodifica frases completas”, diz o pesquisador do Laboratório de Sistemas Cognitivos do Instituto Tecnológico de Karlsruhe (Alemanha) e coautor da pesquisa, Christian Herff. “Conseguimos decodificar em média 7,5 palavras em cada 10, mas somente quando existiam 10 palavras a escolher. Se o sistema pudesse escolher entre 100, conseguimos acertar quatro de dez”, explica. Sobre os fones, o sistema reconhecia por volta de 50%. “Mas não é preciso acertar 100%”, diz Herff. “Ao usar um dicionário que nos mostra como as palavras são produzidas (por exemplo, olá é olá) e um modelo de linguagem, isso nos oferece a probabilidade da palavra seguinte”, acrescenta. Dessa forma usaram uma espécie de adivinhador de textos para completar as lacunas.

       A técnica utilizada para ler a mente é conhecida como eletrocorticografia (ECoG) intracranial. É a melhor maneira que existe para registrar as ondas cerebrais já que oferece maior resolução espacial e temporal. Mas também é a mais invasiva. Ao contrário de outros métodos, como o eletroencefalograma, os eletrodos não são colocados na cabeça, mas diretamente sobre o cérebro, fazendo com que o sinal seja mais claro e não sofra interferência do crânio e do couro cabeludo.

Os pesquisadores tiveram a rara oportunidade de poder realizar várias sessões de ECoG em sete pessoas com epilepsia aguda que teriam o foco epilético extirpado. Com uma janela aberta em seu cérebro, os voluntários tiveram de ler em voz alta fragmentos de textos históricos, como o discurso de posse de John Fitzgerald Kennedy. Os pesquisadores gravaram tanto o áudio como a atividade de ondas gama de áreas cerebrais conhecidas por seu papel no processamento da fala. O passo seguinte foi parcelar em segmentos de 50 milissegundos os dois sinais e deixar que a interface encontrasse correspondências entre a atividade cerebral e os sons.

“Focamos o estudo nas ondas gama de alta frequência (entre 70 e 170 hertz). Essa frequência é conhecida por refletir a atividade muito localizada de funções especializadas do cérebro”, explica Herff. Das cinco ondas cerebrais que a atividade elétrica do cérebro emite, a gama é a de maior frequência e menor amplitude e reflete picos de grande atividade cerebral como a produzida durante a fala.

Para os pesquisadores, que publicaram seus resultados na revista especializada Frontiers in Neuroscience, é somente o primeiro passo para a comunicação mental entre humanos e máquinas. Além disso, segundo Herff, “um sistema que usa padrões de fala pode permitir aos pacientes incomunicáveis relacionarem-se de novo com as pessoas ao seu redor, mas ainda falta tempo para isso”.

         É preciso abrir a cabeça

        Para o pesquisador da empresa Starlab, Giulio Ruffini, que não tem ligação com essa pesquisa, os resultados são muito interessantes porque demonstram que é possível traduzir a atividade elétrica em informação. “Não deveria ser uma surpresa, já que o cérebro é um órgão elétrico e com o ECoG é possível registrar bem essa atividade elétrica, mas não deixa de ser um bom resultado mostrar que é possível extrair fones dessa maneira”, opina.

       Ruffini, que trabalha no desenvolvimento de interfaces cérebro-máquinas, já demonstrou em 2014 que é possível enviar pensamentos de um cérebro a outro situado a milhares de quilômetros de distância. Para ele, não se pode dizer que o pensamento esteja sendo lido no sentido literal, “é preciso entender que é a atividade motora da fala que está sendo decodificada”, diz. O avanço definitivo seria, segundo Ruffini, que um sistema como esse pudesse decodificar no modo leitura silenciosa, sem mover um músculo da língua, ou seja, os pensamentos: “Se isto for feito, já estaremos mais próximos de poder dizer que estamos lendo a mente”.


Fonte:
1. https://www.inovacaotecnologica.com.br/noticias/noticia.php?artigo=programa-traduz-sinais-cerebrais-diretamente-voz&id=010150190130
2. https://brasil.elpais.com/brasil/2015/06/24/ciencia/1435141735_511216.html

Comentários

Postagens mais visitadas