Um Google Translator atômico como você nunca viu

Fidget Spinner... IN SPACE!!!
Experimento de Conformidade de Asch

Comunicação sempre foi uma dor de cabeça, principalmente quando se tinha que lidar com gente de locais afastados, remotos e totalmente isolados. Mais ou menos como carioca tentando entender mineiro falando. Com paulistanos já se desistiu. Muito complicado falar com gente que confunde biscoito com tapa na cara. Agora imagine você ir para o interior de algum lugar esquecido por Hades, por onde Judas andava com e pé no chão, pois já tinha perdido as botas e as meias. É delicioso pro pessoal da Linguística encontrar novos povos com idiomas totalmente díspares do nosso, mas vem a dor de cabeça tentar entende-los. Guerras começaram por muito menos. Seria legal um sistema tradutor um pouquinho mais eficiente que o Google Translator, não é?

Se rolasse uma verbazinha governamental para desenvolver isso seria legal, e como os EUA não tem gente com doutorado fazendo orgias ou indo em banheiro público saciar seus desejos, o Escritório do Diretor de Inteligência Nacional dos EUA mandou de presente pros pesquisadores da Universidade Johns Hopkins cerca de US$ 10 milhões para criar um sistema de recuperação e tradução de informações para idiomas que não são amplamente utilizados em todo o mundo.

O dr. Philipp Koehn é professor de Ciência da Computação da Whiting School of Engineering da Universidade Johns Hopkins. Seu trabalho está focado na tradução de máquinas estatísticas, usando o máximo de dados existentes por aí para múltiplo processamento e cruzamento de tudo o que se pode encontrar. Sentiu o drama? Não, não é pouca merda e qualquer país de verdade (senta aí, Brasil) vai se interessar. Ter informações sobre as pessoas é legal, mas quando tudo está fragmentado acaba servindo para a privacidade do mal, como eu chamo, quando os espertinhos e espertões acabam escapando entre as tramas do grande tecido que se forma facilitando corrupção, lavagem de dinheiro e terrorismo.

Pense quando você recebe uma cobrança por boleto que não foi pago, quando efetivamente você fez o pagamento. Daí você descobre que o setor que cuida da cobrança não tem informações sobre quem pagou ou não. Sim aconteceu comigo. Daí ter que explicar que você pagou gera coisas absurdas como “tem que mandar um fax ou carta”.

Agora pense que você possa coletar o máximo de informações possíveis de um povo, com seus trocentos dialetos, e você precisa saber o que eles estão falando, e ninguém criou um dicionário ou livro de gramática. Em tempos de terrorismo internacional, é algo muito perigoso, principalmente porque nem todo mundo é babaca como corrupto brasileiro que troca ideia pelo WhatsApp e até manda foto, facilitando muito o trabalho da polícia. O dificulta é a falta de recursos, mas aí é outra história.

Claro, você virá com aquele papo ‘mas e a privacidade das pessoas?”. Meu amigo, QUE privacidade, se você coloca toda a sua vida no Facebook, manda foto de tudo pelo WhatsApp e fotografa até o seu almoço? Se você quisesse privacidade, não iria ter rede social, só para começar!

Com a grana na mão, Koehn reuniu um grupo de 20 pesquisadores para construir um sistema que responda a perguntas digitadas em inglês com base em documentos escritos nas chamadas línguas de “recursos baixos”, o que significa que há relativamente pouco material escrito nesses idiomas. Para alguém que trabalha com grande volume de informações, Koehn não deve estar muito feliz, mas ganhar verba extra muda qualquer situação triste.

Agora, está na dele, esperando que o pessoal do Governo envie as informações de grupo em um idioma específico para que eles possam usar para testar a tecnologia que eles criaram para a tarefa. Para que o pessoal da Inteligência quer isso? Muito provavelmente para saber em quem despejar umas democracias, mas estão seguindo a regra Don’t Ask, Don’t Tell, ou também chamado “Só Quem Precisa Saber”. Kohen não precisa saber, precisa apenas fazer a geringonça.

Os engravatados dizem qual idioma estão querendo estudar, Koehn recebe algumas amostras e faz pesquisas online para ter mais amostras destes idiomas, pashto, servo-croata ou o que meus alunos falam no recreio. Comentaristas do YouTube é perda de tempo. A análise começa com as máquinas estudando os padrões de linguagem. Incluindo a estrutura das sentenças e as posições de verbos, adjetivos e outros componentes. Usando essa análise, em vez do trabalho de um tradutor humano, os pesquisadores desenvolvem algoritmos que traduzem automaticamente o idioma em questão, levando em conta até as variantes, dialetos locais, sotaques etc.

É um trabalho que terá resultados agora? Óbvio que não. Vai acabar com a fome na África? Não, mas você comprar pizza também não vai. Vai ajudar a melhora a comunicação? Muito provavelmente. É para uso civil? HÁ-HÁ-HÁ, não agora, filhos. No futuro, é quase certo, como foi com o GPS e todas as tecnologias que em 90% dos casos foram desenvolvidas visando guerra. Assim é o mundo.

Fidget Spinner... IN SPACE!!!
Experimento de Conformidade de Asch

Sobre André Carvalho

και γνωσεσθε την αληθειαν και η αληθεια ελευθερωσει υμας

Quer opinar? Ótimo! Mas leia primeiro a nossa Polí­tica de Comentários, para não reclamar depois. Todos os comentários necessitam aprovação para aparecerem. Não gostou? Só lamento!