Tem boi na linha

Ontem foi um dia de vitória para todas as pessoas que acreditavam na teoria de que serumaninhos ouviam as conversas gravadas por meio da Alexa, a assistente de voz da Amazon. Isso porque, na quarta à noite, a Bloomberg publicou uma reportagem contando que a gigante do e-commerce tem um departamento inteiro, espalhado por vários países, com pessoas 100% dedicadas a ouvir e fazer anotações de conversas registradas pela assistente por meio de aparelhos como o alto-falante Echo. Não ficou sabendo do babado ou quer ler a história no formato maroto que só esta newsletter tem? Desligue o fone de ouvido e vem com a gente.

Dá o papo, Alexa

O principal ponto dessa história é que, ao contrário do que nós (leigos que gostam de tecnologia, mas mal sabem escrever uma linha de HTML) imaginamos, a inteligência artificial não é tão inteligente assim. Enquanto os algoritmos fazem um trabalho bem bom com textos escritos, eles penam pra caramba na hora de colocar o som em palavras. E não conseguem estabelecer relações que, pra gente, são óbvias, ao estilo “Taylor Swift é uma artista, logo preciso apresentar opções de músicas quando um usuário diz o nome dela”. Também existem questões como sotaques e gírias, que o software não tem mesmo condições de adivinhar. Em resumo: tarefa desse departamento é, ao explicar para a inteligência o que ela deve fazer, otimizar as respostas dadas pela Alexa em um período mais curto.

Rádio peão (ou quase isso)

Para essa tarefa, a amazônica teria montado times baseados em países como Costa Rica, Índia e Romênia focados em ouvir e transcrever os diálogos para depois realizar anotações que serão imputadas na ferramenta. De acordo com as fontes que falaram com a Bloomberg, um funcionário escuta, por dia, uma média de mil áudios. Como as gravações são escolhidas aleatoriamente, às vezes acontece do funcionário ouvir um diálogo relacionado a uma conta bancária ou mesmo situações de violência. Nesses contextos, o arquivo deve ser assinalado como critical data (dado sensível). Caso o conteúdo seja considerado “pesado”, existe a prática de dividir a experiência com os colegas de trabalho como um meio de descompressão.

Faz parte do meu show

Procurada, a Amazon confirmou que mantém essa operação e fez questão de afirmar que possui uma política de tolerância zero a “abusos no sistema” e que os funcionários não têm acesso a informações que identifiquem os usuários. E, a bem da verdade, ela não é a única que adota essa prática. Para aprimorar os resultados da Siri, a Apple também faz esse trabalho, deixando os arquivos salvos por um período médio de 6 meses. O mesmo acontece na Google, com a diferença de que, segundo a empresa, a voz gravada é distorcida, como uma forma extra de garantir a privacidade do usuário.

Don’t speak(er)

Mesmo assim, não dá para negar que geral foi pego de surpresa ao saber que, de fato, existe todo um departamento responsável por ouvir conversas, especialmente porque esse é um fator que nunca foi esclarecido por nenhuma das companhias que possuem assistentes de voz. E nem dá para desabilitar a função (pelo menos na Alexa), já que a gravação para fins de estudo funciona mesmo se a opção de não registrar os áudios estiver ligada. Segundo especialistas, o importante é que essas empresas garantam que nenhum arquivo sairá de seus escritórios — dessa forma, o trabalho pode ser feito prezando pela segurança dos clientes. Mesmo assim, é provável que a relação dos usuários com as caixas espertas ainda demore um tempo para ficar sem ruídos.