IPCA
0,83 Abr.2024
Topo

Futuro de assistente de voz é nunca desligar: Bloomberg Opinion

Stephen Carter

10/06/2019 13h10

(Bloomberg) -- O pedido de patente da Amazon para um recurso disponível sem interrupção para a Alexa, seu popular assistente pessoal ativado por voz, levantou muita preocupação. "Se você já está assustado com as implicações de privacidade de alto-falantes inteligentes como o Echo da Amazon", diz o Gizmodo, "temos más notícias." Uma manchete no ScienceAlert é ainda mais direta: "Patente recém-lançada da Amazon mostra quão assustadora a Alexa pode se tornar." Você entendeu a ideia.

Mas a ansiedade é muito barulho por nada. Uma Alexa que está sempre ouvindo provavelmente será mais útil do que uma Alexa que não está; e, em qualquer caso, dispositivos sempre ativos são certamente nosso futuro.

Em janeiro de 2019, a Amazon vendeu mais de 100 milhões de dispositivos que incluem a Alexa. Esse número é certamente ofuscado pelos bilhões de dispositivos que incluem Siri e Google Assistant. Mas a diferença é que esses recursos vêm junto com seu smartphone, que tem muitos outros usos. Quando você compra um dispositivo Alexa, está convidando a Amazon a entrar em sua casa para ouvi-lo.

Mesmo aqueles que não têm interesse em obter um dispositivo vinculado à Alexa sabem como a coisa funciona, mesmo que seja apenas pela enxurrada de comerciais de televisão da Amazon. Você diz "Alexa, qual é a previsão do tempo hoje?" - e ela diz a você. Sempre que a Alexa ouve suas palavras para que o dispositivo desperte, o software assume que o usuário quer sua atenção. Assim Alexa "acorda", ouve e processa as palavras.

A dificuldade surge porque, nas palavras do pedido de patente, uma palavra despertar "nem sempre pode preceder um comando falado, e às vezes pode ser incluída no meio de um comando falado". O aplicativo dá um exemplo: "Toque 'Mother's Little Helper' dos ??Rolling Stones." Como atualmente configurado, o sistema responderá se o usuário iniciar a solicitação com "Alexa" (ou seja, "Alexa, toque 'Mother's Little Helper'"), mas não se a palavra para que o dispositivo acorde aparecer no fim (isto é, "Toque 'Mother's Little Helper', Alexa").

Em outras palavras, a Alexa como atualmente configurada não combina com a maneira como as pessoas falam. O usuário deve estruturar cada comando em torno de uma gramática relativamente formal. A invenção descrita no pedido de patente iria tornar menos formal os meios para endereçar o dispositivo, permitindo assim que a Alexa se encaixasse mais facilmente e naturalmente na vida cotidiana.

Aqui está a solução da Amazon: a Alexa já armazena o que ouve em um buffer. Sob a nova configuração, de acordo com o aplicativo, uma vez que a Alexa detecta uma palavra para que o dispositivo desperte, "o assistente volta o áudio no buffer para determinar o início do enunciado que inclui a palavra." Depois de encontrar o que marca como o mais provável início do comando, a Alexa realizará um cálculo semelhante para encontrar o fim. O comando será então processado exatamente como aquele que foi precedido pela palavra para que o dispositivo desperte.

Tudo faz muito sentido. Por que então a preocupação? Parece-me que existem dois problemas potenciais.

Um deles é uma preocupação sobre o que acontece com as informações do buffer de áudio. A Alexa atualmente mantém as gravações por um período de tempo, ajudando a modelar as necessidades e desejos do usuário. Esse recurso, que pode ser parcialmente desativado, já causou problemas de privacidade. Tribunais emitiram intimações envolvendo gravações da Alexa. E como a Bloomberg News relatou, os seres humanos na Amazon já ouvem muito do que a Alexa ouve, em um esforço para melhorar o algoritmo. Mas nenhum recurso sempre ativo foi necessário para que as gravações sobrevivessem.

A segunda preocupação pode ser que uma Alexa que ouve mais de perto, respondendo a comandos de linguagem natural, logo se tornará uma Alexa que desaparece em segundo plano. A formalidade relativa com a qual o dispositivo deve ser endereçado serve como um lembrete de que estamos abordando apenas isso - um dispositivo. Quanto mais casualmente falarmos, mais casual seremos sobre usá-lo. Podemos, literalmente, esquecer que a Alexa está lá. Somente o consumidor pode decidir se isso é um recurso ou um bug.

A Amazon diz que não tem planos atuais para mudar o modo como a Alexa escuta, mas tenha em mente que o recurso sempre ativo pode ser implementado, independentemente de estar ou não patenteado. Em outras palavras, se a noção de um dispositivo que está sempre ligado o preocupa, o fato de um pedido de patente ter sido apresentado não deve fazer com que você se preocupe mais. Qualquer dispositivo que escute você já pode ser ativado. (Inclusive, a propósito, seu smartphone.)

Nós aceitamos que nossos laptops e televisores inteligentes registrem as escolhas que fazemos e as enviem para onde não sabemos. A única razão pela qual imaginamos que nossas palavras faladas estão seguras é que a fala é uma tecnologia mais antiga e instintiva. Ainda pensamos no discurso como especial, uma função distintamente humana, e quando estamos em espaços que consideramos privados, consideramos nossa voz como algo ouvido apenas por nossos conhecidos mais íntimos e confiáveis.

Mas, para os computadores que agora nos cercam, a fala é apenas outra forma de dados. Os vários dispositivos comandados por voz, seja em nossas casas, smartphones ou carros, funcionam exatamente como teclados ou telas sensíveis ao toque. A única diferença é que a entrada humana é uma voz. E a única maneira de obter essa entrada é ouvi-la.

Então vamos nos acalmar. Sim, pode ser divertido imaginar um futuro em que nossas casas estejam totalmente conectadas e, no entanto, podemos manter em sigilo tudo o que queremos manter em sigilo. Mas esse navio partiu muito antes de a Amazon decidir buscar uma patente em uma mudança menor e bem-vinda para a Alexa.

Esta coluna não reflete necessariamenta a opinião do conselho editorial ou dos proprietários da Bloomberg LP.