Quem não sonha com o fato do Homem de Ferro? Fonte de energia infinita – Reactor Arco Vibranium, capacidade de voar e mergulhar graças a Repulsores e fontes de oxigénio, armadura quase indestrutível de titânio monocristal com armamento extremamente perigoso.
Desde que ainda estamos anos ou mesmo décadas (estamos?) de ter pelo menos um protótipo de suite de metal voador, há uma peça que pode estar mais perto do que pensamos.
Embora o Vibranium Arc Reactor seja um coração de fato de Homem de Ferro, a coisa igualmente importante é o seu cérebro – Jarvis.
“Jarvis é um I.A. computadorizado altamente avançado desenvolvido por Tony Stark, (…) para gerir quase tudo, especialmente assuntos relacionados com a tecnologia, na vida de Tony”. Parece-lhe familiar?
p>Na última conferência grande G mostrou-nos um par de coisas #MadeByGoogle. No início, Sundar Pichai falou de um novo conceito: AI-primeiro. Vivendo numa época movida por estratégias mobile-first, muitos de nós habituámo-nos a utilizar dispositivos de bolso em muitos aspectos da nossa vida – cálculos, notas, informações, entretenimento, comunicação, navegação e muito mais. Mas o dispositivo móvel é apenas uma ferramenta nas nossas mãos – versátil, mas ainda assim uma ferramenta. Na maioria dos casos, apenas aumenta as nossas capacidades – podemos viajar mais rapidamente (navegação, informações de trânsito), falar com pessoas distantes de nós, limpar o nosso cérebro fazendo anotações. Mas a ordem de actuação é sempre a mesma – temos uma intenção e depois o dispositivo móvel faz a coisa por nós. Temos uma consulta e depois o motor de busca devolve a resposta.
AI-first
Agora estamos lentamente a passar para outro conceito depois de mobile-first: AI-first. Isto significa que as nossas ferramentas como os dispositivos móveis (mas não só!) são capazes de aprender os nossos hábitos, planos. E não só de nós, mas também de todo o contexto em redor: localização actual, hora do dia, tempo. É por isso que o Google pode dizer-nos para sairmos mais cedo para uma reunião planeada, devido a engarrafamentos de trânsito. Ou Nest pode definir a melhor temperatura para nos fazer sentir confortáveis, mas também para poupar o máximo de energia possível durante o dia. A aplicação Lembrete diz-nos para comprar um pão quando estamos na padaria e o Google Now lembra-nos o guarda-chuva quando está a chover. E não precisamos de intenção para tudo isto. Os nossos aparelhos, ou talvez seja melhor dizer: assistentes pessoais, conhecem-nos muito bem.
“Ok, Jarvis…”
Voice Input está connosco há já muito tempo. O seu dispositivo móvel actual tem-no com certeza, não importa se é iPhone, Android ou Windows Phone. Há uma grande hipótese de que o anterior, ou mesmo o anterior, que se encontra na sua secretária também suporte comandos de voz.
Em dispositivos de geração mais antiga os comandos eram apenas os comandos, por exemplo, “call mom”. Mas actualmente graças ao Siri, Cortana ou Google Agora podemos pedir ao nosso dispositivo móvel um tempo (sem necessidade de fornecer uma localização – o seu telefone já o conhece), marcar uma reunião no seu calendário ou tomar uma nota. E pode fazê-lo mais naturalmente do que nunca: “Ei Siri, devo levar guarda-chuva amanhã?”, “Ok Google, acorda-me dentro de uma hora?”. Essas e outras frases semelhantes funcionarão graças ao Processamento de Linguagem Natural. Claro, algumas das frases (e as suas variações) são codificadas algures nos servidores, mas algumas podem ser interpretadas dinamicamente por Speech-to-text e por reconhecedores de intenção como api.ai ou wit.ai.
“Find (buy) the cheapest flight from New York to London in 3 days” dar-nos-á:
- Source, destination: Agora York, Londres
- Data: 3 dias a partir de hoje (+ data de hoje tirada do contexto actual)
- Critérios: o mais barato
- Intenção: Encontrar (comprar) um voo
Sem guardar todas essas informações irá provavelmente resultar com apenas 1 chamada API, por exemplo para o Skyscanner. O que é que isso significa? Que a tecnologia já não nos limita. Somos capazes de agendar um voo apenas com comandos de voz.
Para o utilizador final significa:
- Diga o que precisa de fazer
- Não abra o seu dispositivo móvel/computador
- Não abra o motor de busca (viagem)
- Não ajuste a consulta às suas necessidades
- Não compare os resultados
- Desfrute do seu voo.
Assistente pessoal, não um dispositivo
Processamento de texto a texto torna-se cada vez melhor agora. Também graças a nós – os utilizadores. Tendo conversas com Google ou Siri, alimentamos as redes neurais com novas amostras de dados, o que as torna melhores e mais precisas. Claro, ainda não queremos falar em voz alta com os nossos telefones ou comprimidos. Fred Wilson mencionou isto e publicou uma sondagem no seu Twitter:
Qual é a razão? Ainda não é natural para nós. Ao longo dos anos usávamos os nossos telefones em comprimidos, tocando-os. Claro, falamos sempre ao pé do telefone, mas falar com ele ainda parece estar com fios.
Mas agora surge um novo tipo de solução no horizonte. Google Home ou Amazon Echo – os aparelhos para os quais a interface de voz é o padrão. Finalmente, temos dispositivos para ligar as luzes, reproduzir o nosso filme preferido ou obter algumas informações da Wikipedia. E finalmente, falar com um dispositivo torna-se natural para nós. Na verdade, não será apenas um dispositivo, mas o seu assistente. O seu Jarvis pessoal.
Leve o Jarvis consigo
Vamos voltar ao dispositivo móvel durante algum tempo. Após algum tempo e algumas conversas com Amazon Echo ou Android Auto, o seu sistema automóvel veremos os dispositivos móveis de um ângulo completamente novo. Não serão apenas telefones com controlo por voz, mas mais como dispositivos para levar consigo o seu assistente de casa. E falar com eles não será mais esquisito.
Mais ainda, não precisaremos de tirar o dispositivo do nosso bolso. Graças aos AirPods e a dezenas de outros auriculares (que nem sequer necessitam da porta de auscultadores Jack), poderemos falar com o nosso assistente com restrições. E o dispositivo escondido no seu bolso, apoiado por serviços de cloud computing fará tudo por si, confirmando com “Está feito, Tony”, e o final.
O futuro dos hologramas
No final ainda falta uma grande peça no nosso Jarvis pessoal – feedback visual. Ainda não inventámos a tecnologia que seria capaz de desenhar projecção 3d no ar apenas com uma luz. Mas não há preocupações – há projectos como o Hololens que irão misturar a realidade com hologramas, pelo que poderá ver todo o universo na sua mesa, projecção de peças em falta quando construir um motor, ou mesmo pessoas que estão a milhares de quilómetros de distância de nós. Sentado no nosso autocarro.
E qual é o mais fascinante em todas essas soluções e tecnologias? Que todos nós temos acesso a elas. Todos podemos construí-las – criando bots para aplicações de mensagens, integrando APIs de processamento de linguagem natural, construindo aplicações para: dispositivos móveis, assistentes domésticos, automóveis, até mesmo Hololens. Isto já não é um conhecimento secreto – são apenas peças que precisam de ser ligadas correctamente.
Nunca houve melhor altura em toda a história do mundo para inventar algo (← Recomendo realmente este post!).