bizi | 23.04.24
Diretamente das novidades da IA que impressionam e assustam um pouquinho, conheça a VASA-1. O mais novo lançamento da Microsoft que transforma qualquer foto + um arquivo de áudio em um vídeo praticamente perfeito.
Diferente dos outros lançamentos com a mesma proposta até então, o VASA-1 consegue sincronizar com precisão o áudio e o movimento dos lábios.
E mais: além de uma resolução de 512 x 512 pixels e até 40 quadros por segundo, a nova ferramenta pode simular expressões e emoções faciais como nunca vimos antes.
Primeiramente, a principal utilização da ferramenta seria em projetos de acessibilidade e educação, já que ela resolve diversas barreiras de comunicação, como a língua. Ela também tem potencial de oferecer suporte terapêutico aos usuários, animando personagens e proporcionando interação. Mas tudo isso deve ser tratado com muita calma e ética.
É exatamente essa mimetização da realidade que preocupa quem está de olho no avanço da IA. Nem todo mundo está atento para detalhezinhos muito sutis que ajudam a identificar que um conteúdo não é real.
No caso da VASA-1, o que mais denuncia o conteúdo na nossa opinião é a falta de movimento no cabelo e também o que está em torno do personagem. Mas se a IA avançou até aqui, ela não vai parar agora. Uma vez que isso se resolve, a VASA-1 pode se tornar um prato cheio para os deepfakes.
Porém, antes do pânico generalizado que normalmente acontece com esse tipo de lançamento, a VASA-1 ainda é só um protótipo para fins de pesquisa.
Segundo a Microsoft, a ferramenta não será liberada ao público até que haja leis que regulem esse tipo de situação. O que comprova que a empresa tem consciência sobre esse potencial ambíguo.
Não muito distante desse lançamento, Mark Zuckerberg disse que o segredo para as empresas treinarem suas IAs daqui para frente são os loops de feedback.
Em uma entrevista recente para o Command Line, o CEO explicou que esse é “um processo em que os retornos que você recebe de seus clientes e funcionários são utilizados para aperfeiçoar suas campanhas e ações de marketing e vendas”.
Basicamente, nos loops de feedback, os modelos de IA usam os dados mais de uma vez no mesmo processo. Toda vez que um novo feedback chega, ele é inserido no treinamento e, assim, a ferramenta consegue identificar melhor seus erros e pontos de melhoria.
“O fato de muitas pessoas usarem o produto, verem como as pessoas o usam e poderem melhorar a partir daí será, de fato, um diferencial ao longo do tempo”.
— Mark Zuckerberg
De acordo com a Exame, recentemente a empresa de Zuck estava tão desesperada por dados para alimentar sua IA que chegou a considerar comprar dados e até violar leis de direitos autorais para conseguir isso. Bom, se eles já venderam, por que não comprar, não é?
Além dos loops de feedback, outra opção que chama a atenção do chefão da Meta são os dados sintéticos. Esses dados imitam com precisão considerável os dados gerados no mundo real, por isso, “sintéticos”.
Uma forma bem artificial de obter partes da realidade, mas que pode dar muito certo, afinal.
Confira nossos outros conteúdos