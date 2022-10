Áudio atribuído a Ciro Gomes em postagem usa técnica de deepfake - Arte/Comprova

Publicado 10/10/2022 16:29

Brasil - É falso o áudio atribuído a Ciro Gomes (PDT) sobre um esquema armado para eleger Luiz Inácio Lula da Silva (PT) presidente da República e uma consequente tomada de poder pelas Forças Armadas caso isso aconteça. Peritos consultados pelo Comprova e a assessoria de imprensa do político negaram a veracidade do material. Segundo os técnicos, a gravação fraudulenta foi gerada a partir de técnicas de deepfake.*

De acordo com o perito Mario Gazziro, quando a semelhança dos áudios é abaixo de 10%, é possível identificar que não se trata de um conteúdo verídico apenas pelo ouvido. Em casos de produção pela técnica deepfake , é necessário realizar uma análise cepstral – criada inicialmente para identificar problemas no aparelho do trato vocal humano.O resultado da análise realizada pelos peritos apontou que a similaridade do áudio verificado é de 47%. Quando abaixo de 10%, é provável que a fraude tenha sido realizada por um imitador. Já entre 10% e 80%, o conteúdo é gerado por meio de deepfake – quando uma base grande de dados da voz é copiada e utilizada para gerar o text-to-speech (texto lido por uma voz aprendida artificialmente sintetizada via computador).Ainda que a análise cepstral tenha sido criada para fins médicos, a combinação com técnicas modernas possibilita levantar a identidade vocal de um indivíduo analisado, conforme explicação do pesquisador da UFABC. “Do ponto de vista matemático, trata-se de uma análise em frequência que ‘desembaralha’ o espectro vocal e o atribui a uma escala de cores logarítmica, adequada à sensibilidade do ouvido humano para as frequências audíveis”.No laudo elaborado, a análise cepstral foi realizada a partir do áudio do discurso de Ciro Gomes na convenção nacional do PDT , quando o partido confirmou sua candidatura no dia 20 de julho de 2022. Segundo Gazziro, é importante que, na análise cepstral, as vozes comparadas sejam da mesma época em que a amostra foi supostamente gerada. “Uma vez que a análise cepstral identifica componentes do trato vocal, isso pode sofrer mudanças com o avanço da idade”, explica.Por fim, a análise gera um mapa relativo ao trato vocal. Gazziro explica que os mapas gerados se assemelham a impressões digitais dos dedos. Quando a gravação é feita pelo mesmo autor, a variação é baixa entre diferentes tipos de fala. Como exemplo, ele diz que se uma mesma pessoa cantar rápido em inglês e narrar calmamente em português em áudios diferentes, a similaridade ainda será acima de 80%, já que são gravações de mesma autoria.