Fórumcast, o podcast da Fórum
12 de setembro de 2019, 16h20

Brincando de identificar robôs no Twitter no caso David Miranda

Estudo de dados aponta que boa parte das postagens contra o deputado federal David Miranda (PSOL-RJ) foram feitas por robôs

Reprodução

Por Antonio Arles**

De forma geral, algoritmos de identificação de automação de usuários têm falhado em suas análises. Tanto os que utilizam análise de linguagem natural quanto os que se utilizam de aprendizado de máquina, ou os dois ao mesmo tempo, têm que ser muito bem calibrados para apresentarem resultados satisfatórios, mesmo que ainda assim o veredicto final dependa de análise humana.

Mas, para fins didáticos e para o teste de hipóteses na tentativa de encontrar pistas e fomentar o debate, podemos usar destes instrumentos para “brincar” de ciência de dados.

A amostra

Durante a tarde do dia 11 de Setembro foram recolhidos 18.000 tweets (entre originais e RTs) citando o descritor “David Miranda”. Era um tema quente na Rede depois da revelação por um jornalão carioca de que o deputado federal David Miranda (PSOL-RJ) teria tido supostas movimentações financeiras atípicas em sua conta bancária, segundo o COAF.

A disposição temporal dos tweets obtidos é expressa no seguinte gráfico (horários em GMT):

BotOrNot

Os usuários que compuseram estes tweets foram submetidos ao algoritmo de aprendizado de máquina TweetBotOrNot através de sua biblioteca para a linguagem de programação. Apesar de ser experimental e estar há 9 meses sem atualizações, o manual do algoritmo afirma que ele tem grau de acerto de 91.78% na classificação de bot-positivos na sua modalidade fast (rápida), que foi a que usamos no programa de classificação confeccionado para este estudo. Tomaremos para fins desse estudo o marco de 50% de probabilidade de atividade automatizada para considerar que o usuário é um bot, mesmo que isso estritamente não signifique que usuários com grau de automação mais baixo sejam efetivamente isentos de atividade robótica e/ou que os de graus mais altos sejam efetivamente robôs.

Dentro desta amostra específica foram retornados 10.584 usuários, sendo que 4.509 tiveram mais de 50% de probabilidade de cultivarem algum tipo de atividade automatizada.

A questão que fica

Mesmo com tantos senões a respeito das técnicas aqui utilizadas, podemos verificar que há, sim, possibilidade de identificar atividades automatizadas dentro das plataformas de redes sociais digitais. Mesmo que a atividade robótica em si não seja de todo mau – existem robôs fazendo trabalhos muito úteis para a democracia na Rede -, a utilização de automação de perfis está sendo usada para fins que corroem a democracia, como assassinatos de reputação e outros mais.

Sendo assim, perguntamos às empresas detentoras das plataformas de redes sociais: por que não tomam providências referentes a este tipo de postura, onde cada vez mais a toxidade e até crimes cometidos vêm causando sérios danos à democracia e aos cidadãos conectados?

 

*Este ensaio é uma obra coletiva feita a partir de questionamentos dos usuários do grupo do programa Fórum Onze e Meia no Whatsapp

**Antonio Arles é analista de dados


Você pode fazer o jornalismo da Fórum ser cada vez melhor

A Fórum nunca foi tão lida como atualmente. Ao mesmo tempo nunca publicou tanto conteúdo original e trabalhou com tantos colaboradores e colunistas. Ou seja, nossos recordes mensais de audiência são frutos de um enorme esforço para fazer um jornalismo posicionado a favor dos direitos, da democracia e dos movimentos sociais, mas que não seja panfletário e de baixa qualidade. Prezamos nossa credibilidade. Mesmo com todo esse sucesso não estamos satisfeitos.

Queremos melhorar nossa qualidade editorial e alcançar cada vez mais gente. Para isso precisamos de um número maior de sócios, que é a forma que encontramos para bancar parte do nosso projeto. Sócios já recebem uma newsletter exclusiva todas as manhãs e em julho terão uma área exclusiva.

Fique sócio e faça parte desta caminhada para que ela se torne um veículo cada vez mais respeitado e forte.

Apoie a Fórum