Brincando de identificar robôs no Twitter no caso David Miranda

Estudo de dados aponta que boa parte das postagens contra o deputado federal David Miranda (PSOL-RJ) foram feitas por robôs

Reprodução
Escrito en POLÍTICA el
Por Antonio Arles** De forma geral, algoritmos de identificação de automação de usuários têm falhado em suas análises. Tanto os que utilizam análise de linguagem natural quanto os que se utilizam de aprendizado de máquina, ou os dois ao mesmo tempo, têm que ser muito bem calibrados para apresentarem resultados satisfatórios, mesmo que ainda assim o veredicto final dependa de análise humana. Mas, para fins didáticos e para o teste de hipóteses na tentativa de encontrar pistas e fomentar o debate, podemos usar destes instrumentos para “brincar” de ciência de dados. A amostra Durante a tarde do dia 11 de Setembro foram recolhidos 18.000 tweets (entre originais e RTs) citando o descritor “David Miranda”. Era um tema quente na Rede depois da revelação por um jornalão carioca de que o deputado federal David Miranda (PSOL-RJ) teria tido supostas movimentações financeiras atípicas em sua conta bancária, segundo o COAF. A disposição temporal dos tweets obtidos é expressa no seguinte gráfico (horários em GMT): BotOrNot Os usuários que compuseram estes tweets foram submetidos ao algoritmo de aprendizado de máquina TweetBotOrNot através de sua biblioteca para a linguagem de programação. Apesar de ser experimental e estar há 9 meses sem atualizações, o manual do algoritmo afirma que ele tem grau de acerto de 91.78% na classificação de bot-positivos na sua modalidade fast (rápida), que foi a que usamos no programa de classificação confeccionado para este estudo. Tomaremos para fins desse estudo o marco de 50% de probabilidade de atividade automatizada para considerar que o usuário é um bot, mesmo que isso estritamente não signifique que usuários com grau de automação mais baixo sejam efetivamente isentos de atividade robótica e/ou que os de graus mais altos sejam efetivamente robôs. Dentro desta amostra específica foram retornados 10.584 usuários, sendo que 4.509 tiveram mais de 50% de probabilidade de cultivarem algum tipo de atividade automatizada. A questão que fica Mesmo com tantos senões a respeito das técnicas aqui utilizadas, podemos verificar que há, sim, possibilidade de identificar atividades automatizadas dentro das plataformas de redes sociais digitais. Mesmo que a atividade robótica em si não seja de todo mau – existem robôs fazendo trabalhos muito úteis para a democracia na Rede -, a utilização de automação de perfis está sendo usada para fins que corroem a democracia, como assassinatos de reputação e outros mais. Sendo assim, perguntamos às empresas detentoras das plataformas de redes sociais: por que não tomam providências referentes a este tipo de postura, onde cada vez mais a toxidade e até crimes cometidos vêm causando sérios danos à democracia e aos cidadãos conectados?   *Este ensaio é uma obra coletiva feita a partir de questionamentos dos usuários do grupo do programa Fórum Onze e Meia no Whatsapp **Antonio Arles é analista de dados