quarta-feira, 30 set 2020
Publicidade

Ciência e Covid-19: o estado da arte no Twitter

A equipe do Dadoscope mapeou os temas mais recorrentes entre os principais pesquisadores e organizações científicas no Brasil em relação à pandemia

Por Charles Novaes de Santana, Tarssio Barreto, Fernando Barbalho, Leonardo F. Nascimento e Henrique Gomide

Pouco mais de seis meses desde o início da pandemia de Covid-19, o Brasil ainda caminha de maneira imprecisa quanto ao desfecho de uma crise sanitária, econômica e psicológica. Ao longo deste conturbado período, os posicionamentos em defesa da ciência foram importantes para marcar posições acerca da adoção das medidas sanitárias de distanciamento social. Cientistas de todos os campos do conhecimento entraram no debate público afirmando algo que até então parecia óbvio: é através da lente da ciência que devemos enfrentar esta e as próximas pandemias.

Diante de tantos debates acalorados, a equipe do Dadoscope pensou que seria importante descobrirmos quais seriam os temas mais recorrentes entre os principais pesquisadores e organizações científicas no Brasil – e no mundo – que foram publicados no Twitter. Nós fomos atrás do que poderia ser uma boa base de dados que nos ajudasse a pensar como os diversos cientistas dialogaram e lançaram ideias sobre a pandemia e sua solução.

Durante as investigações, descobrimos que o jornalista José Roberto Toledo produziu uma lista de 98 perfis que publicaram sobre a Covid-19 no Brasil e no mundo. Se já tínhamos então o insumo para as nossas análises, a partir de agora, bastava convocar a inspiração, o rigor analítico e, obviamente, os algoritmos.

Nós utilizamos a API do twitter — uma interface que permite aos programadores buscarem dados disponibilizados via internet — e com esse recurso conseguimos identificar informações que descrevem as atividades dos perfis, suas localizações e o número de seguidores. Nosso interesse maior foi analisar os textos produzidos por cada um dos cientistas da lista. Através da plataforma, conseguimos baixar as 200 postagens mais recentes de cada um dos membros. Esta coleta de dados foi feita no dia 07/09/2020 e a base completa resultou em 18.874 postagens. Os códigos e o arquivos utilizados estão disponíveis nesse link.

Caracterizando a lista

Primeiramente buscamos caracterizar onde atuam as pessoas e as organizações que estão nessa lista. A partir das informações sobre a localização disponibilizada nos perfis, chegamos a essa nuvem de palavra logo abaixo:

Como se vê, há uma predominância de localidades associados aos EUA e ao Reino Unido. Aparecem ainda a Suíça, que é sede da Organização Mundial de Saúde, e o Brasil, como não poderia deixar de ser.

O que essas pessoas e organizações estariam debatendo? Qual o propósito delas? Quais os seus interesses? Essas informações nós buscamos a partir da sessão “descrição” que é mais conhecida como a bio dos perfis. A figura logo abaixo mostra as palavras mais frequentes das bios:

Como era de se esperar, é possível observar que a maior parte das palavras está em inglês.

No conjunto, os termos mais frequentes indicam que os perfis estão associados principalmente à pesquisa na área de saúde. Observa-se ainda que há uma ênfase forte em epidemiologia. Vale notar, também, alguns cargos e profissões que mostram a relevância dos profissionais para o tema da Covid-19 tais como médico, diretor e professor, que em inglês se refere a professor efetivo em universidades.

E para quem falam essas organizações? Quantos usuários de twitter os seguem? Para isso novamente vamos montar um gráfico de barras. Dessa vez mostrando os 20 perfis mais influentes da lista. Veja a figura abaixo:

É fácil perceber que o alcance desses perfis é muito grande. Observem que a Organização Mundial de Saúde (WHO, na sigla em inglês) é seguida por quase 8 milhões de outros usuários. Há uma grande lacuna para o segundo colocado, mas, mesmo assim, o número é também bastante impactante. A publicação Nature News & Comment alcança mais de 2 milhões de seguidores. Nature e Science, as duas revistas científicas mais prestigiosas do mundo vêm logo em seguida, com ao redor de 2 milhões de seguidores cada. O perfil brasileiro melhor colocado nesse ranking é o da agência Fiocruz com quase 250 mil seguidores.

Termos mais correlacionados em inglês e em português

As análises que fazemos sobre os textos dos tuítes seguem a mesma lógica de outras publicações do nosso blog. O que fazemos é verificar as palavras mais importantes para o tema que estamos analisando. Em seguida, verificamos quais são as palavras estão sempre associadas. Depois disso, nós representamos essas coocorrências através de um gráfico de rede de palavras que mostram como as palavras se relacionam nas diversas postagens.

Para este texto fizemos duas redes de palavras distintas: Uma para os textos em inglês e outra para os textos em português. Logo abaixo representamos a rede dos termos em inglês:


E logo abaixo, mostramos o que sai com mais recorrência nos textos em português.

Agora que já temos os desenhos das duas redes, vamos mostrar o resultado das nossas análises. Aqui vale destacar que as duas redes vão ser analisadas em conjunto. Para isso elencamos quatro tópicos através dos quais podemos enquadrar as postagens.

Tópico: Curas, tratamentos e vacinas

As redes de palavras mostram o que está ocorrendo na fronteira da ciência na busca de novos processos de tratamento e cura para a COVID-19 e claro para o desenvolvimento da vacina. Destacamos abaixo algumas das sub-redes que discutem esses achados.

A sub-rede que contém b1 b2 trata dos avanços nas pesquisas da empresa Pfizer para o desenvolvimento de uma vacina contra a COVID. Basicamente a discussão é trazida por uma microbiologista brasileira que indica as opções feitas pela empresa farmacêutica no processo de desenvolvimento da vacina.

A sub-rede que tem Johns Hopkins é associada a mais de 40 tuítes. Os temas são diversos, entre eles, as pesquisas onde a instituição se insere no tratamento da doença.

Já as palavras plasmaconvalescent estão associadas a tuítes que discutem as controvérsias em torno das opções de tratamento da COVID-19, usando plasma de pessoas que estão convalescendo da doença. A disputa é que se há ou não elementos suficientes para indicar essa prática como uma alternativa de tratamento. As pesquisas mais recentes puxadas principalmente pelo Instituto Nacional de Saúde dos EUA indicam que não há conclusões sobre o tratamento. Já a FDA, órgão de governo dos EUA que trata de liberação de medicamentos, autorizou recentemente o uso emergencial dessa abordagem.

Herd imunity é a terminologia em inglês para a já famosa imunidade de rebanho. Vamos explorar melhor esse tema no próximo tópico. Aqui aparece pela observação dos cientistas indicando que não se pode falar em imunidade de rebanho desassociado de discussões sobre vacinas.

Mais controvérsias: dessa vez quando se percebe o que sai das palavras warp e operation. Nesse caso, é o esforço puxado principalmente pelo governo dos EUA para liberar uma vacina antes de Novembro. A polêmica está justamente no calendário. As suspeitas são de que o projeto esteja sendo apressado para coincidir com as vésperas das eleições nos EUA.

Tópico: Divulgação científica e desinformação

Os posts também expressam a disputa de narrativas sobre a pandemia proveniente de grupos de Whatsapp e a pesquisa baseada em evidências. Os achados indicam a ampliação dos porta-vozes de divulgação científica e instrumentos de combate à desinformação.

Na figura acima, as sub-redes que aparecem relacionadas a esse tópico trazem sugestões de debates online para a divulgação dos achados científicos sobre a doença. Daí surgem as palavras quinta-feira/convidados, Natália Pasternak e qanon/desinformação. Estas sub-redes dizem respeito à anúncios postados no Twitter convidando as pessoas a tomarem contatos com cientistas como a brasileira Pasternak e também para discutir fenômenos de desinformação e anti-ciência, que é o caso do movimento QAnon, que se fortalece principalmente nos EUA.

Destacamos ainda a imunidade de rebanho que aparece tanto em inglês como em português. A maioria dos cientistas do Brasil e do exterior insistem que essa é uma solução equivocada, pois ela pode significar um desastre ainda maior para aqueles países que optarem por esse caminho.

Ainda sobre combate à desinformação há uma pausa para falar sobre cloroquina. Esse termo não aparece na rede por não estar fortemente correlacionado a outras palavras, porém na base bruta dos dados vê-se que em português o termo aparece em 11 posts. É unânime a condenação do governo brasileiro, que optou realizar por gastos públicos e propaganda em torno de um medicamento que não possui eficácia comprovada no tratamento da COVID-19.

Tópico: Estimativas da pandemia

Desde os primeiros momentos da pandemia há uma preocupação recorrente para entender a dimensão que os números podem tomar. Aqui há vários posts que tratam desse tópico.

Para se fazer estimativas é necessário uma base de dados para indicar a situação tanto da contaminação por COVID como por outras doenças respiratórias. Nesse sentido, aparecem nesse tópico as sub-redes que tratam do boletim infogripe e novamente Johns Hopkins. Em relação à segunda sub-rede, a Johns Hopkins University tem se destacado como um dos principais provedores mundiais de informação sobre a disseminação da doença. Já o infogripe destaca-se no Brasil por apresentar dados que podem ajudar a medir eventuais subnotificações da doença por conta de registros de pacientes ou de óbitos em outras doenças que não a COVID.

As subnotificações são um obstáculo para se fazer previsões e afirmações sobre o excesso de mortes decorrentes da propagação do coronavírus. A busca por um número que possa aferir o real impacto da doença no Brasil e no mundo está por trás da formação das outras sub-redes associadas a esse tópico.

Tópico: Pontos de interrogação

A pandemia ainda é muito recente e há muita coisa ainda para ser descoberta. A ciência de fronteira se vê constantemente com novos enigmas e novas perguntas. Observamos na figura abaixo a formação de uma sub-rede com várias palavras que se relacionam. Nessa rede revela-se que alguns posts discutiam “a suscetibilidade que algumas espécies podem apresentar ao SARS-CoV-2 e seus impactos ambientais”. Há portanto a preocupação sobre o alastramento da doença que pode atingir animais e como se dá a reação desses seres ao vírus.

Outra pergunta que surge é o que justificaria a sobrevivência de algumas pessoas centenárias infectadas pela COVID-19? A maioria dos posts que tratam desse assunto dizem respeito a uma edição do programa fantástico que fez uma matéria sobre o tema.

Tudo ainda é incerto

Quem está atento ao que dizem os cientistas normalmente sabe que as dúvidas são mais frequentes do que as certezas. Talvez esse seja o preço a ser pago ao se evitar a ignorância e o obscurantismo.

Nós ainda não temos certeza de curas, de vacinas ou do número de mortes. A única certeza que dispomos é que o flerte com o fundamentalismo e com as práticas anti-ciência de vários governos ao redor do mundo tem custado a vida de muitos seres humanos. Percebe-se que as manipulações feitas, sobretudo em redes sociais e aplicativos de mensagens, tem como objetivo atingir uma camada social com uma narrativa da aversão à ciência e favorável às soluções mágicas e fáceis. Esse parece ser o caminho populista para a geração de dividendos políticos imediatos.

Por outro lado é reconfortante saber que há espírito coletivo, solidário e humano em grande parte das pessoas que fazem ciência no Brasil e no mundo. A estas pessoas, o nosso muito obrigado. O abraço deixamos reservado para quando a pandemia acabar.

*Charles Novaes de Santana: Cientista da computação, mestre e doutor em mudanças climáticas, com experiência no uso de técnicas de inteligência artificial e de aprendizado estatístico para responder perguntas interdisciplinares. É co-fundador de DataSCOUT, apaixonado por fractais, redes complexas, e por identificar padrões escondidos em amontoados de dados.

Tarssio Barreto: Estudante de doutorado do Programa de Engenharia Industrial da Universidade Federal da Bahia. Dedica o seu tempo ao aprendizado de máquina com particular interesse na interpretabilidade de modelos black box e qualquer desafio que lhe tire o sono!

Fernando Barbalho — Doutor em Administração pela UnB (2014). Pesquisa e implementa produtos para transparência no setor público brasileiro. Usa R nos finais de semana para investigar perguntas que fogem às finanças públicas.

Leonardo F. Nascimento — Doutor em sociologia pelo Instituto de Estudos Sociais e Políticos — IESP/UERJ (2013). Pesquisa temas relacionados à sociologia digital e aos métodos digitais de pesquisa. Atualmente é professor do Instituto de Ciência, Tecnologia e Inovação da UFBA.

Henrique Gomide — Professor na Universidade Federal de Viçosa. Mestre e doutor em Psicologia. Trabalhou como cientista de dados na área de saúde suplementar. Tem como principais interesses a aplicação de técnicas quantitativas e inovação nas áreas de saúde e educação.

Dadoscope
Dadoscope
Cientistas de dados que usam dados abertos, dashboards, machine learning e um pouco de criatividade para entender o mundo à nossa volta.