Dadoscope

dados abertos, dashboards, machine learning e um pouco de criatividade

Seja #sóciofórum. Clique aqui e saiba como
30 de dezembro de 2019, 06h35

Nel mezzo del cammin: Divina Comédia no Twitter

Como não poderia deixar de ser, a Divina Comédia está presente também no Twitter. Utilizando recursos de programação, fizemos um apanhado de referências à obra

Ponte Vecchio, em Firenze (Foto: Fernando Barbalho)

Em 2020 a obra completará 700 anos. Durante todo esse tempo a Divina Comédia vem influenciando leitores, autores, políticos e pessoas comuns. Passou por várias mídias, do livro impresso à música, do teatro aos games contemporâneos. Como não poderia deixar de ser, está presente também no Twitter e não à toa um robô se dedica a recolher qualquer referência à Divina Comédia feita na plataforma e em seguida faz o retuíte.

Utilizando recursos de programação fizemos um apanhado dos textos da curadoria do robô. São 3200 tuítes que foram publicados entre 12/09/2019 e 29/12/2019. O que se percebe é que a jornada de Dante, Virgílio, e também Beatriz, inspira, entre outras coisas, debates literários, posições éticas e movimentos contestatórios. Nos próximos parágrafos a visualização de dados será o nosso Virgílio nos guiando entre as contrassignificações dessa obra prima da literatura universal.

Lasciate ogni speranza, deja toda esperanza, abandon all hope

O primeiro achado que se faz sobre a base de dados é a grande diversidade de idiomas utilizados nos tuítes. São quase 30 línguas diferentes, das de base latina ao checo e dinamarquês. A Figura 1 mostra a distribuição de frequência das mensagens por idioma.

Figura 1: A relevância de cada idioma

Talvez como se fosse de esperar, o italiano é o idioma mais frequente nos tuítes, com quase 1250 referências, seguido pelo espanhol, inglês e português. Os posts publicados nesses quatro idiomas serão examinados com mais profundidade neste texto.

Será que é divina? Será que é comédia?

Chico Buarque e Edu Lobo no Grande Circo Místico questionam se é comédia ou divina a vida da atriz Beatriz. No limbo, purgatório e paraíso, não parece que a vida é comédia na acepção mais corrente da palavra, muito menos quando se pensa nos vários círculos do inferno. Quando se vê os usos contemporâneos dos cantos de Dante nos posts do twitter, percebe-se alfinetadas para uma tomada de ação ou conscientização para aspectos diversos da vida moderna. Em alguns idiomas isso é mais frequente, noutros menos. Vamos começar pelo italiano, analisando a nuvem de palavras da Figura 2.

Figura 2: Nuvem de palavras em italiano

Em italiano as palavras mais frequentes dos posts estão associados à estrutura da obra. Então é fácil perceber porque aparece com destaque as palavras inferno, poesia e canto. Isso explica também os números em algarismos romanos que marcam os versos do livro. A paz da literatura, no entanto, se transforma em debates quando se percebe as redes de palavras correlacionadas. Veja a Figura 3.

 

Figura 3: a rede de palavras correlacionadas em italiano

Pela Figura 3 percebe-se algumas aglomerações importantes. A maioria tratando de partes marcantes da obra. A primeira a ser destacada é a que envolve as palavras oscura, cammin, ritrovai, entre outras. Essas palavras marcam o primeiro canto da obra de Dante. Mostra o personagem no momento indicado como o meio do caminho de sua (nossa) vida. Dante tem algumas inquietações principalmente relacionadas com a ausência de sua amada Beatriz. Pouco depois surge Virgílio, que vem do limbo, para guiá-lo até a entrada do paraíso.

O post destacado logo acima traz preocupações sobre o atual momento dos britânicos. A autora encontra inspiração na abertura do Inferno de Dante.

Outro emaranhado importante é o que traz as palavras italia, sanza, bordello. Todas fazem parte do sexto canto do purgatório.

Nota-se que tal como os britânicos, os italianos também fazem uso dos versos centenários de Dante para tentar explicar o que ocorre em seu país no momento atual. O trecho fala de uma serva Itália, uma nave sem rumo numa grande tempestade. O(a) autor(a) do post se apresenta como “Antifascista, antirazzista, ambientalista”.

Saindo do italiano e indo ao muito espalhado espanhol, percebe-se uma ênfase diferente já na nuvem de palavras mostrada na Figura 4.

Figura 4: Nuvem de palavras em Espanhol

A figura 4 é bem maior do que a nuvem de palavras italianas, mesmo ambas contendo 30 palavras. O que justifica é a alta correlação e alta frequência de um conjunto de palavras que formam a frase mais frequente dos “hablantes”. Isso traz uma consequência imediata na forma da rede de palavras como pode ser visto na Figura 5.

Figura 5: rede de palavras em espanhol

As palavras mais relevantes da figura 4 estão juntas na figura 5. Trata-se na verdade de um trecho de Monarquia, outra obra de Alighieri. Observa-se ainda que a alta frequência é resultado principalmente de sucessivos posts de uma única conta de Madrid especializada em “Contenido placebo para luchar contra la información narcótica”, seja lá o que isso for.

Das redes em espanhol relativas aos versos da Divina Comédia passa a interessar então a que é formada pelas palavras lugares, neutralidad, crisis. Parece que em tempos de revoltas populares nos diversos países hispânicos não convém ser isentão. Veja o que mostra esse usuário colombiano.

Quando partimos para a língua inglesa, a nuvem de palavras já demonstra que a ansiedade por tomada de posição está presente no idioma mais difundido no lado ocidental, como se vê na Figura 6.

Figura 6: nuvem de palavras em inglês

Vê-se aí a concentração das mesmas palavras que formam o verso do lugar reservado aos neutros em situação de crise. Há o reforço dessa tendência na rede de palavras da Figura 7.

Figura 7: rede de palavras em inglês

A figura 7 mostra várias redes, porém observa-se que não há na maioria a formação de um discurso mais claro. Uma exceção é a que traz as palavras relacionadas ao espaço dos neutros: neutrality, places, reserved.

Observa-se ainda que o apelo em inglês vem de vários lugares. O uso do idioma é feito para chamar a atenção por exemplo do que está ocorrendo em Hong Kong. Por outro lado, o centro do império ocidental também está passando por turbulências e lá também não é lugar para se ficar em cima do muro, como quer demonstrar esse usuário de Connecticut.

E finalmente chegamos ao português. Vamos ver na Figura 8 o que a última flor do Lácio nos reserva.

Figura 8: nuvem de palavras em português

Provavelmente influenciado principalmente pelos falantes do sul das Américas, a Figura 8 revela que também aqui as palavras que mostram os lugares reservados aos neutros estão em destaque. Há ainda algumas curiosidades como a palavra praça, que se refere a uma praça chamada Dante Alighieri que parece ser o ponto de encontro das pessoas jovens em alguma cidade brasileira. Vamos à Figura 9 para ver o que sai na rede de palavras.

Figura 9: rede de palavras em português

Na Figura 9 apenas duas redes importantes são formadas. A já corriqueira que trata da neutralidade e uma outra que é formada pelas palavras pode e ensinar. Essa última rede é uma sugestão de um usuário indicando que Dante pode trazer algumas lições ao poder judiciário brasileiro.

Já a rede do lugar reservado, parece que cedeu algum espaço para algumas liberdades poéticas na tradução do italiano. Afinal de contas é como se diz: Traduttore, traditore.

Conclusão

Danti Alighieri foi um gênio e é considerado o maior poeta e escritor da língua italiana. Seu trabalho transcende o tempo, especialmente sua obra prima, A Divina Comédia. Na modernidade líquida em que tudo envelhece muito rápido, a internet faz sua reverência a um poema épico escrito há sete séculos, que fala de Inferno, Purgatório e Paraíso e que ainda inspira pessoas de todas as partes do mundo, de diferentes culturas. Muitas dessas pessoas descrevem fatos contemporâneos como passagens da Divina Comédia, especialmente fatos políticos, em tempos tão politicamente conturbados como têm sido estes anos da década de 2010. No Brasil, na América Latina, Nos Estados Unidos, na própria Itália de Dante, a realidade às vezes supera a ficção.

Sobre os autores

Charles Novaes de Santana: Cientista da computação, mestre e doutor em mudanças climáticas, com experiência no uso de técnicas de inteligência artificial e de aprendizado estatístico para responder perguntas interdisciplinares. É co-fundador de DataSCOUT, apaixonado por fractais, redes complexas, e por identificar padrões escondidos em amontoados de dados.

Tarssio Barreto: Estudante de doutorado do Programa de Engenharia Industrial da Universidade Federal da Bahia. Dedica o seu tempo ao aprendizado de máquina com particular interesse na interpretabilidade de modelos black box e qualquer desafio que lhe tire o sono!

Fernando Barbalho — Doutor em Administração pela UnB (2014). Pesquisa e implementa produtos para transparência no setor público brasileiro. Usa R nos finais de semana para investigar perguntas que fogem às finanças públicas.

Leonardo F. Nascimento — Doutor em sociologia pelo Instituto de Estudos Sociais e Políticos — IESP/UERJ (2013). Pesquisa temas relacionados à sociologia digital e aos métodos digitais de pesquisa. Atualmente é professor do Instituto de Ciência, Tecnologia e Inovação da UFBA.

Henrique Gomide — Professor na Universidade Federal de Viçosa. Mestre e doutor em Psicologia. Trabalhou como cientista de dados na área de saúde suplementar. Tem como principais interesses a aplicação de técnicas quantitativas e inovação nas áreas de saúde e educação.


Quantas matérias por dia você lê da Fórum?

Você já pensou nisso? Em quantas vezes por dia você lê conteúdos esclarecedores, sérios, comprometidos com os interesses do povo e a soberania do Brasil e que têm a assinatura da Fórum? Pois então, que tal fazer parte do grupo que apoia este projeto? Que tal contribuir pra que ele fique cada vez maior. Bora lá. Apoie já.

Apoie a Fórum