CRITÉRIOS DE CLASSIFICAÇÃO DE FONTES DE FAKE NEWS NO BRASIL E NO MUNDO

Autor(es): 

Matheus Souza Passamani - Orientador: Prof. André Luiz Silva Samartini

Ano: 

2019

[INTRODUÇÃO] Com o surgimento atribuído nas eleições norte-americanas em 2016, o termo fake news entrou no léxico mundial, inclusive no do brasileiro. Em um estudo organizado pela Avaaz mostrou que 98,21% dos eleitores do presidente eleito no Brasil foram expostos a notícias falsas e 89,77% acreditaram que estas eram verdadeiras (Valor, 2018). Busca-se neste trabalho entender quais são as fontes de notícias falsas e se é possível identificá-las por padrões apresentados nos websites. Este trabalho foi dividido em duas partes: primeiro devido a falta de conteúdo relativo ao assunto, foi necessário fazer um estudo qualitativo das teorias de comunicação e como as fontes de fake news se misturam com as convencionais; segundo foi feito o estudo qualitativo, analisando através de variáveis propostas quais são as mais relevantes para a classificação de uma página em fake. [METODOLOGIA] Para a realização da primeira parte deste estudo, foi utilizada a metodologia de revisão bibliográfica. Esta consiste em um procedimento sistemático de análise de documentos, principalmente eletrônicos, e notícias para entender o que já havia sido estudado. Para tal, foram utilizados o Google Scholars e o sistema de bibliotecas da FGV. Na segunda parte, obteve-se um banco de dados com os 2200 sites mais acessados no Brasil em outubro/2018 e estes foram classificados primeiramente em “notícia/outros” e depois as páginas de notícias foram separadas em “política/outros”. Obteve-se, assim, 106 sites que compartilham apenas notícias políticas. Após, foram criadas variáveis para a análise do conteúdo encontrado, sendo elas “sufixo do domínio”, “segurança da conexão”, “expediente”, “e-mail”, “telefone”, “reportar erro”, “diagramação”, “existência de propagandas”, “propagandas conhecidas”, “scam”, “furos jornalísticos”, “assinatura”, “fontes”, “caixa-alta” e “juízo de valor”. Os 106 sites foram então analisados um a um e eram preenchidos de forma binária (falso = 0 ou verdadeiro = 1) se ele possuía ou não aquela variável. Em seguida, foi determinada a variável dependente binária “é fake?”, e os sites foram novamente analisados através de verificadores de fatos conhecidos, investigando a veracidade de notícias presentes na página e pesquisando o histórico da página. Com isso, pôde-se fazer uma regressão logística para avaliar quais variáveis apresentavam melhores evidências de o site ser disseminador de notícias falsas. [Resultados] Das 15 variáveis propostas, apenas duas obtiveram um grau de significação menor do que 0.05, “segurança da conexão” e “scam”. Notou-se também que outras quatro obtiveram significação menor 0.20, “sufixo do domínio”, “furos jornalísticos” “e-mail” e “juízo de valor”, o que pode evidenciar que estas já tiveram significância maior. No ajuste do modelo, para probabilidades maiores que 0.30, a regressão classificou corretamente cerca de 90% dos sites. Notou-se que as 5 páginas que foram classificadas erroneamente como difusoras de fake news eram sites com forte “juízo de valor”. [CONCLUSÃO] É possível concluir que ocorreu uma evolução nos métodos de persuasão utilizados por fontes de fake news. As únicas variáveis que puderam predizer se a fonte é fake são pouco utilizadas, mostrando a preocupação atual de seus criadores a enquadrar suas páginas nos padrões atuais. Até o começo de 2018, era comum sites que transmitiam notícias falsas utilizarem caixa-alta, linguagem de realce e diagramação confusa, percebe-se que hoje poucas das fontes utilizam-se deste, visto os resultados da regressão e a taxa de rejeição à sites que apresentam essas características. Foi possível perceber, também, que existe uma área cinzenta entre o que é difusor de fake news e o que é uma página com forte enviesamento político, visto que de 5 páginas que a regressão logística errou, classificando-as como as que possuem evidências de ser fake, todas tiveram “juízo de valor” como verdadeiro na categorização prévia.

Departamento: 

TDS

Anexos: