Code Monkey home page Code Monkey logo

fake.br-corpus's People

Contributors

erickrf avatar guilhermezaninimoreira avatar roneysco avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

fake.br-corpus's Issues

Arquivos Faltantes

Olá tenho uma duvida quantos aos dados
Em size_normalized_texts em ambos fake e true esta sem os arquivos:
586.txt e 1607.txt
já no full_texts em ambos fake, fake-meta-information, true e true-meta-information esta sem os arquivos:
697-meta.txt ,1468-meta.txt, 697.txt ,1468.txt

acabei não encontrando a alteração que deletou os respectivos arquivos.

Como usar o repositorio

Olá @roneysco , muito interessante usar text mining pra detect fake news das noticias no Brasil. Gostaria de saber como usar o repositório. Existe alguma ferramenta ou manual? Desculpa nao ler a fundo a pubblicacao, mas queria so um resumo mesmo da utilidade do seu repositorio.

Seria possivel pensar num site para o publico leigo, onde facilmente pessoas poderiam pesquisar frases ou textos com uma ferramenta de busca, para saber se uma noticia é fake ou nao?

Isso seria sem sombra de duvidas muito interessante

Pausality

Prezado,

Estamos utilizando seu dataset e gostaríamos de saber o que foi considerado como "Pausality" para melhor entendermos os dados.

Desde já, agradecemos sua gentileza e colaboração.

Alguns textos na base rotulada correspondente a fake news são falsos negativos.

Fake.br-Corpus/full_texts/fake/1109.txt

"Esquerdopata fanático inferniza a vida de Alexandre Garcia em aeroporto de Brasília..."

Ao acessar a noticia no site https://diariodobrasil.org/esquerdopata-doente-inferniza-a-vida-de-alexandre-garcia-em-aeroporto-de-brasilia/ é possível ver um vídeo com os acontecimentos descritos na notícia.

Na própria notícia temos: "O rapaz, que filmou e divulgou o vídeo nas redes sociais, chamou Alexandre Garcia e a Rede Globo de golpistas."

Se existe um video e notícia relata o que acontece no vídeo, como isto é classificado como fake news?

Seria o caso de validar a base de notícias falsas que está sendo usada para fazer o treinamento? Além desse exemplo, encontrei outros que cabem análise.

Licensa

Olá,

Sou uma estudante de mestrado e gostaria de utilizar o dataset no meu projeto. Estou citando a publicação no meu trabalho de acordo com as intruções no README, mas além disso gostaria de saber se há alguma licença de uso dos dados.

Obrigada.

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.