Code Monkey home page Code Monkey logo

phd-snowballing-scripts's Introduction

Snowballing scripts

Contém conjunto de scripts para apoiar a minha extração de dados para a constrção de uma modelo de snowballing no Stack Exchange (SE).

Dependências

  • Python 3 ou superior
  • Postgres 16 ou superior

Montando ambiente

  • Criando ambiente local
python3 -m venv myenv
  • Ativando ambiente
source myenv/bin/activate (Linux/MacOS)
myenv\Scripts\activate (Windows)
  • Instalando pacotes no ambiente
pip install -r requirements.txt

Links interessantes

Documentação do schema do SE

https://meta.stackexchange.com/questions/2677/database-schema-documentation-for-the-public-data-dump-and-sede

Links sobre links Related

https://meta.stackexchange.com/questions/20473/how-are-related-questions-selected

https://stackoverflow.blog/2008/10/17/stack-overflow-search-now-51-less-crappy/

https://stackoverflow.blog/2010/04/26/new-linked-posts/?_ga=2.201252078.1532454634.1711292722-150477141.1684451486

Conceitos

Linked Backward Snowballing

Lista de posts fora do starset que são apontados por algum post dentro do starset via um link do tipo linked.

hits = quantidade de vezes que um post X, fora do dataset, foi apontado por um post dentro do startset via um lined link. Por exemplo, os posts 26070, 28023 e 29724 estão no startset e eles tem um linked link apontando para o post 26011, que está fora do startset, logo o post 26011 tem 3 hits.

Linked Forward Snowballing

Lista de posts fora do startset que têm algum link do tipo linked que aponta para um post no startset.

hits = quantidade de links que um post X tem que apontam para o startset. Por exemplo, o post 27453 (que se encontra fora do startset) tem dois links apontando para 7904 e 16361 (ambos partes do starset), logo o post 27453 tem 2 hits.

Related Backward Snowballing

Lista de posts fora do starset que são apontados por algum post dentro do starset via um link do tipo related.

hits = quantidade de vezes que um post X, fora do dataset, foi apontado por um post dentro do startset via um related link. Por exemplo, o post 8793 (que se encontra dentro do startset) tem um link related para o post 7852 (fora do startset), logo tem 1 hit.

Related Forward Snowballing

Lista de posts fora do startset que têm algum link do tipo related que aponta para um post no startset.

hist = quantidade de links related que um post X tem que apontam para o startset. Por exemplo, o post 7954 (fora do startset) tem 3 links related para posts no startset (são el2043, 11980 e 14345), logo o post 7945 tem 3 hits.

phd-snowballing-scripts's People

Contributors

felipegustavo avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.