Code Monkey home page Code Monkey logo

gudang-data-indonesia's Introduction

Gudang Data Indonesia

Suatu repositori data yang umum digunakan oleh pemrogram. Contohnya seperti
asal diskusi ini lah. Data lain bisa kode kendaraan bermotor, data danau,
sungai, Indonesia, dll.

Skripnya sebenernya sangat sederhana yang mesti kita pikirin adalah (1)
kemutakhiran data, (2) otomatisasi, (3) keluwesan penambangan, dan (4)
keterskalaan server utk menampung permintaan yang banyak.
-- Ivan Lanin

Kita punya sistem Gudang Data yang merupakan repository data umum yang
sumbernya dari berbagai tempat. Outputnya disederhanakan menjadi
seperti XML, JSON, CSV atau yang lainnya. Masalah output harusnya
gampang, seperti kata Arthur, karena tinggal echo dengan mengikuti
aturan tertentu.

Pengumpulan data, bisa gampang bisa susah. Susahnya adalah menemukan
sumber data, menambangnya dan membersihkannya untuk kemudian disusun
dalam simpanan kita. Gampangnya kalau proses tersebut berhasil
di-otomatisasi, maka berapapun datanya atau kapanpun data itu ada bisa
kita dapatkan untuk disajikan.

Nah, otomatisasi data ini kuncinya menurut saya adalah CURL dan regex,
yang merupakan proses sekali jalan. Masalah selanjutnya adalah, kalau
kemudian ternyata setelah otomatisasi berjalan dengan baik, tiba-tiba
sumber data mengubah pola datanya sehingga regex pengumpul data tidak
sesuai lagi.
-- Youppie Arliansyah

location database 
- Key harus bisa diquery dan dalam bentuk tree
- output bisa dalam berbagai versi (xls, csv, json)
- ada versioning.
- perbedaan versi bisa di 'diff' sehingga ketidakvalidan user data bisa langsung
  dihighlight
- location database dimiliki oleh admin
- best saved in sqlite

data
- merefer ke location_id dari versi tertentu dari location database
- dimiliki oleh user
- cannot be queried.
- hanya bisa di download sebagai data penuh, dalam berbagai versi
  (xls, csv, json)
- waktu upload akan dicek validitas key
- waktu insert data, user bisa download location key terlebih dahulu.
- location key bisa subset di daerah tertentu saja
- orang lain bisa branching data
- best saved in csv
- metadata saved in ini:
    - info referal: location database versi tertentu, scope filters
    - data owner (user)
    - column description
    - version data: time, comment

gudang-data-indonesia's People

Watchers

 avatar  avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    ๐Ÿ–– Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. ๐Ÿ“Š๐Ÿ“ˆ๐ŸŽ‰

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google โค๏ธ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.