- Tener/Instalar VirtualBox: https://www.virtualbox.org/wiki/Downloads.
- Descargar la máquina virtual del taller: https://www.dropbox.com/s/83i4cll8lgo6dzr/SparkR%3A%20Jornadas7.ova.
Nota: Se necesita como mínimo un ordenador de 64bits y 4gb de ram.
- Tener/Instalar Java.
- Descargar/clonar este repositorio con los códigos: https://github.com/jayusor/taller_SparkR/archive/master.zip
- Descargar Spark 1.5.1 y descomprimir en la misma carpeta que el zip anterior: http://www.apache.org/dyn/closer.lua/spark/spark-1.5.1/spark-1.5.1-bin-hadoop2.6.tgz
- Descargar y descomprimir el zip
datos_taller_sparkR.zip
: https://www.dropbox.com/s/0o024r5j2e0082g/datos_taller_sparkR.zip. - Instalar los siguientes paquetes de R:
paquetes <- c("rmarkdown","magrittr")
if( any(!paquetes %in% rownames(installed.packages())) ){
install.packages(paquetes[!paquetes %in% rownames(installed.packages())])
}