diff --git a/pruebas_spark.md b/pruebas_spark.md index 577dbd7..95ba20d 100644 --- a/pruebas_spark.md +++ b/pruebas_spark.md @@ -26,4 +26,25 @@ ssh cluster_master ~/Documentos/spark/sbin/start-workers.sh ssh cluster_master ~/Documentos/spark/sbin/stop-workers.sh ``` -![master](fotos/spark/workers_spark.png) \ No newline at end of file +![master](fotos/spark/workers_spark.png) + +## Carga de archivos + +Para cargar datos es necesario enviarlos a todos los nodos , se podria enviar a cada nodo con **scp** o crear un archivo con el nombre del host de cada nodo. + +```bash +for i in `cat slaves`; do +scp data.csv $i:~/dataSpark/ +done +``` + +### Crear carpeta de datos +Todo: + +- [ ] montar carpeta compartida Samba + +```bash +for i in `cat slaves`; do +ssh $i mkdir ~/dataSpark +done +``` \ No newline at end of file