From 117f9ac8ef9326a98082567f3b4968d2b0d9801b Mon Sep 17 00:00:00 2001 From: mdchaparror Date: Sat, 3 Apr 2021 21:58:16 -0500 Subject: [PATCH] Actualizar 'pruebas_spark.md' --- pruebas_spark.md | 23 ++++++++++++++++++++++- 1 file changed, 22 insertions(+), 1 deletion(-) diff --git a/pruebas_spark.md b/pruebas_spark.md index 577dbd7..95ba20d 100644 --- a/pruebas_spark.md +++ b/pruebas_spark.md @@ -26,4 +26,25 @@ ssh cluster_master ~/Documentos/spark/sbin/start-workers.sh ssh cluster_master ~/Documentos/spark/sbin/stop-workers.sh ``` -![master](fotos/spark/workers_spark.png) \ No newline at end of file +![master](fotos/spark/workers_spark.png) + +## Carga de archivos + +Para cargar datos es necesario enviarlos a todos los nodos , se podria enviar a cada nodo con **scp** o crear un archivo con el nombre del host de cada nodo. + +```bash +for i in `cat slaves`; do +scp data.csv $i:~/dataSpark/ +done +``` + +### Crear carpeta de datos +Todo: + +- [ ] montar carpeta compartida Samba + +```bash +for i in `cat slaves`; do +ssh $i mkdir ~/dataSpark +done +``` \ No newline at end of file