Actualizar 'pruebas_spark.md'

This commit is contained in:
2021-04-03 21:58:16 -05:00
parent 45611bb725
commit 117f9ac8ef

View File

@@ -26,4 +26,25 @@ ssh cluster_master ~/Documentos/spark/sbin/start-workers.sh
ssh cluster_master ~/Documentos/spark/sbin/stop-workers.sh ssh cluster_master ~/Documentos/spark/sbin/stop-workers.sh
``` ```
![master](fotos/spark/workers_spark.png) ![master](fotos/spark/workers_spark.png)
## Carga de archivos
Para cargar datos es necesario enviarlos a todos los nodos , se podria enviar a cada nodo con **scp** o crear un archivo con el nombre del host de cada nodo.
```bash
for i in `cat slaves`; do
scp data.csv $i:~/dataSpark/
done
```
### Crear carpeta de datos
Todo:
- [ ] montar carpeta compartida Samba
```bash
for i in `cat slaves`; do
ssh $i mkdir ~/dataSpark
done
```