Hola,
esta es mi primera entrada tras volver a la EEAD-CSIC.
Si hace unos años explicaba en este blog cómo instalar el gestor de colas de cálculo gridengine en un servidor Ubuntu, esta semana lo actualizo para un servidor multicore con Debian 11:
Instalación de los diferentes componentes gridengine en la misma máquina:
Si tuvieras que empezar de cero puedes hacerlo con:
sudo apt purge gridengine-common
sudo rm -rf /var/spool/gridengine/spooldb/sge
sudo apt install gridengine-master gridengine-qmon gridengine-exec
Tras leer esto edité el fichero /etc/hosts así:
127.0.0.1 localhost.localdomain localhost
127.0.1.1 master master
121.xxx.yyy.zzz myhost
Ojo que la instalación crea el usuario sgeadmin. Para que tu propio usuario tenga privilegios de administración, crear y configurar una cola llamada all.q deberás hacer los siguiente:
sudo -u sgeadmin qconf -am myuser
# and to a userlist:
qconf -au myuser users
# Add a submission host:
qconf -as myhost
# Add an execution host, you will be prompted for information about the execution host
qconf -ae
# Add a new host group:
qconf -ahgrp @allhosts
# Add the exec host to the @allhosts list:
qconf -aattr hostgroup hostlist myhost @allhosts
# Add and configure queue, set the slots to CPU/cores, check parallel env (pe_list)
qconf -aq all.q
# Add the host group to the queue:
qconf -aattr queue hostlist @allhosts all.q
# Allocate slots in this queue:
qconf -aattr queue slots "[myhost=12]" all.q
Con esto estaría, y puedes comprobarlo con qstat -f o lanzando un trabajo con qsub
Con los siguientes comandos puedes reiniciar los respectivos servicios en Debian:
sudo systemctl restart gridengine-master.service
sudo systemctl restart gridengine-exec.service
Hasta pronto,
Bruno
https://serverfault.com/questions/241813/sun-grid-engine-set-memory-requirements-per-jobs
ResponderEliminar