Updates


Event Date Summary

Storage system fixed.

Système de stockage rétabli.

The storage system behing /home is not responding. We are investigating the problem.


Le système de stockage derrière /home ne répond pas. Nous analysons le problème.

An update of the Slurm scheduler is required to fix a bug. We expect the access to compute nodes to resume by 3pm EDT on May 3rd


Une mise-à-jour de l'ordonnanceur Slurm est requise afin de corriger un certain bogue. Nous prévoyons que l'accès aux noeuds de calculs sera rétabli d'ici 15h (HAE) ce 3 mai.


Incident description

System Incident status Start Date End Date
Narval Closed
Created by Pier-Luc St-Onge on

Title


(Update) Planned Outage - (Mise-à-jour) Arrêt planifié


Summary


Narval will be unavailable from 9:00 PM EDT on May 2 until 12:00 PM EDT on May 3 due to an electrical outage required for Beluga’s return to service.

This planned outage will only affect Narval’s compute nodes. All other services, including login nodes, storage, the Béluga cloud and Juno secure cloud will be available.

Any jobs that have been submitted and which have a duration that would extend beyond the start of the outage will not start until service is restored. No action is required on your part.


En raison d’une coupure électrique nécessaire aux travaux de remise en service de Béluga, Narval ne sera pas disponible à partir de 21h HAE le 2 mai jusqu’à 12h HAE le 3 mai.

Cette coupure affecte uniquement les nœuds de calcul de Narval. Tous les autres services, incluant les nœuds de tête, le stockage, le nuage Béluga, ainsi que le nuage sécurisé Juno resteront accessibles.

Les tâches qui auraient été soumises et dont l’exécution se prolongerait au-delà de l’arrêt ne démarreront qu'une fois le service rétabli. Aucune action n’est requise de votre part.


Updated by Pier-Luc St-Onge on