Bonsoir,
Gros souci avec Caparmor avec un plan de simulation (en PJ). Lorsque j'ai lancé ce plan sur Caparmor, les simulations se sont lancées de manière indépendante mais sans limite : une à une, des simulations se sont lancées sur Caparmor, sans attendre que l'autre soit terminée, jusqu'à ce que plus de 200 simus aient été lancées, ce qui est bien plus que le nombre de coeurs auquel nous avons droit. Là, j'ai eu des centaines de messages d'erreur, plantage, et j'ai dû redémarrer(j'espère vraiment qu'aucun autre utilisateur n'avait de choses importantes en cours sur la machine)(je n'ai pas le debug comme j'ai relancé ISIS après redémarrage). C'est le fonctionnement normal. Si elles sont indépendantes, il peut les lancer toutes en même temps sur caparmor. Par contre, faut pas le faire, sinon Tina va pas être contente ;)
Lorsque je fais la même chose en local, une à une, autant de simus que de coeurs dispos se lancent, se réalisent en même temps, se terminent, puis le même nombre de simus va se lancer, etc.C'est exactement ce qu'on veut. C'est pareil, sauf qu'en local il les lances et les execute toutes en même tant et est limité par le nombre de processeur.
Donc le problème ne vient pas de mes scripts... Je suis contraint, pour utiliser ces plans sur caparmor, de le faire en dépendant (lorque je déclare ma classe : "[....] extends SimulationPlan"), ce qui nous fait perdre tout l'intérêt de la parallélisation puisqu'il faut attendre qu'une simu soit terminée pour lancer l'autre. Une solution pour utiliser ce plan de simus sur Caparmor avec des simus indépendantes?
Il n'y a pas vraiment de problème avec cette approche. Tu peux lancer 2000 simulations il va les lancer sur caparmor, mais caparmor les fera 16 par 16. Le seul problème est que qstat va lister 1984 jobs en attente et ca va gêner les admins. Actuellement, je n'ai pas de solution. Les simulations sont indépendantes mais pas identiques, et on ne pourra pas les lier dans un multijobs. -- Éric Chatellier