bwGRiD Cluster Mannheim

Störungen/Wartungen



+++++ Hinweise zur Abschaltung bwGRiD Mannheim / Heidelberg +++++


Abschaltung des bwGRiD-Clusters MA/HD am 28. Februar2015

Im Zuge der sukzessiven Umstellung auf die neue Infrastruktur werden wir die Rechenknoten des alten bwGRiD-Clusters MA/HD, der nach sieben Jahren das Ende seiner Lebensdauer erreicht hat, Ende Februar abschalten. Damit schaffen wir Platz und Kapazitäten für eine Preview-Version und die Installation des neuen bwForClusters für Molecular Life Science sowie Wirtschafts- und Sozialwissenschaften. Die Daten in Ihren persönlichen Verzeichnissen werden noch zum 31. März 2015 zugänglich sein.

Umzug Ihrer Rechenvorhaben

Bitte stellen Sie sicher, dass Sie Ihre Daten rechtzeitig an anderem Ort zugänglich machen. Wir empfehlen die Nutzung des bwFileStorage-Dienstes. Wie empfehlen Ihnen außerdem, möglichst zeitnah mit der Migration Ihrer Rechenprojekte auf den bwUniCluster oder, falls zutreffend, den bereits verfügbaren bwForCluster für Computational Chemistry zu beginnen, um eine Übergangsphase zur Beseitigung etwaiger Komplikationen nutzen zu können. Falls Sie bisher keinen Zugang zum bwUniCluster haben, finden Sie hier Informationen zu dessen Freischaltung. Mit zunehmender Verfügbarkeit der fachspezifischen bwForCluster können Sie Ihre Projekte dann nahtlos dorthin umziehen.

Anpassung an die neuen Systeme

Der bwUniCluster und die neuen bwForCluster unterscheiden sich in der Handhabung geringfügig vom bisherigen bwGRiD-Cluster. Für die Stapelverarbeitung Ihrer Rechenaufträge kommt das Moab-System der Firma Adaptive Computing zum Einsatz. Dies macht kleinere Änderungen Ihrer Job-Dateien und deren Handhabung erforderlich. Im Wesentlichen handelt es sich um die Verwendung der Direktive #MSUB statt des bisherigen #PBS zur Anforderung der benötigten Ressourcen sowie des Befehls msub statt des bisherigen qsub zum Absenden des Auftrags. Eine Dokumentation des neuen Systems und zahlreiche Tipps zur Optimierung finden Sie in den Hinweisen zu Batch Jobs im bwHPC-C5 Wiki.

Hilfe und Support

Falls Sie auf den neuen Clustern von Ihnen benötigte Softwarepakete vermissen, Hilfe beim Zugang, dem Umzug Ihrer Daten und der Anpassung Ihrer Job-Dateien benötigen oder sonstige Fragen haben, wenden Sie sich bitte über die Support-E-Mail-Adresse Ihres Standorts an uns: hpc-support@mailman.uni-mannheim.de.


+++++ Hinweise zur Abschaltung bwGRiD Mannheim / Heidelberg +++++


Beschreibung bwGRiD

Die staatlichen Universitäten des Landes Baden-Württemberg haben sich entschlossen, eine regionale Grid-Cluster-Infrastruktur aufzubauen. Federführend bei dem Vorhaben ist das Höchstleistungsrechenzentrum Stuttgart (HLRS). Die Cluster-Hardware wurde finanziert durch das Bundesministerium für Bildung und Forschung. Personal und Storage-Infrastruktur werden vom Land Baden-Württemberg getragen. Unser Parallelrechner grid.uni-mannheim.de ist einer dieser Hochleistungscluster der bwGRiD-Initiative.

Der an der Universität Mannheim aufgestellte Cluster besteht aus 140 sogenannten Blades (auf das Minimum reduzierten Mainboards). Diese Blades sind die Compute Nodes des Clusters. Die Maschine kann genutzt werden für

  • Parallel Computing mit verteiltem Speicher (Jeder Compute-Node besitzt seinen eigenen Speicherbereich. Andere Nodes können nicht auf diesen Teil des Speichers lesend oder schreibend zugreifen. Alle 140 Nodes mit insgesamt 1120 Cores können genutzt werden.)
  • Parallel Computing mit gemeinsamem Speicher (Bis zu 8 Cores partipizieren an einem gemeinsamen Speicher, d.h. jeder Core kann hier lesen und schreiben.)
  • Skalarbetrieb (Nur ein Core arbeitet an dem Auftrag.) 

Der Cluster ist konzipiert für den Batchbetrieb, d.h. Aufträge werden nicht-interaktiv gerechnet. Dabei wird eine Befehlsdatei abgearbeitet, die zuvor vom Nutzer erstellt wurde. Interaktiver Zugriff ist ebenfalls möglich, z.B. zur Entwicklung von Software (Tests, Debugging) und für die Nutzung interaktiver Programme.

Dokumentation


Kopplung mit bwGRiD Cluster Heidelberg

Seit Juli 2009 sind die bwGRiD Cluster von Mannheim und Heidelberg zu einem einzigen Cluster gekoppelt. Es gibt eine gemeinsame Benutzerverwaltung und ein gemeinsames Batch-System. Den Nutzern der Universitäten Mannheim und Heidelberg steht somit eine Rechenleistung von insgesamt 2240 Cores zur Verfügung.

Aktuelles

bwForTreff
Nächstes Nutzertreffen:
25.02.2015, 16:15-18:00
Universität Mannheim
Rechenzentrum
L 15 1-6
Thema:
Einführung bwUniCluster
Pressemitteilung des MWK
bwGRiD Nachfolge-Cluster wurde bewilligt.