Strategien für den Datenzugriff

Remote Datenzugriff: große Datensätze werden zunächst an den PNI-Zentren gespeichert und externen Nutzern, die nicht in der Lage sind die Daten zu ihrem Heimat-Institut zu transferieren, müssen in der Lage sein die Daten remote zuzugreifen. Ein Web-basiertes Portal soll als einheitliche Zugangsschnittstelle agieren. Eine Untersuchung der etablierten OpenSource Lösungen (z.B. Fedora Commons) und implementierten oder geplannten Lösungen an anderen Einrichtungen (z.B. DIAMOND, EuroFEL) soll durchgeführt und ein Prototyp des Portals am DESY implementiert werden. In der vorhergesehenen Lösung soll der Nutzer in die Lage versetzt werden ...

  • Daten zu suchen
  • durch große Datensätze zu blättern und deren Inhalt zu visualisieren
  • spezifisch Teile großer Datensätze zu kopieren und die Notwendigkeit immer den gesammten Datensatz transferieren zu müssen.

Wenn der Nutzer sich entscheidet die Daten an der Einrichtung zu belassen, werden die Daten mit einem geeignetem Caching und Bandroboter-System für einen definierten Zeitraum, der mit den Communities vereinbart werden muss, gepflegt. Eine Option wäre dabei das dCache-System, das von DESY und FermiLab entwickelt wurde. Ein langfristiges Ziel, das allerdings nicht Teil der ersten Phase von HDRI sein wird, ist der Zugang zu den Daten in Rahmen eines Daten-GRIDs.

Remote Computing: für Nutzer ohne ausreichende Infrastruktur um die Daten an ihrem Heimat-Institut zu prozessieren, wird eine entsprechende Platform für die Remote-Datenanalyse bereitgestellt. Für diesen Zweck werden Compute-Resourcen und ein PNI-weites Repository mit den nötigen Programmen und Algorithmen etabliert. Dies wird die grundlegenden Bedürfnisse der Datenanalyse abdecken, aber auch für gewisse wissenschaftliche Anwendungen spezifische Software beinhalten (z.B. tomographische Rekonstruktionen). Die Arbeiten daran werden im Rahmen des Projektes initiert, werden aber über das Projekt hinaus fortgeführt werden müssen.

Authentifizierung und Authorisierung: Remote Zugang zu Daten und Compute Resourcen erfordert ein Authentifizierungs- und Authorisierungs-Schema. Es wird beabsichtigt einen übergreifenden Mechanismus für alle HDRI-Zentren zu etablieren. Basierend auf einer detaillierten Bewertung verfügbarer Authentifizierungs-Systeme (z.B. OpenID, Shibboleth) soll eine Lösung gewählt und an den beteligten Einrichtungen implementiert werden, mit der Idee, das Nutzer ihre Kontaktdaten nur einmalig innerhalb von PNI angeben oder aktualisieren müssten.