PubFlow

Motivation

Research Workflows

Traditionell konzentrieren sich wissenschaftliche Arbeiten z. B. auf die Durchführung von Laborexperimenten zur Überprüfung von aufgestellten Hypothesen. Die rasch fortschreitende Entwicklung und Verbreitung von IT-Technologien hat die wissenschaftliche Arbeit in vielen Bereichen stark verändert. Ergebnisse von Experimenten werden digital erfasst und weiterverarbeitet oder gar ganze Experimente werden mit einem Computer simuliert. Für diese IT-getriebene Art wissenschaftlichen Arbeitens haben sich die Begriffe Computational Science und Scientific Computing etabliert. Zentraler Kern bilden dabei Daten. Über zum Teil komplexe Prozessketten werden vorher ausgewählte Daten verarbeitet und die Ergebnisdaten analysiert bzw. visualisiert, mit dem Ziel, neue wissenschaftliche Erkenntnisse zu erlangen. Die automatisierte Ausführung dieser Arbeitsschritte wird durch Scientific Workflows ermöglicht [1]. Da diese Prozessketten oft aus zahlreichen aufeinanderfolgenden Schritten der Datenprozessierung, -analyse und -visualisierung bestehen, haben sich Workflows als geeignete Repräsentation etabliert. Grundsätzlich haben Scientific Workflows nach Ludäscher et al. [2] zwei zentrale Ziele:


Save 'machine cycles
': Die Workflow-Ausführung soll auf den verfügbaren Hardware-Ressourcen
optimiert werden.

Save ’human cycles': Die Wissenschaftler sollen sich auf ihre disziplinspezifischen Fragen konzentrieren können, statt sich mit komplexen IT-Fragen beschäftigen zu müssen.

Der erste Punkt bezieht sich insbesondere auf die Parallelisierung zur Performancesteigerung. In PubFlow steht der zweite Punkt im Fokus, der die Benutzbarkeit und den Nutzen für die Wissenschaftler betrifft. Wie z. B. auch in [3] diskutiert wird, ist die einfache Benutzbarkeit ein entscheidender Erfolgsfaktor für die Etablierung von Scientific Workflows. Gleichzeitig ist es erforderlich, den Wissenschaftlern den Nutzen zu vermitteln, den sie durch ein professionelles Datenmanagement für ihre fachwissenschaftliche Arbeit erreichen können.


[1] A. Shoshani and D. Rotem, editors. Scientific Data Management: Challenges, Technology, and Deployment. Francis & Taylor, 2009.

[2] B. Ludäscher, M. Weske, T. M. McPhillips, and S. Bowers. Scientific workflows: Business as usual? In Proc. 7th International Conference, BPM 2009, pages 31–47, 2009.

[3] P. Maechling, H. Chalupsky, M. Dougherty, E. Deelman, Y. Gil, S. Gullapalli, V. Gupta, C. Kesselman, J. Kim, G. Mehta, B. Mendenhall, T. Russ, G. Singh, M. Spraragen, G. Staples, and K. Vahi. Simplifying construction of complex workflows for non-expert users of the Southern California Earthquake Center Community Modeling Environment. SIGMOD Rec., 34(3):24–30, 2005.