Maths meets information specialists: MaRDI Workshop zu mathematischen Forschungsdaten für information specialists

Abstracts for the talks

Christine Biedinger :
(joint work with Jochen Fiedler)
Workflows for structuring mathematical research data
In the mathematical sciences, a large amount of data is regularly generated. This includes numerical data used and produced for specific computations, but also information of models, calculation methods, software, notations, etc. While there is now a growing awareness of the need to make numerical data findable, accessible, interoperable and reusable (FAIR), this awareness is not yet very pronounced for the other mentioned forms of data that arise. However, the research community can also benefit greatly for precisely these forms of data if they are stored according to FAIR principles, as we will explain in our talk.
As part of a solution approach, we present and discuss first results obtained by the interdisciplinary working group of the mathematical research data initiative MaRDI, which enable a fair storage of information on used workflows and models. In the process, the potentially complex work processes are recorded in a structured manner in a workflow schema. It combines a description of what is done with auxiliary information like software and hardware used as well as the applied mathematical models and solution techniques, and algorithms with their corresponding properties. For the models that are used in research, we develop an ontology, which allows to classify single components and quantities and to implement a knowledge graph that can then be browsed via a web platform. In this way, a wide variety of models and problems are linked together so that researchers can identify connections between different applications and exploit possible synergies.
The concepts designed so far are demonstrated on specific use cases involving complex mathematical models, parameter identification and data acquisition. They originate from applied research and therefore touch on diverse areas of mathematics, such as modeling, optimization, statistics, or machine learning - they are therefore not limited to a specific area of mathematics. The gains of documenting research data in such a scheme are compared to the expected additional effort.

Sibylle Hermann :
Forschungsdatenmanagement als Teil der Forschung im Zusammenspiel zwischen Infrastruktur und Wissenschaft
Um gutes Forschungsdatenmanagement betreiben zu können, müssen Infrastruktur und Wissenschaft eng zusammenarbeiten. Für das Veröffentlichen und Archivieren der Daten braucht es eine geeignete Infrastruktur, die an die Anforderungen der Wissenschaft angepasst ist. Dabei wird die Infrastruktur, genau wie Forschung, oft über Projekte entwickelt. Anders als in der Forschung, bei der es um das Erarbeiten neuer Erkenntnisse geht, schafft Infrastrukturförderung Rahmenbedingungen, Voraussetzungen und Strukturen, damit diese Erkenntnisse möglichst gut erarbeitet und verbreitet werden können (Ball, 2023). Ein Beispiel dafür ist das Publizieren der Forschungsdaten und -software und deren Beschreibung mit Metadaten. Dafür ist eine geeignete Fachexpertise der formalen und inhaltlichen Beschreibung notwendig, um die Daten inhaltlich zu beschreiben, aber auch eine geeignete Infrastruktur, um die Forschungsdaten finden und nachnutzen zu können. Ergänzt werden diese Überlegungen durch gezielte Weiterentwicklungen, die das Veröffentlichen und Auffinden der Forschungsdaten vereinfachen.
Forschungsdatenmanagement ist aber selber auch ein Forschungsgebiet und spielt nicht nur für das Veröffentlichen und Nachnutzen der Daten im Forschungsprozesses eine wichtige Rolle. Vielmehr fallen Forschungsdaten im gesamten Forschungsprozess an und kommen in vielen Ausprägungen vor. Das zeigen auch die Leitlinie zur Sicherung Guter Wissenschaftlicher Praxis der DFG (DFG, 2019), hier wird ersichtlich, dass es dabei nicht nur um das Veröffentlichen der Forschungsdaten (Leitlinie 13), der Qualitätssicherung (Leitlinie 7) und der Dokumentation (Leitlinie 12) geht, sondern auch das Forschungsdesign (Leitlinie 9) sowie die Methoden und Standards (Leitlinie 13) in das Forschungsdatenmanagement hineinspielen, in dem diese Punkte bisher wenig berücksichtigt werden. Auch hier braucht es gemeinsame Bemühungen, Standards und Infrastruktur aufzubauen, die auch den Spagat zwischen disziplinspezifischen Besonderheiten und allgemeingültiger Infrastruktur benötigen.
Im Vortrag wird am Beispiel des Exzellenzclusters SimTech aufgezeigt, wie Infrastruktur und Forschung erfolgreich zusammenarbeiten können. Weiterhin wird exemplarisch der Forschungsprozess aus den Ingenieurwissenschaften beleuchtet und auf dessen Implikationen für die Dokumentation und das Forschungsdatenmanagement eingegangen.
Ball, R. (2023). „Die Grenze zwischen Forschung und Infrastruktur wird zunehmend durchlässiger“: Interview mit Dr. Johannes Fournier, Leiter der Gruppe Wissenschaftliche Literaturversorgungs- und Informationssysteme (LIS). b.i.t. online, 26(3), 268–274.
DFG (Hrsg.). (2019). Leitlinien zur Sicherung Guter Wissenschaftlicher Praxis: Kodex.

Christian Himpe :
What is a Metadata-Lake and Why are We Building One?
Universities turn out to have a lot of research data. This data is sometimes: obvious, not obvious, or even hidden; and can be itself: structured, semi-structured, or unstructured. To have an insight into their data products, collections, and responsibilities, for: administration, discoverability, and demonstration for funding agencies, university libraries will have to build central data catalogs. In this regard, the University and State Library of Münster is building a so-called metadata-lake, aiming to tackle these pressing challenges. In this contribution I will delineate the metadata-lake data-architecture, and its meaning for subject-specific NFDI consortia.

Holger Israel :
Die Forschungsdatendienste der technischen Informationsbibliothek
Die Technische Informationsbibliothek (TIB) – Leibniz-Informationszentrum Technik und Naturwissenschaften vereint in sich mehrere Funktionen, in denen sie (Foschungsdaten-)dienste für die mathematische Community bereitstellt:
- Lokal als Universitätsbibliothek für Forschende der Leibniz-Universität Hannover
- Deutschlandweit als Zentrale Fachbibliothek für u.a. Mathematik mit dem Schwerpunkt Angewandte Mathematik
- Durch ihre Forschung und Entwicklung zur Digitalisierung der Wissenschaft, welche in Services wie dem Open Research Knowledge Graph Anwendung finden.
Als Organisation, die sich Open Science, zuverlässigen digitalen Infrastrukturen und verantwortungsvoller Datenwissenschaft verschrieben hat, engagiert sich die TIB in der NDFI in mehreren Konsortien und in den Sektionen.
In meinem Vortrag möchte ich einen Überblick über das Angebot der TIB für Forschende aus der Mathematik geben und aufzeigen, wie die TIB zu FAIReren mathematischen Forschungsdaten beitragen kann.

Note to the committee: Please let me know in case you prefer I give my talk in English.

Leonie Kayser :
MathRepo, das mathematische Repositorium des MPI MiS
MathRepo ist das Forschungsdatenrepositorium des MPI MiS mathrepo.mis.mpg.de
Ich gebe einen Einblick in den Aufbau des MathRepos, Erfahrungen mit den Mathematiker:innen und Ausblicke für die Zukunft.

Marco Reidelbach :
MaRDMO – Document and Query Interdisciplinary Workflows Using the MaRDI Portal.
The Mathematical Research Data Initiative (MaRDI) has set itself the goal of making information about mathematical objects, e.g. algorithms or models, available in a structured and easy-to-find manner in the form of a knowledge graph. The linking of all these objects with concrete questions, input and output data, software and hardware is done in specific workflows. To achieve reproducibility of these often interdisciplinary workflows, detailed documentation is required. For this purpose, a standardized template for workflow documentation was developed in the MaRDI Project, which can be completed by answering a simple questionnaire in the Research Data Management Organiser (RDMO). Workflows recorded in this way can be stored locally or published, through the MaRDMO Plugin, directly on the MaRDI Portal. In addition, central information of the documentations is integrated into the MaRDI Knowledge Graph. Next to the pure documentation of workflows, MaRDMO offers the possibility to retrieve existing workflows from the MaRDI Knowledge Graph in order to provide researchers with suggestions for future projects and to document workflows based on these suggestions. Thus, MaRDMO creates a community-driven knowledge loop that could help to overcome the replication crisis.

 

Date and Location

October 09 - 11, 2023
Max Planck Institute for Mathematics in the Sciences
G3 10 (Lecture hall)
Inselstr. 22
04103 Leipzig

Scientific Organizers

  • Tabea Bacher, MPI für Mathematik in den Naturwissenschaften
  • Tabea Krause, Universität Leipzig
  • Daniel Mietchen, FIZ Karlsruhe
  • Björn Schembera, Universität Stuttgart
  • Olaf Teschke, FIZ Karlsruhe

Administrative Contact

Tabea Bacher
MPI für Mathematik in den Naturwissenschaften
Contact by Email
25.09.2023, 01:27