IRIS Adlershof hat erste Schritte zur Etablierung eines neuen Forschungsfeldes, Big Data, an der Schnittstelle von Physik, Mathematik, Informatik, Chemie und Materialwissenschaften unternommen.
Innovatives Management von Big Data in der computergestützten Materialwissenschaft ist einer der Forschungsschwerpunkte von den IRIS-Mitgliedern C. Draxl und M. Scheffler. Sie haben in den letzten Jahren in enger Zusammenarbeit das Novel Materials Discovery Laboratory (NOMAD Lab) aufgebaut, die weltweit größte Datenbank für Materialeigenschaften, die mittlerweile 100 Millionen Berechnungen enthält. Als FAIRe (Findable, Accessible, Interoperable, and Re-purposable) Infrastruktur konzipiert, ermöglicht das NOMAD Lab den produktiven Umgang mit wissenschaftlichen Daten und ist damit zusammen mit dem Einsatz von Künstlicher Intelligenz essenziell für die Entwicklung von Zukunftstechnologien. Im Rahmen des NOMAD Center of Excellence, das 2020 für eine zweite Förderperiode verlängert wurde, entwickeln Draxl und Scheffler zudem die rechnergestützen Materialwissenschaften weiter zu neuen Anwendungen und bereiten sie für die nächste Generation von Höchstleistungsrechnern (Exascale-Computern) vor.
Auch der im Juli 2020 von der Deutschen Forschungsgemeinschaft bewilligte SFB 1404 FONDA – Foundations of Workflows for Large-Scale Scientific Data Analysis stellt eine Weiterentwicklung von IRIS Adlershof in Richtung Big Data dar. Im SFB 1404 untersucht eine interdisziplinäre Gruppe von Forschern aus Informatik, Materialwissenschaften, Geowissenschaften und Lebenswissenschaften Methoden zur Steigerung der Produktivität bei der Entwicklung, Ausführung und Wartung von Datenanalyse-Workflows (DAW) für große wissenschaftliche Datensätze. Langfristiges Ziel ist es, Methoden und Werkzeuge zu entwickeln, die eine erhebliche Reduzierung der Entwicklungszeit und der Entwicklungskosten von DAWs erreichen. Sprecher des SFB ist IRIS-Mitglied U. Leser vom Institut der Informatik der HU. Weitere teilnehmende IRIS-Mitglieder sind C. Draxl und C.T. Koch.
FAIRmat repräsentiert das vielfältige Forschungsgebiet der Sektion Kondensierte Materie (SKM) der Deutschen Physikalischen Gesellschaft (DPG) sowie die chemische Physik von Festkörpern. Das Projekt erhält Fördermittel für den Aufbau einer Infrastruktur, die es ermöglicht, materialwissenschaftliche Daten FAIR zu machen: auffindbar (Findable), zugänglich (Accessible), interoperabel (Interoperable) und wiederverwendbar (Re-purposable). Damit wird es Forschenden in Deutschland und darüber hinaus ermöglichen, Daten langfristig zu speichern, zu teilen, zu finden und zu analysieren.