IKT 2020: Forschungsvorhaben zur automatisierten Analyse von Daten mittels Maschinellen Lernens
Fristen
- Daten des Inkrafttretens
- 01.06.2017
- Ende der Laufzeit
- 30.06.2026
- Einreichungsfrist(en)
15.10.2017
- Förderinstitution
- Bundesministerium für Bildung und Forschung (BMBF)
Beschreibung
Informations- und Kommunikationstechnologien (IKT) sind Treiber für Innovationen und damit Grundlage für neue Produkte, Verfahren und Dienstleistungen. Die „Digitale Wirtschaft und Gesellschaft“ voranzubringen ist eine der sechs prioritären Zukunftsaufgaben der „Neuen Hightech-Strategie – Innovationen für Deutschland“ der Bundesregierung. Mit dem Förderprogramm „IKT 2020 – Forschung für Innovationen“ setzt die Bundesregierung einen Schwerpunkt ihrer Innovationspolitik auf IKT. Die Analyse und Auswertung von großen Datenmengen ist eine der bedeutendsten Herausforderungen unserer Zeit. Einer der wichtigsten Technologiebausteine im Bereich der komplexen Datenanalysen stellt das Maschinelle Lernen (ML) dar. Das ML dient dazu, Muster in Daten zu erkennen oder Daten erst auf eine Weise zu segmentieren, die eine weitere Bearbeitung ermöglicht. Dabei kann ML nicht isoliert betrachtet werden, vielmehr ist es eingebettet in eine neue Wissenschaft der Datenanalyse, die das Lernen aus Beispielen mit Analysemethoden in Logik und Statistik verbindet.
Aus wissenschaftlicher wie technologischer Sicht wird die erfolgreiche Auswertung extrem großer Datenmengen als notwendiger Beitrag zur Bewältigung gesellschaftlicher Herausforderungen angesehen. Neue Anwendungsbereiche stellen das ML jedoch vor neue Herausforderungen. Diese Herausforderungen müssen adressiert werden, einerseits auf prinzipieller Ebene von induktiven Verfahren (u. a. Nachvollziehbarkeit, Validierbarkeit, Reproduzierbarkeit, Interdeterminismus) anderseits auch bei den Grenzen des ML (u. a. bei minimalen oder sehr großen Datenmengen, bei Lernen mit unsicheren Daten, bei exponentiell wachsendem Rechenaufwand). Weiterhin müssen Anforderungen verschiedener neuer Anwendungen hinsichtlich der Beweisbarkeit, Zuverlässigkeit, Zertifizierbarkeit und Transparenz untersucht werden. Große Herausforderungen und Potenziale ergeben sich auch für verschiedene Wissenschaftsdisziplinen, die sich mit einer immer größer werdenden Menge verwertbarer Daten für ihre Forschung konfrontiert sehen.
Eine Grundvoraussetzung für den erfolgreichen Einsatz von ML ist ein fundiertes Verständnis über die verschiedenen Verfahren des ML. In vielen Bereichen der Wissenschaft und in der deutschen Wirtschaft wurde dieses große Potenzial erkannt, allerdings werden entsprechende Verfahren nur selten konsequent angewandt. Um dieses enorme Potenzial des ML zu heben, sollen Kooperationen zwischen verschiedenen Disziplinen der Wissenschaft und Kooperationen zwischen grundlagenorientierten Theoretikern und praxisnahen Anwendern gefördert werden.
Zuwendungszweck
Durch die vorliegende Bekanntmachung sollen Forschungsvorhaben für die praxisrelevante Anwendung von Verfahren des ML gefördert werden. Von der Fördermaßnahme soll ein breiter und langfristiger Nutzen für die verschiedensten Anwender des ML ausgehen. Deshalb beabsichtigt das BMBF insbesondere die breite Anwendbarkeit der Methoden und Verfahren des ML deutlich zu steigern und somit neue disruptive Anwendungen und Technologien zu ermöglichen.
Gegenstand der Förderung
Das BMBF wird im Rahmen der Bekanntmachung Verbundprojekte von Partnern aus Wissenschaft und Wirtschaft in interdisziplinärer Zusammensetzung fördern, die gezielt die beschriebenen Herausforderungen adressieren und eine herausragende Exzellenz im Bereich des ML nachweisen können.
In den zu fördernden Projekten sollen Forschergruppen aus Universitäten, Forschungseinrichtungen oder Verbünde aus der Wissenschaft zusammenarbeiten, die idealerweise Anwender aus der Wirtschaft einbinden. In der Fördermaßnahme wird die Durchführung von FuE-Vorhaben gefördert, die Bezüge zu einem oder mehreren der folgenden FuE-Themen aufweisen:
- a) Robustheit: Techniken, die die Robustheit der Verfahren gegenüber den Eingabedaten erhöhen. Dazu gehören insbesondere:
- Kuration von Daten: für Lösungsansätze, die die Qualität der Eingabedaten erhöhen, Aussagen über die Datengüte ermöglichen, sowie das Zusammenführen heterogener Datenquellen angehen,
- minimale Datensätze: Techniken, die sich mit dem Problem der minimalen Datensätze (Lernen bei extrem geringen Trainingsdaten) für das ML beschäftigen,
- Flexibilität: Techniken, die die Adaption und Anpassbarkeit der Verfahren gegenüber sich verändernden Datendimensionen erhöhen;
- b) Nachvollziehbarkeit und Begründbarkeit: Techniken zur Verbindung induktiver Lernverfahren mit modellbasierten, deduktiven und anderen Ansätzen zur besseren Nachvollziehbarkeit und Begründbarkeit maschineller Lernverfahren. Dazu gehören insbesondere:
- Einbringung von Expertenwissen: Verfahren, die jenseits der zielgerichteten Auswahl von Trainingsdaten deklaratives oder modellhaftes A‑priori-Wissen des Anwenders einbringen, wie beispielsweise Constraints oder andere Verfahren,
- Verkettung: Techniken zur sinnvollen Kombination der Verfahren des ML mit anderen Verfahren der Künstlichen Intelligenz,
- Erklärbarkeit und Transparenz: Techniken zur nutzergerechten transparenten Darstellung des Lösungswegs. Adressierbar sind hier Ansätze, die das Verständnis für die Funktionsweise sowie die Erklärbarkeit erhöhen und den Weg zur Lösung überprüfbar und validierbar machen,
- Fehlerabschätzung: Techniken, die die Zuverlässigkeit der Algorithmen hinsichtlich Angaben zur Fehlerwahrscheinlichkeit und Plausibilität der gefundenen Lösung erhöhen,
- Haftungssicherheit: Verfahren zum Einsatz maschinellen Lernens unter einer für Haftungsfragen zuverlässigen und nachweisbaren Einhaltung vorgegebener Rahmengrößen;
c) Effizienz: Techniken zur Skalierbarkeit der Algorithmen wie z. B. Verteiltes Lernen.
Zuwendungsempfänger
Antragsberechtigt sind Hochschulen, Verbünde von Hochschulen und/oder außeruniversitären Forschungseinrichtungen und Unternehmen der gewerblichen Wirtschaft mit einem herausragenden Kompetenzprofil.
Verfahren
Das Verfahren ist zweistufig angelegt.