Angenommenes Paper für die IEEE ICCCS 2025 (International Conference on Computer and Communication Systems): “Highly scaled Federated Learning Simulations for Text Classification”

In dieser Studie wurde untersucht, wie sich die Klassifikationsgenauigkeit eines Sprachmodells, das mit Hilfe von föderiertem Lernen feinabgestimmt wurde, verändert, wenn dieselbe Datenmenge auf eine zunehmende Anzahl von Clients (bis zu 1.000) verteilt wird, so dass die Datenmenge pro Client stetig reduziert wird. Zu diesem Zweck wurden mehrere Experimente am Beispiel der bekannten Klassifizierungsaufgabe „Widerspruchserkennung“ durchgeführt und die Ergebnisse diskutiert.

Das Paper wird zwischen dem 18. und 21. April 2025 virtuell auf der Konferenz vorgestellt und anschließend publiziert.

Angenommnes Paper für die 10th IEEE DSS 2024 (International Conference in Data Science and Systems): “A Taxonomy for Evaluating Data Quality in Data Integration – Towards a Standardized Data Quality Management”

Diese Veröffentlichung verfolgt das Ziel, die Evaluation von Datenqualität zu standardisieren und zu vereinfachen. Die Qualität von Daten lässt dich durch Data Quality Characteristics und Data Quality Measures beschreiben. Diese sind jedoch für jeden Use Case neu zu definieren. Um diesen Aufwand zu reduzieren, wurde eine Taxonomie entwickelt, welche als Vorlage dient. Zudem wurde ein angepasster Prozess zur Evaluation der Qualität für den Use Case Datenintegration bechrieben und ein Prototyp entwickelt, welcher Anwendende durch die nötigen Schritte führt. 
Die Ergebnisse werden zwischen dem 13. und 15. Dezember 2024 virtuell auf der Konferenz vorgestellt und anschließend publiziert. 

Erfolgreicher Abschluss der Masterarbeit „Einsatzpotenziale von Federated Learning im Record-Linkage-Prozess“

In dieser Masterarbeit wurde der Einsatz von Federated Learning für die Klassifikation von übereinstimmenden Datensätzen untersucht. Dazu wurden in Laborexperimenten verschiedene Modelle trainiert und mit unterschiedlichen Daten evaluiert. Die Ergebnisse ermöglichen die Analyse des Einflusses von verschiedenen Modellen und Datenverteilungen auf die Klassifikationsqualität.

Erfolgreicher Abschluss der Bachelorarbeit „Vergleich von Federated Learning Frameworks“

Das Ziel dieser Bachelorarbeit war ein systematischer Vergleich von bestehenden Frameworks für Federated Learning (FL). Durch Recherche in Fachliteratur und im Internet wurden 29 FL-Frameworks identifiziert. Nach einem mehrstufigen Auswahlprozess wurden fünf Frameworks (PySyft, FATE, FedML, Flower, OpenFL) ausgewählt und anhand eines Kriterienkatalogs verglichen. Dieser Katalog umfasst 25 Kriterien, die den Funktionsumfang und die Einsatzgebiete der Frameworks detailliert beschreiben.

Zusätzlich wurden die Frameworks anhand eines konkreten Beispiels implementiert, um ihre Leistung in der Praxis zu vergleichen.

Erfolgreicher Abschluss der Masterarbeit „Decentralized Federated Contradiction Detection“

Das Ziel dieser Masterarbeit bestand in der Implementierung und Evaluation unterschiedlicher dezentraler FL-Topologien zum Zwecke eines föderiert trainierten Widerspruchserkennungs-Modells. Auf diese Weise konnten wichtige Erkenntnisse über den Einfluss der jeweiligen Topologie auf die Modell-Genauigkeit sowie die Konvergenz innerhalb des föderierten Clusters gesammelt und diskutiert werden.

Erfolgreicher Abschluss der Masterarbeit „Federated Contradiction Detection“

In dieser Masterarbeit wurde mit Hilfe von Federated Learning ein Modell zur Erkennung von Widersprüchen zwischen natürlichsprachigen Sätzen entwickelt und evaluiert. Zu diesem Zweck wurde im Rahmen von unterschiedlichen Laborexperimenten untersucht, welchen Einfluss eine unterschiedliche Non-IID-Datenverteilungen sowie eine erhöhte Anzahl an partizipierenden Clients auf die Klassifikationsqualität des Modells haben.

Angenommenes Paper für die IEEE BdKCSE (Big Data, Knowledge and Control Systems Engineering) 2023: Exploring Federated Learning for Data Integtation – A Structured Literature Review

Durch ein systematisches Literatur Review wurde der aktuelle State of the Art für die Kombination der beiden Themenbereiche Data Integration und Federated Learning untersucht. Neben dem aktuellen Forschungsstand wurden Herausforderungen und eine Forschungslücke für zukünftige Forschungsvorhaben dargestellt. Die Ergebnisse werden vom 02. bis 03.11.2023 virtuell auf der Konferenz vorgestellt und anschließend publiziert.

Angenommener Beitrag für die IEEE AIBThings 2023 „Natural Language Processing using Federated Learning: A Structured Literature Review”

Im Rahmen eines systemischen Literatur-Reviews wurde der Einsatz von Federated Learning für Natural Language Processing untersucht. Dazu wurde der state-of-the-art sowie Herausforderungen und Ansätze für weiter Forschungsaktivitäten dargestellt. Das Paper wurde bei der IEEE International Conference on Artificial Intelligence, Blockchain, and Internet of Things (IEEE AIBThings 2023) angenommen und wird vom 16. bis 17. September vorgestellt und anschließend publiziert. Die Teilnahme an der Konferenz erfolgt virtuell.

Zuwachs im CoLDa-Team

Seit dem 01.05.2023 unterstützt uns Jonas bei der Arbeit im Projekt. Jonas studiert im 4. Semester Bachelor Wirtschaftsinformatik und wird bei der Entwicklung von Prototypen unterstützen.

Wir freuen uns sehr auf die künftige gemeinsame Arbeit mit Jonas und begrüßen Ihn herzlich in unserem Team!

Quartalsmeeting Q1 2023

Am 12.04.2023 fand das erste Quartalsmeeting in Sankt Augustin mit Frank Köster, Michael Karl, Lars Steffens, Jorge Marx Gómez, Gerrit Schumann, und Jan-Philipp Awick statt. In dem Meeting wurden die laufenden Arbeitspakete und die bisherigen Ergebnisse vorgestellt. Zudem wurde der aktuelle Stand des Demonstrators vorgeführt und Feedback für dessen Erweiterung aufgenommen. Im Anschluss wurden die nächsten Aufgabenpakete und Ziele diskutiert und festgelegt.

en_USEnglish