Angenommenes Paper auf ICRAIS 2025 (International Conference on Recent Advancements in Information Systems): “A Comprehensive Comparison of Federated Learning Frameworks”

Im Rahmen dieser Veröffentlichung wurden aktuelle Frameworks für den Einsatz von föderiertem Lernen ermittelt und anhand eines erarbeiteten Kriterienkatalogs verglichen. Die Ergebnisse stellen neben den unterstützten Funktionalitäten auch technische und rechtliche Aspekte sowie die Nutzerfreundlichkeit gegenüber. Darüber hinaus wurde eine technische Evaluation mit einem standardisierten Benchmark-Datensatz durchgeführt, um die Frameworks hinsichtlich ihrer Performance zu vergleichen.

Das Paper wird am 10. September 2025 auf der Konferenz vorgestellt und folgend publiziert.

Angenommenes Paper auf der IEEE CSCS 2025 (International Conference on Control Systems and Computer Science): “Entity Matching in the Era of Language Models: A Structured Literature Review”

Im Rahmen eines systematischen Literatur-Reviews wurde der aktuelle Stand der Forschung für den Einsatz von Language Models im Entity Matching untersucht. Dazu wurden 54 Paper systematisch ausgewertet, um aktuelle Trends und Limitationen aufzuzeigen sowie Ansätze für zukünftige Forschungsvorhaben abzuleiten.

Das Paper wurde am 28. Mai 2025 online vorgestellt und anschließend publiziert.

Angenommenes Paper für die IEEE CCCBDA 2025 (International Conference on Cloud Computing and Big Data Analytics): “Benchmarking Scalability and Effectiveness of Blocking Approaches for Entity Matching: A Comparative Analysis”

Im Rahmen dieser Veröffentlichung wurden acht unterschiedliche Open-Source Blocking-Verfahren hinsichtlich der Skalierbarkeit und der Effektivität gebenchmarkt. Hierzu wurden sowohl Benchmark-Daten als auch reale Datenquellen genutzt. Die Ergebnisse zeigen neben der Skalierbarkeit auch die Einflüsse unterschiedlicher Parameterkonfigurationen auf.

Die Ergebnisse wurden am 27. April 2025 virtuell auf der Konferenz vorgestellt und anschließend publiziert.

Angenommenes Paper für die IEEE ICCCS 2025 (International Conference on Computer and Communication Systems): “Highly scaled Federated Learning Simulations for Text Classification”

In dieser Studie wurde untersucht, wie sich die Klassifikationsgenauigkeit eines Sprachmodells, das mit Hilfe von föderiertem Lernen feinabgestimmt wurde, verändert, wenn dieselbe Datenmenge auf eine zunehmende Anzahl von Clients (bis zu 1.000) verteilt wird, so dass die Datenmenge pro Client stetig reduziert wird. Zu diesem Zweck wurden mehrere Experimente am Beispiel der bekannten Klassifizierungsaufgabe „Widerspruchserkennung“ durchgeführt und die Ergebnisse diskutiert.

Das Paper wird zwischen dem 18. und 21. April 2025 virtuell auf der Konferenz vorgestellt und anschließend publiziert.

Angenommnes Paper für die 10th IEEE DSS 2024 (International Conference in Data Science and Systems): “A Taxonomy for Evaluating Data Quality in Data Integration – Towards a Standardized Data Quality Management”

Diese Veröffentlichung verfolgt das Ziel, die Evaluation von Datenqualität zu standardisieren und zu vereinfachen. Die Qualität von Daten lässt dich durch Data Quality Characteristics und Data Quality Measures beschreiben. Diese sind jedoch für jeden Use Case neu zu definieren. Um diesen Aufwand zu reduzieren, wurde eine Taxonomie entwickelt, welche als Vorlage dient. Zudem wurde ein angepasster Prozess zur Evaluation der Qualität für den Use Case Datenintegration bechrieben und ein Prototyp entwickelt, welcher Anwendende durch die nötigen Schritte führt. 
Die Ergebnisse werden zwischen dem 13. und 15. Dezember 2024 virtuell auf der Konferenz vorgestellt und anschließend publiziert. 

Erfolgreicher Abschluss der Masterarbeit „Einsatzpotenziale von Federated Learning im Record-Linkage-Prozess“

In dieser Masterarbeit wurde der Einsatz von Federated Learning für die Klassifikation von übereinstimmenden Datensätzen untersucht. Dazu wurden in Laborexperimenten verschiedene Modelle trainiert und mit unterschiedlichen Daten evaluiert. Die Ergebnisse ermöglichen die Analyse des Einflusses von verschiedenen Modellen und Datenverteilungen auf die Klassifikationsqualität.

Erfolgreicher Abschluss der Bachelorarbeit „Vergleich von Federated Learning Frameworks“

Das Ziel dieser Bachelorarbeit war ein systematischer Vergleich von bestehenden Frameworks für Federated Learning (FL). Durch Recherche in Fachliteratur und im Internet wurden 29 FL-Frameworks identifiziert. Nach einem mehrstufigen Auswahlprozess wurden fünf Frameworks (PySyft, FATE, FedML, Flower, OpenFL) ausgewählt und anhand eines Kriterienkatalogs verglichen. Dieser Katalog umfasst 25 Kriterien, die den Funktionsumfang und die Einsatzgebiete der Frameworks detailliert beschreiben.

Zusätzlich wurden die Frameworks anhand eines konkreten Beispiels implementiert, um ihre Leistung in der Praxis zu vergleichen.

Erfolgreicher Abschluss der Masterarbeit „Decentralized Federated Contradiction Detection“

Das Ziel dieser Masterarbeit bestand in der Implementierung und Evaluation unterschiedlicher dezentraler FL-Topologien zum Zwecke eines föderiert trainierten Widerspruchserkennungs-Modells. Auf diese Weise konnten wichtige Erkenntnisse über den Einfluss der jeweiligen Topologie auf die Modell-Genauigkeit sowie die Konvergenz innerhalb des föderierten Clusters gesammelt und diskutiert werden.

Erfolgreicher Abschluss der Masterarbeit „Federated Contradiction Detection“

In dieser Masterarbeit wurde mit Hilfe von Federated Learning ein Modell zur Erkennung von Widersprüchen zwischen natürlichsprachigen Sätzen entwickelt und evaluiert. Zu diesem Zweck wurde im Rahmen von unterschiedlichen Laborexperimenten untersucht, welchen Einfluss eine unterschiedliche Non-IID-Datenverteilungen sowie eine erhöhte Anzahl an partizipierenden Clients auf die Klassifikationsqualität des Modells haben.

Angenommenes Paper für die IEEE BdKCSE (Big Data, Knowledge and Control Systems Engineering) 2023: Exploring Federated Learning for Data Integtation – A Structured Literature Review

Durch ein systematisches Literatur Review wurde der aktuelle State of the Art für die Kombination der beiden Themenbereiche Data Integration und Federated Learning untersucht. Neben dem aktuellen Forschungsstand wurden Herausforderungen und eine Forschungslücke für zukünftige Forschungsvorhaben dargestellt. Die Ergebnisse werden vom 02. bis 03.11.2023 virtuell auf der Konferenz vorgestellt und anschließend publiziert.

de_DEDeutsch