SecureRAG
Edorex AG und BFH-TI zeigen in dieser Studie, wie KI SQL-Datenbanken sicher, effizient und datenschutzkonform abfragen kann – zur Demonstration der technischen Machbarkeit.
Steckbrief
- Beteiligte Departemente Technik und Informatik
- Institut(e) Institute for Cybersecurity & Engineering (ICE)
- Förderorganisation Andere
- Laufzeit (geplant) 01.03.2025 - 31.08.2025
- Projektleitung Prof. Dr. Ulrich Fiedler
-
Projektmitarbeitende
Prof. Dr. Jürgen Vogel
Catherine Ikae - Partner Edorex AG
- Schlüsselwörter Künstliche Intelligenz (KI), Large Language Models (LLM), Retrieval-Augmented Generation (RAG), Text-to-SQL, Prompt Engineering, SQL-Datenbanken, Automatisierung, Datenanalyse, Technische Machbarkeit, Kontinuierliches Lernen
Ausgangslage
Die Edorex AG, ein Schweizer Softwareunternehmen mit Schwerpunkt auf digitale Transformation, erweitert ihre Kompetenzen im Bereich Künstliche Intelligenz (KI) gezielt. Im Vordergrund stehen dabei moderne Ansätze wie Large Language Models (LLM) zur Verarbeitung natürlicher Sprache sowie Retrieval-Augmented Generation (RAG), bei der externe Wissensquellen in KI-Abfragen integriert werden. Als zentrales Produkt entwickelt Edorex die KI-Assistentin Kira, die Unternehmen bei der Informationssuche, Automatisierung von Aufgaben und Nutzung interner Daten unterstützt. Gemeinsam mit der Berner Fachhochschule (BFH-TI) wurde im Rahmen eines Vorprojekts untersucht, wie Kira künftig auch SQL-Datenbanken in einer sicheren Umgebung ansprechen kann. Damit eröffnen sich neue Möglichkeiten für die effiziente Nutzung strukturierter Unternehmensdaten, ohne Kompromisse beim Datenschutz einzugehen.
Vorgehen
Das Projekt wurde agil und iterativ umgesetzt. Zu Beginn analysierte das Team die bestehenden Datenstrukturen, um ein präzises Verständnis der zu verarbeitenden Informationen zu gewinnen. Darauf aufbauend entstand ein spezifischer Testdatensatz, der als Grundlage für die Evaluation und Optimierung diente. Im Zentrum stand das Prompt Engineering: Durch wiederholte Verfeinerung der Eingaben für die Large Language Models (LLMs) konnten die generierten SQL-Abfragen schrittweise verbessert werden. Ergänzend kam Retrieval-Augmented Generation (RAG) zum Einsatz, um den Modellen kontextrelevante Informationen aus internen Geschäftsdaten bereitzustellen. Die Wirksamkeit der Ansätze wurde laufend anhand der syntaktischen Korrektheit und der semantischen Relevanz der Resultate überprüft.
Ergebnisse
Die Resultate der Projektarbeit sind vielversprechend: in rund 85 % der Fälle lieferten die generierten SQL-Abfragen korrekte und inhaltlich relevante Resultate. Durch gezieltes Prompt Engineering konnte zudem in allen Fällen syntaktisch korrektes SQL erzeugt werden. Darüber hinaus wurde die Machbarkeit eines KI-Systems in einer sicheren Umgebung erfolgreich nachgewiesen. Das entwickelte System verarbeitet sensible Daten ausschliesslich lokal und gibt keine Informationen an externe Anbieter wie OpenAI oder Google weiter – ein entscheidender Vorteil für Organisationen mit hohen Anforderungen an Datenschutz und Compliance.
Ausblick
Als nächster Schritt ist ein interner Pilotversuch bei Edorex vorgesehen, um wertvolles Feedback von Nutzerinnen und Nutzern zu erhalten. Auf dieser Basis wird das System gezielt weiter verfeinert. Ein besonderer Fokus liegt auf kontinuierlichem Lernen: Durch die Sammlung und automatisierte Integration zusätzlicher Abfragen kann das Modell seine Genauigkeit und Praxistauglichkeit in realen Szenarien stetig verbessern. Damit entsteht die Grundlage für einen nachhaltigen Kompetenzaufbau im Bereich KI und LLM/RAG.