Testautomatisierung

Einführung in die Testautomatisierung mit AI Agentic

Veröffentlicht am 12. Mai 2026 · Ventus IT Services GmbH

IT-Leiter in der Automobilindustrie stehen vor einem strukturellen Widerspruch: Die Komplexität eingebetteter Systeme wächst — AUTOSAR-konforme Steuergeräte, OTA-Update-Pipelines, IVSR-Cloudifizierung — während Releasezyklen kürzer werden. Klassische Testautomatisierung mit Selenium oder fest verdrahteten Skripten kommt hier an ihre Grenzen. Der Ausweg, den wir in mehreren Automotive-Projekten erprobt haben, ist der Einsatz von KI-Agenten, die Testfälle dynamisch generieren, priorisieren und auswerten.

Warum klassische Testautomatisierung im Automotive-Kontext scheitert

Traditionelle Frameworks wie Selenium oder Robot Framework sind auf stabile UI-Strukturen und vordefinierte Testpfade ausgelegt. In einem modernen Automotive-Projekt — etwa der Integration eines Auftragsmanagement-Systems für CKD-Märkte — ändern sich Schnittstellenspezifikationen häufig während der Entwicklung. Jede Änderung an einem SAP-Endpunkt oder einer REST-API zieht manuelle Skriptanpassungen nach sich. In einem Projekt mit 12 aktiven Märkten und parallelen Rollouts ist das schlicht nicht skalierbar.

Unsere Erfahrung aus UAT-Koordinationen über mehrere europäische und nordafrikanische Märkte zeigt: 40–60 % des Testaufwands entfallen auf Skriptpflege — nicht auf eigentliche Testdurchführung. Genau hier setzen KI-Agenten an.

KI-Agenten in der Testautomatisierung: Architektur und Tools

Ein KI-basierter Testagent kombiniert ein Large Language Model (LLM) mit einem strukturierten Werkzeugrahmen. In der Praxis nutzen wir LangChain als Orchestrierungsschicht, Playwright für Browser- und API-Interaktionen sowie pytest als Testrunner. Das LLM — in sicherheitskritischen Umgebungen lokal deployed, etwa über Ollama mit llama-3-Modellen auf isolierten Servern — übernimmt drei Kernaufgaben:

  • Testfallgenerierung: Aus einer OpenAPI-Spezifikation oder einem User-Story-Dokument generiert der Agent automatisch Testfälle inklusive Randbedingungen und negativer Szenarien.
  • Selbstheilung von Locators: Ändert sich ein CSS-Selektor oder ein API-Endpunkt, identifiziert der Agent das neue Element anhand von Kontext und aktualisiert den Test ohne manuellen Eingriff.
  • Testergebnisanalyse: Fehlgeschlagene Tests werden kategorisiert — echter Defekt, Datenproblem oder Umgebungsfehler — was die Triage-Zeit um durchschnittlich 70 % reduziert.

Praxisbeispiel: UAT-Automatisierung bei einem Tier-1-Zulieferer

Ein Tier-1-Automobilzulieferer mit Werken in Deutschland, Spanien und Portugal musste ein neues Produktionssteuerungssystem in acht Wochen über drei Märkte ausrollen. Das UAT-Team umfasste 14 Tester, die mit unterschiedlichen Sprachversionen der Applikation arbeiteten. Der klassische Ansatz hätte bedeutet: drei separate Testsuiten, manuelle Synchronisation, hoher Koordinationsaufwand.

Mit einem LangChain-basierten Testagenten, der auf Playwright aufsetzt und über eine GitLab CI-Pipeline gesteuert wird, wurden aus einer zentralen Testspezifikation automatisch lokalisierte Testfälle für alle drei Märkte generiert. Das Ergebnis:

  • Regressionszeit: von 18 Stunden auf unter 4 Stunden pro Zyklus
  • Vollständig on-premise betrieben — keine Cloud-Anbindung, TISAX-konform
  • Eine zentrale Testspezifikation für alle drei Märkte statt drei separater Suiten

TISAX und DSGVO: KI-Testautomatisierung in regulierten Umgebungen

Ein häufiges Missverständnis: KI-gestützte Tools seien in TISAX-zertifizierten Umgebungen per se nicht erlaubt. Das stimmt nicht — entscheidend sind Datenresidenz und Modellinfrastruktur. Wer LLMs über externe APIs (OpenAI, Anthropic) einsetzt, hat ein Problem mit Artikel 28 DSGVO und TISAX ISA-Kontrolle 1.3.2. Wer hingegen Modelle lokal betreibt — Ollama, vLLM auf eigener Hardware oder einer dedizierten Instanz ohne Drittlandtransfer — bewegt sich im Rahmen.

Unsere Empfehlung für den Einstieg: llama-3.1-8b auf einem dedizierten Server für Testfallgenerierung und -analyse. Das Modell läuft auf Standard-Server-Hardware ab 16 GB RAM und liefert für strukturierte Testaufgaben hervorragende Ergebnisse — ohne ein einziges Byte die eigene Infrastruktur zu verlassen.

Fazit

KI-gestützte Testautomatisierung ist kein Zukunftsprojekt — sie ist in Automotive-IT-Projekten heute produktiv einsetzbar, sofern Architektur und Compliance von Anfang an mitgedacht werden. Der Schlüssel liegt nicht im LLM selbst, sondern in der sauberen Integration in bestehende CI/CD-Pipelines und der on-premise Absicherung für regulierte Umgebungen.

Bei Ventus IT Services haben wir diesen Ansatz in mehreren UAT-Koordinationsprojekten mit internationalen Rollouts etabliert — die Erfahrungen daraus fließen direkt in unsere Beratungsleistungen ein.

Bereit für den nächsten Schritt?

Buchen Sie ein kostenloses 30-Minuten-Gespräch mit unserem Team.

Gespräch vereinbaren