Working Student - GenAI / LLM Evaluation - Agentic AI / NLP (f/m/d)
Position Description
As a Working Student in the GenAI / LLM team at Cinemo, you will support the evaluation and validation of agentic AI systems and GenAI algorithms for NLP that power next-generation in-car experiences. You will help build datasets, extend evaluation tooling, and contribute to end-to-end testing workflows to ensure our non-deterministic AI components are measurable, reliable, and ready for real-world automotive environments across cloud-based services and in-vehicle platforms such as Android Automotive OS (AAOS) and Linux.
In this role, you will:
- Support evaluation of agentic AI systems and LLM-based NLP features, including qualitative and quantitative analysis.
- Create, curate, and maintain datasets for benchmarking, regression testing, and scenario coverage.
- Extend and improve internal evaluation frameworks (metrics, dashboards, automated test runs).
- Contribute to end-to-end testing of GenAI features within the in-car experience, including integration and validation workflows.
- Document findings, track model/system changes, and communicate results clearly to the team.
- Collaborate with engineers and researchers to translate evaluation insights into actionable improvements.
What you will need to succeed:
- Ongoing Bachelor’s or Master’s studies in Computer Science, AI/ML, Data Science, Computational Linguistics, or a related field.
- Hands-on programming skills in Python and a solid understanding of basic ML/NLP concepts.
- Interest in GenAI / LLMs, agentic systems, and evaluation of non-deterministic AI behavior.
- Experience with data handling and dataset creation (labeling, preprocessing, quality checks).
- Familiarity with software testing concepts (e.g., unit/e2e testing, CI) is a plus.
- Good written and spoken English communication skills.
- The successful candidate will be based in Karlsruhe, Germany.
Empfohlene Jobs
Senior Developer / Teamleiter - CIAM (m/w/d)
Du hast Spaß an technischer Kundenberatung und setzt komplexe CIAM-Lösungen souverän um? Du möchtest nicht nur selbst entwickeln, sondern auch Verantwortung für ein Team übernehmen und technische Sta…
Mitarbeiter Empfang & Telefonzentrale (m/w/d)
Die Industrie- und Handelskammer Karlsruhe vertritt die Interessen der gewerblichen Wirtschaft in der TechnologieRegion Karlsruhe und unterstützt ihre Mitgliedsunternehmen durch ein umfassendes Diens…
Senior UX-/UI-Designer (m/w/d)
die vielseitig und herausfordernd ist? bei der Sie Ihre fachlichen Stärken gezielt einbringen und dabei an komplexen IT-Projekten mitarbeiten können? die Ihnen die Möglichkeit bietet, Teil eines …
Masterthesis: Numerical Investigations in Solid Propellant Combustion
As one of the oldest and largest Fraunhofer institutes, the Fraunhofer Institute for Chemical Technology ICT has special expertise: by linking the diverse research fields of polymer engineering, chem…
Lagerhilfskraft Obst und Gemüse in Karlsruhe (m/w/d)
Starte jetzt erfolgreich bei uns als Lagerhilfskraft Obst und Gemüse (m/w/d) im Rahmen der Arbeitnehmerüberlassung durch! Freue Dich auf eine attraktive Vergütung: 14,96 € pro Stunde ! Dein ne…
Mitarbeiter Reinigung in Karlsruhe (m/w/d)
Starte jetzt erfolgreich bei uns als Mitarbeiter Reinigung (m/w/d) im Rahmen der Arbeitnehmerüberlassung durch! Freue Dich auf eine attraktive Vergütung: 15,00 € pro Stunde ! Dein neuer Job is…
Stationsleitung (m /w /d)
Das Städtische Klinikum Karlsruhe ist das größte Krankenhaus in der Region Mittlerer Oberrhein. Es ist im Krankenhausbedarfsplan des Landes Baden-Württemberg als Haus der Maximalversorgung für die Reg…
Strategy Consultant - Identity Security (m/w/d)
Du hast Lust, die IT-Strategie von großen Firmen entscheidend mitzugestalten? Du suchst dafür ein angenehmes Arbeitsumfeld und eine von freundschaftlichem Umgang geprägte Zusammenarbeit? Dann bewirb …