
Ein Telefonat mit GPT: von Spracherkennung bis -ausgabe (clt25)
Chaos Computer Club - recent events feed · Phillip Blaschka, Lisette Kratkey, Tom Borowsky
March 22, 202537m 57s
Audio is streamed directly from the publisher (cdn.media.ccc.de) as published in their RSS feed. Play Podcasts does not host this file. Rights-holders can request removal through the copyright & takedown page.
Show Notes
Museen stehen vor der Herausforderung, ihre Inhalte möglichst attraktiv erlebbar gestalten zu wollen. Insbesondere kann historischem Wissen durch aktuelle Tools aus dem Bereich KI zu neuem Leben verholfen werden. Wie ein solches Vorhaben umgesetzt werden kann, zeigt unser Projekt.
Das Robert-Schumann-Haus in Zwickau trat an die Westsächsische Hochschule Zwickau heran, mit dem Ziel, Besucher*innen die Möglichkeit zu geben, sich über einen historischen Telefonapparat mit Clara Schumann „unterhalten“ zu können. Über einen Zeitraum von 1,5 Jahren haben mehrere Studierendengruppen im Rahmen von Lehrveranstaltungen unter Leitung von Prof. Dr.-Ing. Hellbach eine technische Lösung entwickelt.
Ab Frühjahr 2025 wird dieses interaktive Erlebnis für die Besucher*innen des Robert-Schumann-Hauses zugänglich sein.
Im Vortrag werden die Herausforderungen und die Entwicklung eines Chatbots aus Komponenten wie Spracherkennung (Whisper), großem Sprachmodell (GPT via LangChain mit Anbindung an eine ChromaDB) und Sprachsynthese (ElevenLabs) durch ein Team von Studierenden beleuchtet. Der Prototyp läuft dabei großteils auf einem Desktop-PC, während ein Raspberry Pi im Telefonapparat die Audioein- und ausgabe steuert.
Licensed to the public under http://creativecommons.org/licenses/by/4.0
about this event: https://chemnitzer.linux-tage.de/2025/de/programm/beitrag/198
Topics
132025clt25VortragV7clt25-deuDay 1