Hainzelman nutzt Retrieval-Augmented Generation (RAG) in Kombination mit einer intelligenten Wissensveredelung. Diese Veredelung ist ein mehrstufiger Prozess, der unter anderem umfasst:
1. Vorverarbeitung: Entfernung irrelevanter Inhalte (wie HTML-Code) aus Dokumenten.
2. OCR: Nutzung von Optical Character Recognition für schwierige Formate wie gescannte PDFs, um Text zu extrahieren.
3. Nachverarbeitung: Automatisierte Agenten-Workflows verdichten, aggregieren und strukturieren Rohdaten, um höherwertige Assets zu schaffen.