TERUG
Building Assist: van nul naar voice agent
Wat er echt nodig is om een AI-product te lanceren
Assist begon met een simpele observatie: de meeste bedrijven nemen de telefoon nog steeds handmatig op, en de meeste van die gesprekken zijn repetitief. Bevestigingen van afspraken, openingstijden, routevragen. Werk dat geen mens nodig heeft, maar wel menselijke tijd opslokt.
Dus bouwden we een AI-telefonist. Een spraakagent die opneemt, de intentie van de beller begrijpt en het afhandelt — of het doorschakelt naar de juiste persoon wanneer dat echt nodig is.
Van idee naar productie gaan verliep allesbehalve rechtlijnig. De eerste uitdaging was latency. Spraak is op een manier meedogenloos die chat niet is. Als een antwoord drie seconden duurt, denkt de beller dat de lijn dood is. We moesten obsessief zijn over pipelinesnelheid: transcriptie, inferentie, tekst-naar-spraak, alles.
De tweede uitdaging was omgaan met het onverwachte. Echte bellers volgen geen scripts. Ze ratelen, veranderen halverwege een zin van onderwerp, hebben accenten, hebben slechte microfoons. De agent moest op al die dingen bestand zijn en toch natuurlijk blijven klinken.
Wat ik heb geleerd bij het bouwen van Assist: een AI-product lanceren is vooral een engineeringprobleem, niet een AI-probleem. De modellen zijn goed. Het zware werk zit in de infrastructuur eromheen — foutafhandeling, fallbacks, logging, de integraties met elk systeem dat de klant al gebruikt.
Als je eraan denkt om iets in deze ruimte te bouwen, begin dan smaller dan je denkt dat je zou moeten. Kies één sector, één type gesprek, en maak dat perfect voordat je generaliseert.
Meer