DeepL, ett översättningsföretag som är mest känt för sina textverktyg, släppte idag en tal-till-tal-översättningssvit som täcker användningsfall som möten, mobil- och webbkonversationer och gruppkonversationer i frontlinjen genom anpassade appar. Företaget släpper även ett API som gör att externa utvecklare och företag kan bygga vidare på DeepL:s teknologi för skräddarsydda användningsfall såsom callcenter.
”Rösten var ett naturligt steg för oss efter att ha tillbringat åratal med textöversättning,” sa DeepL:s vd Jarek Kutylowski till TechCrunch i en intervju. ”Vi har kommit långt när det kommer till text- och dokumentöversättning, men vi trodde att vi inte hade en bra produkt för realtidsöversättning av tal.”
Kutylowski sa att utmaningarna med att skapa översättningsprodukter i realtid är fokuserade på att hitta en balans mellan att minska latensen (fördröjningen mellan någon som talar och det översatta ljudet som spelas upp) och att bibehålla korrekta resultat.
DeepL släpper tillägg för plattformar som Zoom och Microsoft Teams. Lyssnare kan höra översättningar i realtid när andra lyssnare talar på sitt modersmål, eller så kan de följa översatt text i realtid på skärmen. Programmet är för närvarande i tidig tillgång, och företaget bjuder in organisationer att gå med på sin väntelista. Företaget erbjuder även produkter för mobila och webbaserade konversationer som sker personligen eller på distans.
DeepL tillåter användare att delta i gruppsamtal i inställningar som träningspass och workshops, där deltagarna kan delta genom QR-koder.
DeepL sa att dess talsyntesteknik också kan lära sig och anpassa branschspecifika termer och anpassade ordförråd som företags- och personnamn.
Kutylowski sa att AI ombildar hur kundservice kommer att se ut under de kommande åren. Han noterade att ett översättningslager kan hjälpa företag att ge stöd på språk där kvalificerad personal är få och dyr att anställa.
tech crunch event
San Francisco, Kalifornien
|
13-15 oktober 2026
Företaget sa att det kontrollerar hela stacken mellan röster. Men nuvarande system konverterar tal till text, tillämpar översättningar och konverterar sedan tillbaka till tal. DeepL har arbetat med textöversättning i många år, så vi tror att vi har en fördel i översättningskvalitet. I framtiden hoppas företaget kunna utveckla en heltäckande modell för talöversättning som helt hoppar över textsteget.
DeepL möter konkurrens från flera välfinansierade startups som verkar i angränsande hörn av utrymmet. Sanas, som samlade in 65 miljoner dollar från Quadrille Capital och Teleperformance förra året, använder AI för att korrigera en högtalares accent i realtid, ett verktyg som främst riktar sig till callcenteragenter.
Dubai-baserade Camb.AI fokuserar på talsyntes och översättning för media- och underhållningsföretag Amazon Web Services, och hjälper dem dubba och lokalisera videoinnehåll i stor skala.
Palabra, med stöd av Reddits medgrundare Alexis Ohanians företag Seven Seven Six, bygger en talöversättningsmotor i realtid utformad för att bevara både innebörden och högtalarens originalljud, och sätta den i mer direkt konkurrens med vad DeepL för närvarande bygger.
