Trots hypen att dessa agenter är kollegor, enligt vår erfarenhet tenderar de att fungera bäst när du tänker på dem som verktyg för att förbättra dina befintliga färdigheter, snarare än som självständiga kollegor som marknadsföringsterminologin antyder. Du kan skapa imponerande utkast snabbt, men de kräver fortfarande ständig mänsklig korrigering.
Frontiers lansering kommer bara tre dagar efter att OpenAI släppte en ny macOS-skrivbordsapp för Codex, företagets AI-kodningsverktyg. OpenAI-chefer har beskrivit det som ett ”kommandocenter för agenter.” Codex-appar tillåter utvecklare att köra flera agenttrådar parallellt, där varje agenttråd arbetar på en isolerad kopia av kodbasen via ett Git-arbetsträd.
OpenAI släppte också GPT-5.3-Codex på torsdagen, en ny AI-modell som driver Codex-appen. OpenAI hävdar att Codex-teamet använde en tidig version av GPT-5.3-Codex för att felsöka träningskörningar på själva modellen, hantera driftsättning och diagnostisera testresultat, liknande vad OpenAI sa till Ars Technica i en decemberintervju.
”Vårt team blev blåst av hur mycket Codex kunde påskynda vår utveckling”, skrev företaget. På agentkodningsriktmärket Terminal-Bench 2.0 får GPT-5.3-Codex 77,3 %, vilket slår Anthropics nyss släppta Opus 4.6 med cirka 12 procentenheter.
Gemensamt för alla dessa produkter är användarens föränderliga roll. Istället för att bara skriva en uppmaning och vänta på ett enda svar, blir utvecklare och kunskapsarbetare mer som handledare, skickar uppgifter, övervakar framsteg och ingriper när agenter behöver instruktioner.
I denna vision blir utvecklare och kunskapsarbetare effektivt mellancheferna för AI. Det vill säga, istället för att skriva och analysera kod själv, delegerar du uppgifter, granskar resultatet och hoppas att de agenter som arbetar under dig inte sitter tillbaka och bryter saker. Om det kommer att hända (eller om det faktiskt är en bra idé) diskuteras fortfarande mycket.
