Det finns en gammal idé inom management att ”det som mäts är viktigt.” Och du får oftast fler resultat för vad du än mäter.
Programvaruingenjörer har diskuterat produktivitetsmått i decennier, med början med kodraden. Men eftersom en ny generation av AI-kodningsagenter levererar mer kod än någonsin tidigare, blir det mindre tydligt vad chefer ska mäta.
Enorma tokenbudgetar (i princip mängden AI-processorkraftutvecklare tillåts att konsumera) har blivit ett hedersmärke bland Silicon Valley-utvecklare, men detta är ett väldigt konstigt sätt att tänka på produktivitet. Det kanske inte är meningsfullt att mäta input till en process om du bryr dig om resultatet. Det kan vara vettigt om du försöker uppmuntra mer AI-antagande (eller tokenförsäljning), men det är inte vettigt om du försöker bli mer effektiv.
Tänk på bevisen från en ny klass av företag som verkar inom området ”Developer Productivity Insights”. De fann att utvecklare som använde verktyg som Claude Code, Cursor och Codex producerade kod som var mycket mer acceptabel än tidigare. Men vi upptäckte också att ingenjörer var tvungna att gå tillbaka oftare för att fixa accepterad kod, vilket undergrävde påståenden om ökad produktivitet.
Alex Circei, VD och grundare av Waydev, bygger ett lager av intelligens för att spåra denna dynamik. Hans företag arbetar med 50 olika kunder som sysselsätter mer än 10 000 mjukvaruingenjörer. (Circei har skrivit för TechCrunch tidigare, men den här reportern hade aldrig träffat honom tidigare.)
Han säger att ingenjörschefer vet att kodacceptansgraden är 80 % till 90 %, eller procentandelen av AI-genererad kod som utvecklare godkänner och behåller, men de missar churn som uppstår när ingenjörer behöver fixa den koden inom några veckor, och den faktiska kodacceptansgraden sjunker till mellan 10 % och 30 % av den genererade koden.
Waydev grundades 2017 för att tillhandahålla utvecklaranalyser på grund av uppkomsten av AI-kodningsverktyg, och Waydev har helt omarbetat sin plattform under de senaste sex månaderna för att ta itu med den snabba spridningen av kodningsverktyg. Nu släpper företaget nya verktyg för att spåra metadata som genereras av AI-agenter och tillhandahålla analyser om kodkvalitet och kostnad, vilket ger ingenjörschefer mer insikt i både AI-användning och effektivitet.
tech crunch event
San Francisco, Kalifornien
|
13-15 oktober 2026
Även om analysföretag har ett incitament att lyfta fram problem de upptäcker, finns det växande bevis för att stora organisationer fortfarande letar efter sätt att använda AI-verktyg effektivt. Stora företag lägger märke till det också – Atlassian förra året förvärvade en annan teknisk intelligensstartup, DX, för 1 miljard dollar för att hjälpa kunder att förstå avkastningen på investeringen i kodningsagenter.
Data från hela branschen berättar en konsekvent historia. Mer kod skrivs, men en oproportionerligt stor del av den fastnar inte.
GitClear, ett annat företag i det här utrymmet, publicerade en rapport i januari som fann att AI-verktyg ökade produktiviteten, men dess data visade också att ”vanliga AI-användare hade ett genomsnitt på 9,4 gånger högre kodchurn jämfört med icke-AI-användare”, och produktivitetsvinsterna som verktygen gav var mer än dubbelt så mycket.
Faros AI, en teknisk analysplattform, utnyttjade två års kunddata för sin rapport från mars 2026. Som ett resultat ökade kodavgången (rader med kod borttagen jämfört med tillagd) med 861 % med högre AI-användningsfrekvens.
Jellyfish, som hyllar en intelligensplattform för AI-integrerad teknik, samlade in data om 7 548 ingenjörer under det första kvartalet 2026. Företaget fann att ingenjörer med de största tokenbudgetarna genererade flest pull-förfrågningar (föreslagna ändringar av en delad kodbas), men produktivitetsvinsterna skalade inte. Vi uppnådde 2x genomströmningen till 10x kostnaden för tokens. Med andra ord, verktyg skapar kvantitet, inte värde.
När du pratar med utvecklare är statistik som denna sann. Medan utvecklare njuter av friheten med nya verktyg, upptäcker de att kodgranskning och tekniska skulder hopar sig. Ett vanligt fynd är skillnaden mellan seniora och juniora ingenjörer, där de senare accepterar mycket mer AI-genererad kod och som ett resultat hanterar en större mängd omskrivningar.
Ändå jobbar utvecklare på att förstå exakt vad agenterna försöker göra, men förvänta dig inte att backa någon gång snart.
”Det här är en ny era inom mjukvaruutveckling, och vi måste anpassa oss, och vi är tvungna att anpassa oss som företag,” sa Circei till TechCrunch. ”Cirkeln går inte över.”
