Vissa Netflix-tittare har nu ett nytt sätt att upptäcka filmer och TV-program. Streamern började nyligen testa en AI-driven inbyggd röstsökningsfunktion med vissa prenumeranter, vilket fick tittarna att trycka på Netflix-knappen på sina fjärrkontroller för att se rekommendationer.
När tittarna trycker på knappen ser de flera sökförslag, inklusive fraser som ”Jag behöver en bra gråt”, ”Titta i bakgrunden” och ”Hjälp mig att hålla mig vaken”. Vart och ett av dessa förslag leder till en serie visningsrekommendationer, men det finns också en ”Fråga”-knapp med en vågformsikon. Detta val startar AI-driven röstsökning, som ger visningsrekommendationer som svar på naturliga språkuppmaningar.
Jag har använt den här nya röstsökningsfunktionen de senaste dagarna, och jag tycker att den är anmärkningsvärd av två anledningar. Även om den fortfarande är i beta, imponerar den med sin förmåga att ge relevanta och intressanta visningsrekommendationer, även för de svåraste förfrågningarna. Den går också direkt förbi röstassistenter och sökfunktioner inbyggda i smarta TV-apparater och streamingenheter, vilket framhäver maktkampen mellan TV OS-plattformar och streamingtjänsterna som körs ovanpå dem.
Netflix testar för närvarande en ny röstsökningsfunktion med några medlemmar i USA. Jag kunde komma åt den här funktionen med Chromecast med Google TV-strömningsdongel och TCL Google TV, men inte med Roku- eller Fire TV-enheter. Även användare med flera enheter som kör samma smart TV OS rapporterade att de bara kunde komma åt det på en delmängd av dessa enheter.
Efter att ha lekt med funktionen i några dagar blev jag imponerad av dess förmåga att hitta relevanta val för en mängd olika önskemål, från de ganska uppenbara (”80s date night-filmer” som serveras på The Breakfast Club) till det mycket specifika (”Jag gillar Brian Enos musik, vad ska jag titta på?” förslag ledde till Abstract: The Art of Design).
Jag testade den här funktionen under mer belastning än vad folk skulle använda dagligen och kunde ge solida rekommendationer som svar på ovanliga förfrågningar. För att vara ärlig trodde jag inte att jag skulle få några resultat genom att be om ett ”roligt barn-tv-program om döden”. Istället fick vi A Series of Unfortunate Events och Raising Dion, som båda träffade målet.
Frågan: ”Jag har druckit för mycket kaffe idag. Vad ska jag titta på?” fick Netflix att föreslå den ”lata” komedispecialen Sheng Wang och ”Headspace Guide to Sleep”. När jag helt enkelt sa: ”Att skada människor skadar människor”, svarade Netflix-appen: ”Att skada människor skadar människor, och här är några historier bakom det”, och rekommenderade sedan ”13 skäl till varför” och ”Det är okej att inte vara okej.”
Intressant nog verkar Netflixs röstsökning för närvarande inte utnyttja tjänstens personaliseringsmotor. När du ber om rekommendationer baserat på vad du nyligen har sett är appens svar: ”Vi kan inte svara på det ännu, men vi jobbar på det!” (Apropå det, alla svar visas som text; Netflixs röstsökning använder inte sin egen röstutgång, men jag hade inget emot det alls.)
Svaren innehåller ofta förslag för att ytterligare begränsa dina resultat, till exempel ”mer frihet” eller ”mer bitterljuv”. Att begränsa rekommendationerna på detta sätt fungerar dock inte alltid. När vi sökte efter kantonesisk komedi hittade vi många relaterade resultat. Men när jag följde Netflix förslag och tryckte på ”Wackier”-knappen för att begränsa mina resultat, försökte streamern plötsligt marknadsföra BoJack Horseman som en ”kantonesisk komedi med en udda twist.”
Bild: Netflix
Det finns några saker som kan göra dig upprörd med Netflix röstsökning. När jag begärde en blaxploitation-film hörde appens röstigenkänningssystem mig istället begära en ”svart exploateringsfilm” och vägrade ge resultaten. Tja, det är nog rätt val.
Min begäran om ett ”tv-program om porr” avslogs också, men när jag begärde ett ”sexigt tv-program” gav Netflix mer än gärna ett antal förslag. Detta skiljer sig markant från Googles Gemini-assistent på Google TV. Assistenten informerade mig om att hon inte kunde tillmötesgå begäran och lade passivt-aggressivt till: ”Om du vill kan vi hjälpa dig att hitta ett lämpligt program.” Bara detta förklarar varför tjänster som Netflix kräver sin egen röstsökning, snarare än att förlita sig på röstsökningen från tillverkare av TV- och streamingenheter.
En annan viktig anledning till att Netflix bygger sin egen röstsökning är att streamern vill att dess tittare ska stanna på sin egen app och bara rekommendera Netflix-innehåll. Samtidigt vill smart TV OS-plattformsoperatörer som Google, Roku och Amazon att konsumenterna ska använda sin egen universella sökning, som rekommenderar resultat från deras egna tjänster såväl som de från partners som de kan tjäna pengar på.
Denna maktkamp mellan plattformar och utgivare har pågått i åratal och har länge sträckt sig även till röstsökning. För konsumenterna var resultaten förvirrande. När du trycker på mikrofonknappen på fjärrkontrollen medan du använder Hulu eller Disney Plus, kommer du troligen åt den universella sökfunktionen inbyggd i din TV eller streamingenhet, som kommer att blanda resultat från appen du använder med resultat från andra förlag. Om du gör samma sak när du surfar på Netflix eller YouTube, kommer du bara att söka igenom varje apps katalog.
YouTube och Netflix har så mycket makt tack vare sin marknadsandel att de har kunnat kräva audioroutingprivilegier som inte är tillgängliga för mindre publicister. Till en början använde företagen bara den kraften för röst-till-text-funktionalitet, vilket i huvudsak gjorde det möjligt för röstfrågor att skrivas in i samma sökfält och nås med en fjärrkontroll för att söka efter program med namn.
Med tillkomsten av LLM har båda tjänsterna utökat dessa privilegier för att erbjuda fler fullfjädrade röstassistenter. YouTube tillkännagav nyligen sina egna konversations-AI-verktyg, som ger tittarna tillgång till Gemini-drivna röstfunktioner på enheter som Amazon och Roku.
I likhet med YouTubes implementering visar Netflixs AI-röstsökningsinsatser att konsumenter kan dra nytta av att appar har tillgång till sina mikrofoner. Publishers behöver inte en enorm marknadsandel eller en märkesknapp på sin fjärrkontroll för att bygga sådana upplevelser.

Janko Letgers
Författare till Lowpass, bidragsgivare till Verge
Inlägg från den här författaren kommer att läggas till i ditt dagliga e-postsammandrag och din startsida.
att följaatt följa
Se allt om Janko Roettgers
