Close Menu
  • Home
  • Ekonomi
  • Kultur
  • Sport
  • Sverige
  • Väder
  • Lokalt
    • blekinge
    • Dalarna
    • Gavleborg
    • Gotland
    • Halland
    • Jamtland
    • Jonkoping
    • Kalmar
    • kronoberg
    • Norrbotten
    • Orebro
    • Ostergotland
    • Skane
    • Sodermanland
    • Stockholm
    • Uppsala
    • Världen
    • Varmland
    • Vasterbotten
    • Vasternorrland
    • Vastmanland
    • Vastra-Gotaland

Prenumerera på uppdateringar

Prenumerera på vårt nyhetsbrev och missa aldrig våra senaste nyheter

Det hetaste

Källa: Project SGLang sprang ut när RadixArk värderas till 400 miljoner dollar när slutsatsmarknaden exploderar

januari 22, 2026

Insändare. Utrymmeskrav för passagerare i taxibilar

januari 22, 2026

Tidigare underrättelseofficer tar ställning i Österrikes största spionrättegång på decennier

januari 22, 2026
Facebook X (Twitter) Instagram
Trending
  • Källa: Project SGLang sprang ut när RadixArk värderas till 400 miljoner dollar när slutsatsmarknaden exploderar
  • Insändare. Utrymmeskrav för passagerare i taxibilar
  • Tidigare underrättelseofficer tar ställning i Österrikes största spionrättegång på decennier
  • ”Jag är förresten 86 år gammal!” Prue Leith slutar The Great British Bake Off
  • Forsbergs stöd till Linus Ullmark: ’Terrible’ NHL
  • Jacob Wallenberg säger om Trump: ”Det är viktigt för EU att stå upp”
  • 26 nya filmer drar svenskar till bio
  • Carolina Klufts penis till Thomas Brolin: ”Sanning och fakta”
Facebook X (Twitter) Instagram
Folketstidning – Nyheter från Sverige och världen
  • Home
  • Ekonomi
  • Kultur
  • Sport
  • Sverige
  • Väder
  • Lokalt
    • blekinge
    • Dalarna
    • Gavleborg
    • Gotland
    • Halland
    • Jamtland
    • Jonkoping
    • Kalmar
    • kronoberg
    • Norrbotten
    • Orebro
    • Ostergotland
    • Skane
    • Sodermanland
    • Stockholm
    • Uppsala
    • Världen
    • Varmland
    • Vasterbotten
    • Vasternorrland
    • Vastmanland
    • Vastra-Gotaland
Folketstidning – Nyheter från Sverige och världen
Home » Mänskligheten säger att vissa Claude -modeller kan avsluta “skadliga eller kränkande” konversationer
Tech

Mänskligheten säger att vissa Claude -modeller kan avsluta ”skadliga eller kränkande” konversationer

adminBy adminaugusti 17, 2025Inga kommentarer2 Mins Read0 Views
Share Facebook Twitter Pinterest LinkedIn Tumblr Email WhatsApp Copy Link
Follow Us
Google News Flipboard Threads
Share
Facebook Twitter LinkedIn Pinterest Email Copy Link


Anthropic har meddelat några av de största modellerna för att avsluta konversationer som företaget beskriver som ”ett sällsynt och extremt fall av permanent skadliga eller missbrukande användningsinteraktioner.” Överraskande säger människor att de träffar detta för att skydda AI -modellen snarare än att skydda mänskliga användare.

För att vara tydlig hävdar inte företaget att Claude AI -modellen kan försenas eller skadas av samtal med användare. Med sina egna ord förblir mänskligheten ”mycket osäker på de potentiella moraliska tillstånden för Claude och andra LLM, eller om de nuvarande eller framtida potentiella moraliska tillstånden.”

I Howver visar tillkännagivandet ett nyligen program som skapats för att studera vad som kallas ”Model Welfare”, och säger att mänskligheten i huvudsak tar en rättvis tillvägagångssätt.

Denna senaste förändring är för närvarande begränsad till Claude Opus 4 och 4.1. Återigen bör ett ”extremt kantfall” ske i ”extrema kantfall”, till exempel ”att försöka begära information som möjliggör förfrågningar från användare av mindre sexuellt innehåll eller våld eller rädsla.”

While these types of requests could potentially create legal or advertising issues for humanity itself (a recent report on how ChatGPT potentially enhance or contribute to users’ delusional thinking), the SANAY SANAY SANAY SANAY SANAY SANAY SANAY SANAY SANAY SANAY SANAY SANAY SANAY SANAY SANAY SANAY SANAY SANAY SANAY SANAY SANAY SANAY SANAY SANAY SANAY ANAY SANAY SANAY SANAY ANAY SANAY SANAY ANAY SANAY SANAY ANAY Sanay anay sanay sanay anay sanay anay sanay sanay anay sanay sanay anay sanay sanay anay sanay sanay anay sanay sanay anay sanay sanay sanay anay sanay sanay sanay sanay anay sanay sanay sanay sanay sanay sanay sanay

När det gäller dessa nya slutkonversationsfunktioner sa företaget: ”I alla fall bör Claude bara använda slutet på konversationens ABTA-resort om flera försök till omdirigering misslyckas och hopp om produktiv iteration är uttömda.”

Mänskligheten säger också att Claude ”instrueras att inte använda denna förmåga när användare har en omedelbar risk att skada sig själva och andra.”

TechCrunch -evenemang

San Francisco
|
27-29 oktober 2025

När Claude är klar med en konversation säger Humanity att användare kan starta en ny konversation från samma konto och redigera svar för att skapa en ny gren av besvärliga konversationer.

”Vi behandlar den här funktionen som ett kontinuerligt experiment och kommer att fortsätta att förbättra vår strategi”, säger företaget.



Source link

Share. Facebook Twitter Pinterest LinkedIn Tumblr Email WhatsApp Copy Link
admin
  • Website

Related Posts

Tech

Källa: Project SGLang sprang ut när RadixArk värderas till 400 miljoner dollar när slutsatsmarknaden exploderar

januari 22, 2026
Tech

Domare beordrar att FBI:s utredning av utrustning som beslagtagits från Washington Posts reporter ska stoppas

januari 22, 2026
Tech

Blue Origins Starlink-konkurrent TeraWave lovar 6 Tb uppladdningar

januari 22, 2026
Tech

För att inte bli överträffad av OpenAI, utvecklar Apple enligt uppgift också en AI-bärbar.

januari 22, 2026
Tech

Trump FCC hotar att upprätthålla regler om lika tid på talkshows sena kvällar

januari 21, 2026
Tech

Anthropics nya Claude ”Constitution”: Var hjälpsam, ärlig och förstör inte mänskligheten.

januari 21, 2026
Add A Comment
Leave A Reply Cancel Reply

Toppinlägg

Günther Moderdar kräver whatsapp ägare meta för att ta ansvar

augusti 17, 202541 Views

Di Gaselle 2025 börjar med nya regler och kategorier

oktober 15, 202510 Views

Pemberton köper Bukowskis ägare Bonhams

oktober 21, 20259 Views

Sverige behöver en utrikesminister som får jobbet gjort.

oktober 20, 20259 Views
Missa inte

”Vi vet inte var vändpunkten är, men det börjar närma sig.”

By adminjanuari 21, 20260

Vi går in i en fas av klimatförändringar där osäkra men katastrofala risker inte längre…

Hat mot muslimer är demokratins undergång

januari 21, 2026

Adolf Hitler var den förste att attackera Danmark.

januari 21, 2026

”Att lämna riksdagen kan vara det bästa som händer för L.”

januari 20, 2026

Prenumerera på uppdateringar

Prenumerera på vårt nyhetsbrev och missa aldrig våra senaste nyheter

Om oss
Om oss

Välkommen till Folketstidning.se, din pålitliga källa för nyheter och uppdateringar från Sverige och hela världen.

Vårt uppdrag är enkelt: att leverera korrekt, aktuell och engagerande journalistik som betyder något för våra läsare. Vi bevakar ett brett spektrum av ämnen

Facebook X (Twitter) Pinterest YouTube WhatsApp
Våra val

Forsbergs stöd till Linus Ullmark: ’Terrible’ NHL

januari 22, 2026

Carolina Klufts penis till Thomas Brolin: ”Sanning och fakta”

januari 22, 2026

Längdskidåkning: Jonah Sandling slår Mjarby i omröstningen: ”Vi älskar längdskidåkning”

januari 22, 2026
Mest populära

Putin sägs kräva hela Donetze -regionen

augusti 16, 20250 Views

Ryssland kan sedan hota fler länder

augusti 16, 20250 Views

Hans rekryteringsplattform för ungdomar i staden har berömts av kungen.

augusti 17, 20250 Views
© 2026 folketstidning. Designed by folketstidning.
  • Home
  • Hälsa
  • Kommunal
  • Miljö
  • Opinion
  • Tech

Type above and press Enter to search. Press Esc to cancel.

...
►
Necessary cookies enable essential site features like secure log-ins and consent preference adjustments. They do not store personal data.
None
►
Functional cookies support features like content sharing on social media, collecting feedback, and enabling third-party tools.
None
►
Analytical cookies track visitor interactions, providing insights on metrics like visitor count, bounce rate, and traffic sources.
None
►
Advertisement cookies deliver personalized ads based on your previous visits and analyze the effectiveness of ad campaigns.
None
►
Unclassified cookies are cookies that we are in the process of classifying, together with the providers of individual cookies.
None