ArXiv, ett allmänt använt öppet arkiv för förtrycksforskning, går längre för att slå ner på den vårdslösa användningen av stora språkmodeller i vetenskapliga artiklar.
Även om artiklar läggs ut på webbplatsen innan de granskas av fackmän, har arXiv (uttalas ”arkiv”) blivit ett av de främsta sätten att distribuera forskning inom områden som datavetenskap och matematik, och själva webbplatsen är en källa till data om trender inom vetenskaplig forskning.
ArXiv har redan vidtagit åtgärder för att bekämpa ökningen av AI-genererade papper av låg kvalitet, som att kräva att förstagångsbidrag ska få godkännande från framstående författare. Och organisationen, som Cornell University har varit värd för i mer än 20 år, håller på att bli en oberoende ideell organisation som borde kunna samla in mer pengar för att ta itu med frågor som AI-slop.
I den senaste utvecklingen skrev arXivs chef för datavetenskap, Thomas Dieterich, på torsdagen: ”Om en inlämning innehåller obestridliga bevis för att författarna inte har kontrollerat resultaten av LLM-genereringen, betyder detta att ingenting i tidningen kan litas på.”
Odiskutabelt bevis kan inkludera saker som ”psykedeliska referenser” eller kommentarer till eller från LLM, sa Dieterich. Om sådana bevis hittas står tidningens författare inför ett års avstängning från arXiv, med kravet att alla efterföljande arXiv-bidrag först måste accepteras av en välrenommerad peer review-organisation.
Observera att detta inte är ett direkt förbud mot användningen av LLM, utan snarare ett påstående att, som Dieterich uttrycker det, författare är ”fullständigt ansvariga” för sitt innehåll, ”oavsett hur innehållet genererades.” Därför är forskare ansvariga även om de kopierar och klistrar in ”olämpligt språk, plagierat innehåll, partiskt innehåll, fel, misstag, falska referenser eller vilseledande innehåll” direkt från LLM.
Dieterich sa till 404 Media att detta skulle vara en ”one strike”-regel, men moderatorer måste flagga frågan och sektionsordföranden måste granska bevisen innan de utdömer ett straff. Författare kan också överklaga detta beslut.
En nyligen granskad studie fann att tillverkade citat inom biomedicinsk forskning ökar, troligen på grund av LLM. För att vara rättvis är dock forskare inte de enda som blir fastnade för att de använder AI-genererade citat.
Om du köper via länkar i våra artiklar kan vi tjäna en liten provision. Detta påverkar inte vårt redaktionella oberoende.
