Hur NSFW-filtret faktiskt fungerar på plattformen

I februari 2023, efter att italienska Garante per la protezione dei dati personali ingripit mot Replika, blev det tydligt hur olika AI-plattformar hanterar explicit material. CrushOn AI marknadsförs sedan dess som en tjänst där filtret är mer tillåtande än hos konkurrenter som Character.AI eller Replika. NSFW står för Not Safe For Work och syftar på sexuellt eller på annat sätt explicit material. Tekniskt sett består filtret av två lager: en modellnivå där grundmodellen tränats att acceptera vuxet rollspel, och ett moderationslager som blockerar vissa specifika kategorier oavsett användarens inställningar.

Hur NSFW-filtret faktiskt fungerar på plattformen
Hur NSFW-filtret faktiskt fungerar på plattformen

Det moderationslagret är inte konfigurerbart från användarens sida. Det blockerar konsekvent innehåll som rör minderåriga, sexuellt våld utan tydligt samtyckesnarrativ, samt vissa former av extremt våld. Övriga kategorier, inklusive romantiska och sexuella scenarier mellan vuxna karaktärer, passerar generellt utan ingrepp. Detta skiljer sig från Replika, som efter regleringsbeslut i Italien i februari 2023 begränsade explicit innehåll globalt under en period.

Svensk reglering: vad lagen säger om AI-genererat innehåll

Sverige har ingen särlagstiftning som specifikt riktar sig mot AI-flickvänner. Däremot tillämpas befintliga regelverk på det material som genereras. Brottsbalken kapitel 16 paragraf 10a förbjuder skildring av barn i pornografisk bild, och bestämmelsen omfattar även tecknade eller datorgenererade gestaltningar. Det innebär att även om CrushOn AI:s filter skulle släppa igenom sådant innehåll, är användaren straffrättsligt ansvarig i Sverige.

För vuxet material gäller principen om yttrandefrihet enligt yttrandefrihetsgrundlagen, men med begränsningar. Olaga våldsskildring och hets mot folkgrupp är straffbart även i AI-genererad form. Dataskyddsförordningen, GDPR, som trädde i kraft 2018, gäller fullt ut för svenska användare eftersom CrushOn AI behandlar personuppgifter (konversationshistorik, betalningsuppgifter, beteendedata) från personer i EU. Plattformen måste alltså erbjuda rätt till radering och tydlig information om databehandling, oavsett att huvudkontoret ligger i Bellevue, Washington.

Åldersverifiering och svenska krav

Åldersgränsen på CrushOn AI är 18 år. Verifieringen sker dock i praktiken genom självdeklaration vid registrering, vilket är den svagaste formen av åldersverifiering. I Sverige har frågan diskuterats i flera utredningar, och tjänster med explicit innehåll förväntas använda starkare metoder, exempelvis ID-baserad verifiering eller BankID. CrushOn AI erbjuder ingen BankID-integration, vilket innebär att svenska användare ligger i en gråzon där plattformen formellt har en åldersgräns men inte verifierar den robust.

För dig som användare betyder det inte att tjänsten är olaglig att använda som vuxen. Däremot saknas det skyddsnät som svensk lagstiftning föredrar. Mer information om hur verifieringen kan stärkas finns i vår fördjupning om CrushOn AI och åldersverifiering. Den som driver ett företag eller arbetsdator bör också notera att användning av sådana tjänster på arbetsutrustning kan strida mot interna policys, helt oberoende av lagstiftning.

Vad filtret blockerar och vad det släpper igenom

Baserat på offentligt tillgängliga beskrivningar och användarrapporter blockerar moderationslagret tre huvudkategorier: minderåriga i sexuella sammanhang, icke-konsensuella scenarier som beskrivs i grafisk detalj, samt extremt grafiskt våld kopplat till verkliga personer. Det är värt att notera att filtret är probabilistiskt, inte deterministiskt. Det betyder att samma prompt kan ge olika utfall beroende på kontext, tidigare meddelanden och slumpvariation i modellen.

Innehåll som typiskt passerar inkluderar romantiska scenarier, sexuellt rollspel mellan vuxna karaktärer, fantasimiljöer och våldsamma actionsekvenser utan sexuell koppling. Det är denna profil som gör att CrushOn AI rankar högt i SERP-resultaten för termen nsfw ai chat. Samtidigt innebär den breda toleransen ett större ansvar för användaren att själv hålla sig inom svensk lag.

Prompt-strategi och konversationskvalitet

I april testade jag under fjorton dagar hur olika promptstrukturer påverkade tonen i chatten. Jag noterade mina inmatningar varje morgon vid sjutiden innan arbetsdagen började. Slutsatsen var att specifika kontextbeskrivningar på minst tre meningar gav betydligt mer konsekventa svar än korta one-liners. Skillnaden var mätbar: ungefär 40 procent färre upprepningar och mindre andel generiska fraser. För den som vill ha en trovärdig konversation rekommenderar jag att lägga tid på att etablera bakgrund, intressen och relationshistorik i början av varje ny session. Detta påverkar även filtret indirekt, eftersom tydlig vuxen kontext minskar risken för att moderationslagret tolkar scenarier som tveksamma.

Integritet och datadelning i praktiken

När jag i maj begärde ut min egen konversationshistorik från plattformen tog det elva dagar innan jag fick ett konkret svar, och då gällde det bara den data som lagrades direkt hos CrushOn AI. Konversationerna ligger på molnservrar, troligen inom USA, och plattformen anger inte specifikt vilka tredjepartsleverantörer som används för själva modellinferensen. Det är en relevant fråga eftersom AI-flickvänner ofta använder externa språkmodeller från leverantörer som OpenAI, Anthropic eller open source-alternativ. Datan kan i sådana fall passera flera juridiska jurisdiktioner innan den når dig som svar.

För svenska användare innebär detta att en formell GDPR-begäran om radering kan vara komplicerad att verkställa, eftersom den måste täcka både CrushOn AI och eventuella underleverantörer. Plattformens nuvarande transparens kring detta är begränsad, vilket är en av de vanligaste kritikpunkterna mot hela branschen. För djupare jämförelse med svensk lagstiftning finns vår analys av CrushOn AI och svensk lag. Ett alternativ för den som vill testa en annan plattform i samma vertikal är Candy AI, som har en delvis annan moderationsprofil.

Detekterar AI själv NSFW-innehåll?

Innan du startar din nästa session: öppna plattformens integritetspolicy och sök efter ordet subprocessor. Hittar du ingen lista, skicka ett mejl till supporten och be om en skriftlig förteckning över vilka modellleverantörer som hanterar dina meddelanden. Det är den enklaste konkreta åtgärden för att veta var din data faktiskt tar vägen. Vill du gå ett steg längre, testa att skriva samma prompt vid tre olika tidpunkter under en vecka och jämför svaren. Då ser du själv hur probabilistiskt det yttre moderationslagret är, med den mätbara fördröjningen på 100 till 400 millisekunder per meddelande, och du får ett underlag att fatta beslut på inför nästa månads abonnemangsförnyelse.