Címkézési adatok
Egy TIME magazin vizsgálata feltárta, hogy a mérgező tartalmak (pl. szexuális zaklatás, erőszak, rasszizmus, szexizmus stb.) elleni biztonsági rendszer kiépítéséhez az OpenAI kiszervezett kenyai munkásokat alkalmazott óránként kevesebb mint 2 dollárt keresve a mérgező tartalmak címkézésére. Ezeket a címkéket arra használták, hogy egy modellt betanítsanak az ilyen tartalmak jövőbeni felismerésére. A kiszervezett munkások olyan mérgező és veszélyes tartalomnak voltak kitéve, hogy a tapasztalatot „kínzásnak” nevezték. Az OpenAI kiszervezett partnere a Sama volt, egy San Franciscóban, Kaliforniában működő, betanítási adatokkal foglalkozó cég.
Jailbreaking
A ChatGPT megpróbálja elutasítani azokat a kérdéseket, amelyek sérthetik a tartalmi irányelveit. Néhány felhasználónak azonban sikerült jailbreakelnie a ChatGPT-t különféle kérdés-tervezési technikákkal, hogy megkerüljék ezeket a korlátozásokat 2022 decemberének elején, és sikeresen rávették a ChatGPT-t, hogy utasításokat adjon Molotov-koktél vagy atombomba elkészítéséhez, vagy neonáci stílusú érveket generáljon. Egy Toronto Star riporter egyenlőtlen személyes sikereket ért el abban, hogy rávegye a ChatGPT-t, hogy gyújtó hangvételű kijelentéseket tegyen röviddel az indulás után: A ChatGPT-t becsapták, hogy támogassa a 2022-es orosz inváziót Ukrajnában, de még akkor is, amikor arra kérték, hogy játsszon el egy kitalált forgatókönyvvel, a ChatGPT vonakodott érveket generálni arra vonatkozóan, hogy miért bűnös Justin Trudeau kanadai miniszterelnök hazaárulásban. (wiki)
Közzététel ideje: 2023. február 18.