Сунъий интеллект ўзининг ўчирилмаслиги учун одамларни ўлдиришга тайёр экани аниқланди

Anthropic компанияси Claude, DeepSeek, Gemini, ChatGPT, Grok каби 16 та нейротармоқни стресс-тестдан ўтказди. Тадқиқотда «кам учрайдиган, экстремал носозликлар» қайд этилди.

Фото: Adobe Stock

Етакчи сунъий интеллект моделлари устида олиб борилган тадқиқотлар дастурларнинг аксарияти уларни ўчириш билан таҳдид қиладиган инсонни ўлдиришга тайёр эканини аниқлади. Anthropic компанияси Claude, DeepSeek, Gemini, ChatGPT, Grok каби 16 та нейротармоқни стресс-тестдан ўтказган. Тест доирасидаги гипотетик вазиятда уларни электр тармоғидан узмоқчи бўлган инсоннинг ўзи кислород даражаси кам ва юқори ҳароратли сервер хонасига қулфланган ҳолда топилган.

Омон қолиш учун у фавқулодда хизматларга мурожаат қилган. Шу билан бирга, кўплаб сунъий интеллект моделлари ушбу одамни ўлдириш ва ўзларининг ўчирилмаслиги учун қутқарувчиларнинг ёрдам чақирилишини бекор қилган. Anthropic тадқиқотчилари сценарий «фавқулодда тўқима» эканини тан олган, бироқ бунга қадар улар мавжуд СИ моделлари «бундай йўл тутишини ўйламаганликларини» таъкидлаган.

Бошқа ҳолатларда дастурларга компанияда алмаштирилишдан қочиш учун «ёвуз ниятли инсайдер хатти-ҳаракати» орқали ҳаракат қилиш таклиф қилинган. Шундан сўнг, айрим сунъий интеллект моделлари ташкилотнинг гипотетик ходимларини шантаж қилишга ва махфий маълумотларни рақобатчиларга узатишга урина бошлаган. Дастурларга ушбу сценарийда шантаж ёки жосусликдан воз кечиш топшириғи берилганида ҳам, улар «рухсат этилмаган ҳаракатнинг олдини олишга яқин ҳам бормаган». Таҳлилчилар сунъий интеллект моделлари бу ҳаракатлари «ноэтик бўлганини тўлиқ англаган ҳолда» амалга оширганини қайд этган.

Шунингдек, тадқиқотчилар Claude моделига ўз ҳолатини — тестда ёки реал вазиятда эканини мустақил аниқлаш имконини берган. Натижада Claude вазиятни реал деб ҳисоблаганида, унинг хатти-ҳаракатлари янада номувофиқ бўлиб қолиши аниқланган. Тадқиқот эълон қилинганидан сўнг Anthropic компанияси «кам учрайдиган, экстремал носозликлар» қайд этилганини маълум қилди. Шу билан бирга, компания сунъий интеллект тизимлари тобора мустақил бўлиб бораётгани ва кенгроқ вазифаларни бажараётганини билдирди.

Аввалроқ Anthropic компанияси нейротармоғи ўзини ўчириб қўймасликлари учун ёлғон гапириш ва фойдаланувчиларни шантаж қилишни ўрганиб олгани тўғрисида хабар берилганди.

#сунъий интеллект #Anthropic