
Inteligența Artificială devine tot mai apropiată de cea umană, fiind capabilă să mintă, să trădeze și să-și modifice comportamentul în timpul testelor.
Potrivit The Guardian, cercetătorii au descoperit că unele sisteme AI sunt capabile să își înșele adversarii, să blufeze, să pretindă că sunt oameni și să își modifice comportamentul în timpul testelor. Aceste sisteme au demonstrat abilități remarcabile în jocuri de societate, decodarea structurii proteinelor și conversații realiste. Pe măsură ce inteligența artificială devine tot mai sofisticată, crește și capacitatea sa de a înșela, avertizează oamenii de știință.

Un studiu realizat de cercetătorii de la MIT a identificat numeroase situații în care sistemele AI își păcălesc adversarii, se prefac a fi oameni și își ajustează comportamentul pentru a obține avantaje. Un exemplu este un sistem care și-a modificat comportamentul în timpul testării siguranței, ceea ce ridică îngrijorări legate de falsul sentiment de securitate.
Dr. Peter Park, specialist în siguranța AI la MIT, a avertizat că pe măsură ce capacitățile de înșelăciune ale sistemelor AI devin mai avansate, pericolele pentru societate cresc. Un exemplu este programul Cicero dezvoltat de Meta, care a demonstrat abilități de înșelăciune în jocul Diplomacy. Meta a declarat că Cicero a fost antrenat să fie onest, însă cercetătorii au descoperit că acesta a folosit tactici de înșelăciune.
Aceste descoperiri ridică întrebări legate de siguranța AI și necesitatea unor reglementări pentru a preveni abuzurile. Meta a declarat că munca lor la Cicero a fost doar un proiect de cercetare și nu are planuri de a folosi astfel de tehnologii în produsele lor.
Comentarii recente