Stiri

Cercetătoare Meta AI, pusă în dificultate de agentul OpenClaw care i-a golit inboxul de emailuri

Actualitate 24.02.2026 03:17 Vizualizări

295

Cercetătoare Meta AI, pusă în dificultate de agentul OpenClaw care i-a golit inboxul de emailuri

Postarea de pe X a cercetătoarei în securitate Meta AI, Summer Yue, devenită acum virală, pare la început o satiră. Ea i-a cerut agentului ei OpenClaw AI să verifice inboxul de e-mail, supraîncărcat de mesaje, și să îi sugereze ce să șteargă sau să arhiveze.

Agentul a scăpat însă de sub control. A început să șteargă toate emailurile într-un fel de „speed run”, ignorând complet comenzile trimise de pe telefon prin care îi spunea să se oprească.

„A trebuit să ALERG la Mac mini ca și cum aș fi dezamorsat o bombă”, a scris ea, publicând capturi de ecran cu comenzile de oprire ignorate, drept dovezi.

Mac mini, un computer Apple accesibil, de dimensiuni reduse, care stă plat pe birou și încape în palmă, a devenit în prezent dispozitivul preferat pentru a rula OpenClaw. Se spune că aceste Mini „se vând ca pâinea caldă”, după cum i-ar fi spus un angajat Apple „confuz” cercetătorului în inteligență artificială Andrej Karpathy, când acesta a cumpărat unul pentru a rula o alternativă la OpenClaw numită NanoClaw.

OpenClaw este, de fapt, agentul AI open source care a devenit celebru prin Moltbook, o rețea socială populată doar de AI. Agenții OpenClaw au fost în centrul episodului acum, în mare parte, demontat de pe Moltbook, în care păruse că inteligențele artificiale complotau împotriva oamenilor.

Totuși, misiunea declarată a OpenClaw, conform paginii sale de pe GitHub, nu este legată în principal de rețele sociale. Scopul său este să fie un asistent AI personal care rulează direct pe propriile tale dispozitive.

Elita tehnologică din Silicon Valley a devenit atât de entuziasmată de OpenClaw încât „claw” și „claws” au ajuns cuvinte-cheie pentru agenții care rulează pe hardware personal. Au apărut și alți agenți de acest tip: ZeroClaw, IronClaw, PicoClaw. Echipa de podcast a acceleratorului Y Combinator chiar a apărut în cel mai recent episod costumata în homari.

Postarea lui Yue funcționează însă ca un semnal de alarmă. Așa cum au remarcat și alți utilizatori pe X, dacă o cercetătoare în securitatea AI se poate confrunta cu o astfel de problemă, ce șanse au utilizatorii obișnuiți?

„Ai testat intenționat limitele de siguranță ale sistemului sau ai făcut o greșeală de începător?”, a întrebat-o un dezvoltator de software pe X.

„Rookie mistake tbh”, i-a răspuns ea. Inițial își testase agentul pe un inbox mai mic, un „toy inbox”, cum l-a numit, și acesta funcționase bine pe emailuri mai puțin importante. Așa și-a câștigat încrederea ei. Apoi a decis să-l lase să acționeze în inboxul real.

Yue consideră că volumul mare de date din inboxul ei principal „a declanșat compaction”, a explicat ea. Compaction apare când fereastra de context – registrul continuu cu tot ce i s-a spus AI-ului și tot ce a făcut în cadrul unei sesiuni – devine prea mare, iar agentul începe să rezume, să comprime și să reorganizeze conversația.

În acel moment, AI-ul poate sări peste instrucțiuni pe care omul le consideră esențiale.

În acest caz, e posibil ca modelul să fi ignorat ultimul ei prompt, în care îi spunea să nu mai acționeze, și să fi revenit la instrucțiunile folosite pentru inboxul „toy”.

Așa cum au subliniat mai multe persoane pe X, prompturile nu pot fi considerate mecanisme de securitate de încredere. Modelele le pot interpreta greșit sau le pot ignora.

Diferite persoane au venit cu sugestii: de la sintaxa exactă pe care Yue ar fi trebuit să o folosească pentru a opri agentul, până la metode tehnice pentru a întări „guardrails”-urile, cum ar fi scrierea instrucțiunilor în fișiere dedicate sau folosirea altor instrumente open-source.

Din motive de transparență totală, redacția care a relatat cazul nu a putut verifica independent ce s-a întâmplat cu inboxul lui Yue. Ea nu a răspuns solicitării lor de comentarii, deși a reacționat la multe întrebări și comentarii primite pe X.

Dar acest lucru nici nu este esențial.

Esenta poveștii este că agenții AI orientați spre munca de birou, în stadiul lor actual de dezvoltare, sunt riscanți. Cei care susțin că îi folosesc cu succes improvizează soluții, combină strategii și își construiesc singuri bariere de protecție.

Într-o zi, poate chiar curând – prin 2027 sau 2028 – aceste sisteme ar putea fi suficient de mature pentru o utilizare largă. Nevoia există deja: mulți dintre noi și-ar dori ajutor cu emailul, comenzile de cumpărături și programările la dentist. Însă acel moment încă nu a sosit.

Prietenii tăi merită să știe ASTA!