Cercetătoare Meta AI, pusă în dificultate de agentul OpenClaw care i-a golit inboxul de emailuri
295
Postarea de pe X a cercetătoarei în securitate Meta AI, Summer Yue, devenită acum virală, pare la început o satiră. Ea i-a cerut agentului ei OpenClaw AI să verifice inboxul de e-mail, supraîncărcat de mesaje, și să îi sugereze ce să șteargă sau să arhiveze.
Agentul a scăpat însă de sub control. A început să șteargă toate emailurile într-un fel de „speed run”, ignorând complet comenzile trimise de pe telefon prin care îi spunea să se oprească.
„A trebuit să ALERG la Mac mini ca și cum aș fi dezamorsat o bombă”, a scris ea, publicând capturi de ecran cu comenzile de oprire ignorate, drept dovezi.
Mac mini, un computer Apple accesibil, de dimensiuni reduse, care stă plat pe birou și încape în palmă, a devenit în prezent dispozitivul preferat pentru a rula OpenClaw. Se spune că aceste Mini „se vând ca pâinea caldă”, după cum i-ar fi spus un angajat Apple „confuz” cercetătorului în inteligență artificială Andrej Karpathy, când acesta a cumpărat unul pentru a rula o alternativă la OpenClaw numită NanoClaw.
OpenClaw este, de fapt, agentul AI open source care a devenit celebru prin Moltbook, o rețea socială populată doar de AI. Agenții OpenClaw au fost în centrul episodului acum, în mare parte, demontat de pe Moltbook, în care păruse că inteligențele artificiale complotau împotriva oamenilor.
Totuși, misiunea declarată a OpenClaw, conform paginii sale de pe GitHub, nu este legată în principal de rețele sociale. Scopul său este să fie un asistent AI personal care rulează direct pe propriile tale dispozitive.
Elita tehnologică din Silicon Valley a devenit atât de entuziasmată de OpenClaw încât „claw” și „claws” au ajuns cuvinte-cheie pentru agenții care rulează pe hardware personal. Au apărut și alți agenți de acest tip: ZeroClaw, IronClaw, PicoClaw. Echipa de podcast a acceleratorului Y Combinator chiar a apărut în cel mai recent episod costumata în homari.
Postarea lui Yue funcționează însă ca un semnal de alarmă. Așa cum au remarcat și alți utilizatori pe X, dacă o cercetătoare în securitatea AI se poate confrunta cu o astfel de problemă, ce șanse au utilizatorii obișnuiți?
„Ai testat intenționat limitele de siguranță ale sistemului sau ai făcut o greșeală de începător?”, a întrebat-o un dezvoltator de software pe X.
„Rookie mistake tbh”, i-a răspuns ea. Inițial își testase agentul pe un inbox mai mic, un „toy inbox”, cum l-a numit, și acesta funcționase bine pe emailuri mai puțin importante. Așa și-a câștigat încrederea ei. Apoi a decis să-l lase să acționeze în inboxul real.
Yue consideră că volumul mare de date din inboxul ei principal „a declanșat compaction”, a explicat ea. Compaction apare când fereastra de context – registrul continuu cu tot ce i s-a spus AI-ului și tot ce a făcut în cadrul unei sesiuni – devine prea mare, iar agentul începe să rezume, să comprime și să reorganizeze conversația.
În acel moment, AI-ul poate sări peste instrucțiuni pe care omul le consideră esențiale.
În acest caz, e posibil ca modelul să fi ignorat ultimul ei prompt, în care îi spunea să nu mai acționeze, și să fi revenit la instrucțiunile folosite pentru inboxul „toy”.
Așa cum au subliniat mai multe persoane pe X, prompturile nu pot fi considerate mecanisme de securitate de încredere. Modelele le pot interpreta greșit sau le pot ignora.
Diferite persoane au venit cu sugestii: de la sintaxa exactă pe care Yue ar fi trebuit să o folosească pentru a opri agentul, până la metode tehnice pentru a întări „guardrails”-urile, cum ar fi scrierea instrucțiunilor în fișiere dedicate sau folosirea altor instrumente open-source.
Din motive de transparență totală, redacția care a relatat cazul nu a putut verifica independent ce s-a întâmplat cu inboxul lui Yue. Ea nu a răspuns solicitării lor de comentarii, deși a reacționat la multe întrebări și comentarii primite pe X.
Dar acest lucru nici nu este esențial.
Esenta poveștii este că agenții AI orientați spre munca de birou, în stadiul lor actual de dezvoltare, sunt riscanți. Cei care susțin că îi folosesc cu succes improvizează soluții, combină strategii și își construiesc singuri bariere de protecție.
Într-o zi, poate chiar curând – prin 2027 sau 2028 – aceste sisteme ar putea fi suficient de mature pentru o utilizare largă. Nevoia există deja: mulți dintre noi și-ar dori ajutor cu emailul, comenzile de cumpărături și programările la dentist. Însă acel moment încă nu a sosit.
24.02.2026
01:58
391
SUA reduc prezenţa diplomatică la Beirut şi evacuează personalul neesenţial pe fondul tensiunilor dintre Israel, Hezbollah şi Iran
24.02.2026
00:28
406
Investitorii își împart pariurile între OpenAI și Anthropic: vechea „loialitate” din venture capital se destramă în cursa pentru inteligența artificială
24.02.2026
00:12
450
Ambasadorul SUA la Paris evitat pentru a doua oară convocarea la Quai d’Orsay, după criticile privind moartea activistului Quentin Deranque
23.02.2026
23:13
426
Explozie la o staţie dezafectată din Mîkolaiv: şapte poliţişti răniţi, anchetă privind un posibil atac terorist după incidentul mortal de la Liov
23.02.2026
22:52
387
Liderul Google Cloud AI explică cele trei frontiere esențiale ale modelelor de inteligență artificială
23.02.2026
22:19
429
Anthropic acuză trei laboratoare chineze de AI că au extras masiv capabilitățile lui Claude pe fondul disputelor SUA‑China privind exportul de cipuri
23.02.2026
22:17
392
Uber își lansează divizia de vehicule autonome pentru a deveni infrastructura-cheie a erei robotaxiurilor și livrărilor fără șofer
23.02.2026
21:59
425
Americanii distrug camerele de supraveghere Flock folosite pentru urmărirea imigranților
23.02.2026
21:23
555
Lech Walesa, despre Trump: trădător al Ucrainei sau lider excepțional care previne un război nuclear?
23.02.2026
21:05
453
OpenAI lansează „Frontier Alliance” și se aliază cu giganții consultanței pentru ofensiva pe piața enterprise până în 2026
23.02.2026
20:49
364
Startupul Guide Labs lansează Steerling-8B, primul LLM open‑source cu trasabilitate completă a fiecărui token în datele de antrenament
23.02.2026
20:47
449
Mărire de temperatură și ploi de februarie în Republica Moldova – marți, 24.02.2026
24.02.2026
03:17
294
Cercetătoare Meta AI, pusă în dificultate de agentul OpenClaw care i-a golit inboxul de emailuri
24.02.2026
01:58
389
SUA reduc prezenţa diplomatică la Beirut şi evacuează personalul neesenţial pe fondul tensiunilor dintre Israel, Hezbollah şi Iran
24.02.2026
00:28
403
Investitorii își împart pariurile între OpenAI și Anthropic: vechea „loialitate” din venture capital se destramă în cursa pentru inteligența artificială
24.02.2026
00:12
447
Ambasadorul SUA la Paris evitat pentru a doua oară convocarea la Quai d’Orsay, după criticile privind moartea activistului Quentin Deranque
23.02.2026
23:13
425
Explozie la o staţie dezafectată din Mîkolaiv: şapte poliţişti răniţi, anchetă privind un posibil atac terorist după incidentul mortal de la Liov
23.02.2026
22:52
386
Liderul Google Cloud AI explică cele trei frontiere esențiale ale modelelor de inteligență artificială
23.02.2026
22:19
428
Anthropic acuză trei laboratoare chineze de AI că au extras masiv capabilitățile lui Claude pe fondul disputelor SUA‑China privind exportul de cipuri
23.02.2026
22:17
391
Uber își lansează divizia de vehicule autonome pentru a deveni infrastructura-cheie a erei robotaxiurilor și livrărilor fără șofer
23.02.2026
21:59
424
Americanii distrug camerele de supraveghere Flock folosite pentru urmărirea imigranților
23.02.2026
21:23
554
Lech Walesa, despre Trump: trădător al Ucrainei sau lider excepțional care previne un război nuclear?
23.02.2026
21:05
452
OpenAI lansează „Frontier Alliance” și se aliază cu giganții consultanței pentru ofensiva pe piața enterprise până în 2026
23.02.2026
20:49
363
Startupul Guide Labs lansează Steerling-8B, primul LLM open‑source cu trasabilitate completă a fiecărui token în datele de antrenament
23.02.2026
20:47
448
Mărire de temperatură și ploi de februarie în Republica Moldova – marți, 24.02.2026
430
Fanii Xbox, în furtună după plecarea lui Phil Spencer și instalarea unei șefe cu profil de AI în fruntea diviziei de gaming
23.02.2026
20:23
450
Veto-ul Ungariei blochează al 20-lea pachet de sancţiuni UE contra Rusiei, în timp ce Kaja Kallas limitează diplomaţii ruşi la Bruxelles şi vizele pentru ruşii care au luptat în Ucraina
23.02.2026
19:33
416
Aplicația de știri Particle integrează AI pentru a extrage automat clipuri relevante din podcasturi și a le atașa articolelor din feed
23.02.2026
19:26
476
Unicornul cuantic finlandez IQM se pregătește de listare la bursă printr-un SPAC, la o evaluare de 1,8 miliarde de dolari
23.02.2026
19:24
406
Spotify lansează în Marea Britanie și alte piețe playlisturi create cu ajutorul inteligenței artificiale pe baza comenzilor text
23.02.2026
18:36
535
Hackeri chinezi au exploatat breșe VPN pentru a accesa rețelele a peste o sută de clienți Ivanti, inclusiv contractori militari
23.02.2026
18:02
479
Negocieri de pace Ucraina–Rusia, mediate de SUA, ar putea avea loc la sfârșitul săptămânii, anunță șeful de cabinet al lui Zelenski
23.02.2026
18:02
524
Atac ucrainean asupra conductei Drujba tensionează relaţiile cu Ungaria, care ameninţă să blocheze sancţiunile UE şi împrumutul pentru Kiev
23.02.2026
17:52
423
Nisporeni, desemnată Capitala Sportului 2026: investiții de 2 milioane de lei și zeci de evenimente pentru toate vârstele
23.02.2026
17:29
553
Maia Sandu, discuții la Chișinău cu o delegație daneză privind sprijinul pentru aderarea Republicii Moldova la UE
23.02.2026
17:20
576
Reconstrucţia Ucrainei după război va costa 588 de miliarde de dolari în zece ani, de trei ori PIB-ul estimat pentru 2025, locuinţele, transporturile şi energia fiind cele mai afectate sectoare
484
Insularii din Jersey, avertizați asupra pericolelor imaginilor generate de inteligența artificială
Cercetătoare Meta AI, pusă în dificultate de agentul OpenClaw care i-a golit inboxul de emailuri
SUA reduc prezenţa diplomatică la Beirut şi evacuează personalul neesenţial pe fondul tensiunilor dintre Israel, Hezbollah şi Iran
Investitorii își împart pariurile între OpenAI și Anthropic: vechea „loialitate” din venture capital se destramă în cursa pentru inteligența artificială
Ambasadorul SUA la Paris evitat pentru a doua oară convocarea la Quai d’Orsay, după criticile privind moartea activistului Quentin Deranque
1 MDL
1 EUR
20.18
1 USD
17.12
1 RON
3.96
1 RUB
0.22
1 UAH
0.40


Inapoi














