Cercetătoare Meta AI, pusă în dificultate de agentul OpenClaw care i-a golit inboxul de emailuri
809
Postarea de pe X a cercetătoarei în securitate Meta AI, Summer Yue, devenită acum virală, pare la început o satiră. Ea i-a cerut agentului ei OpenClaw AI să verifice inboxul de e-mail, supraîncărcat de mesaje, și să îi sugereze ce să șteargă sau să arhiveze.
Agentul a scăpat însă de sub control. A început să șteargă toate emailurile într-un fel de „speed run”, ignorând complet comenzile trimise de pe telefon prin care îi spunea să se oprească.
„A trebuit să ALERG la Mac mini ca și cum aș fi dezamorsat o bombă”, a scris ea, publicând capturi de ecran cu comenzile de oprire ignorate, drept dovezi.
Mac mini, un computer Apple accesibil, de dimensiuni reduse, care stă plat pe birou și încape în palmă, a devenit în prezent dispozitivul preferat pentru a rula OpenClaw. Se spune că aceste Mini „se vând ca pâinea caldă”, după cum i-ar fi spus un angajat Apple „confuz” cercetătorului în inteligență artificială Andrej Karpathy, când acesta a cumpărat unul pentru a rula o alternativă la OpenClaw numită NanoClaw.
OpenClaw este, de fapt, agentul AI open source care a devenit celebru prin Moltbook, o rețea socială populată doar de AI. Agenții OpenClaw au fost în centrul episodului acum, în mare parte, demontat de pe Moltbook, în care păruse că inteligențele artificiale complotau împotriva oamenilor.
Totuși, misiunea declarată a OpenClaw, conform paginii sale de pe GitHub, nu este legată în principal de rețele sociale. Scopul său este să fie un asistent AI personal care rulează direct pe propriile tale dispozitive.
Elita tehnologică din Silicon Valley a devenit atât de entuziasmată de OpenClaw încât „claw” și „claws” au ajuns cuvinte-cheie pentru agenții care rulează pe hardware personal. Au apărut și alți agenți de acest tip: ZeroClaw, IronClaw, PicoClaw. Echipa de podcast a acceleratorului Y Combinator chiar a apărut în cel mai recent episod costumata în homari.
Postarea lui Yue funcționează însă ca un semnal de alarmă. Așa cum au remarcat și alți utilizatori pe X, dacă o cercetătoare în securitatea AI se poate confrunta cu o astfel de problemă, ce șanse au utilizatorii obișnuiți?
„Ai testat intenționat limitele de siguranță ale sistemului sau ai făcut o greșeală de începător?”, a întrebat-o un dezvoltator de software pe X.
„Rookie mistake tbh”, i-a răspuns ea. Inițial își testase agentul pe un inbox mai mic, un „toy inbox”, cum l-a numit, și acesta funcționase bine pe emailuri mai puțin importante. Așa și-a câștigat încrederea ei. Apoi a decis să-l lase să acționeze în inboxul real.
Yue consideră că volumul mare de date din inboxul ei principal „a declanșat compaction”, a explicat ea. Compaction apare când fereastra de context – registrul continuu cu tot ce i s-a spus AI-ului și tot ce a făcut în cadrul unei sesiuni – devine prea mare, iar agentul începe să rezume, să comprime și să reorganizeze conversația.
În acel moment, AI-ul poate sări peste instrucțiuni pe care omul le consideră esențiale.
În acest caz, e posibil ca modelul să fi ignorat ultimul ei prompt, în care îi spunea să nu mai acționeze, și să fi revenit la instrucțiunile folosite pentru inboxul „toy”.
Așa cum au subliniat mai multe persoane pe X, prompturile nu pot fi considerate mecanisme de securitate de încredere. Modelele le pot interpreta greșit sau le pot ignora.
Diferite persoane au venit cu sugestii: de la sintaxa exactă pe care Yue ar fi trebuit să o folosească pentru a opri agentul, până la metode tehnice pentru a întări „guardrails”-urile, cum ar fi scrierea instrucțiunilor în fișiere dedicate sau folosirea altor instrumente open-source.
Din motive de transparență totală, redacția care a relatat cazul nu a putut verifica independent ce s-a întâmplat cu inboxul lui Yue. Ea nu a răspuns solicitării lor de comentarii, deși a reacționat la multe întrebări și comentarii primite pe X.
Dar acest lucru nici nu este esențial.
Esenta poveștii este că agenții AI orientați spre munca de birou, în stadiul lor actual de dezvoltare, sunt riscanți. Cei care susțin că îi folosesc cu succes improvizează soluții, combină strategii și își construiesc singuri bariere de protecție.
Într-o zi, poate chiar curând – prin 2027 sau 2028 – aceste sisteme ar putea fi suficient de mature pentru o utilizare largă. Nevoia există deja: mulți dintre noi și-ar dori ajutor cu emailul, comenzile de cumpărături și programările la dentist. Însă acel moment încă nu a sosit.
42
Amazon închide primul său centru din Marea Britanie, dar deschide un hub uriaș la Northampton
26.03.2026
08:28
182
Horoscopul zilei 26.03.2026
264
Cum va schimba Regatul Unit accesul minorilor la rețelele sociale după verdictul istoric împotriva Google și Meta în SUA?
406
Dezvoltator Roblox avertizează: fără supraveghere 24/7 de la părinți, copiii nu ar trebui să folosească platforma
26.03.2026
03:11
443
Malware descoperit în proiectul LiteLLM ridică semne de întrebare asupra certificărilor de securitate obținute prin Delve
451
Războiul din Iran împinge britanicii spre energia verde: Octopus Energy anunță o creștere de 50% a vânzărilor de panouri solare
26.03.2026
00:20
460
Șeful spyware Intellexa, condamnat în Grecia, sugerează implicarea directă a guvernului Mitsotakis în zecile de interceptări telefonice
25.03.2026
23:56
485
Google lansează TurboQuant, algoritmul care comprimă memoria AI de „cel puțin 6x” și stârnește comparații cu Pied Piper din Silicon Valley
25.03.2026
21:11
572
Republica Moldova evaluează la nivel național dezvoltarea timpurie a copiilor cu instrumentul internațional IDELA
25.03.2026
20:31
4062
VIDEO // Lecție de DEMNITATE în Parlament: Liliana Vițu a pus-o la punct pe comunista Diana Caraman, care SFIDEAZĂ Constituția
25.03.2026
20:28
509
Cer mai acoperit și vânt sporit în Republica Moldova, joi, 26 martie 2026
26.03.2026
08:28
0
Horoscopul zilei 26.03.2026
238
Cum va schimba Regatul Unit accesul minorilor la rețelele sociale după verdictul istoric împotriva Google și Meta în SUA?
393
Dezvoltator Roblox avertizează: fără supraveghere 24/7 de la părinți, copiii nu ar trebui să folosească platforma
26.03.2026
03:11
434
Malware descoperit în proiectul LiteLLM ridică semne de întrebare asupra certificărilor de securitate obținute prin Delve
443
Războiul din Iran împinge britanicii spre energia verde: Octopus Energy anunță o creștere de 50% a vânzărilor de panouri solare
26.03.2026
00:20
449
Șeful spyware Intellexa, condamnat în Grecia, sugerează implicarea directă a guvernului Mitsotakis în zecile de interceptări telefonice
25.03.2026
23:56
470
Google lansează TurboQuant, algoritmul care comprimă memoria AI de „cel puțin 6x” și stârnește comparații cu Pied Piper din Silicon Valley
25.03.2026
21:11
566
Republica Moldova evaluează la nivel național dezvoltarea timpurie a copiilor cu instrumentul internațional IDELA
25.03.2026
20:31
3933
VIDEO // Lecție de DEMNITATE în Parlament: Liliana Vițu a pus-o la punct pe comunista Diana Caraman, care SFIDEAZĂ Constituția
25.03.2026
20:28
502
Cer mai acoperit și vânt sporit în Republica Moldova, joi, 26 martie 2026
25.03.2026
19:55
541
Bernie Sanders și AOC vor să blocheze marile centre de date până la o reglementare strictă a inteligenței artificiale
25.03.2026
18:13
557
Meta aduce inteligența artificială în Facebook și Instagram pentru a simplifica cumpărăturile și plățile online
25.03.2026
17:54
816
PERICOL // Europa ar putea rămâne fără combustibili de luna viitoare, avertizează directorul uneia dintre cele mai mari companii din lume
25.03.2026
17:43
556
MEC lansează Planul de acțiuni 2026 pentru învățarea și promovarea limbii ucrainene în Republica Moldova
25.03.2026
17:27
560
Guvernul pregătește legea mobilității urbane durabile: primăriile vor elabora planuri proprii pentru transport și parcări
582
Franța sprijină modernizarea agriculturii moldovenești prin proiecte de irigare și expertiză tehnică
25.03.2026
17:21
581
Startupul Arbor Energy primește o comandă de miliarde pentru turbine de inspirație rachetă destinate centrelor de date și industriei
25.03.2026
14:29
713
Guvernul introduce integritatea academică drept criteriu obligatoriu în evaluarea tuturor instituțiilor de învățământ din Republica Moldova
25.03.2026
14:25
1000
R. Moldova REZISTĂ. Autoritățile au identificat SOLUȚII pentru ca cetățenii să nu stea pe întuneric din cauza armatei Rusiei
25.03.2026
13:36
608
Guvernul introduce noi restricții și investiții de urgență pentru protejarea sistemului energetic și reducerea consumului în timpul stării de urgență
25.03.2026
12:17
657
Maia Sandu, vizită oficială în Slovacia pentru sprijin european și noi acorduri economice
25.03.2026
11:45
1099
AUDIO, FOTO // „Munte de bani” la nordul R. Moldova: peste 120.000 de euro ridicați de procurori după destructurarea unei caracatițe a mitei în transporturi
25.03.2026
11:44
640
Campania „Fii PRO! Alege să fii profesor!” promovează cariera didactică la Universitatea „Alecu Russo” din Bălți, cu indemnizații de până la 200.000 de lei pentru tinerii profesori
25.03.2026
11:36
1662
VIDEO // Plahotniuc a început să VORBEASCĂ, după ce procurorii au solicitat să fie condamnat la 25 de ani de ÎNCHISOARE
25.03.2026
10:26
706
Maia Sandu, la Ungheni: dialog național despre siguranța copiilor online, sprijin pentru afaceri locale și proiectul Podul de Flori
Adrian Dupu, la întâlnirea cu aleșii locali din Cantemir: „Alegerile europarlamentare din 9 iunie sunt la fel de importante atât pentru România, cât și pentru R. Moldova”
VIDEO // Cine a CÂȘTIGAT alegerile parlamentare anticipate. PAS ar fi acumulat 55,1%, iar BeCS - 24%. În viitorul Parlament va fi și Partidul „ȘOR”. Prezentarea rezultatelor prealabile a sondajului AFTER POLL 2021
Cavcaliuc poate fi CERCETAT PENAL în perioada electorală, în pofida faptului că e candidat la funcția de deputat. Cum comentează PACE decizia CSJ
Nicolae Negru // Primul pas, Maia Sandu cu Volodymyr Zelenski
1 MDL
1 EUR
20.23
1 USD
17.44
1 RON
3.97
1 RUB
0.22
1 UAH
0.40


Inapoi














