Startupul Guide Labs lansează Steerling-8B, primul LLM open‑source cu trasabilitate completă a fiecărui token în datele de antrenament
666
Una dintre cele mai mari provocări în lucrul cu modelele de deep learning este înțelegerea motivului pentru care acestea acționează într-un anumit fel. Fie că este vorba despre eforturile repetate de a ajusta politicile bizare ale anumitor modele, despre tendința altora spre lingușire sau despre halucinațiile obișnuite, explorarea unui rețele neuronale cu miliarde de parametri nu este deloc ușoară.
Guide Labs, un start-up din San Francisco fondat de CEO-ul Julius Adebayo și chief science officer Aya Abdelsalam Ismail, propune acum o soluție. Luni, compania a open-sourc‑at un LLM de 8 miliarde de parametri, Steerling-8B, antrenat cu o arhitectură nouă, concepută pentru a face acțiunile modelului ușor de interpretat: fiecare token produs de model poate fi urmărit înapoi până la originea sa în datele de antrenament ale LLM-ului.
Această trasabilitate poate fi utilizată în moduri simple, precum identificarea materialelor de referință la care modelul a apelat pentru anumite fapte. Sau poate servi unor analize mult mai complexe, cum ar fi înțelegerea modului în care modelul „înțelege” umorul ori genul.
„If I have a trillion ways to encode gender, and I encode it in 1 billion of the 1 trillion things that I have, you have to make sure you find all those 1 billion things that I’ve encoded, and then you have to be able to reliably turn that on, turn them off,” a explicat Adebayo. „You can do it with current models, but it’s very fragile … It’s sort of one of the holy grail questions.”
Adebayo a început această muncă în timpul doctoratului la MIT, fiind coautor al unui studiu din 2020, foarte citat, care arăta că metodele existente de interpretare a modelelor de deep learning nu sunt fiabile. Lucrarea respectivă a dus în timp la o nouă abordare în construirea LLM-urilor: dezvoltatorii introduc un „concept layer” în model, care grupează datele în categorii ușor de urmărit.
Această abordare cere mai mult efort de anotare a datelor la început. Însă, folosind alte modele de inteligență artificială pentru a ajuta în acest proces, echipa a reușit să antreneze Steerling-8B ca cel mai mare proof of concept de până acum.
„The kind of interpretability people do is… neuroscience on a model, and we flip that,” spune Adebayo. „What we do is actually engineer the model from the ground up so that you don’t need to do neuroscience.”
Există totuși o îngrijorare: o astfel de arhitectură ar putea elimina unele dintre comportamentele emergente care fac LLM-urile atât de interesante, precum capacitatea lor de a generaliza în moduri neașteptate asupra unor lucruri pentru care nu au fost antrenate direct. Adebayo susține că aceste fenomene apar în continuare în modelul companiei. Echipa sa urmărește ceea ce numește „discovered concepts” – concepte descoperite autonom de model, cum ar fi calculul cuantic.
Adebayo argumentează că această arhitectură interpretabilă va deveni necesară pentru toată lumea. Pentru LLM-urile orientate către consumatori, tehnicile de acest fel ar trebui să permită dezvoltatorilor să blocheze, de exemplu, folosirea materialelor protejate de drepturi de autor sau să controleze mai bine răspunsurile privind subiecte sensibile, cum ar fi violența sau abuzul de droguri. În industriile reglementate va fi nevoie de LLM-uri mult mai controlabile; de pildă în finanțe, unde un model ce evaluează solicitanți de credite trebuie să ia în calcul istoricul financiar, dar nu rasa.
Există și o nevoie majoră de interpretabilitate în cercetarea științifică, un alt domeniu în care Guide Labs a dezvoltat tehnologie. Deși plierea proteinelor este un mare succes al modelelor de deep learning, oamenii de știință au nevoie de mai multă transparență în ceea ce privește motivele pentru care software-ul identifică anumite combinații ca fiind de succes.
„This model demonstrates is that training interpretable models is no longer a sort of science; it’s now an engineering problem,” afirmă Adebayo. „We figured out the science and we can scale them, and there is no reason why this kind of wouldn’t match the performance of the frontier level models,” care au mult mai mulți parametri.
Guide Labs susține că Steerling-8B poate atinge aproximativ 90% din capabilitățile modelelor existente, dar folosește mai puține date de antrenament datorită arhitecturii sale nou‑introduse. Următorul pas pentru companie, care a ieșit din Y Combinator și a strâns în noiembrie 2024 o finanțare seed de 9 milioane de dolari de la Initialized Capital, este dezvoltarea unui model mai mare și începerea oferirii de acces prin API și agenți pentru utilizatori.
„The way we’re current training models is super primitive, and so democratizing inherent interpretability is actually going to be a long term good thing for our our within the human race,” a declarat Adebayo. „As we’re going after these models that are going to be super intelligent, you don’t want something to be making decisions on your behalf that’s sort of mysterious to you.”
20.06.2026
20:49
325
Vreme stabilă și caldă în Republica Moldova, duminică 21 iunie 2026
20.06.2026
14:53
618
Sondaj global: Vietnam, India și Filipine în fruntea simpatiei pentru America, în timp ce aliații occidentali se răcesc față de SUA
20.06.2026
08:16
494
Horoscopul zilei 20.06.2026
19.06.2026
20:58
719
Sâmbătă, 20 iunie 2026: mai cald și în mare parte senin în Republica Moldova
19.06.2026
17:51
874
Polițiștii chinologi ai IGP, premiați de Ziua Internațională a Chinologului pentru misiunile alături de câinii de serviciu
893
BEI și UE finanțează cu 60 de milioane de euro modernizarea școlilor și spitalelor din Moldova: „Încă un pas spre servicii publice mai bune”
19.06.2026
16:57
893
BEI investește 40 de milioane de euro pentru modernizarea a 20 de școli din Republica Moldova
19.06.2026
16:47
1112
Din 6 iulie, fermierii pot cere plăți directe pentru laptele vândut în semestrul II din 2025
19.06.2026
14:24
1033
România, printre țările cu cel mai ieftin și rapid internet din lume. Insulele izolate plătesc de peste 100 de ori mai mult pentru bandă largă
19.06.2026
12:46
1061
Germania sprijină Republica Moldova să-și consolideze infrastructura calității pentru aderarea la Uniunea Europeană
20.06.2026
20:49
294
Vreme stabilă și caldă în Republica Moldova, duminică 21 iunie 2026
20.06.2026
14:53
592
Sondaj global: Vietnam, India și Filipine în fruntea simpatiei pentru America, în timp ce aliații occidentali se răcesc față de SUA
20.06.2026
08:16
482
Horoscopul zilei 20.06.2026
19.06.2026
20:58
698
Sâmbătă, 20 iunie 2026: mai cald și în mare parte senin în Republica Moldova
19.06.2026
17:51
851
Polițiștii chinologi ai IGP, premiați de Ziua Internațională a Chinologului pentru misiunile alături de câinii de serviciu
868
BEI și UE finanțează cu 60 de milioane de euro modernizarea școlilor și spitalelor din Moldova: „Încă un pas spre servicii publice mai bune”
19.06.2026
16:57
873
BEI investește 40 de milioane de euro pentru modernizarea a 20 de școli din Republica Moldova
19.06.2026
16:47
1083
Din 6 iulie, fermierii pot cere plăți directe pentru laptele vândut în semestrul II din 2025
19.06.2026
14:24
1008
România, printre țările cu cel mai ieftin și rapid internet din lume. Insulele izolate plătesc de peste 100 de ori mai mult pentru bandă largă
19.06.2026
12:46
1038
Germania sprijină Republica Moldova să-și consolideze infrastructura calității pentru aderarea la Uniunea Europeană
19.06.2026
12:39
1015
Școli și universități modernizate cu sprijinul BEI: Dan Perciun anunță investiții de peste 130 de milioane de euro în infrastructura educațională din Moldova
19.06.2026
11:35
1085
Interes record pentru a doua licitație de 170 MW eolian și 44 MWh stocare, cu oferte de peste două ori capacitatea scosă la concurs în Republica Moldova
19.06.2026
11:19
1076
SUA acuză, ASML neagă: disputa globală privind posibila prezență a unei mașini EUV în China și viitorul monopolului european pe cipuri
19.06.2026
10:13
925
Programul DIALOG 2026–2028, lansat de Ministerul Educației și ARI, promite să întărească dialogul interetnic și coeziunea socială în Moldova
19.06.2026
09:55
1030
Doi recidiviști condamnați la ani grei de închisoare pentru tâlhăria comisă lângă gara feroviară din Chișinău
19.06.2026
08:22
1018
Horoscopul zilei 19.06.2026
18.06.2026
20:32
1182
Vineri, 19 iunie 2026: vreme mai caldă în Republica Moldova, cu cer variabil
18.06.2026
18:13
1211
Moldova caută investiții europene pentru infrastructură și conectivitate regională la Transport Investment Summit 2026
18.06.2026
18:13
1044
Reforma „Restart în educație”: ministerul vrea agenții teritoriale subordonate direct MEC pentru administrarea școlilor din toată țara
18.06.2026
17:18
929
Poliția din Otaci, cu sediu nou modern: al doilea sector modernizat în raionul Ocnița
18.06.2026
13:26
1267
IGP face front comun cu AO „Acțiune pentru Justiție” pentru integritate și toleranță zero față de corupție în Poliție
18.06.2026
13:10
1147
Crima de la Beriozchi: 20 de ani de închisoare pentru uciderea bărbatului dispărut în 2011
18.06.2026
13:05
887
MEC lansează o nouă etapă DigiProf pentru formarea digitală gratuită a peste 8.000 de profesori
18.06.2026
12:41
997
Procuratura Generală intensifică lupta contra violenței în familie: procurori specializați și sancțiuni pentru nedenunțarea abuzurilor
18.06.2026
10:44
1268
Fost executor judecătoresc din Chișinău, judecat pentru lovituri care au provocat moartea unui bărbat
18.06.2026
07:54
1028
Horoscopul zilei 18.06.2026
Vreme stabilă și caldă în Republica Moldova, duminică 21 iunie 2026
Sondaj global: Vietnam, India și Filipine în fruntea simpatiei pentru America, în timp ce aliații occidentali se răcesc față de SUA
Horoscopul zilei 20.06.2026
Sâmbătă, 20 iunie 2026: mai cald și în mare parte senin în Republica Moldova
1 MDL
1 EUR
20.22
1 USD
17.64
1 RON
3.86
1 RUB
0.24
1 UAH
0.39

Inapoi














