Startupul Guide Labs lansează Steerling-8B, primul LLM open‑source cu trasabilitate completă a fiecărui token în datele de antrenament
558
Una dintre cele mai mari provocări în lucrul cu modelele de deep learning este înțelegerea motivului pentru care acestea acționează într-un anumit fel. Fie că este vorba despre eforturile repetate de a ajusta politicile bizare ale anumitor modele, despre tendința altora spre lingușire sau despre halucinațiile obișnuite, explorarea unui rețele neuronale cu miliarde de parametri nu este deloc ușoară.
Guide Labs, un start-up din San Francisco fondat de CEO-ul Julius Adebayo și chief science officer Aya Abdelsalam Ismail, propune acum o soluție. Luni, compania a open-sourc‑at un LLM de 8 miliarde de parametri, Steerling-8B, antrenat cu o arhitectură nouă, concepută pentru a face acțiunile modelului ușor de interpretat: fiecare token produs de model poate fi urmărit înapoi până la originea sa în datele de antrenament ale LLM-ului.
Această trasabilitate poate fi utilizată în moduri simple, precum identificarea materialelor de referință la care modelul a apelat pentru anumite fapte. Sau poate servi unor analize mult mai complexe, cum ar fi înțelegerea modului în care modelul „înțelege” umorul ori genul.
„If I have a trillion ways to encode gender, and I encode it in 1 billion of the 1 trillion things that I have, you have to make sure you find all those 1 billion things that I’ve encoded, and then you have to be able to reliably turn that on, turn them off,” a explicat Adebayo. „You can do it with current models, but it’s very fragile … It’s sort of one of the holy grail questions.”
Adebayo a început această muncă în timpul doctoratului la MIT, fiind coautor al unui studiu din 2020, foarte citat, care arăta că metodele existente de interpretare a modelelor de deep learning nu sunt fiabile. Lucrarea respectivă a dus în timp la o nouă abordare în construirea LLM-urilor: dezvoltatorii introduc un „concept layer” în model, care grupează datele în categorii ușor de urmărit.
Această abordare cere mai mult efort de anotare a datelor la început. Însă, folosind alte modele de inteligență artificială pentru a ajuta în acest proces, echipa a reușit să antreneze Steerling-8B ca cel mai mare proof of concept de până acum.
„The kind of interpretability people do is… neuroscience on a model, and we flip that,” spune Adebayo. „What we do is actually engineer the model from the ground up so that you don’t need to do neuroscience.”
Există totuși o îngrijorare: o astfel de arhitectură ar putea elimina unele dintre comportamentele emergente care fac LLM-urile atât de interesante, precum capacitatea lor de a generaliza în moduri neașteptate asupra unor lucruri pentru care nu au fost antrenate direct. Adebayo susține că aceste fenomene apar în continuare în modelul companiei. Echipa sa urmărește ceea ce numește „discovered concepts” – concepte descoperite autonom de model, cum ar fi calculul cuantic.
Adebayo argumentează că această arhitectură interpretabilă va deveni necesară pentru toată lumea. Pentru LLM-urile orientate către consumatori, tehnicile de acest fel ar trebui să permită dezvoltatorilor să blocheze, de exemplu, folosirea materialelor protejate de drepturi de autor sau să controleze mai bine răspunsurile privind subiecte sensibile, cum ar fi violența sau abuzul de droguri. În industriile reglementate va fi nevoie de LLM-uri mult mai controlabile; de pildă în finanțe, unde un model ce evaluează solicitanți de credite trebuie să ia în calcul istoricul financiar, dar nu rasa.
Există și o nevoie majoră de interpretabilitate în cercetarea științifică, un alt domeniu în care Guide Labs a dezvoltat tehnologie. Deși plierea proteinelor este un mare succes al modelelor de deep learning, oamenii de știință au nevoie de mai multă transparență în ceea ce privește motivele pentru care software-ul identifică anumite combinații ca fiind de succes.
„This model demonstrates is that training interpretable models is no longer a sort of science; it’s now an engineering problem,” afirmă Adebayo. „We figured out the science and we can scale them, and there is no reason why this kind of wouldn’t match the performance of the frontier level models,” care au mult mai mulți parametri.
Guide Labs susține că Steerling-8B poate atinge aproximativ 90% din capabilitățile modelelor existente, dar folosește mai puține date de antrenament datorită arhitecturii sale nou‑introduse. Următorul pas pentru companie, care a ieșit din Y Combinator și a strâns în noiembrie 2024 o finanțare seed de 9 milioane de dolari de la Initialized Capital, este dezvoltarea unui model mai mare și începerea oferirii de acces prin API și agenți pentru utilizatori.
„The way we’re current training models is super primitive, and so democratizing inherent interpretability is actually going to be a long term good thing for our our within the human race,” a declarat Adebayo. „As we’re going after these models that are going to be super intelligent, you don’t want something to be making decisions on your behalf that’s sort of mysterious to you.”
12.03.2026
20:48
268
Vreme mai caldă și mult soare în Republica Moldova, vineri, 13 martie 2026
12.03.2026
20:12
238
Rețea globală de tip botnet, formată din sute de mii de routere piratate, dezmembrată de autorități internaționale
12.03.2026
20:05
260
Scriitoare dă în judecată Grammarly pentru folosirea fără consimțământ a numelor de autori în funcția „Expert Review”
12.03.2026
20:03
249
Bumble lansează „Bee”, asistentul AI care îți învață valorile și îți alege partenerii de dating
12.03.2026
19:06
361
Republica Moldova accelerează demersurile de asociere la programul Erasmus+, în dialog cu Comisia Europeană la Bruxelles
12.03.2026
18:10
305
Vitalie Mîța: Eficiența energetică, prioritate pentru securitatea energetică și reducerea facturilor cetățenilor
12.03.2026
17:54
416
ULTIMA ORĂ // Mii de tone de carburanți au intrat în țară, inclusiv prin Portul Giurgiulești: „Stocurile sunt garantate”
12.03.2026
16:38
350
Disney+ lansează Verts, flux de videoclipuri scurte în stil TikTok pentru a crește interacțiunea pe platformă
12.03.2026
15:43
402
MEC lansează consultări publice pentru noua Concepție a disciplinei școlare „Geografie” din învățământul general
12.03.2026
15:23
402
Târguri de cariere în toată țara pentru tinerii care aleg învățământul profesional tehnic
12.03.2026
20:48
94
Vreme mai caldă și mult soare în Republica Moldova, vineri, 13 martie 2026
12.03.2026
20:12
81
Rețea globală de tip botnet, formată din sute de mii de routere piratate, dezmembrată de autorități internaționale
12.03.2026
20:05
223
Scriitoare dă în judecată Grammarly pentru folosirea fără consimțământ a numelor de autori în funcția „Expert Review”
12.03.2026
20:03
200
Bumble lansează „Bee”, asistentul AI care îți învață valorile și îți alege partenerii de dating
12.03.2026
19:06
316
Republica Moldova accelerează demersurile de asociere la programul Erasmus+, în dialog cu Comisia Europeană la Bruxelles
12.03.2026
18:10
260
Vitalie Mîța: Eficiența energetică, prioritate pentru securitatea energetică și reducerea facturilor cetățenilor
12.03.2026
17:54
365
ULTIMA ORĂ // Mii de tone de carburanți au intrat în țară, inclusiv prin Portul Giurgiulești: „Stocurile sunt garantate”
12.03.2026
16:38
331
Disney+ lansează Verts, flux de videoclipuri scurte în stil TikTok pentru a crește interacțiunea pe platformă
12.03.2026
15:43
384
MEC lansează consultări publice pentru noua Concepție a disciplinei școlare „Geografie” din învățământul general
12.03.2026
15:23
385
Târguri de cariere în toată țara pentru tinerii care aleg învățământul profesional tehnic
12.03.2026
15:22
358
Google Maps introduce funcția AI „Ask Maps” și navigare imersivă 3D cu ghidare vocală îmbunătățită
12.03.2026
14:21
451
Group14 deschide în Coreea de Sud o fabrică de materiale pentru baterii cu încărcare „flash” destinate vehiculelor electrice
12.03.2026
12:36
498
UE sprijină modernizarea Poliției Naționale: digitalizare, echipamente moderne și extinderea cooperării în domeniul ADN
12.03.2026
12:31
473
Google transformă milioane de articole de presă în hartă globală de avertizare la viituri rapide
12.03.2026
12:24
576
Schema de deposedare a bunurilor de 12 milioane de lei scoasă la iveală: percheziții PA și CNA și două rețineri
12.03.2026
11:36
1495
Dodon vrea să „SALVEZE” R. Moldova cu ajutorul lui Putin, după ce Rusia a TĂIAT în 2023 gazul pentru malul drept al Nistrului: „Sunt gata să discut cu Moscova pentru a găsi resurse energetice și produse petroliere…”
12.03.2026
11:07
509
Tânără de 25 de ani, condamnată la 9 ani și jumătate de închisoare pentru două jafuri comise în Chișinău
12.03.2026
10:41
718
VIDEO // Ion Ceban a „REZOLVAT” toate problemele Chișinăului, iar acum a luat la pas benzinăriile din capitală în timpul orelor de serviciu. Edilul INTERZIS în UE cere MOTORINĂ de la Guvern, Parlament și Președinție
12.03.2026
09:31
638
Rețea de droguri pe Telegram, destructurată la Chișinău: doi tineri de 25 și 29 de ani, condamnați la ani grei de închisoare
12.03.2026
08:13
574
Horoscopul zilei 12.03.2026
624
Ofcom și autoritatea pentru date cer rețelelor sociale să înăsprească verificarea vârstei copiilor sub 13 ani în Marea Britanie
11.03.2026
22:44
685
NTSB indică neatenția șoferilor și limite ale sistemului Ford BlueCruise în două accidente mortale din SUA
11.03.2026
21:47
726
Gigantul medical american Stryker, paralizat la nivel global de un atac revendicat de hackeri pro-iranieni Handala
11.03.2026
21:16
643
ULTIMA ORĂ // O nouă MEDALIE pentru R. Moldova. Luptătorul Alexandru Borș a cucerit medalia de bronz la Campionatul European U-23 din Serbia
11.03.2026
20:58
626
Scădere ușoară de temperatură și dimineți cu ceață în Republica Moldova, joi 12.03.2026
ULTIMA ORĂ // O nouă MEDALIE pentru R. Moldova. Luptătorul Alexandru Borș a cucerit medalia de bronz la Campionatul European U-23 din Serbia
Guvernul extinde până în 2026 facilitățile de rambursare a TVA și pregătește restituirea integrală a accizei la motorina pentru lucrările agricole de primăvară
1 MDL
1 EUR
20.04
1 USD
17.28
1 RON
3.94
1 RUB
0.22
1 UAH
0.39


Inapoi














