Startupul Guide Labs lansează Steerling-8B, primul LLM open‑source cu trasabilitate completă a fiecărui token în datele de antrenament
599
Una dintre cele mai mari provocări în lucrul cu modelele de deep learning este înțelegerea motivului pentru care acestea acționează într-un anumit fel. Fie că este vorba despre eforturile repetate de a ajusta politicile bizare ale anumitor modele, despre tendința altora spre lingușire sau despre halucinațiile obișnuite, explorarea unui rețele neuronale cu miliarde de parametri nu este deloc ușoară.
Guide Labs, un start-up din San Francisco fondat de CEO-ul Julius Adebayo și chief science officer Aya Abdelsalam Ismail, propune acum o soluție. Luni, compania a open-sourc‑at un LLM de 8 miliarde de parametri, Steerling-8B, antrenat cu o arhitectură nouă, concepută pentru a face acțiunile modelului ușor de interpretat: fiecare token produs de model poate fi urmărit înapoi până la originea sa în datele de antrenament ale LLM-ului.
Această trasabilitate poate fi utilizată în moduri simple, precum identificarea materialelor de referință la care modelul a apelat pentru anumite fapte. Sau poate servi unor analize mult mai complexe, cum ar fi înțelegerea modului în care modelul „înțelege” umorul ori genul.
„If I have a trillion ways to encode gender, and I encode it in 1 billion of the 1 trillion things that I have, you have to make sure you find all those 1 billion things that I’ve encoded, and then you have to be able to reliably turn that on, turn them off,” a explicat Adebayo. „You can do it with current models, but it’s very fragile … It’s sort of one of the holy grail questions.”
Adebayo a început această muncă în timpul doctoratului la MIT, fiind coautor al unui studiu din 2020, foarte citat, care arăta că metodele existente de interpretare a modelelor de deep learning nu sunt fiabile. Lucrarea respectivă a dus în timp la o nouă abordare în construirea LLM-urilor: dezvoltatorii introduc un „concept layer” în model, care grupează datele în categorii ușor de urmărit.
Această abordare cere mai mult efort de anotare a datelor la început. Însă, folosind alte modele de inteligență artificială pentru a ajuta în acest proces, echipa a reușit să antreneze Steerling-8B ca cel mai mare proof of concept de până acum.
„The kind of interpretability people do is… neuroscience on a model, and we flip that,” spune Adebayo. „What we do is actually engineer the model from the ground up so that you don’t need to do neuroscience.”
Există totuși o îngrijorare: o astfel de arhitectură ar putea elimina unele dintre comportamentele emergente care fac LLM-urile atât de interesante, precum capacitatea lor de a generaliza în moduri neașteptate asupra unor lucruri pentru care nu au fost antrenate direct. Adebayo susține că aceste fenomene apar în continuare în modelul companiei. Echipa sa urmărește ceea ce numește „discovered concepts” – concepte descoperite autonom de model, cum ar fi calculul cuantic.
Adebayo argumentează că această arhitectură interpretabilă va deveni necesară pentru toată lumea. Pentru LLM-urile orientate către consumatori, tehnicile de acest fel ar trebui să permită dezvoltatorilor să blocheze, de exemplu, folosirea materialelor protejate de drepturi de autor sau să controleze mai bine răspunsurile privind subiecte sensibile, cum ar fi violența sau abuzul de droguri. În industriile reglementate va fi nevoie de LLM-uri mult mai controlabile; de pildă în finanțe, unde un model ce evaluează solicitanți de credite trebuie să ia în calcul istoricul financiar, dar nu rasa.
Există și o nevoie majoră de interpretabilitate în cercetarea științifică, un alt domeniu în care Guide Labs a dezvoltat tehnologie. Deși plierea proteinelor este un mare succes al modelelor de deep learning, oamenii de știință au nevoie de mai multă transparență în ceea ce privește motivele pentru care software-ul identifică anumite combinații ca fiind de succes.
„This model demonstrates is that training interpretable models is no longer a sort of science; it’s now an engineering problem,” afirmă Adebayo. „We figured out the science and we can scale them, and there is no reason why this kind of wouldn’t match the performance of the frontier level models,” care au mult mai mulți parametri.
Guide Labs susține că Steerling-8B poate atinge aproximativ 90% din capabilitățile modelelor existente, dar folosește mai puține date de antrenament datorită arhitecturii sale nou‑introduse. Următorul pas pentru companie, care a ieșit din Y Combinator și a strâns în noiembrie 2024 o finanțare seed de 9 milioane de dolari de la Initialized Capital, este dezvoltarea unui model mai mare și începerea oferirii de acces prin API și agenți pentru utilizatori.
„The way we’re current training models is super primitive, and so democratizing inherent interpretability is actually going to be a long term good thing for our our within the human race,” a declarat Adebayo. „As we’re going after these models that are going to be super intelligent, you don’t want something to be making decisions on your behalf that’s sort of mysterious to you.”
23.04.2026
23:55
335
Șeful propus de Trump pentru agenția americană de securitate cibernetică CISA își retrage candidatura, instituția rămâne fără conducere permanentă
23.04.2026
23:40
445
Moldova și Regatul Unit întăresc cooperarea economică și strategică la a 5-a reuniune a Dialogului Strategic de la Londra
23.04.2026
23:04
400
OpenAI lansează GPT-5.5, noul model de inteligență artificială care apropie compania de „superaplicația” AI unificată
23.04.2026
21:47
456
ULTIMA ORĂ // Halterofilul Marin Robu cucerește AURUL european și stabilește un nou record continental
23.04.2026
20:29
494
Vremea în Republica Moldova se răcorește ușor vineri, 24 aprilie 2026
23.04.2026
20:01
470
X renunță la funcția Communities din cauza utilizării reduse și a exploziei de spam, mizând pe group chat și cronologii personalizate
23.04.2026
17:48
508
Greva anunțată la Samsung riscă să agraveze criza globală de cipuri de memorie
23.04.2026
17:44
595
Tesla renunță la pachetul salarial interimar de 29 de miliarde pentru Musk după restabilirea mega-recompensei de 56 de miliarde de dolari
23.04.2026
17:18
587
ULTIMA ORĂ // Proiect de importanță NAȚIONALĂ. În pofida crizei politice, Guvernul României declanșează exproprierile pentru linia electrică Suceava – Bălți
23.04.2026
16:30
549
Criza globală de GPU se adâncește: vânătorii de galaxii cu inteligență artificială sufocă resursele universităților
23.04.2026
23:55
304
Șeful propus de Trump pentru agenția americană de securitate cibernetică CISA își retrage candidatura, instituția rămâne fără conducere permanentă
23.04.2026
23:40
415
Moldova și Regatul Unit întăresc cooperarea economică și strategică la a 5-a reuniune a Dialogului Strategic de la Londra
23.04.2026
23:04
374
OpenAI lansează GPT-5.5, noul model de inteligență artificială care apropie compania de „superaplicația” AI unificată
23.04.2026
21:47
434
ULTIMA ORĂ // Halterofilul Marin Robu cucerește AURUL european și stabilește un nou record continental
23.04.2026
20:29
475
Vremea în Republica Moldova se răcorește ușor vineri, 24 aprilie 2026
23.04.2026
20:01
449
X renunță la funcția Communities din cauza utilizării reduse și a exploziei de spam, mizând pe group chat și cronologii personalizate
23.04.2026
17:48
493
Greva anunțată la Samsung riscă să agraveze criza globală de cipuri de memorie
23.04.2026
17:44
577
Tesla renunță la pachetul salarial interimar de 29 de miliarde pentru Musk după restabilirea mega-recompensei de 56 de miliarde de dolari
23.04.2026
17:18
570
ULTIMA ORĂ // Proiect de importanță NAȚIONALĂ. În pofida crizei politice, Guvernul României declanșează exproprierile pentru linia electrică Suceava – Bălți
23.04.2026
16:30
532
Criza globală de GPU se adâncește: vânătorii de galaxii cu inteligență artificială sufocă resursele universităților
23.04.2026
15:53
524
Furnizori de supraveghere, prin companii „fantomă”, acuzați că abuzează de accesul la rețelele telecom globale pentru a spiona și localiza utilizatori de telefonie mobilă
23.04.2026
15:10
576
Meta le permite părinților să vadă ce discută adolescenții lor cu Meta AI pe Facebook, Messenger și Instagram
23.04.2026
13:27
637
„Hexagonul Facultăților de Drept” reunește la Chișinău 200 de studenți din Republica Moldova și România
23.04.2026
12:55
608
Reguli noi pentru școlile private: sistem unitar de autorizare, acreditare și certificare a calității
23.04.2026
11:10
763
Bătrân de 84 de ani, condamnat la 20 de ani de închisoare pentru violarea repetată a unei fete de 12 ani
23.04.2026
10:50
703
Cinci școli din Republica Moldova își transformă managementul educațional prin programul „Școala Viitorului”
23.04.2026
10:40
687
PERCHEZIȚII // Șor la adăpost, subalternii rămân să răspundă: 26 de „pioni”, inclusiv PRIMARI, consilieri raionali și locali, cercetați penal în dosarele privind corupere electorală și finanțare ilegală a partidelor politice
23.04.2026
08:26
644
Piața aplicațiilor din India explodează, dar grosul banilor ajunge la giganții globali
23.04.2026
08:00
800
Horoscopul zilei 23.04.2026
23.04.2026
03:29
807
Tesla își urcă investițiile la 25 de miliarde de dolari pentru 2026, pariază masiv pe AI, roboți și Optimus
23.04.2026
02:50
807
Elon Musk recunoaște că milioane de șoferi Tesla au nevoie de upgrade hardware pentru adevăratul Full Self-Driving
23.04.2026
02:29
816
Google transformă Workspace într-un „intern” digital: noul Workspace Intelligence automatizează munca de birou cu Gemini
23.04.2026
00:21
897
Veniturile Tesla urcă în T1 pe fondul vânzărilor de mașini electrice și al boomului de abonamente FSD, în pofida livrărilor sub așteptări
23.04.2026
00:09
874
SpaceX își întărește profilul de gigant AI: cum a blocat finanțarea de 2 miliarde a Cursor cu o ofertă de preluare de 60 de miliarde de dolari
22.04.2026
23:27
709
Misiunea Artemis II demonstrează că internetul spațiu–Pământ prin laser poate fi extins ieftin la scară globală
Șeful propus de Trump pentru agenția americană de securitate cibernetică CISA își retrage candidatura, instituția rămâne fără conducere permanentă
Moldova și Regatul Unit întăresc cooperarea economică și strategică la a 5-a reuniune a Dialogului Strategic de la Londra
OpenAI lansează GPT-5.5, noul model de inteligență artificială care apropie compania de „superaplicația” AI unificată
Vremea în Republica Moldova se răcorește ușor vineri, 24 aprilie 2026
1 MDL
1 EUR
20.28
1 USD
17.36
1 RON
3.98
1 RUB
0.23
1 UAH
0.40


Inapoi














