Imaginează-ți că trebuie să scrii un program care să distingă o pisică de un câine. Cum ai face-o? Ai putea scrie ceva de genul: dacă are urechi ascuțite și mieunat, e pisică; dacă e mai mare și latră, e câine. Simplu, nu? Dar ce faci cu pisicile Scottish Fold care au urechile pliate? Cu câinii Chihuahua mai mici decât unele pisici? Cu pozele întunecate, cu unghiurile ciudate, cu rasele exotice? Lista de excepții crește exponențial, iar programul devine un coșmar de if/else-uri. Exact această problemă a motivat apariția machine learning-ului — și, în cele din urmă, a inteligenței artificiale moderne.

Programarea clasică: spunem computerului ce să facă

Timp de decenii, programarea a funcționat simplu: omul scria reguli explicite, computerul le executa. Vrei să sortezi o listă? Scrii un algoritm de sortare. Vrei să calculezi TVA-ul? Scrii formula. Aceasta este programarea bazată pe reguli — utilă, predictibilă, controlabilă. Funcționează perfect atunci când problema poate fi descrisă complet prin reguli logice.

Problema apare când regulile sunt prea complexe sau prea implicite. Cum descrii în reguli explicite ce face o față umană să pară tristă? Cum codezi instinctul unui jucător de șah expert care „simte" că o mutare e greșită? Cum exprimi în if/else-uri diferența de stil între Eminescu și Arghezi? Aceste lucruri le facem natural, dar nu le putem articula complet. Și ceea ce nu putem articula, nu putem programa în mod tradițional.

Întoarcerea perspectivei: machine learning

Machine learning inversează logica. În loc să scriem noi regulile și să le dăm computerului, îi dăm computerului exemple și îl lăsăm să găsească singur regulile. Îi arăți 100.000 de poze cu pisici și 100.000 de poze cu câini, îi spui care e care, și algoritmul extrage singur tiparele care le diferențiază.

Aceasta e schimbarea de paradigmă fundamentală. Nu mai programezi soluția — programezi un sistem care învață soluția din date. Termenul tehnic pentru ce încearcă modelul să găsească sunt parametrii — valorile numerice care, odată ajustate corect, permit sistemului să facă predicții bune pe date noi, nevăzute anterior.

CriteriuProgramare clasicăMachine Learning
IntrareDate + ReguliDate + Răspunsuri corecte
IeșireRăspunsuriReguli (parametrii modelului)
Potrivit pentruProbleme bine definiteProbleme complexe, cu multe variabile
ExempluCalculator TVA, sortare listăRecunoaștere facială, traducere

Neuronul artificial — blocul de construcție de bază

Rețelele neurale s-au inspirat vag din biologie: creierul uman are aproximativ 86 de miliarde de neuroni, fiecare conectat cu mii de alți neuroni. Un neuron biologic primește semnale electrice prin dendrite, le procesează și, dacă suma depășește un prag, trimite un semnal prin axon mai departe. Rețelele neurale artificiale mimează această logică, dar la nivel matematic, nu biologic.

Un neuron artificial (sau perceptron) face trei lucruri simple: primește câteva valori numerice de intrare, le înmulțește pe fiecare cu un weight (o pondere care reflectă importanța acelei intrări), adună totul și aplică o funcție de activare care decide dacă neuronul „se activează" sau nu. Dacă vrem să clasificăm un email ca spam, intrările pot fi: numărul de cuvinte de tip „ofertă urgentă", prezența unor domenii suspecte, lungimea subiectului. Weighturile determină cât de mult contează fiecare factor.

Straturile: de la simplu la complex

Un singur neuron poate rezolva probleme liniare simple, dar lumea reală e nelineară și plină de nuanțe. Soluția: conectăm mai mulți neuroni în straturi. O rețea neurală tipică are:

  • Stratul de intrare — primește datele brute (pixelii unei imagini, tokenurile unui text)
  • Straturile ascunse (hidden layers) — procesează și transformă datele, extrag trăsături din ce în ce mai abstracte
  • Stratul de ieșire — produce răspunsul final (probabilitățile că e pisică vs câine)

Ce e fascinant e ce se întâmplă în straturile ascunse. Dacă vizualizezi ce „vede" fiecare strat al unei rețele de recunoaștere a imaginilor, primul strat detectează muchii și culori simple, al doilea combină muchiile în texturi și forme, al treilea recunoaște ochi, urechi, blană. Fiecare strat construiește o abstracție mai sofisticată pe baza celui anterior — exact cum și noi înțelegem lumea în niveluri de complexitate crescătoare.

Cum „învață" rețeaua — backpropagation explicat fără formule

Antrenarea unei rețele neurale funcționează prin erori și corecții repetate. Procesul are trei pași care se repetă de milioane de ori:

  1. Forward pass: rețeaua primește un exemplu (o poză cu pisică), face o predicție (ex: 30% pisică, 70% câine — greșit)
  2. Calculul erorii: un număr (loss) măsoară cât de greșit a fost răspunsul
  3. Backward pass (backpropagation): eroarea se propagă înapoi prin rețea, ajustând fiecare weight proporțional cu cât a contribuit la greșeală

Ajustarea weighturilor urmează gradient descent: imaginează-ți că ești pe un munte și vrei să cobori în vale (să minimizezi eroarea). La fiecare pas, verifici panta terenului și faci un pas în direcția cea mai abruptă în jos. Repetând asta de milioane de ori pe milioane de exemple, rețeaua ajunge treptat la o configurație de weightări care funcționează bine.

Revoluția din 2012: când deep learning a explodat

Rețelele neurale existau din anii '50, dar timp de decenii au rămas o curiozitate academică. Ce s-a schimbat în 2012? Trei lucruri au coincis: date masive (ImageNet — 14 milioane de imagini etichetate), putere de calcul (GPU-urile NVIDIA, proiectate pentru gaming, s-au dovedit perfecte pentru antrenarea rețelelor neurale) și algoritmi mai buni (funcții de activare mai eficiente, tehnici de regularizare).

În 2012, o rețea numită AlexNet, creată de Geoffrey Hinton și studenții săi, a câștigat competiția ImageNet cu o marjă șocantă: 15,3% eroare față de 26,2% a celui mai bun sistem anterior. Comunitatea de computer vision a realizat că rețelele neurale adânci — deep learning, unde „deep" înseamnă pur și simplu că ai mai multe straturi ascunse — sunt o schimbare de paradigmă, nu o îmbunătățire marginală.

De atunci, deep learning a cucerit rând pe rând toate domeniile: recunoaștere vocală (2015), jocul de Go (AlphaGo, 2016), traducere automată (2017), generare de text (GPT, 2018), generare de imagini (DALL-E, 2021), și continuă să avanseze într-un ritm fără precedent în istoria informaticii.

Ce vede de fapt o rețea neurală

Una dintre cele mai contraintuitive descoperiri din cercetarea deep learning este că rețelele antrenate pe imagini dezvoltă, spontan, detectoare de trăsături vizuale ierarhice — fără ca nimeni să le fi programat explicit. Primul strat al unei rețele de recunoaștere a imaginilor detectează în mod natural muchii orientate în diferite direcții. Al doilea strat combină aceste muchii în curbe și colțuri. Straturile mai adânci recunosc ochi, botoșei, blănuri, roți — în funcție de ce a văzut rețeaua la antrenare.

Acest lucru sugerează ceva profund: ierarhia de trăsături nu e o invenție umană introdusă în algoritm, ci o structură care emerge natural din date, atunci când antrenezi o rețea suficient de adâncă pe suficiente exemple. E una dintre marile surprize ale deep learning-ului — și una care a aprins dezbaterile despre dacă aceste rețele „înțeleg" cu adevărat ceva sau doar memorează pattern-uri sofisticate.

De la imagini la cuvinte — ce urmează în episodul 2

Rețelele neurale convoluționale (CNN) au revoluționat viziunea computerizată. Dar limbajul natural e o provocare diferită și mai complexă: e secvențial, contextual, ambiguu prin definiție. Cuvântul „bancă" poate fi mobilier sau instituție financiară — contextul decide. Cum construiești o rețea care „înțelege" contextul? Răspunsul a venit în 2017 odată cu o arhitectură numită Transformer — și a dus direct la ChatGPT, Claude și Gemini. Asta explorăm în episodul următor.

🤖 Inteligență Artificială
← Toate articolele
🤖
Serie de articole
Inteligența Artificială
Vezi toate →
1 Cum gândește un calculator: de la reguli la rețele neurale Acum citești
2 Ce este un LLM și cum știe să răspundă 3 ChatGPT, Claude, Gemini — comparație și când să folosești ce 4 AI care generează imagini și video: Midjourney, DALL-E, Sora 5 AI în locul de muncă — ce joburi se schimbă și cum 6 Cum nu te păcălești: halucinații, deepfakes și dezinformare AI 7 EU AI Act și reglementarea globală a inteligenței artificiale 8 AGI, superinteligență și viitorul pe termen lung al AI
Ep.2: Ce este un LLM și cum știe să răspundă… →
💬 Comentarii

Fii primul care comentează acest articol!

✍️ Lasă un comentariu
5 + 5 = ?