huggingface · stevhliu · Jun 4, 2025 · Dec 28, 2024 · Jan 1, 2025 · Jan 2, 2025
diff --git a/chapters/rum/_toctree.yml b/chapters/rum/_toctree.yml
@@ -26,3 +26,25 @@
   - local: chapter1/10
     title: Quiz de final de capitol
     quiz: 1
+
+- title: 7. Sarcini clasice NLP
+  sections:
+  - local: chapter7/1
+    title: Introducere
+  - local: chapter7/2
+    title: Clasificarea tokenilor
+  - local: chapter7/3
+    title: Fine-tuningul la un model de limbaj mascat
-    title: Fine-tuningul la un model de limbaj mascat
+    title: Fine-tuningul unui model de limbaj mascat
-    title: Fine-tuningul la un model de limbaj mascat
+    title: Fine-tuningul unui model de limbaj mascat
+  - local: chapter7/4
+    title: Traducere
+  - local: chapter7/5
+    title: Sumarizare
+  - local: chapter7/6
+    title: Antrenarea de la zero a unui model de limbaj cauzal
+  - local: chapter7/7
+    title: Răspuns la întrebări
+  - local: chapter7/8
+    title: Înțelegerea LLM-urilor
+  - local: chapter7/9
+    title: Quiz de sfârșit de capitol
+    quiz: 7
diff --git a/chapters/rum/chapter7/1.mdx b/chapters/rum/chapter7/1.mdx
@@ -0,0 +1,38 @@
+<FrameworkSwitchCourse {fw} />
+
+# Introducere[[introduction]]
+
+<CourseFloatingBanner
+    chapter={7}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+În [Capitolul 3](/course/chapter3), ați văzut cum să faceți fine-tune unui model pentru clasificarea textului. În acest capitol, vom aborda următoarele sarcini NLP:
+
+- Clasificarea tokenilor
+- Masked language modeling (precum BERT)
+- Sumarizare
+- Traducere
+- Preantrenare pentru causal language modeling (precum GPT-2)
- Preantrenare pentru causal language modeling (precum GPT-2)
+- Preantrenare pentru `causal language modeling` (precum GPT-2)
- Preantrenare pentru causal language modeling (precum GPT-2)
+- Preantrenare pentru `causal language modeling` (precum GPT-2)
+- Răspunderea la întrebări
- Răspunderea la întrebări
+- Răspunsul la întrebări
- Răspunderea la întrebări
+- Răspunsul la întrebări
+
+{#if fw === 'pt'}
+
+Pentru a face acest lucru, va trebui să valorificați tot ceea ce ați învățat despre API-ul `Trainer` și biblioteca 🤗 Accelerate în [Capitolul 3](/course/chapter3), biblioteca 🤗 Datasets în [Capitolul 5](/course/chapter5) și biblioteca 🤗 Tokenizers în [Capitolul 6](/course/chapter6). De asemenea, vom încărca rezultatele noastre în Model Hub, așa cum am făcut în [Capitolul 4](/course/chapter4), astfel încât acesta este cu adevărat capitolul în care totul se unește!
+
+Fiecare secțiune poate fi citită independent și vă va arăta cum să antrenați un model cu API-ul `Trainer` sau cu propria buclă de antrenament, utilizând 🤗 Accelerate. Nu ezitați să săriți peste oricare dintre cele două părți și să vă concentrați pe cea care vă interesează cel mai mult: API-ul `Trainer` este excelent pentru fine-tuning sau antrenarea modelului vostru fără a vă face griji cu privire la ceea ce se întâmplă în spatele scenei, în timp ce bucla de antrenament cu `Accelerate` vă va permite să personalizați mai ușor orice parte doriți.
+
+{:else}
+
+Pentru a face acest lucru, va trebui să valorificați tot ceea ce ați învățat despre API-ul `Trainer` și biblioteca 🤗 Accelerate în [Capitolul 3](/course/chapter3), biblioteca 🤗 Datasets în [Capitolul 5](/course/chapter5) și biblioteca 🤗 Tokenizers în [Capitolul 6](/course/chapter6). De asemenea, vom încărca rezultatele noastre în Model Hub, așa cum am făcut în [Capitolul 4](/course/chapter4), astfel încât acesta este cu adevărat capitolul în care totul se unește!
+
+Fiecare secțiune poate fi citită independent.
+
+{/if}
+
+
+<Tip>
+
+Dacă citiți secțiunile în succesiune, veți observa că acestea au destul de mult cod și proză în comun. Repetarea este intenționată, pentru a vă permite să intrați (sau să reveniți mai târziu) la orice sarcină care vă interesează și să găsiți un exemplu.
+
+</Tip>
diff --git a/chapters/rum/chapter7/2.mdx b/chapters/rum/chapter7/2.mdx
diff --git a/chapters/rum/chapter7/3.mdx b/chapters/rum/chapter7/3.mdx
diff --git a/chapters/rum/chapter7/4.mdx b/chapters/rum/chapter7/4.mdx
diff --git a/chapters/rum/chapter7/5.mdx b/chapters/rum/chapter7/5.mdx
diff --git a/chapters/rum/chapter7/6.mdx b/chapters/rum/chapter7/6.mdx
diff --git a/chapters/rum/chapter7/7.mdx b/chapters/rum/chapter7/7.mdx
diff --git a/chapters/rum/chapter7/8.mdx b/chapters/rum/chapter7/8.mdx
@@ -0,0 +1,34 @@
+# Înțelegerea LLM-urilor[[mastering-llms]]
+
+<CourseFloatingBanner
+    chapter={7}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+Dacă ați ajuns până aici în curs, felicitări – acum aveți toate cunoștințele și instrumentele necesare pentru a aborda (aproape) orice sarcină de procesare a limbajului cu 🤗 Transformers și ecosistemul Hugging Face!
+
+## De la NLP la LLM-uri
+
+Deși am acoperit multe sarcini tradiționale de NLP în acest curs, domeniul a fost revoluționat de Modelele Mari de Limbaj (LLM-uri). Aceste modele au extins dramatic ceea ce este posibil în procesarea limbajului:
+
+- Pot gestiona mai multe sarcini fără fine-tuning specific pentru fiecare sarcină
+- Excelează la urmarea instrucțiunilor și adaptarea la contexte diferite
+- Pot genera text coerent și adecvat contextului pentru diverse aplicații
+- Pot realiza raționamente și rezolva probleme complexe prin tehnici precum chain-of-thought prompting
+
+Abilitățile fundamentale de NLP pe care le-ați învățat sunt în continuare esențiale pentru a lucra eficient cu LLM-urile. Înțelegerea tokenizării, a arhitecturilor de modele, a metodelor de fine-tuning și a metricilor de evaluare vă oferă cunoștințele necesare pentru a valorifica la maximum potențialul LLM-urilor.
+
+Am văzut o mulțime de data collators, așa că am făcut acest mic videoclip pentru a vă ajuta să găsiți cel pe care să îl utilizați pentru fiecare sarcină:
+
+<Youtube id="-RPeakdlHYo"/>
+
+După finalizarea acestui tur fulger prin sarcinile de bază ale procesării limbajului, ar trebui să:
+
+* Știți care arhitecturi (encoder, decoder sau encoder-decoder) sunt cele mai potrivite pentru fiecare sarcină
+* Înțelegeți diferența dintre preantrenarea și fine-tuning-ul unui model lingvistic
+* Știți cum să antrenați modele Transformer folosind fie API-ul `Trainer` și funcționalitățile de antrenare distribuită ale 🤗 Accelerate, fie TensorFlow și Keras, în funcție de traseul pe care l-ați urmat
+* Înțelegeți semnificația și limitele metricilor precum ROUGE și BLEU pentru sarcinile de generare de text
+* Știți cum să interacționați cu modelele voastre ajustate, atât pe Hub, cât și folosind `pipeline` din 🤗 Transformers
+* Să apreciați modul în care LLM-urile se bazează pe și extind tehnicile tradiționale de NLP
+
+În ciuda tuturor acestor cunoștințe, va veni un moment în care fie veți întâlni un bug dificil în codul vostru, fie veți avea o întrebare despre cum să rezolvați o anumită problemă de procesare a limbajului. Din fericire, comunitatea Hugging Face este aici pentru a vă ajuta! În ultimul capitol al acestei părți a cursului, vom explora cum puteți depana modelele Transformer și cum puteți solicita ajutor în mod eficient.