From 6b0cb4865fdb5c6ef2f7a72ef1380a19110691e8 Mon Sep 17 00:00:00 2001
From: "ludmila.friptu" <ludmila.friptu@iucosoft.com>
Date: Sat, 28 Sep 2024 20:30:02 +0300
Subject: [PATCH 001/167] Add chapter1 with file1 rom

---
 chapters/rum/chapter1/1.mdx | 0
 1 file changed, 0 insertions(+), 0 deletions(-)
 create mode 100644 chapters/rum/chapter1/1.mdx
diff --git a/chapters/rum/chapter1/1.mdx b/chapters/rum/chapter1/1.mdx
new file mode 100644
index 000000000..e69de29bb

From af5d9a5a399a37bb401b3f4a9eec39fa1e7319e1 Mon Sep 17 00:00:00 2001
From: "ludmila.friptu" <ludmila.friptu@iucosoft.com>
Date: Sat, 28 Sep 2024 20:35:57 +0300
Subject: [PATCH 002/167] Add file1 with content

---
 chapters/rum/chapter1/1.mdx | 211 ++++++++++++++++++++++++++++++++++++
 1 file changed, 211 insertions(+)

diff --git a/chapters/rum/chapter1/1.mdx b/chapters/rum/chapter1/1.mdx
index e69de29bb..4e00b799a 100644
--- a/chapters/rum/chapter1/1.mdx
+++ b/chapters/rum/chapter1/1.mdx
@@ -0,0 +1,211 @@
+# Introducere[[introduction]]
+
+<CourseFloatingBanner
+    chapter={1}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+## Bun venit la 🤗 curs![[bun-venit-la-curs]]
+
+<Youtube id="00GKzGyWFEs" />
+Acest curs vă va învăța despre procesarea limbajelor naturale (NLP) folosind biblioteci din [Hugging Face](https://huggingface.co/) ecosystem — [🤗 Transformers](https://github.com/huggingface/transformers), [🤗 Datasets](https://github.com/huggingface/datasets), [🤗 Tokenizers](https://github.com/huggingface/tokenizers), and [🤗 Accelerate](https://github.com/huggingface/accelerate) — precum și [Hugging Face Hub](https://huggingface.co/models).Este complet gratuit și nu conține reclame.
+
+## La ce să te aștepți?[[la-ce-sa-te-aștepți]]
+
+Aceasta este o scurtă prezentare a cursului:
+
+<div class="flex justify-center">
+<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/summary.svg" alt="Brief overview of the chapters of the course.">
+<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/summary-dark.svg" alt="Brief overview of the chapters of the course.">
+</div>
+
+- Capitolele 1-4 oferă o introducere în conceptele fundamentale ale bibliotecii 🤗 Transformers. Până la sfârșitul acestei părți a cursului, veți fi familiarizați cu modul în care funcționează modelele Transformer și veți ști cum să utilizați un model din [Hugging Face Hub](https://huggingface.co/models), să îl ajustați pe un set de date și să vă partajați rezultatele pe Hub!
+- # Introducere[[introduction]]
+
+<CourseFloatingBanner
+    chapter={1}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+## Bun venit la 🤗 curs![[bun-venit-la-curs]]
+
+<Youtube id="00GKzGyWFEs" />
+Acest curs vă va învăța despre procesarea limbajelor naturale (NLP) folosind biblioteci din [Hugging Face](https://huggingface.co/) ecosystem — [🤗 Transformers](https://github.com/huggingface/transformers), [🤗 Datasets](https://github.com/huggingface/datasets), [🤗 Tokenizers](https://github.com/huggingface/tokenizers), and [🤗 Accelerate](https://github.com/huggingface/accelerate) — precum și [Hugging Face Hub](https://huggingface.co/models).Este complet gratuit și nu conține reclame.
+
+## La ce să te aștepți?[[la-ce-sa-te-aștepți]]
+
+Aceasta este o scurtă prezentare a cursului:
+
+<div class="flex justify-center">
+<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/summary.svg" alt="Brief overview of the chapters of the course.">
+<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/summary-dark.svg" alt="Brief overview of the chapters of the course.">
+</div>
+
+- Capitolele 1-4 oferă o introducere în conceptele fundamentale ale bibliotecii 🤗 Transformers. Până la sfârșitul acestei părți a cursului, veți fi familiarizați cu modul în care funcționează modelele Transformer și veți ști cum să utilizați un model din [Hugging Face Hub](https://huggingface.co/models), să îl ajustați pe un set de date și să vă partajați rezultatele pe Hub!
+- Capitolele 5-8 predau elementele de bază ale Datasets 🤗 și ale Tokenizerelor 🤗 înainte de a vă scufunda în sarcinile NLP. Până la sfârșitul acestei părți, veți fi capabil să abordați singur cele mai frecvente probleme NLP.
+- Capitolele 9-12 trec dincolo de NLP și explorează modul în care modelele Transformer pot fi utilizate pentru a aborda sarcini din domeniul procesării semnalelor vorbirii și al viziunii computerizate. Pe parcurs, veți învăța cum să construiți și să partajați demo-uri ale modelelor dumneavoastră și cum să le optimizați pentru mediul de producție. Până la sfârșitul acestei părți, veți fi gata să aplicați 🤗 Transformers la (aproape) orice problemă de machine learning!
+
+Acest curs:
+
+* Necesită o bună cunoaștere a limbajului Python.
+* Este mai bine să fie urmat după un curs introductiv de deep learning, cum ar fi [fast.ai's](https://www.fast.ai/) [Practical Deep Learning for Coders](https://course.fast.ai/) sau unul dintre programele dezvoltate de [DeepLearning.AI](https://www.deeplearning.ai/).
+* Nu se așteaptă la cunoștințe anterioare despre [PyTorch](https://pytorch.org/) sau [TensorFlow](https://www.tensorflow.org/), deși o familiaritate cu oricare dintre acestea va fi de ajutor.
+
+După ce ați completat acest curs, vă recomandăm să accesați [Natural Language Processing Specialization] (https://www.coursera.org/specializations/natural-language-processing?utm_source=deeplearning-ai&utm_medium=institutions&utm_campaign=20211011-nlp-2-hugging_face-page-nlp-refresh) de la DeepLearning.AI, care acoperă o gamă largă de modele NLP clasice, cum ar fi naive Bayes și LSTMs, despre care este bine să știți!
+
+## Cine suntem noi?[[cine-suntem-noi]]
+
+Despre autori:
+
+[**Abubakar Abid**](https://huggingface.co/abidlabs) și-a susținut doctoratul la Stanford în domeniul învățării automate (Machine Learning) aplicate. În timpul doctoratului său, a fondat [Gradio](https://github.com/gradio-app/gradio), o bibliotecă Python open-source care a fost utilizată pentru a construi peste 600.000 de demo-uri de Machine Learning. Gradio a fost achiziționată de Hugging Face, unde Abubakar activează acum ca lider al echipei de Machine Learning.
+
+[**Matthew Carrigan**](https://huggingface.co/Rocketknight1) este inginer de Machine Learning la Hugging Face. Locuiește în Dublin, Irlanda și a lucrat anterior ca inginer ML la Parse.ly și înainte de asta ca cercetător postdoctoral la Trinity College Dublin. El nu crede că vom ajunge la AGI prin scalarea arhitecturilor existente, dar are mari speranțe în ceea ce privește nemurirea roboților.
+
+[**Lysandre Debut**](https://huggingface.co/lysandre) este inginer de Machine Learning la Hugging Face și a lucrat la biblioteca 🤗 Transformers încă din primele etape de dezvoltare. Scopul său este de a face NLP accesibil pentru toată lumea prin dezvoltarea de instrumente cu un API foarte simplu.
+
+[**Sylvain Gugger**](https://huggingface.co/sgugger) este inginer de cercetare în Machine Learning la Hugging Face și unul dintre principalii întreținători ai bibliotecii 🤗 Transformers. Anterior a fost cercetător științific la fast.ai și a fost coautor la _[Deep Learning for Coders with fastai and PyTorch](https://learning.oreilly.com/library/view/deep-learning-for/9781492045519/)_ cu Jeremy Howard. Obiectivul principal al cercetării sale este de a face învățarea profundă mai accesibilă, prin proiectarea și îmbunătățirea tehnicilor care permit modelelor să se antreneze rapid pe resurse limitate.
+
+[**Dawood Khan**](https://huggingface.co/dawoodkhan82) este inginer de Machine Learning la Hugging Face. Este originar din New York și a absolvit Universitatea din New York, unde a studiat Informatica. După ce a lucrat ca inginer iOS timp de câțiva ani, Dawood a demisionat pentru a înființa Gradio împreună cu colegii săi co-fondatori. Gradio a fost în cele din urmă achiziționat de Hugging Face.
+
+[**Merve Noyan**](https://huggingface.co/merve) este un susținător al dezvoltatorilor la Hugging Face, lucrând la dezvoltarea de instrumente și la crearea de conținut în jurul acestora pentru a facilita învățarea automată pentru toată lumea. 
+
+[**Lucile Saulnier**](https://huggingface.co/SaulLu) este inginer de Machine Learning la Hugging Face, dezvoltând și susținând utilizarea de instrumente open source. De asemenea, este implicată activ în multe proiecte de cercetare în domeniul procesării limbajului natural, cum ar fi formarea colaborativă și BigScience.
+
+[**Lewis Tunstall**](https://huggingface.co/lewtun) este inginer de Machine Learning la Hugging Face, concentrându-se pe dezvoltarea de instrumente open-source și pe asigurarea accesibilității acestora pentru întreaga comunitate. De asemenea, este coautor al cărții O'Reilly [Natural Language Processing with Transformers] (https://www.oreilly.com/library/view/natural-language-processing/9781098136789/).
+
+[**Leandro von Werra**](https://huggingface.co/lvwerra) este inginer de Machine Learning în cadrul echipei open-source de la Hugging Face și, de asemenea, coautor al cărții O'Reilly [Natural Language Processing with Transformers] (https://www.oreilly.com/library/view/natural-language-processing/9781098136789/). El are mai mulți ani de experiență în industrie, aducând proiecte NLP în stadiul de producție, lucrând pe întreaga stivă de învățare automată.
+
+## FAQ[[faq]]
+
+Iată câteva răspunsuri la întrebări frecvente:
+
+- **Acest curs permite obținerea unei certificări?**
+Deocamdată nu avem nicio certificare pentru acest curs. Cu toate acestea, lucrăm la un program de certificare pentru ecosistemul Hugging Face - rămâneți pe fază!
+
+- **Cât timp ar trebui să dedic acestui curs?**
+Fiecare capitol din acest curs este conceput pentru a fi parcurs într-o săptămână, cu aproximativ 6-8 ore de lucru pe săptămână. Cu toate acestea, vă puteți lua cât timp aveți nevoie pentru a finaliza cursul.
+
+- **Unde pot să pun o întrebare dacă am una?**
+Dacă aveți o întrebare despre orice secțiune a cursului, faceți clic pe bannerul „*Pune o întrebare*” din partea de sus a paginii pentru a fi redirecționat automat către secțiunea corectă a [[Hugging Face forums](https://discuss.huggingface.co/):
+
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/forum-button.png" alt="Link to the Hugging Face forums" width="75%">
+
+Rețineți că o listă de [idei de proiecte](https://discuss.huggingface.co/c/course/course-event/25) este de asemenea disponibilă pe forumuri dacă doriți să practicați mai mult după ce ați terminat cursul.
+
+- **De unde pot obține codul pentru curs?**
+Pentru fiecare secțiune, faceți clic pe bannerul din partea de sus a paginii pentru a rula codul în Google Colab sau Amazon SageMaker Studio Lab:
+
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/notebook-buttons.png" alt="Link to the Hugging Face course notebooks" width="75%">
+
+Caietele Jupyter care conțin tot codul din curs sunt găzduite în repo-ul [`huggingface/notebooks`](https://github.com/huggingface/notebooks). Dacă doriți să le generați local, consultați instrucțiunile din repo-ul [`course`](https://github.com/huggingface/course#-jupyter-notebooks) de pe GitHub.
+
+
+- **Cum pot contribui la curs?**
+Există multe modalități de a contribui la curs! Dacă găsiți o greșeală de tipar sau o eroare, vă rugăm să creați o cerere în repo-ul [`course`](https://github.com/huggingface/course). Dacă doriți să ajutați la traducerea cursului în limba dumneavoastră maternă, consultați instrucțiunile [aici](https://github.com/huggingface/course#translating-the-course-into-your-language).
+
+- **Care au fost alegerile făcute pentru fiecare traducere?**
+Fiecare traducere are un glosar și un fișier `TRANSLATING.txt` care detaliază alegerile care au fost făcute pentru jargonul de Machine Learning etc. Puteți găsi un exemplu în limba germană [aici](https://github.com/huggingface/course/blob/main/chapters/de/TRANSLATING.txt).
+
+
+- **Pot reutiliza acest curs?**
+Desigur! Cursul este distribuit sub licența [Apache 2 license](https://www.apache.org/licenses/LICENSE-2.0.html) cu caracter permisiv. Aceasta înseamnă că trebuie să acordați creditul corespunzător, să furnizați un link către licență și să indicați dacă au fost făcute modificări. Puteți face acest lucru în orice mod rezonabil, dar nu în niciun fel care să sugereze că licențiatorul vă aprobă pe dumneavoastră sau utilizarea dumneavoastră. Dacă doriți să citați cursul, vă rugăm să utilizați următorul BibTeX:
+
+```
+@misc{huggingfacecourse,
+  author = {Hugging Face},
+  title = {The Hugging Face Course, 2022},
+  howpublished = "\url{https://huggingface.co/course}",
+  year = {2022},
+  note = "[Online; accessed <today>]"
+}
+```
+
+## Let's Go
+Sunteți gata să începeți? În acest capitol, veți învăța:
+
+* Cum să utilizați funcția `pipeline()` pentru a rezolva sarcini NLP precum generarea și clasificarea textului
+* Despre arhitectura Transformer
+* Cum să faceți distincția între arhitecturile și cazurile de utilizare ale codificatorului, decodificatorului și codificatorului-decodificator.
+- Capitolele 9-12 trec dincolo de NLP și explorează modul în care modelele Transformer pot fi utilizate pentru a aborda sarcini din domeniul procesării semnalelor vorbirii și al viziunii computerizate. Pe parcurs, veți învăța cum să construiți și să partajați demo-uri ale modelelor dumneavoastră și cum să le optimizați pentru mediul de producție. Până la sfârșitul acestei părți, veți fi gata să aplicați 🤗 Transformers la (aproape) orice problemă de machine learning!
+
+Acest curs:
+
+* Necesită o bună cunoaștere a limbajului Python.
+* Este mai bine să fie urmat după un curs introductiv de deep learning, cum ar fi [fast.ai's](https://www.fast.ai/) [Practical Deep Learning for Coders](https://course.fast.ai/) sau unul dintre programele dezvoltate de [DeepLearning.AI](https://www.deeplearning.ai/).
+* Nu se așteaptă la cunoștințe anterioare despre [PyTorch](https://pytorch.org/) sau [TensorFlow](https://www.tensorflow.org/), deși o familiaritate cu oricare dintre acestea va fi de ajutor.
+
+După ce ați completat acest curs, vă recomandăm să accesați [Natural Language Processing Specialization] (https://www.coursera.org/specializations/natural-language-processing?utm_source=deeplearning-ai&utm_medium=institutions&utm_campaign=20211011-nlp-2-hugging_face-page-nlp-refresh) de la DeepLearning.AI, care acoperă o gamă largă de modele NLP clasice, cum ar fi naive Bayes și LSTMs, despre care este bine să știți!
+
+## Cine suntem noi?[[cine-suntem-noi]]
+
+Despre autori:
+
+[**Abubakar Abid**](https://huggingface.co/abidlabs) și-a susținut doctoratul la Stanford în domeniul învățării automate (Machine Learning) aplicate. În timpul doctoratului său, a fondat [Gradio](https://github.com/gradio-app/gradio), o bibliotecă Python open-source care a fost utilizată pentru a construi peste 600.000 de demo-uri de Machine Learning. Gradio a fost achiziționată de Hugging Face, unde Abubakar activează acum ca lider al echipei de Machine Learning.
+
+[**Matthew Carrigan**](https://huggingface.co/Rocketknight1) este inginer de Machine Learning la Hugging Face. Locuiește în Dublin, Irlanda și a lucrat anterior ca inginer ML la Parse.ly și înainte de asta ca cercetător postdoctoral la Trinity College Dublin. El nu crede că vom ajunge la AGI prin scalarea arhitecturilor existente, dar are mari speranțe în ceea ce privește nemurirea roboților.
+
+[**Lysandre Debut**](https://huggingface.co/lysandre) este inginer de Machine Learning la Hugging Face și a lucrat la biblioteca 🤗 Transformers încă din primele etape de dezvoltare. Scopul său este de a face NLP accesibil pentru toată lumea prin dezvoltarea de instrumente cu un API foarte simplu.
+
+[**Sylvain Gugger**](https://huggingface.co/sgugger) este inginer de cercetare în Machine Learning la Hugging Face și unul dintre principalii întreținători ai bibliotecii 🤗 Transformers. Anterior a fost cercetător științific la fast.ai și a fost coautor la _[Deep Learning for Coders with fastai and PyTorch](https://learning.oreilly.com/library/view/deep-learning-for/9781492045519/)_ cu Jeremy Howard. Obiectivul principal al cercetării sale este de a face învățarea profundă mai accesibilă, prin proiectarea și îmbunătățirea tehnicilor care permit modelelor să se antreneze rapid pe resurse limitate.
+
+[**Dawood Khan**](https://huggingface.co/dawoodkhan82) este inginer de Machine Learning la Hugging Face. Este originar din New York și a absolvit Universitatea din New York, unde a studiat Informatica. După ce a lucrat ca inginer iOS timp de câțiva ani, Dawood a demisionat pentru a înființa Gradio împreună cu colegii săi co-fondatori. Gradio a fost în cele din urmă achiziționat de Hugging Face.
+
+[**Merve Noyan**](https://huggingface.co/merve) este un susținător al dezvoltatorilor la Hugging Face, lucrând la dezvoltarea de instrumente și la crearea de conținut în jurul acestora pentru a facilita învățarea automată pentru toată lumea. 
+
+[**Lucile Saulnier**](https://huggingface.co/SaulLu) este inginer de Machine Learning la Hugging Face, dezvoltând și susținând utilizarea de instrumente open source. De asemenea, este implicată activ în multe proiecte de cercetare în domeniul procesării limbajului natural, cum ar fi formarea colaborativă și BigScience.
+
+[**Lewis Tunstall**](https://huggingface.co/lewtun) este inginer de Machine Learning la Hugging Face, concentrându-se pe dezvoltarea de instrumente open-source și pe asigurarea accesibilității acestora pentru întreaga comunitate. De asemenea, este coautor al cărții O'Reilly [Natural Language Processing with Transformers] (https://www.oreilly.com/library/view/natural-language-processing/9781098136789/).
+
+[**Leandro von Werra**](https://huggingface.co/lvwerra) este inginer de Machine Learning în cadrul echipei open-source de la Hugging Face și, de asemenea, coautor al cărții O'Reilly [Natural Language Processing with Transformers] (https://www.oreilly.com/library/view/natural-language-processing/9781098136789/). El are mai mulți ani de experiență în industrie, aducând proiecte NLP în stadiul de producție, lucrând pe întreaga stivă de învățare automată.
+
+## FAQ[[faq]]
+
+Iată câteva răspunsuri la întrebări frecvente:
+
+- **Acest curs permite obținerea unei certificări?**
+Deocamdată nu avem nicio certificare pentru acest curs. Cu toate acestea, lucrăm la un program de certificare pentru ecosistemul Hugging Face - rămâneți pe fază!
+
+- **Cât timp ar trebui să dedic acestui curs?**
+Fiecare capitol din acest curs este conceput pentru a fi parcurs într-o săptămână, cu aproximativ 6-8 ore de lucru pe săptămână. Cu toate acestea, vă puteți lua cât timp aveți nevoie pentru a finaliza cursul.
+
+- **Unde pot să pun o întrebare dacă am una?**
+Dacă aveți o întrebare despre orice secțiune a cursului, faceți clic pe bannerul „*Pune o întrebare*” din partea de sus a paginii pentru a fi redirecționat automat către secțiunea corectă a [[Hugging Face forums](https://discuss.huggingface.co/):
+
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/forum-button.png" alt="Link to the Hugging Face forums" width="75%">
+
+Rețineți că o listă de [idei de proiecte](https://discuss.huggingface.co/c/course/course-event/25) este de asemenea disponibilă pe forumuri dacă doriți să practicați mai mult după ce ați terminat cursul.
+
+- **De unde pot obține codul pentru curs?**
+Pentru fiecare secțiune, faceți clic pe bannerul din partea de sus a paginii pentru a rula codul în Google Colab sau Amazon SageMaker Studio Lab:
+
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/notebook-buttons.png" alt="Link to the Hugging Face course notebooks" width="75%">
+
+Caietele Jupyter care conțin tot codul din curs sunt găzduite în repo-ul [`huggingface/notebooks`](https://github.com/huggingface/notebooks). Dacă doriți să le generați local, consultați instrucțiunile din repo-ul [`course`](https://github.com/huggingface/course#-jupyter-notebooks) de pe GitHub.
+
+
+- **Cum pot contribui la curs?**
+Există multe modalități de a contribui la curs! Dacă găsiți o greșeală de tipar sau o eroare, vă rugăm să creați o cerere în repo-ul [`course`](https://github.com/huggingface/course). Dacă doriți să ajutați la traducerea cursului în limba dumneavoastră maternă, consultați instrucțiunile [aici](https://github.com/huggingface/course#translating-the-course-into-your-language).
+
+- **Care au fost alegerile făcute pentru fiecare traducere?**
+Fiecare traducere are un glosar și un fișier `TRANSLATING.txt` care detaliază alegerile care au fost făcute pentru jargonul de Machine Learning etc. Puteți găsi un exemplu în limba germană [aici](https://github.com/huggingface/course/blob/main/chapters/de/TRANSLATING.txt).
+
+
+- **Pot reutiliza acest curs?**
+Desigur! Cursul este distribuit sub licența [Apache 2 license](https://www.apache.org/licenses/LICENSE-2.0.html) cu caracter permisiv. Aceasta înseamnă că trebuie să acordați creditul corespunzător, să furnizați un link către licență și să indicați dacă au fost făcute modificări. Puteți face acest lucru în orice mod rezonabil, dar nu în niciun fel care să sugereze că licențiatorul vă aprobă pe dumneavoastră sau utilizarea dumneavoastră. Dacă doriți să citați cursul, vă rugăm să utilizați următorul BibTeX:
+
+```
+@misc{huggingfacecourse,
+  author = {Hugging Face},
+  title = {The Hugging Face Course, 2022},
+  howpublished = "\url{https://huggingface.co/course}",
+  year = {2022},
+  note = "[Online; accessed <today>]"
+}
+```
+
+## Let's Go
+Sunteți gata să începeți? În acest capitol, veți învăța:
+
+* Cum să utilizați funcția `pipeline()` pentru a rezolva sarcini NLP precum generarea și clasificarea textului
+* Despre arhitectura Transformer
+* Cum să faceți distincția între arhitecturile și cazurile de utilizare ale codificatorului, decodificatorului și codificatorului-decodificatort

From 70ea3206bdbba833eece8c0ef9a18003c6581f33 Mon Sep 17 00:00:00 2001
From: "ludmila.friptu" <ludmila.friptu@iucosoft.com>
Date: Mon, 7 Oct 2024 19:55:30 +0300
Subject: [PATCH 003/167] Add chapter 1 translated

---
 chapters/rum/chapter1/1.mdx  |   2 +-
 chapters/rum/chapter1/10.mdx | 258 +++++++++++++++++++++++++++
 chapters/rum/chapter1/2.mdx  |  26 +++
 chapters/rum/chapter1/3.mdx  | 326 +++++++++++++++++++++++++++++++++++
 chapters/rum/chapter1/4.mdx  | 178 +++++++++++++++++++
 chapters/rum/chapter1/5.mdx  |  22 +++
 chapters/rum/chapter1/6.mdx  |  21 +++
 chapters/rum/chapter1/7.mdx  |  20 +++
 chapters/rum/chapter1/8.mdx  |  31 ++++
 chapters/rum/chapter1/9.mdx  |  16 ++
 10 files changed, 899 insertions(+), 1 deletion(-)
 create mode 100644 chapters/rum/chapter1/10.mdx
 create mode 100644 chapters/rum/chapter1/2.mdx
 create mode 100644 chapters/rum/chapter1/3.mdx
 create mode 100644 chapters/rum/chapter1/4.mdx
 create mode 100644 chapters/rum/chapter1/5.mdx
 create mode 100644 chapters/rum/chapter1/6.mdx
 create mode 100644 chapters/rum/chapter1/7.mdx
 create mode 100644 chapters/rum/chapter1/8.mdx
 create mode 100644 chapters/rum/chapter1/9.mdx

diff --git a/chapters/rum/chapter1/1.mdx b/chapters/rum/chapter1/1.mdx
index 4e00b799a..c4d8a71a3 100644
--- a/chapters/rum/chapter1/1.mdx
+++ b/chapters/rum/chapter1/1.mdx
@@ -1,4 +1,4 @@
-# Introducere[[introduction]]
+# Introducere[[introducere]]
 
 <CourseFloatingBanner
     chapter={1}
diff --git a/chapters/rum/chapter1/10.mdx b/chapters/rum/chapter1/10.mdx
new file mode 100644
index 000000000..3936539e5
--- /dev/null
+++ b/chapters/rum/chapter1/10.mdx
@@ -0,0 +1,258 @@
+<!-- DISABLE-FRONTMATTER-SECTIONS -->
+
+# Quiz de sfârșit de capitol[[test-de-sfârșit-de-capitol]]
+
+<CourseFloatingBanner
+    chapter={1}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+Acest capitol a acoperit o mulțime de subiecte! Nu vă faceți griji dacă nu ați înțeles toate detaliile; capitolele următoare vă vor ajuta să înțelegeți cum funcționează lucrurile în mecanismele lor interne.
+
+Mai întâi, însă, să testăm ceea ce ați învățat în acest capitol!
+
+
+### 1. Explorați Hub-ul și căutați checkpoint-ul `roberta-large-mnli`. Ce sarcină îndeplinește acesta?
+
+
+<Question
+	choices={[
+		{
+			text: "Summarization",
+			explain: "Look again on the <a href=\"https://huggingface.co/roberta-large-mnli\">roberta-large-mnli page</a>."
+		},
+		{
+			text: "Text classification",
+			explain: "More precisely, it classifies if two sentences are logically linked across three labels (contradiction, neutral, entailment) — a task also called <em>natural language inference</em>.",
+			correct: true
+		},
+		{
+			text: "Text generation",
+			explain: "Look again on the <a href=\"https://huggingface.co/roberta-large-mnli\">roberta-large-mnli page</a>."
+		}
+	]}
+/>
+
+### 2. Ce va returna următorul cod?
+
+```py
+from transformers import pipeline
+
+ner = pipeline("ner", grouped_entities=True)
+ner("My name is Sylvain and I work at Hugging Face in Brooklyn.")
+```
+
+<Question
+	choices={[
+		{
+			text: "It will return classification scores for this sentence, with labels \"positive\" or \"negative\".",
+			explain: "This is incorrect — this would be a <code>sentiment-analysis</code> pipeline."
+		},
+		{
+			text: "It will return a generated text completing this sentence.",
+			explain: "This is incorrect — it would be a <code>text-generation</code> pipeline.",
+		},
+		{
+			text: "It will return the words representing persons, organizations or locations.",
+			explain: "Furthermore, with <code>grouped_entities=True</code>, it will group together the words belonging to the same entity, like \"Hugging Face\".",
+			correct: true
+		}
+	]}
+/>
+
+### 3. Ce ar trebui să înlocuiască ... în acest exemplu de cod?
+
+```py
+from transformers import pipeline
+
+filler = pipeline("fill-mask", model="bert-base-cased")
+result = filler("...")
+```
+
+<Question
+	choices={[
+		{
+			text: "This &#60;mask> has been waiting for you.",
+			explain: "This is incorrect. Check out the <code>bert-base-cased</code> model card and try to spot your mistake."
+		},
+		{
+			text: "This [MASK] has been waiting for you.",
+			explain: "Correct! This model's mask token is [MASK].",
+			correct: true
+		},
+		{
+			text: "This man has been waiting for you.",
+			explain: "This is incorrect. This pipeline fills in masked words, so it needs a mask token somewhere."
+		}
+	]}
+/>
+
+### 4. De ce nu va funcționa acest cod?
+
+```py
+from transformers import pipeline
+
+classifier = pipeline("zero-shot-classification")
+result = classifier("This is a course about the Transformers library")
+```
+
+<Question
+	choices={[
+		{
+			text: "This pipeline requires that labels be given to classify this text.",
+			explain: "Right — the correct code needs to include <code>candidate_labels=[...]</code>.",
+			correct: true
+		},
+		{
+			text: "This pipeline requires several sentences, not just one.",
+			explain: "This is incorrect, though when properly used, this pipeline can take a list of sentences to process (like all other pipelines)."
+		},
+		{
+			text: "The 🤗 Transformers library is broken, as usual.",
+			explain: "We won't dignify this answer with a comment!"
+		},
+		{
+			text: "This pipeline requires longer inputs; this one is too short.",
+			explain: "This is incorrect. Note that a very long text will be truncated when processed by this pipeline."
+		}
+	]}
+/>
+
+### 5. Ce înseamnă „învățarea prin transfer”?
+
+<Question
+	choices={[
+		{
+			text: "Transferring the knowledge of a pretrained model to a new model by training it on the same dataset.",
+			explain: "No, that would be two versions of the same model."
+		},
+		{
+			text: "Transferring the knowledge of a pretrained model to a new model by initializing the second model with the first model's weights.",
+			explain: "Correct: when the second model is trained on a new task, it *transfers* the knowledge of the first model.",
+			correct: true
+		},
+		{
+			text: "Transferring the knowledge of a pretrained model to a new model by building the second model with the same architecture as the first model.",
+			explain: "The architecture is just the way the model is built; there is no knowledge shared or transferred in this case."
+		}
+	]}
+/>
+
+### 6. Adevărat sau fals? De obicei, un model lingvistic nu are nevoie de etichete pentru preinstruire.
+
+<Question
+	choices={[
+		{
+			text: "True",
+			explain: "The pretraining is usually <em>self-supervised</em>, which means the labels are created automatically from the inputs (like predicting the next word or filling in some masked words).",
+			correct: true
+		},
+		{
+			text: "False",
+			explain: "Incorrect."
+		}
+	]}
+/>
+
+### 7. Selectați propoziția care descrie cel mai bine termenii „model”, „arhitectură” și „ greutăți”.
+
+<Question
+	choices={[
+		{
+			text: "If a model is a building, its architecture is the blueprint and the weights are the people living inside.",
+			explain: "Following this metaphor, the weights would be the bricks and other materials used to construct the building."
+		},
+		{
+			text: "An architecture is a map to build a model and its weights are the cities represented on the map.",
+			explain: "The problem with this metaphor is that a map usually represents one existing reality (there is only one city in France named Paris). For a given architecture, multiple weights are possible."
+		},
+		{
+			text: "An architecture is a succession of mathematical functions to build a model and its weights are those functions parameters.",
+			explain: "The same set of mathematical functions (architecture) can be used to build different models by using different parameters (weights).",
+			correct: true
+		}
+	]}
+/>
+
+
+### 8. Care dintre aceste tipuri de modele le-ați folosi pentru a completa prompt-urile cu text generat?
+
+<Question
+	choices={[
+		{
+			text: "An encoder model",
+			explain: "An encoder model generates a representation of the whole sentence that is better suited for tasks like classification."
+		},
+		{
+			text: "A decoder model",
+			explain: "Decoder models are perfectly suited for text generation from a prompt.",
+			correct: true
+		},
+		{
+			text: "A sequence-to-sequence model",
+			explain: "Sequence-to-sequence models are better suited for tasks where you want to generate sentences in relation to the input sentences, not a given prompt."
+		}
+	]}
+/>
+
+### 9. Care dintre aceste tipuri de modele le-ați folosi pentru a rezuma texte?
+
+<Question
+	choices={[
+		{
+			text: "An encoder model",
+			explain: "An encoder model generates a representation of the whole sentence that is better suited for tasks like classification."
+		},
+		{
+			text: "A decoder model",
+			explain: "Decoder models are good for generating output text (like summaries), but they don't have the ability to exploit a context like the whole text to summarize."
+		},
+		{
+			text: "A sequence-to-sequence model",
+			explain: "Sequence-to-sequence models are perfectly suited for a summarization task.",
+			correct: true
+		}
+	]}
+/>
+
+### 10. Care dintre aceste tipuri de modele le-ați utiliza pentru a clasifica intrările de text în funcție de anumite etichete?
+
+<Question
+	choices={[
+		{
+			text: "An encoder model",
+			explain: "An encoder model generates a representation of the whole sentence which is perfectly suited for a task like classification.",
+			correct: true
+		},
+		{
+			text: "A decoder model",
+			explain: "Decoder models are good for generating output texts, not extracting a label out of a sentence."
+		},
+		{
+			text: "A sequence-to-sequence model",
+			explain: "Sequence-to-sequence models are better suited for tasks where you want to generate text based on an input sentence, not a label.",
+		}
+	]}
+/>
+
+### 11. Ce sursă posibilă poate avea prejudecata observată într-un model?
+
+<Question
+	choices={[
+		{
+			text: "The model is a fine-tuned version of a pretrained model and it picked up its bias from it.",
+			explain: "When applying Transfer Learning, the bias in the pretrained model used persists in the fine-tuned model.",
+			correct: true
+		},
+		{
+			text: "The data the model was trained on is biased.",
+			explain: "This is the most obvious source of bias, but not the only one.",
+			correct: true
+		},
+		{
+			text: "The metric the model was optimizing for is biased.",
+			explain: "A less obvious source of bias is the way the model is trained. Your model will blindly optimize for whatever metric you chose, without any second thoughts.",
+			correct: true
+		}
+	]}
+/>
diff --git a/chapters/rum/chapter1/2.mdx b/chapters/rum/chapter1/2.mdx
new file mode 100644
index 000000000..2fb20b831
--- /dev/null
+++ b/chapters/rum/chapter1/2.mdx
@@ -0,0 +1,26 @@
+# Procesarea limbajului natural[[procesarea-limbajului-natural]]
+
+<CourseFloatingBanner
+    chapter={1}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+Înainte de a trece la modelele Transformer, haideți să facem o prezentare scurtă despre ce este procesarea limbajului natural și de ce ne interesează.
+
+## Ce este NLP?[[ce-este-nlp]]
+
+NLP este un domeniu al lingvisticii și al învățării automate axat pe înțelegerea a tot ceea ce este legat de limbajul uman. Scopul sarcinilor NLP nu este doar înțelegerea individuală a cuvintelor, ci și capacitatea de a înțelege contextul acelor cuvinte.
+
+În continuare este prezentată o listă a sarcinilor obișnuite de NLP, cu câteva exemple pentru fiecare:
+
+- **Clasificarea propozițiilor întregi**: Determinarea caracterului unei recenzii, detectarea dacă un e-mail este spam, determinarea dacă o propoziție este corectă gramatical sau dacă două propoziții sunt legate logic sau nu
+- **Clasificarea fiecărui cuvânt dintr-o propoziție**: Identificarea componentelor gramaticale ale unei propoziții (substantiv, verb, adjectiv) sau a entităților nominalizate (persoană, locație, organizație)
+- **Generarea conținutului de text**: Completarea unui text generat automat, completarea spațiilor goale dintr-un text cu cuvinte ascunse
+- **Extragerea unui răspuns dintr-un text**:Având o întrebare și un context, se extrage răspunsul la întrebare pe baza informațiilor furnizate în context
+- **Generarea unei propoziții noi dintr-un text de intrare**: Traducerea unui text într-o altă limbă, rezumarea textului
+
+NLP nu se limitează însă la textul scris. NLP, de asemenea, abordează provocări complexe în domeniul recunoașterii vorbirii și al viziunii computerizate, cum ar fi generarea unei transcrieri a unui fragment audio sau a unei descrieri a unei imagini.
+
+## De ce este o provocare?[[de-ce-este-o-provocare]]
+
+Computerele nu procesează informațiile în același mod ca oamenii. De exemplu, atunci când citim propoziția „Mi-e foame”, îi putem înțelege cu ușurință semnificația. În mod similar, având în vedere două propoziții precum „mi-e foame” și „sunt trist”, suntem capabili să determinăm cu ușurință cât de asemănătoare sunt acestea. Pentru modelele de învățare automată (ML), astfel de sarcini sunt mai dificile. Textul trebuie prelucrat într-un mod care să permită modelului să învețe din el. Și deoarece limbajul este complex, trebuie să ne gândim cu atenție la modul în care trebuie efectuată această procesare. Au fost efectuate numeroase cercetări cu privire la modul de reprezentare a textului și vom analiza câteva metode în capitolul următor.
diff --git a/chapters/rum/chapter1/3.mdx b/chapters/rum/chapter1/3.mdx
new file mode 100644
index 000000000..91803fb0a
--- /dev/null
+++ b/chapters/rum/chapter1/3.mdx
@@ -0,0 +1,326 @@
+# Ce pot face modelele Transformer[[ce-pot-face-modelele-transformer]]
+
+<CourseFloatingBanner chapter={1}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter1/section3.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter1/section3.ipynb"},
+]} />
+
+În această parte, vom vedea ce pot face modelele Transformer și vom folosi primul nostru instrument din biblioteca 🤗 Transformers: funcția `pipeline()`.
+
+<Tip>
+👀 Vedeți butonul <em>Open in Colab</em> din dreapta sus? Faceți clic pe el pentru a deschide un notebook Google Colab cu toate exemplele de cod din această secțiune. Acest buton va fi prezent în orice secțiune care conține exemple de cod. 
+Dacă doriți să executați exemplele local, vă recomandăm să aruncați o privire la <a href="/course/chapter0">setup</a>.
+</Tip>
+
+## Modelele Transformer sunt peste tot![[modelele-transformer-sunt-peste-tot]]
+
+Modelele Transformer sunt utilizate pentru a rezolva toate tipurile de sarcini NLP, precum cele menționate în secțiunea anterioară. Iată câteva dintre companiile și organizațiile care utilizează modelele Hugging Face și Transformer, care de asemenea contribuie la dezvoltarea comunității prin partajarea modelelor lor:
+
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/companies.PNG" alt="Companies using Hugging Face" width="100%">
+
+Biblioteca [🤗 Transformers](https://github.com/huggingface/transformers) oferă funcționalitatea de a crea și utiliza aceste modele partajate. [Model Hub](https://huggingface.co/models) conține mii de modele preinstruite pe care oricine le poate descărca și utiliza. De asemenea, vă puteți încărca propriile modele pe Hub!
+
+<Tip>
+⚠️ Hub-ul Hugging Face nu este limitat la modelele Transformer. Oricine poate partaja orice fel de modele sau seturi de date pe care le dorește! <a href="https://huggingface.co/join">Creați un cont huggingface.co</a> pentru a beneficia de toate funcțiile disponibile!
+</Tip>
+
+Înainte de a analiza funcționarea internă a modelelor Transformer , să ne oprim asupra unor exemple privind modul în care acestea pot fi utilizate pentru a rezolva unele probleme interesante de NLP.
+
+## Lucrul cu pipelines[[lucrul-cu-pipelines]]
+
+<Youtube id="tiZFewofSLM" />
+
+Obiectul cel mai elementar din biblioteca 🤗 Transformers este funcția `pipeline()`. Aceasta conectează un model cu etapele sale necesare de preprocesare și postprocesare, permițându-ne să introducem direct orice text și să obținem un răspuns inteligibil:
+
+```python
+from transformers import pipeline
+
+classifier = pipeline("sentiment-analysis")
+classifier("I've been waiting for a HuggingFace course my whole life.")
+```
+
+```python out
+[{'label': 'POSITIVE', 'score': 0.9598047137260437}]
+```
+
+Putem adăuga chiar și  mai multe propoziții!
+
+```python
+classifier(
+    ["I've been waiting for a HuggingFace course my whole life.", "I hate this so much!"]
+)
+```
+
+```python out
+[{'label': 'POSITIVE', 'score': 0.9598047137260437},
+ {'label': 'NEGATIVE', 'score': 0.9994558095932007}]
+```
+
+În mod implicit, aceast pipeline selectează un anumit model preinstruit care a fost ajustat pentru a analiza emoțiile dintr-un text în limba engleză. Modelul este descărcat și pus în cache atunci când creați obiectul `classifier`. Dacă rulați din nou comanda, modelul din memoria cache va fi utilizat în locul acestuia și nu este nevoie să descărcați din nou modelul.
+
+Atunci când transmiteți un text către un pipeline, sunt necesari trei pași:
+
+1. Textul este preprocesat într-un format pe care modelul îl poate înțelege.
+2. Datele de intrare preprocesate sunt transmise modelului.
+3. Predicțiile modelului sunt postprocesate, astfel încât să le puteți înțelege.
+
+
+Unele dintre [pipeline-urile disponibile] în prezent (https://huggingface.co/transformers/main_classes/pipelines) sunt:
+
+- `feature-extraction` (obține reprezentarea vectorială a unui text)
+- `fill-mask`
+- `ner` (recunoașterea NE (named entity))
+- `question-answering`
+- `sentiment-analysis`
+- `summarization`
+- `text-generation`
+- `translation`
+- `zero-shot-classification`
+
+Să aruncăm o privire la câteva dintre ele!
+
+## Zero-shot classification[zero-shot-classification]]
+
+Vom începe prin a aborda o sarcină mai dificilă în care trebuie să clasificăm texte care nu au fost etichetate. Acesta este un scenariu comun în proiectele din lumea reală, deoarece adnotarea textului este de obicei costisitoare în timp și necesită expertiză în domeniu. Pentru acest caz de utilizare, pipeline-ul `zero-shot-classification` este foarte puternică: vă permite să specificați ce etichete să utilizați pentru clasificare, astfel încât să nu trebuie să vă bazați pe etichetele modelului preinstruit. Ați văzut deja cum modelul poate clasifica o propoziție ca fiind pozitivă sau negativă folosind aceste două etichete - dar poate, de asemenea, clasifica textul folosind orice alt set de etichete doriți.
+
+```python
+from transformers import pipeline
+
+classifier = pipeline("zero-shot-classification")
+classifier(
+    "This is a course about the Transformers library",
+    candidate_labels=["education", "politics", "business"],
+)
+```
+
+```python out
+{'sequence': 'This is a course about the Transformers library',
+ 'labels': ['education', 'business', 'politics'],
+ 'scores': [0.8445963859558105, 0.111976258456707, 0.043427448719739914]}
+```
+
+Aceast pipeline se numește _zero-shot_ deoarece nu trebuie să reglați modelul pe datele dvs. pentru a o utiliza. Aceasta poate returna direct scoruri de probabilitate pentru orice listă de etichete doriți!
+
+<Tip>
+
+✏️ **Încercați** Jucați-vă cu propriile secvențe și etichete și vedeți cum se comportă modelul.
+
+</Tip>
+
+
+## Text generation[[text-generation]]
+
+Să vedem acum cum se utilizează un pipeline pentru a genera un text. Ideea principală aici este că furnizați o solicitare, iar modelul o va completa automat prin generarea textului rămas. Acest lucru este similar cu funcția de text previzibil care se găsește pe multe telefoane. Generarea textului implică caracter aleatoriu, deci este normal să nu obțineți aceleași rezultate ca cele prezentate mai jos.
+
+```python
+from transformers import pipeline
+
+generator = pipeline("text-generation")
+generator("In this course, we will teach you how to")
+```
+
+```python out
+[{'generated_text': 'In this course, we will teach you how to understand and use '
+                    'data flow and data interchange when handling user data. We '
+                    'will be working with one or more of the most commonly used '
+                    'data flows — data flows of various types, as seen by the '
+                    'HTTP'}]
+```
+
+Puteți controla câte secvențe diferite sunt generate cu argumentul `num_return_sequences` și lungimea totală a textului de ieșire cu argumentul `max_length`.
+
+<Tip>
+
+✏️ **Încercați!** Utilizați argumentele `num_return_sequences` și `max_length` pentru a genera două propoziții a câte 15 cuvinte fiecare.
+
+</Tip>
+
+
+## Utilizarea oricărui model de pe Hub într-un pipeline[[utilizarea-oricărui-model-de-pe-hub-într-un-pipeline]]
+
+Exemplele anterioare au utilizat modelul implicit pentru sarcina în cauză, dar puteți alege, de asemenea, un anumit model din Hub pentru a-l utiliza într-un pipeline pentru o sarcină specifică - de exemplu, generarea de text. Accesați [Model Hub](https://huggingface.co/models) și faceți clic pe eticheta corespunzătoare din stânga pentru a afișa numai modelele acceptate pentru sarcina respectivă. Ar trebui să ajungeți la o pagină precum [aceasta](https://huggingface.co/models?pipeline_tag=text-generation).
+
+Să încercăm modelul [`distilgpt2`](https://huggingface.co/distilgpt2)! Iată cum să îl încărcați în același pipeline ca înainte:
+
+```python
+from transformers import pipeline
+
+generator = pipeline("text-generation", model="distilgpt2")
+generator(
+    "In this course, we will teach you how to",
+    max_length=30,
+    num_return_sequences=2,
+)
+```
+
+```python out
+[{'generated_text': 'In this course, we will teach you how to manipulate the world and '
+                    'move your mental and physical capabilities to your advantage.'},
+ {'generated_text': 'In this course, we will teach you how to become an expert and '
+                    'practice realtime, and with a hands on experience on both real '
+                    'time and real'}]
+```
+
+Puteți să vă îmbunătățiți căutarea unui model făcând clic pe tag-urile de limbaj și să alegeți un model care va genera text în altă limbă. Model Hub conține chiar și puncte de control pentru modele multilingve care acceptă mai multe limbi.
+
+După ce selectați un model făcând clic pe el, veți vedea că există un widget care vă permite să îl încercați direct online. În acest fel, puteți testa rapid capacitățile modelului înainte de a-l descărca.
+
+<Tip>
+
+✏️ ** Încercați!** Utilizați filtrele pentru a găsi un model de generare a textului pentru o altă limbă. Nu ezitați să vă jucați cu widget-ul și să îl utilizați într-un pipeline!
+
+</Tip>
+
+### API-ul de inferență[[api-ul-de-inferență]]
+
+Toate modelele pot fi testate direct prin browser utilizând API-ul de inferență, care este disponibil pe site-ul Hugging Face [website] (https://huggingface.co/). Vă puteți juca cu modelul direct pe această pagină introducând text personalizat și urmărind cum modelul procesează datele de intrare.
+
+API-ul de inferență care alimentează widget-ul este, de asemenea, disponibil ca produs plătit, ceea ce este util dacă aveți nevoie de el pentru fluxurile dvs. de lucru. Consultați [pagina de prețuri](https://huggingface.co/pricing) pentru mai multe detalii.
+
+## Mask filling[[mask-filling]]
+
+Următorul pipeline pe care il veți încerca este `fill-mask`. Ideea acestei sarcini este de a completa golurile dintr-un text dat:
+
+```python
+from transformers import pipeline
+
+unmasker = pipeline("fill-mask")
+unmasker("This course will teach you all about <mask> models.", top_k=2)
+```
+
+```python out
+[{'sequence': 'This course will teach you all about mathematical models.',
+  'score': 0.19619831442832947,
+  'token': 30412,
+  'token_str': ' mathematical'},
+ {'sequence': 'This course will teach you all about computational models.',
+  'score': 0.04052725434303284,
+  'token': 38163,
+  'token_str': ' computational'}]
+```
+
+Argumentul `top_k` controlează câte posibilități doriți să fie afișate. Rețineți că aici modelul completează cuvântul special `<mask>`, care este adesea denumit *mask token*. Alte modele de umplere a măștii ar putea avea token-uri de mască diferite, astfel încât este întotdeauna bine să verificați cuvântul de mască adecvat atunci când explorați alte modele. O modalitate de verificare este să vă uitați la cuvântul mască utilizat în widget.
+
+<Tip>
+
+✏️ **Încercați!** Căutați modelul `bert-base-cased` pe Hub și identificați-i cuvântul mască în widget-ul Inference API. Ce prezice acest model pentru propoziția din exemplul nostru `pipeline` de mai sus?
+
+</Tip>
+
+## Recunoașterea NE (named entity)[[recunoașterea-NE]]
+
+Recunoașterea (NE) este o sarcină în care modelul trebuie să găsească care părți din textul de intrare corespund unor entități precum persoane, locații sau organizații. Să ne uităm la un exemplu:
+
+```python
+from transformers import pipeline
+
+ner = pipeline("ner", grouped_entities=True)
+ner("My name is Sylvain and I work at Hugging Face in Brooklyn.")
+```
+
+```python out
+[{'entity_group': 'PER', 'score': 0.99816, 'word': 'Sylvain', 'start': 11, 'end': 18}, 
+ {'entity_group': 'ORG', 'score': 0.97960, 'word': 'Hugging Face', 'start': 33, 'end': 45}, 
+ {'entity_group': 'LOC', 'score': 0.99321, 'word': 'Brooklyn', 'start': 49, 'end': 57}
+]
+```
+
+Aici, modelul a identificat corect că Sylvain este o persoană (PER), Hugging Face o organizație (ORG), iar Brooklyn o locație (LOC).
+
+Trecem opțiunea `grouped_entities=True` în funcția de creare a pipeline-ului pentru a-i spune pipeline-ului să regrupeze părțile propoziției care corespund aceleiași entități: aici, modelul a grupat corect „Hugging” și „Face” ca o singură organizație, chiar dacă numele este format din mai multe cuvinte. De fapt, după cum vom vedea în capitolul următor, preprocesarea chiar împarte unele cuvinte în părți mai mici. De exemplu, `Sylvain` este împărțit în patru părți: `S`, `##yl`, `##va`, și `##in`. În etapa de postprocesare, pipeline-ul a reușit să regrupeze aceste părți.
+
+<Tip>
+
+✏️ **Încercați!** Căutați în Hub-ul de modele un model capabil să facă etichetarea părții de vorbire (de obicei abreviată ca POS) în limba engleză. Ce prezice acest model pentru propoziția din exemplul de mai sus?
+
+</Tip>
+
+## Question answering[[question-answering]]
+
+Pipeline-ul "question-answering" răspunde la întrebări folosind informații dintr-un context dat:
+
+```python
+from transformers import pipeline
+
+question_answerer = pipeline("question-answering")
+question_answerer(
+    question="Where do I work?",
+    context="My name is Sylvain and I work at Hugging Face in Brooklyn",
+)
+```
+
+```python out
+{'score': 0.6385916471481323, 'start': 33, 'end': 45, 'answer': 'Hugging Face'}
+```
+
+Rețineți că acest pipeline funcționează prin extragerea informațiilor din contextul furnizat; el nu generează răspunsul.
+
+## Summarization[[summarization]]
+
+Rezumarea este sarcina de a reduce un text într-un altul mai scurt, păstrând toate (sau majoritatea) aspectelor importante menționate în el. Iată un exemplu:
+
+```python
+from transformers import pipeline
+
+summarizer = pipeline("summarization")
+summarizer(
+      """
+    America has changed dramatically during recent years. Not only has the number of 
+    graduates in traditional engineering disciplines such as mechanical, civil, 
+    electrical, chemical, and aeronautical engineering declined, but in most of 
+    the premier American universities engineering curricula now concentrate on 
+    and encourage largely the study of engineering science. As a result, there 
+    are declining offerings in engineering subjects dealing with infrastructure, 
+    the environment, and related issues, and greater concentration on high 
+    technology subjects, largely supporting increasingly complex scientific 
+    developments. While the latter is important, it should not be at the expense 
+    of more traditional engineering.
+
+    Rapidly developing economies such as China and India, as well as other 
+    industrial countries in Europe and Asia, continue to encourage and advance 
+    the teaching of engineering. Both China and India, respectively, graduate 
+    six and eight times as many traditional engineers as does the United States. 
+    Other industrial countries at minimum maintain their output, while America 
+    suffers an increasingly serious decline in the number of engineering graduates 
+    and a lack of well-educated engineers.
+"""
+)
+```
+
+```python out
+[{'summary_text': ' America has changed dramatically during recent years . The '
+                  'number of engineering graduates in the U.S. has declined in '
+                  'traditional engineering disciplines such as mechanical, civil '
+                  ', electrical, chemical, and aeronautical engineering . Rapidly '
+                  'developing economies such as China and India, as well as other '
+                  'industrial countries in Europe and Asia, continue to encourage '
+                  'and advance engineering .'}]
+```
+
+La fel ca în cazul generării de text, puteți specifica o lungime `max_length` sau `min_length` pentru rezultat.
+
+## Translation[[translation]]
+
+Pentru traducere, puteți utiliza un model predefinit dacă introduceți o combinație de limbi în numele sarcinii (cum ar fi `„translation_en_to_fr”`), dar cel mai simplu este să alegeți modelul pe care doriți să îl utilizați în [Model Hub](https://huggingface.co/models). Aici vom încerca să traducem din franceză în engleză:
+
+```python
+from transformers import pipeline
+
+translator = pipeline("translation", model="Helsinki-NLP/opus-mt-fr-en")
+translator("Ce cours est produit par Hugging Face.")
+```
+
+```python out
+[{'translation_text': 'This course is produced by Hugging Face.'}]
+```
+
+Ca și în cazul generării și rezumării textului, puteți specifica `max_length` sau `min_length` pentru rezultat.
+<Tip>
+
+✏️ **Incercați!** Căutați modele de traducere în alte limbi și încercați să traduceți propoziția anterioară în câteva limbi diferite.
+
+</Tip>
+
+Pipeline-urile prezentate până în acest moment au în principal scop demonstrativ. Ele au fost programate pentru sarcini specifice și nu pot efectua variații ale acestora. În capitolul următor, veți afla ce se află în interiorul unei funcții `pipeline()` și cum să îi personalizați comportamentul.
\ No newline at end of file
diff --git a/chapters/rum/chapter1/4.mdx b/chapters/rum/chapter1/4.mdx
new file mode 100644
index 000000000..6fb2bdcdb
--- /dev/null
+++ b/chapters/rum/chapter1/4.mdx
@@ -0,0 +1,178 @@
+# Cum funcționează Transformers?[[cum-funcționează-transformers]]
+
+<CourseFloatingBanner
+    chapter={1}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+În această secțiune, vom analiza arhitectura modelelor Transformer.
+
+## Un pic despre istorie modelelor Transformer[[un-pic-despre-istoria-modelelor-transformer]]
+
+Iată câteva puncte de referință în (scurta) istorie a modelelor Transformer:
+
+<div class="flex justify-center">
+<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/transformers_chrono.svg" alt="A brief chronology of Transformers models.">
+<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/transformers_chrono-dark.svg" alt="A brief chronology of Transformers models.">
+</div>
+
+[Arhitectura Transformer] (https://arxiv.org/abs/1706.03762) a fost introdusă în iunie 2017. Accentul cercetării inițiale a fost pus pe sarcinile de traducere. Aceasta a fost urmată de introducerea mai multor modele influente, inclusiv:
+
+- **Iunie 2018**: [GPT](https://cdn.openai.com/research-covers/language-unsupervised/language_understanding_paper.pdf), primul model Transformer preinstruit, utilizat pentru reglarea precisă a diferitelor sarcini NLP și a obținut rezultate de top
+
+- **Octombrie 2018**: [BERT](https://arxiv.org/abs/1810.04805), un alt model mare preinstruit, conceput pentru a produce rezumate mai bune ale propozițiilor (mai multe despre el în capitolul următor!)
+
+- **Februarie 2019**: [GPT-2](https://cdn.openai.com/better-language-models/language_models_are_unsupervised_multitask_learners.pdf), o versiune îmbunătățită (și mai mare) a GPT care nu a fost lansată public imediat din motive etice
+
+- **Octombrie 2019**: [DistilBERT](https://arxiv.org/abs/1910.01108), o versiune rafinată a BERT care este cu 60% mai rapidă, cu 40% mai ușoară în memorie și care păstrează încă 97% din performanța BERT
+
+- **Octombrie 2019**: [BART](https://arxiv.org/abs/1910.13461) și [T5](https://arxiv.org/abs/1910.10683), două modele mari preinstruite folosind aceeași arhitectură ca modelul original Transformer (primul care face acest lucru)
+
+- **Mai 2020**, [GPT-3](https://arxiv.org/abs/2005.14165), o versiune și mai mare a GPT-2, care este capabilă să se descurce bine într-o varietate de sarcini, fără a fi nevoie de o reglare fină (numită _zero-shot learning_)
+
+Această listă este departe de a fi completă și este menită doar să evidențieze câteva dintre diferitele tipuri de modele Transformer. În linii mari, acestea pot fi grupate în trei categorii:
+
+- Tip GPT (numite și modele de Transformer autoregresive)
+- Tip BERT (numite și modele de Transfomer _auto-encoding_) 
+- Tip BART/T5 (denumite și modele de Transformer _sequence-to-sequence_)
+
+Vom analiza aceste familii în detaliu mai târziu.
+
+##Transformers sunt modele de limbaj[transformers-sunt-modele-de-limbaj]]
+
+Toate modelele Transformer menționate mai sus (GPT, BERT, BART, T5 etc.) au fost antrenate ca *modele lingvistice*. Aceasta înseamnă că au fost antrenate pe volume mari de text brut într-un mod autosupravegheat. Învățarea autosupravegheată este un tip de formare în care obiectivul este calculat automat din datele de intrare ale modelului. Aceasta înseamnă că nu este nevoie de oameni pentru a eticheta datele!
+
+Acest tip de model dezvoltă o înțelegere statistică a limbii pe care a fost antrenat, dar nu este foarte util pentru sarcini practice specifice. Din acest motiv, modelul general preinstruit trece apoi printr-un proces numit *transfer learning*. În timpul acestui proces, modelul este ajustat într-un mod supravegheat - adică folosind etichete notate de oameni - pentru o anumită sarcină.
+
+Un exemplu de sarcină este prezicerea următorului cuvânt dintr-o propoziție după citirea a *n* cuvinte anterioare. Aceasta se numește *modelare cauzală a limbajului* deoarece rezultatul depinde de intrările trecute și prezente, dar nu și de cele viitoare.
+
+<div class="flex justify-center">
+<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/causal_modeling.svg" alt="Example of causal language modeling in which the next word from a sentence is predicted.">
+<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/causal_modeling-dark.svg" alt="Example of causal language modeling in which the next word from a sentence is predicted.">
+</div>
+
+Un alt exemplu este *modelarea limbajului mascat*, în care modelul prezice un cuvânt mascat din propoziție.
+
+<div class="flex justify-center">
+<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/masked_modeling.svg" alt="Example of masked language modeling in which a masked word from a sentence is predicted.">
+<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/masked_modeling-dark.svg" alt="Example of masked language modeling in which a masked word from a sentence is predicted.">
+</div>
+
+## Modelele Transformer sunt mari[[modelele-transformer-sunt-mari]]
+
+Cu excepția câtorva cazuri excepționale (cum ar fi DistilBERT), strategia generală pentru a obține performanțe mai bune constă în creșterea dimensiunilor modelelor, precum și a cantității de date pe care acestea sunt preinstruite.
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/model_parameters.png" alt="Number of parameters of recent Transformers models" width="90%">
+</div>
+
+Din păcate, antrenarea unui model, în special a unuia mare, necesită o cantitate mare de date. Acest lucru devine foarte costisitor în termeni de timp și resurse de calcul. Aceasta se reflectă chiar și în impactul asupra mediului, după cum se poate vedea în graficul următor.
+
+<div class="flex justify-center">
+<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/carbon_footprint.svg" alt="The carbon footprint of a large language model.">
+<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/carbon_footprint-dark.svg" alt="The carbon footprint of a large language model.">
+</div>
+
+<Youtube id="ftWlj4FBHTg"/>
+
+Iar acest lucru arată un proiect pentru un model (foarte mare) condus de o echipă care încearcă în mod conștient să reducă impactul de mediu al preinstruirii. Amprenta lăsată de efectuarea multor teste pentru a obține cei mai buni hiperparametri ar fi și mai mare.
+
+Imaginați-vă dacă de fiecare dată când o echipă de cercetare, o organizație studențească sau o companie ar dori să antreneze un model, ar face-o de la zero. Acest lucru ar conduce la costuri globale uriașe și inutile!
+
+Acesta este motivul pentru care partajarea modelelor lingvistice este esențială: partajarea ponderilor antrenate și construirea pe baza ponderilor deja antrenate reduce costul global de calcul și amprenta de carbon a comunității.
+
+Apropo, puteți evalua amprenta de carbon a formării modelelor dvs. prin intermediul mai multor instrumente. De exemplu [ML CO2 Impact](https://mlco2.github.io/impact/) sau [Code Carbon]( https://codecarbon.io/) care este integrat în 🤗 Transformers. Pentru a afla mai multe despre acest lucru, puteți citi această [postare pe blog](https://huggingface.co/blog/carbon-emissions-on-the-hub) care vă va arăta cum să generați un fișier `emissions.csv` cu o estimare a amprentei formării dvs., precum și [documentația](https://huggingface.co/docs/hub/model-cards-co2) din 🤗 Transformers care abordează acest subiect.
+
+
+## Transfer Learning[[transfer-learning]]
+
+<Youtube id="BqqfQnyjmgg" />
+
+*Preinstruirea* este acțiunea de formare a unui model de la zero: ponderile sunt inițializate aleatoriu, iar formarea începe fără nicio cunoaștere prealabilă.
+
+<div class="flex justify-center">
+<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/pretraining.svg" alt="The pretraining of a language model is costly in both time and money.">
+<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/pretraining-dark.svg" alt="The pretraining of a language model is costly in both time and money.">
+</div>
+
+Această preinstruire se face de obicei pe cantități foarte mari de date. Prin urmare, este nevoie de un corpus foarte mare de date, iar formarea poate dura până la câteva săptămâni.
+
+*Reglarea-fină*, pe de altă parte, este instruirea efectuată **după** ce un model a fost preinstruit. Pentru a efectua reglarea fină, obțineți mai întâi un model lingvistic preinstruit, apoi efectuați o instruire suplimentară cu un set de date specific sarcinii dumneavoastră. Stați - de ce să nu instruiți de la început modelul pentru cazul dvs. final de utilizare (**scratch**)? Există câteva motive:
+
+* Modelul preinstruit a fost deja instruit pe un set de date care are unele similitudini cu setul de date pentru reglarea fină. Procesul de reglare fină este astfel capabil să profite de cunoștințele dobândite de modelul inițial în timpul preantrenării (de exemplu, în cazul problemelor de NLP, modelul preantrenat va avea un anumit tip de înțelegere statistică a limbajului pe care îl utilizați pentru sarcina dumneavoastră). 
+* Deoarece modelul preinstruit a fost deja instruit pe o mulțime de date, reglarea fină necesită mult mai puține date pentru a obține rezultate decente.
+* Din același motiv, timpul și resursele necesare pentru a obține rezultate bune sunt mult mai reduse.
+
+De exemplu, se poate valorifica un model preformat antrenat pe limba engleză și apoi ajustat pe un corpus arXiv, rezultând un model bazat pe știință/cercetare. Reglarea fină va necesita doar o cantitate limitată de date: cunoștințele dobândite de modelul pre-format sunt „transferate”, de unde și termenul de *învățare prin transfer*.
+
+<div class="flex justify-center">
+<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/finetuning.svg" alt="The fine-tuning of a language model is cheaper than pretraining in both time and money.">
+<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/finetuning-dark.svg" alt="The fine-tuning of a language model is cheaper than pretraining in both time and money.">
+</div>
+
+Prin urmare, reglarea fină a unui model are costuri mai mici de timp, date, financiare și de mediu. De asemenea, este mai rapid și mai ușor să iterați pe diferite scheme de reglaj fin, deoarece formarea este mai puțin constrângătoare decât o preformare completă.
+
+Acest proces va obține, de asemenea, rezultate mai bune decât formarea de la zero (cu excepția cazului în care dispuneți de o mulțime de date), motiv pentru care ar trebui să încercați întotdeauna să valorificați un model preformat - unul cât mai apropiat posibil de sarcina pe care o aveți la îndemână - și să îl reglați fin.
+
+## Arhitectura generală[[arhitectura-generală]]
+
+În această secțiune, vom analiza arhitectura generală a modelului Transformer. Nu vă faceți griji dacă nu înțelegeți anumite concepte; mai târziu există secțiuni detaliate care acoperă fiecare dintre componente.
+
+<Youtube id="H39Z_720T5s" />
+
+## Introducere[[introducere]]
+
+Modelul este compus în principal din două blocuri:
+
+* **Codificator (stânga)**: Codificatorul primește o intrare și construiește o reprezentare a acesteia (caracteristicile sale). Aceasta înseamnă că modelul este optimizat pentru a dobândi cunoștințe din datele de intrare.
+* **Decodificator (dreapta)**: Decodificatorul utilizează reprezentarea codificatorului (caracteristicile) împreună cu alte intrări pentru a genera o secvență țintă. Aceasta înseamnă că modelul este optimizat pentru a genera ieșiri.
+
+<div class="flex justify-center">
+<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/transformers_blocks.svg" alt="Architecture of a Transformers models">
+<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/transformers_blocks-dark.svg" alt="Architecture of a Transformers models">
+</div>
+
+Fiecare dintre aceste părți poate fi utilizată independent, în funcție de sarcină: 
+
+* **Modeluri exclusiv de codare**: Bune pentru sarcini care necesită înțelegerea datelor de intrare, cum ar fi clasificarea propozițiilor și recunoașterea entităților numite.
+* **Modele exclusiv decodificatoare**: Bune pentru sarcini generative, cum ar fi generarea de text.
+* **Modele encoder-decoder** sau **modele sequence-to-sequence**: Bune pentru sarcinile generative care necesită o intrare, cum ar fi traducerea sau rezumarea.
+
+Vom analiza aceste arhitecturi în mod independent în secțiunile următoare.
+
+## Attention layers(straturi de atenție)[[attention-layers]]
+
+O caracteristică cheie a modelelor Transformer este faptul că acestea sunt construite cu straturi speciale numite *attention layers*. De fapt, titlul lucrării de prezentare a arhitecturii Transformer a fost [„Attention Is All You Need”] (https://arxiv.org/abs/1706.03762)! Vom explora detaliile attention layers-urilor mai târziu în curs; pentru moment, tot ce trebuie să știți este că acest strat va spune modelului să acorde o atenție specifică anumitor cuvinte din propoziția pe care i-ați transmis-o (și să le ignore mai mult sau mai puțin pe celelalte) atunci când se ocupă de reprezentarea fiecărui cuvânt.
+
+Pentru a pune acest lucru în context, luați în considerare sarcina de a traduce un text din engleză în franceză. Având în vedere intrarea „Vă place acest curs”, un model de traducere va trebui să se ocupe și de cuvântul adiacent „You” pentru a obține traducerea corectă pentru cuvântul „like”, deoarece în franceză verbul „like” se conjugă diferit în funcție de subiect. Cu toate acestea, restul propoziției nu este util pentru traducerea acestui cuvânt. În aceeași ordine de idei, la traducerea cuvântului „this”, modelul va trebui, de asemenea, să acorde atenție cuvântului „course”, deoarece „this” se traduce diferit în funcție de faptul dacă substantivul asociat este masculin sau feminin. Din nou, celelalte cuvinte din propoziție nu vor conta pentru traducerea cuvântului „course”. În cazul unor propoziții mai complexe (și al unor reguli gramaticale mai complexe), modelul ar trebui să acorde o atenție deosebită cuvintelor care ar putea apărea mai departe în propoziție pentru a traduce corect fiecare cuvânt.
+
+Același concept se aplică oricărei sarcini asociate cu limbajul natural: un cuvânt în sine are o semnificație, dar această semnificație este profund afectată de context, care poate fi orice alt cuvânt (sau cuvinte) înainte sau după cuvântul studiat.
+
+Acum, că aveți o idee despre ce sunt attention layers, să analizăm mai îndeaproape arhitectura Transformer.
+
+## Arhitectura originală[[arhitectura-originală]
+
+Arhitectura Transformer a fost concepută inițial pentru traducere. În timpul formării, codificatorul primește intrări (propoziții) într-o anumită limbă, în timp ce decodificatorul primește aceleași propoziții în limba țintă dorită. În codificator, attention layets pot utiliza toate cuvintele dintr-o propoziție (deoarece, după cum tocmai am văzut, traducerea unui anumit cuvânt poate depinde de ceea ce se află înainte și după el în propoziție). Cu toate acestea, decodificatorul funcționează secvențial și poate acorda atenție numai cuvintelor din propoziție pe care le-a tradus deja (deci, numai cuvintelor anterioare cuvântului generat în prezent). De exemplu, atunci când am prezis primele trei cuvinte din ținta tradusă, le dăm decodificatorului, care utilizează apoi toate intrările codificatorului pentru a încerca să prezică al patrulea cuvânt.
+
+Pentru a accelera lucrurile în timpul formării (atunci când modelul are acces la propozițiile țintă), decodorul primește întreaga țintă, dar nu i se permite să utilizeze cuvintele viitoare (dacă ar avea acces la cuvântul din poziția 2 atunci când încearcă să prezică cuvântul din poziția 2, problema nu ar fi foarte dificilă!) De exemplu, atunci când încearcă să prezică al patrulea cuvânt, stratul de atenție va avea acces doar la cuvintele de la pozițiile 1 și 3.
+
+Arhitectura originală a Transformer arăta astfel, cu codificatorul în stânga și decodificatorul în dreapta:
+
+<div class="flex justify-center">
+<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/transformers.svg" alt="Architecture of a Transformers models">
+<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/transformers-dark.svg" alt="Architecture of a Transformers models">
+</div>
+
+Rețineți că primul attention layer dintr-un bloc decodor acordă atenție tuturor intrărilor (trecute) către decodor, dar al doilea attention layer utilizează ieșirea codorului. Astfel, acesta poate accesa întreaga propoziție de intrare pentru a prezice cel mai bine cuvântul curent. Acest lucru este foarte util deoarece diferite limbi pot avea reguli gramaticale care pun cuvintele în ordine diferită sau un context furnizat mai târziu în propoziție poate fi util pentru a determina cea mai bună traducere a unui cuvânt dat.
+
+*attention mask* poate fi, de asemenea, utilizată în codificator/decodificator pentru a împiedica modelul să acorde atenție anumitor cuvinte speciale - de exemplu, cuvântul special de umplutură utilizat pentru a face ca toate intrările să aibă aceeași lungime atunci când se grupează propozițiile.
+
+##  Architectura vs. punctele de control[[architectura-vs-punctele-de-control]]
+
+Pe măsură ce analizăm modelele Transformer în acest curs, veți vedea mențiuni despre *arhitecturi* și *puncte de control*, precum și despre *modele*. Toți acești termeni au semnificații ușor diferite: 
+
+* **Arhitectură**: Acesta este scheletul modelului - definiția fiecărui strat și a fiecărei operațiuni care are loc în cadrul modelului. 
+* **Puncte de control**: Acestea sunt ponderile care vor fi încărcate într-o anumită arhitectură.
+* **Model**: Acesta este un termen generic care nu este la fel de precis ca „arhitectură” sau „punct de control”: poate însemna ambele. Acest curs va specifica *arhitectură* sau *punct de control* atunci când este necesar pentru a reduce ambiguitatea.
+
+De exemplu, BERT este o arhitectură, în timp ce `bert-base-cased`, un set de ponderi antrenate de echipa Google pentru prima versiune a BERT, este un punct de control. Cu toate acestea, se poate spune „modelul BERT” și „modelul `bert-base-cased`”.
\ No newline at end of file
diff --git a/chapters/rum/chapter1/5.mdx b/chapters/rum/chapter1/5.mdx
new file mode 100644
index 000000000..6a32cff0b
--- /dev/null
+++ b/chapters/rum/chapter1/5.mdx
@@ -0,0 +1,22 @@
+# Modele Encoder[[modele-encoder]]
+
+<CourseFloatingBanner
+    chapter={1}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+<Youtube id="MUqNwgPjJvQ" />
+
+Modelele Encoder utilizează doar encoderul unui model Transformer. La fiecare etapă, layer-urile de atenție pot accesa toate cuvintele din propoziția inițială. Aceste modele sunt adesea caracterizate ca având o atenție „bidirecțională” și sunt adesea numite *modele de autocodificare*.
+
+Preinstruirea acestor modele se bazează, de obicei, pe alterarea unei propoziții date (de exemplu, prin mascarea unor cuvinte aleatorii) și pe sarcina modelului de a găsi sau reconstrui propoziția inițială.
+
+Modelele Encoder sunt cele mai potrivite pentru sarcinile care necesită înțelegerea întregii propoziții, cum ar fi clasificarea propozițiilor, recunoașterea entităților numite (și, mai general, clasificarea cuvintelor) și Extractive QA.
+
+Printre reprezentanții acestei familii de modele se numără:
+
+- [ALBERT](https://huggingface.co/docs/transformers/model_doc/albert)
+- [BERT](https://huggingface.co/docs/transformers/model_doc/bert)
+- [DistilBERT](https://huggingface.co/docs/transformers/model_doc/distilbert)
+- [ELECTRA](https://huggingface.co/docs/transformers/model_doc/electra)
+- [RoBERTa](https://huggingface.co/docs/transformers/model_doc/roberta)
diff --git a/chapters/rum/chapter1/6.mdx b/chapters/rum/chapter1/6.mdx
new file mode 100644
index 000000000..9e284d5ea
--- /dev/null
+++ b/chapters/rum/chapter1/6.mdx
@@ -0,0 +1,21 @@
+# Modele Decoder[[modele-decoder]]
+
+<CourseFloatingBanner
+    chapter={1}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+<Youtube id="d_ixlCubqQw" />
+
+Modelele Decoder utilizează doar decodificatorul unui model Transformer. În fiecare etapă, pentru un cuvânt dat, layerele de atenție pot accesa doar cuvintele poziționate înaintea acestuia în propoziție. Aceste modele sunt adesea numite *modele autoregresive*.
+
+Preinstruirea modelelor de decodare se axează de obicei pe prezicerea următorului cuvânt din propoziție.
+
+Aceste modele sunt cele mai potrivite pentru sarcinile care implică generarea de text.
+
+Printre reprezentanții acestei familii de modele se numără:
+
+- [CTRL](https://huggingface.co/transformers/model_doc/ctrl)
+- [GPT](https://huggingface.co/docs/transformers/model_doc/openai-gpt)
+- [GPT-2](https://huggingface.co/transformers/model_doc/gpt2)
+- [Transformer XL](https://huggingface.co/transformers/model_doc/transfo-xl)
\ No newline at end of file
diff --git a/chapters/rum/chapter1/7.mdx b/chapters/rum/chapter1/7.mdx
new file mode 100644
index 000000000..8a93e0fd8
--- /dev/null
+++ b/chapters/rum/chapter1/7.mdx
@@ -0,0 +1,20 @@
+# Modele Sequence-to-sequence[modele-sequence-to-sequence]
+
+<CourseFloatingBanner
+    chapter={1}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+<Youtube id="0_4KEb08xrE" />
+
+Modelele Encoder-Decoder (denumite și *modele sequence-to-sequence*) utilizează ambele părți ale arhitecturii Transformer. În fiecare etapă, layerele de atenție ale codificatorului pot accesa toate cuvintele din propoziția inițială, în timp ce layerele de atenție ale decodificatorului pot accesa doar cuvintele poziționate înaintea unui anumit cuvânt din intrare.
+
+Preinstruirea acestor modele se poate face folosind obiectivele modelelor de codificare sau de decodificare, dar de obicei implică ceva un pic mai complex. De exemplu, [T5](https://huggingface.co/t5-base) este preinstruit prin înlocuirea unor intervale aleatorii de text (care pot conține mai multe cuvinte) cu un singur cuvânt special mascat, iar obiectivul este apoi de a prezice textul pe care îl înlocuiește acest cuvânt mascat.
+
+Modelele Sequence-to-sequence sunt cele mai potrivite pentru sarcinile care se învârt în jurul generării de noi propoziții în funcție de o intrare dată, cum ar fi rezumarea, traducerea sau răspunsul generativ la întrebări.
+
+Printre reprezentanții acestei familii de modele se numără:
+- [BART](https://huggingface.co/transformers/model_doc/bart)
+- [mBART](https://huggingface.co/transformers/model_doc/mbart)
+- [Marian](https://huggingface.co/transformers/model_doc/marian)
+- [T5](https://huggingface.co/transformers/model_doc/t5)
diff --git a/chapters/rum/chapter1/8.mdx b/chapters/rum/chapter1/8.mdx
new file mode 100644
index 000000000..5f6049d2a
--- /dev/null
+++ b/chapters/rum/chapter1/8.mdx
@@ -0,0 +1,31 @@
+# Prejudecăți și limitări[[prejudecăți-și-limitări]]
+
+<CourseFloatingBanner chapter={1}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter1/section8.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter1/section8.ipynb"},
+]} />
+
+În cazul în care intenționați să utilizați un model preinstruit sau o versiune ajustată în producție, vă rugăm să fiți conștienți de faptul că, deși aceste modele sunt instrumente puternice, ele au anumite limitări. Cea mai importantă dintre acestea este că, pentru a permite preinstruirea pe cantități mari de date, cercetătorii deseori extrag tot conținutul pe care îl pot găsi, luând atât ce este mai bun, cât și ce este mai rău din ceea ce este disponibil pe internet. 
+
+Pentru a oferi o ilustrare rapidă, să ne întoarcem la exemplul unui pipeline `fill-mask` cu modelul BERT:
+```python
+from transformers import pipeline
+
+unmasker = pipeline("fill-mask", model="bert-base-uncased")
+result = unmasker("This man works as a [MASK].")
+print([r["token_str"] for r in result])
+
+result = unmasker("This woman works as a [MASK].")
+print([r["token_str"] for r in result])
+```
+
+```python out
+['lawyer', 'carpenter', 'doctor', 'waiter', 'mechanic']
+['nurse', 'waitress', 'teacher', 'maid', 'prostitute']
+```
+
+Atunci când i se cere să completeze cuvântul care lipsește din aceste două propoziții, modelul dă un singur răspuns fără gen (chelner/ chelneriță). Celelalte sunt ocupații asociate de obicei cu un anumit gen - și da, „prostituată” a ajuns în primele 5 posibilități pe care modelul le asociază cu „femeie” și „muncă”. Acest lucru se întâmplă chiar dacă BERT este unul dintre puținele modele Transformer care nu este construit prin extragerea de date de pe întregul internet, ci mai degrabă folosind date aparent neutre (este antrenat pe seturile de date [English Wikipedia](https://huggingface.co/datasets/wikipedia) și [BookCorpus](https://huggingface.co/datasets/bookcorpus)). 
+
+Prin urmare, atunci când utilizați aceste instrumente, trebuie să aveți în minte faptul că modelul original pe care îl utilizați ar putea genera foarte ușor conținut sexist, rasist sau homofob. Reglarea fină a modelului pe baza datelor dumneavoastră nu va face ca această prejudecată intrinsecă să dispară.
\ No newline at end of file
diff --git a/chapters/rum/chapter1/9.mdx b/chapters/rum/chapter1/9.mdx
new file mode 100644
index 000000000..4d0cd5a4a
--- /dev/null
+++ b/chapters/rum/chapter1/9.mdx
@@ -0,0 +1,16 @@
+# Sumar[[sumar]]
+
+<CourseFloatingBanner
+    chapter={1}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+În acest capitol, ați văzut cum să abordați diferite sarcini NLP utilizând funcția de nivel înalt `pipeline()` din 🤗 Transformers. De asemenea, ați văzut cum să căutați și să utilizați modele în Hub, precum și cum să utilizați API-ul de inferență pentru a testa modelele direct în browser.
+
+Am discutat despre modul în care funcționează modelele Transformer la un nivel general și am vorbit despre importanța învățării prin transfer și a reglării fine. Un aspect cheie este faptul că puteți utiliza întreaga arhitectură sau doar codificatorul sau decodificatorul, în funcție de tipul de sarcină pe care doriți să o rezolvați. Următorul tabel rezumă acest aspect:
+
+| Model           | Exemple                                    | Task-uri                                                                           |
+|-----------------|--------------------------------------------|----------------------------------------------------------------------------------|
+| Encoder         | ALBERT, BERT, DistilBERT, ELECTRA, RoBERTa | Clasificarea propozițiilor, recunoașterea entităților denumite, Extractive QA    |
+| Decoder         | CTRL, GPT, GPT-2, Transformer XL           | Generarea de text                                                                |
+| Encoder-decoder | BART, T5, Marian, mBART                    | Rezumare, traducere, răspunsuri generative la întrebări                          |

From bc49d4d5835e7c9b2c25305cb16497a1cd3d9052 Mon Sep 17 00:00:00 2001
From: "ludmila.friptu" <ludmila.friptu@iucosoft.com>
Date: Sun, 20 Oct 2024 20:41:21 +0300
Subject: [PATCH 004/167] Add chapter 2 without the translation of the quiz

---
 chapters/rum/chapter2/1.mdx |  28 +++
 chapters/rum/chapter2/2.mdx | 364 ++++++++++++++++++++++++++++++++++++
 chapters/rum/chapter2/3.mdx | 235 +++++++++++++++++++++++
 chapters/rum/chapter2/4.mdx | 246 ++++++++++++++++++++++++
 chapters/rum/chapter2/5.mdx | 338 +++++++++++++++++++++++++++++++++
 chapters/rum/chapter2/6.mdx | 164 ++++++++++++++++
 chapters/rum/chapter2/7.mdx |  19 ++
 chapters/rum/chapter2/8.mdx | 310 ++++++++++++++++++++++++++++++
 8 files changed, 1704 insertions(+)
 create mode 100644 chapters/rum/chapter2/1.mdx
 create mode 100644 chapters/rum/chapter2/2.mdx
 create mode 100644 chapters/rum/chapter2/3.mdx
 create mode 100644 chapters/rum/chapter2/4.mdx
 create mode 100644 chapters/rum/chapter2/5.mdx
 create mode 100644 chapters/rum/chapter2/6.mdx
 create mode 100644 chapters/rum/chapter2/7.mdx
 create mode 100644 chapters/rum/chapter2/8.mdx

diff --git a/chapters/rum/chapter2/1.mdx b/chapters/rum/chapter2/1.mdx
new file mode 100644
index 000000000..75093a9f9
--- /dev/null
+++ b/chapters/rum/chapter2/1.mdx
@@ -0,0 +1,28 @@
+# Introducere[[introducere]]
+
+<CourseFloatingBanner
+    chapter={2}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+După cum ați văzut în [Capitolul 1](/course/chapter1), modelele Transformer sunt de obicei foarte voluminoase. Fiind alcătuite din milioane până la zeci de *miliarde* de parametri, instruirea și implementarea acestor modele este o sarcină complicată. În plus, cu noi modele lansate aproape zilnic și fiecare având propria sa implementare, testarea tuturor acestora nu este o sarcină ușoară.
+
+Biblioteca 🤗 Transformers a fost creată pentru a rezolva această problemă. Scopul său este de a oferi un singur API prin care orice model Transformer poate fi încărcat, instruit și salvat. Principalele caracteristici ale bibliotecii sunt:
+
+- ** Simplitate în utilizare**: Descărcarea, încărcarea și utilizarea unui model NLP de ultimă generație pentru inferență pot fi realizate în doar două linii de cod.
+- **Flexibilitate**: În esența lor, toate modelele sunt simple clase PyTorch `nn.Module` sau TensorFlow `tf.keras.Model` și pot fi manipulate ca orice alte modele în framework-urile lor respective de învățare automată (ML).
+- **Simplitate**: Aproape că nu se fac abstractizări în întreaga bibliotecă. „All in one file” este un concept de bază: trecerea înainte a unui model este definită în întregime într-un singur fișier, astfel încât codul în sine să fie ușor de înțeles și hackable.
+
+Această ultimă caracteristică face 🤗 Transformers destul de diferit de alte biblioteci ML. Modelele nu sunt construite pe module 
+care sunt partajate între fișiere; în schimb, fiecare model are propriile sale straturi. În plus, pe lângă faptul că modelele sunt mai ușor de abordat și de înțeles, acest lucru vă permite să experimentați cu ușurință pe un model fără a le afecta pe celelalte.
+
+Acest capitol va începe cu un exemplu end-to-end în care folosim împreună un model și un tokenizer pentru a replica funcția `pipeline()` introdusă în [Capitolul 1](/course/chapter1). În continuare, vom discuta despre API-ul modelului: vom analiza clasele de model și de configurare și vă vom arăta cum să încărcați un model și cum acesta procesează intrările numerice pentru a genera predicții. 
+
+Apoi vom analiza API-ul tokenizer, care este cealaltă componentă principală a funcției `pipeline()`. Tokenizerii se ocupă de prima și ultima etapă de procesare, gestionând conversia de la text la intrări numerice pentru rețeaua neuronală și conversia înapoi la text atunci când este necesar. În cele din urmă, vă vom arăta cum să vă ocupați de trimiterea mai multor propoziții printr-un model în cadrul unui lot pregătit, apoi vom încheia totul cu o examinare mai atentă a funcției  `tokenizer()`.
+
+
+<Tip>
+⚠️  
+Pentru a beneficia de toate funcțiile disponibile cu Model Hub și 🤗 Transformers, vă recomandăm <a href="https://huggingface.co/join">să vă creați un cont</a>.
+
+</Tip>
\ No newline at end of file
diff --git a/chapters/rum/chapter2/2.mdx b/chapters/rum/chapter2/2.mdx
new file mode 100644
index 000000000..b0f1c4855
--- /dev/null
+++ b/chapters/rum/chapter2/2.mdx
@@ -0,0 +1,364 @@
+<FrameworkSwitchCourse {fw} />
+
+# În spatele pipeline-ului[[în-spatele-pipeline-ului]]
+
+{#if fw === 'pt'}
+
+<CourseFloatingBanner chapter={2}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section2_pt.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section2_pt.ipynb"},
+]} />
+
+{:else}
+
+<CourseFloatingBanner chapter={2}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section2_tf.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section2_tf.ipynb"},
+]} />
+
+{/if}
+
+<Tip>
+ 
+Aceasta este prima secțiune în care conținutul este ușor diferit în funcție de utilizarea PyTorch sau TensorFlow. Schimbați comutatorul din partea de sus a titlului pentru a selecta platforma pe care o preferați!
+</Tip>
+
+{#if fw === 'pt'}
+<Youtube id="1pedAIvTWXk"/>
+{:else}
+<Youtube id="wVN12smEvqg"/>
+{/if}
+
+Să începem cu un exemplu complet, aruncând o privire la ceea ce s-a întâmplat în spate atunci când am executat următorul cod în [Capitolul 1](/curs/capitol1):
+
+
+```python
+from transformers import pipeline
+
+classifier = pipeline("sentiment-analysis")
+classifier(
+    [
+        "I've been waiting for a HuggingFace course my whole life.",
+        "I hate this so much!",
+    ]
+)
+```
+
+și am obținut:
+
+```python out
+[{'label': 'POSITIVE', 'score': 0.9598047137260437},
+ {'label': 'NEGATIVE', 'score': 0.9994558095932007}]
+```
+
+După cum am văzut în [Capitolul 1](/course/chapter1), acest pipeline grupează trei etape: preprocesarea, trecerea intrărilor prin model și postprocesarea:
+
+<div class="flex justify-center">
+<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/full_nlp_pipeline.svg" alt="The full NLP pipeline: tokenization of text, conversion to IDs, and inference through the Transformer model and the model head."/>
+<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/full_nlp_pipeline-dark.svg" alt="The full NLP pipeline: tokenization of text, conversion to IDs, and inference through the Transformer model and the model head."/>
+</div>
+
+Să trecem rapid prin fiecare dintre acestea.
+
+## Preprocesarea cu un tokenizator[[preprocesarea-cu-un-tokenizerator]]
+
+La fel ca alte rețele neuronale, modelele Transformer nu pot procesa direct text brut, astfel încât primul pas al pipeline-ului nostru este de a converti intrările de text în numere pe care modelul le poate înțelege. Pentru a face acest lucru, folosim un *tokenizer*, care va fi responsabil pentru:
+
+- Împărțirea datelor de intrare în cuvinte, părți de cuvinte sau simboluri (cum ar fi punctuația) care se numesc *tokens*
+- Maparea fiecărui token într-un număr întreg
+- Adăugarea de intrări suplimentare care pot fi utile pentru model
+
+Toată această preprocesare trebuie efectuată exact în același mod ca atunci când modelul a fost preinstruit, așa că mai întâi trebuie să descărcăm aceste informații din [Model Hub] (https://huggingface.co/models). Pentru a face acest lucru, folosim clasa `AutoTokenizer` și metoda sa `from_pretrained()`. Folosind numele checkpoint-ului modelului nostru, aceasta va prelua automat datele asociate cu tokenizer-ul modelului și le va stoca în cache (astfel încât acestea să fie descărcate doar prima dată când executați codul de mai jos).
+
+Deoarece punctul de control implicit al pipeline-ului `sentiment-analysis` este `distilbert-base-uncased-finetuned-sst-2-english` (puteți vedea fișa modelului [aici](https://huggingface.co/distilbert-base-uncased-finetuned-sst-2-english)), executăm următoarele:
+
+```python
+from transformers import AutoTokenizer
+
+checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
+tokenizer = AutoTokenizer.from_pretrained(checkpoint)
+```
+
+Odată ce avem tokenizatorul, putem să îi transmitem direct propozițiile noastre și vom primi înapoi un dicționar care este gata să fie introdus în modelul nostru! Singurul lucru rămas de făcut este să convertim lista de ID-uri de intrare în tensori.
+
+Puteți utiliza 🤗 Transformers fără a trebui să vă faceți griji cu privire la cadrul ML utilizat ca backend; ar putea fi PyTorch sau TensorFlow, sau Flax pentru unele modele. Cu toate acestea, modelele Transformer acceptă numai *tensori * ca intrare. Dacă este prima dată când auziți despre tensori, vă puteți gândi la ei ca la matrici NumPy. Un array NumPy poate fi un scalar (0D), un vector (1D), o matrice (2D) sau poate avea mai multe dimensiuni. Este de fapt un tensor; tensorii altor cadre ML se comportă similar și sunt de obicei la fel de simplu de instanțiat ca și array-urile NumPy.
+
+Pentru a specifica tipul de tensori pe care dorim să îi primim înapoi (PyTorch, TensorFlow sau NumPy simplu), folosim argumentul `return_tensors`:
+
+
+{#if fw === 'pt'}
+```python
+raw_inputs = [
+    "I've been waiting for a HuggingFace course my whole life.",
+    "I hate this so much!",
+]
+inputs = tokenizer(raw_inputs, padding=True, truncation=True, return_tensors="pt")
+print(inputs)
+```
+{:else}
+```python
+raw_inputs = [
+    "I've been waiting for a HuggingFace course my whole life.",
+    "I hate this so much!",
+]
+inputs = tokenizer(raw_inputs, padding=True, truncation=True, return_tensors="tf")
+print(inputs)
+```
+{/if}
+
+ 
+Nu vă faceți încă griji cu privire la padding și trunchiere; le vom explica mai târziu. Principalele lucruri de reținut aici sunt că puteți trece o propoziție sau o listă de propoziții, precum și specificarea tipului de tensori pe care doriți să îi primiți înapoi (dacă nu este trecut niciun tip, veți primi o listă de liste ca rezultat)
+{#if fw === 'pt'}
+
+Iată cum arată rezultatele ca tensori PyTorch:
+
+```python out
+{
+    'input_ids': tensor([
+        [  101,  1045,  1005,  2310,  2042,  3403,  2005,  1037, 17662, 12172, 2607,  2026,  2878,  2166,  1012,   102],
+        [  101,  1045,  5223,  2023,  2061,  2172,   999,   102,     0,     0,     0,     0,     0,     0,     0,     0]
+    ]), 
+    'attention_mask': tensor([
+        [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
+        [1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0]
+    ])
+}
+```
+{:else}
+
+Iată cum arată rezultatele ca tensori TensorFlow:
+
+```python out
+{
+    'input_ids': <tf.Tensor: shape=(2, 16), dtype=int32, numpy=
+        array([
+            [  101,  1045,  1005,  2310,  2042,  3403,  2005,  1037, 17662, 12172,  2607,  2026,  2878,  2166,  1012,   102],
+            [  101,  1045,  5223,  2023,  2061,  2172,   999,   102,     0,     0,     0,     0,     0,     0,     0,     0]
+        ], dtype=int32)>, 
+    'attention_mask': <tf.Tensor: shape=(2, 16), dtype=int32, numpy=
+        array([
+            [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
+            [1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0]
+        ], dtype=int32)>
+}
+```
+{/if}
+
+ 
+Rezultatul în sine este un dicționar care conține două chei, `input_ids` și `attention_mask`. `input_ids` conține două rânduri de numere întregi (unul pentru fiecare propoziție) care sunt identificatorii unici ai simbolurilor din fiecare propoziție. Vom explica ce este `attention_mask` mai târziu în acest capitol. 
+
+## Parcurgerea modelului[[parcurgerea-modelului]]
+
+{#if fw === 'pt'}
+Putem descărca modelul nostru preinstruit în același mod în care am făcut-o cu tokenizatorul nostru. 🤗 Transformers oferă o clasă `AutoModel` care are și o metodă `from_pretrained()`:
+
+```python
+from transformers import AutoModel
+
+checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
+model = AutoModel.from_pretrained(checkpoint)
+```
+{:else}
+ 
+Putem descărca modelul nostru preinstruit în același mod în care am făcut-o cu tokenizatorul nostru. 🤗 Transformers oferă o clasă `TFAutoModel` care are și o metodă `from_pretrained`:
+
+```python
+from transformers import TFAutoModel
+
+checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
+model = TFAutoModel.from_pretrained(checkpoint)
+```
+{/if}
+
+ 
+În acest fragment de cod, am descărcat același checkpoint pe care l-am folosit anterior în pipeline-ul nostru (de fapt, ar fi trebuit să fie deja în cache) și am instanțiat un model cu acesta.
+
+Această arhitectură conține doar modulul Transformer de bază: având în vedere anumite intrări, acesta produce ceea ce vom numi *stări ascunse*, cunoscute și ca *caracteristici*. Pentru fiecare intrare a modelului, vom extrage un vector înalt-dimensional care reprezintă **înțelegerea contextuală a intrării respective de către modelul Transformer**.
+
+Dacă acest lucru nu are sens, nu vă faceți griji. Vom explica totul mai târziu.
+
+Deși aceste stări ascunse pot fi utile pe cont propriu, ele sunt de obicei intrări pentru o altă parte a modelului, cunoscută sub numele de *head*. În [Capitolul 1](/curs/capitol1), diferitele sarcini ar fi putut fi efectuate cu aceeași arhitectură, dar fiecăreia dintre aceste sarcini îi va fi asociat un head diferit.
+
+### Un vector multidimensional?[[un-vector-multidimensional]]
+
+ 
+Vectorul emis de modulul Transformator este de obicei de dimensiuni mari. Acesta are în general trei dimensiuni:
+
+- **Dimensiunea lotului**: Numărul de secvențe prelucrate simultan (2 în exemplul nostru).
+- **Lungimea secvenței**: Lungimea reprezentării numerice a secvenței (16 în exemplul nostru).
+- **Dimensiunea ascunsă**: Dimensiunea vectorială a fiecărei intrări a modelului.
+
+Se spune că este multidimensional din cauza ultimei valori. Dimensiunea ascunsă poate fi foarte mare (768 este comună pentru modelele mai mici, iar în modelele mai mari aceasta poate ajunge la 3072 sau mai mult).
+
+Putem vedea acest lucru dacă introducem în modelul nostru intrările pe care le-am preprocesat:
+
+{#if fw === 'pt'}
+```python
+outputs = model(**inputs)
+print(outputs.last_hidden_state.shape)
+```
+
+```python out
+torch.Size([2, 16, 768])
+```
+{:else}
+```py
+outputs = model(inputs)
+print(outputs.last_hidden_state.shape)
+```
+
+```python out
+(2, 16, 768)
+```
+{/if}
+
+ 
+Rețineți că ieșirile modelelor 🤗 Transformers se comportă ca `namedtuple`s sau dicționare. Puteți accesa elementele prin atribute (așa cum am făcut noi) sau prin cheie (`outputs[„last_hidden_state”]`), sau chiar prin index dacă știți exact unde se află lucrul pe care îl căutați (`outputs[0]`).
+
+### Modele de head-uri: Înțelegerea numerelor[modele-de-head-uri-înțelegerea-numerelor]]
+
+Head-urile modelelor iau ca intrare vectorul multidimensional al stărilor ascunse și le proiectează pe o altă dimensiune. Acestea sunt de obicei compuse din unul sau câteva straturi liniare:
+
+<div class="flex justify-center">
+<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/transformer_and_head.svg" alt="A Transformer network alongside its head."/>
+<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/transformer_and_head-dark.svg" alt="A Transformer network alongside its head."/>
+</div>
+
+ 
+Rezultatul modelului Transformer este trimis direct la head-ul modelului pentru a fi prelucrat.
+
+În această diagramă, modelul este reprezentat de stratul său de încorporare și de straturile următoare. Stratul de încorporare convertește fiecare ID de intrare din intrarea tokenizată într-un vector care reprezintă tokenul asociat. Straturile ulterioare manipulează acești vectori folosind mecanismul de atenție pentru a produce reprezentarea finală a propozițiilor.
+
+Există multe arhitecturi diferite disponibile în 🤗 Transformers, fiecare fiind concepută în jurul abordării unei sarcini specifice. Iată o listă neexhaustivă:
+
+- `*Model` (extragerea stărilor ascunse)
+- `*ForCausalLM`
+- `*ForMaskedLM`
+- `*ForMultipleChoice`
+- `*ForQuestionAnswering`
+- `*ForSequenceClassification`
+- `*ForTokenClassification`
+- și altele 🤗
+
+{#if fw === 'pt'}
+ Pentru exemplul nostru, vom avea nevoie de un model cu un head de clasificare a secvențelor (pentru a putea clasifica propozițiile ca fiind pozitive sau negative). Așadar, nu vom utiliza clasa `AutoModel`, ci `AutoModelForSequenceClassification`:
+
+```python
+from transformers import AutoModelForSequenceClassification
+
+checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
+model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
+outputs = model(**inputs)
+```
+{:else}
+ Pentru exemplul nostru, vom avea nevoie de un model cu un head de clasificare a secvențelor (pentru a putea clasifica propozițiile ca fiind pozitive sau negative). Așadar, nu vom utiliza clasa `TFAutoModel`, ci `TFAutoModelForSequenceClassification`:
+
+```python
+from transformers import TFAutoModelForSequenceClassification
+
+checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
+model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint)
+outputs = model(inputs)
+```
+{/if}
+ 
+Acum, dacă ne uităm la forma ieșirilor noastre, dimensiunea va fi mult mai mică: head-ul modelului ia ca intrare vectorii multidimensionali pe care i-am văzut înainte și scoate vectori care conțin două valori (una pentru fiecare etichetă):
+
+```python
+print(outputs.logits.shape)
+```
+
+{#if fw === 'pt'}
+```python out
+torch.Size([2, 2])
+```
+{:else}
+```python out
+(2, 2)
+```
+{/if}
+
+ 
+Deoarece avem doar două propoziții și două etichete, rezultatul pe care îl obținem din modelul nostru este de forma 2 x 2.
+
+## Postprocesarea rezultatului[[postprocesarea-rezultatului]]
+
+Valorile pe care le obținem ca rezultat al modelului nostru nu au neapărat sens în sine. Să aruncăm o privire:
+
+```python
+print(outputs.logits)
+```
+
+{#if fw === 'pt'}
+```python out
+tensor([[-1.5607,  1.6123],
+        [ 4.1692, -3.3464]], grad_fn=<AddmmBackward>)
+```
+{:else}
+```python out
+<tf.Tensor: shape=(2, 2), dtype=float32, numpy=
+    array([[-1.5606991,  1.6122842],
+           [ 4.169231 , -3.3464472]], dtype=float32)>
+```
+{/if}
+
+Modelul nostru a prezis `[-1.5607, 1.6123]` pentru prima propoziție și `[ 4.1692, -3.3464]` pentru cea de-a doua. Acestea nu sunt probabilități, ci *logits*, scorurile brute, nenormalizate, emise de ultimul strat al modelului. Pentru a fi convertite în probabilități, acestea trebuie să treacă printr-un strat [SoftMax](https://en.wikipedia.org/wiki/Softmax_function) (toate modelele 🤗 Transformers produc logits, deoarece funcția de pierdere pentru formare va fuziona în general ultima funcție de activare, cum ar fi SoftMax, cu funcția de pierdere reală, cum ar fi entropia încrucișată):
+
+{#if fw === 'pt'}
+```py
+import torch
+
+predictions = torch.nn.functional.softmax(outputs.logits, dim=-1)
+print(predictions)
+```
+{:else}
+```py
+import tensorflow as tf
+
+predictions = tf.math.softmax(outputs.logits, axis=-1)
+print(predictions)
+```
+{/if}
+
+{#if fw === 'pt'}
+```python out
+tensor([[4.0195e-02, 9.5980e-01],
+        [9.9946e-01, 5.4418e-04]], grad_fn=<SoftmaxBackward>)
+```
+{:else}
+```python out
+tf.Tensor(
+[[4.01951671e-02 9.59804833e-01]
+ [9.9945587e-01 5.4418424e-04]], shape=(2, 2), dtype=float32)
+```
+{/if}
+
+ 
+Acum putem vedea că modelul a prezis `[0.0402, 0.9598]` pentru prima propoziție și `[0.9995, 0.0005]` pentru cea de-a doua. Acestea sunt scoruri de probabilitate care pot fi recunoscute.
+
+Pentru a obține etichetele corespunzătoare fiecărei poziții, putem inspecta atributul `id2label` din configurația modelului (mai multe despre acest lucru în secțiunea următoare):
+
+```python
+model.config.id2label
+```
+
+```python out
+{0: 'NEGATIVE', 1: 'POSITIVE'}
+```
+Acum putem concluziona că modelul a prezis următoarele:
+ 
+- Prima propoziție: NEGATIV: 0,0402, POZITIV: 0,9598
+- A doua propoziție: NEGATIVĂ: 0,9995, POZITIVĂ: 0,0005
+
+Am reprodus cu succes cele trei etape ale pipeline-ului: preprocesarea cu tokenizere, trecerea intrărilor prin model și postprocesarea! Acum haideți să analizăm în profunzime fiecare dintre aceste etape.
+
+<Tip>
+
+✏️  
+** Încercați!** Alegeți două (sau mai multe) texte proprii și treceți-le prin conducta `sentiment-analysis`. Apoi repetați pașii pe care i-ați văzut aici și verificați dacă obțineți aceleași rezultate!
+
+</Tip>
diff --git a/chapters/rum/chapter2/3.mdx b/chapters/rum/chapter2/3.mdx
new file mode 100644
index 000000000..e0f0758df
--- /dev/null
+++ b/chapters/rum/chapter2/3.mdx
@@ -0,0 +1,235 @@
+<FrameworkSwitchCourse {fw} />
+
+# Modele[[modele]]
+
+{#if fw === 'pt'}
+
+<CourseFloatingBanner chapter={2}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section3_pt.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section3_pt.ipynb"},
+]} />
+
+{:else}
+
+<CourseFloatingBanner chapter={2}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section3_tf.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section3_tf.ipynb"},
+]} />
+
+{/if}
+
+{#if fw === 'pt'}
+<Youtube id="AhChOFRegn4"/>
+{:else}
+<Youtube id="d3JVgghSOew"/>
+{/if}
+
+{#if fw === 'pt'}
+ 
+În această secțiune vom analiza mai detaliat crearea și utilizarea unui model. Vom folosi clasa `AutoModel`, care este utilă atunci când doriți să instanțiați orice model dintr-un checkpoint.
+
+Clasa `AutoModel` și toate celelalte clase înrudite sunt, de fapt, simple wrappere ale gamei largi de modele disponibile în bibliotecă. Este un wrapper inteligent, deoarece poate ghici automat arhitectura modelului corespunzător pentru checkpoint-ul dumneavoastră și apoi instanțiază un model cu această arhitectură.
+
+{:else}
+ 
+În această secțiune vom analiza mai detaliat crearea și utilizarea unui model. Vom utiliza clasa `TFAutoModel`, care este utilă atunci când doriți să instanțați un model dintr-un checkpoint.
+
+Clasa `TFAutoModel` și toate clasele înrudite cu aceasta sunt de fapt simple wrappere ale gamei largi de modele disponibile în bibliotecă. Este un wrapper inteligent, deoarece poate ghici automat arhitectura modelului corespunzător pentru checkpoint-ul dumneavoastră și apoi instanțiază un model cu această arhitectură.
+
+{/if}
+
+Cu toate acestea, dacă știți ce tip de model doriți să utilizați, puteți folosi direct clasa care definește arhitectura acestuia. Să aruncăm o privire la modul în care funcționează acest lucru cu un model BERT.
+
+## Crearea unui Transformer[[crearea-unui-transformer]]
+
+Primul lucru pe care va trebui să îl facem pentru a inițializa un model BERT este să încărcăm un obiect de configurare:
+
+{#if fw === 'pt'}
+```py
+from transformers import BertConfig, BertModel
+
+# Construirea configurației
+config = BertConfig()
+
+# Construirea modelului pornind de la configurație
+model = BertModel(config)
+```
+{:else}
+```py
+from transformers import BertConfig, TFBertModel
+
+# Construirea configurației
+config = BertConfig()
+
+#  Construirea modelului pornind de la configurație
+model = TFBertModel(config)
+```
+{/if}
+
+Configurația conține multe atribute care sunt utilizate pentru a construi modelul:
+
+```py
+print(config)
+```
+
+```python out
+BertConfig {
+  [...]
+  "hidden_size": 768,
+  "intermediate_size": 3072,
+  "max_position_embeddings": 512,
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  [...]
+}
+```
+
+Deși nu ați văzut încă ce fac toate aceste atribute, ar trebui să recunoașteți unele dintre ele: atributul `hidden_size` definește dimensiunea vectorului `hidden_states`, iar `num_hidden_layers` definește numărul de straturi pe care le are modelul Transformer.
+
+### Diferite metode de încărcare[[diferite-metode-de-încărcare]]
+
+Crearea unui model din configurația implicită îl inițializează cu valori aleatorii:
+
+
+{#if fw === 'pt'}
+```py
+from transformers import BertConfig, BertModel
+
+config = BertConfig()
+model = BertModel(config)
+
+# Modelul este inițializat aleatoriu!
+```
+{:else}
+```py
+from transformers import BertConfig, TFBertModel
+
+config = BertConfig()
+model = TFBertModel(config)
+
+# Modelul este inițializat aleatoriu!
+```
+{/if}
+
+Modelul poate fi utilizat în această stare, dar va produce rezultate neclare; mai întâi trebuie să fie antrenat. Am putea antrena modelul de la zero pentru sarcina în cauză, dar, după cum ați văzut în [Capitolul 1](/course/chapter1), acest lucru ar necesita mult timp și o mulțime de date și ar avea un impact semnificativ asupra mediului. Pentru a evita efortul inutil, este esențial să puteți partaja și reutiliza modelele care au fost deja formate.
+
+Încărcarea unui model Transformer care este deja instruit este simplă - putem face acest lucru utilizând metoda `from_pr
+
+{#if fw === 'pt'}
+```py
+from transformers import BertModel
+
+model = BertModel.from_pretrained("bert-base-cased")
+```
+
+După cum ați văzut mai devreme, am putea înlocui `BertModel` cu clasa `AutoModel` echivalentă. Vom face acest lucru în continuare, deoarece acest lucru produce un cod compatibil cu checkpoint-urile; dacă codul dumneavoastră funcționează pentru un checkpoint, ar trebui să funcționeze fără probleme pentru altul. Acest lucru este valabil chiar dacă arhitectura este diferită, atât timp cât checkpoint-ul a fost instruit pentru o sarcină similară (de exemplu, o sarcină de analiză a sentimentelor).
+
+{:else}
+```py
+from transformers import TFBertModel
+
+model = TFBertModel.from_pretrained("bert-base-cased")
+```
+
+După cum ați văzut mai devreme, am putea înlocui `BertModel` cu clasa `AutoModel` echivalentă. Vom face acest lucru în continuare, deoarece acest lucru produce un cod compatibil cu checkpoint-urile; dacă codul dumneavoastră funcționează pentru un checkpoint, ar trebui să funcționeze fără probleme pentru altul. Acest lucru este valabil chiar dacă arhitectura este diferită, atât timp cât checkpoint-ul a fost instruit pentru o sarcină similară (de exemplu, o sarcină de analiză a sentimentelor).
+
+{/if}
+
+În exemplul de cod de mai sus nu am utilizat `BertConfig` și, în loc de acesta, am încărcat un model preinstruit prin intermediul identificatorului `bert-base-cased`. Acesta este un checkpoint al modelului care a fost antrenat chiar de autorii BERT; puteți găsi mai multe detalii despre acesta în [model card](https://huggingface.co/bert-base-cased).
+
+Acest model este acum inițializat cu toate weight-urile din checkpoint. Acesta poate fi utilizat direct pentru inferență pe sarcinile pe care a fost antrenat și poate fi, de asemenea, ajustat pe o sarcină nouă. Prin antrenarea cu weight-uri instruite în prealabil, putem obține rapid rezultate bune.
+
+Greutățile au fost descărcate și stocate în cache (astfel încât apelurile viitoare la metoda `from_pretrained()` nu le vor descărca din nou) în folderul cache, care are ca valoare implicită *~/.cache/huggingface/transformers*. Puteți personaliza folderul cache prin setarea variabilei de mediu `HF_HOME`.
+
+Identificatorul utilizat pentru încărcarea modelului poate fi identificatorul oricărui model de pe Model Hub, atâta timp cât acesta este compatibil cu arhitectura OARET. Lista completă a  checkpoint-urilor OARET disponibile poate fi găsită [aici](https://huggingface.co/models?filter=bert).
+
+
+### Metode de păstrare[[metode-de-păstrare]]
+
+Salvarea unui model este la fel de ușoară ca încărcarea unuia - folosim metoda `save_pretrained()`, care este analogă metodei `from_pretrained()`:
+
+```py
+model.save_pretrained("directory_on_my_computer")
+```
+
+Se salvează două fișiere pe disc:
+
+{#if fw === 'pt'}
+```
+ls directory_on_my_computer
+
+config.json pytorch_model.bin
+```
+{:else}
+```
+ls directory_on_my_computer
+
+config.json tf_model.h5
+```
+{/if}
+
+Dacă aruncați o privire la fișierul *config.json*, veți recunoaște atributele necesare pentru construirea arhitecturii modelului. Acest fișier conține, de asemenea, unele metadate, cum ar fi locul de origine al checkpoint-ului și ce versiune 🤗 Transformers ați folosit când ați salvat ultima dată checkpoint-ul.
+
+{#if fw === 'pt'}
+ 
+Fișierul *pytorch_model.bin* este cunoscut sub numele de *state dictionary*; acesta conține toate weight-urile modelului dumneavoastră. Cele două fișiere merg mână în mână; configurația este necesară pentru a cunoaște arhitectura modelului, în timp ce weight-urile modelului sunt parametrii modelului.
+
+{:else}
+ 
+Fișierul *tf_model.h5* este cunoscut sub numele de *state dictionary*; acesta conține toate weight-urile modelului dumneavoastră. Cele două fișiere merg mână în mână; configurația este necesară pentru a cunoaște arhitectura modelului, în timp ce weight-urile modelului sunt parametrii modelului.
+
+{/if}
+
+## Utilizarea unui model Transformer pentru inferență[[utilizarea-unui-model-transformer-pentru-inferență]]
+
+
+Acum că știți cum să încărcați și să salvați un model, să încercăm să îl folosim pentru a face câteva predicții. Modelele Transformer pot procesa doar numere - numere pe care le generează tokenizatorul. Dar înainte de a discuta despre tokenizeri, să explorăm ce intrări acceptă modelul.
+
+Tokenizerii se pot ocupa de transformarea intrărilor în tensori ai framework-ului corespunzător, dar pentru a vă ajuta să înțelegeți ce se întâmplă, vom arunca o privire rapidă la ceea ce trebuie făcut înainte de trimiterea intrărilor către model.
+
+Să spunem că avem câteva secvențe:
+
+```py
+sequences = ["Hello!", "Cool.", "Nice!"]
+```
+
+Tokenizatorul le convertește în indici de vocabular care sunt denumiți în mod obișnuit *input IDs*. Fiecare secvență este acum o listă de numere! Rezultatul este:
+
+```py no-format
+encoded_sequences = [
+    [101, 7592, 999, 102],
+    [101, 4658, 1012, 102],
+    [101, 3835, 999, 102],
+]
+```
+
+Aceasta este o listă de secvențe codificate: o listă de liste. Tensorii acceptă numai forme dreptunghiulare (gândiți-vă la matrici). Această " listă " are deja o formă dreptunghiulară, astfel încât convertirea sa într-un tensor este ușoară:
+
+{#if fw === 'pt'}
+```py
+import torch
+
+model_inputs = torch.tensor(encoded_sequences)
+```
+{:else}
+```py
+import tensorflow as tf
+
+model_inputs = tf.constant(encoded_sequences)
+```
+{/if}
+
+### Utilizarea tensorilor ca intrări în model[[utilizarea-tensorilor-ca-intrări-în-to-model]]
+
+Utilizarea tensorilor cu ajutorul modelului este extrem de simplă - trebuie doar să apelăm modelul cu intrările:
+
+```py
+output = model(model_inputs)
+```
+
+Deși modelul acceptă o mulțime de argumente diferite, doar ID-urile de intrare sunt necesare. Vom explica mai târziu ce fac celelalte argumente și când sunt necesare, 
+dar mai întâi trebuie să aruncăm o privire mai atentă la tokenizerii care construiesc intrările pe care un model Transformer le poate înțelege.
\ No newline at end of file
diff --git a/chapters/rum/chapter2/4.mdx b/chapters/rum/chapter2/4.mdx
new file mode 100644
index 000000000..c38234e14
--- /dev/null
+++ b/chapters/rum/chapter2/4.mdx
@@ -0,0 +1,246 @@
+<FrameworkSwitchCourse {fw} />
+
+# Tokenizere[[tokenizere]]
+
+{#if fw === 'pt'}
+
+<CourseFloatingBanner chapter={2}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section4_pt.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section4_pt.ipynb"},
+]} />
+
+{:else}
+
+<CourseFloatingBanner chapter={2}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section4_tf.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section4_tf.ipynb"},
+]} />
+
+{/if}
+
+<Youtube id="VFp38yj8h3A"/>
+
+
+Tokenizoarele sunt una dintre componentele de bază ale pipeline-ului NLP. Acestea au un singur scop: să transforme textul în date care pot fi prelucrate de model. Modelele pot procesa doar numere, astfel încât tokenizerii trebuie să convertească intrările noastre de text în date numerice. În această secțiune, vom explora exact ce se întâmplă în pipeline-ul de tokenizare. 
+
+În sarcinile NLP, datele care sunt în general prelucrate sunt text brut. Iată un exemplu de astfel de text:
+
+```
+Jim Henson was a puppeteer
+
+```
+
+Cu toate acestea, modelele pot procesa doar numere, deci trebuie să găsim o modalitate de a converti textul brut în numere. Asta fac tokenizerii și există o mulțime de modalități de a face acest lucru. Scopul este de a găsi cea mai relevantă reprezentare - adică cea care are cel mai mare sens pentru model - și, dacă este posibil, cea mai mică reprezentare.
+
+Să aruncăm o privire la câteva exemple de algoritmi de tokenizare și să încercăm să răspundem la unele dintre întrebările pe care le puteți avea despre tokenizare.
+
+
+
+## Word-based[[word-based]]
+
+<Youtube id="nhJxYji1aho"/>
+
+ 
+Primul tip de tokenizator care îmi vine în minte este _word-based_. În general, este foarte ușor de configurat și de utilizat, cu doar câteva reguli, și adesea produce rezultate satisfăcătoare. De exemplu, în imaginea de mai jos, obiectivul este de a împărți textul brut în cuvinte și de a găsi o reprezentare numerică pentru fiecare dintre ele:
+
+<div class="flex justify-center">
+  <img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/word_based_tokenization.svg" alt="An example of word-based tokenization."/>
+  <img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/word_based_tokenization-dark.svg" alt="An example of word-based tokenization."/>
+</div>
+
+ 
+Există diferite moduri de a împărți textul. De exemplu, am putea folosi spațiu pentru a tokeniza textul în cuvinte prin aplicarea funcției `split()` din Python:
+
+ 
+```py
+tokenized_text = "Jim Henson was a puppeteer".split()
+print(tokenized_text)
+```
+
+```python out
+['Jim', 'Henson', 'was', 'a', 'puppeteer']
+```
+
+Există, de asemenea, variații ale tokenizerelor de cuvinte care au reguli suplimentare pentru punctuație. Cu acest tip de tokenizator, putem ajunge la „vocabulare” destul de mari, unde un vocabular este definit de numărul total de token-uri independente pe care le avem în corpus.
+
+Fiecărui cuvânt i se atribuie un ID, începând de la 0 și mergând până la dimensiunea vocabularului. Modelul utilizează aceste ID-uri pentru a identifica fiecare cuvânt.
+
+Dacă dorim să acoperim complet o limbă cu un tokenizer bazat pe cuvinte, va trebui să avem un identificator pentru fiecare cuvânt din limbă, ceea ce va genera o cantitate uriașă de token-uri. De exemplu, există peste 500 000 de cuvinte în limba engleză, astfel încât, pentru a construi o hartă de la fiecare cuvânt la un ID de intrare, ar trebui să ținem evidența unui număr atât de mare de ID-uri. În plus, cuvinte precum „dog” sunt reprezentate diferit de cuvinte precum „dogs”, iar modelul nu va avea inițial nicio modalitate de a ști că „dog” și „dogs” sunt similare: va identifica cele două cuvinte ca neavând legătură. Același lucru este valabil și pentru alte cuvinte similare, precum „run” și „running”, pe care modelul nu le va vedea inițial ca fiind similare.
+
+În cele din urmă, avem nevoie de un token personalizat pentru a reprezenta cuvintele care nu se află în vocabularul nostru. Acesta este cunoscut sub numele de token "necunoscut", adesea reprezentat ca "[UNK]" sau "&lt;unk&gt;". În general, este un indiciu rău dacă vedeți că tokenizatorul produce o mulțime de astfel de token-uri, deoarece nu a fost capabil să recupereze reprezentarea sensibilă a unui cuvânt și veți pierde informații pe parcurs. Scopul elaborării vocabularului este de a face în așa fel încât tokenizatorul să tokenizeze cât mai puține cuvinte posibil în tokenul necunoscut.
+
+O modalitate de a reduce numărul de token-uri necunoscute este de a merge un nivel mai adânc, folosind un tokenizer _character-based_.
+
+## Character-based[[character-based]]
+
+<Youtube id="ssLq_EK2jLE"/>
+
+
+Tokenizerele character-based împart textul în caractere, și nu în cuvinte. Acest lucru are două beneficii principale:
+
+- Dimensiunea vocabularului este mult mai mică.
+- Există mult mai puține token-uri în afara vocabularului (necunoscute), deoarece fiecare cuvânt poate fi construit din caractere.
+
+Dar și aici apar unele probleme legate de spații și punctuație:
+
+
+<div class="flex justify-center">
+  <img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/character_based_tokenization.svg" alt="An example of character-based tokenization."/>
+  <img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/character_based_tokenization-dark.svg" alt="An example of character-based tokenization."/>
+</div>
+
+ 
+Nici această abordare nu este perfectă. Deoarece reprezentarea se bazează acum pe caractere și nu pe cuvinte, s-ar putea spune că, din punct de vedere intuitiv, este mai puțin relevantă: fiecare caracter nu înseamnă mult în sine, în timp ce în cazul cuvintelor situația este diferită. Totuși, acest lucru variază din nou în funcție de limbă; în chineză, de exemplu, fiecare caracter conține mai multe informații decât un caracter într-o limbă latină.
+
+Un alt lucru care trebuie luat în considerare este faptul că ne vom trezi cu o cantitate foarte mare de token-uri care vor fi prelucrate de modelul nostru: în timp ce un cuvânt ar fi un singur token cu un tokenizator bazat pe cuvinte, acesta se poate transforma cu ușurință în 10 sau mai multe token-uri atunci când este convertit în caractere.
+
+Pentru a obține ce este mai bun din ambele lumi, putem utiliza o a treia tehnică care combină cele două abordări: *subword tokenization*.
+
+## Subword tokenization[[subword-tokenization]]
+
+<Youtube id="zHvTiHr506c"/>
+
+Algoritmii "Subword Tokenization " se bazează pe principiul conform căruia cuvintele utilizate frecvent nu ar trebui să fie împărțite în cuvinte secundare mai mici, dar cuvintele rare ar trebui să fie descompuse în cuvinte secundare semnificative.
+
+De exemplu, " annoyingly " ar putea fi considerat un cuvânt rar și ar putea fi descompus în " annoying " și " ly ". Este probabil ca ambele să apară mai frecvent ca subcuvinte de sine stătătoare, în timp ce, în același timp, sensul cuvântului " annoyingly " este păstrat de sensul compus al cuvintelor " annoying " și " ly ".
+
+Iată un exemplu care arată modul în care un algoritm de subword tokenization ar tokeniza secvența "Let's do tokenization!":
+
+<div class="flex justify-center">
+  <img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/bpe_subword.svg" alt="A subword tokenization algorithm."/>
+  <img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/bpe_subword-dark.svg" alt="A subword tokenization algorithm."/>
+</div>
+
+Aceste părți de cuvinte oferă în cele din urmă o mulțime de semnificații semantice: în exemplul de mai sus, "tokenization" a fost împărțit în "token" și "ization", două cuvinte care au o semnificație semantică, fiind în același timp eficiente din punct de vedere al spațiului (sunt necesare doar două cuvinte pentru a reprezenta un cuvânt lung). Acest lucru ne permite să avem o acoperire relativ bună cu vocabulare de dimensiuni mici și aproape fără token-uri necunoscute.
+
+Această abordare este utilă în special în limbile aglutinative, cum ar fi turca, în care se pot forma cuvinte complexe (aproape) arbitrar de lungi prin combinarea părților de cuvinte.
+
+### Și nu numai![[și-nu-numai]]
+
+Nu este surprinzător faptul că există mult mai multe tehnici. Iată câteva:
+
+- BPE la nivel de byte, utilizată în GPT-2
+- WordPiece, utilizată în BERT
+- SentencePiece sau Unigram, utilizate în mai multe modele multilingve
+
+Acum ar trebui să cunoașteți destul de bine cum funcționează tokenizerele pentru a începe să utilizați API-
+
+## Încărcarea și salvarea[[încărcarea-și-salvarea]]
+
+Încărcarea și salvarea tokenizerelor este la fel de simplă ca în cazul modelelor. De fapt, se bazează pe aceleași două metode: `from_pretrained()` și `save_pretrained()`. Aceste metode vor încărca sau salva algoritmul utilizat de tokenizator (un pic ca *arhitectura* modelului), precum și vocabularul său (un pic ca *weight-urile* modelului).
+
+Încărcarea tokenizatorului BERT antrenat cu același punct de control ca BERT se face în același mod ca și încărcarea modelului, cu excepția faptului că folosim clasa `BertTokenizer`:
+
+```py
+from transformers import BertTokenizer
+
+tokenizer = BertTokenizer.from_pretrained("bert-base-cased")
+```
+
+{#if fw === 'pt'}
+Similar cu `AutoModel`, clasa `AutoTokenizer` va prelua clasa tokenizer corespunzătoare din bibliotecă pe baza numelui checkpoint-ului și poate fi utilizată direct cu orice checkpoint:
+
+{:else}
+Similar cu `TFAutoModel`, clasa `AutoTokenizer` va prelua clasa tokenizer corespunzătoare din bibliotecă pe baza numelui checkpoint-ului și poate fi utilizată direct cu orice checkpoint:
+
+{/if}
+
+```py
+from transformers import AutoTokenizer
+
+tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
+```
+
+Acum putem utiliza tokenizatorul așa cum am arătat în secțiunea anterioară:
+
+```python
+tokenizer("Using a Transformer network is simple")
+```
+
+```python out
+{'input_ids': [101, 7993, 170, 11303, 1200, 2443, 1110, 3014, 102],
+ 'token_type_ids': [0, 0, 0, 0, 0, 0, 0, 0, 0],
+ 'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1, 1]}
+```
+
+Salvarea unui tokenizer este identică cu salvarea unui model:
+
+```py
+tokenizer.save_pretrained("directory_on_my_computer")
+```
+
+Vom vorbi mai mult despre `token_type_ids` în [Capitolul 3](/course/chapter3) și vom explica cheia `attention_mask` puțin mai târziu. Mai întâi, să vedem cum sunt generate `input_ids`. Pentru a face acest lucru, va trebui să ne uităm la metodele intermediare ale tokenizatorului.
+
+## Codificarea[[codificarea]]
+
+<Youtube id="Yffk5aydLzg"/>
+
+Al doilea pas este să convertim aceste token-uri în numere, astfel încât să putem construi un tensor din ele și să le introducem în model. Pentru a face acest lucru, tokenizatorul are un *vocabular*, care este partea pe care o descărcăm atunci când îl instanțiem cu metoda `from_pretrained()`. Din nou, trebuie să folosim același vocabular utilizat atunci când modelul a fost preinstruit.
+
+Pentru a înțelege mai bine cele două etape, le vom explora separat. Rețineți că vom utiliza unele metode care efectuează părți ale pipeline-ului de tokenizare separat pentru a vă arăta rezultatele intermediare ale acestor etape, dar, în practică, ar trebui să apelați tokenizatorul direct pe intrările dvs. (așa cum se arată în secțiunea 2).
+
+### Tokenizarea[[tokenizarea]]
+
+Procesul de tokenizare este realizat prin metoda `tokenize()`:
+
+```py
+from transformers import AutoTokenizer
+
+tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
+
+sequence = "Using a Transformer network is simple"
+tokens = tokenizer.tokenize(sequence)
+
+print(tokens)
+```
+
+Rezultatul acestei metode este o listă de șiruri de caractere, sau token-uri:
+
+```python out
+['Using', 'a', 'transform', '##er', 'network', 'is', 'simple']
+```
+
+Acest tokenizator este un tokenizator de părți de cuvinte: împarte cuvintele până când obține token-uri care pot fi reprezentate de vocabularul său. Acesta este cazul aici cu `transformer`, care este împărțit în două token-uri: `transform` și `##er`
+
+### De la token-uri la ID-uri de intrare[[de-la-token-uri-la-id-uri-de-intrare]]
+
+Conversia în ID-uri de intrare este gestionată de metoda de tokenizare `convert_tokens_to_ids()`:
+
+```py
+ids = tokenizer.convert_tokens_to_ids(tokens)
+
+print(ids)
+```
+
+```python out
+[7993, 170, 11303, 1200, 2443, 1110, 3014]
+```
+
+Aceste rezultate, odată convertite în tensorul framework-ului corespunzător, pot fi apoi utilizate ca intrări într-un model, așa cum am văzut mai devreme în acest capitol.
+
+<Tip>
+
+✏️ ** Încercați!** Replicați ultimii doi pași (tokenizarea și conversia în ID-uri de intrare) pe propozițiile de intrare pe care le-am folosit în secțiunea 2 ("I've been waiting for a HuggingFace course my whole life." și "I hate this so much!"). Verificați dacă obțineți aceleași ID-uri de intrare pe care le-am obținut mai devreme! 
+
+</Tip>
+
+## Decodificare[[decodificare]]
+
+*Decodificarea* este inversă: din indicii vocabularului, dorim să obținem un șir de caractere. Acest lucru poate fi realizat cu metoda `decode()` după cum urmează:
+
+```py
+decoded_string = tokenizer.decode([7993, 170, 11303, 1200, 2443, 1110, 3014])
+print(decoded_string)
+```
+
+```python out
+'Using a Transformer network is simple'
+```
+
+Rețineți că metoda `decode` nu numai că convertește indicii înapoi în token-uri, dar și grupează token-urile care fac parte din aceleași cuvinte pentru a produce o propoziție inteligibilă. Acest comportament va fi extrem de util atunci când vom utiliza modele care prezic text nou (fie text generat de un prompt, fie pentru probleme sequence-to-sequence, precum traducerea sau rezumarea).
+
+Până acum ar trebui să înțelegeți operațiunile atomice pe care le poate gestiona un tokenizator: tokenizarea, conversia în ID-uri și conversia ID-urilor înapoi într-un șir. Cu toate acestea, am atins doar vârful icebergului. În secțiunea următoare, vom aborda limitele metodei noastre și vom vedea cum să le depășim.
diff --git a/chapters/rum/chapter2/5.mdx b/chapters/rum/chapter2/5.mdx
new file mode 100644
index 000000000..1d71f6188
--- /dev/null
+++ b/chapters/rum/chapter2/5.mdx
@@ -0,0 +1,338 @@
+<FrameworkSwitchCourse {fw} />
+
+# Gestionarea secvențelor multiple[[gestionarea-secvențelor-multiple]]
+
+{#if fw === 'pt'}
+
+<CourseFloatingBanner chapter={2}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section5_pt.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section5_pt.ipynb"},
+]} />
+
+{:else}
+
+<CourseFloatingBanner chapter={2}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section5_tf.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section5_tf.ipynb"},
+]} />
+
+{/if}
+
+{#if fw === 'pt'}
+<Youtube id="M6adb1j2jPI"/>
+{:else}
+<Youtube id="ROxrFOEbsQE"/>
+{/if}
+
+În secțiunea anterioară, am explorat cel mai simplu caz de utilizare: realizarea de inferențe pe o singură secvență de lungime mică. Cu toate acestea, apar deja unele întrebări:
+
+- Cum gestionăm secvențe multiple?
+- Cum gestionăm secvențe multiple *de lungimi diferite*?
+- Indicii vocabularului sunt singurele intrări care permit unui model să funcționeze bine?
+- Există o secvență prea lungă?
+
+Să vedem ce tipuri de probleme prezintă aceste întrebări și cum le putem rezolva folosind API-ul 🤗 Transformers.
+
+
+## Modelele așteaptă un lot de intrări[[modelele-așteaptă-un-lot-de-intrări]]
+
+În exercițiul anterior ați văzut cum secvențele sunt transformate în liste de numere. Să convertim această listă de numere într-un tensor și să o transmitem modelului:
+
+{#if fw === 'pt'}
+```py
+import torch
+from transformers import AutoTokenizer, AutoModelForSequenceClassification
+
+checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
+tokenizer = AutoTokenizer.from_pretrained(checkpoint)
+model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
+
+sequence = "I've been waiting for a HuggingFace course my whole life."
+
+tokens = tokenizer.tokenize(sequence)
+ids = tokenizer.convert_tokens_to_ids(tokens)
+input_ids = torch.tensor(ids)
+# Această linie va eșua.
+model(input_ids)
+```
+
+```python out
+IndexError: Dimension out of range (expected to be in range of [-1, 0], but got 1)
+```
+{:else}
+```py
+import tensorflow as tf
+from transformers import AutoTokenizer, TFAutoModelForSequenceClassification
+
+checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
+tokenizer = AutoTokenizer.from_pretrained(checkpoint)
+model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint)
+
+sequence = "I've been waiting for a HuggingFace course my whole life."
+
+tokens = tokenizer.tokenize(sequence)
+ids = tokenizer.convert_tokens_to_ids(tokens)
+input_ids = tf.constant(ids)
+# This line will fail.
+model(input_ids)
+```
+
+```py out
+InvalidArgumentError: Input to reshape is a tensor with 14 values, but the requested shape has 196 [Op:Reshape]
+```
+{/if}
+
+Oh, nu! De ce a eșuat? Am urmat pașii din pipeline-ul din secțiunea 2.
+
+Problema este că am trimis o singură secvență către model, în timp ce modelele 🤗 Transformers așteaptă în mod implicit mai multe propoziții. Aici am încercat să facem tot ce a făcut tokenizatorul în fundal atunci când l-am aplicat unei `secvențe`. Dar, dacă vă uitați cu atenție, veți vedea că tokenizatorul nu a convertit doar lista de ID-uri de intrare într-un tensor, ci a adăugat și o dimensiune peste aceasta:
+
+{#if fw === 'pt'}
+```py
+tokenized_inputs = tokenizer(sequence, return_tensors="pt")
+print(tokenized_inputs["input_ids"])
+```
+
+```python out
+tensor([[  101,  1045,  1005,  2310,  2042,  3403,  2005,  1037, 17662, 12172,
+          2607,  2026,  2878,  2166,  1012,   102]])
+```
+{:else}
+```py
+tokenized_inputs = tokenizer(sequence, return_tensors="tf")
+print(tokenized_inputs["input_ids"])
+```
+
+```py out
+<tf.Tensor: shape=(1, 16), dtype=int32, numpy=
+array([[  101,  1045,  1005,  2310,  2042,  3403,  2005,  1037, 17662,
+        12172,  2607,  2026,  2878,  2166,  1012,   102]], dtype=int32)>
+```
+{/if}
+
+Să încercăm din nou și să adăugăm o nouă dimensiune:
+
+{#if fw === 'pt'}
+```py
+import torch
+from transformers import AutoTokenizer, AutoModelForSequenceClassification
+
+checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
+tokenizer = AutoTokenizer.from_pretrained(checkpoint)
+model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
+
+sequence = "I've been waiting for a HuggingFace course my whole life."
+
+tokens = tokenizer.tokenize(sequence)
+ids = tokenizer.convert_tokens_to_ids(tokens)
+
+input_ids = torch.tensor([ids])
+print("Input IDs:", input_ids)
+
+output = model(input_ids)
+print("Logits:", output.logits)
+```
+{:else}
+```py
+import tensorflow as tf
+from transformers import AutoTokenizer, TFAutoModelForSequenceClassification
+
+checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
+tokenizer = AutoTokenizer.from_pretrained(checkpoint)
+model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint)
+
+sequence = "I've been waiting for a HuggingFace course my whole life."
+
+tokens = tokenizer.tokenize(sequence)
+ids = tokenizer.convert_tokens_to_ids(tokens)
+
+input_ids = tf.constant([ids])
+print("Input IDs:", input_ids)
+
+output = model(input_ids)
+print("Logits:", output.logits)
+```
+{/if}
+
+Imprimăm ID-urile de intrare, precum și logit-urile rezultate - iată rezultatul:
+
+{#if fw === 'pt'}
+```python out
+Input IDs: [[ 1045,  1005,  2310,  2042,  3403,  2005,  1037, 17662, 12172,  2607, 2026,  2878,  2166,  1012]]
+Logits: [[-2.7276,  2.8789]]
+```
+{:else}
+```py out
+Input IDs: tf.Tensor(
+[[ 1045  1005  2310  2042  3403  2005  1037 17662 12172  2607  2026  2878
+   2166  1012]], shape=(1, 14), dtype=int32)
+Logits: tf.Tensor([[-2.7276208  2.8789377]], shape=(1, 2), dtype=float32)
+```
+{/if}
+
+Gruparea în loturi este acțiunea de a trimite mai multe propoziții prin model, toate odată. Dacă aveți o singură propoziție, puteți crea un lot cu o singură secvență: 
+
+```
+batched_ids = [ids, ids]
+```
+
+Acesta este un lot de două secvențe identice!
+
+<Tip>
+
+✏️ ** Încercați!** Convertiți această listă `batched_ids` într-un tensor și treceți-o prin modelul dumneavoastră. Verificați dacă obțineți aceleași logits ca înainte (dar de două ori)!
+
+</Tip>
+
+Gruparea în loturi permite modelului să funcționeze atunci când îi furnizați mai multe secvențe. Utilizarea mai multor secvențe este la fel de simplă ca și crearea unui lot cu o singură secvență. Există însă o a doua problemă. Atunci când încercați să combinați două (sau mai multe) propoziții, acestea pot avea lungimi diferite. Dacă ați mai lucrat vreodată cu tensori, știți că aceștia trebuie să aibă o formă dreptunghiulară, deci nu veți putea converti direct lista de ID-uri de intrare într-un tensor. Pentru a rezolva această problemă, de obicei *umplem* datele de intrare.
+
+## Umplerea datelor de intrare[[umplerea-datelor-de-intrare]]
+
+Următoarea serie de liste nu poate fi convertită într-un tensor:
+
+```py no-format
+batched_ids = [
+    [200, 200, 200],
+    [200, 200]
+]
+```
+
+Pentru a ocoli acest lucru, vom folosi *padding-ul* pentru ca tensorii noștri să aibă o formă dreptunghiulară. Padding-ul (umplerea datelor) asigură că toate propozițiile noastre au aceeași lungime prin adăugarea unui cuvânt special numit *padding token* la propozițiile cu mai puține valori. De exemplu, dacă aveți 10 propoziții cu 10 cuvinte și 1 propoziție cu 20 de cuvinte, padding-ul va asigura că toate propozițiile au 20 de cuvinte. În exemplul nostru, tensorul rezultat arată astfel:
+
+```py no-format
+padding_id = 100
+
+batched_ids = [
+    [200, 200, 200],
+    [200, 200, padding_id],
+]
+```
+
+ID-ul token-ului de umplere poate fi găsit în `tokenizer.pad_token_id`. Să-l folosim și să trimitem cele două propoziții prin model în mod separat și grupate împreună:
+
+{#if fw === 'pt'}
+```py no-format
+model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
+
+sequence1_ids = [[200, 200, 200]]
+sequence2_ids = [[200, 200]]
+batched_ids = [
+    [200, 200, 200],
+    [200, 200, tokenizer.pad_token_id],
+]
+
+print(model(torch.tensor(sequence1_ids)).logits)
+print(model(torch.tensor(sequence2_ids)).logits)
+print(model(torch.tensor(batched_ids)).logits)
+```
+
+```python out
+tensor([[ 1.5694, -1.3895]], grad_fn=<AddmmBackward>)
+tensor([[ 0.5803, -0.4125]], grad_fn=<AddmmBackward>)
+tensor([[ 1.5694, -1.3895],
+        [ 1.3373, -1.2163]], grad_fn=<AddmmBackward>)
+```
+{:else}
+```py no-format
+model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint)
+
+sequence1_ids = [[200, 200, 200]]
+sequence2_ids = [[200, 200]]
+batched_ids = [
+    [200, 200, 200],
+    [200, 200, tokenizer.pad_token_id],
+]
+
+print(model(tf.constant(sequence1_ids)).logits)
+print(model(tf.constant(sequence2_ids)).logits)
+print(model(tf.constant(batched_ids)).logits)
+```
+
+```py out
+tf.Tensor([[ 1.5693678 -1.3894581]], shape=(1, 2), dtype=float32)
+tf.Tensor([[ 0.5803005  -0.41252428]], shape=(1, 2), dtype=float32)
+tf.Tensor(
+[[ 1.5693681 -1.3894582]
+ [ 1.3373486 -1.2163193]], shape=(2, 2), dtype=float32)
+```
+{/if}
+
+Este ceva în neregulă cu logit-urile din predicțiile noastre grupate: al doilea rând ar trebui să fie identic cu logit-urile pentru a doua propoziție, dar avem valori complet diferite!
+
+Acest lucru se datorează faptului că principala caracteristică a modelelor Transformer sunt straturile de atenție care *contextualizează* fiecare token. Acestea vor lua în considerare token-urile de umplutură, deoarece se ocupă de toate token-urile unei secvențe. Pentru a obține același rezultat atunci când trecem propoziții individuale de diferite lungimi prin model sau atunci când trecem un lot cu aceleași propoziții și același umplutură aplicată, trebuie să spunem acelor straturi de atenție să ignore token-urile de umplutură. Acest lucru se realizează prin utilizarea unei măști de atenție (attention mask).
+
+## Attention masks(măști de atenție)[[attention-masks]]
+
+*Măștile de atenție* sunt tensori cu exact aceeași formă ca tensorul ID-urilor de intrare, completate cu 0 și 1: valorile 1 indică faptul că ar trebui să se acorde atenție token-urilor corespunzătoare, iar valorile 0 indică faptul că nu ar trebui să se acorde atenție token-urilor corespunzătoare (adică acestea ar trebui ignorate de straturile de atenție ale modelului).
+
+Să completăm exemplul anterior cu o mască de atenție:
+
+{#if fw === 'pt'}
+```py no-format
+batched_ids = [
+    [200, 200, 200],
+    [200, 200, tokenizer.pad_token_id],
+]
+
+attention_mask = [
+    [1, 1, 1],
+    [1, 1, 0],
+]
+
+outputs = model(torch.tensor(batched_ids), attention_mask=torch.tensor(attention_mask))
+print(outputs.logits)
+```
+
+```python out
+tensor([[ 1.5694, -1.3895],
+        [ 0.5803, -0.4125]], grad_fn=<AddmmBackward>)
+```
+{:else}
+```py no-format
+batched_ids = [
+    [200, 200, 200],
+    [200, 200, tokenizer.pad_token_id],
+]
+
+attention_mask = [
+    [1, 1, 1],
+    [1, 1, 0],
+]
+
+outputs = model(tf.constant(batched_ids), attention_mask=tf.constant(attention_mask))
+print(outputs.logits)
+```
+
+```py out
+tf.Tensor(
+[[ 1.5693681  -1.3894582 ]
+ [ 0.5803021  -0.41252586]], shape=(2, 2), dtype=float32)
+```
+{/if}
+
+Acum obținem aceeași logits pentru a doua propoziție din lot.
+
+Observăm cum ultima valoare a celei de-a doua secvențe este un ID de umplere, care este o valoare 0 în masca de atenție.
+
+<Tip>
+
+✏️ ** Încercați!** Aplicați manual tokenizarea pe cele două propoziții utilizate în secțiunea 2 ("I've been waiting for a HuggingFace course my whole life." și "I hate this so much!"). Treceți-le prin model și verificați dacă obțineți aceeași logiți ca în secțiunea 2. Acum grupați-le împreună folosind token-ul de umplere, apoi creați masca de atenție corespunzătoare. Verificați dacă obțineți aceleași rezultate atunci când parcurgeți modelul!
+
+</Tip>
+
+## Secvențe mai lungi[[secvențe-mai-lungi]]
+
+Cu modelele Transformer, există o limită a lungimii secvențelor pe care le putem transmite modelelor. Majoritatea modelelor gestionează secvențe de până la 512 sau 1024 de token-uri și se vor bloca atunci când li se cere să proceseze secvențe mai lungi. Există două soluții la această problemă:
+
+- Utilizați un model cu o lungime de secvență acceptată mai mare.
+- Trunchiați secvențele.
+
+Modelele au diferite lungimi de secvență acceptate, iar unele sunt specializate în tratarea secvențelor foarte lungi. [Longformer](https://huggingface.co/docs/transformers/model_doc/longformer) este un exemplu, iar altul este [LED](https://huggingface.co/docs/transformers/model_doc/led). Dacă lucrați la o sarcină care necesită secvențe foarte lungi, vă recomandăm să aruncați o privire la aceste modele.
+
+În caz contrar, vă recomandăm să vă trunchiați secvențele prin specificarea parametrului `max_sequence_length`:
+```py
+sequence = sequence[:max_sequence_length]
+```
diff --git a/chapters/rum/chapter2/6.mdx b/chapters/rum/chapter2/6.mdx
new file mode 100644
index 000000000..a95a92d56
--- /dev/null
+++ b/chapters/rum/chapter2/6.mdx
@@ -0,0 +1,164 @@
+<FrameworkSwitchCourse {fw} />
+
+# Să punem totul cap la cap[[să-punem-totul-cap-la-cap]]
+
+{#if fw === 'pt'}
+
+<CourseFloatingBanner chapter={2}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section6_pt.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section6_pt.ipynb"},
+]} />
+
+{:else}
+
+<CourseFloatingBanner chapter={2}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section6_tf.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section6_tf.ipynb"},
+]} />
+
+{/if}
+
+În ultimele secțiuni, ne-am străduit să facem cea mai mare parte a muncii manual. Am explorat modul în care funcționează tokenizerele și am analizat tokenizarea, conversia în ID-uri de intrare, padding, trunchiere și măști de atenție.
+
+Cu toate acestea, după cum am văzut în secțiunea 2, API-ul 🤗 Transformers poate gestiona toate acestea pentru noi cu o funcție de nivel înalt în care ne vom adânci aici. Atunci când apelați `tokenizer` direct pe propoziție, primiți înapoi intrări care sunt gata să treacă prin modelul dvs:
+
+```py
+from transformers import AutoTokenizer
+
+checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
+tokenizer = AutoTokenizer.from_pretrained(checkpoint)
+
+sequence = "I've been waiting for a HuggingFace course my whole life."
+
+model_inputs = tokenizer(sequence)
+```
+
+Aici, variabila `model_inputs` conține tot ceea ce este necesar pentru ca un model să funcționeze bine. Pentru DistilBERT, aceasta include ID-urile de intrare, precum și masca de atenție. Alte modele care acceptă intrări suplimentare le vor avea, de asemenea, la ieșire prin obiectul `tokenizer`.
+
+După cum vom vedea în câteva exemple de mai jos, această metodă este foarte eficientă. În primul rând, poate tokeniza o singură secvență:
+
+```py
+sequence = "I've been waiting for a HuggingFace course my whole life."
+
+model_inputs = tokenizer(sequence)
+```
+
+De asemenea, gestionează mai multe secvențe simultan, fără nicio modificare a API-ului:
+
+```py
+sequences = ["I've been waiting for a HuggingFace course my whole life.", "So have I!"]
+
+model_inputs = tokenizer(sequences)
+```
+
+Acesta poate umple în funcție de mai multe obiective:
+
+```py
+# Va umple secvențele până la lungimea maximă a secvenței
+model_inputs = tokenizer(sequences, padding="longest")
+
+# Va umple secvențele până la lungimea maximă a modelului
+# (512 pentru BERT sau DistilBERT)
+model_inputs = tokenizer(sequences, padding="max_length")
+
+# Va umple secvențele până la lungimea maximă specificată
+model_inputs = tokenizer(sequences, padding="max_length", max_length=8)
+```
+
+De asemenea, poate trunchia secvențele:
+
+```py
+sequences = ["I've been waiting for a HuggingFace course my whole life.", "So have I!"]
+
+# Va trunchia secvențele care sunt mai lungi decât lungimea maximă a modelului
+# (512 pentru BERT sau DistilBERT)
+model_inputs = tokenizer(sequences, truncation=True)
+
+# Va trunchia secvențele care sunt mai lungi decât lungimea maximă specificată
+model_inputs = tokenizer(sequences, max_length=8, truncation=True)
+```
+
+Obiectul `tokenizer` poate gestiona conversia în tensori specifici framework-ului, care pot fi apoi trimiși direct la model. De exemplu, în următorul exemplu de cod, solicităm tokenizatorului să returneze tensori din diferite cadre - `„pt”` returnează tensori PyTorch, `„tf”` returnează tensori TensorFlow, iar `„np”` returnează matrici NumPy:
+
+```py
+sequences = ["I've been waiting for a HuggingFace course my whole life.", "So have I!"]
+
+# Returnează tensori PyTorch
+model_inputs = tokenizer(sequences, padding=True, return_tensors="pt")
+
+# Returnează tensori TensorFlow 
+model_inputs = tokenizer(sequences, padding=True, return_tensors="tf")
+
+# Returnează array-uri NumPy 
+model_inputs = tokenizer(sequences, padding=True, return_tensors="np")
+```
+
+## Token-uri speciale[[token-uri-speciale]]
+
+Dacă aruncăm o privire la ID-urile de intrare returnate de tokenizer, vom vedea că sunt puțin diferite de cele pe care le-am avut mai devreme:
+
+```py
+sequence = "I've been waiting for a HuggingFace course my whole life."
+
+model_inputs = tokenizer(sequence)
+print(model_inputs["input_ids"])
+
+tokens = tokenizer.tokenize(sequence)
+ids = tokenizer.convert_tokens_to_ids(tokens)
+print(ids)
+```
+
+```python out
+[101, 1045, 1005, 2310, 2042, 3403, 2005, 1037, 17662, 12172, 2607, 2026, 2878, 2166, 1012, 102]
+[1045, 1005, 2310, 2042, 3403, 2005, 1037, 17662, 12172, 2607, 2026, 2878, 2166, 1012]
+```
+
+Un token ID a fost adăugat la început, iar unul la sfârșit. Să decodificăm cele două secvențe de ID-uri de mai sus pentru a vedea despre ce este vorba:
+
+```py
+print(tokenizer.decode(model_inputs["input_ids"]))
+print(tokenizer.decode(ids))
+```
+
+```python out
+"[CLS] i've been waiting for a huggingface course my whole life. [SEP]"
+"i've been waiting for a huggingface course my whole life."
+```
+
+Tokenizatorul a adăugat cuvântul special `[CLS]` la început și cuvântul special `[SEP]` la sfârșit. Acest lucru se datorează faptului că modelul a fost preinstruit cu aceste cuvinte, deci pentru a obține aceleași rezultate pentru inferență trebuie să le adăugăm și pe acestea. Rețineți că unele modele nu adaugă cuvinte speciale sau adaugă cuvinte diferite; de asemenea, modelele pot adăuga aceste cuvinte speciale doar la început sau doar la sfârșit. În orice caz, tokenizatorul știe care sunt cele așteptate și se va ocupa de acest lucru pentru dumneavoastră.
+
+## Încheiere: De la tokenizer la model[[încheiere-de-la-tokenizator--model]]
+
+Acum că am văzut toți pașii individuali pe care îi utilizează obiectul `tokenizer` atunci când este aplicat pe texte, să vedem o ultimă dată cum poate gestiona secvențe multiple (padding!), secvențe foarte lungi (trunchiere!) și mai multe tipuri de tensori cu API-ul său principal:
+
+{#if fw === 'pt'}
+```py
+import torch
+from transformers import AutoTokenizer, AutoModelForSequenceClassification
+
+checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
+tokenizer = AutoTokenizer.from_pretrained(checkpoint)
+model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
+sequences = ["I've been waiting for a HuggingFace course my whole life.", "So have I!"]
+
+tokens = tokenizer(sequences, padding=True, truncation=True, return_tensors="pt")
+output = model(**tokens)
+```
+{:else}
+```py
+import tensorflow as tf
+from transformers import AutoTokenizer, TFAutoModelForSequenceClassification
+
+checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
+tokenizer = AutoTokenizer.from_pretrained(checkpoint)
+model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint)
+sequences = ["I've been waiting for a HuggingFace course my whole life.", "So have I!"]
+
+tokens = tokenizer(sequences, padding=True, truncation=True, return_tensors="tf")
+output = model(**tokens)
+```
+{/if}
diff --git a/chapters/rum/chapter2/7.mdx b/chapters/rum/chapter2/7.mdx
new file mode 100644
index 000000000..2e6f1175c
--- /dev/null
+++ b/chapters/rum/chapter2/7.mdx
@@ -0,0 +1,19 @@
+# Utilizarea de bază este completă![[utilizarea-de-bază-este-completă]]
+
+<CourseFloatingBanner
+    chapter={2}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+ 
+Ați făcut o treabă excelentă dacă ați urmat cursul până aici! Pentru a sintetiza, în acest capitol ați:
+
+- Ați învățat elementele de bază ale unui model Transformer.
+- Ați învățat ce formează un pipeline de tokenizare.
+- Ați văzut cum să utilizați un model Transformer în practică.
+- Ați învățat cum să folosiți un tokenizer pentru a converti textul în tensori care sunt inteligibili pentru model.
+- Am configurat împreună un tokenizer și un model pentru a ajunge de la text la predicții.
+- Am învățat limitările ID-urilor de intrare și am învățat despre attention masks(măști de atenție).
+- V-ați antrenat cu ajutorul metodelor versatile și configurabile ale tokenizatorului.
+
+De acum înainte, ar trebui să puteți naviga liber prin documentele 🤗 Transformers: vocabularul va suna familiar și ați văzut deja metodele pe care le veți utiliza în majoritatea timpului.
\ No newline at end of file
diff --git a/chapters/rum/chapter2/8.mdx b/chapters/rum/chapter2/8.mdx
new file mode 100644
index 000000000..c41f27936
--- /dev/null
+++ b/chapters/rum/chapter2/8.mdx
@@ -0,0 +1,310 @@
+<FrameworkSwitchCourse {fw} />
+
+<!-- DISABLE-FRONTMATTER-SECTIONS -->
+
+# End-of-chapter quiz[[end-of-chapter-quiz]]
+
+<CourseFloatingBanner
+    chapter={2}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+### 1. What is the order of the language modeling pipeline?
+
+<Question
+	choices={[
+		{
+			text: "First, the model, which handles text and returns raw predictions. The tokenizer then makes sense of these predictions and converts them back to text when needed.",
+			explain: "The model cannot understand text! The tokenizer must first tokenize the text and convert it to IDs so that it is understandable by the model."
+		},
+		{
+			text: "First, the tokenizer, which handles text and returns IDs. The model handles these IDs and outputs a prediction, which can be some text.",
+			explain: "The model's prediction cannot be text straight away. The tokenizer has to be used in order to convert the prediction back to text!"
+		},
+		{
+			text: "The tokenizer handles text and returns IDs. The model handles these IDs and outputs a prediction. The tokenizer can then be used once again to convert these predictions back to some text.",
+			explain: "Correct! The tokenizer can be used for both tokenizing and de-tokenizing.",
+            correct: true
+		}
+	]}
+/>
+
+### 2. How many dimensions does the tensor output by the base Transformer model have, and what are they?
+
+<Question
+	choices={[
+		{
+			text: "2: The sequence length and the batch size",
+			explain: "False! The tensor output by the model has a third dimension: hidden size."
+		},
+		{
+			text: "2: The sequence length and the hidden size",
+			explain: "False! All Transformer models handle batches, even with a single sequence; that would be a batch size of 1!"
+		},
+		{
+			text: "3: The sequence length, the batch size, and the hidden size",
+			explain: "Correct!",
+            correct: true
+		}
+	]}
+/>
+
+### 3. Which of the following is an example of subword tokenization?
+
+<Question
+	choices={[
+		{
+			text: "WordPiece",
+			explain: "Yes, that's one example of subword tokenization!",
+            correct: true
+		},
+		{
+			text: "Character-based tokenization",
+			explain: "Character-based tokenization is not a type of subword tokenization."
+		},
+		{
+			text: "Splitting on whitespace and punctuation",
+			explain: "That's a word-based tokenization scheme!"
+		},
+		{
+			text: "BPE",
+			explain: "Yes, that's one example of subword tokenization!",
+            correct: true
+        },
+		{
+			text: "Unigram",
+			explain: "Yes, that's one example of subword tokenization!",
+            correct: true
+        },
+		{
+			text: "None of the above",
+			explain: "Incorrect!"
+        }
+	]}
+/>
+
+### 4. What is a model head?
+
+<Question
+	choices={[
+		{
+			text: "A component of the base Transformer network that redirects tensors to their correct layers",
+			explain: "Incorrect! There's no such component."
+		},
+		{
+			text: "Also known as the self-attention mechanism, it adapts the representation of a token according to the other tokens of the sequence",
+			explain: "Incorrect! The self-attention layer does contain attention \"heads,\" but these are not adaptation heads."
+		},
+		{
+			text: "An additional component, usually made up of one or a few layers, to convert the transformer predictions to a task-specific output",
+			explain: "That's right. Adaptation heads, also known simply as heads, come up in different forms: language modeling heads, question answering heads, sequence classification heads... ",
+			correct: true
+		} 
+	]}
+/>
+
+{#if fw === 'pt'}
+### 5. What is an AutoModel?
+
+<Question
+	choices={[
+		{
+			text: "A model that automatically trains on your data",
+			explain: "Incorrect. Are you mistaking this with our <a href='https://huggingface.co/autotrain'>AutoTrain</a> product?"
+		},
+		{
+			text: "An object that returns the correct architecture based on the checkpoint",
+			explain: "Exactly: the <code>AutoModel</code> only needs to know the checkpoint from which to initialize to return the correct architecture.",
+			correct: true
+		},
+		{
+			text: "A model that automatically detects the language used for its inputs to load the correct weights",
+			explain: "Incorrect; while some checkpoints and models are capable of handling multiple languages, there are no built-in tools for automatic checkpoint selection according to language. You should head over to the <a href='https://huggingface.co/models'>Model Hub</a> to find the best checkpoint for your task!"
+		} 
+	]}
+/>
+
+{:else}
+### 5. What is an TFAutoModel?
+
+<Question
+	choices={[
+		{
+			text: "A model that automatically trains on your data",
+			explain: "Incorrect. Are you mistaking this with our <a href='https://huggingface.co/autotrain'>AutoTrain</a> product?"
+		},
+		{
+			text: "An object that returns the correct architecture based on the checkpoint",
+			explain: "Exactly: the <code>TFAutoModel</code> only needs to know the checkpoint from which to initialize to return the correct architecture.",
+			correct: true
+		},
+		{
+			text: "A model that automatically detects the language used for its inputs to load the correct weights",
+			explain: "Incorrect; while some checkpoints and models are capable of handling multiple languages, there are no built-in tools for automatic checkpoint selection according to language. You should head over to the <a href='https://huggingface.co/models'>Model Hub</a> to find the best checkpoint for your task!"
+		} 
+	]}
+/>
+
+{/if}
+
+### 6. What are the techniques to be aware of when batching sequences of different lengths together?
+
+<Question
+	choices={[
+		{
+			text: "Truncating",
+			explain: "Yes, truncation is a correct way of evening out sequences so that they fit in a rectangular shape. Is it the only one, though?",
+			correct: true
+		},
+		{
+			text: "Returning tensors",
+			explain: "While the other techniques allow you to return rectangular tensors, returning tensors isn't helpful when batching sequences together."
+		},
+		{
+			text: "Padding",
+			explain: "Yes, padding is a correct way of evening out sequences so that they fit in a rectangular shape. Is it the only one, though?",
+			correct: true
+		}, 
+		{
+			text: "Attention masking",
+			explain: "Absolutely! Attention masks are of prime importance when handling sequences of different lengths. That's not the only technique to be aware of, however.",
+			correct: true
+		} 
+	]}
+/>
+
+### 7. What is the point of applying a SoftMax function to the logits output by a sequence classification model?
+
+<Question
+	choices={[
+		{
+			text: "It softens the logits so that they're more reliable.",
+			explain: "No, the SoftMax function does not affect the reliability of results."
+		},
+		{
+			text: "It applies a lower and upper bound so that they're understandable.",
+			explain: "Correct! The resulting values are bound between 0 and 1. That's not the only reason we use a SoftMax function, though.",
+            correct: true
+		},
+		{
+			text: "The total sum of the output is then 1, resulting in a possible probabilistic interpretation.",
+			explain: "Correct! That's not the only reason we use a SoftMax function, though.",
+            correct: true
+		}
+	]}
+/>
+
+### 8. What method is most of the tokenizer API centered around?
+
+<Question
+	choices={[
+		{
+			text: "<code>encode</code>, as it can encode text into IDs and IDs into predictions",
+			explain: "Wrong! While the <code>encode</code> method does exist on tokenizers, it does not exist on models."
+		},
+		{
+			text: "Calling the tokenizer object directly.",
+			explain: "Exactly! The <code>__call__</code> method of the tokenizer is a very powerful method which can handle pretty much anything. It is also the method used to retrieve predictions from a model.",
+			correct: true
+		},
+		{
+			text: "<code>pad</code>",
+			explain: "Wrong! Padding is very useful, but it's just one part of the tokenizer API."
+		},
+		{
+			text: "<code>tokenize</code>",
+			explain: "The <code>tokenize</code> method is arguably one of the most useful methods, but it isn't the core of the tokenizer API."
+		}
+	]}
+/>
+
+### 9. What does the `result` variable contain in this code sample?
+
+```py
+from transformers import AutoTokenizer
+
+tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
+result = tokenizer.tokenize("Hello!")
+```
+
+<Question
+	choices={[
+		{
+			text: "A list of strings, each string being a token",
+			explain: "Absolutely! Convert this to IDs, and send them to a model!",
+            correct: true
+		},
+		{
+			text: "A list of IDs",
+			explain: "Incorrect; that's what the <code>__call__</code> or <code>convert_tokens_to_ids</code> method is for!"
+		},
+		{
+			text: "A string containing all of the tokens",
+			explain: "This would be suboptimal, as the goal is to split the string into multiple tokens."
+		}
+	]}
+/>
+
+{#if fw === 'pt'}
+### 10. Is there something wrong with the following code?
+
+```py
+from transformers import AutoTokenizer, AutoModel
+
+tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
+model = AutoModel.from_pretrained("gpt2")
+
+encoded = tokenizer("Hey!", return_tensors="pt")
+result = model(**encoded)
+```
+
+<Question
+	choices={[
+		{
+			text: "No, it seems correct.",
+			explain: "Unfortunately, coupling a model with a tokenizer that was trained with a different checkpoint is rarely a good idea. The model was not trained to make sense out of this tokenizer's output, so the model output (if it can even run!) will not make any sense."
+		},
+		{
+			text: "The tokenizer and model should always be from the same checkpoint.",
+			explain: "Right!",
+            correct: true
+		},
+		{
+			text: "It's good practice to pad and truncate with the tokenizer as every input is a batch.",
+			explain: "It's true that every model input needs to be a batch. However, truncating or padding this sequence wouldn't necessarily make sense as there is only one of it, and those are techniques to batch together a list of sentences."
+		}
+	]}
+/>
+
+{:else}
+### 10. Is there something wrong with the following code?
+
+```py
+from transformers import AutoTokenizer, TFAutoModel
+
+tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
+model = TFAutoModel.from_pretrained("gpt2")
+
+encoded = tokenizer("Hey!", return_tensors="pt")
+result = model(**encoded)
+```
+
+<Question
+	choices={[
+		{
+			text: "No, it seems correct.",
+			explain: "Unfortunately, coupling a model with a tokenizer that was trained with a different checkpoint is rarely a good idea. The model was not trained to make sense out of this tokenizer's output, so the model output (if it can even run!) will not make any sense."
+		},
+		{
+			text: "The tokenizer and model should always be from the same checkpoint.",
+			explain: "Right!",
+            correct: true
+		},
+		{
+			text: "It's good practice to pad and truncate with the tokenizer as every input is a batch.",
+			explain: "It's true that every model input needs to be a batch. However, truncating or padding this sequence wouldn't necessarily make sense as there is only one of it, and those are techniques to batch together a list of sentences."
+		}
+	]}
+/>
+
+{/if}

From 6b5a6f9fb28f2106e7a0a5703183517eab8cbd18 Mon Sep 17 00:00:00 2001
From: Angroys <120798951+Angroys@users.noreply.github.com>
Date: Sat, 28 Dec 2024 18:56:57 +0200
Subject: [PATCH 005/167] Changed romanian folder name from rum to ro

---
 chapters/{rum => ro}/_toctree.yml   | 0
 chapters/{rum => ro}/chapter0/1.mdx | 0
 chapters/{rum => ro}/chapter2/1.mdx | 0
 chapters/{rum => ro}/chapter2/2.mdx | 0
 chapters/{rum => ro}/chapter2/3.mdx | 0
 chapters/{rum => ro}/chapter2/4.mdx | 0
 chapters/{rum => ro}/chapter2/5.mdx | 0
 chapters/{rum => ro}/chapter2/6.mdx | 0
 chapters/{rum => ro}/chapter2/7.mdx | 0
 chapters/{rum => ro}/chapter2/8.mdx | 0
 10 files changed, 0 insertions(+), 0 deletions(-)
 rename chapters/{rum => ro}/_toctree.yml (100%)
 rename chapters/{rum => ro}/chapter0/1.mdx (100%)
 rename chapters/{rum => ro}/chapter2/1.mdx (100%)
 rename chapters/{rum => ro}/chapter2/2.mdx (100%)
 rename chapters/{rum => ro}/chapter2/3.mdx (100%)
 rename chapters/{rum => ro}/chapter2/4.mdx (100%)
 rename chapters/{rum => ro}/chapter2/5.mdx (100%)
 rename chapters/{rum => ro}/chapter2/6.mdx (100%)
 rename chapters/{rum => ro}/chapter2/7.mdx (100%)
 rename chapters/{rum => ro}/chapter2/8.mdx (100%)

diff --git a/chapters/rum/_toctree.yml b/chapters/ro/_toctree.yml
similarity index 100%
rename from chapters/rum/_toctree.yml
rename to chapters/ro/_toctree.yml
diff --git a/chapters/rum/chapter0/1.mdx b/chapters/ro/chapter0/1.mdx
similarity index 100%
rename from chapters/rum/chapter0/1.mdx
rename to chapters/ro/chapter0/1.mdx
diff --git a/chapters/rum/chapter2/1.mdx b/chapters/ro/chapter2/1.mdx
similarity index 100%
rename from chapters/rum/chapter2/1.mdx
rename to chapters/ro/chapter2/1.mdx
diff --git a/chapters/rum/chapter2/2.mdx b/chapters/ro/chapter2/2.mdx
similarity index 100%
rename from chapters/rum/chapter2/2.mdx
rename to chapters/ro/chapter2/2.mdx
diff --git a/chapters/rum/chapter2/3.mdx b/chapters/ro/chapter2/3.mdx
similarity index 100%
rename from chapters/rum/chapter2/3.mdx
rename to chapters/ro/chapter2/3.mdx
diff --git a/chapters/rum/chapter2/4.mdx b/chapters/ro/chapter2/4.mdx
similarity index 100%
rename from chapters/rum/chapter2/4.mdx
rename to chapters/ro/chapter2/4.mdx
diff --git a/chapters/rum/chapter2/5.mdx b/chapters/ro/chapter2/5.mdx
similarity index 100%
rename from chapters/rum/chapter2/5.mdx
rename to chapters/ro/chapter2/5.mdx
diff --git a/chapters/rum/chapter2/6.mdx b/chapters/ro/chapter2/6.mdx
similarity index 100%
rename from chapters/rum/chapter2/6.mdx
rename to chapters/ro/chapter2/6.mdx
diff --git a/chapters/rum/chapter2/7.mdx b/chapters/ro/chapter2/7.mdx
similarity index 100%
rename from chapters/rum/chapter2/7.mdx
rename to chapters/ro/chapter2/7.mdx
diff --git a/chapters/rum/chapter2/8.mdx b/chapters/ro/chapter2/8.mdx
similarity index 100%
rename from chapters/rum/chapter2/8.mdx
rename to chapters/ro/chapter2/8.mdx

From d13ac2dd8d67d3ccf519fb36867e20123422af8f Mon Sep 17 00:00:00 2001
From: Angroys <120798951+Angroys@users.noreply.github.com>
Date: Wed, 1 Jan 2025 22:44:41 +0200
Subject: [PATCH 006/167] added chapter 3 first 3 sections

---
 .codegpt/head                 |   1 +
 chapters/ro/chapter3/1.mdx    |  25 +++
 chapters/ro/chapter3/2.mdx    | 393 ++++++++++++++++++++++++++++++++++
 chapters/ro/chapter3/3_tf.mdx | 206 ++++++++++++++++++
 4 files changed, 625 insertions(+)
 create mode 100644 .codegpt/head
 create mode 100644 chapters/ro/chapter3/1.mdx
 create mode 100644 chapters/ro/chapter3/2.mdx
 create mode 100644 chapters/ro/chapter3/3_tf.mdx

diff --git a/.codegpt/head b/.codegpt/head
new file mode 100644
index 000000000..61e0708bd
--- /dev/null
+++ b/.codegpt/head
@@ -0,0 +1 @@
+d92002a2-d67d-44e7-9370-14bf913c3669
\ No newline at end of file
diff --git a/chapters/ro/chapter3/1.mdx b/chapters/ro/chapter3/1.mdx
new file mode 100644
index 000000000..87d1e54dd
--- /dev/null
+++ b/chapters/ro/chapter3/1.mdx
@@ -0,0 +1,25 @@
+<FrameworkSwitchCourse {fw} />
+
+# Introduction[[introduction]]
+
+<CourseFloatingBanner
+    chapter={3}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+În [Chapter 2](/course/chapter2) am explorat cum să folosim tokenizeri și modele pretrained pentru a face predicții. Dar dacă vrei să faci fine-tune un model pre-trained pentru propriul dataset? Acesta e subiectul acestui capitol. Vei învăța:
+
+{#if fw === 'pt'}
+* Cum să pregătiți un dataset mare din Hub
+* Cum să folosiți API-ul `Trainer` pentru a face fine-tune unui model
+* Cum să creați o buclă de antrenare personalizată
+* Cum să beneficiați de biblioteca 🤗 Accelerate pentru a rula ușor această bucla de antrenare personalizare pe orice configurare distribuită.
+
+{:else}
+* Cum să pregătiți un datasetmare din Hub
+* Cum să folosiți Keras să faceți fine-tune unui model
+* Cum să folosiți Keras pentru a obține predicții
+* Cum să folosiți un indicator custom
+
+{/if}
+Pentru a încărca checkpoint-urile antrenate pe Hugging Face Hub, veți avea nevoie de un cont la huggingface.co: [creați un cont](https://huggingface.co/join)
\ No newline at end of file
diff --git a/chapters/ro/chapter3/2.mdx b/chapters/ro/chapter3/2.mdx
new file mode 100644
index 000000000..8d6cc6c4c
--- /dev/null
+++ b/chapters/ro/chapter3/2.mdx
@@ -0,0 +1,393 @@
+`<FrameworkSwitchCourse {fw} />`
+
+# Procesarea datelor [[processing-the-data]]
+
+{#if fw === 'pt'}
+
+<CourseFloatingBanner chapter={3}
+    classNames="absolute z-10 right-0 top-0"
+    notebooks={[
+        {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter3/section2_pt.ipynb"},
+        {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter3/section2_pt.ipynb"},
+]} />
+{:else}
+
+<CourseFloatingBanner chapter={3}
+
+classNames="absolute z-10 right-0 top-0"
+    notebooks={[
+        {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter3/section2_tf.ipynb"},
+        {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter3/section2_tf.ipynb"},
+]} />
+
+{/if}
+
+{#if fw === 'pt'}
+Continuând cu exemplul din [capitol anterior](/course/chapter2), mai jos vedeți cum putem să antrenăm un sequence classifier pe un singur batch în PyTorch:
+
+```python
+import torch
+from transformers import AdamW, AutoTokenizer, AutoModelForSequenceClassification
+
+checkpoint = "bert-base-uncased"
+tokenizer = AutoTokenizer.from_pretrained(checkpoint)
+model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
+
+sequences = [
+    "Am așteptat toată viața mea pentru un curs HuggingFace.",
+    "Acest curs este fascinant!",
+]
+batch = tokenizer(sequences, padding=True, truncation=True, return_tensors="pt")
+
+# Acesta este nou
+batch["labels"] = torch.tensor([1, 1])
+
+optimizer = AdamW(model.parameters())
+loss = model(**batch).loss
+loss.backward()
+optimizer.step()
+```
+{:else}
+Continuând cu exemplul din [capitolul anterior](/course/chapter2), mai jos vedeți cum continuăm antrenarea unui sequence classifier pe un batch în TensorFlow:
+
+```python
+import tensorflow as tf
+import numpy as np
+from transformers import AutoTokenizer, TFAutoModelForSequenceClassification
+
+# Același lucru ca dinainte
+checkpoint = "bert-base-uncased"
+tokenizer = AutoTokenizer.from_pretrained(checkpoint)
+model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint)
+sequences = [
+    "Am așteptat toată viața mea pentru un curs HuggingFace.",
+    "Acest curs este fascinant!",
+]
+batch = dict(tokenizer(sequence, padding=True, truncate=True, return_tensors="tf"))
+
+
+# Aceasta este nou
+model.compile(optimizer="adam", loss="sparse_categorical_crossentropy")
+etichete = tf.convert_to_tensor([1, 1])
+model.train_on_batch(batch, etichete)
+```
+
+De obicei, antrenarea modelului pe două propoziții nu va da rezultate foarte bune. Pentru a obține rezultate mai bune, veți avea nevoie să pregătiți un dataset mai mare.
+
+În această secțiune vom folosi ca exemplu datasetul MRPC (Microsoft Research Paraphrase Corpus), introdus într-un [articol](https://www.aclweb.org/anthology/I05-5002.pdf) de William B. Dolan și Chris Brockett. Datasetul constă din 5,801 perechi de propoziții, cu o etichetă care indică dacă sunt paraphraseuri sau nu (adică dacă ambele propoziții au același înțeles). Am selectat-o pentru acest capitoldeoare că este un dataset mic, așa încât să fie ușor de experimentat cu antrenarea pe el.
+
+### Încărcarea unui dataset din Hub[[loading-a-dataset-from-the-hub]]
+
+{#if fw === 'ro'}
+<Youtube id="_BZearw7f0w"/>
+{:else}
+<Youtube id="W_gMJF0xomE"/>
+{/if}
+
+Hub-ul nu conține doar modele; de asemenea, conține multiple dataseturi înm mai multe limbi. Puteți naviga prin seturile de date [aici](https://huggingface.co/datasets), și vă recomandăm să încercați să încărcați și procurați un nou dataset odată ce veți fi trecut prin această secțiune (vedeți documentația generală [aici](https://huggingface.co/docs/datasets/loading)). Dar pentru moment, să ne concentrăm pe datasetul MRPC! Este una dintre cele 10 seturi de date care compun benchmark-ul [GLUE](https://gluebenchmark.com/), care este un benchmark academic folosit pentru a măsura performanța modelelor ML în 10 diferite sarcini de clasificare a textului.
+
+Biblioteca 🤗 Datasets oferă o comandă foarte simplă pentru a descărca și a stoca un dataset din Hub. Putem să instalăm datasetul MRPC astfel:
+
+<Tip>
+⚠️ **Avertizare** Asigurați-vă că `datasets` este instalat prin rularea `pip install datasets`. Apoi, încărcați dataset-ul MRPC și printați-l pentru a vedea ce conține.
+</Tip>
+
+```py
+from datasets import load_dataset
+
+raw_datasets = load_dataset("glue", "mrpc")
+raw_datasets
+```
+
+```python out
+DatasetDict({
+    train: Dataset({
+        features: ['sentence1', 'sentence2', 'label', 'idx'],
+        num_rows: 3668
+    })
+    validation: Dataset({
+        features: ['sentence1', 'sentence2', 'label', 'idx'],
+        num_rows: 408
+    })
+    test: Dataset({
+        features: ['sentence1', 'sentence2', 'label', 'idx'],
+        num_rows: 1725
+    })
+})
+```
+
+Ai observat că am obținut un obiect `DatasetDict` care conține setul de antrenare, setul de validare și setul de testare. Fiecare dintre acestea conține câteva coloane (`sentence1`, `sentence2`, `label`, și `idx`) și o numpăr de rânduri variabil, care reprezintă numărul de elemente în fiecare set (astfel, există 3.668 perechi de fraze în setul de antrenare, 408 în setul de validare și 1.725 în setul de testare).
+
+Acest comandă descarcă și face cache datasetului, în *~/.cache/huggingface/datasets*(folderul implicit de salvare). În capitolul 2, am văzut cum putem personaliza folderul de cache stabilind variabila de mediu `HF_HOME`.
+
+Putem accesa fiecare pereche de fraze din obiectul `raw_datasets` prin indexare, asemenea unui dicționar:
+
+```py
+raw_train_dataset = raw_datasets["train"]
+raw_train_dataset[0]
+```
+
+```python
+{'idx': 0,
+ 'label': 1,
+ 'sentence1': 'Amrozi l-a acuzat pe fratele său, pe care l-a numit „martorul” , că distorsionează intenționat probele sale.',
+ 'sentence2': 'Referindu-se la el doar sub numele de " martorul ", Amrozi l-a acuzat pe fratele său că distorsionează intenționat probele sale.'}
+```
+
+Putem vedea că labels sunt numere întregi, așadar nu vom trebui să facem nicio procesare în acest sens. Pentru a ști care număr întreg corespunde cu care label, putem inspecta variabila `features` al 'raw_train_dataset'. Acest lucru ne va spune tipul fiecărui coloană.
+
+```py
+raw_train_dataset.features
+```
+
+```python out
+{'sentence1': Value(dtype='string', id=None),
+ 'sentence2': Value(dtype='string', id=None),
+ 'label': ClassLabel(num_classes=2, names=['not_equivalent', 'equivalent'], names_file=None, id=None),
+ 'idx': Value(dtype='int32', id=None)}
+```
+
+În spatele, `label` este obiect de tip `ClassLabel`, iar maparea numerelor întregi la numele label-ului este stocat în folderele *names*. Astfel, `0` corespunde cu `not_equivalent`, iar `1` corespunde cu `equivalent`.
+
+<Tip>
+
+✏️ **Încercați-o!** Arată elementul 15 din setul de antrenament și elementul 87 din setul de validare. Care sunt label-urile acesotra?
+
+</Tip>
+
+### Preprocessing un datset[[preprocessing-a-dataset]]
+
+{#if fw === 'pt'}
+<Youtube id="0u3ioSwev3s"/>
+{:else}
+<Youtube id="P-rZWqcB6CE"/>
+{/if}
+
+Pentru a prelucra datele, trebuie să convertim textul în numere pe care modelul le poate înțelege. Cum ai văzut în [capitol anterior](/course/chapter2), acest lucru se face cu ajutorul unui tokenizer. Putem să oferim tokenizerului o propoziție sau o listă de propoziții, așa că putem să tokenizăm direct toate primele propoziții și toate cele de-a doua propoziții ale fiecărei perechi în felul următor:
+
+```py
+from transformers import AutoTokenizer
+
+checkpoint = "bert-base-uncased"
+tokenizer = AutoTokenizer.from_pretrained(checkpoint)
+tokenized_sentences_1 = tokenizer(raw_datasets["train"]["sentence1"])
+tokenized_sentences_2 = tokenizer(raw_datasets["train"]["sentence2"])
+```
+
+Însă nu putem să transmitem doar două propoziții către model și să obținem o predicție dacă cele două propoziții sunt parafraze sau nu. Trebuie să controlăm cele două secvențe ca o pereche, apoi să le aplicăm preprocesarea adecvată. Norocul este că tokenizer-ul poate lua o pereche de propoziții și le poate pregăti în felul în care modelul BERT îl așteaptă: 
+
+```py
+inputs = tokenizer("Aceasta este prima propoziție.", "Aceasta este a doua.")
+inputs
+
+```
+
+```python out
+{ 
+  'input_ids': [101, 2023, 2003, 1996, 2034, 6251, 1012, 102, 2023, 2003, 1996, 2117, 2028, 1012, 102],
+  'token_type_ids': [0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1],
+  'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]
+}
+```
+
+Am discutat despre `input_ids` și `attention_mask` cheii în [Capitolul 2](/course/chapter2), dar am întârziat cu abordarea cheii `token_type_ids`. În acest exemplu, această cheie este ceea ce spune modelului care parte a inputului este prima propoziție și care este a doua.
+
+<Tip>
+✏️ **Încercați!** Luați elementul 15 din setul de antrenare și tokenizați cele două propoziții separat și ca o pereche. Care este diferența dintre rezultatele celor două? 
+</Tip>
+
+Dacă facem decode ID-urilor din `input_ids` înapoi la cuvinte:
+
+```python
+tokenizer.convert_ids_to_tokens(inputs["input_ids"])
+```
+
+Noi vom obține următorul rezultat:
+
+```python
+['[CLS]', 'acesta', 'este', 'prima', 'propoziție', '.', '[SEP]', 'acesta', 'este', 'a', 'doua', '.', '[SEP]']
+```
+
+Prin urmare, modelul așteaptă ca inputul să fie în forma `[CLS] sentence1 [SEP] sentence2 [SEP]` atunci când există două propoziții. Aliniind această informație cu `token_type_ids`, obținem:
+
+```python
+['[CLS]', 'acesta', 'este', 'prima', 'propoziție', '.', '[SEP]', 'acesta', 'este', 'a', 'doua', '.', '[SEP]']
+[      0,      0,    0,     0,       0,          0,   0,       0,      1,    1,     1,        1,     1,   1,       1]
+```
+
+Observăm,că inputul corespunzător `[CLS] sentence1 [SEP]` au toate un token type ID de `0`, în timp ce celelalte părți, corespunzătoare `sentence2 [SEP]`, au toate un token type ID de `1`.
+
+Înțelegem că dacă selectăm alt checkpoint al modelului, nu vom avea neapărat `token_type_ids` în inputurile tokenizate (de exemplu, ele nu sunt returnate dacă folosim un model DistilBERT). Acestea sunt returnate doar atunci când modelul știe ce să facă cu ele, pentru că le-a văzut în timpul pretrainingului.
+
+În acest caz, BERT este antrenat cu token type IDs și pe lângă the masked language modeling objective despre care am vorbit în [Capitolul 1](/course/chapter1), are un objective suplimentar numit _next sentence prediction_. Objectiveul este destinat modelării relației între perechi de propoziții.
+
+Cu următoare predicție a propoziției, modelului i se prezintă perechi de propoziții (cu masked tokens aleatoriu) și i se cere să prezică dacă a doua propoziție urmează primei. Pentru a face sarcina non-trivial, în jumătate dintre cazuri propizițiie urmează una pe alta în documentul original din care au fost extrase și cealaltă jumătate ele vin de la două documente diferite.
+
+În general, nu trebuie să vă faceți griji dacă există sau nu `token_type_ids` în inputurile tokenizate: atât timp cât folosiți aceelași checkpoint al modelului și a tokenizer-ului, totul va fi bine, pentru că tokenizer-ul știe ce are de oferit modelului.
+
+Acum că am văzut cum poate prelucra tokenizer-ul o pereche de propoziții, îl putem folosi acest lucru pentru a tokeniza întregul nostru dataset: exact ca în [capitolul anterior](/course/chapter2), putem să oferim tokenizer-ului o listă de perechi de propoziții oferindu-i prima listă de propoziții și apoi lista a doua. Acest lucru este compatibil cu padding-ul și truncation-ul pe care le-am văzut în [Capitolul 2](/course/chapter2). În felul acesta putem prelucra datasetul de antrenare astfel:
+
+```py
+tokenized_dataset = tokenizer(
+    raw_datasets["train"]["sentence1"],
+    raw_datasets["train"]["sentence2"],
+    padding=True,
+    truncation=True,
+)
+```
+
+Această metodă funcționează bine, dar are dezavantajul că returnează un dicționar (cu key-urile noastre, `input_ids`, `attention_mask`, și `token_type_ids` și valori care sunt liste de liste). Va funcționa doar dacă aveți destul de RAM pentru a stoca întreg dataset în tokenizării acestuia (iar dataset-urile din biblioteca 🤗 Datasets sunt fișiere [Apache Arrow](https://arrow.apache.org/) stocate pe disc, deci tu stochezi numai sample-urile pe care le ceri să se păstreaze în memorie).
+
+Acum că am înțeles modul în care tokenizer-ul nostru poate gestiona o pereche de fraze, putem folosi el pentru a tokenize întregul nostru set de date: la fel cum am făcut în [capitolul anterior](/course/chapter2), putem alimenta tokenizer-ul cu lista de prime fraze și apoi lista de fraze secunde. Această metodă este compatibilă și cu opțiunile de umplere și tăiere pe care le-am văzut în [Capitolul 2](/course/chapter2). Astfel, una dintre modalitățile prin care putem preprocesa dataset-ul de antrenare este:
+
+```py
+tokenized_dataset = tokenizer(
+    raw_datasets["train"]["sentence1"],
+    raw_datasets["train"]["sentence2"],
+    padding=True,
+    truncation=True,
+)
+```
+
+Această metodă funcționează bine, dar are dezavantajul că returnează un dicționar (cu cheile noastre, `input_ids`, `attention_mask`, și `token_type_ids`, și valori care sunt liste de liste). Va fi disponibilă doar dacă aveți suficient spațiu de memorie pentru a stoarca întregul set de date în timpul tokenizării (în timp ce dataset-urile din biblioteca 🤗 Datasets se salvează sub forma [Apache Arrow](https://arrow.apache.org/), fișiere stocate pe disch, astfel încât doar acele fragmente ale datelor pe care le cerem să fie încărcate în memorie).
+
+Pentru a păstra datele în forma de dataset, vom folosi metoda [`Dataset.map()`](https://huggingface.co/docs/datasets/package_reference/main_classes#datasets.Dataset.map). Aceasta ne permite puțin mai multă flexibilitate, dacă ne trebuie mai multă preprocesare pe lângă tokenization. Metoda `map()` aplică o funcție asupra fiecărui element al datasetului, astfel putem să definim o funcție care tokenizează input-urile noastre:
+
+```py
+def tokenize_function(example):
+    return tokenizer(example["sentence1"], example["sentence2"], truncation=True)
+```
+
+Această funcție i-a un dicționar (ca și elementele datasetului) și returnează un nou dicționar cu key-urile `input_ids`, `attention_mask`, și `token_type_ids`. Acesta va lucra chiar și dacă dicționarul "example" conține câteva sample-uri(fiecare key ca o list de propoziții), întrucât "tokenizer"-ul lucrează și cu liste cu perechi de propoziții cum am văzut mai devreme. Aceasta va permite folosirea opțiunii `batched=True` în apelul funcției `map()`, ceea ce va accelera semnificativ tokenizarea. `Tokenizer`-ul nostru este susținut de un tokenizer scris în Rust din biblioteca [🤗 Tokenizers](https://github.com/huggingface/tokenizers). Acest tokenizer poate fi extrem de rapid, dar numai dacă îi dăm multe inputuri odată.
+
+*Atenție*:Am omis argumentul `padding` din funcția noastră de tokenizare pentru moment. Acest lucru este datorat faptului că aplicarea padding-ului tuturor elementelor cu lungimea maximă nu este eficientă: în schimb, este mai bine să faceți padding elementelor atunci când creați un batch, astfel încât să vă trebuiască doar să faceți padding până la lungimea maximă doar în acest batch și nu întregului dataset. Acest lucru poate salva mult timp și resurse atunci când input-urile au lungimi foarte variabile.
+
+Aici este modul în care aplicăm funcția de tokenizare asupra tuturor dataset-urilor noastre. Folosim `batched=True` în apelul funcției `map` astfel încât funcția să fie aplicată asupra mai multor elemente ale datasetului odată. Aceasta permite preprocesarea accelerată.
+
+```py
+tokenized_datasets = raw_datasets.map(tokenize_function, batched=True)
+tokenized_datasets
+```
+
+Modul în care biblioteca 🤗 Datasets aplică această procesare este prin adăugarea de noi câmpuri la dataset-uri, unul pentru fiecare key din dicționarul returnat de funcția de preprocesare:
+
+```python out
+DatasetDict({
+    train: Dataset({
+        features: ['attention_mask', 'idx', 'input_ids', 'label', 'sentence1', 'sentence2', 'token_type_ids'],
+        num_rows: 3668
+    })
+    validation: Dataset({
+        features: ['attention_mask', 'idx', 'input_ids', 'label', 'sentence1', 'sentence2', 'token_type_ids'],
+        num_rows: 408
+    })
+    test: Dataset({
+        features: ['attention_mask', 'idx', 'input_ids', 'label', 'sentence1', 'sentence2', 'token_type_ids'],
+        num_rows: 1725
+    })
+})
+```
+
+Puteți chiar și folosi multiprocessing când aplicați funcția de preprocesare cu `map()` prin folosirea unui argument `num_proc`. Nu am făcut acest lucru aici pentru că biblioteca 🤗 Tokenizers utilizează deja mai multe thread-uri pentru a tokeniza sample-urile mai rapid, dar dacă nu folosiți un tokenizer rapid cu această bibliotecă, acest lucru v-ar putea accelera preprocesarea.
+
+Funcția `tokenize_function` returnează un dicționar cu key-urile `input_ids`, `attention_mask`, și `token_type_ids`, astfel că aceste trei câmpuri sunt adăugate tuturor split-urilor în dataset-urile noastre. Notați-vă că am putea chiar schimba câmpurile existente dacă funcția de preprocesare ar returna o nouă valoare pentru un key din dataset-ul pe care aplicăm `map()`.
+
+Ultimul lucru pe care trebuie să îl facem este să facem padding tuturor exemplelor până la lungimea celui mai mare element atunci când facem batch elementelor împreună – o tehnică pe care o denumim *dinamic padding*.
+
+### Dinamic Padding[[dynamic-padding]]
+<Youtube id="7q5NyFT8REg"/>
+{#if fw === 'pt'}
+
+Funcția care este responsabilă de a pune împreună sample-urile într-un batch se numește *collate function*. Este un argument default pe care puteți să-l transmiteți când construiți un `DataLoader`, valoarea implicită fiind o funcție care va converti sample-urile în tensors PyTorch și le va concatena (recursiv dacă elementele dumneavoastră sunt liste, tuple-uri sau dicționare). Acest lucru nu este posibil în cazul nostru deoarece input-urile noastre nu vor avea toate aceeași dimensiune. Am amânat intenționat padding-ul pentru a o aplica numai atunci când e nevoie, pe fiecare batch și să evităm astfel exemplele cu lungimi prea mari cu multe padding-uri. Acest lucru va accelera antrenarea, dar notați-vă că dacă antrenați pe un TPU, acest lucru poate cauza probleme – TPU-urile preferă forme fixe, chiar dacă aceasta înseamnă padding suplimentar.
+
+{:else}
+
+Funcția care este responsabilă de a pune împreună sample-urile într-un batch se numește *collate function*. Collator-ul default este o funcție ce va transforma sample-urile în tf. Faceți Tensor și concatenațile (recursiv dacă elementele dumneavoastră sunt liste, tuple-uri sau dicționare). Acest lucru nu este posibil în cazul nostru deoarece input-urile noastre nu vor avea toate aceeași dimensiune. Am amânat intenționat padding-ul pentru a o aplica numai atunci când e nevoie, pe fiecare batch și să evităm astfel exemplele cu lungimi prea mari cu multe padding-uri. Acest lucru va accelera antrenarea, dar notați-vă că dacă antrenați pe un TPU, acest lucru poate cauza probleme – TPU-urile preferă forme fixe, chiar dacă aceasta înseamnă padding suplimentar.
+
+{/if}
+
+Pentru a face acest lucru, trebuie să definim o funcție collate care va aplica cantitatea corectă de padding pentru elementele din dataset-ul pe care vrem să-i facem batch. Norocul este că biblioteca 🤗 Transformers ne oferă o asemenea funcție prin `DataCollatorWithPadding`. Aceasta i-a un tokenizer atunci când o inițializați(pentru a ști care padding token să folosim și dacă modelul se așteaptă ca padding-ul să fie pe stânga sau dreapta inputu-lui) și va face tot ce este nevoie:
+{#if fw === 'pt'}
+```py
+from transformers import DataCollatorWithPadding
+data_collator = DataCollatorWithPadding(tokenizer=tokenizer)
+```
+{:else}
+```py
+from transformers import DataCollatorWithPadding
+data_collator = DataCollatorWithPadding(tokenizer=tokenizer, return_tensors="tf")
+```
+{/if}
+
+Pentru a testa acest nou jucărie, să luăm câteva sample-uri din setul nostru de antrenare pe care am dori să le facem batch împreună. Aici, ștergem coloanele `idx`, `sentence1` și `sentence2` deoarece nu vor fi necesare și conțin stringuri (și nu putem crea tensore cu stringuri) și uitați-vă la lungimile fiecărui element din lotul nostru:
+
+```py
+samples = tokenized_datasets["train"][:8]
+samples = {k: v for k, v in samples.items() if k not in ["idx", "sentence1", "sentence2"]}
+[len(x) for x in samples["input_ids"]]
+```
+
+```python out
+[50, 59, 47, 67, 59, 50, 62, 32]
+```
+
+Nu e de mirare că obținem sample-uri de lungimi diferite, între 32 și 67. Dynamic padding înseamnă că sample-urilor din acest batch le-ar trebui aplicate padding cu o lungime de 67, lungimea cea mai mare din batch. Fără Dynamic padding, toate sample-urile ar fi avut padding cu maximul lungimii din întregul dataset sau maximul lungimii pe care modelul poate accepta. Să verificăm încă o dată dacă `data_collator`-ul nostru face dynamic padding pe batch:
+
+```py
+batch = data_collator(samples)
+{k: v.shape for k, v in batch.items()}
+```
+
+{#if fw === 'tf'}
+
+```python out
+{'attention_mask': TensorShape([8, 67]),
+ 'input_ids': TensorShape([8, 67]),
+ 'token_type_ids': TensorShape([8, 67]),
+ 'labels': TensorShape([8])}
+```
+
+{:else}
+
+```python out
+{'attention_mask': torch.Size([8, 67]),
+ 'input_ids': torch.Size([8, 67]),
+ 'token_type_ids': torch.Size([8, 67]),
+ 'labels': torch.Size([8])}
+```
+
+Looking good! Acum că am trecut de la textul raw la batch-uri pe care modelul nostru poate să le proceseze, suntem gata să îi facem fine-tune!
+
+{/if}
+
+<Tip>
+
+✏️ **Încearcă-ți norocul!** Implementează preprocesarea datelor pe dataset-ul GLUE SST-2. Acesta se diferență puțin deoarece nu conține perechi de propoziții, ci doar câte o propoziție, dar ceea ce am făcut ar trebui să rămână neschimbat. Pentru o provocare mai grea, încearcă să scrii o funcție de preprocesare care se aplică oricărui task GLUE.
+
+</Tip>
+
+{#if fw === 'tf'}
+
+Acum că avem dataset-ul nostru și un `data_collator`, este timpul să-i punem la lucru. În loc să încărcăm manual batch-urile și să le facem collate, asta însemnând prea mult lucru și, nu ar fi nici prea performantă. În schimb, există o metodă simplă care oferă o soluție performantă la acest problemă: `to_tf_dataset()`. Acest lucru va face wrap unui `tf.data.Dataset` în jurul datasetului nostru, cu o fucție opțională de collation. `tf.data.Dataset` este un format nativ TensorFlow pe care Keras-ul o poate folosi pentru `model.fit()`, astfel încât această metodă face convert unui 🤗 Dataset la un format gata să fie antrenat. Hai să-l vedem în acțiune cu datasetul nostru!
+
+```py
+tf_train_dataset = tokenized_datasets["train"].to_tf_dataset(
+    columns=["attention_mask", "input_ids", "token_type_ids"],
+    label_cols=["labels"],
+    shuffle=True,
+    collate_fn=data_collator,
+    batch_size=8,
+)
+
+tf_validation_dataset = tokenized_datasets["validation"].to_tf_dataset(
+    columns=["attention_mask", "input_ids", "token_type_ids"],
+    label_cols=["labels"],
+    shuffle=False,
+    collate_fn=data_collator,
+    batch_size=8,
+)
+```
+
+Și asta e tot! Putem lua aceste dataset-uri pentru următoarea lecție, unde antrenamentul va fi ușor după toată munca depusă pentru prelucrarea datelor.
+
+{/if}
\ No newline at end of file
diff --git a/chapters/ro/chapter3/3_tf.mdx b/chapters/ro/chapter3/3_tf.mdx
new file mode 100644
index 000000000..5b1636851
--- /dev/null
+++ b/chapters/ro/chapter3/3_tf.mdx
@@ -0,0 +1,206 @@
+<FrameworkSwitchCourse {fw} />
+
+# Aplicarea fine-tuningului asupra unui model cu Keras[[fine-tuning-a-model-with-keras]]
+
+<CourseFloatingBanner chapter={3}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[ 
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter3/section3_tf.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter3/section3_tf.ipynb"},
+]} />
+
+Odată ce ai finalizat toate operațiile de preprocesare a datelor din ultima secțiune, ai doar câțiva pași rămași pentru a antrena modelul. Însă, observați că `model.fit()` va rula foarte lent pe un CPU. Dacă nu aveți un GPU configurat, puteți accesa GPU-uri sau TPUs pe gratis pe [Google Colab](https://colab.research.google.com/).
+
+Exemplele de cod de mai jos presupun că ați executat deja exemplele din secțiunea precedentă. Aici este o scurtă sumarizare care recapitulează ceea ce trebuie să faceți:
+
+```py
+from datasets import load_dataset
+from transformers import AutoTokenizer, DataCollatorWithPadding
+import numpy as np
+
+raw_datasets = load_dataset("glue", "mrpc")
+checkpoint = "bert-base-uncased"
+tokenizer = AutoTokenizer.from_pretrained(checkpoint)
+
+
+def tokenize_function(example):
+    return tokenizer(example["sentence1"], example["sentence2"], truncation=True)
+
+
+tokenized_datasets = raw_datasets.map(tokenize_function, batched=True)
+
+data_collator = DataCollatorWithPadding(tokenizer=tokenizer, return_tensors="tf")
+
+tf_train_dataset = tokenized_datasets["train"].to_tf_dataset(
+    columns=["attention_mask", "input_ids", "token_type_ids"],
+    label_cols=["labels"],
+    shuffle=True,
+    collate_fn=data_collator,
+    batch_size=8,
+)
+
+tf_validation_dataset = tokenized_datasets["validation"].to_tf_dataset(
+    columns=["attention_mask", "input_ids", "token_type_ids"],
+    label_cols=["labels"],
+    shuffle=False,
+    collate_fn=data_collator,
+    batch_size=8,
+)
+```
+
+
+### Antrenare[[antrenare]]
+
+
+Modelele TensorFlow importate din 🤗 Transformers sunt deja modele Keras. Aici este o scurtă introducere în Keras.
+
+<Youtube id="rnTGBy2ax1c"/>
+
+
+Astfel, odată ce avem datele noastre, putem începe antrenarea lor foarte ușor.
+
+
+<Youtube id="AUozVp78dhk"/>
+
+
+În același mod ca și în [capitolul anterior](/course/chapter2), vom folosi clasa `TFAutoModelForSequenceClassification`, cu două labeluri:
+
+```py
+from transformers import TFAutoModelForSequenceClassification
+
+model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
+```
+
+Veți observa că în comparație cu [Capitolul 2](/course/chapter2), veți primi o avertizare după ce inițializați acest model preantrenat. Acest lucru se datorează faptului că BERT nu a fost antrenat pentru clasificarea perechilor de propoziții, astfel încât începutul preantrenat al modelului a fost eliminat și un nou început potrivit pentru clasificarea secvențelor a fost adăugat în locul lui. Avertizările indică faptul că anumite weights nu au fost folosite (cele corespunzătoare începutului de preantrenare eliminat) și că altele au fost inițializate aleatoriu (cele pentru noul capăt). Avertizarea se încheie prin încurajarea antrenării modelului, ceea ce este exact ceea ce vom face acum.
+
+
+Pentru a face fine-tune modelului pe datasetul nostru, avem de făcut `compile()` modelului și apoi să trasnmitem datele noastre spre metoda `fit()`. Acest lucru va porni procesul de fine-tuning (care ar trebui să dureze câteva minute pe un GPU) și va raporta training loss, plus validation loss la sfârșitul fiecărei epoci.
+
+<Tip>
+
+Observați că modelele 🤗 Transformers au o abilitate specială care nu este disponibilă pentru cele mai multe modele Keras - ele pot folosi automat un appropriate loss pe care le calculează intern. Ele vor utiliza această pierdere implicit dacă nu veți specifica un argument de pierdere în `compile()`. Pentru a folosi internal loss, va trebui să transmiteți labelurile ca parte din input, și nu ca nu label separat, ceea ce este modul normal de utilizare a labelurilor cu modelele Keras. Veți vedea exemple de acest tip în Partea 2 a cursului, unde definirea funcției de loss corecte poate fi dificilă. În cazul sequence classification, însă, o funcție Keras standard pentru loss se va dovedi suficient, astfel o vom folosi în acest context.
+
+</Tip>
+
+
+```py
+from tensorflow.keras.losses import SparseCategoricalCrossentropy
+
+model.compile(
+    optimizer="adam",
+    loss=SparseCategoricalCrossentropy(from_logits=True),
+    metrics=["accuracy"],
+)
+model.fit(
+    tf_train_dataset,
+    validation_data=tf_validation_dataset,
+)
+```
+
+
+<Tip warning={true}>
+
+Observați un pericol comun aici — puteți transmite doar numele pierderii ca un string în Keras, dar implicit Keras va presupune că deja ați aplicat un softmax la outputurile voastre. Multe modele, însă, produc outputurile direct înainte de aplicarea softmaxului, cunoscute și sub numele de *logit*. Trebuie să spuneți funcției loss că asta este ceea ce produce modelul tău, iar singura modalitate de a face acest lucru este de a-o chema direct, în loc de a o specifica numai cu un string.
+
+</Tip>
+
+### Îmbunătățirea performanței de antrenare
+
+<Youtube id="cpzq6ESSM5c"/>
+
+Dacă încerci codul de mai sus, sigur o să ruleze, dar vei constata că lossul scade doar lent sau doar sporadic. Principala cauză
+este *learning rateul*. Așa cum și lossul, când trimitem către Keras numele unui omptimizer ca uin string, Keras inițiază
+acel optimizer cu valori default pentru toți parametrii, inclusiv learning rateul. Din experiență, însă, știm că
+modelele transformer se bucură de un learning rate mult mai mic decât cel default pentru Adam, care este 1e-3, scris și ca 
+10 la puterea -3 sau 0.001. 5e-5 (0.00005), care este aproximativ douăzeci de ori mai mică, reprezintă o bază mult mai bună.
+
+În plus față de reducerea learning rateului, avem un al doilea truc la dispoziție: putem reduce treptat learning rateul
+pe parcursul antrenării. În documentație, vei găsi uneori această practică denumită *decaying* sau *annealing*
+learning rateul. În Keras, cel mai bun mod de a face acest lucru este să folosim un *learning rate scheduler*. O opțiune bună este
+`PolynomialDecay` — deși numele ar putea sugera altceva, cu setările default, el doar face decay liniar learning rateului din valoarea inițială
+până la valoarea finală pe parcursul antrenării; exact ceea ce ne-am dori. Pentru a utiliza corect un scheduler,
+însă, trebuie să-i spunem cât timp va dura antrenarea. Calculăm acest lucru sub forma `num_train_steps` de mai jos.
+
+```py
+from tensorflow.keras.optimizers.schedules import PolynomialDecay
+
+batch_size = 8
+num_epochs = 3
+# Numărul de pași de antrenare este numărul de sampleuri din dataset, împărțit la dimensiunea batchului și apoi înmulțit
+# cu numărul total de epoci. Observăm că `tf_train_dataset` aici este un batched tf.data.Dataset`,
+# nu datasetul original Hugging Face, astfel încât len() să fie deja num_samples // batch_size.
+num_train_steps = len(tf_train_dataset) * num_epochs
+lr_scheduler = PolynomialDecay(
+    initial_learning_rate=5e-5, end_learning_rate=0.0, decay_steps=num_train_steps
+)
+from tensorflow.keras.optimizers import Adam
+
+opt = Adam(learning_rate=lr_scheduler)
+```
+
+<Tip>
+
+Biblioteca 🤗 Transformers are funcția `create_optimizer()` care va crea un optimizer `AdamW` cu learning rate decay. Aceasta este o metodă convenabilă pe care o veți vedea în detaliu în viitoarele sec'iuni ale cursului.
+
+</Tip>
+
+Acum, avem noul nostru optimizer și putem încerca să antrenăm cu el. Începem cu reloadul modelului pentru a reseta modificările pe weighturole de la ultima rundă de antrenare ;o apoi putem face compile cu noul optimizer:
+
+```py
+import tensorflow as tf
+
+model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
+loss = tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True)
+model.compile(optimizer=opt, loss=loss, metrics=["accuracy"])
+```
+
+Acum putem face fit din nou:
+
+```py
+model.fit(tf_train_dataset, validation_data=tf_validation_dataset, epochs=3)
+```
+
+<Tip>
+
+💡 Dacă doriți să încărcați automat modelul dumneavoastră pe Hub în timpul antrenării, puteți transmite `PushToHubCallback` în metoda `model.fit()`. Mai multe despre acest lucru veți învăța în [Capitol 4](/course/chapter4/3).
+
+</Tip>
+
+### Model prediction
+
+<Youtube id="nx10eh4CoOs"/>
+
+
+Încheierea antrenării și observarea lossului scăzând este foarte frumos, dar ce se întămplă dacă doriți să obțineți efectiv outputuruke din modelul antrenat, fie pentru a calcula câteva metrice, fie pentru utilizarea modelului în producție? Pentru asta putem folosi metoda `predict()`. Aceasta va returna *logits* de la începutul outputului modelului, câte unul pe clasă.
+
+```py
+preds = model.predict(tf_validation_dataset)["logits"]
+```
+
+Puteți converti aceste logituri în predicțiile clasei modelului prin utilizarea `argmax` pentru a găsi logit-ul cel mai mare, care corespunde clasei celei mai probabile:
+
+```py
+class_preds = np.argmax(preds, axis=1)
+print(preds.shape, class_preds.shape)
+```
+
+```python out
+(408, 2) (408,)
+```
+
+Acum, să folosim aceste `preds` pentru a calcula câteva metrici! Puteți încărca metricele asociate cu datasetul MRPC în același mod cum am încărcat și datasetul, dar de data aceasta cu ajutorul funcției `evaluate.load()`. Obiectul returnat are o metodă de calculare `compute()` pe care o putem utiliza pentru a face metric calculation:
+
+```py
+import evaluate
+
+metric = evaluate.load("glue", "mrpc")
+metric.compute(predictions=class_preds, references=raw_datasets["validation"]["label"])
+```
+
+```python out
+{'accuracy': 0.8578431372549019, 'f1': 0.8996539792387542}
+```
+
+Rezultatele exacte pe care le veți obține pot varia, deoarece inițializarea aleatoare a începutului modelului care poate schimba metricele pe care le-a atins. Aici putem vedea că modelul nostru are o precizie de 85.78% în setul de validare și un scor F1 de 89.97. Acestea sunt exact aceleași metrice folosite pentru evaluarea rezultatelor pe datasetul MRPC pentru GLUE benchmark. Tabelul din [BERT Paper](https://arxiv.org/pdf/1810.04805.pdf) a raportat un scor F1 de 88.9 pentru modelul de bază. Acela a fost un `uncased` model, dar noi utilizăm acum un `cased` model, ceea ce explică rezultatul mai bun.
+
+Acesta este punctul unde vă prezentăm introducerea la folosirea fine-tuningului cu ajutorul APIului Keras. Un exemplu bun pentru majoritatea sarcinilor NLP va fi dat în [Capitol 7](/course/chapter7). Dacă doriți să dezvoltați abilitățile dumneavoastră pe API-ul Keras, încercați să faceți fine-tune unui model pe datasetul GLUE SST-2 folosind procesarea de date din secvența 2.
\ No newline at end of file

From ade28a8f64a97a97fc7b0069c8d583b59dbb8238 Mon Sep 17 00:00:00 2001
From: Angroys <120798951+Angroys@users.noreply.github.com>
Date: Thu, 2 Jan 2025 02:40:15 +0200
Subject: [PATCH 007/167] Finished translating chapter 3

---
 chapters/ro/chapter3/3.mdx | 174 ++++++++++++++++++
 chapters/ro/chapter3/4.mdx | 361 +++++++++++++++++++++++++++++++++++++
 chapters/ro/chapter3/5.mdx |  28 +++
 chapters/ro/chapter3/6.mdx | 301 +++++++++++++++++++++++++++++++
 4 files changed, 864 insertions(+)
 create mode 100644 chapters/ro/chapter3/3.mdx
 create mode 100644 chapters/ro/chapter3/4.mdx
 create mode 100644 chapters/ro/chapter3/5.mdx
 create mode 100644 chapters/ro/chapter3/6.mdx

diff --git a/chapters/ro/chapter3/3.mdx b/chapters/ro/chapter3/3.mdx
new file mode 100644
index 000000000..0a47ba072
--- /dev/null
+++ b/chapters/ro/chapter3/3.mdx
@@ -0,0 +1,174 @@
+
+<FrameworkSwitchCourse {fw} />
+
+# Fine-tuningul unui model cu API-ul Trainer[[fine-tuning-a-model-with-the-trainer-api]]
+
+<CourseFloatingBanner chapter={3}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[ 
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter3/section3.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter3/section3.ipynb"},
+]} />
+
+<Youtube id="nvBXf7s7vTI"/>
+
+🤗 Transformers oferă o clasă `Trainer` pentru a vă ajuta să faceți fine-tune pe oricare dintre modelurile preantrenate pe care le oferă pe datasetul dvs. Odată ce ați terminat preprocesarea datelor din ultima secțiune, mai aveți doar câteva pași rămași pentru a defini `Trainerul`. Partea cea mai grea este probabil pregătirea environmentul pentru a rula `Trainer.train()`, deoarece va lua mult timp pe un CPU. Dacă nu aveți niciun GPU configurat, puteți accesa gratuit GPUuri sau TPUuri pe [Google Colab](https://colab.research.google.com/).
+
+Exemplele de cod de mai jos presupune că ați executat exemplele din secțiunea anterioară. Aici este o scurtă recapitulare despre ce aveți nevoie:
+
+```py
+from datasets import load_dataset
+from transformers import AutoTokenizer, DataCollatorWithPadding
+
+raw_datasets = load_dataset("glue", "mrpc")
+checkpoint = "bert-base-uncased"
+tokenizer = AutoTokenizer.from_pretrained(checkpoint)
+
+
+def tokenize_function(example):
+    return tokenizer(example["sentence1"], example["sentence2"], truncation=True)
+
+
+tokenized_datasets = raw_datasets.map(tokenize_function, batched=True)
+data_collator = DataCollatorWithPadding(tokenizer=tokenizer)
+```
+
+### Antrenarea[[training]]
+
+Înainte de a putea defini `Trainerul`, trebuie să definim o clasă `TrainingArguments` care va conține toți hyperparameters pe care `Trainer` le va folosi pentru antrenare și evaluare. Singurul argument pe care trebuie să-l oferiți este un folder în care modelul anternat va fi salvat, precum și checkpointurile de-a lungul drumului. Toate celelalte pot fi lăsate ca valori default, care ar trebui să funcționeze destul de bine pentru un fine-tune de bază.
+
+```py
+from transformers import TrainingArguments
+
+training_args = TrainingArguments("test-trainer")
+```
+
+<Tip>
+
+💡 Dacă doriți să încărcați automat modelul pe Hub în timpul antrenării, transmiteți `push_to_hub=True` în `TrainingArguments`. Ne vom întoarce la acest subiect în [Capitolul 4](/course/chapter4/3)
+
+</Tip>
+
+A doua etapă este definiția modelului nostru. Ca în capitolul anterior, vom folosi clasa `AutoModelForSequenceClassification`, cu două labeluri:
+
+```py
+from transformers import AutoModelForSequenceClassification
+
+model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
+```
+
+Observăm că, spre deosebire de [Capitolul 2](/course/chapter2), se emite o avertizare după crearea acestui model preantrenat. Acest lucru este datorit faptului că BERT nu a fost antrenat pentru clasificarea perechilor de propoziții, astfel încât începutul modelului preantrenat a fost eliminat și un nou început adecvat pentru clasificarea secvențelor a fost adăugat în loc. Avertizările indică faptul că anumite weights nu au fost utilizate (cele care corespundeau începutul eliminat) și celelalte au fost inițializate aleatoriu (cele pentru noul început). Aceasta se termină cu o recomandare de a antrena modelul, ceea ce vom face acum.
+
+Odată ce am definit modelul nostru, putem defini `Trainer` prin transmiterea tuturor obiectelor construite până acum — `model`, `training_args`, a training și validation datasets, `data_collator`, și `tokenizer`:
+
+```py
+from transformers import Trainer
+
+trainer = Trainer(
+    model,
+    training_args,
+    train_dataset=tokenized_datasets["train"],
+    eval_dataset=tokenized_datasets["validation"],
+    data_collator=data_collator,
+    tokenizer=tokenizer,
+)
+```
+
+Observăm că, dacă transmitem `tokenizer`, atunci defaultul `data_collator` folosit de `Trainer` va fi un `DataCollatorWithPadding` similar celui definit mai devreme. Din acest motiv, puteți omite linia `data_collator=data_collator` aici. A fost important să vă arătăm această parte în secțiunea 2!
+
+Pentru a face fine-tune modelului pe datasetul nostru, trebuie să apelăm metoda `train()` a `Trainerului`:
+
+```py
+trainer.train()
+```
+
+Acest lucru va începe fine-tuningul (care ar trebui să dureze câteva minute pe un GPU) și va raporta training loss la fiecare 500 de pași. Totuși, nu va raporta cât de bine sau rău se descurcă modelul. Acest lucru este datorat:
+
+1. Nu am transmis `Trainerului` să efectueze evaluarea în timpul antrenării, prin setarea `evaluation_strategy` la `"steps"` (evaluați la fiecare `eval_steps`) sau `"epoch"` (evaluați la finalul fiecărei epoch).
+2. Nu am oferit `Trainerului` o funcție `compute_metrics()` pentru a calcula metricele în timpul evaluări(altminter evalurea ar fi printat doar lossul, care nu este un număr foarte intuitiv).
+
+### Evaluare[[evaluation]]
+
+Să vedem cum putem construi o funcție `compute_metrics()` folositoare și să o utilizăm la următoarea antrenare. Funcția trebuie să primească obiectul `EvalPrediction` (un named tuple cu fieldul `predictions` și altul `label_ids`) și să returneze un dicționar ce le asociază făcând mapping valorilor string la valori float (stringurile fiind denumirile metricelor returnate, și valorile floats al acestora). Pentru a obține câteva predicții din model, putem folosi comanda `Trainer.predict()`:
+
+```py
+predictions = trainer.predict(tokenized_datasets["validation"])
+print(predictions.predictions.shape, predictions.label_ids.shape)
+```
+
+```python out
+(408, 2) (408,)
+```
+
+Outputul metodei `predict()` este un named tuple  cu trei fielduri: `predictions`, `label_ids` și `metrics`. Câmpul `metrics` va conține doar lossul asupra datasetului transmis, precum și o serie de metrice de timp (cât de mult a luat prezicerea și timpul mediu). Odată ce vom completa funcția `compute_metrics()` și îl vom oferi `Trainerului`, atunci acel field va conține și metricele returnate de `compute_metrics()`.
+
+După cum puteți vedea, `predictions` este un array bi-dimensional cu shapeul 408x2 (408 fiind numărul de elemente în datasetul folosit). Acestea sunt logiturile pentru fiecare element al datasetului pe care le-am oferit funcției `predict()` (cum ați văzut în [capitolul anterior](/course/chapter2), toate modelel Transformer returneă logituri). Pentru a le transforma în predicții pe care să le comparăm cu labelurile noastre, noi trebui să luăm indexul cu cea mai mare valoare pe axa a doua:
+
+
+```py
+import numpy as np
+
+preds = np.argmax(predictions.predictions, axis=-1)
+```
+
+Acum putem compara `preds` cu labelurile. Ca să construim funcțioa noastră `compute_metric()`, o să ne bazăm pe metricele de la librăria 🤗 [Evaluate](https://github.com/huggingface/evaluate/). Putem încărca metricele asociate cu datasetul MRPC la fel de ușor cum am încărcat datasetul, de data asta cu funcția `evaluate.load()`. Obiectul returnat are o metodă `compute()` pe care o putem folosi ca să facem calcularea metricelor:
+
+```py
+import evaluate
+
+metric = evaluate.load("glue", "mrpc")
+metric.compute(predictions=np.argmax(predictions.predictions, axis=-1), references=predictions.label_ids)
+```
+
+```python out
+{'accuracy': 0.8578431372549019, 'f1': 0.8996539792387542}
+```
+
+Rezultatele exacte pe care le veți obține pot varia, deoarece inițializarea aleatoare a începutului modelului care poate schimba metricele pe care le-a atins. Aici putem vedea că modelul nostru are o precizie de 85.78% în setul de validare și un scor F1 de 89.97. Acestea sunt exact aceleași metrice folosite pentru evaluarea rezultatelor pe datasetul MRPC pentru GLUE benchmark. Tabelul din [BERT Paper](https://arxiv.org/pdf/1810.04805.pdf) a raportat un scor F1 de 88.9 pentru modelul de bază. Acela a fost un `uncased` model, dar noi utilizăm acum un `cased` model, ceea ce explică rezultatul mai bun.
+
+Pentru a reuni toate acestea într-o singură funcție `compute_metrics()`, putem scrie:
+
+```py
+def compute_metrics(eval_preds):
+    metric = evaluate.load("glue", "mrpc")
+    logits, labels = eval_preds
+    predictions = np.argmax(logits, axis=-1)
+    return metric.compute(predictions=predictions, references=labels)
+```
+
+Să vedem acum cum putem utiliza această funcție pentru a raporta metricele la sfârșitu fiecărei epoch, mai jos puteți vedea cum definim un nou `Trainer` cu funcția compute:
+
+```py
+training_args = TrainingArguments("test-trainer", evaluation_strategy="epoch")
+model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
+
+trainer = Trainer(
+    model,
+    training_args,
+    train_dataset=tokenized_datasets["train"],
+    eval_dataset=tokenized_datasets["validation"],
+    data_collator=data_collator,
+    tokenizer=tokenizer,
+    compute_metrics=compute_metrics,
+)
+```
+
+Observăm că am creat un nou `TrainingArguments` cu `evaluation_strategy` setat la `"epoch"` și o nouă instanță a modelului. În cazul nostru, ar fi fost suficient să continuam antrenarea prezentată anterior.
+
+Pentru a lansa o nouă antrenare, putem executa:
+
+```py
+trainer.train()
+```
+
+De data aceasta, acesta va raporta validation loss și metricele la sfârșitul fiecărui epocă pe lângă training loss. Dar acuratețea/scorul F1 pe care îl atingeți poate fi puțin diferit față de ceea ce am găsit, datorită inițializării aleatoare a începutului modelului, dar ar trebui să nu difere foarte mult.
+
+`Trainerul` va funcționa în mod automat pe mai multe GPU-uri sau TPU-uri și oferă multe opțiuni, cum ar fi mixed-precision training(folosiți `fp16 = True` în argumentele de antrenare). Vom discuta despre toate opțiunile pe care le are în Capitolul 10.
+
+Cu aceasta terminăm introducerea fine-tuningului folosind API-ul `Trainer`. Un exemplu de a face acest lucru pentru majoritatea sarcinilor NLP va fi dat în [Capitolul 7](/course/chapter7), dar pentru moment să vedem cum putem face același lucru doar cu PyTorch.
+
+<Tip>
+
+✏️ **Încearcă!** Fă fine-tune unui model pe datasetul GLUE SST-2, folosind procesarea de date efectuată în secțiunea 2.
+
+</Tip>
diff --git a/chapters/ro/chapter3/4.mdx b/chapters/ro/chapter3/4.mdx
new file mode 100644
index 000000000..4c703260b
--- /dev/null
+++ b/chapters/ro/chapter3/4.mdx
@@ -0,0 +1,361 @@
+# O antrenare completă [[a-full-training]]
+
+<CourseFloatingBanner chapter={3}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[ 
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter3/section4.ipynb"}, 
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter3/section4.ipynb"}, 
+]} />
+
+<Youtube id="Dh9CL8fyG80"/>
+
+Acum vom vedea cum putem atinge același rezultat pe care l-am obținut în secțiune anterioară fără a utiliza clasa `Trainer`. Din nou, noi presupunem că ai procesat datele în secțiunea 2. În continuare, găsiți o scurtă sinteză asupra tuturor informațiilor de care aveți nevoie:
+
+```py
+from datasets import load_dataset
+from transformers import AutoTokenizer, DataCollatorWithPadding
+
+raw_datasets = load_dataset("glue", "mrpc")
+checkpoint = "bert-base-uncased"
+tokenizer = AutoTokenizer.from_pretrained(checkpoint)
+
+
+def tokenize_function(example):
+    return tokenizer(example["sentence1"], example["sentence2"], truncation=True)
+
+
+tokenized_datasets = raw_datasets.map(tokenize_function, batched=True)
+data_collator = DataCollatorWithPadding(tokenizer=tokenizer)
+```
+
+### Pregătirea pentru antrenare[[prepare-for-training]]
+
+Înainte de a scrie propriul nostru loop de antrenament, vom avea nevoie să definim câteva obiecte. Primele dintre ele sunt dataloader-urile pe care le vom utiliza pentru a itera peste batch-uri. Dar înainte de a putea defini aceste datealoader-uri, trebuie să aplicăm o anumită postprocesare pe `tokenized_datasets`, pentru a avea grijă de unele lucruri care au fost automatizate de către `Trainer`. În special:
+
+- Eliminăm coloanele corespunzătoare valorilor pe care modelul nu le așteaptă (ca de exemplu, `sentence1` și `sentence2`).
+- Redenumește coloana `label` în `labels`, deoarece modelul așteaptă argumentul să fie numit `labels`.
+- Setăm formatul dataseturilor astfel încât ele să returneze tensore PyTorch în loc de liste.
+
+Metodele noastre `tokenized_datasets` au fiecare unul dintre acești pași:
+
+```py
+tokenized_datasets = tokenized_datasets.remove_columns(["sentence1", "sentence2", "idx"])
+tokenized_datasets = tokenized_datasets.rename_column("label", "labels")
+tokenized_datasets.set_format("torch")
+tokenized_datasets["train"].column_names
+```
+
+Vom verifica că rezultatul conține doar coloanele pe care vor modelul le acceptă:
+
+```python
+["attention_mask", "input_ids", "labels", "token_type_ids"]
+```
+
+Acum că am făcut asta, putem defini cu ușurință dataloader-urile noastre:
+
+```py
+from torch.utils.data import DataLoader
+
+train_dataloader = DataLoader(
+    tokenized_datasets["train"], shuffle=True, batch_size=8, collate_fn=data_collator
+)
+eval_dataloader = DataLoader(
+    tokenized_datasets["validation"], batch_size=8, collate_fn=data_collator
+)
+```
+
+Pentru a verifica rapid că nu există nici o greșeală în procesarea datelor, putem inspecta un batch-ul astfel:
+
+```py
+for batch in train_dataloader:
+    break
+{k: v.shape for k, v in batch.items()}
+```
+
+```python out
+{'attention_mask': torch.Size([8, 65]),
+ 'input_ids': torch.Size([8, 65]),
+ 'labels': torch.Size([8]),
+ 'token_type_ids': torch.Size([8, 65])}
+```
+
+Observați că shapeurile actuale vor fi probabil ușor diferite pentru tine, deoarece am setat `shuffle=True` pentru dataloader-ul de antrenare și am făcut padding batch-urilor la lungime maximă în interiorul lor.
+
+Acum că am terminat complet procesarea datelor (un obiectiv satisfăcător, dar înșelător pentru orice specialist ML), să trecem la model. Îl inițializăm exact ca în secțiunea precedentă:
+
+```py
+from transformers import AutoModelForSequenceClassification
+
+model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
+```
+
+Pentru a ne asigura că totul va merge bine în timpul antrenamentului, vom transmite batch-ul nostru modelului acesta:
+
+```py
+outputs = model(**batch)
+print(outputs.loss, outputs.logits.shape)
+```
+
+```python out
+tensor(0.5441, grad_fn=<NllLossBackward>) torch.Size([8, 2])
+```
+
+Toate modelele 🤗 Transformers vor returna lossul atunci când `labels` sunt furnizate și vom primi de asemenea logiturile (două pentru fiecare input în batch-ul nostru, deci un tensor cu dimensiunea 8 x 2).
+
+Suntem aproape gata să scriem loopul nostru de antrenament! Doar că ne lipsesc două lucruri: un optimizer și learning rate scheduler. Deoarece încercăm să replicăm ceea ce a făcut `Trainer` manual, vom folosi aceleași argumente default. Optimizerul utilizat de `Trainer` este `AdamW`, care este similar cu Adam, dar cu un twist pentru weight decay regularization (vedeți ["Decoupled Weight Decay Regularization"](https://arxiv.org/abs/1711.05101) de Ilya Loshchilov și Frank Hutter):
+
+```py
+from transformers import AdamW
+
+optimizer = AdamW(model.parameters(), lr=5e-5)
+```
+
+La final, learning rate schedulerul utilizat este un linear decay de la valoarea maximă (5e-5) la 0. Pentru a-l defini cu adevărat, avem nevoie să cunoaștem numărul de pași de antrenament pe care îi vom face, care este numărul de epoci pe care dorim să le rulăm înmulțit cu numărul de batch-uri de antrenare (care este lungimea dataloader-ului de antrenare). `Trainer` folosește trei epoci ca default, deci vom continua cu asta:
+
+```py
+from transformers import get_scheduler
+
+num_epochs = 3
+num_training_steps = num_epochs * len(train_dataloader)
+lr_scheduler = get_scheduler(
+    "linear",
+    optimizer=optimizer,
+    num_warmup_steps=0,
+    num_training_steps=num_training_steps,
+)
+print(num_training_steps)
+```
+
+```python out
+1377
+```
+
+### Training Loop[[the-training-loop]]
+
+Un ultim lucru: vom dori să folosim un GPU dacă avem acces la unul (pe un CPU, instruirea poate dura câteva ore în loc de câteva minute). Pentru a face acest lucru, definim un `device` pe care vom plasa modelul și batch-urile noastre:
+
+```py
+import torch
+
+device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")
+model.to(device)
+device
+```
+
+```python out
+device(type='cuda')
+```
+
+Suntem acum gata pentru antrenare! Pentru a avea o idee când va fi finalizată antrenarea, adăugăm un progress bar peste numărul nostru de pași de antrenare, folosind biblioteca `tqdm`:
+
+```py
+from tqdm.auto import tqdm
+
+progress_bar = tqdm(range(num_training_steps))
+
+model.train()
+for epoch in range(num_epochs):
+    for batch in train_dataloader:
+        batch = {k: v.to(device) for k, v in batch.items()}
+        outputs = model(**batch)
+        loss = outputs.loss
+        loss.backward()
+
+        optimizer.step()
+        lr_scheduler.step()
+        optimizer.zero_grad()
+        progress_bar.update(1)
+```
+
+Poți să vezi că nucleul loopului de instruire are o formă similară cu cea din introducere. Nu am cerut nicio raportare, deci acest loop de antrenare nu ne va spune nimic despre cum se descurcă modelul. Trebuie să adăugăm un evaluation loop pentru a face acest lucru.
+
+
+### Evaluation Loop[[the-evaluation-loop]]
+
+La fel ca înainte, vom folosi o metrică oferită de librăria 🤗 Evaluate. Am văzut deja metoda `metric.compute()`, dar metricile pot acumula batch-urile pentru noi pe măsură ce mergem peste loopurile de  predicțoie cu metoda `add_batch()`. Când am acumulat toate batch-urile, putem să obținem rezultatul final cu `metric.compute()`. Acesta este modul în care trebuie să implementăm acest lucru într-un loop de evaluare:
+
+```py
+import evaluate
+
+metric = evaluate.load("glue", "mrpc")
+model.eval()
+for batch in eval_dataloader:
+    batch = {k: v.to(device) for k, v in batch.items()}
+    with torch.no_grad():
+        outputs = model(**batch)
+
+    logits = outputs.logits
+    predictions = torch.argmax(logits, dim=-1)
+    metric.add_batch(predictions=predictions, references=batch["labels"])
+
+metric.compute()
+```
+
+```python out
+{'accuracy': 0.8431372549019608, 'f1': 0.8907849829351535}
+```
+
+Rezultatele tale vor fi ușor diferite datorită randomizării în inițializarea începutului modelului și a data shuffling, dar ele nu ar trebui să fie foart diferite.
+
+
+<Tip>
+
+✏️ **Încearcă!** Modifica loopul de antrenare dinainte pentru a face fine-tune modelul pe dataset-ul SST-2.
+
+</Tip>
+
+
+### Supercharge Training Loopul cu 🤗 Accelerate[[supercharge-your-training-loop-with-accelerate]]
+
+<Youtube id="s7dy8QRgjJ0" />
+
+Loopul de antrenare pe care l-am definit anterior funcționează bine pe un singur CPU sau GPU. Dar folosind libraria [🤗 Accelerate](https://github.com/huggingface/accelerate), cu câteva ajustări putem activa distributed training pe multiple GPU-uri sau TPU-uri. Începând de la crearea training și validation dataloaders, aceasta este este loopul manual de antrenare:
+
+```py
+from transformers import AdamW, AutoModelForSequenceClassification, get_scheduler
+
+model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
+optimizer = AdamW(model.parameters(), lr=3e-5)
+
+device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")
+model.to(device)
+
+num_epochs = 3
+num_training_steps = num_epochs * len(train_dataloader)
+lr_scheduler = get_scheduler(
+    "linear",
+    optimizer=optimizer,
+    num_warmup_steps=0,
+    num_training_steps=num_training_steps,
+)
+
+progress_bar = tqdm(range(num_training_steps))
+
+model.train()
+for epoch in range(num_epochs):
+    for batch in train_dataloader:
+        batch = {k: v.to(device) for k, v in batch.items()}
+        outputs = model(**batch)
+        loss = outputs.loss
+        loss.backward()
+
+        optimizer.step()
+        lr_scheduler.step()
+        optimizer.zero_grad()
+        progress_bar.update(1)
+```
+
+Și aici sunt schimbările:
+
+```diff
++ from accelerate import Accelerator
+  from transformers import AdamW, AutoModelForSequenceClassification, get_scheduler
+
++ accelerator = Accelerator()
+
+  model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
+  optimizer = AdamW(model.parameters(), lr=3e-5)
+
+- device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")
+- model.to(device)
+
++ train_dataloader, eval_dataloader, model, optimizer = accelerator.prepare(
++     train_dataloader, eval_dataloader, model, optimizer
++ )
+
+  num_epochs = 3
+  num_training_steps = num_epochs * len(train_dataloader)
+  lr_scheduler = get_scheduler(
+      "linear",
+      optimizer=optimizer,
+      num_warmup_steps=0,
+      num_training_steps=num_training_steps
+  )
+
+  progress_bar = tqdm(range(num_training_steps))
+
+  model.train()
+  for epoch in range(num_epochs):
+      for batch in train_dataloader:
+-         batch = {k: v.to(device) for k, v in batch.items()}
+          outputs = model(**batch)
+          loss = outputs.loss
+-         loss.backward()
++         accelerator.backward(loss)
+
+          optimizer.step()
+          lr_scheduler.step()
+          optimizer.zero_grad()
+          progress_bar.update(1)
+```
+
+Prima linie de adăugat este importarea librăriei. A doua linie creează un obiect `Accelerator` care va evalua environmentul și va inițializa proper distributed setup. 🤗 Accelerate gestionează automat poziționarea deviceului pentru tine, așa că poți șterge rândurile care pun modelul pe device (sau dacă preferi, poți să le schimbi cu `accelerator.device` în loc de `device`). 
+
+Partea principală a lucrului se face în linia ce trimite dataloader-urile, modelul și optimizerul la `accelerator.prepare()`. Acaeasta va face wrap acestor obiecte în containerul potrivit pentru a asigura o antrenare distribuită corespunzătoare. Ultimele schimbări sunt ștergerea linei cep une batch-ul pe device(din nou, dacă vvrei să lași acest lucru poți să le schimbi cu `accelerator.device`) și schimbarea `loss.backward()` cu `accelerator.backward(loss)`.
+
+<Tip>
+⚠️ Pentru a beneficia de viteza oferită de Cloud TPUs, recomandăm să faceți padding sampleurilor la o lungime fixă folosind argumentele `padding="max_length"` și `max_length` ale tokenizerului.
+</Tip>
+
+Dacă vrei să copiezi codul pentru a-l testa, aici este loopul complet de antrenare cu Accelerate:
+
+```py
+from accelerate import Accelerator
+from transformers import AdamW, AutoModelForSequenceClassification, get_scheduler
+
+accelerator = Accelerator()
+
+model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
+optimizer = AdamW(model.parameters(), lr=3e-5)
+
+train_dl, eval_dl, model, optimizer = accelerator.prepare(
+    train_dataloader, eval_dataloader, model, optimizer
+)
+
+num_epochs = 3
+num_training_steps = num_epochs * len(train_dl)
+lr_scheduler = get_scheduler(
+    "linear",
+    optimizer=optimizer,
+    num_warmup_steps=0,
+    num_training_steps=num_training_steps,
+)
+
+progress_bar = tqdm(range(num_training_steps))
+
+model.train()
+for epoch in range(num_epochs):
+    for batch in train_dl:
+        outputs = model(**batch)
+        loss = outputs.loss
+        accelerator.backward(loss)
+
+        optimizer.step()
+        lr_scheduler.step()
+        optimizer.zero_grad()
+        progress_bar.update(1)
+```
+
+Scriind în `train.py` aceste modificări, vor face scriptul executabil pe orice tip de distributed setup. Pentru a testa codul în mediul tău distribuit, rulează următoarea comandă:
+
+```bash
+accelerate config
+```
+
+Ceea ce îți va oferi să răspunzi la o serie de întrebări și să salvezi răspunsurile într-un fișier de configurare folosit de acest modul: 
+
+```bash
+accelerate launch train.py
+```
+
+Această comandă va lansa loopul de antrenare pe dispozitivele distribuite.
+
+Dacă doriți să încercați acest lucru într-un Jupyter Notebook (de exemplu, pentru a testa TPU-urile de pe Colab), înlocuiți codul cu următoarea funcție:
+
+```python
+from accelerate import notebook_launcher
+
+notebook_launcher(training_function)
+```
+
+Pentru mai multe exemple consultați [repo-ul 🤗 Accelerate](https://github.com/huggingface/accelerate/tree/main/examples).
\ No newline at end of file
diff --git a/chapters/ro/chapter3/5.mdx b/chapters/ro/chapter3/5.mdx
new file mode 100644
index 000000000..9afa55a7d
--- /dev/null
+++ b/chapters/ro/chapter3/5.mdx
@@ -0,0 +1,28 @@
+```mdx chapters/en/chapter3/5.mdx (1-26)
+<FrameworkSwitchCourse {fw} />
+
+# Fine-tuning, Check![[fine-tuning-check]]
+
+<CourseFloatingBanner
+    chapter={3}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+
+A fost distractiv! În primele două capitole ai învățat despre modele și tokenizeri, iar acum știi cum să aplici fine-tune pentru datele proprii. Pentru a rezuma, în acest capitol tu:
+
+{#if fw === 'pt'}
+* Ai învățat despre dataseturi din [Hub](https://huggingface.co/datasets)
+* Ai învățat cum să încarci și să preprocesezi dataseturi, inclusiv folosind dynamic padding și collators
+* Ai implementat fine-tuningul și evaluarea unui model
+* Ai implementat un training loop la nivel de bază
+* Ai utilizat 🤗 Accelerate pentru a adapta ușor training loopul astfel încât să funcționeze cu mai multe GPU-uri sau TPU-uri
+
+{:else}
+* Ai învățat despre dataseturi din [Hub](https://huggingface.co/datasets)
+* Ai învățat cum să încarci și să preprocesezi dataseturi
+* Ai învățat cum să faci fine-tune și să evaluezi un model cu Keras
+* Ai implementat o metrică personalizată
+
+{/if}
+```
\ No newline at end of file
diff --git a/chapters/ro/chapter3/6.mdx b/chapters/ro/chapter3/6.mdx
new file mode 100644
index 000000000..070acdd2e
--- /dev/null
+++ b/chapters/ro/chapter3/6.mdx
@@ -0,0 +1,301 @@
+<FrameworkSwitchCourse {fw} />
+
+<!-- DISABLE-FRONTMATTER-SECTIONS
+
+# End-of-chapter quiz[[end-of-chapter-quiz]]
+
+<CourseFloatingBanner
+    chapter={3}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+Testează ce ai învățat în acest capitol!
+
+### 1. Datasetul `emotion` conține mesaje de pe Twitter cu labeluri cu emoții. Căutați-l în [Hub](https://huggingface.co/datasets) și citiți card-ul datasetului. Care dintre acestea nu este una dintre emoțiile sale de bază?
+
+<Question
+	choices={[
+		{
+			text: "Fericire",
+			explain: "Încercă din nou — emoția asta este prezentă în acest dataset!"
+		},
+		{
+			text: "Iubire",
+			explain: "Încercă din nou — emoția asta este prezentă în acest dataset!"
+		},
+		{
+			text: "Confuzie",
+			explain: "Corect! Confuzia nu este una dintre cele șase emoții de bază.",
+            correct: true
+		},
+        {
+			text: "Suprpiză",
+			explain: "Supriză! Încearcă din nou!"
+		}
+	]}
+/>
+
+### 2. Căutați datasetul `ar_sarcasm` în [Hub](https://huggingface.co/datasets). Care este sarcina pe care o sprijină?
+
+<Question
+	choices={[
+		{
+			text: "Clasificarea sentimentului",
+			explain: "Acesta este corect! Poți să știi grație etichetelor.",
+            correct: true
+		},
+		{
+			text: "Machine Translation",
+			explain: "Acesta nu este corect — încercați din nou, în funcție de cardul datasetului <a href='https://huggingface.co/datasets/ar_sarcasm'>ar_sarcasm</a>!"
+		},
+		{
+			text: "Reconstrucția entităților numite",
+			explain: "Acesta nu este corect — încercați din nou, în funcție de cardul datasetului <a href='https://huggingface.co/datasets/ar_sarcasm'>ar_sarcasm</a>!"
+		},
+        {
+			text: "Răspunsul întrebării",
+			explain: "Nesatisfăcător — încercați din nou!"
+		}
+	]}
+/>
+
+### 3. Cum se așteaptă modelul BERT ca o pereche de propoziții să fie procesate?
+
+<Question
+	choices={[
+		{
+			text: "Tokens_of_sentence_1 [SEP] Tokens_of_sentence_2",
+			explain: "Este necesară un token special <code>[SEP]</code> pentru a separa cele două propoziții, dar nu e doar asta!"
+		},
+		{
+			text: "[CLS] Tokens_of_sentence_1 Tokens_of_sentence_2",
+			explain:"Este necesară un token special <code>[CLS]</code> pentru a separa cele două propoziții, dar nu e doar asta!
+		},
+		{
+			text: "[CLS] Tokens_of_sentence_1 [SEP] Tokens_of_sentence_2 [SEP]",
+			explain: "Acesta este corect!",
+            correct: true
+		},
+        {
+			text: "[CLS] Token-urile propoziției_1 [SEP] Token-urile propoziției_2",
+			explain: "Este necesar un token special <code>[CLS]</code> la început, precum și un token special <code>[SEP]</code> pentru a separa cele două propoziții, dar nu e doar asta!"
+		}
+	]}
+/>
+
+{#if fw === 'pt'}
+### 4. Care sunt beneficiile metodei `Dataset.map()`?
+
+<Question
+	choices={[
+		{
+			text: "Rezultatele funcției sunt cached, deci nu va lua timp dacă re-executăm codul.",
+			explain: "Acest lucru este efectiv unul dintre beneficiile sale! Nu e doar asta...",
+            correct: true
+		},
+		{
+			text: "Se aplică multiprocessing pentru a merge mai rapid decât aplicarea funcției la fiecare element al datasetului.",
+			explain: "Acest lucru este efectiv o caracteristică specială a acestei metode, dar nu e doar asta...",
+            correct: true
+		},
+		{
+			text: "Nu încarcă întregul datasetul în memorie și salvează rezultatele la fiecare element procesat.",
+			explain: "Acest lucru este un avantaj al acestei metode. Există și altele...",
+            correct: true
+		},
+	]}
+/>
+
+### 5. Ce înseamnă "dynamic padding"?
+
+<Question
+	alegeri={[  
+		{
+			text: "Dynamic padding este atunci când faci padding inputurilor pentru fiecare batch la lungimea maximă din întregul dataset.",
+			explain: "Acest lucru implică paddingul, dar nu la lungimea maximă a întregului dataset."
+		},
+		{
+			text: "Dynamic padding este atunci când faci padding inputurilor pentru fiecare batch, la lungimea maximă a propozițiilor din acel batch.",
+			explain: "Este corect! Partea \"dynamic\" vine din faptul că dimensiunea fiecărui batch este determinată la momentul creării lui, iar toate batch-urile pot avea shape-uri diferite ca rezultat.",
+            correct: true
+		},
+		{
+			text: "Dynamic padding este atunci când faci padding inputurilor pentru ca fiecare propoziție să aibă același număr de tokenuri ca în precedentul dataset.",
+			explain: "Este greșit, și nu are nici un sens să ne uităm la ordinea din dataset, deoarece îl amestecăm în timpul antrenării."
+		},
+	]}
+/>
+
+### 6. Care este scopul unei funcții collate?
+
+<Question
+	alegeri={[  
+		{
+			text: "Asigură că toate secvențele din dataset au aceeași lungime.",
+			explain: "O funcție collate este implicată în gestionarea a câte unui batch, nu întregului dataset. De asemenea, vorbim despre funcții generice, nu <code>DataCollatorWithPadding</code> specific."
+		},
+		{
+			text: "Adună toate sampleurile dintr-un batch.",
+			explain: "Corect! Poți să dai ca argument o funcție collate în constructorul unui <code>DataLoader</code>. Am folosit funcția <code>DataCollatorWithPadding</code>, care face padding tuturor elementelor dintr-un batch, astfel încât ele să aibă aceeași lungime.",
+            correct: true
+		},
+		{
+			text: "Preprocesează întregul dataset.",
+			explain: "Acest lucru ar fi o funcție de preprocesare, nu una collate."
+		},
+        {
+			text: "Taie secvențele din dataset.",
+			explain: "O funcție collate este implicată în gestionarea a câte un batch, nu întregului dataset. Dacă ești interesat în tăierea acestora, poți utiliza argumentul <code>truncate</code> al unui <code>tokenizer</code>."
+		}
+	]}
+/>
+
+### 7. Ce se întâmplă când inițializezi una dintre clasele `AutoModelForXxx` cu un pretrained language model (ca <code>bert-base-uncased</code>) care corespunde unei alte sarcini decât aceea pentru care a fost antrenat?
+
+<Question
+	alegeri={[  
+		{
+			text: "Nimic, dar se afișează un warning.",
+			explain: "Se afișează un warning, dar asta nu este totul!"
+		},
+		{
+			text: "Începutul modelului preantrenat al modelului este înlăturat și înlocuit cu un început nou potrivit pentru sarcină.",
+			explain: "Corect. De exemplu, atunci când am folosit <code>AutoModelForSequenceClassification</code> cu <code>bert-base-uncased</code>, am primit warningul la momentul inițializării modelului. Începutul preantrenat nu este folosit pentru sarcina de clasificare a secvențelor, astfel încât el este înlăturat și înlocuit cu un început nou, cu weights aleatorii.",
+            correct: true
+		},
+		{
+			text: "Începutul modelului preantrenat este înlăturat.",
+			explain: "Trebuie să se întâmple încă ceva. Încearcă din nou!"
+		},
+        {
+			text: "Nimic, deoarece modelul poate avea fine-tuning pentru o sarcina diferită.",
+			explain: "Începutul preantrenat al modelului nu a fost antrenat să rezolve această sarcină, astfel încât el trebuie înlăturat."
+		}
+	]}
+/>
+
+### 8. Care este scopul la `TrainingArguments`?
+
+<Question
+	alegeri={[  
+		{
+			text: "Conține toți hyperparametrii utilizați pentru antrenare și evaluare cu <code>Trainer</code>.",
+			explain: "Corect!",
+            correct: true
+		},
+		{
+			text: "Specifică dimensiunea modelului.",
+			explain: "Dimensiunea modelului este definită de configurația modelului, nu clasa <code>TrainingArguments</code>. "
+		},
+		{
+			text: "Conține doar hyperparametrii utilizați pentru evaluare.",
+			explain: "În exemplul nostru, am specificat unde se va salva modelul și toate checkpoint-urile. Încearcă din nou!"
+		},
+        {
+			text: "Conține doar hyperparametrii utilizați pentru antrenare.",
+			explain: "În exemplul nostru, am folosit un <code>evaluation_strategy</code>, astfel încât acest lucru afectează și evaluarea. Încearcă din nou!"
+		}
+	]}
+/>
+
+### 9. De ce ar trebui să folosim biblioteca 🤗 Accelerate?
+
+<Question
+	alegeri={[  
+		{
+			text: "Ofereă acces la modele mai rapide.",
+			explain: "Nu, biblioteca 🤗 Accelerate nu oferă nici un model."
+		},
+		{
+			text: "Oferă un API de nivel înalt astfel încât să nu trebuiască să implementăm singuri un training loop.",
+			explain: "Acest lucru este ceea ce am făcut cu <code>Trainer</code>, nu biblioteca 🤗 Accelerate. Încearcă din nou!"
+		},
+		{
+			text: "Face ca loopurile de antrenare să funcționeze pe distributed strategies.",
+			explain: "Corect! Cu 🤗 Accelerate, loopurile de antrenare vor funcționa pentru multiple GPU-uri și TPU-uri.",
+            correct: true
+		},
+        {
+			text: "Oferă mai multe funcții de optimizare.",
+			explain: "Nu, biblioteca 🤗 Accelerate nu oferă nici o funcțiune de optimizare."
+		}
+	]}
+/>
+
+{:else}
+### 4. Ce se întâmplă când inițializezi una dintre clasele `TFAutoModelForXxx` cu un pretrained language model (ca <code>bert-base-uncased</code>) care corespunde unei alte sarcini decât aceea pentru care a fost antrenat?
+
+<Question
+	alegeri={[  
+		{
+			text: "Nimic, dar se afișează un warning.",
+			explain: "Se afișează un warning, dar asta nu este totul!"
+		},
+		{
+			text: "Începutul preantrenat al modelului este înlăturat și înlocuit cu un început nou potrivit pentru sarcină.",
+			explain: "Corect. De exemplu, atunci când am folosit <code>TFAutoModelForSequenceClassification</code> cu <code>bert-base-uncased</code>, am primit warningul la momentul inițializării modelului. Începutul preantrenat nu este folosit pentru sarcina de clasificare a secvențelor, astfel încât el este înlăturat și înlocuit cu un început nou, cu weights aleatorii.",
+            correct: true
+		},
+		{
+			text: "Începutul preantrenat al modelului este înlăturat.",
+			explain: "Trebuie să se întâmple ceva mai mult. Încercă din nou!"
+		},
+        {
+			text: "Nimic, deoarece modelul poate fi reantrenat pentru o sarcina diferită.",
+			explain: "Începutul prentrenat al modelului nu a fost antrenat să rezolve această sarcină, astfel încât el trebuie înlăturat."
+		}
+	]}
+/>
+
+### 5. Modelele TensorFlow din `transformers` sunt deja modele Keras. Ce beneficiu oferă acest lucru?
+
+<Question
+	alegeri={[  
+		{
+			text: "Modelele funcționează pe un TPU direct.",
+			explain: "Ești aproape, dar sunt necesare mici schimbări. De exemplu, trebuie să rulezi totul într-un <code>TPUStrategy</code> scop, inclusiv inițializarea modelului."
+		},
+		{
+			text: "Poți folosi metode existente precum <code>compile()</code>, <code>fit()</code>, și <code>predict()</code>.",
+			explain: "Corect! Odată ce ai datele, antrenarea pe acestea necesită foarte puțin lucru.",
+            correct: true
+		},
+		{
+			text: "Poți învăța și Keras precum și Transformers.",
+			explain: "Corect, dar căutăm altceva. :)",
+			correct: true
+		},
+        {
+			text: "Poți calcula ușor metrice legate de dataset.",
+			explain: "Keras ne ajută cu antrenarea și evaluarea modelului, dar nu calculează metrice legate de dataset."
+		}
+	]}
+/>
+
+### 6. Cum poți defini o metrică personalizată?
+
+<Question
+	alegeri={[  
+		{
+			text: "Prin subclassing pe <code>tf.keras.metrics.Metric</code>.",
+			explain: "Excelent!",
+			correct: true
+		},
+		{
+			text: "Folosind API-ul Keras.",
+			explain: "Încercă din nou!"
+		},
+		{
+			text: "Prin intermediul callable cu semnatura <code>metric_fn(y_true, y_pred)</code>.",
+			explain: "Corect!",
+			correct: true
+		},
+        {
+			text: "Prin căutarea pe Google.",
+			explain: "Acest lucru nu este răspunsul pe care îl căutăm, dar ar trebui să te ajute să-l găsești.",
+            correct: true
+		}
+	]}
+/>
+
+{/if}
\ No newline at end of file

From 2a10e3bd6072ee4f63ee7138b0f297ad2665a75c Mon Sep 17 00:00:00 2001
From: Angroys <120798951+Angroys@users.noreply.github.com>
Date: Fri, 3 Jan 2025 01:00:38 +0200
Subject: [PATCH 008/167] Finished chapter 4

---
 .gitignore                    |   2 +
 chapters/ro/chapter3/3.mdx    |   6 +-
 chapters/ro/chapter3/3_tf.mdx |   6 +-
 chapters/ro/chapter3/4.mdx    |   2 +-
 chapters/ro/chapter3/5.mdx    |   4 +-
 chapters/ro/chapter3/6.mdx    |  20 +-
 chapters/ro/chapter4/1.mdx    |  22 ++
 chapters/ro/chapter4/2.mdx    |  98 ++++++
 chapters/ro/chapter4/3.mdx    | 641 ++++++++++++++++++++++++++++++++++
 chapters/ro/chapter4/4.mdx    |  88 +++++
 chapters/ro/chapter4/5.mdx    |  12 +
 chapters/ro/chapter4/6.mdx    | 233 ++++++++++++
 12 files changed, 1114 insertions(+), 20 deletions(-)
 create mode 100644 chapters/ro/chapter4/1.mdx
 create mode 100644 chapters/ro/chapter4/2.mdx
 create mode 100644 chapters/ro/chapter4/3.mdx
 create mode 100644 chapters/ro/chapter4/4.mdx
 create mode 100644 chapters/ro/chapter4/5.mdx
 create mode 100644 chapters/ro/chapter4/6.mdx

diff --git a/.gitignore b/.gitignore
index a1d21056b..fa8e74203 100644
--- a/.gitignore
+++ b/.gitignore
@@ -82,3 +82,5 @@ nbs/
 __pycache__/
 .cache/
 
+
+.codegpt
\ No newline at end of file
diff --git a/chapters/ro/chapter3/3.mdx b/chapters/ro/chapter3/3.mdx
index 0a47ba072..df987c810 100644
--- a/chapters/ro/chapter3/3.mdx
+++ b/chapters/ro/chapter3/3.mdx
@@ -57,7 +57,7 @@ from transformers import AutoModelForSequenceClassification
 model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
 ```
 
-Observăm că, spre deosebire de [Capitolul 2](/course/chapter2), se emite o avertizare după crearea acestui model preantrenat. Acest lucru este datorit faptului că BERT nu a fost antrenat pentru clasificarea perechilor de propoziții, astfel încât începutul modelului preantrenat a fost eliminat și un nou început adecvat pentru clasificarea secvențelor a fost adăugat în loc. Avertizările indică faptul că anumite weights nu au fost utilizate (cele care corespundeau începutul eliminat) și celelalte au fost inițializate aleatoriu (cele pentru noul început). Aceasta se termină cu o recomandare de a antrena modelul, ceea ce vom face acum.
+Observăm că, spre deosebire de [Capitolul 2](/course/chapter2), se emite o avertizare după crearea acestui model preantrenat. Acest lucru este datorit faptului că BERT nu a fost antrenat pentru clasificarea perechilor de propoziții, astfel încât headul modelului preantrenat a fost eliminat și un nou head adecvat pentru clasificarea secvențelor a fost adăugat în loc. Avertizările indică faptul că anumite weights nu au fost utilizate (cele care corespundeau headului eliminat) și celelalte au fost inițializate aleatoriu (cele pentru noul head). Aceasta se termină cu o recomandare de a antrena modelul, ceea ce vom face acum.
 
 Odată ce am definit modelul nostru, putem defini `Trainer` prin transmiterea tuturor obiectelor construite până acum — `model`, `training_args`, a training și validation datasets, `data_collator`, și `tokenizer`:
 
@@ -124,7 +124,7 @@ metric.compute(predictions=np.argmax(predictions.predictions, axis=-1), referenc
 {'accuracy': 0.8578431372549019, 'f1': 0.8996539792387542}
 ```
 
-Rezultatele exacte pe care le veți obține pot varia, deoarece inițializarea aleatoare a începutului modelului care poate schimba metricele pe care le-a atins. Aici putem vedea că modelul nostru are o precizie de 85.78% în setul de validare și un scor F1 de 89.97. Acestea sunt exact aceleași metrice folosite pentru evaluarea rezultatelor pe datasetul MRPC pentru GLUE benchmark. Tabelul din [BERT Paper](https://arxiv.org/pdf/1810.04805.pdf) a raportat un scor F1 de 88.9 pentru modelul de bază. Acela a fost un `uncased` model, dar noi utilizăm acum un `cased` model, ceea ce explică rezultatul mai bun.
+Rezultatele exacte pe care le veți obține pot varia, deoarece inițializarea aleatoare a headului modelului care poate schimba metricele pe care le-a atins. Aici putem vedea că modelul nostru are o precizie de 85.78% în setul de validare și un scor F1 de 89.97. Acestea sunt exact aceleași metrice folosite pentru evaluarea rezultatelor pe datasetul MRPC pentru GLUE benchmark. Tabelul din [BERT Paper](https://arxiv.org/pdf/1810.04805.pdf) a raportat un scor F1 de 88.9 pentru modelul de bază. Acela a fost un `uncased` model, dar noi utilizăm acum un `cased` model, ceea ce explică rezultatul mai bun.
 
 Pentru a reuni toate acestea într-o singură funcție `compute_metrics()`, putem scrie:
 
@@ -161,7 +161,7 @@ Pentru a lansa o nouă antrenare, putem executa:
 trainer.train()
 ```
 
-De data aceasta, acesta va raporta validation loss și metricele la sfârșitul fiecărui epocă pe lângă training loss. Dar acuratețea/scorul F1 pe care îl atingeți poate fi puțin diferit față de ceea ce am găsit, datorită inițializării aleatoare a începutului modelului, dar ar trebui să nu difere foarte mult.
+De data aceasta, acesta va raporta validation loss și metricele la sfârșitul fiecărui epocă pe lângă training loss. Dar acuratețea/scorul F1 pe care îl atingeți poate fi puțin diferit față de ceea ce am găsit, datorită inițializării aleatoare a headului modelului, dar ar trebui să nu difere foarte mult.
 
 `Trainerul` va funcționa în mod automat pe mai multe GPU-uri sau TPU-uri și oferă multe opțiuni, cum ar fi mixed-precision training(folosiți `fp16 = True` în argumentele de antrenare). Vom discuta despre toate opțiunile pe care le are în Capitolul 10.
 
diff --git a/chapters/ro/chapter3/3_tf.mdx b/chapters/ro/chapter3/3_tf.mdx
index 5b1636851..146a4b118 100644
--- a/chapters/ro/chapter3/3_tf.mdx
+++ b/chapters/ro/chapter3/3_tf.mdx
@@ -71,7 +71,7 @@ from transformers import TFAutoModelForSequenceClassification
 model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
 ```
 
-Veți observa că în comparație cu [Capitolul 2](/course/chapter2), veți primi o avertizare după ce inițializați acest model preantrenat. Acest lucru se datorează faptului că BERT nu a fost antrenat pentru clasificarea perechilor de propoziții, astfel încât începutul preantrenat al modelului a fost eliminat și un nou început potrivit pentru clasificarea secvențelor a fost adăugat în locul lui. Avertizările indică faptul că anumite weights nu au fost folosite (cele corespunzătoare începutului de preantrenare eliminat) și că altele au fost inițializate aleatoriu (cele pentru noul capăt). Avertizarea se încheie prin încurajarea antrenării modelului, ceea ce este exact ceea ce vom face acum.
+Veți observa că în comparație cu [Capitolul 2](/course/chapter2), veți primi o avertizare după ce inițializați acest model preantrenat. Acest lucru se datorează faptului că BERT nu a fost antrenat pentru clasificarea perechilor de propoziții, astfel încât headul preantrenat al modelului a fost eliminat și un nou head potrivit pentru clasificarea secvențelor a fost adăugat în locul lui. Avertizările indică faptul că anumite weights nu au fost folosite (cele corespunzătoare headului de preantrenare eliminat) și că altele au fost inițializate aleatoriu (cele pentru noul capăt). Avertizarea se încheie prin încurajarea antrenării modelului, ceea ce este exact ceea ce vom face acum.
 
 
 Pentru a face fine-tune modelului pe datasetul nostru, avem de făcut `compile()` modelului și apoi să trasnmitem datele noastre spre metoda `fit()`. Acest lucru va porni procesul de fine-tuning (care ar trebui să dureze câteva minute pe un GPU) și va raporta training loss, plus validation loss la sfârșitul fiecărei epoci.
@@ -171,7 +171,7 @@ model.fit(tf_train_dataset, validation_data=tf_validation_dataset, epochs=3)
 <Youtube id="nx10eh4CoOs"/>
 
 
-Încheierea antrenării și observarea lossului scăzând este foarte frumos, dar ce se întămplă dacă doriți să obțineți efectiv outputuruke din modelul antrenat, fie pentru a calcula câteva metrice, fie pentru utilizarea modelului în producție? Pentru asta putem folosi metoda `predict()`. Aceasta va returna *logits* de la începutul outputului modelului, câte unul pe clasă.
+Încheierea antrenării și observarea lossului scăzând este foarte frumos, dar ce se întămplă dacă doriți să obțineți efectiv outputuruke din modelul antrenat, fie pentru a calcula câteva metrice, fie pentru utilizarea modelului în producție? Pentru asta putem folosi metoda `predict()`. Aceasta va returna *logits* de la output headul al modelului, câte unul pe clasă.
 
 ```py
 preds = model.predict(tf_validation_dataset)["logits"]
@@ -201,6 +201,6 @@ metric.compute(predictions=class_preds, references=raw_datasets["validation"]["l
 {'accuracy': 0.8578431372549019, 'f1': 0.8996539792387542}
 ```
 
-Rezultatele exacte pe care le veți obține pot varia, deoarece inițializarea aleatoare a începutului modelului care poate schimba metricele pe care le-a atins. Aici putem vedea că modelul nostru are o precizie de 85.78% în setul de validare și un scor F1 de 89.97. Acestea sunt exact aceleași metrice folosite pentru evaluarea rezultatelor pe datasetul MRPC pentru GLUE benchmark. Tabelul din [BERT Paper](https://arxiv.org/pdf/1810.04805.pdf) a raportat un scor F1 de 88.9 pentru modelul de bază. Acela a fost un `uncased` model, dar noi utilizăm acum un `cased` model, ceea ce explică rezultatul mai bun.
+Rezultatele exacte pe care le veți obține pot varia, deoarece inițializarea aleatoare a headului modelului care poate schimba metricele pe care le-a atins. Aici putem vedea că modelul nostru are o precizie de 85.78% în setul de validare și un scor F1 de 89.97. Acestea sunt exact aceleași metrice folosite pentru evaluarea rezultatelor pe datasetul MRPC pentru GLUE benchmark. Tabelul din [BERT Paper](https://arxiv.org/pdf/1810.04805.pdf) a raportat un scor F1 de 88.9 pentru modelul de bază. Acela a fost un `uncased` model, dar noi utilizăm acum un `cased` model, ceea ce explică rezultatul mai bun.
 
 Acesta este punctul unde vă prezentăm introducerea la folosirea fine-tuningului cu ajutorul APIului Keras. Un exemplu bun pentru majoritatea sarcinilor NLP va fi dat în [Capitol 7](/course/chapter7). Dacă doriți să dezvoltați abilitățile dumneavoastră pe API-ul Keras, încercați să faceți fine-tune unui model pe datasetul GLUE SST-2 folosind procesarea de date din secvența 2.
\ No newline at end of file
diff --git a/chapters/ro/chapter3/4.mdx b/chapters/ro/chapter3/4.mdx
index 4c703260b..bfb423625 100644
--- a/chapters/ro/chapter3/4.mdx
+++ b/chapters/ro/chapter3/4.mdx
@@ -195,7 +195,7 @@ metric.compute()
 {'accuracy': 0.8431372549019608, 'f1': 0.8907849829351535}
 ```
 
-Rezultatele tale vor fi ușor diferite datorită randomizării în inițializarea începutului modelului și a data shuffling, dar ele nu ar trebui să fie foart diferite.
+Rezultatele tale vor fi ușor diferite datorită randomizării în inițializarea headului modelului și a data shuffling, dar ele nu ar trebui să fie foart diferite.
 
 
 <Tip>
diff --git a/chapters/ro/chapter3/5.mdx b/chapters/ro/chapter3/5.mdx
index 9afa55a7d..63d1f159a 100644
--- a/chapters/ro/chapter3/5.mdx
+++ b/chapters/ro/chapter3/5.mdx
@@ -1,4 +1,3 @@
-```mdx chapters/en/chapter3/5.mdx (1-26)
 <FrameworkSwitchCourse {fw} />
 
 # Fine-tuning, Check![[fine-tuning-check]]
@@ -24,5 +23,4 @@ A fost distractiv! În primele două capitole ai învățat despre modele și to
 * Ai învățat cum să faci fine-tune și să evaluezi un model cu Keras
 * Ai implementat o metrică personalizată
 
-{/if}
-```
\ No newline at end of file
+{/if}
\ No newline at end of file
diff --git a/chapters/ro/chapter3/6.mdx b/chapters/ro/chapter3/6.mdx
index 070acdd2e..9ceeea782 100644
--- a/chapters/ro/chapter3/6.mdx
+++ b/chapters/ro/chapter3/6.mdx
@@ -2,7 +2,7 @@
 
 <!-- DISABLE-FRONTMATTER-SECTIONS
 
-# End-of-chapter quiz[[end-of-chapter-quiz]]
+# Quiz pentru finalizarea capitolului[[end-of-chapter-quiz]]
 
 <CourseFloatingBanner
     chapter={3}
@@ -78,7 +78,7 @@ Testează ce ai învățat în acest capitol!
 		},
         {
 			text: "[CLS] Token-urile propoziției_1 [SEP] Token-urile propoziției_2",
-			explain: "Este necesar un token special <code>[CLS]</code> la început, precum și un token special <code>[SEP]</code> pentru a separa cele două propoziții, dar nu e doar asta!"
+			explain: "Este necesar un token special <code>[CLS]</code> la head, precum și un token special <code>[SEP]</code> pentru a separa cele două propoziții, dar nu e doar asta!"
 		}
 	]}
 />
@@ -159,17 +159,17 @@ Testează ce ai învățat în acest capitol!
 			explain: "Se afișează un warning, dar asta nu este totul!"
 		},
 		{
-			text: "Începutul modelului preantrenat al modelului este înlăturat și înlocuit cu un început nou potrivit pentru sarcină.",
-			explain: "Corect. De exemplu, atunci când am folosit <code>AutoModelForSequenceClassification</code> cu <code>bert-base-uncased</code>, am primit warningul la momentul inițializării modelului. Începutul preantrenat nu este folosit pentru sarcina de clasificare a secvențelor, astfel încât el este înlăturat și înlocuit cu un început nou, cu weights aleatorii.",
+			text: "Headul modelului preantrenat al modelului este înlăturat și înlocuit cu un head nou potrivit pentru sarcină.",
+			explain: "Corect. De exemplu, atunci când am folosit <code>AutoModelForSequenceClassification</code> cu <code>bert-base-uncased</code>, am primit warningul la momentul inițializării modelului. Headul preantrenat nu este folosit pentru sarcina de clasificare a secvențelor, astfel încât el este înlăturat și înlocuit cu un head nou, cu weights aleatorii.",
             correct: true
 		},
 		{
-			text: "Începutul modelului preantrenat este înlăturat.",
+			text: "Headul modelului preantrenat este înlăturat.",
 			explain: "Trebuie să se întâmple încă ceva. Încearcă din nou!"
 		},
         {
 			text: "Nimic, deoarece modelul poate avea fine-tuning pentru o sarcina diferită.",
-			explain: "Începutul preantrenat al modelului nu a fost antrenat să rezolve această sarcină, astfel încât el trebuie înlăturat."
+			explain: "Headul preantrenat al modelului nu a fost antrenat să rezolve această sarcină, astfel încât el trebuie înlăturat."
 		}
 	]}
 />
@@ -232,17 +232,17 @@ Testează ce ai învățat în acest capitol!
 			explain: "Se afișează un warning, dar asta nu este totul!"
 		},
 		{
-			text: "Începutul preantrenat al modelului este înlăturat și înlocuit cu un început nou potrivit pentru sarcină.",
-			explain: "Corect. De exemplu, atunci când am folosit <code>TFAutoModelForSequenceClassification</code> cu <code>bert-base-uncased</code>, am primit warningul la momentul inițializării modelului. Începutul preantrenat nu este folosit pentru sarcina de clasificare a secvențelor, astfel încât el este înlăturat și înlocuit cu un început nou, cu weights aleatorii.",
+			text: "Headul preantrenat al modelului este înlăturat și înlocuit cu un head nou potrivit pentru sarcină.",
+			explain: "Corect. De exemplu, atunci când am folosit <code>TFAutoModelForSequenceClassification</code> cu <code>bert-base-uncased</code>, am primit warningul la momentul inițializării modelului. Headul preantrenat nu este folosit pentru sarcina de clasificare a secvențelor, astfel încât el este înlăturat și înlocuit cu un head nou, cu weights aleatorii.",
             correct: true
 		},
 		{
-			text: "Începutul preantrenat al modelului este înlăturat.",
+			text: "Headul preantrenat al modelului este înlăturat.",
 			explain: "Trebuie să se întâmple ceva mai mult. Încercă din nou!"
 		},
         {
 			text: "Nimic, deoarece modelul poate fi reantrenat pentru o sarcina diferită.",
-			explain: "Începutul prentrenat al modelului nu a fost antrenat să rezolve această sarcină, astfel încât el trebuie înlăturat."
+			explain: "Headul prentrenat al modelului nu a fost antrenat să rezolve această sarcină, astfel încât el trebuie înlăturat."
 		}
 	]}
 />
diff --git a/chapters/ro/chapter4/1.mdx b/chapters/ro/chapter4/1.mdx
new file mode 100644
index 000000000..4ef56abf4
--- /dev/null
+++ b/chapters/ro/chapter4/1.mdx
@@ -0,0 +1,22 @@
+# Platforma Hugging Face Hub[[the-hugging-face-hub]]
+
+<CourseFloatingBanner
+    chapter={4}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+Platforma [Hugging Face Hub](https://huggingface.co/) –- site-ul nostru principal –- reprezintă o platformă care permite oricărui utilizator să descopere, utilizeze și contribuie la noi modele și dataseturi. Acesta găzduiește o varietate vastă de modele, cu peste 10.000 disponibile public. Ne vom concentra discuția asupra modelelor în acest capitol, iar pentru dataseturi vom vorbi în Capitolul 5.
+
+Modelele din Hub nu sunt limitate la 🤗 Transformers sau chiar și NLP. Există și alte modele, cum ar fi cele de la [Flair](https://github.com/flairNLP/flair) și [AllenNLP](https://github.com/allenai/allennlp) pentru NLP, [Asteroid](https://github.com/asteroid-team/asteroid) și [pyannote](https://github.com/pyannote/pyannote-audio) pentru speech, precum și cele de la [timm](https://github.com/rwightman/pytorch-image-models) pentru vision, doar să menționăm câteva.
+
+Fiecare dintre aceste modele este găzduit ca un repository Git, ceea ce permite crearea versiunilor și reproducerea acestuia. Oferirea modelului pe Hub înseamnă deschiderea sa comunității, făcându-l accesibil oricărui utilizator care dorește să îl utilizeze cu ușurință, eliminând astfel nevoia de a-și antrena propriul model și simplificând utilizarea acestora. 
+
+În plus, oferirea unui model pe Hub face deploy automat la un Inference API pentru acel model. Orice membru al comunității poate testa direct pe pagina modelului cu inputuri personalizate și widget-uri corespunzătoare.
+
+Cel mai bun lucru este că oferirea și utilizarea oricărui model public pe Hub este complet gratuit! Existează și [planuri plătite](https://huggingface.co/pricing) dacă doriți să oferiți modele în privat.
+
+Video-ul de mai jos arată modul în care puteți naviga prin Hub.
+
+<Youtube id="XvSGPZFEjDY"/>
+
+Crearea unui cont huggingface.co este necesară pentru a continua această parte, deoarece vom crea și gestiona repositorii pe Platforma Hugging Face Hub: [creați un cont](https://huggingface.co/join)
\ No newline at end of file
diff --git a/chapters/ro/chapter4/2.mdx b/chapters/ro/chapter4/2.mdx
new file mode 100644
index 000000000..bbe94669b
--- /dev/null
+++ b/chapters/ro/chapter4/2.mdx
@@ -0,0 +1,98 @@
+<FrameworkSwitchCourse {fw} />
+
+# Utilizarea modelelor preantrenate[[using-pretrained-models]]
+
+{#if fw === 'pt'}
+ 
+<CourseFloatingBanner chapter={4}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter4/section2_pt.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter4/section2_pt.ipynb"},
+]} />
+
+{:else}
+
+<CourseFloatingBanner chapter={4}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter4/section2_tf.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter4/section2_tf.ipynb"},
+]} />
+
+{/if}
+
+Hubul Model oferă o modalitate simplă de a selecta modelul adecvat, astfel încât utilizarea sa în orice bibliotecă downstream poate fi efectuată în câteva linii de cod. Să vedem cum se utilizează efectiv unul dintre aceste modele și cum putem contribui înapoi la comunitate.
+
+
+Să presupunem că noi căutăm un French-based model ce poate face mask filling.
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/camembert.gif" alt="Selecting the Camembert model." width="80%"/>
+</div>
+
+Alegem checkpointul „camembert-base” pentru al încerca. Identificatorul `camembert-base` este tot de ce avem nevoie pentru a începe. În capitolele precedente, am văzut cum putem inițializa modelul folosind funcția `pipeline()`:
+
+```py
+from transformers import pipeline
+
+camembert_fill_mask = pipeline("fill-mask", model="camembert-base")
+results = camembert_fill_mask("Le camembert est <mask> :)")
+```
+
+```python out
+[
+  {'sequence': 'Le camembert est délicieux :)', 'score': 0.49091005325317383, 'token': 7200, 'token_str': 'délicieux'}, 
+  {'sequence': 'Le camembert est excellent :)', 'score': 0.1055697426199913, 'token': 2183, 'token_str': 'excellent'}, 
+  {'sequence': 'Le camembert est succulent :)', 'score': 0.03453313186764717, 'token': 26202, 'token_str': 'succulent'}, 
+  {'sequence': 'Le camembert est meilleur :)', 'score': 0.0330314114689827, 'token': 528, 'token_str': 'meilleur'}, 
+  {'sequence': 'Le camembert est parfait :)', 'score': 0.03007650189101696, 'token': 1654, 'token_str': 'parfait'}
+]
+```
+
+În mod evident, încărcarea unui model într-un pipeline este extrem de simplu. Singurul lucru la care trebuie să atrageți atenția este că checkpointul ales este adecvat pentru sarcina pe care urmează să o execute. De exemplu, în momentul în care încărăm checkpoint-ul „camembert-base” în pipelineul `fill-mask`, este perfect în regulă. Dar dacă îl încărcam în pipelineul `text-classification`, rezultatele nu vor avea nici o logică, pentru că headul „camembert-base” nu este adecvat pentru această sarcină! Recomandăm utilizarea task selectorului în interfața Hugging Face în scopul selectării checkpointurilor adecvate:
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/tasks.png" alt="Selectorul de sarcini pe interfața web." width="80%"/>
+</div>
+
+Puteți inițializa checkpointul în mod direct folosind arhitectura modelului:
+
+{#if fw === 'pt'}
+```py
+from transformers import CamembertTokenizer, CamembertForMaskedLM
+
+tokenizer = CamembertTokenizer.from_pretrained("camembert-base")
+model = CamembertForMaskedLM.from_pretrained("camembert-base")
+```
+
+Însă, recomandăm utilizarea [claselor `Auto*`](https://huggingface.co/transformers/model_doc/auto?highlight=auto#auto-classes), deoarece acestea sunt proiectate să fie architecture-agnostic. În timp ce codul precedent limita utilizatorii la checkpoints loadable în CamemBERT architecture, utilizarea claselor `Auto*` face schimbarea checkpointurilor simplă:
+
+```py
+from transformers import AutoTokenizer, AutoModelForMaskedLM
+
+tokenizer = AutoTokenizer.from_pretrained("camembert-base")
+model = AutoModelForMaskedLM.from_pretrained("camembert-base")
+```
+{:else}
+```py
+from transformers import CamembertTokenizer, TFCamembertForMaskedLM
+
+tokenizer = CamembertTokenizer.from_pretrained("camembert-base")
+model = TFCamembertForMaskedLM.from_pretrained("camembert-base")
+```
+
+Însă, recomandăm utilizarea [claselor `TFAuto*`](https://huggingface.co/transformers/model_doc/auto?highlight=auto#auto-classes), deoarece acestea sunt proiectate să fie architecture-agnostic. În timp ce codul precedent limita utilizatorii la checkpoints loadable în CamemBERT architecture, utilizarea claselor `TFAuto*` face schimbarea checkpointurilor simplă:
+
+```py
+from transformers import AutoTokenizer, TFAutoModelForMaskedLM
+
+tokenizer = AutoTokenizer.from_pretrained("camembert-base")
+model = TFAutoModelForMaskedLM.from_pretrained("camembert-base")
+```
+{/if}
+
+<Tip>
+În momentul în care folosiți un model preantrenat, asigurați-vă să verificați cum a fost antrenat și pe ce date se bazează. De asemenea, trebuie să cunoasceți limitele și prejudecățile sale. Toată această informație va fi indicată pe cartea modelului.
+</Tip>
+
diff --git a/chapters/ro/chapter4/3.mdx b/chapters/ro/chapter4/3.mdx
new file mode 100644
index 000000000..dda42f45e
--- /dev/null
+++ b/chapters/ro/chapter4/3.mdx
@@ -0,0 +1,641 @@
+
+**Capitolul 4**
+
+<FrameworkSwitchCourse {fw} />
+
+# Partajarea modelelor preantrenate [[sharing-pretrained-models]]
+
+{#if fw === 'pt'}
+
+<CourseFloatingBanner chapter={4}
+classNames="absolute z-10 right-0 top-0"
+notebooks={[ 
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter4/section3_pt.ipynb"}, 
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter4/section3_pt.ipynb"},
+]} />
+
+{:else}
+
+<CourseFloatingBanner chapter={4}
+classNames="absolute z-10 right-0 top-0"
+notebooks={[ 
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter4/section3_tf.ipynb"}, 
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter4/section3_tf.ipynb"},
+]} />
+
+{/if}
+
+În următoarele etape, vom explora modalitățile cele mai ușoare de a partaja modelele preantrenate pe 🤗 Hub. Există tooluri și utilities disponibile care fac posibilă partajarea și actualizarea modelelor direct pe Hub, despre care vom vorbi mai jos.
+
+<Youtube id="9yY3RB_GSPM"/>
+
+Recomandăm tuturor utilizatorilor care antrenează modele să contribuie prin partajarea lor cu comunitatea - partajarea modelelor, chiar și atunci când sunt antrenate pe dateseturi foarte specifice, va ajuta la economising timpul altor utilizatori și resurselor și va oferi acces la trained artifcats folositoare. În schimb, puteți beneficia de munca altora!
+
+Există trei moduri de a crea noi repositorii cu modele:
+
+- Utilizând API-ul `push_to_hub`
+- Utilizând biblioteca Python `huggingface_hub`
+- Utilizând interfața web
+
+Odată ce aveți creat un repository, puteți încărca fișiere în el folosind git și git-lfs. Vom trece împreună prin crearea model repositories și încărcarea fișierelor în el în următoarele secțiuni.
+
+## Utilizând API-ul `push_to_hub`[[using-the-pushtohub-api]]
+
+{#if fw === 'pt'}
+
+<Youtube id="Zh0FfmVrKX0"/>
+
+{:else}
+
+<Youtube id="pUh5cGmNV8Y"/>
+
+{/if}
+
+Cea mai simplă modalitate de a încărca fișiere pe Hub este utilizând API-ul `push_to_hub`.
+
+Înainte de a continua, aveți nevoie să creați un token de autentificare astfel încât API-ul `huggingface_hub` să știe cine sunteți și care sunt namespaces la care aveți acces de scriere. Asigurați-vă că sunteți într-un environment unde aveți instalat `transformers` (vedeti [Configurarea](/course/chapter0)). Dacă sunteți într-un notebook, puteți folosi următoarea funcție pentru a vă autentifica:
+
+```python
+from huggingface_hub import notebook_login
+
+notebook_login()
+```
+
+În terminal, puteți rula următoarea comandă:
+
+```bash
+huggingface-cli login
+```
+
+În ambele cazuri, veți fi rugați să introduceți numele utilizatorului și parola, care sunt aceleași cu cele folosite la autentificare pe Hub. Dacă nu aveți încă un profil pe Hub, vă rugăm să creați unul [aici](https://huggingface.co/join).
+
+Excelent! Acum aveți tokenul de autentificare stocat în folder-ul cache. Vom crea acum niște repositorii!
+
+{#if fw === 'pt'}
+
+Dacă ați lucrat cu API-ul `Trainer` pentru a antrena un model, cea mai ușoară modalitate de a o încărca pe Hub este să setați `push_to_hub=True` când definiți `TrainingArguments`:
+
+```py
+from transformers import TrainingArguments
+
+training_args = TrainingArguments(
+    "bert-finetuned-mrpc", save_strategy="epoch", push_to_hub=True
+)
+```
+
+Când chemați `trainer.train()`, `Trainer` va încărca modelul pe Hub de fiecare dată când este salvat (aici, la fiecare epocă) într-un repository namespaceul tău. Acest repository va fi numit după outpul directory-ul ales (aici `bert-finetuned-mrpc`), dar puteți alege un alt nume cu `hub_model_id = "un_nume_diferit"`.
+
+Pentru a încărca modelul într-o organizație din care faceți parte, este suficient să introduceți aceasta în `hub_model_id = "organizația_mea/numele_repositoriului"`.
+
+Odată ce antrenarea s-a terminat, trebuie să faceți `trainer.push_to_hub()` pentru a încărca ultima versiune a modelului. Acesta va genera apoi un model card cu toate informațiile relevante, inclusiv metadatele despre hyperparametrii utilizați și rezultatele evaluării! Aici este exemplul unui astfel de model card:
+
+<div class="flex justify-center">
+  <img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/model_card.png" alt="Un exemplu de un card auto-generat." width="100%"/>
+</div>
+
+{:else}
+
+Dacă utilizați Keras pentru a antrena modelul dumneavoastră, cea mai ușoară modalitate de a încărca-o pe Hub este să transmiteți un `PushToHubCallback` când chemați `model.fit()`:
+
+```py
+from transformers import PushToHubCallback
+
+callback = PushToHubCallback(
+    "bert-finetuned-mrpc", save_strategy="epoch", tokenizer=tokenizer
+)
+```
+
+Apoi, adăugați `callbacks=[callback]` în apelul la `model.fit()`. Callback-ul va încărca apoi modelul pe Hub de fiecare dată când se salvează(aici, la fiecare epocă) într-un repository din namespaceul tău. Acest repository va fi numit după output directory ales (aici `bert-finetuned-mrpc`), dar puteți alege un alt nume cu `hub_model_id = "un_nume_diferit"`.
+
+Pentru a încărca modelul într-o organizație din care faceți parte, este suficient să introduceți aceasta în `hub_model_id = "organizația_mea/numele_repositoriului"`.
+
+{/if}
+
+La un nivel inferior, accesarea Hub-ului se poate face direct pe modele, tokenizers și configurations objects prin metoda `push_to_hub()`. Această metodă se ocupă atât de crearea repositoriului cât si de încărcarea modelului și tokenizerului direct în el. Nu este nevoie de o interacțiune manuală, precum fața de API-ul pe care îl vom vedea mai jos.
+
+Pentru a înțelege cum funcționează, luați în considerare inițializarea unui model și a unui tokenizer:
+
+{#if fw === 'pt'}
+```py
+from transformers import AutoModelForMaskedLM, AutoTokenizer
+
+checkpoint = "camembert-base"
+
+model = AutoModelForMaskedLM.from_pretrained(checkpoint)
+tokenizer = AutoTokenizer.from_pretrained(checkpoint)
+```
+{:else}
+```py
+from transformers import TFAutoModelForMaskedLM, AutoTokenizer
+
+checkpoint = "camembert-base"
+
+model = TFAutoModelForMaskedLM.from_pretrained(checkpoint)
+tokenizer = AutoTokenizer.from_pretrained(checkpoint)
+```
+{/if}
+
+Sunteți liberi să faceți orice ați vrea cu acestea - adăugați tokens la tokenizer, antrenați modelul sau faceți fine-tune. Odată ce sunteți mulțumiți de modelul obținut, weighturile și tokenizerul acestuia , puteți folosi metoda `push_to_hub()` disponibilă direct pe obiectul `model`:
+
+```py
+model.push_to_hub("dummy-model")
+```
+Acest lucru va crea un nou repository `dummy-model` în profilul tău și o va popula cu fișierele modelului tău.
+Încercați același lucru cu tokenizerul, astfel încât toate fișierele să fie acum disponibile în acest repository:
+
+```py
+tokenizer.push_to_hub("dummy-model")
+```
+
+Dacă apartineți unei organizații, specificați doar argumentul `organization` pentru a încărca în namespaceul acestei organizații:
+
+```py
+tokenizer.push_to_hub("dummy-model", organization="huggingface")
+```
+
+Dacă doriți să utilizați un anumit token Hugging Face, sunteți liberi să specificați acest lucru metodei `push_to_hub()`:
+
+```py
+tokenizer.push_to_hub("dummy-model", organization="huggingface", use_auth_token="<TOKEN>")
+```
+
+Acum, mergeți la Model Hub pentru a găsi modelul încărcat: *https://huggingface.co/user-or-organization/dummy-model*.
+
+Apăsați pe tabul "Files and versions", iar acum ar trebui să vedeți fișierele vizibile în următorul screenshot:
+
+{#if fw === 'pt'}
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/push_to_hub_dummy_model.png" alt="Dummy model containing both the tokenizer and model files." width="80%"/>
+</div>
+{:else}
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/push_to_hub_dummy_model_tf.png" alt="Dummy model containing both the tokenizer and model files." width="80%"/>
+</div>
+{/if}
+
+<Tip>
+
+✏️ **Încercați!** Luați modelul și tokenizerul asociat cu checkpointul `bert-base-cased` și încărcați-l pe un repo în namespaceul tău folosind metoda `push_to_hub()`. Verificați că repo-ul apare  în pagina dumneavoastră înainte de a-l șterge.
+
+</Tip>
+
+Ați văzut că metoda `push_to_hub()` acceptă mai multe argumente, ceea ce permite încărcarea într-un repository specific sau namespace al unei organizații, sau utilizarea unui token API diferit. Vă recomandăm să vă uitați la specificația metodei disponibilă direct în [documentația 🤗 Transformers](https://huggingface.co/transformers/model_sharing) pentru a înțelge ceea ce este posibil.
+
+Metoda `push_to_hub()` este backed de packageul Python [`huggingface_hub`](https://github.com/huggingface/huggingface_hub), care oferă un API direct la Hub-ul Hugging Face. Acesta este integrat în 🤗 Transformers și în mai multe biblioteci pentru machine learning, ca de exemplu [`allenlp`](https://github.com/allenai/allennlp). Deși ne concentrăm pe integrarea în 🤗 Transformers în acest capitol, integrarea sa în propriul dumneavoastră cod sau bibliotecă este simplu.
+
+Întoarceți-vă la secțiune precedentă pentru a vedea cum să încărcați fișierele în noul repository-ul creat!
+
+## Utilizarea bibliotecii Python `huggingface_hub`
+
+Biblioteca Python `huggingface_hub` este un package care oferă un set de instrumente pentru model și datasets hubs. Oferă metode simple și clase pentru sarcini comune ca:
+Obținerea informațiilor despre repositorii pe hub și gestionarea lor. Ofere API-uri simple care lucrează pe lângă Git pentru a gestiona conținutul acestor repositorii și integrarea Hub-ului
+în proiectele și bibliotecile tale.
+
+Similar cu utilizarea API-ului `push_to_hub`, asta va necesita un token de autentificare salvat în cache. Pentru a face acest lucru, veți avea nevoie să folosiți comanda `login` din CLI, cum am menționat în secțiunea anterioară (din nou, asigurați-vă prefixați această comandă cu simbolul `!` dacă rulați în Google Colab):
+
+```bash
+huggingface-cli login
+```
+
+Packageul `huggingface_hub` oferă mai multe metode și clase utile pentru noi. În primul rând, există câteva metode pentru crearea, ștergerea și gestionarea repositoriilor:
+
+```python no-format
+from huggingface_hub import (
+    # Gestionarea utilizatorilor
+    login,
+    logout,
+    whoami,
+
+    # Crearea și gestionarea repositoriilor
+    create_repo,
+    delete_repo,
+    update_repo_visibility,
+
+    # Și câteva metode pentru a obține/schimba informațiile despre conținut
+    list_models,
+    list_datasets,
+    list_metrics,
+    list_repo_files,
+    upload_file,
+    delete_file,
+)
+```
+
+De asemenea, el oferă clasa `Repository` pentru gestionarea unei repository local. Vom explora aceste metode și clasa în următoarele secțiuni pentru a înțelege cum să le utilizați.
+
+Metoda `create_repo` poate fi utilizată pentru crearea unui nou repository în hub:
+
+```py
+from huggingface_hub import create_repo
+
+create_repo("dummy-model")
+```
+
+Acesta va crea repositarul `dummy-model` în namespaceul tău. Dacă doriți, puteți specifica care organizație să aparțină repositoriului folosind argumentul `organization`:
+
+```py
+from huggingface_hub import create_repo
+
+create_repo("dummy-model", organization="huggingface")
+```
+
+Acesta va crea repositoriul `dummy-model` în spațiul organizației `huggingface`, cu condiția că dumneavoastră să apartineți acestei organizații.
+Alte argumente care pot fi utile sunt:
+
+- `private`, pentru a specifica dacă repositarul trebuie să fie vizibil celorlați sau nu.
+- `token`, dacă doriți să vă înlocuiți token-ul stocat în cache cu un anumit token.
+- `repo_type`, dacă doriți să creați un `dataset` sau `space` în loc de model. Valorile acceptate sunt `"dataset"` și `"space"`.
+
+Acum, trebuie să adăugați fișierele în repository-ul dumneavoastră! Treceți la secțiunea următoare pentru a vedea cele trei moduri de a face acest lucru.
+
+## Utilizarea interfeței web
+
+Interfața web oferă instrumente pentru a gestiona repositorii direct în Hub. Cu ajutorul acestei interfețe, puteți crea ușor repositorii, adăuga fișiere (și chiar și fișiere mari!), explora modele, vizualiza diffuri, și multe altele.
+
+Pentru a crea un nou repositoriu, vizitați [huggingface.co/new](https://huggingface.co/new):
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/new_model.png" alt="Pagină care prezintă modelul utilizat pentru crearea unui nou repository." width="80%"/>
+</div>
+
+În primul rând, specificați deținătorul repositoriului: acesta puteți fi dumneavoastră, fie orice organizație cu care sunteți afiliat. Dacă alegeți o organizație, modelul va fi prezent pe pagina organizației și toți membrii acesteia vor avea posibilitatea să contribuie la repositoriu.
+
+În al doilea rând, introduceți numele modelului dumneavoastră. Acest lucru va fi și denumirea repositoriului. În final, puteți specifica dacă doriți ca modelul dumneavoastră să fie public sau privat. Modelele private nu sunt vizibile ceilorlalți.
+
+După crearea repositoriului, ar trebui să vedeți o pagină ca aceasta:
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/empty_model.png" alt="O pagină goală a modelului după crearea unui nou repository." width="80%"/>
+</div>
+
+Acesta este locul unde va fi găzduit modelul. Pentru a începe să populați acesta, puteți adăuga un fișier README direct din interfața web.
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/dummy_model.png" alt="Fișierul README care arată capacitățile Markdown." width="80%"/>
+</div>
+
+Fișierul README este scris în format Markdown - vă rugăm să fiți creativi cu el! A treia parte a acestui capitol se ocupă de crearea unui model card. Acestea sunt foarte importante pentru a aduce valoare modelului dumneavoastră, deoarece este acolo unde spuneți celorlalți ce poate face.
+
+Dacă vă uitați la secțiunea "Fișiere și versiuni", veți vedea că nu sunt prea multe fișiere acolo încă - doar *README.md* pe care l-ați creat dumneavoastră și *.gitattributes* care urmărește fișierele mari.
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/files.png" alt="Secțiunea 'Fișiere și versiuni' arată doar fișierul .gitattributes și README.md." width="80%"/>
+</div>
+
+Vom vedea mai târziu cum să adăugați câteva fișiere noi.
+
+## Încărcarea fișierelor modelului[[uploading-the-model-files]]
+
+Sistemul pentru a gestiona fișierele în Hugging Face Hub se bazează pe git pentru fișierele obișnuite, și pe git-lfs (care se descrifrează ca [Git Large File Storage](https://git-lfs.github.com/)) pentru fișierele mai mari.
+
+În secțiunea următoare, vom discuta despre trei metode diferite de încărcare a fișierelor în Hub: prin `huggingface_hub` și prin comanda git.
+
+### Metoda `upload_file`[[the-uploadfile-approach]]
+
+Prin `upload_file` nu este necesar să instalați git și git-lfs pe sistemul dumneavoastră. Acest lucru încarcă direct fișierele în 🤗 Hub folosind HTTP POST requests. O limitare a acestei metode este că ea nu se ocupă de fișiere care sunt mai mari de 5GB.
+Dacă fișierele dumneavoastră sunt mai mari decât 5 GB, vă rugăm să urmați celelalte două metode descrise mai jos.
+
+API-ul poate fi folosit astfel:
+
+```python
+from huggingface_hub import upload_file
+
+upload_file(
+    "<path_to_file>/config.json",
+    path_in_repo="config.json",
+    repo_id="<namespace>/dummy-model",
+)
+```
+
+Acest lucru va încărca fișierul `config.json` disponibil la `<path_to_file>` la rootul repositoriului ca `config.json`, în `dummy-model` repository.
+Alte argumente utile pot fi:
+
+- `token`, dacă doriți să înlocuiți tokenul stocat în cache cu un alt token.
+- `repo_type`, dacă doriți să încărcați într-un `dataset` sau într-un `space` în locul modelului. Valorile acceptate sunt `"dataset"` și `"space"`.
+
+### Clasa `Repository`[[the-repository-class]]
+
+Clasa `Repository` gestionează un repository local în-tro manieră asemănătoare gitului. Ea abstracționează majoritatea problemelor pe care le întâlniți cu git pentru a oferi toate caracteristicile necesare.
+
+Utilizarea acestei clase necesită ca dumneavoastră să aveți instalat git și git-lfs, așadar asigurați-vă că aveți instalat git-lfs (vezi [aici](https://git-lfs.github.com/) pentru instrucțiunile de instalare) și setat înainte de a începe.
+
+Pentru a vă juca cu repositoriul pe care l-am creat, puteți porni prin inițializarea lui ca un folder local printr-un clonarea repositoriului remote:
+
+```py
+from huggingface_hub import Repository
+
+repo = Repository("<path_to_dummy_folder>", clone_from="<namespace>/dummy-model")
+```
+
+Acesta a creat folderele `<path_to_dummy_folder>` în folderul de lucru. Acest folder conține doar fișierul `.gitattributes` pentru că acesta este singurul fișier creat atunci când inițializați repositoriul prin `create_repo`.
+
+Acum puteți folosi majoritatea metodelor tradiționale ale gitului:
+
+```python
+repo.git_pull()
+repo.git_add()
+repo.git_commit()
+repo.git_push()
+repo.git_tag()
+```
+
+Și altele! Vă recomandăm să vă uitați la documentația `Repository` disponibilă [aici](https://github.com/huggingface/huggingface_hub/tree/main/src/huggingface_hub#advanced-programmatic-repository-management) pentru o înțelegere generală a tuturor metodelor disponibile.
+
+Pentru moment, avem un model și un tokenizer pe care doriți să îl trimiteți în hub. Am reușit să clonăm repositoriul local, deci putem salva fișierele în acesta.
+
+În primul rând asigurați-vă că copia locală este la zi cu ultimele schimbări:
+
+```python
+repo.git_pull()
+```
+
+Odată ce am facut asta, salvați fișierele modelului și al tokenizerul:
+
+```python
+model.save_pretrained("<path_to_dummy_folder>")
+tokenizer.save_pretrained("<path_to_dummy_folder>")
+```
+
+Folder-ul `<path_to_dummy_folder>` acum conține toate fișierele modelului dumneavoastră și ale tokenizerul. Vom urma fluxul tradițional de git adăugând fișiere în zona de pregătire, făcând commit și push fișierelor în hub:
+
+```python
+repo.git_add()
+repo.git_commit("Adăugarea fișierelor modelului și ale tokenizerului")
+repo.git_push()
+```
+
+Felicitări! Ați reușit să încărcați primele fișiere în hub.
+
+### Folosirea Git[[the-git-based-approach]]
+
+Acesta este abordarea cea mai de bază pentru încărcarea fișierelor: vom face ast cu ajutorul git și git-lfs direct. Cea mai grea parte este abstractizată prin abordări anterioare, dar există câteva excepții cu metoda următoare, așadar ne vom referi la un use-case mai complicat.
+
+Pentru această clasă se cere să aveți instalate git și git-lfs, așadar asigurați-vă că aveți [git-lfs](https://git-lfs.github.com/) instalat (vedeți aici instrucțiunile de instalare) și configurat înainte să începeți.
+
+În primul rând, inițializați git-lfs:
+
+```bash
+git lfs install
+```
+
+```bash
+Updated git hooks.
+Git LFS initialized.
+```
+
+După ce ați făcut acest lucru, primul pas este să faceți o copie a repositoriului dumneavoastră:
+
+```bash
+git clone https://huggingface.co/<namespace>/<your-model-id>
+```
+
+Numele meu de utilizator este `lysandre` și am folosit numele modelului `dummy`, așadar comanda mea se termină cu următorul rezultat:
+
+```
+git clone https://huggingface.co/lysandre/dummy
+```
+
+Acum am un folder denumit *dummy* în folderul meu de lucru. Pot intra în folder cu ajutorul `cd` și pot examina conținutul:
+
+```bash
+cd dummy && ls
+```
+
+```bash
+README.md
+```
+
+Dacă ați creat repositoriul dumneavoastră folosind metodă din partea Hugging Face Hub, `create_repo` , acest folder ar trebui să conțină doar un fișier cu numele *.gitattributes*. Dacă ați urmat instrucțiunile din secțiunea anterioară pentru crearea repositoriului folosind interfața web, atunci folderul ar trebui să conțină un singur fișier *README.md* și, de asemenea, un fișier cu numele *.gitattributes*, pe care nu-l puteți vedea.
+
+Adăugarea unui fișier de mărime obișnuită, precum un fișier de configurare, un vocabulary file sau orice alt tip de fișier care au mai puțin de câțiva megabytes se realizează exact așa cum ați face în orice sistem git. Cu toate acestea, pentru a încărca fișiere mai mari, este necesară utilizarea a git-lfs pentru a le trimite spre *huggingface.co*.
+
+Să ne întoarcem la Python pentru a genera un model și tokenizer pe care am dori să le facem commit în repositoriul nostru dummy:
+
+{#if fw === 'pt'}
+```py
+from transformers import AutoModelForMaskedLM, AutoTokenizer
+
+checkpoint = "camembert-base"
+
+model = AutoModelForMaskedLM.from_pretrained(checkpoint)
+tokenizer = AutoTokenizer.from_pretrained(checkpoint)
+
+# Faceți orice cu modelul, antrenați-l, aplicați fine-tuning... 
+
+model.save_pretrained("<path_to_dummy_folder>")
+tokenizer.save_pretrained("<path_to_dummy_folder>")
+```
+{:else}
+```py
+from transformers import TFAutoModelForMaskedLM, AutoTokenizer
+
+checkpoint = "camembert-base"
+
+model = TFAutoModelForMaskedLM.from_pretrained(checkpoint)
+tokenizer = AutoTokenizer.from_pretrained(checkpoint)
+
+# Faceți orice cu modelul, antrenați-l, aplicați fine-tuning... 
+
+model.save_pretrained("<path_to_dummy_folder>")
+tokenizer.save_pretrained("<path_to_dummy_folder>")
+```
+{/if}
+
+Acum am salvat câteva artefacte de model și tokenizer, așadar să examinăm din nou folderul *dummy*:
+
+```bash
+ls
+```
+
+{#if fw === 'pt'}
+```bash
+config.json  pytorch_model.bin  README.md  sentencepiece.bpe.model  special_tokens_map.json tokenizer_config.json  tokenizer.json
+```
+Dacă priviți la dimensiunile fișierelor (de exemplu, folosind `ls -lh`), ar trebui să vedeți că singurul outlier este model state dict file (*pytorch_model.bin*), care are mai mult de 400 MB.
+
+{:else}
+```bash
+config.json  README.md  sentencepiece.bpe.model  special_tokens_map.json  tf_model.h5  tokenizer_config.json  tokenizer.json
+```
+Dacă priviți la dimensiunile fișierelor (de exemplu, folosind`ls -lh`), ar trebui să vedeți că singurul outlier este model state dict file (*t5_model.h5*), care are mai mult de 400 MB.
+
+{/if}
+
+<Tip>
+✏️ Dacă creați repositoriul folosind interfața web, fișierul *.gitattributes* va fi automat configurat pentru a considera anumite extensii de fișiere, precum *.bin* și *.h5*, ca fiind fișiere mari. În acest caz nu este necesară nici o setare suplimentară din partea ta, pentru că git-lfs le va urmări automat.
+</Tip>
+
+Acum putem continua procesul în felul nostru obișnuit cu repositoriurile Git tradiționale. Putem adăuga toate fișierele în mediul de stocare a Git folosind comanda `git add`:
+
+```bash
+git add .
+```
+
+Puteți verifica fișierele curente care sunt în stare de stocare utilizând următoarea comandă:
+
+```bash
+git status
+```
+
+
+{#if fw === 'pt'}
+```bash
+On branch main
+Your branch is up to date with 'origin/main'.
+
+Changes to be committed:
+  (use "git restore --staged <file>..." to unstage)
+  modified:   .gitattributes
+	new file:   config.json
+	new file:   pytorch_model.bin
+	new file:   sentencepiece.bpe.model
+	new file:   special_tokens_map.json
+	new file:   tokenizer.json
+	new file:   tokenizer_config.json
+```
+{:else}
+```bash
+On branch main
+Your branch is up to date with 'origin/main'.
+
+Changes to be committed:
+  (use "git restore --staged <file>..." to unstage)
+  modified:   .gitattributes
+  	new file:   config.json
+	new file:   sentencepiece.bpe.model
+	new file:   special_tokens_map.json
+	new file:   tf_model.h5
+	new file:   tokenizer.json
+	new file:   tokenizer_config.json
+```
+{/if}
+
+De asemenea, putem verifica dacă git-lfs monitorizează fisierele corecte folosind comanda sa `status`:
+
+```bash
+git lfs status
+```
+
+
+{#if fw === 'pt'}
+```bash
+On branch main
+Objects to be pushed to origin/main:
+
+
+Objects to be committed:
+
+	config.json (Git: bc20ff2)
+	pytorch_model.bin (LFS: 35686c2)
+	sentencepiece.bpe.model (LFS: 988bc5a)
+	special_tokens_map.json (Git: cb23931)
+	tokenizer.json (Git: 851ff3e)
+	tokenizer_config.json (Git: f0f7783)
+
+Objects not staged for commit:
+
+
+```
+
+Vom observa că toate fișierele au `Git` ca handler, cu excepția *pytorch_model.bin* și *sentencepiece.bpe.model*, care au `LFS`. Excelent!
+
+{:else}
+```bash
+On branch main
+Objects to be pushed to origin/main:
+
+
+Objects to be committed:
+
+	config.json (Git: bc20ff2)
+	sentencepiece.bpe.model (LFS: 988bc5a)
+	special_tokens_map.json (Git: cb23931)
+	tf_model.h5 (LFS: 86fce29)
+	tokenizer.json (Git: 851ff3e)
+	tokenizer_config.json (Git: f0f7783)
+
+Objects not staged for commit:
+
+
+```
+
+Observăm că toate fișierele au `Git` ca handler, cu excepția *t5_model.h5*, care are `LFS`. Excelent!
+
+{/if}
+
+Acum vom continua cu ultimii pași: commiting și pushing la repo-urile *huggingface.co*:
+
+```
+git commit -m "Prima versiune a modelului"
+```
+
+
+{#if fw === 'pt'}
+```bash
+[main b08aab1] First model version
+ 7 files changed, 29027 insertions(+)
+  6 files changed, 36 insertions(+)
+ create mode 100644 config.json
+ create mode 100644 pytorch_model.bin
+ create mode 100644 sentencepiece.bpe.model
+ create mode 100644 special_tokens_map.json
+ create mode 100644 tokenizer.json
+ create mode 100644 tokenizer_config.json
+```
+{:else}
+```bash
+[main b08aab1] First model version
+ 6 files changed, 36 insertions(+)
+ create mode 100644 config.json
+ create mode 100644 sentencepiece.bpe.model
+ create mode 100644 special_tokens_map.json
+ create mode 100644 tf_model.h5
+ create mode 100644 tokenizer.json
+ create mode 100644 tokenizer_config.json
+```
+{/if}
+
+Pushingul poate lua câteva minute, în funcție de viteza conexiunii tale la internet și mărimea fișierelor:
+
+```bash
+git push
+```
+
+```bash
+Uploading LFS objects: 100% (1/1), 433 MB | 1.3 MB/s, done.
+Enumerating objects: 11, done.
+Counting objects: 100% (11/11), done.
+Delta compression using up to 12 threads
+Compressing objects: 100% (9/9), done.
+Writing objects: 100% (9/9), 288.27 KiB | 6.27 MiB/s, done.
+Total 9 (delta 1), reused 0 (delta 0), pack-reused 0
+To https://huggingface.co/lysandre/dummy
+   891b41d..b08aab1  main -> main
+```
+
+{#if fw === 'pt'}
+Dacă ne uităm la repositoriul modelului când acest lucru este finalizat, putem vedea toate fișierele recent adăugate:
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/full_model.png" alt="Tabul 'Files and versions' conține acum toate fișierele recente adăugate." width="80%"/>
+</div>
+
+Interfața permite explorarea fișierelor modelului și a commiturilor și vizualizarea diferenței introduse de fiecare commit:
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/diffs.gif" alt="Diferența introdusă de ultimul commit." width="80%"/>
+</div>
+{:else}
+Dacă ne uităm la repositoriul modelului când acest lucru este finalizat, putem vedea toate fișierele recent adăugate:
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/full_model_tf.png" alt="Tabul 'Files and versions' conține acum toate fișierele recente adăugate." width="80%"/>
+</div>
+
+Interfața permite explorarea fișierelor modelului și a commiturilor și vizualizarea diferenței introduse de fiecare commit:
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/diffstf.gif" alt="Diferența introdusă de ultimul commit." width="80%"/>
+</div>
+{/if}
+```
\ No newline at end of file
diff --git a/chapters/ro/chapter4/4.mdx b/chapters/ro/chapter4/4.mdx
new file mode 100644
index 000000000..7cac09819
--- /dev/null
+++ b/chapters/ro/chapter4/4.mdx
@@ -0,0 +1,88 @@
+# Crearea unui model card[[building-a-model-card]]
+
+
+<CourseFloatingBanner
+    chapter={4}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+Model card este un fișier care este, probabil, la fel de important ca și fișierele de model si tokenizer dintr-o repositoriul modelului. Este definiția centrală a modelului, asigurând reutilizarea de către membrii comunității și reproducerea rezultatelor, oferind o platformă pe care alți membri pot construi artefecatele lor.
+
+Documentarea procesului de antrenare și evaluare ajută celorlați să înțeleagă la ce să aștepte de la un model - iar oferirea informațiilor suficiente referitoare la datele folosite si preprocesarea acestora (înainte și după antrenare) vor ajuta la identificarea și înțelegerea limitelor, biaseruile și contextului în care modelul este și nu este folositor.
+
+Prin urmare, crearea unui model card care definește modelul dvs. este un pas foarte important. Aici, oferim câteva sfaturi care v-ar putea ajuta în acest sens. Crearea model cardului se face prin intermediul fișierului `README.md`, pe care l-ați văzut anterior, care este un fișier Markdown.
+
+Conceptul de "model card" provine dintr-o direcție de cercetare a Google, publicată inițial în articolul ["Model Cards for Model Reporting"](https://arxiv.org/abs/1810.03993) scrisă de Margaret Mitchell et al. O parte semnificativă dintre informațiile conținute aici sunt bazate pe acest articol, iar noi vă recomandăm să verificați dacă doriți să înțelegeți de ce model cardurile sunt atât importante într-o lume care valorifică reproducerea, reutilizarea și echitatea.
+
+Model cardul începe cu o prezentare scurtă și generală a ceea ce este modelul - urmată de detalii suplimentare în secțiunile următoare:
+
+- Descrierea modelului
+- Utilizări intenționate și limitările modelului
+- Cum se utilizează
+- Limitări și bias
+- Datele de antrenare
+- Procedura de antrenare
+- Rezultatele evaluării
+
+Hai să vedem ce ar trebui să conțină fiecare dintre aceste secțiuni.
+
+### Descrierea modelului[[model-description]]
+
+Secțiunea de descriere a modelului conține detalii generale despre model. Aceasta include arhitectura, versiunea, dacă a fost introdus într-un articol științific, dacă este disponibilă o implementare originală, autorul și informații generale despre model. Orice drepturi de autor ar trebui să fie atribuite în această secțiune. Informația generală despre procedurile de antrenare, parametrii și avertismente pot fi menționate aici.
+
+### Utilizări intenționate și limitările modelului[[intended-uses-limitations]]
+
+Aici descrieți utilizările pentru care modelul este destinat - inclusiv limba și domeniile unde se poate aplica. Această secțiune din model card poate documenta și zone cunoscute ca nefiind în scopul modelului sau unde este probabil să funcționeze suboptimal.
+
+### Cum se utilizează[[how-to-use]]
+
+Acesta secțiune ar trebui să includă exemple despre cum să utilizați modelul. Acest lucru poate prezenta utilizarea funcției `pipeline()`, utilizarea claselor de model si tokenizer, și orice cod care credeți că ar putea fi util.
+
+### Datele de antrenare[[training-data]]
+
+Această secțiune trebuie să indice datasetul(urile) folosit pentru instruirea modelului. O descriere scurtă a datasetului(urilor) este binevenită.
+
+### Procedura de antrenare[[training-procedure]]
+
+Aici descrieți toate aspectele relevante ale antrenarii care sunt utile din punct de vedere al reproducerii. Acest lucru include orice preprocessing sau postprocessing efectuat pe date, precum și detalii ca numărul de epoci pe care a fost antrenat modelul, dimensiunea batch-ului, learning rateul si alte astfel de detalii.
+
+### Variabilele si metrice[[variable-and-metrics]]
+
+Aici descrieți metricile utilizate la evaluarea rezultatelor, precum și diferite aspecte pe care le măsurați. Menționați metricile folosite, pe ce dataset și care dataset split, astfel încât să fie ușor de comparat performanțele modelului cu cele ale altor modele.
+
+### Rezultatele evaluării[[evaluation-results]]
+
+În sfârșit, indicați cum s-a comportat modelul pe datasetul de evaluare. Dacă modelul foloseste un decision threshold, atunci includeți acest decision threshold în secțiunea respectivă - sau explicați că rezultatele sunt prezentate la diferite thresholduri pentru utilizările preconizate.
+
+## Exemplu[[example]]
+
+Aici puteți găsi câteva exemple ale unor Model Card:
+
+- [`bert-base-cased`](https://huggingface.co/bert-base-cased)
+- [`gpt2`](https://huggingface.co/gpt2)
+- [`distilbert`](https://huggingface.co/distilbert-base-uncased)
+
+Câteva exemple din alte organizații și companii pot fi găsite [aici](https://github.com/huggingface/model_card/blob/master/examples.md).
+
+## Notă[[note]]
+
+Model cardurile nu sunt o cerință obligatorie când se publică modelele si nu este necesar să includeți toate secțiunile descrise mai sus în Model Card. Cu toate acestea, documentarea explicită a modelului poate beneficia utilizatorilor viitori, deci vă recomandăm să completați cât mai multe dintre secțiuni.
+
+## Metadatele cardului de model[[model-card-metadata]]
+
+Dacă ați explorat puțin Hugging Face Hub atunci ar trebui să fi văzut că anumite modele aparțin anumitor categorii: puteți filtra acestea după diverse domenii. Categoriile modelului sunt identificate prin metadata adăugată în secțiunea de header a cardului.
+
+Spre exemplu, dacă vă uitați la modelul [`camembert-base`](https://huggingface.co/camembert-base/blob/main/README.md) atunci veți observa următoarea linii din headerul cardului:
+
+````
+---
+language: fr
+license: mit
+datasets:
+- oscar
+---
+```
+
+Metadatele acestei secțiuni sunt analizate de Hugging Face Hub, care apoi identifică acest model ca fiind un model francez, cu licență MIT și antrenat pe datasetul Oscar.
+
+[Toate specificările cardului](https://github.com/huggingface/hub-docs/blame/main/modelcard.md) permite specificarea a mai multor metadate, inclusiv limba, licența, etichetele, dataseturile folosite la antrenare și metricile evaluate.
\ No newline at end of file
diff --git a/chapters/ro/chapter4/5.mdx b/chapters/ro/chapter4/5.mdx
new file mode 100644
index 000000000..509673def
--- /dev/null
+++ b/chapters/ro/chapter4/5.mdx
@@ -0,0 +1,12 @@
+# Partea 1 este completată!
+
+<CourseFloatingBanner
+    chapter={4}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+Acesta este sfârșitul primei părți a cursului! Partea 2 va fi lansată pe data de 15 noiembrie, cu un mare eveniment comunitar, mai multe informații găsiți [aici](https://huggingface.co/blog/course-launch-event).
+
+Acum, sunteți capabili să faceți fine-tune unui model preantrenat pe o problemă de clasificare a textului (o singură sau perechi de propoziții) și să încarci rezultatele la Model Hub. Să fii sigur că ai învățat această primă secțiune, ar trebui să faci exact acest lucru pe o problemă care ți se pare interesantă (și nu neapărat în limba engleză dacă vorbiți altă limbă)! Puteți găsi ajutor în [forumurile Hugging Face](https://discuss.huggingface.co/) și să împărtășiți proiectul dvs. pe [acest subiect](https://discuss.huggingface.co/t/share-your-projects/6803) odată ce ați terminat.
+
+Ne așteptăm cu nerăbdare să vedem ceea ce veți construi cu aceste cunoștințe :)!
\ No newline at end of file
diff --git a/chapters/ro/chapter4/6.mdx b/chapters/ro/chapter4/6.mdx
new file mode 100644
index 000000000..746428f14
--- /dev/null
+++ b/chapters/ro/chapter4/6.mdx
@@ -0,0 +1,233 @@
+<FrameworkSwitchCourse {fw} />
+
+<!-- DISABLE-FRONTMATTER-SECTIONS -->
+
+# Quiz pentru finalizarea capitolului[[end-of-chapter-quiz]]
+
+<CourseFloatingBanner
+    chapter={4}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+Să testăm ceea ce ai învățat în acest capitol!
+  
+### 1. La ce sunt limitate modelele din Hub?
+
+<Question
+	choices={[ 
+		{
+			text: "Modelele din biblioteca 🤗 Transformers.",
+			explicație: "Ținând cont că modelele din biblioteca 🤗 Transformers sunt disponibile pe Hugging Face Hub, ele nu sunt singurele!"
+		},
+		{
+			text: "Toate modelele cu o interfață similară cu 🤗 Transformers.",
+			explicație: "Nu există nicio cerință de interfață când se încarcă modelele pe Hugging Face Hub."
+		},
+		{
+			text: "Nu există limite.",
+			explicație: "Adevărat! Nu există nici o limită când se încarcă modele pe Hub.",
+            corect: true
+		},
+        {
+			text: "Modele care, într-o anumită măsură, sunt legate de NLP.",
+			explicație: "Nu există nicio cerință privind domeniul aplicației!"
+		}
+	] }
+/>
+
+### 2. Cum poți gestiona modelele pe Hub?
+
+<Question
+	choices={[ 
+		{
+			text: "Printr-un cont GCP.",
+			explicație: "Greșit! "
+		},
+		{
+			text: "Prin distribuția peer-to-peer.",
+			explicație: "Greșit!"
+		},
+		{
+			text: "Prin git și git-lfs.",
+			explicație: "Corect! Modelele din Hub sunt simple repositorii Git, care utilizează <code>git-lfs</code> pentru fișiere mari.",
+            corect: true
+		}
+	] }
+/>
+
+### 3. Ce poți face utilizând interfața web a Hugging Face Hub?
+
+<Question
+	choices={[ 
+		{
+			text: "Forkingul unui repositoriu existent.",
+			explicație: "Nu se poate face forking la un repositoriu pe Hugging Face Hub."
+		},
+		{
+			text: "Crearea unui nou model repository.",
+			explicație: "Corect! Dar nu este singurul lucru pe care îl poți face...",
+            corect: true
+		},
+		{
+			text: "Gestionarea și editarea fișierelor.",
+			explicație: "Corect! Dar nuu este singurul lucru pe care îl poți face..."
+            correct: true
+		},
+        {
+			text: "Încărcarea de fișiere.",
+			explicație: "Corect! Dar nu este singurul lucru..."
+            correct: true
+		},
+        {
+			text: "Vizualizarea diferențelor între versiuni.",
+			explicație: "Corect! Dar nu este singurul lucru pe care îl poți face...",
+            corect: true
+		}
+	] }
+/>
+
+### 4. Ce este un model card?
+
+<Question
+	choices={[ 
+		{
+			text: "O descriere a modelului, deci mai puțin importantă decât fișierele model și tokenizer.",
+			explicație: "Este într-adevăr o descriere a modelului, dar este un element important. Dacă descrierea nu este completă sau absentă, utilitatea modelului se reduce drastic."
+		},
+		{
+			text: "Un mod de asigurare a reproducerii, reutilizării și egalității.",
+			explicație: "Corect! Oferirea informațiilor adecvate în model card va ajuta utilizatorii să utilizeze modelul și să fie conștienți de limitele și biasurile acestuia. ",
+            corect: true
+		},
+		{
+			text: "Un fișier Python care poate fi rulat pentru a obține informații despre model.",
+			explicație: "Model cardurile sunt simple fișiere Markdown."
+		}
+	] }
+/>
+
+Chapitru 4
+
+### 5. Câte dintre obiectele bibliotecii 🤗 Transformers pot fi împărtășite direct pe Hub cu `push_to_hub()`?
+
+{#if fw === 'pt'}
+<Question
+	choices={[
+		{
+			text: "Un tokenizer",
+			explain: "Corect! Toți tokenizerii au metoda <code>push_to_hub</code>, și utilizând-o, vor împărtăși toate fișierele tokenizerului (vocabular, arhitectură tokenizerului, etc.) către un repo. Însă acesta nu este singura soluție corectă!",
+            correct: true
+		},
+		{
+			text: "O configurare a modelului",
+			explain: "Corect! Toate configurațiile modelelor au metoda <code>push_to_hub</code>, și utilizând-o, vor împărtăși configurația către un repo. Și ce altceva poți oferi?",
+            correct: true
+		},
+		{
+			text: "Un model",
+			explain: "Corect! Toate modelele au metoda <code>push_to_hub</code>, și utilizând-o, vor împărtăși ei, precum și fișierele de configurare către un repo. Și nu numai asta!",
+            correct: true
+		},
+        {
+			text: "Un Trainer",
+			explain: "Corect — <code>Trainer</code> implementează metoda <code>push_to_hub</code>, și utilizând-o, vor încărca modelul, configurarea sa, tokenizerul, precum și un draft a unui model card către un repo. Încearcă și altă opțiune!",
+            correct: true
+		}
+	]}
+/>
+
+{:else}
+<Question
+	choices={[
+		{
+			text: "Un tokenizer",
+			explain: "Corect! Toți tokenizerii au metoda <code>push_to_hub</code>, și utilizând-o, vor împărtăși toate fișierele tokenizerului (vocabular, arhitectură tokenizerului, etc.) către un repo. Însă acesta nu este singura soluție corectă!",
+            correct: true
+		},
+		{
+			text: "O configurare a modelului",
+			explain: "Corect! Toate configurațiile modelelor au metoda <code>push_to_hub</code>, și utilizând-o, vor împărtăși configurația către un repo. Și ce altceva poți oferi?",
+            correct: true
+		},
+		{
+			text: "Un model",
+			explain: "Corect! Toate modelele au metoda <code>push_to_hub</code>, și utilizând-o, vor împărtăși ei, precum și fișierele de configurare către un repo. Și nu numai asta!",
+            correct: true
+		},
+        {
+			text: "Toate cele trei cu un callback dedicat",
+			explain: "Corect — <code>PushToHubCallback</code> va trimite regular toate aceste obiecte către un repo în timpul antrenării.",
+            correct: true
+		}
+	]}
+/>
+{/if}
+
+### 6. Care este primul pas atunci când utilizați metoda `push_to_hub()` sau instrumentele CLI?
+
+<Question
+	choices={[
+		{
+			text: "Logarea pe website",
+			explain: "Acest lucru nu vă va ajuta local."
+		},
+		{
+			text: "Rulați 'huggingface-cli login' în terminal.",
+			explain: "Corect — acest lucru va descărca și va stoca tokenul personal.",
+            correct: true
+		},
+		{
+			text: "Rulați 'notebook_login()' într-un notebook",
+			explain: "Corect — acest lucru va afișa un widget pentru a vă autentifica.",
+            correct: true
+		},
+	]
+    }
+/>
+
+
+### 7. Aveți un model și un tokenizer, cum le puteți încărca pe ambele în Hub?
+
+<Question
+	choices={[
+		{
+			text: "Prin apelarea directă a metodei `push_to_hub` pe model și tokenizer",
+			explain: "Corect!",
+            correct: true
+		},
+		{
+			text: "În cadrul runtime-ului Python, prin wrappingul acestora într-un <code>huggingface_hub</code>",
+			explain: "Modelele și tokenizerii deja beneficiază de utilitățile <code>huggingface_hub</code>: nu vă trebuie nici un wrapping suplimentar!"
+		},
+		{
+			text: "Prin salvarea lor pe disc și apelarea <code>transformers-cli upload-model</code>",
+			explain: "Comanda <code>upload-model</code> nu există."
+		}
+	]}
+/>
+
+### 8. Carele operații git poți face cu clasa `Repository`?
+
+<Question
+	choices={[
+		{
+			text: "Un commit",
+			explain: "Corect, metoda <code>git_commit()</code> este acolo pentru a face commit.",
+            correct: true
+		},
+		{
+			text: "Un pull",
+			explain: "Acesta este scopul metodei <code>git_pull()</code>",
+            correct: true
+		},
+		{
+			text: "Un push",
+			explain: "Metoda <code>git_push()</code> face acest lucru.",
+            correct: true
+		},
+		{
+			text: "Un merge",
+			explain: "Nu, această operație nu va fi niciodată posibilă cu acest API."
+		}
+	]}
+/>
\ No newline at end of file

From 1c9d20a761c0883404096211aac071e86a27953d Mon Sep 17 00:00:00 2001
From: Angroys <120798951+Angroys@users.noreply.github.com>
Date: Sun, 5 Jan 2025 01:42:24 +0200
Subject: [PATCH 009/167] Finished chapter 5 for the ro language

---
 chapters/en/chapter5/3.mdx |   1 -
 chapters/ro/chapter5/1.mdx |  22 ++
 chapters/ro/chapter5/2.mdx | 173 +++++++++
 chapters/ro/chapter5/3.mdx | 748 +++++++++++++++++++++++++++++++++++++
 chapters/ro/chapter5/4.mdx | 287 ++++++++++++++
 chapters/ro/chapter5/5.mdx | 404 ++++++++++++++++++++
 chapters/ro/chapter5/6.mdx | 517 +++++++++++++++++++++++++
 chapters/ro/chapter5/7.mdx |  16 +
 chapters/ro/chapter5/8.mdx | 228 +++++++++++
 9 files changed, 2395 insertions(+), 1 deletion(-)
 create mode 100644 chapters/ro/chapter5/1.mdx
 create mode 100644 chapters/ro/chapter5/2.mdx
 create mode 100644 chapters/ro/chapter5/3.mdx
 create mode 100644 chapters/ro/chapter5/4.mdx
 create mode 100644 chapters/ro/chapter5/5.mdx
 create mode 100644 chapters/ro/chapter5/6.mdx
 create mode 100644 chapters/ro/chapter5/7.mdx
 create mode 100644 chapters/ro/chapter5/8.mdx

diff --git a/chapters/en/chapter5/3.mdx b/chapters/en/chapter5/3.mdx
index 9e6e738bc..8bde80552 100644
--- a/chapters/en/chapter5/3.mdx
+++ b/chapters/en/chapter5/3.mdx
@@ -526,7 +526,6 @@ train_df = drug_dataset["train"][:]
 
 </Tip>
 
-
 From here we can use all the Pandas functionality that we want. For example, we can do fancy chaining to compute the class distribution among the `condition` entries:
 
 ```py
diff --git a/chapters/ro/chapter5/1.mdx b/chapters/ro/chapter5/1.mdx
new file mode 100644
index 000000000..7fd54a2ad
--- /dev/null
+++ b/chapters/ro/chapter5/1.mdx
@@ -0,0 +1,22 @@
+# Introducere[[introduction]]
+
+<CourseFloatingBanner
+    chapter={5}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+În [Capitolul 3](/course/chapter3) ați încercat a biblioteca 🤗Datasets și ați văzut că existau trei pași principali atunci când vine vorba de fine-tuningul unui model:
+
+1. Încărcați un dataset din Hugging Face Hub.
+2. Preprocesați datele cu `Dataset.map()`.
+3. Încărcați și calculați metricele.
+
+Dar acesta este doar o mică parte a ceea ce poate face 🤗 Datasets! În acest capitol, vom trece mai in deep în această bibliotecă. Pe parcurs, vom găsi răspunsuri la următoarele întrebări:
+
+* Ce faceți atunci când datasetul tău nu este pe Hub?
+* Cum puteți tăia și împărți un dataset? (Și ce dacă tu _really_ trebuie să folosești Pandas?)
+* Ce faceți atunci când datasetul este uriaș și va topi RAM-ul laptopului dumneavoastră?
+* Ce este "memory mapping" și Apache Arrow?
+* Cum puteți crea propriul dataset și să-l trimiteți pe Hub?
+
+Tehnicile pe care le veți învăța aici vă vor pregăti pentru sarcinile avansate de tokenizare și fine-tuning din [Capitolul 6](/course/chapter6) și [Capitolul 7](/course/chapter7) -- deci luați o cafea sau două și să începem!
diff --git a/chapters/ro/chapter5/2.mdx b/chapters/ro/chapter5/2.mdx
new file mode 100644
index 000000000..1f78a1a05
--- /dev/null
+++ b/chapters/ro/chapter5/2.mdx
@@ -0,0 +1,173 @@
+# Ce-ar fi dacă dataset-ul meu nu este pe Hub?[[what-if-my-dataset-isnt-on-the-hub]]
+
+<CourseFloatingBanner chapter={5}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[  
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/ro/chapter5/section2.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/ro/chapter5/section2.ipynb"},  
+]} />
+
+Ai învățat să folosești [Hugging Face Hub](https://huggingface.co/datasets) pentru a descărca dataseturi, dar vei găsi adesea că lucrați cu date care sunt stocate fie pe laptopul dumneavoastră, fie pe un server. În această secțiune vă vom arăta cum poate fi utilizat 🤗 Datasets pentru a încărca dataseturi care nu sunt disponibile pe Hugging Face Hub.
+<Youtube id="HyQgpJTkRdE"/>
+
+## Lucrând cu dataseturi locale și remote[[working-with-local-and-remote-datasets]]
+
+🤗 Datasets oferă loading scripts pentru a gestiona încărcarea dataseturilor locale și remote. Suportă mai multe data formats , cum ar fi:
+
+|    Data format     | Loading script |                         Example                         |
+| :----------------: | :------------: | :-----------------------------------------------------: |
+|     CSV & TSV      |     `csv`      |     `load_dataset("csv", data_files="my_file.csv")`     |
+|     Text files     |     `text`     |    `load_dataset("text", data_files="my_file.txt")`     |
+| JSON & JSON Lines  |     `json`     |   `load_dataset("json", data_files="my_file.jsonl")`    |
+| Pickled DataFrames |    `pandas`    | `load_dataset("pandas", data_files="my_dataframe.pkl")` |
+
+As shown in the table, for each data format we just need to specify the type of loading script in the `load_dataset()` function, along with a `data_files` argument that specifies the path to one or more files. Let's start by loading a dataset from local files; later we'll see how to do the same with remote files.
+
+## Loading a local dataset[[loading-a-local-dataset]]
+
+For this example we'll use the [SQuAD-it dataset](https://github.com/crux82/squad-it/), which is a large-scale dataset for question answering in Italian.
+
+The training and test splits are hosted on GitHub, so we can download them with a simple `wget` command:
+
+În tabelele de mai sus, pentru fiecare format de date trebuie doar să specificăm tipul scriptului de încărcare din funcția `load_dataset()`, alături de un argument `data_files` care specifică calea către un sau mai multe fișiere. Începem cu încărcarea datasetului din fișierele locale; apoi vom vedea cum să faceți același lucru cu fișierele remote.
+
+## Încărcarea unui dataset local[[loading-a-local-dataset]]
+
+În acest exemplu, vom folosi [datasetul SQuAD-it](https://github.com/crux82/squad-it/), care este un large-scale dataset pentru întrebări și răspunsuri în italiană.
+
+Spliturile de training și test sunt disponibile pe GitHub, deci putem descarca cu o comanda `wget`:
+```python
+!wget https://github.com/crux82/squad-it/raw/master/SQuAD_it-train.json.gz
+!wget https://github.com/crux82/squad-it/raw/master/SQuAD_it-test.json.gz
+```
+
+This will download two compressed files called *SQuAD_it-train.json.gz* and *SQuAD_it-test.json.gz*, which we can decompress with the Linux `gzip` command:
+
+```python
+!gzip -dkv SQuAD_it-*.json.gz
+```
+
+```bash
+SQuAD_it-test.json.gz:	   87.4% -- replaced with SQuAD_it-test.json
+SQuAD_it-train.json.gz:	   82.2% -- replaced with SQuAD_it-train.json
+```
+
+
+
+Putem observa că fișierele comprimate au fost înlocuite cu _SQuAD_it-train.json_ și _SQuAD_it-test.json_, iar datele sunt stocate în formatul JSON.
+
+<Tip>
+✎ Dacă vă întrebați de ce există un caracter `!` în comenziile shell din exemplu, acest lucru se întâmplă pentru că le-am rulat în cadrul unui jupyter notebook. Simplu să ștergeți prefixul dacă doriți să descărcați și să faceți unzip datasetului într-un terminal.
+</Tip>
+
+Să încarcăm acum un fișier JSON cu funcția `load_dataset()`. Ne trebuie doar să știm dacă ne confruntăm cu un JSON obișnuit (similar cu un nested dictionary) sau JSON Lines (lines-separated JSON). Cum multe dataset-uri pentru întrebări și răspunsuri, SQuAD-it folosește formatul nested, în care toate textele sunt stocate într-un câmp numit `data`. Acest lucru ne permite să încărcăm datasetul specificând argumentul `field` astfel:
+
+```py
+from datasets import load_dataset
+
+squad_it_dataset = load_dataset("json", data_files="SQuAD_it-train.json", field="data")
+```
+
+By default, loading local files creates a `DatasetDict` object with a `train` split. We can see this by inspecting the `squad_it_dataset` object:
+
+```py
+squad_it_dataset
+```
+
+```python out
+DatasetDict({
+    train: Dataset({
+        features: ['title', 'paragraphs'],
+        num_rows: 442
+    })
+})
+```
+
+Acest lucru ne arată numărul de rânduri și numele coloanelor asociate cu setul de antrenare. Putem vizualiza un exemplu prin a indexa în `train` split astfel:
+```py
+squad_it_dataset["train"][0]
+```
+
+```python out
+{
+    "title": "Terremoto del Sichuan del 2008",
+    "paragraphs": [
+        {
+            "context": "Il terremoto del Sichuan del 2008 o il terremoto...",
+            "qas": [
+                {
+                    "answers": [{"answer_start": 29, "text": "2008"}],
+                    "id": "56cdca7862d2951400fa6826",
+                    "question": "In quale anno si è verificato il terremoto nel Sichuan?",
+                },
+                ...
+            ],
+        },
+        ...
+    ],
+}
+```
+
+Excelent, am reușit să încarcăm datasetul nostru local! Dar, deși acest lucru a funcționat pentru setul de antrenare, ceea ce dorim cu adevărat este să includem ambele splituri, `train` și `test`, într-un singur obiect `DatasetDict` astfel încât să putem aplica funcțiile `Dataset.map()` asupra ambelor splituri în același timp. Pentru a face acest lucru, putem furniza un dicționar pentru argumentul `data_files` care va face maps fiecărui spilt name cu fișierul asociat acelui split:
+
+```py
+data_files = {"train": "SQuAD_it-train.json", "test": "SQuAD_it-test.json"}
+squad_it_dataset = load_dataset("json", data_files=data_files, field="data")
+```
+
+```python out
+DatasetDict({
+    train: Dataset({
+        features: ['title', 'paragraphs'],
+        num_rows: 442
+    })
+    test: Dataset({
+        features: ['title', 'paragraphs'],
+        num_rows: 48
+    })
+})
+```
+
+Astfel obținem exact ceea ce am dori. Acum putem aplica diverse tehnici de preprocesare pentru a curăța datele, să facem tokenize recenziilor și așa mai departe.
+
+<Tip>
+
+Argumentul `data_files` al funcției `load_dataset()` este destul de flexibil și poate fi fie un singur file paths, o listă de file paths, sau un dicționar care face maps split nameurilor cu file pathurile. De asemenea putem să folosim glob files care se potrivest unui model specificat conform regulilor folosite de Unix shell (de exemplu putem să facem glob tuturor fișierelor JSON într-un folder ca un singur split setând `data_files="*.json"`). Pentru mai multe detalii consultați [documentația](https://huggingface.co/docs/datasets/loading#local-and-remote-files) 🤗 Datasets.
+
+</Tip>
+
+Scripturile de încărcare din 🤗 Datasets suportă automat decomprimarea fișierelor de intrare, astfel putem să evităm folosirea `gzip` arătând argumentul `data_files` direct către fișierele comprimate:
+
+```py
+data_files = {"train": "SQuAD_it-train.json.gz", "test": "SQuAD_it-test.json.gz"}
+squad_it_dataset = load_dataset("json", data_files=data_files, field="data")
+```
+
+Acest lucru poate fi util dacă nu dorim să manualizăm dezcomprimarea mai multe fișiere GZIP. Automatic decompression se aplică și altor formate precum ZIP și TAR, astfel putem să indicăm `data_files` către fișierele comprimate și suntem gata!
+
+Acum că știm cum să încărcăm fișierele locale pe laptop sau desktop, să vedem cum să încarcăm fișiere remote.
+
+## Încărcarea unui dataset remote[[loading-a-remote-dataset]]
+
+Dacă lucrați ca Data Scientist sau programatori într-o companie, există șanse mari că dataseturile pe care doriți să le analizați sunt stocate pe un anumit server. Din fericire, încărcarea fișierelor remote este la fel de simplă ca încărcarea celor locale! În schimb putem să oferim pathul la fișiere locale, noi oferim argumentului `data_files` de la metoda `load_dataset()` către una sau mai multe adrese URL unde sunt stocate fișierele remote. De exemplu pentru datasetul SQuAD-it găzduit pe GitHub, putem să oferitum argumentului `data_files`, URL-urile _SQuAD_it-*.json.gz_ astfel:
+
+```py
+url = "https://github.com/crux82/squad-it/raw/master/"
+data_files = {
+    "train": url + "SQuAD_it-train.json.gz",
+    "test": url + "SQuAD_it-test.json.gz",
+}
+squad_it_dataset = load_dataset("json", data_files=data_files, field="data")
+```
+
+Astfel obținem același obiect `DatasetDict` ca mai sus, dar economisim timp, deoarece nu descărcăm și decomprimăm fișierele _SQuAD_it-*.json.gz_. Asta încheie aventura noastră în diversele modalități de încarcare a dataseturilor care nu sunt găzduite pe Hugging Face Hub. Acum că am avem un dataset la dispoziție, hai să îl prelucrăm!
+
+<Tip>
+
+✏️ **Încearcă!** Alegeți alt dataset găzduit pe GitHub sau [UCI Machine Learning Repository](https://archive.ics.uci.edu/ml/index.php) și încercați să îl încărcați atât local cât și remote folosind tehniciile introduse mai sus. Pentru puncte bonus, încercați să încărcați un dataset care este stocat în format CSV sau text (consultați [documentația](https://huggingface.co/docs/datasets/loading#local-and-remote-files) pentru detalii suplimentare despre aceste formate).
+
+</Tip>
+
+
+
+
diff --git a/chapters/ro/chapter5/3.mdx b/chapters/ro/chapter5/3.mdx
new file mode 100644
index 000000000..dcc99f474
--- /dev/null
+++ b/chapters/ro/chapter5/3.mdx
@@ -0,0 +1,748 @@
+# E timpul să facem slice și dice[[time-to-slice-and-dice]]
+
+<CourseFloatingBanner chapter={5}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter5/section3.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter5/section3.ipynb"},
+]} />
+
+În cea mai mare parte, datele cu care lucrezi nu vor fi perfect pregătite pentru antrenarea modelelor. În această secțiune vom explora features variate pe care 🤗 Datasets le oferă pentru curățirea dataseturilor.
+
+<Youtube id="tqfSFcPMgOI"/>
+
+## Slicing și dicing asupra datelor[[slicing-and-dicing-our-data]]
+
+Asemenea Pandas, 🤗 Datasets oferă mai multe funcții pentru a manipula conținutul obiectelor `Dataset` și `DatasetDict`. Am întâlnit deja metoda `Dataset.map()` în [Capitolul 3](/course/chapter3), iar în această secțiune vom explora alte funcții de care dispunem.
+
+În acest exemplu, vom folosi [Drug Review Dataset](https://archive.ics.uci.edu/ml/datasets/Drug+Review+Dataset+%28Drugs.com%29) găzduit pe [UC Irvine Machine Learning Repository](https://archive.ics.uci.edu/ml/index.php), care conține reviewurile pacienților privind diverse medicamente, alături de bolile care sunt tratate și o evaluare de 10 stele a satisfacției pacientului.
+
+În primul rând trebuie să descărcăm și să extragem datele, ceea ce se poate de făcut cu comenzile `wget` și `unzip`:
+
+```py
+!wget "https://archive.ics.uci.edu/ml/machine-learning-databases/00462/drugsCom_raw.zip"
+!unzip drugsCom_raw.zip
+```
+
+Deoarece TSV este o variantă a CSV care folosește taburi în loc de virgulă ca separator, putem încărca aceste fișiere prin folosirea scriptului de încărcare `csv` și specificarea argumentului `delimiter` în funcția `load_dataset()` astfel:
+
+```py
+from datasets import load_dataset
+
+data_files = {"train": "drugsComTrain_raw.tsv", "test": "drugsComTest_raw.tsv"}
+# \t este caracterul tab de Python
+drug_dataset = load_dataset("csv", data_files=data_files, delimiter="\t")
+```
+
+O practică bună atunci când faceți orice fel de analiză a datelor este să vă luați un mic random sample pentru a înțelege cu ce tip de date lucrați. În 🤗 Datasets, putem crea o colecție aleatorie prin legarea funcțiilor `Dataset.shuffle()` și `Dataset.select()`:
+
+```py
+drug_sample = drug_dataset["train"].shuffle(seed=42).select(range(1000))
+# Vizualizați primele câteva exemple
+drug_sample[:3]
+```
+
+```python out
+{'Unnamed: 0': [87571, 178045, 80482],
+ 'drugName': ['Naproxen', 'Duloxetine', 'Mobic'],
+ 'condition': ['Gout, Acute', 'ibromyalgia', 'Inflammatory Conditions'],
+ 'review': ['"like the previous person mention, I&#039;m a strong believer of aleve, it works faster for my gout than the prescription meds I take. No more going to the doctor for refills.....Aleve works!"',
+  '"I have taken Cymbalta for about a year and a half for fibromyalgia pain. It is great\r\nas a pain reducer and an anti-depressant, however, the side effects outweighed \r\nany benefit I got from it. I had trouble with restlessness, being tired constantly,\r\ndizziness, dry mouth, numbness and tingling in my feet, and horrible sweating. I am\r\nbeing weaned off of it now. Went from 60 mg to 30mg and now to 15 mg. I will be\r\noff completely in about a week. The fibro pain is coming back, but I would rather deal with it than the side effects."',
+  '"I have been taking Mobic for over a year with no side effects other than an elevated blood pressure.  I had severe knee and ankle pain which completely went away after taking Mobic.  I attempted to stop the medication however pain returned after a few days."'],
+ 'rating': [9.0, 3.0, 10.0],
+ 'date': ['September 2, 2015', 'November 7, 2011', 'June 5, 2013'],
+ 'usefulCount': [36, 13, 128]}
+```
+
+Atrageți atenția că am fixat seedul în `Dataset.shuffle()` pentru posibilitatea de reproducere. `Dataset.select()` se așteaptă la un iterabil cu indices, deci noi am scris `range(1000)` pentru a primi primele 1000 de exemple din datasetul amestecat. Din acest sample putem vedea câteva ciudățenii în datasetul nostru:
+
+* Coloana `Unnamed: 0` are un aspect neobișnuit, care sugerează că este un anonymized ID a fiecărui pacient.
+* Coloana `condition` conține labeluri majuscule și minuscule.
+* Recenziile au lungimi variate și conțin caractere Python precum `\r\n` şi caractere HTML ca `&\#039;`.
+
+Hai să vedem cum putem folosi 🤗 Datasets pentru a face față fiecărei dintre aceste probleme. Pentru a testa ipoteza identificării pacientului pentru coloana `Unnamed: 0`, putem folosi funcția `Dataset.unique()` pentru a verifica dacă numărul de ID-uri corespunde cu numărul de rânduri în fiecare split:
+
+```py
+for split in drug_dataset.keys():
+    assert len(drug_dataset[split]) == len(drug_dataset[split].unique("Unnamed: 0"))
+```
+
+Aceasta pare să confirme ipoteza, deci putem curăța datasetul puțin, redenumind coloana `Unnamed: 0` pentru a-i da un nume mai interpretabil. Putem folosi funcția `DatasetDict.rename_column()` pentru a renumea coloana în același timp în ambele splituri:
+
+```py
+drug_dataset = drug_dataset.rename_column(
+    original_column_name="Unnamed: 0", new_column_name="patient_id"
+)
+drug_dataset
+```
+
+```python out
+DatasetDict({
+    train: Dataset({
+        features: ['patient_id', 'drugName', 'condition', 'review', 'rating', 'date', 'usefulCount'],
+        num_rows: 161297
+    })
+    test: Dataset({
+        features: ['patient_id', 'drugName', 'condition', 'review', 'rating', 'date', 'usefulCount'],
+        num_rows: 53766
+    })
+})
+```
+
+<Tip>
+
+✏️ **Încearcă!** Folosiți funcția `Dataset.unique()` pentru a găsi numărul de medicamente și condiții unice în seturile de antrenare și testare.
+
+</Tip>
+
+În continuare, vom normaliza toate `condition` labels folosind `Dataset.map()`. La fel cum am făcut cu tokenizarea în [Capitolul 3](/course/chapter3), putem defini o funcție simplă care poate fi aplicată pe toate rândurile fiecărui split din `drug_dataset`:
+
+```py
+def lowercase_condition(example):
+    return {"condition": example["condition"].lower()}
+
+
+drug_dataset.map(lowercase_condition)
+```
+
+```python out
+AttributeError: 'NoneType' object has no attribute 'lower'
+```
+
+Oh no, am întâmpinat o problemă cu funcția map! Din eroarea noastră se poate deduce că unele intrări din coloana `condition` sunt `None`, care nu pot fi convertite la caracterul mic pentru că nu sunt string-uri. Vom elimina aceste rânduri folosind `Dataset.filter()`, care funcționează în mod similar cu `Dataset.map()` și se așteaptă o funcție care primește un exemplu al datasetului.
+
+În loc de a scrie o funcție explicită ca:
+
+```py
+def filter_nones(x):
+    return x["condition"] is not None
+```
+
+și apoi să rulăm `drug_dataset.filter(filter_nones)`, putem face acest lucru într-o linie folosind o _funcție lambda_. În Python, funcțiile lambda sunt funcții mici care pot fi definite fără a le numi. Ele au forma generală:
+
+```py
+lambda <argumente> : <expresie>
+```
+
+unde `lambda` este unul dintre [cuvintele cheie](https://docs.python.org/3/reference/lexical_analysis.html#keywords) Python, `<argumente>` reprezintă o listă/set de valori separate prin virgulă care definesc inputurile funcției și `<expresie>` reprezintă operațiile pe care dorim să le executăm. De exemplu, putem defini o funcție lambda care ridică un număr la pătrat:
+
+```py
+lambda x : x * x
+```
+
+Pentru a aplica această funcție la un input, trebuie să îi facem wrap și pe să punem inputul în paranteze:
+
+```py
+(lambda x: x * x)(3)
+```
+
+```python out
+9
+```
+
+La fel, putem defini funcții lambda cu mai multe argumente prin separarea acestora prin virgulă. De exemplu, putem calcula suprafața unui triunghi ca:
+
+```py
+(lambda base, height: 0.5 * base * height)(4, 8)
+```
+
+```python out
+16.0
+```
+
+Funcțiile lambda sunt utile atunci când dorim să definim funcții mici, pentru o singură folosire (pentru mai multe informații despre ele, recomandăm citirea excelentului [Real Python tutorial](https://realpython.com/python-lambda/) scris de Andre Burgaud). În contextul 🤗 Datasets, putem utiliza funcțiile lambda pentru a defini operații simple de map și filter, astfel încât să eliminăm intrările `None` din datasetul nostru:
+
+```py
+drug_dataset = drug_dataset.filter(lambda x: x["condition"] is not None)
+```
+
+Cu intrările `None` eliminate, putem normaliza coloana `condition`:
+
+```py
+drug_dataset = drug_dataset.map(lowercase_condition)
+# Verificăm dacă lowercasing a funcționat
+drug_dataset["train"]["condition"][:3]
+```
+
+```python out
+['left ventricular dysfunction', 'adhd', 'birth control']
+```
+
+Funcționează! Acum că am curățat labelurile, să vedem cum putem curăți și recenziile.
+
+## Crearea de noi coloane
+
+Atunci când lucrați cu recenziile clienților, o practică bună este să verificați numărul de cuvinte în fiecare recenzie. O recenzie poate fi doar un singur cuvânt, cum ar fi "Excelent!" sau un eseu complet care are sute de cuvinte și depinde de cazul pe care îl aveți la vedere, aici trebuie să vă asigurați că faceți față acestor extreme diferit. Pentru a calcula numărul de cuvinte în fiecare recenzie, vom folosi un heuristic aproximativ bazat pe splittingul textului prin spații.
+
+Vom defini o funcție simplă care numără numărul de cuvinte din fiecare recenzie:
+
+```py
+def compute_review_length(example):
+    return {"review_length": len(example["review"].split())}
+```
+
+Spre deosebire de funcția `lowercase_condition()`, `compute_review_length()` returnează un dicționar ale cărui key nu corespund uneia dintre numele coloanelor din dataset. În acest caz, atunci când `compute_review_length()` este transmis în `Dataset.map()`, el va fi aplicat pe toate rândurile din dataset pentru a crea o nouă coloană `review_length`:
+
+```py
+drug_dataset = drug_dataset.map(compute_review_length)
+# Inspectăm primul exemplu de training
+drug_dataset["train"][0]
+```
+
+```python out
+{'patient_id': 206461,
+ 'drugName': 'Valsartan',
+ 'condition': 'left ventricular dysfunction',
+ 'review': '"It has no side effect, I take it in combination of Bystolic 5 Mg and Fish Oil"',
+ 'rating': 9.0,
+ 'date': 'May 20, 2012',
+ 'usefulCount': 27,
+ 'review_length': 17}
+```
+
+Așa cum era de așteptat, putem vedea o nouă coloană `review_length` adăugată la setul de antrenare. Putem sorta această nouă coloană cu `Dataset.sort()` pentru a vedea cum valorile extreme arată:
+
+```py
+drug_dataset["train"].sort("review_length")[:3]
+```
+
+```python out
+{'patient_id': [103488, 23627, 20558],
+ 'drugName': ['Loestrin 21 1 / 20', 'Chlorzoxazone', 'Nucynta'],
+ 'condition': ['birth control', 'muscle spasm', 'pain'],
+ 'review': ['"Excellent."', '"useless"', '"ok"'],
+ 'rating': [10.0, 1.0, 6.0],
+ 'date': ['November 4, 2008', 'March 24, 2017', 'August 20, 2016'],
+ 'usefulCount': [5, 2, 10],
+ 'review_length': [1, 1, 1]}
+```
+
+Precum am presupus, unele recenii conțin doar un singur cuvânt, ceea ce, deși ar putea fi OK pentru analiza sentimentului, nu ar fi informativ dacă vrem să prezicem condiției.
+
+<Tip>
+
+🙋 O alternativă la adăugarea unei noi coloane într-un dataset este funcția `Dataset.add_column()`. Aceasta permite să oferiți coloana ca o listă Python sau array NumPy și poate fi utilă în situații în care `Dataset.map()` nu este bine adaptat pentru analiza dumneavoastră.
+
+</Tip>
+
+Hai să folosim funcția `Dataset.filter()` pentru a elimina recenziile care conțin mai puțin de 30 de cuvinte. Similar cum am făcut în cazul coloanei `condition`, putem elimina recenziile foarte scurte cerând ca recenziile să aibă o lungime mai mare decât acest prag:
+
+```py
+drug_dataset = drug_dataset.filter(lambda x: x["review_length"] > 30)
+print(drug_dataset.num_rows)
+```
+
+```python out
+{'train': 138514, 'test': 46108}
+```
+
+După cum vedeți, aceasta a eliminat aproximativ 15% din recenziile noastrem, din seturile originale de antrenare și testare.
+
+<Tip>
+
+✏️ **Încercați!** Folosiți funcția `Dataset.sort()` pentru a inspecta recenziile cu cele mai mari numere de cuvinte. Vezi [documentația](https://huggingface.co/docs/datasets/package_reference/main_classes#datasets.Dataset.sort) pentru a vedea ce argument trebuie să folosești pentru a sorta recenziile în ordine descrescătoare.
+
+</Tip>
+
+Ultima chestie de care trebuie să ne ocupăm este prezența caracterelor HTML în recenziile noastre. Putem folosi modulul `html` din Python pentru a face unescape acestor caractere:
+
+```py
+import html
+
+text = "I&#039;m a transformer called BERT"
+html.unescape(text)
+```
+
+```python out
+"I'm a transformer called BERT"
+```
+
+Vom folosi `Dataset.map()` pentru a face unescape toate caracterele HTML din corpus:
+
+```py
+drug_dataset = drug_dataset.map(lambda x: {"review": html.unescape(x["review"])})
+```
+
+În mod evident, metoda `Dataset.map()` este foarte utilă pentru procesarea datelor – și nu am abordat decât o mică parte din ceea ce poate face!
+
+## Superputerile metodei `map()`[[the-map-methods-superpowers]]
+
+Metoda `Dataset.map()` acceptă un argument `batched` care, dacă este setat pe `True`, cauzează ca ea să trimită un batch de exemple la funcția map în același timp (dimensiunea batchului poate fi configurată dar defaultul este 1.000). De exemplu, anterior am folosit o funcție map care a făcut unescaped toate caracterele HTML din recenziile noastre și i-a luat câteva secunde să execute (puteți citi timpul pe progress bars). Putem accelera acest lucru prin procesarea mai multor elemente în același timp folosind list comprehension.
+
+Când specificați `batched=True` funcția primește un dicționar cu câmpurile datasetului, dar fiecare valoare este acum _list of values_ și nu doar o singură valoare. Valoarea de return a `Dataset.map()` ar trebui să fie la fel: un dicționar cu câmpurile pe care dorim să le actualizăm sau adăugăm în datasetul nostru, și o listă de valori. De exemplu, mai jos este alt mod de a face unescape tuturor caracterelor HTML din recenziile noastre, folosind `batched=True`:
+
+```py
+new_drug_dataset = drug_dataset.map(
+    lambda x: {"review": [html.unescape(o) for o in x["review"]]}, batched=True
+)
+```
+
+Dacă executați acest cod într-un notebook, veți vedea că această comandă se execută mult mai rapid decât cea anterioră. Și nu pentru că recenziile noastre au fost deja HTML-unescaped – dacă reexecutați instrucția precedentă (fără `batched=True`), ea va lua același timp ca înainte. Acest lucru se datorează faptului că list comprehension sunt  mai rapide decât executarea aceluiași cod într-un `for` loop, și am câștigat, de asemenea, puțină performanțp accesând multe elemente în același timp, în loc unul câte unul.
+
+Folosirea `Dataset.map()` cu `batched=True` este esențială pentru a obțina viteza "rapidă" a tokenizerilor pe care îi vom întâlni în [Capitolul 6](/course/chapter6), care pot repede să facă tokenize listelor mari de texte. De exemplu, pentru a face tokenize tuturor recenziilor medicamentelor cu un tokenizer rapid, putem folosi o funcție ca aceasta:
+
+```py
+from transformers import AutoTokenizer
+
+tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
+
+
+def tokenize_function(examples):
+    return tokenizer(examples["review"], truncation=True)
+```
+
+Așa cum am văzut în [Capitolul 3](/course/chapter3), putem transmite un singur sau câteva exemple către tokenizer, așadar putem folosi această funcție cu sau fără `batched=True`. Hai să ne folosim de această oportunitate și să comparăm performanța diferitelor opțiuni. Într-un notebook puteți măsura timpul unei instrucțiie de o line prin adăugarea `%time` înaintea acelei linii de cod pe care doriți să o măsurați:
+
+```python no-format
+%time tokenized_dataset = drug_dataset.map(tokenize_function, batched=True)
+```
+
+Puteți și să măsurați un întreg cell prin scrierea `%%time` la începutul celulei. În hardware-ul pe care l-am executat, acest lucru a arătat 10.8s pentru această instrucție (este numărul scris după "Wall time").
+
+<Tip>
+
+✏️ **Încercați!** Executați aceeași instrucție cu și fără `batched=True`, apoi încercați-o cu un tokenizer lent (adaugați `use_fast=False` în metoda `AutoTokenizer.from_pretrained()`), astfel să puteți vedea ce numere obțineți pe hardwareul vostru.
+
+</Tip>
+
+Aici sunt rezultatele pe care le-am obținut cu și fără batching, folosind un tokenizer rapid și lent:
+
+Options         | Fast tokenizer | Slow tokenizer
+:--------------:|:--------------:|:-------------:
+`batched=True`  | 10.8s          | 4min41s
+`batched=False` | 59.2s          | 5min3s
+
+Aceasta înseamnă că utilizarea unui tokenizer rapid cu opțiunea `batched=True` este de 30 de ori mai rapidă decât varianta lentă fără batching - acest lucru este pur și simplu uimitor! Acesta este motivul principal pentru care tokenizerii rapizi sunt setați implicit când se utilizează `AutoTokenizer` (și de ce sunt numiți "rapizi"). Ei pot atinge o asemenea accelerație datorită faptului că codul de tokenizare este executat în Rust, care este un limbaj care facilitează paralelizarea execuției.
+
+Parallelization este și motivul pentru care tokenizerul rapid realizează o accelerare de aproape 6 ori cu batching: nu puteți paraleliza o singură operație de tokenizare, dar atunci când doriți să tokenizați multe texte în același timp, puteți să faceți split execuției pe mai multe procese, fiecare răspunzând pentru propriile texte.
+
+`Dataset.map()` are și o capacitate de parallelization proprie. Deoarece nu sunținute de Rust, nu pot să le ofere aceeași accelerație tokenizerilori înceți ca tokenizerilor rapizi, dar pot încă fi utili (în special dacă utilizați un tokenizer care nu are o variantă rapidă). Pentru a activa multiprocessingul, folosiți argumentul `num_proc` și specificați numărul de procese să fie utilizate în apelul `Dataset.map()`:
+
+```py
+slow_tokenizer = AutoTokenizer.from_pretrained("bert-base-cased", use_fast=False)
+
+
+def slow_tokenize_function(examples):
+    return slow_tokenizer(examples["review"], truncation=True)
+
+
+tokenized_dataset = drug_dataset.map(slow_tokenize_function, batched=True, num_proc=8)
+```
+
+Puteți experimenta puțin cu timpii pentru a determina numărul de procese optime; în cazul nostru 8 s-a dovedit a produce cea mai mare accelerație. Aici sunt rezultatele pe care le-am obținut cu și fără multiprocessing:
+
+Options         | Fast tokenizer | Slow tokenizer
+:--------------:|:--------------:|:-------------:
+`batched=True`  | 10.8s          | 4min41s
+`batched=False` | 59.2s          | 5min3s
+`batched=True`, `num_proc=8`  | 6.52s          | 41.3s
+`batched=False`, `num_proc=8` | 9.49s          | 45.2s
+
+Aceste rezultate sunt mult mai bune pentru tokenizerul lent, dar și performanța tokenizerului rapid a fost semnificativ îmbunătățită. Cu toate acestea, trebuie să reamintim că aceasta nu va fi întotdeauna cazul - testele noastre au arătat că este mai rapid să utilizați `batched=True` fără acest argument în cazurile în care valoarea lui `num_proc` diferă de 8. În general, nu vă recomandăm utilizarea multiplicării proceselor pentru tokenizorii rapizi cu `batched=True`.
+
+<tip>
+
+Utilizarea `num_proc` pentru a accelera procesarea este de obicei o idee excelentă, atâta timp cât funcția pe care o utilizați nu utilizează deja multiprocessing.
+
+</tip>
+
+Toate aceste funcționalități condensate într-o singură metodă este foarte impresionant, dar asta nu e totul! Cu `Dataset.map()` și `batched=True` puteți modifica numărul de elemente din datasetul dumneavoastră. Acesta este extrem de util în numeroase situații în care doriți să creați mai multe caracteristici de antrenare dintr-un singur exemplu, și vom avea nevoie de acest lucru ca parte a preprocesării pentru câteva dintre sarcinile NLP pe care le vom discuta în [Capitolul 7](/course/chapter7).
+
+<tip>
+
+💡 În machine learning, un _exemplu_ este de obicei definit ca fiind un set de _features_ care se oferă modelului. În unele contexte, acestea vor fi seturile de coloane dintr-un `Dataset`, dar în altele (ca și aici și pentru răspunderea la întrebări) mai multe caracteristici pot fi extrase dintr-un singur exemplu și să aparțină unei singure coloane.
+
+</tip>
+
+Hai să vedem cum funcționează! Aici vom tokeniza exemplele și le vom face truncatela lungimea maximă de 128, dar vom cere tokenizerului să returneze *toate* chunkurile de text în loc de prima. Acest lucru poate fi făcut cu `return_overflowing_tokens=True`:
+
+```py
+def tokenize_and_split(examples):
+    return tokenizer(
+        examples["review"],
+        truncation=True,
+        max_length=128,
+        return_overflowing_tokens=True,
+    )
+```
+
+Hai să testăm acest lucru pe un exemplu înainte de a folosi `Dataset.map()` pentru întreg datasetul:
+
+```py
+result = tokenize_and_split(drug_dataset["train"][0])
+[len(inp) for inp in result["input_ids"]]
+```
+
+```python out
+[128, 49]
+```
+
+Așadar, primul nostru exemplu din setul de antrenare a devenit două features pentru că a fost tokenizat mai mult decât lungimea maximă de tokenuri pe care am specificat-o: prima cu lungimea 128 și a doua cu lungimea 49. Acum trebuie să facem acest lucru pentru toate elementele din dataset!
+
+```py
+tokenized_dataset = drug_dataset.map(tokenize_and_split, batched=True)
+```
+
+```python out
+ArrowInvalid: Column 1 named condition expected length 1463 but got length 1000
+```
+
+Oh no! Acesta nu a funcționat! De ce? Citind eroarea vom afla motivul: existența unei incompatibilități în lungimea uneia dintre coloane - una cu o lungime de 1,463 și alta de 1,000. Dacă ați privit [documentația](https://huggingface.co/docs/datasets/package_reference/main_classes#datasets.Dataset.map) Dataset.map(), puteți să vă reamintiți că este numărul de sampleuri care sunt oferite funcției pe care noi le facem mapping; aici aceste 1,000 exemplare creează 1,463 features noi, ceea ce duce la un shape error.
+
+Problema este că încercăm să amestecăm două dataseturi cu mărimi diferite: coloanele `drug_dataset` vor avea un număr determinat de exemple (cele 1,000 din eroare), dar `tokenized_dataset` pe care îl construim va fi mai mare (cel cu 1,463 din eroare; el este mai mare decât 1,000 pentru că tokenizăm reviewrile lungi în mai multe exemple folosind `return_overflowing_tokens=True`). Acest lucru nu funcționează pentru un `Dataset`, așadar trebuie să eliminăm sau să modificămm coloanele din datasetul vechi pentru a se potrivi dimensiunea cu cea din noul dataset. Putem face ultima din cele două opțiuni folosind argumentul `remove_columns`:
+
+```py
+tokenized_dataset = drug_dataset.map(
+    tokenize_and_split, batched=True, remove_columns=drug_dataset["train"].column_names
+)
+```
+
+Acum acest lucru funcționează fără erori. Putem verifica că noul dataset are mai multe elemente decât datasetul original prin compararea lungimilor:
+
+```py
+len(tokenized_dataset["train"]), len(drug_dataset["train"])
+```
+
+```python out
+(206772, 138514)
+```
+
+Am menționat că putem rezolva problema lungimilor diferite are coloanelor prin schimbarea vechilor coloane la aceeași dimensiune cu cele noi. Pentru aceasta, vom avea nevoie de câmpul `overflow_to_sample_mapping` returnat de tokenizer atunci când setăm `return_overflowing_tokens=True`. El ne oferă un mapping de la un nou feature index la indicele sampleului din care a provenit. Prin intermediul acesta, putem asocia fiecărei key prezentă în datasetul original cu o listă de valori de dimensiune corectă prin repetarea valorilor fiecărui exemplu atâta timp cât produce caracteristici noi:
+
+```py
+def tokenize_and_split(examples):
+    result = tokenizer(
+        examples["review"],
+        truncation=True,
+        max_length=128,
+        return_overflowing_tokens=True,
+    )
+    # Extragem maparea între noul și vechiul indice
+    sample_map = result.pop("overflow_to_sample_mapping")
+    for key, values in examples.items():
+        result[key] = [values[i] for i in sample_map]
+    return result
+```
+
+Putem observa că funcționează cu `Dataset.map()` fără ca noi să avem nevoie să eliminăm coloanele vechi:
+
+```py
+tokenized_dataset = drug_dataset.map(tokenize_and_split, batched=True)
+tokenized_dataset
+```
+
+```python out
+DatasetDict({
+    train: Dataset({
+        features: ['attention_mask', 'condition', 'date', 'drugName', 'input_ids', 'patient_id', 'rating', 'review', 'review_length', 'token_type_ids', 'usefulCount'],
+        num_rows: 206772
+    })
+    test: Dataset({
+        features: ['attention_mask', 'condition', 'date', 'drugName', 'input_ids', 'patient_id', 'rating', 'review', 'review_length', 'token_type_ids', 'usefulCount'],
+        num_rows: 68876
+    })
+})
+```
+
+Obținem același număr de features training ca și înainte, dar acum am păstrat toate câmpurile vechi. Dacă ai nevoie de ele pentru post-procesare după aplicarea modelului, ar fi util să folosiți această abordare.
+
+Acum ați învățat cum pot fi utilizate 🤗 Datasets pentru preprocesarea datelor prin metode diferite. Deși funcțiile de preprocesare ale 🤗 Datasets vor acoperi majoritatea nevoilor de antrenare a modelului,
+există momente în care veți avea nevoie să treceți la Pandas pentru accesul la caracteristici mai puternice, cum ar fi `DataFrame.groupby()` sau high-level APIs pentru vizualizare. Din fericire, 🤗 Dataset a fost proiectat astfel încât să fie interoperabil cu biblioteci precum Pandas, NumPy, PyTorch, TensorFlow și JAX. Hai să vedem cum se face acest lucru.
+
+## De la `Dataset`s la `DataFrame`s și înapoi[[from-datasets-to-dataframes-and-back]]
+
+<Youtube id="tfcY1067A5Q"/>
+
+Pentru a permite conversia între diferite biblioteci, 🤗 Datasets oferă o funcțiune `Dataset.set_format()`. Această funcție schimbă doar _output format_ al datasetului, deci puteți ușor să treceți la un alt format fără a afecta _data format_ de bază, care este Apache Arrow. Formatarea se face direct. Pentru a demonstra acest lucru, hai să convertim datasetul nostru în Pandas:
+
+```py
+drug_dataset.set_format("pandas")
+```
+
+Acum, atunci când accesăm elementele din dataset, obținem `pandas.DataFrame` în loc de un dicționar:
+
+```py
+drug_dataset["train"][:3]
+```
+
+<table border="1" class="dataframe">
+  <thead>
+    <tr style="text-align: right;">
+      <th></th>
+      <th>patient_id</th>
+      <th>drugName</th>
+      <th>condition</th>
+      <th>review</th>
+      <th>rating</th>
+      <th>date</th>
+      <th>usefulCount</th>
+      <th>review_length</th>
+    </tr>
+  </thead>
+  <tbody>
+    <tr>
+      <th>0</th>
+      <td>95260</td>
+      <td>Guanfacine</td>
+      <td>adhd</td>
+      <td>"My son is halfway through his fourth week of Intuniv..."</td>
+      <td>8.0</td>
+      <td>April 27, 2010</td>
+      <td>192</td>
+      <td>141</td>
+    </tr>
+    <tr>
+      <th>1</th>
+      <td>92703</td>
+      <td>Lybrel</td>
+      <td>birth control</td>
+      <td>"I used to take another oral contraceptive, which had 21 pill cycle, and was very happy- very light periods, max 5 days, no other side effects..."</td>
+      <td>5.0</td>
+      <td>December 14, 2009</td>
+      <td>17</td>
+      <td>134</td>
+    </tr>
+    <tr>
+      <th>2</th>
+      <td>138000</td>
+      <td>Ortho Evra</td>
+      <td>birth control</td>
+      <td>"This is my first time using any form of birth control..."</td>
+      <td>8.0</td>
+      <td>November 3, 2015</td>
+      <td>10</td>
+      <td>89</td>
+    </tr>
+  </tbody>
+</table>
+
+În continuare, vom crea un `pandas.DataFrame` pentru întregul set de antrenare prin selectarea tuturor elementelor din `drug_dataset["train"]`:
+
+```py
+train_df = drug_dataset["train"][:]
+```
+
+<Tip>
+
+🚨 În spatele scenei, `Dataset.set_format()` schimbă formatul returnat pentru  `__getitem__()` dunder method a datasetului. Asta înseamnă că atunci când dorim să creăm un nou obiect ca `train_df` dintr-un `Dataset` în formatul `"pandas"`, trebuie să tăiem întreg datasetul pentru a obține un `pandas.DataFrame`. Puteți verifica voi înşivă că tipul lui `drug_dataset["train"]` este `Dataset`, indiferent de output format.
+
+</Tip>
+
+Acum putem utiliza toate funcționalitățile Pandas pe care le dorim. De exemplu, putem face fancy chaining pentru a calcula distribuția clasei printre intrările `condition`:
+
+```py
+frequencies = (
+    train_df["condition"]
+    .value_counts()
+    .to_frame()
+    .reset_index()
+    .rename(columns={"index": "condition", "condition": "frequency"})
+)
+frequencies.head()
+```
+
+<table border="1" class="dataframe">
+  <thead>
+    <tr style="text-align: right;">
+      <th></th>
+      <th>condition</th>
+      <th>frequency</th>
+    </tr>
+  </thead>
+  <tbody>
+    <tr>
+      <th>0</th>
+      <td>birth control</td>
+      <td>27655</td>
+    </tr>
+    <tr>
+      <th>1</th>
+      <td>depression</td>
+      <td>8023</td>
+    </tr>
+    <tr>
+      <th>2</th>
+      <td>acne</td>
+      <td>5209</td>
+    </tr>
+    <tr>
+      <th>3</th>
+      <td>anxiety</td>
+      <td>4991</td>
+    </tr>
+    <tr>
+      <th>4</th>
+      <td>pain</td>
+      <td>4744</td>
+    </tr>
+  </tbody>
+</table>
+
+
+Și odată ce suntem gata cu analiza noastră Pandas, putem crea întotdeauna un nou obiect `Dataset` prin utilizarea funcției `Dataset.from_pandas()`:
+
+
+```py
+from datasets import Dataset
+
+freq_dataset = Dataset.from_pandas(frequencies)
+freq_dataset
+```
+
+```python out
+Dataset({
+    features: ['condition', 'frequency'],
+    num_rows: 819
+})
+```
+
+
+<Tip>
+
+✏️ **Încercați!** Calculați media ratingului per medicament și salvați rezultatul într-un nou `Dataset`.
+
+</Tip>
+
+
+Acest lucru completează turul nostru de tehnici de preprocesare disponibile în 🤗 Datasets. Pentru a finisa secțiunea, vom crea un set de validare pentru a pregăti datasetul pentru antrenarea unui clasificator. Înainte de a face asta, noi vom reseta output formatul `drug_dataset` de la `"pandas"` la `"arrow" :
+
+
+```python
+drug_dataset.reset_format()
+```
+
+## Crearea unui set de validare [[creating-a-validation-set]]
+
+Deși avem deja un set de testare pe care îl putem folosi pentru evaluare, este o bună practică să lăsăm setul de test neschimbat și să creăm un set de validare în timpul developmentului. Odată ce sunteți fericiți cu performanța modelului pe setul de validare, puteți face o verificare finală a setului de test. Acest proces ajută la reducerea riscului ca să vă adaptați prea mult setul de test și să depuneți un model care poate eșua analizând date reale.
+
+🤗 Datasets oferă o funcție `Dataset.train_test_split()` bazată pe funcționalitatea celebră din `scikit-learn`. O vom folosi pentru a împărți setul nostru de antrenare în split-uri de `train` și `validation` (setăm argumentul `seed` pentru reproductabilitate):
+
+```python
+drug_dataset_clean = drug_dataset["train"].train_test_split(train_size=0.8, seed=42)
+# Renumește implicit "test" split-ul la "valide"
+drug_dataset_clean["validation"] = drug_dataset_clean.pop("test")
+# Adaugă setul de test în `DatasetDict`
+drug_dataset_clean["test"] = drug_dataset["test"]
+drug_dataset_clean
+```
+
+```python out
+DatasetDict({
+    train: Dataset({
+        features: ['patient_id', 'drugName', 'condition', 'review', 'rating', 'date', 'usefulCount', 'review_length', 'review_clean'],
+        num_rows: 110811
+    })
+    validation: Dataset({
+        features: ['patient_id', 'drugName', 'condition', 'review', 'rating', 'date', 'usefulCount', 'review_length', 'review_clean'],
+        num_rows: 27703
+    })
+    test: Dataset({
+        features: ['patient_id', 'drugName', 'condition', 'review', 'rating', 'date', 'usefulCount', 'review_length', 'review_clean'],
+        num_rows: 46108
+    })
+})
+```
+
+Foarte bine, am pregătit acum un dataset care este gata pentru antrenarea unor modele! În [Secțiunea 5](/course/chapter5/5) vom arăta cum puteți încărca seturile de date în Hugging Face Hub, dar în acest moment hai să punem capăt analizei noastre prin examinarea a câteva modalități de salvare a seturilor de date pe dispozitivele locale.
+
+## Salvarea unui dataset[[saving-a-dataset]]
+
+<Youtube id="blF9uxYcKHo"/>
+
+Deși 🤗 Datasets va face cache fiecărui dataset și a operațiilor efectuate asupra acestuia, există momente în care veți dori să salvați un dataset pe disc (de exemplu, în cazul în care cache-ul se șterge). După cum vedeți în tabelul de mai jos, 🤗 Datasets oferă trei funcții principale pentru salvarea datelor în formate diferite:
+
+| Format de date | Funcție |
+| :---------: | :--------------------: |
+|    Arrow    | `Dataset.save_to_disk()` |
+|     CSV     |    `Dataset.to_csv()`    |
+|    JSON     |   `Dataset.to_json()`    |
+
+Spre exemplu, hai să salvăm datasetul nostru curățat în formatul Arrow:
+
+```python
+drug_dataset_clean.save_to_disk("drug-reviews")
+```
+
+Acest lucru va crea un folder cu următoarea structură:
+
+```
+drug-reviews/
+├── dataset_dict.json
+├── test
+│   ├── dataset.arrow
+│   ├── dataset_info.json
+│   └── state.json
+├── train
+│   ├── dataset.arrow
+│   ├── dataset_info.json
+│   ├── indices.arrow
+│   └── state.json
+└── validation
+    ├── dataset.arrow
+    ├── dataset_info.json
+    ├── indices.arrow
+    └── state.json
+```
+
+unde se poate vedea că fiecare split este asociat cu propriul său tabel `dataset.arrow`, iar unele metadate în `dataset_info.json` și `state.json`. Poți să te gândești la formatul Arrow ca fiind un tabel facny de coloane și rânduri, optimizat pentru construirea aplicațiilor high-performance care procesează și transportă dataseturi mari.
+
+Odată ce setul de date este salvat, putem încărca-o folosind funcția `load_from_disk()` următoarea:
+
+```py
+from datasets import load_from_disk
+
+drug_dataset_reloaded = load_from_disk("drug-reviews")
+drug_dataset_reloaded
+```
+
+```python out
+DatasetDict({
+    train: Dataset({
+        features: ['patient_id', 'drugName', 'condition', 'review', 'rating', 'date', 'usefulCount', 'review_length'],
+        num_rows: 110811
+    })
+    validation: Dataset({
+        features: ['patient_id', 'drugName', 'condition', 'review', 'rating', 'date', 'usefulCount', 'review_length'],
+        num_rows: 27703
+    })
+    test: Dataset({
+        features: ['patient_id', 'drugName', 'condition', 'review', 'rating', 'date', 'usefulCount', 'review_length'],
+        num_rows: 46108
+    })
+})
+```
+
+Pentru formatele CSV și JSON, trebuie să stocați fiecare split într-un fișier separat. Un mod de a face acest lucru estw iterarea asupra cheilor și valorilor obiectului `DatasetDict`:
+
+```py
+for split, dataset in drug_dataset_clean.items():
+    dataset.to_json(f"drug-reviews-{split}.jsonl")
+```
+
+Acesta salvează fiecare split în [JSON Lines format](https://jsonlines.org), unde fiecare rând din setul de date este stocat ca o singură linie JSON. Aici puteți vedea cum arată primul exemplu:
+
+```bash
+!head -n 1 drug-reviews-train.jsonl
+```
+
+```python out
+{"patient_id":141780,"drugName":"Escitalopram","condition":"depression","review":"\"I seemed to experience the regular side effects of LEXAPRO, insomnia, low sex drive, sleepiness during the day. I am taking it at night because my doctor said if it made me tired to take it at night. I assumed it would and started out taking it at night. Strange dreams, some pleasant. I was diagnosed with fibromyalgia. Seems to be helping with the pain. Have had anxiety and depression in my family, and have tried quite a few other medications that haven't worked. Only have been on it for two weeks but feel more positive in my mind, want to accomplish more in my life. Hopefully the side effects will dwindle away, worth it to stick with it from hearing others responses. Great medication.\"","rating":9.0,"date":"May 29, 2011","usefulCount":10,"review_length":125}
+```
+
+Putem apoi folosi tehnicile de la [Secțiunea 2](/course/chapter5/2) pentru încărcarea fișierelor JSON:
+
+```py
+data_files = {
+    "train": "drug-reviews-train.jsonl",
+    "validation": "drug-reviews-validation.jsonl",
+    "test": "drug-reviews-test.jsonl",
+}
+drug_dataset_reloaded = load_dataset("json", data_files=data_files)
+```
+
+Și ăsta este finalul excursiei noastre în lumea manipulării datelor cu 🤗 Datasets! Acum că avem un dataset curat, pregătit pentru antrenarea unui model, aici sunt câteva idei pe care le puteți încerca:
+
+1. Folosiți tehnicile din [Capitolul 3](/course/chapter3) pentru a antrena un classifier care poate prezice starea pacientului pe baza recenziei medicamentului.
+2. Folosiți pipelineul `summarization` din [Capitolul 1](/course/chapter1) pentru a genera rezumate ale recenziilor.
+
+În următoarea secțiune, vom vedea cum 🤗 Datasets vă permite să lucrați cu dataseturi mari fără ca laptopul tău să explodeze :)!
\ No newline at end of file
diff --git a/chapters/ro/chapter5/4.mdx b/chapters/ro/chapter5/4.mdx
new file mode 100644
index 000000000..a1261153b
--- /dev/null
+++ b/chapters/ro/chapter5/4.mdx
@@ -0,0 +1,287 @@
+# Big data?🤗 Datasets îți vin în ajutor![[big-data-datasets-to-the-rescue]]
+
+<CourseFloatingBanner chapter={5}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[ 
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter5/section4.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter5/section4.ipynb"},
+]} />
+
+În prezent, nu este de neașteptat să te confrunți cu dataseturi de câțiva gigabytes, mai ales dacă planifici să preantreenezi un transformer ca BERT sau GPT-2 de la zero. În aceste cazuri, chiar _loading_ a datelor poate fi o provocare. De exemplu, corpusul WebText folosit pentru a preantreena GPT-2 conține peste 8 milioane de documente și 40 GB de text – încărcarea acestuia în memoria RAM a laptopului tău este probabil să-i facă un atac cardiac!
+
+Norocul este că Datasets 🤗 a fost proiectat pentru a depăși aceste limitări. El te eliberează de problemele de gestionare a memoriei, tratarea dataseturilor ca fișiere _memory-mapped_, și limitele hard driveului prin _streamingul_ intrărilor dintr-un corpus.
+
+<Youtube id="JwISwTCPPWo"/>
+
+În această secțiune vom explora aceste caracteristici ale 🤗Datasets cu un corpus de 825 GB numit [Pile](https://pile.eleuther.ai). Să începem!
+
+## Ce este Pile?[[what-is-the-pile]]
+
+Pile este un corpus de text englezesc creat de [EleutherAI](https://www.eleuther.ai) pentru antrenarea large-scale language models. Acesta include o varietate diversă de dataseturi, cuprinzând articole științifice, repositoriuri GitHub și texte web filtrate. Corpusul de antrenare este disponibil în chunkuri de [14 GB](https://the-eye.eu/public/AI/pile/), dar în același timp puteți descărca și câteva dintre [componenetele 
+individuale](https://the-eye.eu/public/AI/pile_preliminary_components/). Să începem prin examinarea datasetului PubMed Abstracts, care este un corpus de rezumate din 15 milioane de publicații științifice biomedicale de pe [PubMed](https://pubmed.ncbi.nlm.nih.gov/). Datasetul este în format JSON și este comprimat cu librăria `zstandard`, așadar prima dată ne trebuie să o instalăm pe aceasta:
+
+```py
+!pip install zstandard
+```
+
+În continuare, putem încărca datasetul utilizând metoda pentru fișierele remote pe care am învățat-o în [secțiunea 2](/course/chapter5/2):
+
+```py
+from datasets import load_dataset
+
+# Acest lucru durează câteva minute, așadar poți să te duci să îți iei un ceai sau o cafea între timp :))
+data_files = "https://the-eye.eu/public/AI/pile_preliminary_components/PUBMED_title_abstracts_2019_baseline.jsonl.zst"
+pubmed_dataset = load_dataset("json", data_files=data_files, split="train")
+pubmed_dataset
+```
+
+```python out
+Dataset({
+    features: ['meta', 'text'],
+    num_rows: 15518009
+})
+```
+
+Putem observa că există 15.518.009 de linii și două colonne în datasetul nostru – e foarte mult!
+
+<Tip>
+
+✎ De abia acum, 🤗 Datasets va descompresa fișierele necesare pentru încărcarea datasetului. Dacă doriți vreei să salvezi spațiu pe hard driveul tău, puteți transmite `DownloadConfig(delete_extracted=True)` la argumentul `download_config` al `load_dataset()`. Vedeți mai multe detalii în [documentație](https://huggingface.co/docs/datasets/package_reference/builder_classes#datasets.DownloadConfig).
+
+</Tip>
+
+Acum hai să analizăm conținutul primei linii:
+
+```py
+pubmed_dataset[0]
+```
+
+```python out
+{'meta': {'pmid': 11409574, 'language': 'eng'},
+ 'text': 'Epidemiology of hypoxaemia in children with acute lower respiratory infection.\nTo determine the prevalence of hypoxaemia in children aged under 5 years suffering acute lower respiratory infections (ALRI), the risk factors for hypoxaemia in children under 5 years of age with ALRI, and the association of hypoxaemia with an increased risk of dying in children of the same age ...'}
+```
+
+Okay, acesta pare a fi un rezumat dintr-un articol medical. Să vedem cât de mult spațiu RAM am folosit pentru încărcarea datasetului!
+
+## Magia memory mappingului[[the-magic-of-memory-mapping]]
+
+Una dintre modalitățile simple de măsurare a utilizării memoriei în Python este cu biblioteca `psutil`, care poate fi instalată cu `pip`:
+
+```python
+!pip install psutil
+```
+
+Biblioteca oferă o clasă `Process` ce ne permite să verificăm utilizarea memoriei procesului curent astfel:
+
+```py
+import psutil
+
+# Process.memory_info este exprimat în bytes, așadar convertim la megabyte
+print(f"Utilizare RAM: {psutil.Process().memory_info().rss / (1024 * 1024):.2f} MB")
+```
+
+```python out
+Utilizarea RAM: 5678.33 MB
+```
+
+Aici `rss` se referă la _resident set size_ , care este partea memoriei ocupată de proces în RAM. Această măsurare include și memoria folosită de Python interpreter și librariile pe care le-am încărcat, așadar cantitatea reală de memorie utilizată pentru încărcarea datelor este puțin mai mică. Pentru comparație, putem să vedem cât de mare este datasetul pe disc folosind atributul `dataset_size`. Deoarece rezultatul este exprimat în bytes, putem să îl convertim manual la gigabyte:
+
+```py
+print(f"Number of files in dataset : {pubmed_dataset.dataset_size}")
+size_gb = pubmed_dataset.dataset_size / (1024**3)
+print(f"Dataset size (cache file) : {size_gb:.2f} GB")
+```
+
+```python out
+Number of files in dataset : 20979437051
+Dataset size (cache file) : 19.54 GB
+```
+
+
+Nice – deși este aproximativ 20 GB, putem încărca și accesa datasetul cu mult mai puțin RAM!
+
+<Tip>
+
+✏️ **Încercați!** Alegeți una dintre [subseturile](https://the-eye.eu/public/AI/pile_preliminary_components/) din Pile care este mai mare decât memoria RAM a laptopului sau dispozitivului tău, încărcați-o cu 🤗 Datasets și măsurați cantitatea de memorie folosită. Pentru o măsurare precisă, veți dori să faceți acest lucru într-un proces nou. Puteți găsi dimensiunile decomprimate ale fiecărui subset în Tabelul 1 din [Pile paper](https://arxiv.org/abs/2101.00027). 
+
+</Tip>
+
+Dacă sunteți familiarizați cu Pandas, rezultatul acesta poate veni ca o surpriză din cauza celebrei [rule of thumbă](https://wesmckinney.com/blog/apache-arrow-pandas-internals/) al lui Wes Kinney, care spune că în mod normal aveți nevoie de 5 până la 10 ori mai mult spațiu pe RAM decât mărimea datasetului. Deci 🤗 Datasets această problemă de memory management? 🤗 Datasets tratează fiecare dataset ca un [memory-mapped file](https://en.wikipedia.org/wiki/Memory-mapped_file), care oferă un mapping între spațiul RAM și stocarea pe sistem, ceea ce permite bibliotecii să acceseze și să opereze asupra elementelor datasetului fără a trebui să-l încarce în totalitate în memorie.
+
+Memory-mapped files pot fi și distribuite între mai multe procese, ceea ce permite metodelor cum ar fi `Dataset.map()` să fie parallelized fără necesitatea mutării sau copierii datasetului. În spatele acestor facilități se află [formatul de memorie Apache Arrow](https://arrow.apache.org) și biblioteca [`pyarrow`](https://arrow.apache.org/docs/python/index.html), care realizează încărcarea datelor și procesarea la viteze fulgerătoare. (Pentru mai multe detalii despre Apache Arrow și compararea sa cu Pandas, vă rugăm să citiți [blogul lui Dejan Simic](https://towardsdatascience.com/apache-arrow-read-dataframe-with-zero-memory-69634092b1a).) Pentru a vedea acest lucru în acțiune, hai să încercăm un speed test prin iterarea asupra tuturor elementelor din datasetul PubMed Abstracts:
+
+```py
+import timeit
+
+code_snippet = """batch_size = 1000
+
+for idx in range(0, len(pubmed_dataset), batch_size):
+    _ = pubmed_dataset[idx:idx + batch_size]
+"""
+
+time = timeit.timeit(stmt=code_snippet, number=1, globals=globals())
+print(
+    f"Iterated over {len(pubmed_dataset)} examples (about {size_gb:.1f} GB) in "
+    f"{time:.1f}s, i.e. {size_gb/time:.3f} GB/s"
+)
+```
+
+```python out
+'Iterated over 15518009 examples (about 19.5 GB) in 64.2s, i.e. 0.304 GB/s'
+```
+
+Aici am folosit modulul `timeit` al Python pentru a măsura timpul de execuție necesar pentru a rula `code_snippet`. În mod normal veți putea trece peste un dataset la viteze de câteva sute de MB/s până la câțiva GB/s. Acest lucru funcționează bine pentru majoritatea aplicațiilor, dar uneori veți avea nevoie să lucrați cu un dataset care este prea mare ca să încapă pe hard driveul laptopului tău. De exemplu, dacă am încerca să descarcăm Pile în întregime, am avea nevoie de 825 GB de spațiu liber! Pentru a vă ajuta cu astfel de cazuri, 🤗 Datasets oferă o feature de streaming care permite accesarea și descărcarea elementelor, fără a trebui să descărcați întregul dataset. Hai să vedem cum funcționează!
+
+<Tip>
+
+💡În Jupyter notebooks poți să măsori timpul unei celule utilizând [funcția magică `%%timeit`](https://ipython.readthedocs.io/en/stable/interactive/magics.html#magic-timeit).
+
+</Tip>
+
+## Streamingul dataseturilor[[streaming-datasets]]
+
+Pentru a activa dataset streaming este suficient să dați argumentul `streaming=True` funcției `load_dataset()`. De exemplu, să încercăm să încărcăm datasetul PubMed Abstracts în streaming mode:
+
+```py
+pubmed_dataset_streamed = load_dataset(
+    "json", data_files=data_files, split="train", streaming=True
+)
+```
+
+În locul `Dataset`-ului obișnuit pe care l-am întâlnit până acum în acest capitol, obiectul returnat cu `streaming=True` este un `IterableDataset`. După nume putem deduce că pentru a accesa elementele dintr-un `IterableDataset`, trebuie să iterăm prin el. Prin urmare, putem accesa primul element al streamed datased astfel:
+
+```py
+next(iter(pubmed_dataset_streamed))
+```
+
+```python out
+{'meta': {'pmid': 11409574, 'language': 'eng'},
+ 'text': 'Epidemiology of hypoxaemia in children with acute lower respiratory infection.\nTo determine the prevalence of hypoxaemia in children aged under 5 years suffering acute lower respiratory infections (ALRI), the risk factors for hypoxaemia in children under 5 years of age with ALRI, and the association of hypoxaemia with an increased risk of dying in children of the same age ...'}
+```
+
+Elementele unui streamed dataset pot fi procesate din mers folosind `IterableDataset.map()`, ceea ce este util în timpul antrenării dacă aveți nevoie să tokenizeți inputurile. Procesarea se face exact la fel ca și în [Capitolul 3](/course/chapter3), cu singura deosebire fiind că rezultatele sunt returnate una câte una:
+
+```py
+from transformers import AutoTokenizer
+
+tokenizer = AutoTokenizer.from_pretrained("distilbert-base-uncased")
+tokenized_dataset = pubmed_dataset_streamed.map(lambda x: tokenizer(x["text"]))
+next(iter(tokenized_dataset))
+```
+
+```python out
+{'input_ids': [101, 4958, 5178, 4328, 6779, ...], 'attention_mask': [1, 1, 1, 1, 1, ...]}
+```
+
+<Tip>
+
+💡 Pentru a accelera tokenizarea cu streaming puteți seta `batched=True`, ca și în secțiunea precedentă. Acest lucru va procesa exemplele, batch cu batch; dimensiunea implicită a batchului este de 1,000 și poate fi specificată cu argumentul `batch_size`.
+
+</Tip>
+
+De asemenea, puteți amesteca un streamed dataset utilizând `IterableDataset.shuffle()`, dar față de `Dataset.shuffle()` acest lucru va amesteca doar elementele dintr-un `buffer_size` predefinit:
+
+```py
+shuffled_dataset = pubmed_dataset_streamed.shuffle(buffer_size=10_000, seed=42)
+next(iter(shuffled_dataset))
+```
+
+```python out
+{'meta': {'pmid': 11410799, 'language': 'eng'},
+ 'text': 'Randomized study of dose or schedule modification of granulocyte colony-stimulating factor in platinum-based chemotherapy for elderly patients with lung cancer ...'}
+```
+
+În acest exemplu, am selectat un exemplu aleatoriu din primele 10,000 exemple din buffer. Odată ce un exemplu este accesat, locul lui în buffer este completat cu următorul exemplu din corpus (adica exemplarul 10,001 în cazul de mai sus). Puteți selecta elemente dintr-un streamed dataset utilizând funcțiile `IterableDataset.take()` și `IterableDataset.skip()`, care acționează în mod similar cu `Dataset.select()`. De exemplu, pentru a selecta primele 5 exemple din PubMed Abstracts dataset putem face următorul lucru:
+
+```py
+dataset_head = pubmed_dataset_streamed.take(5)
+list(dataset_head)
+```
+
+```python out
+[{'meta': {'pmid': 11409574, 'language': 'eng'},
+  'text': 'Epidemiology of hypoxaemia in children with acute lower respiratory infection ...'},
+ {'meta': {'pmid': 11409575, 'language': 'eng'},
+  'text': 'Clinical signs of hypoxaemia in children with acute lower respiratory infection: indicators of oxygen therapy ...'},
+ {'meta': {'pmid': 11409576, 'language': 'eng'},
+  'text': "Hypoxaemia in children with severe pneumonia in Papua New Guinea ..."},
+ {'meta': {'pmid': 11409577, 'language': 'eng'},
+  'text': 'Oxygen concentrators and cylinders ...'},
+ {'meta': {'pmid': 11409578, 'language': 'eng'},
+  'text': 'Oxygen supply in rural africa: a personal experience ...'}]
+```
+
+În mod similar puteți utiliza funcția `IterableDataset.skip()` pentru a crea splituri de antrenare și validare dintr-un set de date amestecat astfel:
+
+```py
+# Săriți primele 1,000 exemple și includeți restul în setul de antrenare
+train_dataset = shuffled_dataset.skip(1000)
+# Luați primele 1,000 de exemple pentru setul de validare
+validation_dataset = shuffled_dataset.take(1000)
+```
+
+Hai să terminăm explorarea streamingului asupra datasetului cu o aplicație comună: combinarea multiplelor dataseturi împreună pentru a crea un singur corpus. 🤗 Datasets oferă o funcție `interleave_datasets()` care convertește o listă de obiecte `IterableDataset` într-un singur `IterableDataset`, unde elementele noului datasetsunt obținute prin alternarea între exemplele sursă. Această funcție este utilă, în special atunci când încercați să combinați dataseturi mari, ca exemplu vom face stream al subsetul FreeLaw din Pile, care reprezintă un dataset de 51 GB de opinii juridice din instanțe din SUA:
+
+```py
+law_dataset_streamed = load_dataset(
+    "json",
+    data_files="https://the-eye.eu/public/AI/pile_preliminary_components/FreeLaw_Opinions.jsonl.zst",
+    split="train",
+    streaming=True,
+)
+next(iter(law_dataset_streamed))
+```
+
+```python out
+{'meta': {'case_ID': '110921.json',
+  'case_jurisdiction': 'scotus.tar.gz',
+  'date_created': '2010-04-28T17:12:49Z'},
+ 'text': '\n461 U.S. 238 (1983)\nOLIM ET AL.\nv.\nWAKINEKONA\nNo. 81-1581.\nSupreme Court of United States.\nArgued January 19, 1983.\nDecided April 26, 1983.\nCERTIORARI TO THE UNITED STATES COURT OF APPEALS FOR THE NINTH CIRCUIT\n*239 Michael A. Lilly, First Deputy Attorney General of Hawaii, argued the cause for petitioners. With him on the brief was James H. Dannenberg, Deputy Attorney General...'}
+```
+
+Această dataset este suficient de mare încât să pună presiune asupra RAM-ului a majorității laptopurilor, dar am reușit să îl încarcăm și să îl accesăm fără să ne facem griji. Acum hai să combinăm exemplele din dataseturile FreeLaw și PubMed Abstracts cu funcția `interleave_datasets()`:
+
+```py
+from itertools import islice
+from datasets import interleave_datasets
+
+combined_dataset = interleave_datasets([pubmed_dataset_streamed, law_dataset_streamed])
+list(islice(combined_dataset, 2))
+```
+
+```python out
+[{'meta': {'pmid': 11409574, 'language': 'eng'},
+  'text': 'Epidemiology of hypoxaemia in children with acute lower respiratory infection ...'},
+ {'meta': {'case_ID': '110921.json',
+   'case_jurisdiction': 'scotus.tar.gz',
+   'date_created': '2010-04-28T17:12:49Z'},
+  'text': '\n461 U.S. 238 (1983)\nOLIM ET AL.\nv.\nWAKINEKONA\nNo. 81-1581.\nSupreme Court of United States.\nArgued January 19, 1983.\nDecided April 26, 1983.\nCERTIORARI TO THE UNITED STATES COURT OF APPEALS FOR THE NINTH CIRCUIT\n*239 Michael A. Lilly, First Deputy Attorney General of Hawaii, argued the cause for petitioners. With him on the brief was James H. Dannenberg, Deputy Attorney General...'}]
+```
+
+Aici am folosit funcția `islice()` din modulul Python `itertools` pentru a selecta primele două exemple din datasetul combinat, și putem vedea că acestea corespund primelor exemple din fiecare dintre cele două dataseturi originale.
+
+În final, dacă doriți să faceți streaming la Pile în întregime (825 GB), puteți rula toate fișierele pregătite după în acest mod:
+
+```py
+base_url = "https://the-eye.eu/public/AI/pile/"
+data_files = {
+    "train": [base_url + "train/" + f"{idx:02d}.jsonl.zst" for idx in range(30)],
+    "validation": base_url + "val.jsonl.zst",
+    "test": base_url + "test.jsonl.zst",
+}
+pile_dataset = load_dataset("json", data_files=data_files, streaming=True)
+next(iter(pile_dataset["train"]))
+```
+
+```python out
+{'meta': {'pile_set_name': 'Pile-CC'},
+ 'text': 'It is done, and submitted. You can play “Survival of the Tastiest” on Android, and on the web...'}
+```
+
+<Tip>
+
+✏️ **Încercați!** Utilizați unul dintre cele mari corpusuri Common Crawl ca [`mc4`](https://huggingface.co/datasets/mc4) sau [`oscar`](https://huggingface.co/datasets/oscar) pentru a crea un streaming dataset multilingv care reprezintă proporția limbii vorbite într-o țară aleasă de tine. De exemplu, cele patru limbi naționale din Elveția sunt germana, franceza, italiana și romansha, așadar puteți încerca să creați un corpus elvețian prin samplingul subseturilor Oscar în funcție de proporția lor vorbită.
+
+</Tip>
+
+Acum aveți toate instrumentele necesare pentru a încărca și procesa dataseturi de orice formă și dimensiune – dar, din păcate, va veni un moment în care veți trebui să creați voi înșivă un dataset pentru a rezolva problema pe care o aveți. Acesta este subiectul următoarei secțiuni!
diff --git a/chapters/ro/chapter5/5.mdx b/chapters/ro/chapter5/5.mdx
new file mode 100644
index 000000000..b200af7d8
--- /dev/null
+++ b/chapters/ro/chapter5/5.mdx
@@ -0,0 +1,404 @@
+# Crearea propriului dataset[[creating-your-own-dataset]]
+
+<CourseFloatingBanner chapter={5}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter5/section5.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter5/section5.ipynb"},
+]} />
+
+Uneori, datasetul necesar pentru a construi o aplicație NLP nu există, astfel încât veți trebui să-l creați singuri. În această secțiune vom arăta cum să creați un corpus de [GitHub issues](https://github.com/features/issues/), care sunt utilizate în mod obișnuit pentru a urmări erorile sau feature-urile din repositoriurile GitHub. Acest corpus poate fi folosit pentru diverse scopuri, inclusiv:
+
+* Explorarea timpului necesar pentru închiderea unor issues deschise sau pull requesturi
+* Antrenarea unui _multilabel classifier_ care poate eticheta issue-urile cu metadate pe baza descrierii issue-urilor (de exemplu, "bug", "enhancement" sau "question")
+* Crearea unui motor de căutare semantică pentru a găsi care issues se potrivesc query-ului utilizatorului
+
+În această secțiune ne vom focusa pe crearea corpusului, și în următoarea vom aborda aplicația motorului de căutare semantic. Pentru a păstra lucrurile meta, vom folosi issue-urile GitHub asociate cu un proiect open source popular: 🤗 Datasets! Să vedem cum să obținem datele și să explorăm informațiile conținute în aceste issue-uri.
+
+## Obținerea datelor[[getting-the-data]]
+
+Puteți găsi toate issue-urile din 🤗 Datasets navigând către tabul [Issues](https://github.com/huggingface/datasets/issues) al repositorului. Așa cum arată următorul screenshot, la momentul scrierii acestui text existau 331 de issues deschise și 668 închise.
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter5/datasets-issues.png" alt="Issue-urile GitHub asociate cu 🤗 Datasets." width="80%"/>
+</div>
+
+Dacă ați da clic pe una dintre aceste issue-uri veți găsi că aceasta conține un titlu, o descriere și un set de labeluri care caracterizează issue-ul. Un exemplu este prezentat în screenshotul următor.
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter5/datasets-issues-single.png" alt="Un issue tipic în GitHub din repositoriul 🤗 Datasets." width="80%"/>
+</div>
+
+Pentru a descărca toate issue-urile din repositoriu, vom folosi [GitHub REST API](https://docs.github.com/en/rest) pentru a enumera [`Issues` endpoint](https://docs.github.com/en/rest/reference/issues#list-repository-issues). Aceast endpoint returnează o listă de obiecte JSON, cu fiecare obiect conținând un număr mare de câmpuri care includ titlul și descrierea precum și metadata despre starea issue-ului și așa mai departe.
+
+Un mod convenabil de descărcare a issue-urilor este prin utilizarea librăriei `requests`, care este modalitatea standard pentru a face cereri HTTP în Python. Puteți instala libraria rulând comanda:
+
+```python
+!pip install requests
+```
+
+Odată cu instalarea librariei, puteți face cereri GET la `Issues` endpoint prin invocarea funcției `requests.get()`. De exemplu, puteți rula următorul cod pentru a obține primul issue din prima pagină:
+
+```py
+import requests
+
+url = "https://api.github.com/repos/huggingface/datasets/issues?page=1&per_page=1"
+response = requests.get(url)
+```
+
+Obiectul `response` conține o cantitate mare de informații utile despre requestul efectuat, inclusiv HTTP status code:
+
+```py
+response.status_code
+```
+
+```python out
+200
+```
+
+unde statusul `200` înseamnă că cererea a fost reușită (puteți găsi o listă completă de status coduri [aici](https://en.wikipedia.org/wiki/List_of_HTTP_status_codes)). De ceea ce suntem însă interesați este _payload_, care poate fi accesat în diverse formaturi precum bytes, string sau JSON. Deoarece știm că issue-urile noastre sunt în format JSON, să inspectăm payload-ul astfel:
+
+```py
+response.json()
+```
+
+```python out
+[{'url': 'https://api.github.com/repos/huggingface/datasets/issues/2792',
+  'repository_url': 'https://api.github.com/repos/huggingface/datasets',
+  'labels_url': 'https://api.github.com/repos/huggingface/datasets/issues/2792/labels{/name}',
+  'comments_url': 'https://api.github.com/repos/huggingface/datasets/issues/2792/comments',
+  'events_url': 'https://api.github.com/repos/huggingface/datasets/issues/2792/events',
+  'html_url': 'https://github.com/huggingface/datasets/pull/2792',
+  'id': 968650274,
+  'node_id': 'MDExOlB1bGxSZXF1ZXN0NzEwNzUyMjc0',
+  'number': 2792,
+  'title': 'Update GooAQ',
+  'user': {'login': 'bhavitvyamalik',
+   'id': 19718818,
+   'node_id': 'MDQ6VXNlcjE5NzE4ODE4',
+   'avatar_url': 'https://avatars.githubusercontent.com/u/19718818?v=4',
+   'gravatar_id': '',
+   'url': 'https://api.github.com/users/bhavitvyamalik',
+   'html_url': 'https://github.com/bhavitvyamalik',
+   'followers_url': 'https://api.github.com/users/bhavitvyamalik/followers',
+   'following_url': 'https://api.github.com/users/bhavitvyamalik/following{/other_user}',
+   'gists_url': 'https://api.github.com/users/bhavitvyamalik/gists{/gist_id}',
+   'starred_url': 'https://api.github.com/users/bhavitvyamalik/starred{/owner}{/repo}',
+   'subscriptions_url': 'https://api.github.com/users/bhavitvyamalik/subscriptions',
+   'organizations_url': 'https://api.github.com/users/bhavitvyamalik/orgs',
+   'repos_url': 'https://api.github.com/users/bhavitvyamalik/repos',
+   'events_url': 'https://api.github.com/users/bhavitvyamalik/events{/privacy}',
+   'received_events_url': 'https://api.github.com/users/bhavitvyamalik/received_events',
+   'type': 'User',
+   'site_admin': False},
+  'labels': [],
+  'state': 'open',
+  'locked': False,
+  'assignee': None,
+  'assignees': [],
+  'milestone': None,
+  'comments': 1,
+  'created_at': '2021-08-12T11:40:18Z',
+  'updated_at': '2021-08-12T12:31:17Z',
+  'closed_at': None,
+  'author_association': 'CONTRIBUTOR',
+  'active_lock_reason': None,
+  'pull_request': {'url': 'https://api.github.com/repos/huggingface/datasets/pulls/2792',
+   'html_url': 'https://github.com/huggingface/datasets/pull/2792',
+   'diff_url': 'https://github.com/huggingface/datasets/pull/2792.diff',
+   'patch_url': 'https://github.com/huggingface/datasets/pull/2792.patch'},
+  'body': '[GooAQ](https://github.com/allenai/gooaq) dataset was recently updated after splits were added for the same. This PR contains new updated GooAQ with train/val/test splits and updated README as well.',
+  'performed_via_github_app': None}]
+```
+
+Uau, aceasta e o cantitate mare de informație! Putem vedea câmpuri utile cum ar fi `title`, `body` și `number` care descriu problema, precum și informații despre utilizatorul GitHub care a deschis issue-ul.
+
+<Tip>
+
+✏️ **Încercați!** Faceți clic pe câteva dintre URL-urile din payload-ul JSON de mai sus pentru a vă familiariza cu tipul de informații către care se face referire pentru fiecare GitHub issue.
+
+</Tip>
+
+După cum este descris în [documentația](https://docs.github.com/en/rest/overview/resources-in-the-rest-api#rate-limiting) GitHub, solicitările neautentificate sunt limitate la 60 de solicitări pe oră. Deși puteți crește `per_page` query parameter pentru a reduce numărul de solicitări pe care le faceți, oricum veți atinge limita pentru orice repository care are mai mult de câteva mii de issues. Prin urmare, ar trebui să urmați [instrucțiunile](https://docs.github.com/en/github/authenticating-to-github/creating-a-personal-access-token) GitHub pentru crearea unui _personal access token_ astfel încât să puteți crește limita la 5.000 de solicitări pe oră. Odată ce aveți tokenul, îl puteți include ca parte a request header:
+
+```py
+GITHUB_TOKEN = xxx  # Copy your GitHub token here
+headers = {"Authorization": f"token {GITHUB_TOKEN}"}
+```
+
+<Tip warning={true}>
+
+⚠️ Nu oferiți nimănui un notebook cu `GITHUB_TOKEN` în el . Vă recomandăm să ștergeți ultima celulă odată ce ați executat-o pentru a evita scurgerea accidentală a acestor informații. Chiar mai bine, stocați tokenul într-un fișier *.env* și utilizați biblioteca `python-dotenv` pentru a îl încărca automat ca variabilă de mediu.
+
+</Tip>
+
+Acum că avem tokenul de acces, hai să creăm o funcție care să poată descărca toate issue-urile dintr-un repositoriu GitHub:
+
+```py
+import time
+import math
+from pathlib import Path
+import pandas as pd
+from tqdm.notebook import tqdm
+
+
+def fetch_issues(
+    owner="huggingface",
+    repo="datasets",
+    num_issues=10_000,
+    rate_limit=5_000,
+    issues_path=Path("."),
+):
+    if not issues_path.is_dir():
+        issues_path.mkdir(exist_ok=True)
+
+    batch = []
+    all_issues = []
+    per_page = 100  # Number of issues to return per page
+    num_pages = math.ceil(num_issues / per_page)
+    base_url = "https://api.github.com/repos"
+
+    for page in tqdm(range(num_pages)):
+        # Query with state=all to get both open and closed issues
+        query = f"issues?page={page}&per_page={per_page}&state=all"
+        issues = requests.get(f"{base_url}/{owner}/{repo}/{query}", headers=headers)
+        batch.extend(issues.json())
+
+        if len(batch) > rate_limit and len(all_issues) < num_issues:
+            all_issues.extend(batch)
+            batch = []  # Flush batch for next time period
+            print(f"Reached GitHub rate limit. Sleeping for one hour ...")
+            time.sleep(60 * 60 + 1)
+
+    all_issues.extend(batch)
+    df = pd.DataFrame.from_records(all_issues)
+    df.to_json(f"{issues_path}/{repo}-issues.jsonl", orient="records", lines=True)
+    print(
+        f"Downloaded all the issues for {repo}! Dataset stored at {issues_path}/{repo}-issues.jsonl"
+    )
+```
+
+Acum când apelăm `fetch_issues()` va descărca toate problemele în batch-uri pentru a evita depășirea limitei GitHub pe numărul de solicitări pe oră; rezultatul va fi stocat într-un fișier `_repository_name-issues.jsonl`, unde fiecare linie este un obiect JSON care reprezintă un issue. Mai jos folosim această funcție pentru a obține toate issue-urile de la 🤗 Datasets:
+
+```py
+# În dependență de conexiunea ta la internet, acest lucru poate dura câteva minute...
+fetch_issues()
+```
+
+Odată ce issue-urile sunt descărcate, le putem încărca local utilizând abilitățile noastre dobândite în [secțiunea 2](/course/chapter5/2):
+
+```py
+issues_dataset = load_dataset("json", data_files="datasets-issues.jsonl", split="train")
+issues_dataset
+```
+
+```python out
+Dataset({
+    features: ['url', 'repository_url', 'labels_url', 'comments_url', 'events_url', 'html_url', 'id', 'node_id', 'number', 'title', 'user', 'labels', 'state', 'locked', 'assignee', 'assignees', 'milestone', 'comments', 'created_at', 'updated_at', 'closed_at', 'author_association', 'active_lock_reason', 'pull_request', 'body', 'timeline_url', 'performed_via_github_app'],
+    num_rows: 3019
+})
+```
+
+Great, am creat primul nostru dataset de la zero! Dar de ce sunt mai mult de câteva mii de issue-uri atunci când tabul de issue-uri al repositoriului 🤗 Datasets afișează doar aproximativ 1.000 de issue-uri în total 🤔? Conform descris în [documentația](https://docs.github.com/en/rest/reference/issues#list-issues-assigned-to-the-authenticated-user) GitHub, acest lucru s-a întâmplat pentru că am descărcat și toate pull requesturile:
+
+> GitHub's REST API v3 considers every pull request an issue, but not every issue is a pull request. For this reason, "Issues" endpoints may return both issues and pull requests in the response. You can identify pull requests by the `pull_request` key. Be aware that the `id` of a pull request returned from "Issues" endpoints will be an issue id.
+
+Deoarece conținutul issue-urilor și pull requesturilor este destul de diferit, hai să preprocesăm puțin datele pentru a ne permite să le diferențiem între ele.
+
+## Curățarea datelor[[cleaning-up-the-data]]
+
+Fragmentul de mai sus din documentația GitHub ne spune că coloana `pull_request` poate fi utilizată pentru a diferenția între issues și pull requests. Să analizăm un sampple aleatoriu pentru a vedea care este diferența. Așa cum am făcut în [secțiunea 3](/course/chapter5/3), vom înlănțui `Dataset.shuffle()` și `Dataset.select()` pentru a crea un sample aleatoriu și apoi vom împerechea coloanele `html_url` și `pull_request` pentru a putea compara diversele URL-uri:
+
+```py
+sample = issues_dataset.shuffle(seed=666).select(range(3))
+
+# Print out the URL and pull request entries
+for url, pr in zip(sample["html_url"], sample["pull_request"]):
+    print(f">> URL: {url}")
+    print(f">> Pull request: {pr}\n")
+```
+
+```python out
+>> URL: https://github.com/huggingface/datasets/pull/850
+>> Pull request: {'url': 'https://api.github.com/repos/huggingface/datasets/pulls/850', 'html_url': 'https://github.com/huggingface/datasets/pull/850', 'diff_url': 'https://github.com/huggingface/datasets/pull/850.diff', 'patch_url': 'https://github.com/huggingface/datasets/pull/850.patch'}
+
+>> URL: https://github.com/huggingface/datasets/issues/2773
+>> Pull request: None
+
+>> URL: https://github.com/huggingface/datasets/pull/783
+>> Pull request: {'url': 'https://api.github.com/repos/huggingface/datasets/pulls/783', 'html_url': 'https://github.com/huggingface/datasets/pull/783', 'diff_url': 'https://github.com/huggingface/datasets/pull/783.diff', 'patch_url': 'https://github.com/huggingface/datasets/pull/783.patch'}
+```
+
+Aici putem vedea că fiecare pull request este asociat cu diverse URL-uri, în timp ce issue-urile obișnuite au o intrare `None`. Putem utiliza această distincție pentru a crea o nouă coloană `is_pull_request` care verifică dacă câmpul `pull_request` este `None` sau nu:
+
+```py
+issues_dataset = issues_dataset.map(
+    lambda x: {"is_pull_request": False if x["pull_request"] is None else True}
+)
+```
+
+<Tip>
+
+✏️ **Încercați!** Calculați timpul mediu necesar pentru închiderea issue-urilor în Datasets. Vă poate fi utilă funcția `Dataset.filter()` pentru a filtra pull requesturile și issue-urile deschise, și puteți utiliza funcția `Dataset.set_format()` pentru a converti datasetul într-un `DataFrame` astfel încât să puteți manipula cu ușurință timestampurile `created_at` și `closed_at`. Pentru puncte bonus, calculați timpul mediu necesar pentru închiderea pull requesturilor.
+
+</Tip>
+
+Deși am putea continua să curățăm datasetul prin eliminarea sau redenumirea unor coloane, este, în general, o practică bună să păstrăm datasetul cât mai "raw" posibil la acest stadiu, astfel încât să poată fi utilizat ușor în multiple aplicații.
+
+Înainte de a încărca datasetul în Hugging Face Hub, trebuie să rezolvăm chestie care lipsește din el: comentariile asociate fiecărui issue și pull request. Le vom adăuga în continuare cu-- ați ghicit -- GitHub REST API!
+
+## Îmbunătățirea datasetului[[augmenting-the-dataset]]
+
+După cum se vede în următorul screenshot, comentariile asociate unui issue sau pull request oferă o sursă bogată de informații, în special dacă suntem interesați să construim un motor de căutare pentru a răspunde la întrebările utilizatorilor despre bibliotecă.
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter5/datasets-issues-comment.png" alt="Comentariile asociate unei probleme despre 🤗 Datasets." width="80%"/>
+</div>
+
+GitHub REST API oferă un endpoint [`Comments`](https://docs.github.com/en/rest/reference/issues#list-issue-comments) care returnează toate comentariile asociate numărului problemei. Să testăm endpointul pentru a vedea ce returnează:
+
+```py
+issue_number = 2792
+url = f"https://api.github.com/repos/huggingface/datasets/issues/{issue_number}/comments"
+response = requests.get(url, headers=headers)
+response.json()
+```
+
+```python out
+[{'url': 'https://api.github.com/repos/huggingface/datasets/issues/comments/897594128',
+  'html_url': 'https://github.com/huggingface/datasets/pull/2792#issuecomment-897594128',
+  'issue_url': 'https://api.github.com/repos/huggingface/datasets/issues/2792',
+  'id': 897594128,
+  'node_id': 'IC_kwDODunzps41gDMQ',
+  'user': {'login': 'bhavitvyamalik',
+   'id': 19718818,
+   'node_id': 'MDQ6VXNlcjE5NzE4ODE4',
+   'avatar_url': 'https://avatars.githubusercontent.com/u/19718818?v=4',
+   'gravatar_id': '',
+   'url': 'https://api.github.com/users/bhavitvyamalik',
+   'html_url': 'https://github.com/bhavitvyamalik',
+   'followers_url': 'https://api.github.com/users/bhavitvyamalik/followers',
+   'following_url': 'https://api.github.com/users/bhavitvyamalik/following{/other_user}',
+   'gists_url': 'https://api.github.com/users/bhavitvyamalik/gists{/gist_id}',
+   'starred_url': 'https://api.github.com/users/bhavitvyamalik/starred{/owner}{/repo}',
+   'subscriptions_url': 'https://api.github.com/users/bhavitvyamalik/subscriptions',
+   'organizations_url': 'https://api.github.com/users/bhavitvyamalik/orgs',
+   'repos_url': 'https://api.github.com/users/bhavitvyamalik/repos',
+   'events_url': 'https://api.github.com/users/bhavitvyamalik/events{/privacy}',
+   'received_events_url': 'https://api.github.com/users/bhavitvyamalik/received_events',
+   'type': 'User',
+   'site_admin': False},
+  'created_at': '2021-08-12T12:21:52Z',
+  'updated_at': '2021-08-12T12:31:17Z',
+  'author_association': 'CONTRIBUTOR',
+  'body': "@albertvillanova my tests are failing here:\r\n```\r\ndataset_name = 'gooaq'\r\n\r\n    def test_load_dataset(self, dataset_name):\r\n        configs = self.dataset_tester.load_all_configs(dataset_name, is_local=True)[:1]\r\n>       self.dataset_tester.check_load_dataset(dataset_name, configs, is_local=True, use_local_dummy_data=True)\r\n\r\ntests/test_dataset_common.py:234: \r\n_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ \r\ntests/test_dataset_common.py:187: in check_load_dataset\r\n    self.parent.assertTrue(len(dataset[split]) > 0)\r\nE   AssertionError: False is not true\r\n```\r\nWhen I try loading dataset on local machine it works fine. Any suggestions on how can I avoid this error?",
+  'performed_via_github_app': None}]
+```
+
+Putem vedea că comentariul este stocat în câmpul `body`, așa că putem scrie o funcție simplă care returnează toate comentariile asociate unei probleme prin extragerea conținutului `body` pentru fiecare element în `response.json()`:
+
+```py
+def get_comments(issue_number):
+    url = f"https://api.github.com/repos/huggingface/datasets/issues/{issue_number}/comments"
+    response = requests.get(url, headers=headers)
+    return [r["body"] for r in response.json()]
+
+
+# Testăm dacă funcția lucrează cum ne dorim
+get_comments(2792)
+```
+
+```python out
+["@albertvillanova my tests are failing here:\r\n```\r\ndataset_name = 'gooaq'\r\n\r\n    def test_load_dataset(self, dataset_name):\r\n        configs = self.dataset_tester.load_all_configs(dataset_name, is_local=True)[:1]\r\n>       self.dataset_tester.check_load_dataset(dataset_name, configs, is_local=True, use_local_dummy_data=True)\r\n\r\ntests/test_dataset_common.py:234: \r\n_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ \r\ntests/test_dataset_common.py:187: in check_load_dataset\r\n    self.parent.assertTrue(len(dataset[split]) > 0)\r\nE   AssertionError: False is not true\r\n```\r\nWhen I try loading dataset on local machine it works fine. Any suggestions on how can I avoid this error?"]
+```
+
+Arată bine. Acum hai să folosim `Dataset.map()` pentru a adăuga noi coloane `comments` fiecărui issue în datasetul nostru:
+
+```py
+# Depending on your internet connection, this can take a few minutes...
+issues_with_comments_dataset = issues_dataset.map(
+    lambda x: {"comments": get_comments(x["number"])}
+)
+```
+
+Ultimul pas este să facem push datasetului nostru pe Hub. Să vedem cum putem face asta.
+
+## Încărcarea datasetului pe Hugging Face Hub[[uploading-the-dataset-to-the-hugging-face-hub]]
+
+<Youtube id="HaN6qCr_Afc"/.”
+
+Acum că avem datasetul nostru augmentat, este timpul să îi facem push pe Hub pentru a-l oferi comunității! Încărcarea unui dataset este foarte simplu: la fel ca modelele și tokenizerrii din 🤗 Transformers, putem utiliza o metodă `push_to_hub()` pentru a face push unui dataset. Pentru a face asta, avem nevoie de un token de autentificare, care poate fi obținut prin autentificarea pe Hugging Face Hub cu funcția `notebook_login()`:
+
+```py
+from huggingface_hub import notebook_login
+
+notebook_login()
+```
+
+Acest lucru va crea un widget unde poți să scrii usernameul și parola ta, iar un API token va fi salvat în *~/.huggingface/token*. Dacă rulezi codeul într-un terminal, te poți loga cu ajutor CLI: 
+This will create a widget where you can enter your username and password, and an API token will be saved in *~/.huggingface/token*. If you're running the code in a terminal, you can log in via the CLI instead:
+
+```bash
+huggingface-cli login
+```
+O dată ce ai făcut asta, putem încărca datasetul rulând:
+
+```py
+issues_with_comments_dataset.push_to_hub("github-issues")
+```
+
+De acum, orice poate să descarce datasetul, utilizând `load_dataset()` cu ID-ul repositoriului ca `path` argument:
+
+```py
+remote_dataset = load_dataset("lewtun/github-issues", split="train")
+remote_dataset
+```
+
+```python out
+Dataset({
+    features: ['url', 'repository_url', 'labels_url', 'comments_url', 'events_url', 'html_url', 'id', 'node_id', 'number', 'title', 'user', 'labels', 'state', 'locked', 'assignee', 'assignees', 'milestone', 'comments', 'created_at', 'updated_at', 'closed_at', 'author_association', 'active_lock_reason', 'pull_request', 'body', 'performed_via_github_app', 'is_pull_request'],
+    num_rows: 2855
+})
+```
+
+Cool, am încărcat datasetul nostru pe Hub și acum este disponibil pentru alții să îl utilizeze! Mai este doar un lucru important de făcut: adăugarea unui _dataset card_ care explică cum a fost creat corpusul și oferă alte informații utile pentru comunitate.
+
+<Tip>
+
+💡 De asemenea, puteți încărca un dataset pe Hugging Face Hub direct din terminal utilizând `huggingface-cli` și puțină magie Git. Consultați [ghidul 🤗 Datasets](https://huggingface.co/docs/datasets/share#share-a-dataset-using-the-cli) pentru detalii despre cum puteți face asta.
+
+</Tip>
+
+## Crearea unei dataset card[[creating-a-dataset-card]]
+
+Datasetiroșe bine documentate sunt mai probabil să fie utile altora (inclusiv ție din viitor!), deoarece furnizează contextul pentru a permite utilizatorilor să decidă dacă datasetul este relevant pentru taskul lor și să evalueze eventualele biasuri sau riscurile asociate cu utilizarea datasetului.
+
+Pe Hugging Face Hub, această informație este stocată în fișierul *README.md* al fiecărui dataset repository. Sunt doi pași principali pe care trebuie să îi efectuați înainte de a crea acest fișier:
+
+1. Utilizați aplicația [`datasets-tagging`](https://huggingface.co/datasets/tagging/) pentru a crea etichete de metadate în format YAML. Aceste taguri sunt utilizate pentru o varietate de funcționalități de căutare pe Hugging Face Hub și asigură că datasetul poate fi găsit ușor de membrii comunității. Deoarece am creat un dataset custom aici, veți fi nevoiți să clonați repositoriul `datasets-tagging` și să rulați aplicația local. Iată cum arată interfața:
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter5/datasets-tagger.png" alt="Interfața `datasets-tagging`." width="80%"/>
+</div>
+
+2. Citiți [ghidul 🤗 Datasets](https://github.com/huggingface/datasets/blob/master/templates/README_guide.md) despre crearea de dataset cards informative și utilizați-l ca șablon.
+
+Puteți crea fișierul *README.md* direct pe Hub și puteți găsi un template pentru dataset card în repositoriul `lewtun/github-issues`. Un screenshot a dataset card completată este afișată mai jos.
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter5/dataset-card.png" alt="Dataset card." width="80%"/>
+</div>
+
+<Tip>
+
+✏️ **Încercați!** Utilizați aplicația `dataset-tagging` și [ghidul 🤗 Datasets](https://github.com/huggingface/datasets/blob/master/templates/README_guide.md) pentru a completa fișierul *README.md* pentru datasetul de probleme GitHub.
+
+</Tip>
+
+Astfel, am văzut în această secțiune că crearea unui dataset bun poate fi destul de complicată, dar, spre norocul nsotru, încărcarea și oferirea acestuia comunității nu sunt. În secțiunea următoare, vom utiliza datasetul nou pentru a crea un motor de căutare semantic cu 🤗 Datasets care poate să asocieze întrebări cu cele mai relevante issues și comentarii.
+
+<Tip>
+
+✏️ **Încercați!** Treceți prin pașii pe care i-am făcut în această secțiune pentru a crea un dataset de issues GitHub pentru o biblioteca open source care îți place(alegeți altceva înafară de 🤗 Datasets, desigur!). Pentru puncte bonus, faceți fine-tune unui multilabel classifier pentru a prezice tagurile prezente în câmpul `labels`.
+
+</Tip>
diff --git a/chapters/ro/chapter5/6.mdx b/chapters/ro/chapter5/6.mdx
new file mode 100644
index 000000000..7587c5ef5
--- /dev/null
+++ b/chapters/ro/chapter5/6.mdx
@@ -0,0 +1,517 @@
+<FrameworkSwitchCourse {fw} />
+
+# Căutare semantică cu FAISS[[semantic-search-with-faiss]]
+
+{#if fw === 'pt'}
+
+<CourseFloatingBanner chapter={5}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter5/section6_pt.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter5/section6_pt.ipynb"},
+]} />
+
+{:else}
+
+<CourseFloatingBanner chapter={5}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter5/section6_tf.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter5/section6_tf.ipynb"},
+]} />
+
+{/if}
+
+În [secțiunea 5](/course/chapter5/5), am creat un dataset cu issues și comentarii din repositoriul 🤗 Datasets. În această secțiune, vom utiliza aceste informații pentru a construi un motor de căutare care ne poate ajuta să găsim răspunsurile la  cele mai importante cele mai importante întrebări despre bibliotecă!
+
+<Youtube id="OATCgQtNX2o"/>
+
+## Utilizarea embeddings pentru căutare semantică[[using-embeddings-for-semantic-search]]
+
+După cum am văzut în [Capitolul 1](/course/chapter1), Transformer-based language models reprezintă fiecare token într-un fragment de text ca un _embedding vector_. S-a dovedit că se poate face "pool" embeddingurilor individuale pentru a crea o reprezentare vectorială pentru fraze întregi, paragrafe sau (în anumite cazuri) documente. Aceste embeddings pot fi apoi utilizate pentru a găsi documente similare în corpus prin calcularea dot-product similarity (sau a unei alte metrice de similaritate) între fiecare embedding și returnarea documentelor cu cea mai mare suprapunere.
+
+În această secțiune, vom utiliza embeddings pentru a dezvolta un motor de căutare semantică. Aceste motoare de căutare oferă mai multe avantaje față de abordările convenționale bazate pe căutarea de cuvinte cheie într-un query cu documente.
+
+<div class="flex justify-center">
+<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter5/semantic-search.svg" alt="Căutare semantică."/>
+<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter5/semantic-search-dark.svg" alt="Căutare semantică."/>
+</div>
+
+## Încărcarea și pregătirea datasetului[[loading-and-preparing-the-dataset]]
+
+Prima lucru pe care trebuie să îl facem este să descărcăm datasetul nostru cu GitHub issues, așa că folosim funcția `load_dataset()` ca de obicei:
+
+```py
+from datasets import load_dataset
+
+issues_dataset = load_dataset("lewtun/github-issues", split="train")
+issues_dataset
+```
+
+```python out
+Dataset({
+    features: ['url', 'repository_url', 'labels_url', 'comments_url', 'events_url', 'html_url', 'id', 'node_id', 'number', 'title', 'user', 'labels', 'state', 'locked', 'assignee', 'assignees', 'milestone', 'comments', 'created_at', 'updated_at', 'closed_at', 'author_association', 'active_lock_reason', 'pull_request', 'body', 'performed_via_github_app', 'is_pull_request'],
+    num_rows: 2855
+})
+```
+
+Aici am specificat splitul default `train` în `load_dataset()`, astfel încât returnează un `Dataset` în loc de `DatasetDict`. Primul lucru care treubuie făcut este să filtrăm pull requesturile, deoarece acestea rareori tind să fie utilizate pentru a răspunde la întrebările utilizatorilor și vor introduce noise în motorul nostru de căutare. Așa cum ar trebuie deja să știți, putem utiliza funcția `Dataset.filter()` pentru a exclude aceste rânduri din datasetul nostru. În timp ce suntem aici, putem să filtrăm și rândurile fără comentari, deoarece acestea nu oferă niciun răspuns la întrebările utilizatorilor:
+
+```py
+issues_dataset = issues_dataset.filter(
+    lambda x: (x["is_pull_request"] == False și len(x["comments"]) > 0)
+)
+issues_dataset
+```
+
+```python out
+Dataset({
+    caracteristici: ['url', 'repository_url', 'labels_url', 'comments_url', 'events_url', 'html_url', 'id', 'node_id', 'number', 'title', 'user', 'labels', 'state', 'locked', 'assignee', 'assignees', 'milestone', 'comments', 'created_at', 'updated_at', 'closed_at', 'author_association', 'active_lock_reason', 'pull_request', 'body', 'performed_via_github_app', 'is_pull_request'],
+    num_rows: 771
+})
+```
+
+Putem vedea că există multe coloane în datasetul nostru, majoritatea dintre care nu sunt necesare pentru a construi motorul nostru de căutare. Din perspectiva căutării, cele mai informative coloane sunt `title`, `body` și `comments`, în timp ce `html_url` ne oferă un link înapoi la problema sursă. Hai să utilizăm funcția `Dataset.remove_columns()` pentru a elimina restul:
+
+```py
+columns = issues_dataset.column_names
+columns_to_keep = ["title", "body", "html_url", "comments"]
+columns_to_remove = set(columns_to_keep).symmetric_difference(columns)
+issues_dataset = issues_dataset.remove_columns(columns_to_remove)
+issues_dataset
+```
+
+```python out
+Dataset({
+    features: ['html_url', 'title', 'comments', 'body'],
+    num_rows: 771
+})
+```
+
+Pentru a crea embeddedurile noastre, vom completa fiecare comentariu cu titlul și body-ul problemei, deoarece aceste câmpuri adesea includ informații contextuale utile. Deoarece coloana noastră `comments` este în prezent o listă de comentarii pentru fiecare issue, trebuie să "explodăm" coloana, astfel încât fiecare rând să fie format dintr-un tuple `(html_url, title, body, comment)`. În Pandas, putem face acest lucru cu funcția [`DataFrame.explode()`](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.explode.html), care creează un rând nou pentru fiecare element dintr-o coloană asemănătoare cu o listă, în timp ce copiază toate celelalte valori ale coloanelor. Pentru a vedea acest lucru în acțiune, să trecem la formatul pandas `DataFrame` main întâi:
+
+```py
+issues_dataset.set_format("pandas")
+df = issues_dataset[:]
+```
+
+Dacă inspectăm primul rând din acest `DataFrame`, putem vedea că există patru comentarii asociate acestei probleme:
+
+```py
+df["comments"][0].tolist()
+```
+
+```python out
+['the bug code locate in ：\r\n    if data_args.task_name is not None:\r\n        # Downloading and loading a dataset from the hub.\r\n        datasets = load_dataset("glue", data_args.task_name, cache_dir=model_args.cache_dir)',
+ 'Hi @jinec,\r\n\r\nFrom time to time we get this kind of `ConnectionError` coming from the github.com website: https://raw.githubusercontent.com\r\n\r\nNormally, it should work if you wait a little and then retry.\r\n\r\nCould you please confirm if the problem persists?',
+ 'cannot connect，even by Web browser，please check that  there is some  problems。',
+ 'I can access https://raw.githubusercontent.com/huggingface/datasets/1.7.0/datasets/glue/glue.py without problem...']
+```
+
+Când facem explode `df`, ne așteptăm să obținem un rând pentru fiecare dintre aceste comentarii. Haideți să verificăm dacă ăsta e cazul:
+
+```py
+comments_df = df.explode("comments", ignore_index=True)
+comments_df.head(4)
+```
+
+<table border="1" class="dataframe" style="table-layout: fixed; word-wrap:break-word; width: 100%;">
+  <thead>
+    <tr style="text-align: right;">
+      <th></th>
+      <th>html_url</th>
+      <th>title</th>
+      <th>comments</th>
+      <th>body</th>
+    </tr>
+  </thead>
+  <tbody>
+    <tr>
+      <th>0</th>
+      <td>https://github.com/huggingface/datasets/issues/2787</td>
+      <td>ConnectionError: Couldn't reach https://raw.githubusercontent.com</td>
+      <td>the bug code locate in ：\r\n    if data_args.task_name is not None...</td>
+      <td>Hello,\r\nI am trying to run run_glue.py and it gives me this error...</td>
+    </tr>
+    <tr>
+      <th>1</th>
+      <td>https://github.com/huggingface/datasets/issues/2787</td>
+      <td>ConnectionError: Couldn't reach https://raw.githubusercontent.com</td>
+      <td>Hi @jinec,\r\n\r\nFrom time to time we get this kind of `ConnectionError` coming from the github.com website: https://raw.githubusercontent.com...</td>
+      <td>Hello,\r\nI am trying to run run_glue.py and it gives me this error...</td>
+    </tr>
+    <tr>
+      <th>2</th>
+      <td>https://github.com/huggingface/datasets/issues/2787</td>
+      <td>ConnectionError: Couldn't reach https://raw.githubusercontent.com</td>
+      <td>cannot connect，even by Web browser，please check that  there is some  problems。</td>
+      <td>Hello,\r\nI am trying to run run_glue.py and it gives me this error...</td>
+    </tr>
+    <tr>
+      <th>3</th>
+      <td>https://github.com/huggingface/datasets/issues/2787</td>
+      <td>ConnectionError: Couldn't reach https://raw.githubusercontent.com</td>
+      <td>I can access https://raw.githubusercontent.com/huggingface/datasets/1.7.0/datasets/glue/glue.py without problem...</td>
+      <td>Hello,\r\nI am trying to run run_glue.py and it gives me this error...</td>
+    </tr>
+  </tbody>
+</table>
+
+Great, putem vedea că rândurile au fost reproduse, cu coloanele `comments` incluzând și comentariile individuale. Acum că am terminat cu Pandas, noi putem să schimăm rapid înapoi la un `Dataset` înărcând `DataFrame` în memorie:
+
+```py
+from datasets import Dataset
+
+comments_dataset = Dataset.from_pandas(comments_df)
+comments_dataset
+```
+
+```python out
+Dataset({
+    features: ['html_url', 'title', 'comments', 'body'],
+    num_rows: 2842
+})
+```
+
+Okay, acest lucru ne-a oferit câteva mii de comentarii cu care să lucrăm!
+
+
+<Tip>
+
+✏️ **Încercați!** Vezi dacă poți utiliza `Dataset.map()` pentru a exploda coloana `comments` din `issues_dataset` _fără_ a recurge la utilizarea Pandas. Acest lucru este puțin dificil; s-ar putea să găsiți utilă secțiunea ["Mapping batch"](https://huggingface.co/docs/datasets/about_map_batch#batch-mapping) din documentația 🤗 Datasets pentru această sarcină.
+
+</Tip>
+
+Acum că avem un singur comentariu pe rând, să creăm o nouă coloană `comments_length` care conține numărul de cuvinte din fiecare comentariu:
+
+```py
+comments_dataset = comments_dataset.map(
+    lambda x: {"comment_length": len(x["comments"].split())}
+)
+```
+
+Putem utiliza această nouă coloană pentru a filtra comentariile scurte, care de obicei includ lucruri precum "cc @lewtun" sau "Mulțumesc!" care nu sunt relevante pentru motorul nostru de căutare. Nu există un număr precis care trebuie selectat pentru filtru, dar aproximativ 15 cuvinte pare a fi un bun punct de plecare:
+
+```py
+comments_dataset = comments_dataset.filter(lambda x: x["comment_length"] > 15)
+comments_dataset
+```
+
+```python out
+Dataset({
+    features: ['html_url', 'title', 'comments', 'body', 'comment_length'],
+    num_rows: 2098
+})
+```
+
+După ce am curățat puțin setul nostru de date, putem să concatenăm titlul, descrirea și comentariile problemei împreună într-o nouă coloană `text`. Ca de obicei, vom scrie o funcție simplă pe care o putem transmite în `Dataset.map()`:
+
+```py
+def concatenate_text(examples):
+    return {
+        "text": examples["title"]
+        + " \n "
+        + examples["body"]
+        + " \n "
+        + examples["comments"]
+    }
+
+
+comments_dataset = comments_dataset.map(concatenate_text)
+```
+
+Suntem în final pregătiți să creăm niște embeddings! Haideți să vedem cum facem acest lucru.
+
+## Crearea embeddings-urilor de text [[creating-text-embeddings]]
+
+Am văzut în [Capitolul 2](/course/chapter2) că putem obține token embeddings prin utilizarea clasei `AutoModel`. Tot ce trebuie să facem este să alegem un checkpoint potrivit pentru a încărca modelul. Din fericire, există o bibliotecă numită `sentence-transformers` care se ocupă de crearea embeddingurilor. Așa cum se descrie în [documentația](https://www.sbert.net/examples/applications/semantic-search/README.html#symmetric-vs-asymmetric-semantic-search) bibliotecii, cazul nostru este un exemplu de _căutare semantică asimetrică_ deoarece avem o întrebare scurtă al cărei răspuns ne-ar plăcea să îl găsim într-un document mai lung, precum un comentariu la un issue. [Tabelul] (https://www.sbert.net/docs/pretrained_models.html#model-overview) util de prezentare a modelului din documentație indică faptul că checkpointul `multi-qa-mpnet-base-dot-v1` are cea mai bună performanță pentru căutarea semantică, așa că îl vom folosi acesta pentru aplicația noastră. De asemenea, vom încărca tokenizer-ul folosind același checkpoint:
+
+{#if fw === 'pt'}
+
+```py
+from transformers import AutoTokenizer, AutoModel
+
+model_ckpt = "sentence-transformers/multi-qa-mpnet-base-dot-v1"
+tokenizer = AutoTokenizer.from_pretrained(model_ckpt)
+model = AutoModel.from_pretrained(model_ckpt)
+```
+
+Pentru a accelera procesul de embedding, este util să punem modelul și inputurile pe un GPU, deci hai să facem asta acum:
+
+```py
+import torch
+
+device = torch.device("cuda")
+model.to(device)
+```
+
+{:else}
+
+```py
+from transformers import AutoTokenizer, TFAutoModel
+
+model_ckpt = "sentence-transformers/multi-qa-mpnet-base-dot-v1"
+tokenizer = AutoTokenizer.from_pretrained(model_ckpt)
+model = TFAutoModel.from_pretrained(model_ckpt, from_pt=True)
+```
+
+Notăm că am setat `from_pt=True` ca argument al metodei `from_pretrained()`. Acest lucru se datorează faptului că checkpoint-ul `multi-qa-mpnet-base-dot-v1` are doar PyTorch weights, astfel încât setarea `from_pt=True` le va converti automat în format TensorFlow pentru noi. După cum puteți vedea, este foarte simplu să treci de la un framework la altul în 🤗 Transformers!
+
+{/if}
+
+După cum am menționat anterior, dorim să reprezentăm fiecare intrare din corpusul nostru de GitHub issues sub forma unui vector, astfel încât avem nevoie să "agregăm" sau să facem media la tokem embeddings într-un anumit mod. O abordare populară este de a efectua *CLS pooling* pe outputurile modelului nostru, unde pur și simplu colectăm ultimul stadiu ascuns pentru tokenul special `[CLS]`. Următoarea funcție face acest lucru pentru noi:
+
+```py
+def cls_pooling(model_output):
+    return model_output.last_hidden_state[:, 0]
+```
+
+În continuare, vom crea o funcție ajutătoare care va tokeniza o listă de documente, va plasa tensorii pe GPU, îi va alimenta în model și, în final, va aplica CLS pooling la outputuri:
+
+{#if fw === 'pt'}
+
+```py
+def get_embeddings(text_list):
+    encoded_input = tokenizer(
+        text_list, padding=True, truncation=True, return_tensors="pt"
+    )
+    encoded_input = {k: v.to(device) for k, v in encoded_input.items()}
+    model_output = model(**encoded_input)
+    return cls_pooling(model_output)
+```
+
+Putem testa funcția oferindui prima intrare de text în corpusul nostru și analizând output shapeul:
+
+```py
+embedding = get_embeddings(comments_dataset["text"][0])
+embedding.shape
+```
+
+```python out
+torch.Size([1, 768])
+```
+
+Minunat, am transformat prima intrare din corpusul nostru într-un vector de 768 de dimensiuni! Putem utiliza `Dataset.map()` pentru a aplica funcția noastră `get_embeddings()` la fiecare rând din corpusul nostru, astfel încât să creăm o nouă coloană `embeddings` în acest mod:
+
+```py
+embeddings_dataset = comments_dataset.map(
+    lambda x: {"embeddings": get_embeddings(x["text"]).detach().cpu().numpy()[0]}
+)
+```
+
+{:else}
+
+```py
+def get_embeddings(text_list):
+    encoded_input = tokenizer(
+        text_list, padding=True, truncation=True, return_tensors="tf"
+    )
+    encoded_input = {k: v for k, v in encoded_input.items()}
+    model_output = model(**encoded_input)
+    return cls_pooling(model_output)
+```
+
+Putem testa funcția oferindui prima intrare de text în corpusul nostru și analizând output shapeul:
+
+```py
+embedding = get_embeddings(comments_dataset["text"][0])
+embedding.shape
+```
+
+```python out
+TensorShape([1, 768])
+```
+
+Minunat, am transformat prima intrare din corpusul nostru într-un vector de 768 de dimensiuni! Putem utiliza `Dataset.map()` pentru a aplica funcția noastră `get_embeddings()` la fiecare rând din corpusul nostru, astfel încât să creăm o nouă coloană `embeddings` în acest mod:
+
+```py
+embeddings_dataset = comments_dataset.map(
+    lambda x: {"embeddings": get_embeddings(x["text"]).numpy()[0]}
+)
+```
+
+{/if}
+
+Observăm că am transformat embeddingurile în matrice NumPy -- acest lucru este necesar deoarece biblioteca 🤗 Datasets cere acest format atunci când încercăm să indexăm cu FAISS, ceea ce vom face în continuare.
+
+## Utilizarea FAISS pentru căutare de similaritate eficientă[[using-faiss-for-efficient-similarity-search]]
+
+Acum că avem un dataset de embeddings, avem nevoie de o modalitate de a căuta printre ele. Pentru a face acest lucru, vom utiliza o structură de date specială din 🤗 Datasets, numită _FAISS index_. [FAISS](https://faiss.ai/) (prescurtat de la Facebook AI Similarity Search) este o bibliotecă care oferă algoritmi eficienți pentru căutarea rapidă și clusteringul al embedding vectors.
+
+Ideea de bază din spatele FAISS este crearea unei structuri de date speciale numite _index_, care permite găsirea embeddingurilor similare cu un input embedding. Crearea unui index FAISS în 🤗 Datasets este simplu -- utilizăm funcția `Dataset.add_faiss_index()` și specificăm care coloană a datasetului nostru dorim să indexăm:
+
+```py
+embeddings_dataset.add_faiss_index(column="embeddings")
+```
+
+Acum putem efectua queries pe acest index realizând o căutare a celor mai apropiați vecini cu funcția `Dataset.get_nearest_examples()`. Haideți să testăm acest lucru prin încorporarea unei întrebări astfel:
+
+{#if fw === 'pt'}
+
+```py
+question = "How can I load a dataset offline?"
+question_embedding = get_embeddings([question]).cpu().detach().numpy()
+question_embedding.shape
+```
+
+```python out
+torch.Size([1, 768])
+```
+
+{:else}
+
+```py
+question = "How can I load a dataset offline?"
+question_embedding = get_embeddings([question]).numpy()
+question_embedding.shape
+```
+
+```python out
+(1, 768)
+```
+
+{/if}
+
+La fel ca și în cazul documentelor, acum avem un vector de 768 de dimensiuni care reprezintă query-ul, pe care îl putem compara cu întregul corpus pentru a găsi embeddingurile cele mai similare:
+
+```py
+scores, samples = embeddings_dataset.get_nearest_examples(
+    "embeddings", question_embedding, k=5
+)
+```
+
+Funcția `Dataset.get_nearest_examples()` returnează un tuple cu scorurile care clasifică suprapunerea dintre query și document, și un set corespunzător de sampleuri (în acest caz, cele 5 match-uri). Haideți să colectăm acestea într-un `pandas.DataFrame` pentru a le putea sorta cu ușurință:
+
+```py
+import pandas as pd
+
+samples_df = pd.DataFrame.from_dict(samples)
+samples_df["scores"] = scores
+samples_df.sort_values("scores", ascending=False, inplace=True)
+```
+
+Acum putem itera peste primele rânduri pentru a veadea cât de bine un query se potrivește cu comentariile disponibile:
+
+```py
+for _, row in samples_df.iterrows():
+    print(f"COMMENT: {row.comments}")
+    print(f"SCORE: {row.scores}")
+    print(f"TITLE: {row.title}")
+    print(f"URL: {row.html_url}")
+    print("=" * 50)
+    print()
+```
+
+```python out
+"""
+COMMENT: Requiring online connection is a deal breaker in some cases unfortunately so it'd be great if offline mode is added similar to how `transformers` loads models offline fine.
+
+@mandubian's second bullet point suggests that there's a workaround allowing you to use your offline (custom?) dataset with `datasets`. Could you please elaborate on how that should look like?
+SCORE: 25.505046844482422
+TITLE: Discussion using datasets in offline mode
+URL: https://github.com/huggingface/datasets/issues/824
+==================================================
+
+COMMENT: The local dataset builders (csv, text , json and pandas) are now part of the `datasets` package since #1726 :)
+You can now use them offline
+\`\`\`python
+datasets = load_dataset("text", data_files=data_files)
+\`\`\`
+
+We'll do a new release soon
+SCORE: 24.555509567260742
+TITLE: Discussion using datasets in offline mode
+URL: https://github.com/huggingface/datasets/issues/824
+==================================================
+
+COMMENT: I opened a PR that allows to reload modules that have already been loaded once even if there's no internet.
+
+Let me know if you know other ways that can make the offline mode experience better. I'd be happy to add them :)
+
+I already note the "freeze" modules option, to prevent local modules updates. It would be a cool feature.
+
+----------
+
+> @mandubian's second bullet point suggests that there's a workaround allowing you to use your offline (custom?) dataset with `datasets`. Could you please elaborate on how that should look like?
+
+Indeed `load_dataset` allows to load remote dataset script (squad, glue, etc.) but also you own local ones.
+For example if you have a dataset script at `./my_dataset/my_dataset.py` then you can do
+\`\`\`python
+load_dataset("./my_dataset")
+\`\`\`
+and the dataset script will generate your dataset once and for all.
+
+----------
+
+About I'm looking into having `csv`, `json`, `text`, `pandas` dataset builders already included in the `datasets` package, so that they are available offline by default, as opposed to the other datasets that require the script to be downloaded.
+cf #1724
+SCORE: 24.14896583557129
+TITLE: Discussion using datasets in offline mode
+URL: https://github.com/huggingface/datasets/issues/824
+==================================================
+
+COMMENT: > here is my way to load a dataset offline, but it **requires** an online machine
+>
+> 1. (online machine)
+>
+> ```
+>
+> import datasets
+>
+> data = datasets.load_dataset(...)
+>
+> data.save_to_disk(/YOUR/DATASET/DIR)
+>
+> ```
+>
+> 2. copy the dir from online to the offline machine
+>
+> 3. (offline machine)
+>
+> ```
+>
+> import datasets
+>
+> data = datasets.load_from_disk(/SAVED/DATA/DIR)
+>
+> ```
+>
+>
+>
+> HTH.
+
+
+SCORE: 22.893993377685547
+TITLE: Discussion using datasets in offline mode
+URL: https://github.com/huggingface/datasets/issues/824
+==================================================
+
+COMMENT: here is my way to load a dataset offline, but it **requires** an online machine
+1. (online machine)
+\`\`\`
+import datasets
+data = datasets.load_dataset(...)
+data.save_to_disk(/YOUR/DATASET/DIR)
+\`\`\`
+2. copy the dir from online to the offline machine
+3. (offline machine)
+\`\`\`
+import datasets
+data = datasets.load_from_disk(/SAVED/DATA/DIR)
+\`\`\`
+
+HTH.
+SCORE: 22.406635284423828
+TITLE: Discussion using datasets in offline mode
+URL: https://github.com/huggingface/datasets/issues/824
+==================================================
+"""
+```
+
+Nu-i rău! A doua încercare se pare că se potrivește cu query-ul!
+
+<Tip>
+
+✏️ **Încearcă!** Creează propriul tău query și vezi dacp poți găsi un răspuns și să extragi documentele. S-ar putea să trebuiești să crești parametrul `k` în `Dataset.get_nearest_examples()` pentru a mări căutarea.
+
+</Tip>
\ No newline at end of file
diff --git a/chapters/ro/chapter5/7.mdx b/chapters/ro/chapter5/7.mdx
new file mode 100644
index 000000000..ca66adcd9
--- /dev/null
+++ b/chapters/ro/chapter5/7.mdx
@@ -0,0 +1,16 @@
+# 🤗 Datasets, check![[datasets-check]]
+
+<CourseFloatingBanner
+    chapter={5}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+Ei bine, a fost un tur palpitant prin biblioteca 🤗 Datasets -- felicitări pentru că ai ajuns până aici! Cu cunoștințele pe care le-ai dobândit din acest capitol, ar trebui să fii capabil să:
+
+- Încarci dataseturi de oriunde, fie Hugging Face Hub, laptopul tău sau un server remote de la compania ta.
+- Modelezi datele tale folosind o combinație a funcțiilor `Dataset.map()` și `Dataset.filter()`.
+- Schimbi rapid între data formats precum Pandas și NumPy folosind `Dataset.set_format()`.
+- Creezi propriul tău dataset și să îl publici pe Hugging Face Hub.
+- Încorporezi documentele tale folosind un model Transformer și construiești un motor de căutare semantică folosind FAISS.
+
+În [Capitolul 7](/course/chapter7), vom pune toate acestea în practică, făcând o examinare amănunțită a principalelor sarcini NLP pentru care modelele Transformer sunt excelente. Înainte de a trece mai departe, puneți-vă cunoștințele despre 🤗 Datasets la încercare cu un quiz rapid!
\ No newline at end of file
diff --git a/chapters/ro/chapter5/8.mdx b/chapters/ro/chapter5/8.mdx
new file mode 100644
index 000000000..6b1b08936
--- /dev/null
+++ b/chapters/ro/chapter5/8.mdx
@@ -0,0 +1,228 @@
+# Testul de sfârșit de capitol[[end-of-chapter-quiz]]
+
+<CourseFloatingBanner
+    chapter={5}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+Acest capitol a acoperit o mulțime de subiecte! Nu vă faceți griji dacă nu ați înțeles toate detaliile; capitolele următoare vă vor ajuta să înțelegeți cum funcționează lucrurile mai aprofundat.
+
+Înainte de a trece mai departe, totuși trebuie să testăm ce ați învățat în acest capitol.
+
+### 1. Funcția `load_dataset()` din 🤗 Datasets vă permite să încărcați un dataset din care dintre următoarele locații?
+
+<Question
+    choices={[
+        {
+            text: "Local, de exemplu pe laptop",
+            explain: "Corect! Puteți trece path-urile fișierelor locale ca argument al `data_files` al `load_dataset()` pentru a încărca dataseturi locale.",
+            correct: true
+        },
+        {
+            text: "Hugging Face Hub",
+            explain: "Corect! Puteți încărca dataseturi de pe Hub furnizând ID-ul datasetului, de exemplu <code>load_dataset('emotion')</code>.",
+            correct: true
+        },
+        {
+            text: "Un server remote",
+            explain: "Corect! Puteți trece URL-uri ca argument al `data_files` al `load_dataset()` pentru a încărca fișiere remote.",
+            correct: true
+        },
+    ]}
+/>
+
+### 2. Presupunem că încărcați una dintre sarcinile GLUE astfel:
+
+```py
+from datasets import load_dataset
+
+dataset = load_dataset("glue", "mrpc", split="train")
+```
+
+Care dintre următoarele comenzi va produce un exemplu aleatoriu de 50 de elemente din `dataset`?
+
+<Question
+    choices={[
+        {
+            text: "<code>dataset.sample(50)</code>",
+            explain: "Acest lucru este incorect -- nu există o metodă `Dataset.sample()`."
+        },
+        {
+            text: "<code>dataset.shuffle().select(range(50))</code>",
+            explain: "Corect! Așa cum ați văzut în acest capitol, mai întâi faceți shuffle datasetului și apoi selectați exemplele din el.",
+            correct: true
+        },
+        {
+            text: "<code>dataset.select(range(50)).shuffle()</code>",
+            explain: "Acest lucru este incorect -- deși codul va rula, va amesteca doar primele 50 de elemente din setul de date."
+        }
+    ]}
+/>
+
+### 3. Presupunem că aveți un set de date despre animale de companie numit `pets_dataset`, care are o coloană `name` care denotă numele fiecărui animal de companie. Care dintre următoarele abordări v-ar permite să filtrați setul de date pentru toate animalele de companie ale căror nume încep cu litera "L"?
+
+<Question
+    choices={[
+        {
+            text: "<code>pets_dataset.filter(lambda x : x['name'].startswith('L'))</code>",
+            explain: "Corect! Utilizarea unei funcții lambda python pentru aceste filtre rapide este o idee grozavă. Vă puteți gândi și la o altă soluție?",
+            correct: true
+        },
+        {
+            text: "<code>pets_dataset.filter(lambda x['name'].startswith('L'))</code>",
+            explain: "Acest lucru este incorect -- o funcție lambda are forma generală <code>lambda *arguments* : *expression*</code>, deci trebuie să furnizați argumente în acest caz."
+        },
+        {
+            text: "Creați o funcție ca <code>def filter_names(x): return x['name'].startswith('L')</code> și rulați <code>pets_dataset.filter(filter_names)</code>.",
+            explain: "Corect! La fel ca și cu <code>Dataset.map()</code>, puteți trece funcții explicite la <code>Dataset.filter()</code>. Acest lucru este util atunci când aveți o logică complexă care nu este potrivită pentru o funcție lambda. Care dintre celelalte soluții ar mai funcționa?",
+            correct: true
+        }
+    ]}
+/>
+
+### 4. Ce este memory mapping?
+
+<Question
+    choices={[
+        {
+            text: "Mappingul între CPU și GPU RAM",
+            explain: "Acest lucru nu este corect -- încearcă din nou!",
+        },
+        {
+            text: "Mapping între RAM și stocarea sistemului de fișiere",
+            explain: "Corect! 🤗 Datasets tratează fiecare dataset ca pe un fișier memory-mapped. Acest lucru permite bibliotecii să acceseze și să opereze pe elemente ale datasetului fără să fie nevoie să îl încarce complet în memorie.",
+            correct: true
+        },
+        {
+            text: "Mapping între două fișiere din cache-ul 🤗 Datasets",
+            explain: "Acest lucru nu este corect -- încearcă din nou!"
+        }
+    ]}
+/>
+
+### 5. Care sunt principalele beneficii ale memory-mapping?
+
+<Question
+    choices={[
+        {
+            text: "Accesarea fișierelor memory-mapped este mai rapid decât citirea de pe disc sau scrierea pe disc.",
+            explain: "Corect! Acest lucru permite 🤗 Datasets să fie extrem de rapid. Acesta însă nu este singurul beneficiu.",
+            correct: true
+        },
+        {
+            text: "Aplicațiile pot accesa segmente de date dintr-un fișier extrem de mare fără a fi necesar să citească întregul fișier în RAM mai întâi.",
+            explain: "Corect! Acest lucru permite 🤗 Datasets să încarce dataseturi de câțiva gigabytes pe laptopul tău fără a fi nevoie să supraîncărcați CPU-ul. Ce alt avantaj oferă memory-mapping?",
+            correct: true
+        },
+        {
+            text: "Acesta consumă mai puțină energie, astfel încât bateria ta ține mai mult.",
+            explain: "Acest lucru nu este corect -- încearcă din nou!"
+        }
+    ]}
+/>
+
+### 6. De ce codul următor eșuează?
+
+```py
+from datasets import load_dataset
+
+dataset = load_dataset("allocine", streaming=True, split="train")
+dataset[0]
+```
+
+<Question
+    choices={[
+        {
+            text: "Încearcă să facă streaming unui dataset prea mare pentru a încăpea în RAM.",
+            explain: "Acest lucru nu este corect -- streaming datasets sunt decompresate pe loc, și puteți prelucra dataseturi de terabytes cu foarte puțin RAM!",
+        },
+        {
+            text: "Încearcă să acceseze un <code>IterableDataset</code>.",
+            explain: "Corect! Un <code>IterableDataset</code> este un generator, nu un container, deci ar trebui să accesați elementele sale utilizând <code>next(iter(dataset))</code>.",
+            correct: true
+        },
+        {
+            text: "Datasetul <code>allocine</code> nu are o un split <code>train</code>.",
+            explain: "Acest lucru este incorect -- consultați cardul datasetului <code>allocine</code> de pe Hub pentru a vedea ce splituri conține."
+        }
+    ]}
+/>
+
+### 7. Care sunt principalele beneficii ale creării unui dataset card?
+
+<Question
+    choices={[
+        {
+            text: "Oferă informații despre utilizarea intenționată și sarcinile susținute ale datasetului, astfel încât ceilalți din comunitate să poată lua o decizie cu privire la utilizarea acestuia.",
+            explain: "Corect! Dataseturile nedocumentate pot fi utilizate pentru a antrena modele care pot să nu reflecte intențiile creatorilor sau pot produce modele a căror statut juridic este incert dacă sunt antrenate pe date care încalcă confidențialitatea sau restricțiile de licențiere. Acesta nu este singurul beneficiu, totuși!",
+            correct: true
+        },
+        {
+            text: "Ajută la sublinierea biasurilor prezente într-un corpus.",
+            explain: "Corect! Aproape toate dataseturile au o formă de bias, ceea ce poate produce consecințe negative. A fi conștient de ele ajută creatorii de modele să înțeleagă cum să abordeze biasurile indispensabile. Cu ce altceva vă pot ajuta dataset cardurile?",
+            correct: true
+        },
+        {
+            text: "Îmbunătățește șansele ca ceilalți din comunitate să utilizeze datasetul meu.",
+            explain: "Corect! Un dataset card bine scris va avea tendința de a duce la o utilizare mai mare a prețiosului tău dataset. Ce beneficiu mai oferă?",
+            correct: true
+        },
+    ]}
+/>
+
+### 8. Ce este căutarea semantică?
+
+<Question
+    choices={[
+        {
+            text: "Un mod de a căuta pentru a găsi potriviri exacte între cuvintele dintr-un query și documentele dintr-un corpus",
+            explain: "Acest lucru este incorect -- acest tip de căutare se numește *căutare lexicală*, și este ceea ce vedeți de obicei cu motoarele de căutare tradiționale."
+        },
+        {
+            text: "Un mod de a căuta documente care se potrivesc prin înțelegerea sensului contextual al unui query",
+            explain: "Corect! Căutarea semantică utilizează embedding vectors pentru a reprezenta queries și documente și utilizează o metrică de similaritate pentru a măsura cantitatea de suprapunere între ele. Cum altfel ați putea descrie-o?",
+            correct: true
+        },
+        {
+            text: "Un mod de a îmbunătăți acuratețea căutării",
+            explain: "Corect! Motoarele de căutare semantice pot captura intenția unui query mult mai bine decât potrivirea de cuvinte cheie și de obicei preia documente cu o precizie mai mare. Dar acesta nu este singurul răspuns corect -- ce alt beneficiu oferă căutarea semantică?",
+            correct: true
+        }
+    ]}
+/>
+
+### 9. Pentru căutarea semantică asimetrică, de obicei aveți:
+
+<Question
+    choices={[
+        {
+            text: "Un query scurt și un paragraf mai lung care răspunde la query",
+            explain: "Corect!",
+            correct: true
+        },
+        {
+            text: "Queries și paragrafe care sunt de aproximativ aceeași lungime",
+            explain: "Acest lucru este de fapt un exemplu de căutare semantică simetrică -- încercați din nou!"
+        },
+        {
+            text: "Un query lung și un paragraf mai scurt care răspunde la query",
+            explain: "Acest lucru este incorect -- încercați din nou!"
+        }
+    ]}
+/>
+
+### 10. Pot utiliza 🤗 Datasets pentru a încărca date pentru utilizare în alte domenii, cum ar fi speech processing?
+
+<Question
+    choices={[
+        {
+            text: "Nu",
+            explain: "Acest lucru este incorect -- 🤗 Datasets acceptă în prezent date tabulare, audio și imagini. Consultați datasetul <a href='https://huggingface.co/datasets/mnist'>MNIST</a> de pe Hub pentru a vedea un exemplu de computer vision."
+        },
+        {
+            text: "Da",
+            explain: "Corect! Consultați dezvoltările interesante cu privire la speech și vision în biblioteca 🤗 Transformers pentru a vedea cum 🤗 Datasets este utilizat în aceste domenii.",
+            correct: true
+        },
+    ]}
+/>
\ No newline at end of file

From bfe0bafa2f22e816b7b28f0474d8462984212bd5 Mon Sep 17 00:00:00 2001
From: Angroys <120798951+Angroys@users.noreply.github.com>
Date: Wed, 8 Jan 2025 02:53:50 +0200
Subject: [PATCH 010/167] Done chapter 6

---
 chapters/ro/chapter 6/1.mdx  |  19 ++
 chapters/ro/chapter 6/10.mdx | 283 +++++++++++++++
 chapters/ro/chapter 6/2.mdx  | 257 ++++++++++++++
 chapters/ro/chapter 6/3.mdx  | 473 ++++++++++++++++++++++++++
 chapters/ro/chapter 6/3b.mdx | 643 +++++++++++++++++++++++++++++++++++
 chapters/ro/chapter 6/4.mdx  | 122 +++++++
 chapters/ro/chapter 6/5.mdx  | 360 ++++++++++++++++++++
 chapters/ro/chapter 6/6.mdx  | 375 ++++++++++++++++++++
 chapters/ro/chapter 6/7.mdx  | 381 +++++++++++++++++++++
 chapters/ro/chapter 6/8.mdx  | 566 ++++++++++++++++++++++++++++++
 chapters/ro/chapter 6/9.mdx  |  16 +
 11 files changed, 3495 insertions(+)
 create mode 100644 chapters/ro/chapter 6/1.mdx
 create mode 100644 chapters/ro/chapter 6/10.mdx
 create mode 100644 chapters/ro/chapter 6/2.mdx
 create mode 100644 chapters/ro/chapter 6/3.mdx
 create mode 100644 chapters/ro/chapter 6/3b.mdx
 create mode 100644 chapters/ro/chapter 6/4.mdx
 create mode 100644 chapters/ro/chapter 6/5.mdx
 create mode 100644 chapters/ro/chapter 6/6.mdx
 create mode 100644 chapters/ro/chapter 6/7.mdx
 create mode 100644 chapters/ro/chapter 6/8.mdx
 create mode 100644 chapters/ro/chapter 6/9.mdx

diff --git a/chapters/ro/chapter 6/1.mdx b/chapters/ro/chapter 6/1.mdx
new file mode 100644
index 000000000..9cfd151ed
--- /dev/null
+++ b/chapters/ro/chapter 6/1.mdx	
@@ -0,0 +1,19 @@
+# Introducere[[introducere]]
+
+<CourseFloatingBanner
+    chapter={6}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+În [Capitolul 3](/course/chapter3), am examinat cum să facem fine-tune unui model pentru o anumită sarcină. Când facem acest lucru, utilizăm același tokenizer cu care modelul a fost antrenat - dar ce facem când dorim să antrenăm un model de la zero? În așa cazuri, utilizarea unui tokenizer care a fost antrenat pe un corpus dintr-un alt domeniu sau limbă este, de obicei, suboptimal. De exemplu, un tokenizer antrenat pe un corpus în limba engleză va funcționa rău pe un corpus de texte în limba japoneză, deoarece utilizarea spațiilor și a punctuației este foarte diferită în cele două limbi.
+
+În acest capitol, veți învăța cum să antrenați un tokenizer complet nou pe un corpus de texte, astfel încât să poată fi utilizat pentru a antrena un model de limbaj. Acest lucru va fi realizat cu ajutorul bibliotecii [🤗 Tokenizers](https://github.com/huggingface/tokenizers), care oferă tokenizerii "rapizi" din biblioteca [🤗 Transformers](https://github.com/huggingface/transformers). Vom examina îndeaproape caracteristicile pe care această bibliotecă le oferă și vom explora cum tokenizatorii rapizi diferă de versiunile "lente".
+
+Subiectele pe care le vom acoperi includ:
+
+* Cum să antrenați un tokenizer nou similar celui utilizat de un anumit checkpoint pe un corpus nou de texte
+* Caracteristicile speciale ale tokenizerilor rapizi
+* Diferențele dintre cei trei algoritmi principali de subword tokenization utilizate în NLP în prezent
+* Cum să construiți un tokenizer de la zero cu biblioteca 🤗 Tokenizers și să îl antrenați pe anumite date
+
+Tehnicile prezentate în acest capitol vă vor pregăti pentru secțiunea din [Capitolul 7](/course/chapter7/6), unde vom examina crearea unui model de limbaj pentru codul sursă Python. Să începem prin a explora ce înseamnă să "antrenați" un tokenizer în primul rând.
diff --git a/chapters/ro/chapter 6/10.mdx b/chapters/ro/chapter 6/10.mdx
new file mode 100644
index 000000000..f3fcf6dc7
--- /dev/null
+++ b/chapters/ro/chapter 6/10.mdx	
@@ -0,0 +1,283 @@
+<!-- DISABLE-FRONTMATTER-SECTIONS -->
+
+# Quiz de sfârșit de capitol[[end-of-chapter-quiz]]
+
+<CourseFloatingBanner
+    chapter={6}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+Hai să testăm ceea ce ai învățat în acest capitol!
+
+### 1. Când ar trebui să antrenezi un nou tokenizer?
+
+<Question
+	choices={[
+		{
+			text: "Când datasetul tău este similar cu cel utilizat de un model preantrenat și doriți să preantrenați un model nou",
+			explain: "În acest caz, pentru a economisi timp și resurse, o alegere mai bună ar fi să folosești același tokenizer ca și modelul preantrenat și să faceți fine-tune acelui model."
+		},
+		{
+			text: "Atunci când datasetul tău este similar cu cel utilizat de un model preantrenat existent și doriți să faceți fine-tune unui nou model utilizând acest model preantrenat",
+			explain: "Pentru a face fine-tune unui model dintr-un model preantrenat, trebuie să utilizați întotdeauna același tokenizer."
+		},
+		{
+			text: "Atunci când datasetul tău este diferit de cel utilizat de un model preantrenat existent și doriți să preantrenați un nou model",
+			explain: "Corect! În acest caz nu există niciun avantaj în a utiliza același tokenizer.",
+            correct: true
+		},
+        {
+			text: "Atunci datasetul tău este diferit de cel utilizat de un model preantrenat existent, dar doriți să faceți fine-tune unui model nou utilizând acest model preantrenat",
+			explain: "Pentru a face fine-tune unui model dintr-un model preantrenat, trebuie să utilizați întotdeauna același tokenizer."
+		}
+	]}
+/>
+
+### 2. Care este avantajul utilizării unui generator de liste de texte în comparație cu o listă de liste de texte atunci când utilizați `train_new_from_iterator()`?
+
+<Question
+	choices={[
+		{
+			text: "Acesta este singurul tip pe care metoda <code>train_new_from_iterator()</code> îl acceptă.",
+			explain: "O listă de liste de texte este un tip special de generator de liste de texte, astfel încât metoda o va accepta și pe aceasta. Încercați din nou!"
+		},
+		{
+			text: "Veți evita încărcarea întregului dataset în memorie.",
+			explain: "Corect! Fiecare batch de texte va fi eliberat din memorie atunci când iterați, iar câștigul va fi vizibil mai ales dacă utilizați 🤗 Datasets pentru a stoca textele.",
+			correct: true
+		},
+		{
+			text: "Acest lucru va permite bibliotecii 🤗 Tokenizers să utilizeze multiprocessing.",
+			explain: "Nu, oricum va folosi multiprocessing."
+		},
+        {
+			text: "Tokenizerul pe care îl vei antrena va genera texte mai bune.",
+			explain: "Tokenizerul nu generează text - îl confundați cu un model lingvistic?"
+		}
+	]}
+/>
+
+### 3. Care sunt avantajele utilizării unui tokenizer "rapid"?
+
+<Question
+	choices={[
+		{
+			text: "Acesta poate procesa inputuri mai rapid decât un tokenizator lent atunci când faci batch mai multor inputuri împreună.",
+			explain: "Corect! Datorită paralelismului implementat în Rust, acesta va fi mai rapid pe batch-uri de inputuri. La ce alt beneficiu te poți gândi?",
+			correct: true
+		},
+		{
+			text: "Tokenizerele rapide tokenizează întotdeauna mai rapid decât omologii lor lenți.",
+			explain: "Un tokenizer rapid poate fi de fapt mai lent atunci când îi dai doar unul sau foarte puține texte, deoarece nu poate utiliza paralelismul."
+		},
+		{
+			text: "Poate aplica padding și truncation.",
+			explain: "Adevărat, dar și tokenizerele lente fac asta."
+		},
+        {
+			text: "Acesta are unele caracteristici suplimentare care vă permit să asociați tokenii cu intervalul de text care le-a creat.",
+			explain: "Într-adevăr - acestea se numesc offset mappings. Totuși, acesta nu este singurul avantaj.",
+			correct: true
+		}
+	]}
+/>
+
+### 4. Cum tratează pipelineul `token-classification` entitățile care se întind pe mai mulți tokeni?
+
+<Question
+	choices={[
+		{
+			text: "Entitățile cu același label sunt merged într-o singură entitate.",
+			explain: "Explicația aceasta e prea simplă. Încearcă din nou!"
+		},
+		{
+			text: "Există un label pentru începutul unei entități și un label pentru continuarea unei entități.",
+			explain: "Corect!",
+			correct: true
+		},
+		{
+			text: "Într-un cuvânt dat, atâta timp cât primul token are labelul entității, întregul cuvânt este considerat etichetat cu entitatea respectivă.",
+			explain: "Aceasta este o strategie de gestionare a entităților. Ce alte răspunsuri se aplică aici?",
+			correct: true
+		},
+        {
+			text: "Atunci când un token are labelul unei entități date, orice alt token următor cu aceeași label este considerat parte a aceleiași entități, cu excepția cazului în care este labeled ca fiind începutul unei noi entități.",
+			explain: "Acesta este cel mai comun mod de a grupa entitățile împreună - deși nu este singurul răspuns corect.",
+			correct: true
+		}
+	]}
+/>
+
+### 5. Cum gestionează pipelineul `question-answering` contextele lungi?
+
+<Question
+	choices={[
+		{
+			text: "De fapt, nu o face, deoarece trunchiază contextul lung la lungimea maximă acceptată de model.",
+			explain: "Există un truc pe care îl poți folosi pentru a gestiona contextele lungi. Îți amintești care este acesta?"
+		},
+		{
+			text: "Acesta împarte contextul în mai multe părți și calculează media rezultatelor obținute.",
+			explain: "Nu, nu ar avea sens să se facă o medie a rezultatelor, deoarece unele părți ale contextului nu vor include răspunsul."
+		},
+		{
+			text: "Acesta împarte contextul în mai multe părți (cu suprapuneri) și găsește scorul maxim pentru un răspuns în fiecare parte.",
+			explain: "Acesta este răspunsul corect!",
+			correct: true
+		},
+        {
+			text: "Acesta împarte contextul în mai multe părți (fără suprapunere, pentru eficiență) și găsește scorul maxim pentru un răspuns în fiecare parte.",
+			explain: "Nu, acesta include o anumită suprapunere între părți pentru a evita situația în care răspunsul ar fi împărțit în două părți."
+		}
+	]}
+/>
+
+### 6. Ce este normalizarea?
+
+<Question
+	choices={[
+		{
+			text: "Este vorba de orice curățare pe care tokenizerul o efectuează asupra textelor în etapele inițiale.",
+			explain: "Corect - de exemplu, ar putea implica eliminarea accentelor sau a spațiilor, sau scrierea cu mijuscule a inputurilor.",
+			correct: true
+		},
+		{
+			text: "Este o tehnică de augmentare a datelor care constă în a face textul mai normal prin eliminarea cuvintelor rare.",
+			explain: "Este incorect! Încearcă din nou."
+		},
+		{
+			text: "Acesta este ultimul pas de post-procesare în care tokenizerul adaugă tokenii speciali.",
+			explain: "Această etapă se numește pur și simplu post-procesare."
+		},
+        {
+			text: "Este atunci când embeddingurile sunt realizate cu media 0 și standard deviation 1, prin scăderea mediei și împărțirea la std.",
+			explain: "Acest proces se numește de obicei normalizare atunci când este aplicat valorilor pixelilor în computer vision, dar nu este ceea ce înseamnă normalizare în NLP."
+		}
+	]}
+/>
+
+### 7. Ce este pre-tokenizarea pentru un subword tokenizer?
+
+<Question
+	choices={[
+		{
+			text: "Acesta este pasul dinaintea tokenizării, în care se aplică augmentarea datelor (cum ar fi mascarea aleatorie).",
+			explain: "Nu, acest pas face parte din preprocesare."
+		},
+		{
+			text: "Este pasul de dinaintea tokenizării, în care operațiile de curățare dorite sunt aplicate textului.",
+			explain: "Nu, acesta este pasul de normalizare."
+		},
+		{
+			text: "Acesta este pasul dinaintea aplicării modelul de tokenizer, pentru a împărți inputul în cuvinte.",
+			explain: "Acesta este răspunsul corect!",
+			correct: true
+		},
+        {
+			text: "Acesta este pasul dinaintea aplicării modelul de  tokenizer, pentru a împărți inputul în tokenuri.",
+			explain: "Nu, împărțirea în tokenuri este sarcina modelul de tokenizer."
+		}
+	]}
+/>
+
+### 8. Selectați propozițiile care se aplică modelului de tokenizare BPE.
+
+<Question
+	choices={[
+		{
+			text: "BPE este un algoritm de tokenizare a subcuvintelor care începe cu un vocabular mic și învață reguli de merge.",
+			explain: "Acesta este într-adevăr cazul!",
+			correct: true
+		},
+		{
+			text: "BPE este un algoritm de tokenizare a subcuvintelor care începe cu un vocabular mare și elimină progresiv tokenii din acesta.",
+			explain: "Nu, aceasta este abordarea adoptată de un alt algoritm de tokenizare."
+		},
+		{
+			text: "Tokenizerele BPE învață regulile de merge prin mergeul perechii de tokeni care este cea mai frecventă.",
+			explain: "Acest lucru este corect!",
+			correct: true
+		},
+		{
+			text: "Un tokenizer BPE învață o regulă de merge prin mergeul perechii de tokeni care maximizează un scor care privilegiază perechile frecvente cu părți individuale mai puțin frecvente.",
+			explain: "Nu, aceasta este strategia aplicată de un alt algoritm de tokenizare."
+		},
+		{
+			text: "BPE tokenizează cuvintele în subcuvinte prin divizarea lor în caractere și apoi prin aplicarea regulilor de merge.",
+			explain: "Acest lucru este corect!",
+			correct: true
+		},
+		{
+			text: "BPE tokenizează cuvintele în subcuvinte prin găsirea celui mai lung subcuvânt de la început care se află în vocabular, apoi repetă procesul pentru restul textului.",
+			explain: "Nu, acesta este un alt mod de a face lucrurile al algoritmului de tokenizare."
+		},
+	]}
+/>
+
+### 9. Selectați propozițiile care se aplică modelului de tokenizare WordPiece.
+
+<Question
+	choices={[
+		{
+			text: "WordPiece este un algoritm de tokenizare a subcuvintelor care începe cu un vocabular mic și învață reguli de merge.",
+			explain: "Acesta este într-adevăr cazul!",
+			correct: true
+		},
+		{
+			text: "WordPiece este un algoritm de tokenizare a subcuvintelor care începe cu un vocabular mare și elimină progresiv tokenii din acesta.",
+			explain: "Nu, aceasta este abordarea adoptată de un alt algoritm de tokenizare."
+		},
+		{
+			text: "Tokenizerele WordPiece învață regulile de merge prin mergeul perechii de tokeni care este cea mai frecventă.",
+			explain: "Nu, aceasta este abordarea adoptată de un alt algoritm de tokenizare!",
+		},
+		{
+			text: "Un tokenizer WordPiece învață o regulă de merge prin mergeul perechii de tokeni care maximizează un scor care privilegiază perechile frecvente cu părți individuale mai puțin frecvente.",
+			explain: "Acest lucru este corect!",
+			correct: true
+		},
+		{
+			text: "WordPiece tokenizează cuvintele în subcuvinte prin găsirea celei mai probabile segmentări în tokeni, în conformitate cu modelul.",
+			explain: "Nu, acesta este modul în care funcționează un alt algoritm de tokenizare."
+		},
+		{
+			text: "WordPiece tokenizează cuvintele în subcuvinte prin găsirea celui mai lung subcuvânt de la început care se află în vocabular, apoi repetă procesul pentru restul textului.",
+			explain: "Da, acesta este modul în care WordPiece procedează pentru encoding.",
+			correct: true
+		},
+	]}
+/>
+
+### 10. Selectați propozițiile care se aplică modelului de tokenizare Unigram.
+
+<Question
+	choices={[
+		{
+			text: "Unigram este un algoritm de tokenizare a subcuvintelor care începe cu un vocabular mic și învață reguli de merge.",
+			explain: "Nu, aceasta este abordarea adoptată de un alt algoritm de tokenizare."
+		},
+		{
+			text: "Unigram este un algoritm de tokenizare a subcuvintelor care începe cu un vocabular mare și elimină progresiv tokenurile din el.",
+			explain: "Acest lucru este corect!",
+			correct: true
+		},
+		{
+			text: "Unigram își adaptează vocabularul prin minimizarea unei pierderi calculate pe întregul corpus.",
+			explain: "Acest lucru este corect!",
+			correct: true
+		},
+		{
+			text: "Unigram își adaptează vocabularul prin păstrarea celor mai frecvente subcuvinte.",
+			explain: "Nu, acest lucru este incorect."
+		},
+		{
+			text: "Unigram tokenizează cuvintele în subcuvinte prin găsirea celei mai probabile segmentări în tokenuri, conform modelului.",
+			explain: "Acest lucru este corect!",
+			correct: true
+		},
+		{
+			text: "Unigram tokenizează cuvintele în subcuvinte prin divizarea lor în caractere, apoi aplică regulile de merge.",
+			explain: "Nu, acesta este modul în care funcționează un alt algoritm de tokenizare."
+		},
+	]}
+/>
diff --git a/chapters/ro/chapter 6/2.mdx b/chapters/ro/chapter 6/2.mdx
new file mode 100644
index 000000000..ef36da15c
--- /dev/null
+++ b/chapters/ro/chapter 6/2.mdx	
@@ -0,0 +1,257 @@
+# Antrenarea unui nou tokenizer dintr-unul vechi[[training-a-new-tokenizer-from-an-old-one]]
+
+<CourseFloatingBanner chapter={6}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter6/section2.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter6/section2.ipynb"},
+]} />
+
+Dacă un model de limbaj nu este disponibil în limba dorită sau dacă corpusul tău este foarte diferit de cel pe care modelul de limbaj a fost antrenat, este probabil că veți dori să antrenați modelul de la zero, folosind un tokenizer adaptat datelor tale. Acest lucru va necesita antrenarea unui nou tokenizer pe datasetul tău. Dar ce înseamnă exact asta? Când am examinat pentru prima dată tokenizatorii în [Capitolul 2](/course/chapter2), am văzut că majoritatea modelelor Transformer folosesc un _algoritm de subword tokenization_. Pentru a identifica care subcuvinte sunt de interes și apar cel mai frecvent în corpusul respectiv, tokenizerul trebuie să examineze cu atenție toate textele din corpus - un proces pe care îl numim *antrenare*. Regulile exacte care conduc această antrenare depind de tipul de tokenizer utilizat și vom prezenta cei trei algoritmi principali mai târziu în acest capitol.
+
+<Youtube id="DJimQynXZsQ"/>
+
+<Tip warning={true}>
+
+⚠️ Antrenarea unui tokenizer nu este același lucru ca antrenarea unui model! Antrenarea modelului folosește stochastic gradient descent pentru a face pierderea puțin mai mică pentru fiecare batch. Este randomizată prin natură (ceea ce înseamnă că trebuie să setați niște seeduri pentru a obține aceleași rezultate atunci când faceți aceeași antrenare de două ori). Antrenarea unui tokenizer este un proces statistic care încearcă să identifice care subcuvinte sunt cele mai bune pentru a fi selectate pentru un anumit corpus, și regulile exacte utilizate pentru a le selecta depind de algoritmul de tokenizare. Este determinist, ceea ce înseamnă că întotdeauna obțineți aceleași rezultate atunci când antrenați cu același algoritm pe același corpus.
+
+</Tip>
+
+## Asamblarea unui corpus[[assembling-a-corpus]]
+
+Există o interfață API foarte simplă în 🤗 Transformers pe care o puteți utiliza pentru a antrena un nou tokenizer cu aceleași caracteristici ca unul existent: `AutoTokenizer.train_new_from_iterator()`. Pentru a vedea acest lucru în acțiune, să zicem că vrem să antrenăm GPT-2 de la zero, dar într-o altă limbă decât engleza. Prima noastră sarcină va fi să adunăm multe date în acea limbă într-un corpus de antrenare. Pentru a oferi exemple pe care toată lumea le poate înțelege, nu vom folosi o limbă ca rusă sau chineza aici, ci mai degrabă o limbă engleză specializată: codul Python.
+
+Biblioteca [🤗 Datasets](https://github.com/huggingface/datasets) ne poate ajuta să asamblăm un corpus de cod sursă Python. Vom folosi funcția obișnuită `load_dataset()` pentru a descărca și a păstra în cache dataseul [CodeSearchNet](https://huggingface.co/datasets/code_search_net). Acest dataset a fost creat pentru [Provocarea CodeSearchNet](https://wandb.ai/github/CodeSearchNet/benchmark) și conține milioane de funcții din biblioteci open-source de pe GitHub în mai multe limbaje de programare. Aici, vom încărca partea Python a acestui dataset:
+
+```py
+from datasets import load_dataset
+
+# Acest lucru poate dura câteva minute pentru a încărca, așa că luați o pauză și beți o ceașcă de cafea sau ceai în timp ce așteptați!
+raw_datasets = load_dataset("code_search_net", "python")
+```
+
+Putem să ne uităm la splitul de antrenare pentru a vedea la care coloane avem acces:
+
+```py
+raw_datasets["train"]
+```
+
+```python out
+Dataset({
+    features: ['repository_name', 'func_path_in_repository', 'func_name', 'whole_func_string', 'language', 
+      'func_code_string', 'func_code_tokens', 'func_documentation_string', 'func_documentation_tokens', 'split_name', 
+      'func_code_url'
+    ],
+    num_rows: 412178
+})
+```
+
+Putem vedea că dataset-ul separă docstringurile de cod și sugerează o tokenizare a ambelor. Aici, vom folosi doar coloana `whole_func_string` pentru a antrena tokenizerul nostru. Putem să ne uităm la un exemplu al unei astfel de funcții prin indexarea în splitul de antrenare:
+
+```py
+print(raw_datasets["train"][123456]["whole_func_string"])
+```
+
+care ar trebui să printeze următorul lucru:
+
+```out
+def handle_simple_responses(
+      self, timeout_ms=None, info_cb=DEFAULT_MESSAGE_CALLBACK):
+    """Accepts normal responses from the device.
+
+    Args:
+      timeout_ms: Timeout in milliseconds to wait for each response.
+      info_cb: Optional callback for text sent from the bootloader.
+
+    Returns:
+      OKAY packet's message.
+    """
+    return self._accept_responses('OKAY', info_cb, timeout_ms=timeout_ms)
+```
+
+Primul lucru pe care trebuie să-l facem este să transformăm setul de date într-un _iterator_ de liste de texte - de exemplu, o listă de liste de texte. Utilizarea listelor de texte va permite tokenizerului nostru să funcționeze mai rapid (antrenându-se pe batch-uri de texte în loc de a procesa texte individuale unul câte unul), iar acesta ar trebui să fie un iterator dacă dorim să evităm să avem tot în memoria RAM deodată. Dacă corpusul tău este uriaș, veți dori să profitați de faptul că 🤗 Datasets nu încarcă totul în memoria RAM, ci stochează elementele datasetului pe disc.
+
+Următoarea operație ar crea o listă de liste de 1.000 de texte fiecare, dar ar încărca totul în memorie:
+
+```py
+# Nu faceți uncomment următoarei linii dacă datasetul vostru este mare, ci doar dacă este mic!
+# training_corpus = [raw_datasets["train"][i: i + 1000]["whole_func_string"] for i in range(0, len(raw_datasets["train"]), 1000)]
+```
+
+Utilizând un generator Python, putem evita ca Python să încarce orice în memorie până când este realmente necesar. Pentru a crea un astfel de generator, trebuie doar să înlocuiți parantezele pătrate cu paranteze rotunde:
+
+```py
+training_corpus = (
+    raw_datasets["train"][i : i + 1000]["whole_func_string"]
+    for i in range(0, len(raw_datasets["train"]), 1000)
+)
+```
+
+Această linie de cod nu extrage niciun element al setului de date; doar creează un obiect pe care îl puteți utiliza într-un `for` loop din Python. Textele vor fi încărcate doar atunci când veți avea nevoie de ele(adică atunci când sunteți la pasul loopului `for` care le solicită), iar doar 1.000 de texte vor fi încărcate la un moment dat. Acest mod vă permite să nu epuizați memoria RAM chiar dacă prelucrați un set de date uriaș.
+
+Problema cu un obiect generator este că poate fi utilizat doar o dată, așadar, în loc să ne ofere lista primelor 10 cifre de două ori:
+
+```py
+gen = (i for i in range(10))
+print(list(gen))
+print(list(gen))
+```
+
+noi le primim o dată și apoi o listă goală:
+
+```python out
+[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
+[]
+```
+
+Din acest motive noi definim o funcție ce returnează în schimb un generator: 
+
+```py
+def get_training_corpus():
+    return (
+        raw_datasets["train"][i : i + 1000]["whole_func_string"]
+        for i in range(0, len(raw_datasets["train"]), 1000)
+    )
+
+
+training_corpus = get_training_corpus()
+```
+
+În același timp poți defini un generator înăuntrul unui `for` loop folosing statementul `yield`:
+
+```py
+def get_training_corpus():
+    dataset = raw_datasets["train"]
+    for start_idx in range(0, len(dataset), 1000):
+        samples = dataset[start_idx : start_idx + 1000]
+        yield samples["whole_func_string"]
+```
+
+ceea ce va produce același generator ca înainte, dar îți va permite să folosești o logică mai complexă decât cea pe care ai putea să o folosești într-un list comprehension.
+
+## Antrenarea unui nou tokenizer[[training-a-new-tokenizer]]
+
+Acum că avem corpusul nostru sub forma unui iterator de batch-uri de texte, suntem gata să antrenăm un nou tokenizer. Pentru a face acest lucru, trebuie mai întâi să încărcăm tokenizerul pe care dorim să-l asociem cu modelul nostru (aici, GPT-2):
+
+```py
+from transformers import AutoTokenizer
+
+old_tokenizer = AutoTokenizer.from_pretrained("gpt2")
+```
+
+Chiar dacă urmează să antrenăm un nou tokenizer, este o idee bună să facem acest lucru pentru a evita să începem să facem tot de la zero. Astfel, nu vom fi nevoiți să specificăm nimic despre algoritmul de tokenizare sau despre special tokens pe care îi vom utiliza; noul nostru tokenizer va fi exact la fel ca GPT-2, iar singur lucrul care se va schimba este vocabularul, care va fi determinat de antrenarea pe corpusul nostru.
+
+Mai întâi, hai să vedem cum ar interpreta acest tokenizer un exemplu de funcție:
+
+```py
+example = '''def add_numbers(a, b):
+    """Add the two numbers `a` and `b`."""
+    return a + b'''
+
+tokens = old_tokenizer.tokenize(example)
+tokens
+```
+
+```python out
+['def', 'Ġadd', '_', 'n', 'umbers', '(', 'a', ',', 'Ġb', '):', 'Ċ', 'Ġ', 'Ġ', 'Ġ', 'Ġ"""', 'Add', 'Ġthe', 'Ġtwo',
+ 'Ġnumbers', 'Ġ`', 'a', '`', 'Ġand', 'Ġ`', 'b', '`', '."', '""', 'Ċ', 'Ġ', 'Ġ', 'Ġ', 'Ġreturn', 'Ġa', 'Ġ+', 'Ġb']
+```
+
+Acest tokenizer are câteva simboluri speciale, cum ar fi `Ġ` și `Ċ`, care denotă spații și noi linii, respectiv. Așa cum se poate vedea, acest lucru nu este prea eficient: tokenizerul returnează tokenuri individuale pentru fiecare spațiu, când ar putea grupa împreună nivelurile de indentare (deoarece având seturi de patru sau opt spații va fi foarte comun în cod). De asemenea, a divizat numele funcției într-un mod ciudat, nefiind obișnuit să vadă cuvinte care conțin caracterele `_`.
+
+Acum hai să antrenăm un nou tokenizer și să vedem dacă rezolvă aceste probleme. Pentru aceasta, vom utiliza metoda `train_new_from_iterator()`:
+
+```py
+tokenizer = old_tokenizer.train_new_from_iterator(training_corpus, 52000)
+```
+
+Această comandă ar putea dura puțin timp dacă corpusul este foarte mare, dar pentru acest dataset de 1,6 GB de texte este extrem de rapid (1 minut și 16 secunde pe un procesor AMD Ryzen 9 3900X cu 12 nuclee).
+
+Reține că `AutoTokenizer.train_new_from_iterator()` funcționează doar dacă tokenizerul pe care îl utilizați este un tokenizer "rapid". Așa cum veți vedea în următoarea secțiune, biblioteca 🤗 Transformers conține două tipuri de tokenizeri: unii sunt scriși în pur Python, iar alții (cei rapizi) sunt susținuți de biblioteca 🤗 Tokenizers, care este scrisă în limbajul de programare Rust. Python este limbajul cel mai frecvent utilizat pentru aplicații de data science și deep learning, dar atunci când orice trebuie să fie paralelizat pentru a fi rapid, trebuie să fie scris într-un alt limbaj de programare. De exemplu, multiplicările matricelor care sunt la baza calculelor modelului sunt scrise în CUDA, o bibliotecă C optimizată pentru GPU-uri.
+
+Antrenarea unui tokenizer nou în pur  Python ar fi extrem de lent, de aceea am dezvoltat biblioteca 🤗 Tokenizers. Reține că, la fel cum nu a trebuit să învățați limbajul CUDA pentru a putea executa modelul pe un batch de inputuri pe un GPU, nu veți avea nevoie să învățați Rust pentru a utiliza un tokenizer rapid. Biblioteca 🤗 Tokenizers oferă legături Python pentru multe metode care apelează intern unele bucăți de cod în Rust; de exemplu, pentru a paraleliza antrenarea noului tokenizer sau, așa cum am văzut în [Capitolul 3](/course/chapter3), tokenizarea unui batch de inputuri.
+
+Majoritatea modelelor Transformer au un tokenizer rapid disponibil (există unele excepții pe care le puteți verifica [aici](https://huggingface.co/transformers/#supported-frameworks)), iar API-ul `AutoTokenizer` selectează întotdeauna tokenizerul rapid pentru tine dacă este disponibil. În următoarea secțiune, vom examina unele dintre celelalte caracteristici speciale ale tokenizerilor rapizi, care vor fi foarte utile pentru sarcini precum clasificarea tokenilor și răspunderea la întrebări. Înainte de a face acest lucru, totuși, să încercăm noul nostru tokenizer pe exemplul anterior:
+
+```py
+tokens = tokenizer.tokenize(example)
+tokens
+```
+
+```python out
+['def', 'Ġadd', '_', 'numbers', '(', 'a', ',', 'Ġb', '):', 'ĊĠĠĠ', 'Ġ"""', 'Add', 'Ġthe', 'Ġtwo', 'Ġnumbers', 'Ġ`',
+ 'a', '`', 'Ġand', 'Ġ`', 'b', '`."""', 'ĊĠĠĠ', 'Ġreturn', 'Ġa', 'Ġ+', 'Ġb']
+```
+
+Aici din nou vedem simboluri speciale ca `Ġ` sau `Ċ` care denotă spații sau linii noi, dar în același timp putem vedea că tokenizerul nostru a învățat câțiva tokens care sunt foarte specifici la corpusul de funcții Python: de exemplu, tokenul `ĊĠĠĠ` care reprezintă indentarea, sau tokenul `Ġ"""` care reprezintă cele trei ghilimele cu care se începe un docstring. Tokenizerul, de asemenea face split corect numelui funției pe `_`. Aceasta chiar este o reprezentare compactă: comparativ, utilizând limba tokenizerul Englez pe același exemplu ne va da o propoziție mai lungă:
+
+```py
+print(len(tokens))
+print(len(old_tokenizer.tokenize(example)))
+```
+
+```python out
+27
+36
+```
+
+Hai să ne uităm la un alt exemplu:
+
+```python
+example = """class LinearLayer():
+    def __init__(self, input_size, output_size):
+        self.weight = torch.randn(input_size, output_size)
+        self.bias = torch.zeros(output_size)
+
+    def __call__(self, x):
+        return x @ self.weights + self.bias
+    """
+tokenizer.tokenize(example)
+```
+
+```python out
+['class', 'ĠLinear', 'Layer', '():', 'ĊĠĠĠ', 'Ġdef', 'Ġ__', 'init', '__(', 'self', ',', 'Ġinput', '_', 'size', ',',
+ 'Ġoutput', '_', 'size', '):', 'ĊĠĠĠĠĠĠĠ', 'Ġself', '.', 'weight', 'Ġ=', 'Ġtorch', '.', 'randn', '(', 'input', '_',
+ 'size', ',', 'Ġoutput', '_', 'size', ')', 'ĊĠĠĠĠĠĠĠ', 'Ġself', '.', 'bias', 'Ġ=', 'Ġtorch', '.', 'zeros', '(',
+ 'output', '_', 'size', ')', 'ĊĊĠĠĠ', 'Ġdef', 'Ġ__', 'call', '__(', 'self', ',', 'Ġx', '):', 'ĊĠĠĠĠĠĠĠ',
+ 'Ġreturn', 'Ġx', 'Ġ@', 'Ġself', '.', 'weights', 'Ġ+', 'Ġself', '.', 'bias', 'ĊĠĠĠĠ']
+```
+
+În plus față de tokenul corespunzător unei indentări, aici putem vedea și un token pentru o indentare dublă: `ĊĠĠĠĠĠĠĠ`. Cuvintele speciale din Python, cum ar fi `class`, `init`, `call`, `self` și `return`, sunt tokenizate fiecare ca un singur token, și putem vedea că, pe lângă divizarea la `_` și `.`, tokenizerul divizează corect chiar și numele scrise în stil camel-case: `LinearLayer` este tokenizeat ca `["ĠLinear", "Layer"]`.
+
+## Salvarea tokenizerului[[saving-the-tokenizer]]
+
+Pentru a ne asigura că îl putem utiliza mai târziu, trebuie să salvăm noul nostru tokenizer. Asemănător salvării unui model, acest lucru se realizează cu metoda `save_pretrained()`:
+
+```py
+tokenizer.save_pretrained("code-search-net-tokenizer")
+```
+
+Acest lucru va crea un nou folder numit *code-search-net-tokenizer*, care va conține toate fișierele necesare pentru a reîncărca tokenizerul. Dacă doriți să partajați acest tokenizer cu colegii și prietenii tăi, îl puteți încărca pe Hub prin conectarea la contul tău. Dacă lucrați într-un notebook, există un convenience function pentru a vă ajuta cu acest lucru:
+
+```python
+from huggingface_hub import notebook_login
+
+notebook_login()
+```
+
+Acest lucru va afișa un widget în care puteți introduce credențialele de conectare Hugging Face. Dacă nu lucrați într-un notebook, introduceți simplu următoarea linie în terminal:
+
+```bash
+huggingface-cli login
+```
+
+După ce v-ați conectat, puteți face push tokenizerului prin executarea următoarei comenzi:
+
+```py
+tokenizer.push_to_hub("code-search-net-tokenizer")
+```
+
+Acest lucru va crea un nou repositoriu în namespacel tău cu numele `code-search-net-tokenizer`, care va conține fișierul tokenizerului. După aceea, puteți încărca tokenizerul de oriunde cu metoda `from_pretrained()`:
+
+```py
+# Înlocuiți "huggingface-course" mai jos cu namespaceul tău pentru a utiliza propriul tokenizer
+tokenizer = AutoTokenizer.from_pretrained("huggingface-course/code-search-net-tokenizer")
+```
+
+Acum sunteți gata să antrenați un model de limbaj de la zero și să îl ajustați pentru sarcina voastră! Vom face acest lucru în [Capitolul 7](/course/chapter7), dar mai întâi, în continuarea acestui capitol, vom arunca o privire mai atentă asupra tokenizerilor rapizi și vom explora în detaliu ce se întâmplă atunci când apelați metoda `train_new_from_iterator()`.
\ No newline at end of file
diff --git a/chapters/ro/chapter 6/3.mdx b/chapters/ro/chapter 6/3.mdx
new file mode 100644
index 000000000..54fa7863f
--- /dev/null
+++ b/chapters/ro/chapter 6/3.mdx	
@@ -0,0 +1,473 @@
+<FrameworkSwitchCourse {fw} />
+
+# Tokenizeri rapizi' puteri speciale[[fast-tokenizers-special-powers]]
+
+{#if fw === 'pt'}
+
+<CourseFloatingBanner chapter={6}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter6/section3_pt.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter6/section3_pt.ipynb"},
+]} />
+
+{:else}
+
+<CourseFloatingBanner chapter={6}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter6/section3_tf.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter6/section3_tf.ipynb"},
+]} />
+
+{/if}
+
+În această secțiune, vom analiza mai atent capacitățile tokenizerilor din 🤗 Transformers. Până acum, i-am folosit doar pentru tokenizarea inputurilor sau decodificarea ID-urilor înapoi în text, dar tokenizerii - în special cei susținuți de biblioteca 🤗 Tokenizers - pot face mult mai multe. Pentru a ilustra aceste funcții suplimentare, vom explora modul de reproducere a rezultatelor pipeline-urilor `token-classification` (pe care le-am numit `ner`) și `question-answering` pe care le-am întâlnit pentru prima dată în [Capitolul 1](/course/chapter1).
+
+<Youtube id="g8quOxoqhHQ"/>
+
+În discuția următoare, vom face adesea distincția între tokenizatori "lenți" și "rapizi". Tokenizerii lenți sunt cei scriși în Python în interiorul bibliotecii 🤗 Transformers, în timp ce versiunile rapide sunt cele furnizate de 🤗 Tokenizers, care sunt scrise în Rust. Dacă vă amintiți de tabelul din [Capitolul 5](/course/chapter5/3) care a raportat cât timp a durat un tokenizer rapid și unul lent pentru a tokeniza datasetul Drug Review, ar trebui să aveți o idee despre de ce îi numim lenți și rapizi:
+
+|               | Fast tokenizer | Slow tokenizer
+:--------------:|:--------------:|:-------------:
+`batched=True`  | 10,8s          | 4min41s
+`batched=False` | 59,2s          | 5min3s
+
+<Tip warning={true}>
+
+⚠️ Atunci când tokenizați o singură propoziție, nu veți vedea întotdeauna o diferență de viteză între versiunea lentă și rapidă ale aceluiași tokenizer. De fapt, versiunea rapidă poate fi chiar mai lentă! Abia atunci când tokenizați multe texte în paralel, în același timp, veți putea observa clar diferența.
+
+</Tip>
+
+## Batch encoding[[batch-encoding]]
+
+<Youtube id="3umI3tm27Vw"/>
+
+Rezultatul unui tokenizer nu este un simplu dicționar Python; ceea ce obținem este de fapt un obiect special `BatchEncoding`. Este o subclasă a unui dicționar (de aceea am putut indexa acel rezultat fără nici o problemă mai devreme), dar cu metode suplimentare care sunt utilizate în principal de către tokenizerii rapizi.
+
+Pe lângă capacitățile lor de paralelizare, funcționalitatea principală a tokenizerilor rapizi este aceea că aceștia țin întotdeauna evidența intervalului original de texte din care provin tokenii finali - o funcționalitate pe care o numim *offset mapping*. Acest lucru deblochează funcții precum mappingul fiecărui cuvânt la tokens pe care îi generează sau mappingul fiecărui caracter al textului original la tokenul în care se află și invers.
+
+Acum hai să aruncăm o privire la un exemplu:
+
+```py
+from transformers import AutoTokenizer
+
+tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
+example = "My name is Sylvain and I work at Hugging Face in Brooklyn."
+encoding = tokenizer(example)
+print(type(encoding))
+```
+
+Așa cum s-a menționat anterior, în outputul tokenizerului obținem un obiect `BatchEncoding`:
+
+```python out
+<class 'transformers.tokenization_utils_base.BatchEncoding'>
+```
+
+Deoarece clasa `AutoTokenizer` selectează un tokenizer rapid în mod implicit, putem utiliza metodele suplimentare pe care acest obiect `BatchEncoding` le oferă. Avem două metode de verificare dacă tokenizerul nostru este unul lent sau rapid. Putem verifica fie atributul `is_fast` al tokenizer-ului:
+
+```python
+tokenizer.is_fast
+```
+
+```python out
+True
+```
+
+sau același atribut al `encoding`:
+
+```python
+encoding.is_fast
+```
+
+```python out
+True
+```
+
+Hai să vedem ce ne permite un tokenizer rapid să facem. În primul rând, putem accesa tokenul fără a fi nevoie să facem convert ID-urile înapoi în tokens:
+
+```py
+encoding.tokens()
+```
+
+```python out
+['[CLS]', 'My', 'name', 'is', 'S', '##yl', '##va', '##in', 'and', 'I', 'work', 'at', 'Hu', '##gging', 'Face', 'in',
+ 'Brooklyn', '.', '[SEP]']
+```
+
+În acest caz tokenul la indexul 5 este `##yl`, ceea ce este o parte a cuvântului "Sylvain" în propoziția originală. În același timp putem folosi metoda `word_ids()` pentru a obține indexul cuvântului din care provine fiecare token:
+
+```py
+encoding.word_ids()
+```
+
+```python out
+[None, 0, 1, 2, 3, 3, 3, 3, 4, 5, 6, 7, 8, 8, 9, 10, 11, 12, None]
+
+Putem vedea că tokenizerul are tokeni speciali `[CLS]` și `[SEP]` care sunt mapped la `None`, iar apoi fiecare token este mapped la cuvântul din care provine. Acest lucru este deosebit de util pentru a determina dacă un token este la începutul unui cuvânt sau dacă două tokenuri sunt în același cuvânt. Ne-am putea baza pe prefixul `##` pentru aceasta, dar funcționează doar pentru tokenizeri de tip BERT; această metodă funcționează pentru orice tip de tokenizator, atâta timp cât este unul rapid. În capitolul următor, vom vedea cum putem utiliza această capabilitate pentru a aplica labeluri pe care le avem pentru fiecare cuvânt în mod corespunzător tokenurilor în sarcini precum named entity recognition (NER) și part-of-speech (POS). De asemenea, îl putem utiliza pentru a face mask tuturor tokenurilor care provin din același cuvânt în masked language modeling(o tehnică numită _whole word masking_).
+
+<Tip>
+
+Noțiunea de ceea ce este un cuvânt este complicată. De exemplu, "I'll" (o prescurtare a "I will") contează ca unul sau două cuvinte? Acest lucru depinde de tokenizer și de operațiunea de pre-tokenizare pe care o aplică. Unii tokenizeri se divid doar pe spații, așa că vor considera acest lucru ca un singur cuvânt. Alții folosesc punctuația pe lângă spații, deci vor considera două cuvinte.
+
+✏️ **Încercați!** Creați un tokenizer din checkpointurile `bert-base-cased` și `roberta-base` și tokenizați "81s" cu ele. Ce observați? Care sunt ID-urile cuvintelor?
+
+</Tip>
+
+În mod similar, există o metodă `sentence_ids()` pe care o putem utiliza pentru a face map unui token la propoziția din care provine (deși, în acest caz, `token_type_ids` returnate de tokenizer ne pot oferi aceeași informație).
+
+În cele din urmă, putem face map oricărui cuvânt sau token la caracterele din textul original și invers, prin intermediul metodelor `word_to_chars()` sau `token_to_chars()` și `char_to_word()` sau `char_to_token()`. De exemplu, metoda `word_ids()` ne-a spus că `##yl` face parte din cuvântul cu indicele 3, dar ce cuvânt este în propoziție? Putem afla astfel:
+
+```py
+start, end = encoding.word_to_chars(3)
+example[start:end]
+```
+
+```python out
+Sylvain
+```
+
+Așa cum am menționat anterior, toate acestea sunt posibile datorită faptului că tokenizerul rapid ține evidența spanului de text de la care provine fiecare token într-o listă de *offseturi*. Pentru a ilustra modul în care se utilizează acestea, în continuare vă vom arăta cum să replicați rezultatele pipelineului `token-classification` manual.
+
+<Tip>
+
+✏️ **Încercați!** Creați propriul exemplu de text și încercați să înțelegeți care tokenuri sunt asociate cu ID-ul cuvântului și, de asemenea, cum să extrageți spanurile pentru singur cuvânt. Pentru puncte bonus, încercați să utilizați două propoziții ca inputuri și să vedeți dacă ID-urile propozițiilor au sens pentru voi.
+
+</Tip>
+
+## În interiorul pipelineului `token-classification`[[inside-the-token-classification-pipeline]]
+
+În [Capitolul 1](/course/chapter1) am avut primul nostru contact aplicând NER - unde sarcina constă în identificarea părților textului care corespund entităților precum persoane, locații sau organizații - cu funcția `pipeline()` din 🤗 Transformers. Apoi, în [Capitolul 2](/course/chapter2), am văzut cum un pipeline grupează cele trei etape necesare pentru a obține predicțiile de la un text "raw": tokenizare, trecerea inputurilor prin model și post-procesare. Primele două etape din pipelineul `token-classification` sunt la fel ca în orice alt pipeline, dar post-procesarea este puțin mai complexă - hai să vedem cum!
+
+{#if fw === 'pt'}
+
+<Youtube id="0E7ltQB7fM8"/>
+
+{:else}
+
+<Youtube id="PrX4CjrVnNc"/>
+
+{/if}
+
+### Obținerea rezultatelor de bază cu pipelineul[[getting-the-base-results-with-the-pipeline]]
+
+În primul rând, trebuie să luăm un token classification pipeline pentru a obține câteva rezultate ca să le putem compara manual. Modelul utilizat în mod implicit este [`dbmdz/bert-large-cased-finetuned-conll03-english`](https://huggingface.co/dbmdz/bert-large-cased-finetuned-conll03-english); acesta aplică NER pe propoziții:
+
+```py
+from transformers import pipeline
+
+token_classifier = pipeline("token-classification")
+token_classifier("My name is Sylvain and I work at Hugging Face in Brooklyn.")
+```
+
+```python out
+[{'entity': 'I-PER', 'score': 0.9993828, 'index': 4, 'word': 'S', 'start': 11, 'end': 12},
+ {'entity': 'I-PER', 'score': 0.99815476, 'index': 5, 'word': '##yl', 'start': 12, 'end': 14},
+ {'entity': 'I-PER', 'score': 0.99590725, 'index': 6, 'word': '##va', 'start': 14, 'end': 16},
+ {'entity': 'I-PER', 'score': 0.9992327, 'index': 7, 'word': '##in', 'start': 16, 'end': 18},
+ {'entity': 'I-ORG', 'score': 0.97389334, 'index': 12, 'word': 'Hu', 'start': 33, 'end': 35},
+ {'entity': 'I-ORG', 'score': 0.976115, 'index': 13, 'word': '##gging', 'start': 35, 'end': 40},
+ {'entity': 'I-ORG', 'score': 0.98879766, 'index': 14, 'word': 'Face', 'start': 41, 'end': 45},
+ {'entity': 'I-LOC', 'score': 0.99321055, 'index': 16, 'word': 'Brooklyn', 'start': 49, 'end': 57}]
+```
+
+Modelul a identificat fiecare token generdat de "Sylvain" ca o persoană, fiecare token generat de "Hugging Face" ca o organizație, și fiecare token "Brooklin" ca o locație". În același timp putem întreba pipelineul să grupeze împreună tokenurile care corespund cu aceeași entitate.
+
+```py
+from transformers import pipeline
+
+token_classifier = pipeline("token-classification", aggregation_strategy="simple")
+token_classifier("My name is Sylvain and I work at Hugging Face in Brooklyn.")
+```
+
+```python out
+[{'entity_group': 'PER', 'score': 0.9981694, 'word': 'Sylvain', 'start': 11, 'end': 18},
+ {'entity_group': 'ORG', 'score': 0.97960204, 'word': 'Hugging Face', 'start': 33, 'end': 45},
+ {'entity_group': 'LOC', 'score': 0.99321055, 'word': 'Brooklyn', 'start': 49, 'end': 57}]
+```
+
+`Aggregation_strategy` aleasă va modifica scorurile calculate pentru fiecare entitate grupată. Cu `"simple"`, scorul este doar media scorurilor pentru fiecare token din entitatea dată: de exemplu, scorul pentru "Sylvain" este media scorurilor pe care le-am văzut în exemplele anterioare pentru token-urile `S`, `##yl`, `##va` și `##in`. Alte strategii disponibile sunt:
+
+- `"first"`, unde scorul fiecărei entități este scorul primului token al acelei entități (astfel, pentru "Sylvain" ar fi 0.993828, scorul token-ului `S`)
+- `"max"`, unde scorul fiecărei entități este scorul maxim al tokenilor din acea entitate (astfel, pentru "Hugging Face" ar fi 0.98879766, scorul "Face")
+- `"average"`, unde scorul fiecărei entități este media scorurilor cuvintelor care compun acea entitate (astfel, pentru "Sylvain" nu ar exista nicio diferență față de strategia `"simple"`, dar "Hugging Face" ar avea un scor de 0.9819, media scorurilor pentru "Hugging", 0.975 și "Face", 0.98879)
+
+Acum să vedem cum putem obține aceste rezultate fără a folosi funcția `pipeline()`!
+
+### De la inputuri la predicții[[from-inputs-to-predictions]]
+
+{#if fw === 'pt'}
+
+În primul rând trebuie să tokenizăm inputurile și sp le trecem prin model. Acest lucru este făcut excat ca în [Capitolul 2](/course/chapter2); noi am inițializat tokenizerul și modelul folosind clasa `AutoXxx` și apoi am folosit-o pe exemplul nostru:
+
+```py
+from transformers import AutoTokenizer, AutoModelForTokenClassification
+
+model_checkpoint = "dbmdz/bert-large-cased-finetuned-conll03-english"
+tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
+model = AutoModelForTokenClassification.from_pretrained(model_checkpoint)
+
+example = "My name is Sylvain and I work at Hugging Face in Brooklyn."
+inputs = tokenizer(example, return_tensors="pt")
+outputs = model(**inputs)
+```
+
+Deoarece aici folosim `AutoModelForTokenClassification` , noi primim un set de logits pentru fiecare token în input sequence:
+
+```py
+print(inputs["input_ids"].shape)
+print(outputs.logits.shape)
+```
+
+```python out
+torch.Size([1, 19])
+torch.Size([1, 19, 9])
+```
+
+{:else}
+
+În primul rând trebuie să tokenizăm inputurile și să le trecem prin model. Acest lucru este făcut excat ca în [Capitolul 2](/course/chapter2); noi am inițializat tokenizerul și modelul folosind clasa `TFAutoXxx` și apoi am folosit-o pe exemplul nostru:
+
+```py
+from transformers import AutoTokenizer, TFAutoModelForTokenClassification
+
+model_checkpoint = "dbmdz/bert-large-cased-finetuned-conll03-english"
+tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
+model = TFAutoModelForTokenClassification.from_pretrained(model_checkpoint)
+
+example = "My name is Sylvain and I work at Hugging Face in Brooklyn."
+inputs = tokenizer(example, return_tensors="tf")
+outputs = model(**inputs)
+```
+
+Deoarece aici folosim `TFAutoModelForTokenClassification`, noi primim un set de logits pentru fiecare token în input sequence:
+
+```py
+print(inputs["input_ids"].shape)
+print(outputs.logits.shape)
+```
+
+```python out
+(1, 19)
+(1, 19, 9)
+```
+
+{/if}
+
+Noi avem un batch cu 1 secvență din 19 tokenuri și modelul are 9 labeluri diferite, deci outputul modelului are un shape de 1 x 19 x 9. Ca și pentru text classification pipeline, noi folosim o funcție softmax pentru a face convert logiturilor în probabilități și luăm argmax pentru a obține predicții(atrage atenția asupra fatpului că putem lua argmax pe logituri deoarece softmax nu schimbă ordinea):
+
+{#if fw === 'pt'}
+
+```py
+import torch
+
+probabilities = torch.nn.functional.softmax(outputs.logits, dim=-1)[0].tolist()
+predictions = outputs.logits.argmax(dim=-1)[0].tolist()
+print(predictions)
+```
+
+{:else}
+
+```py
+import tensorflow as tf
+
+probabilities = tf.math.softmax(outputs.logits, axis=-1)[0]
+probabilities = probabilities.numpy().tolist()
+predictions = tf.math.argmax(outputs.logits, axis=-1)[0]
+predictions = predictions.numpy().tolist()
+print(predictions)
+```
+
+{/if}
+
+```python out
+[0, 0, 0, 0, 4, 4, 4, 4, 0, 0, 0, 0, 6, 6, 6, 0, 8, 0, 0]
+```
+
+Atributul `model.config.id2label` con;ine mappingul indexilor la labeluri pe care le putem folosi pentru a înțelege predicțiile:
+
+```py
+model.config.id2label
+```
+
+```python out
+{0: 'O',
+ 1: 'B-MISC',
+ 2: 'I-MISC',
+ 3: 'B-PER',
+ 4: 'I-PER',
+ 5: 'B-ORG',
+ 6: 'I-ORG',
+ 7: 'B-LOC',
+ 8: 'I-LOC'}
+```
+
+Cum am văzut mai devreme, există 9 labeluri: `O` este labelul pentru tokenurile care nu se află în nicio entitate numită(aceasta reprezintă "exteriorul"), și avem apoi două labeluri pentru fiecare tip de entitate (divers, persoană, organizație și locație). Eticheta `B-XXX` indică faptul că tokenul se află la începutul entității `XXX` și eticheta `I-XXX` indică faptul că tokenul se află în interiorul entității `XXX`. De exemplu, în exemplul curent ne-am aștepta ca modelul nostru să clasifice tokenul `S` ca `B-PER` (începutul unei entități de-tip persoană) și tokenurile `##yl`, `##va` și `##in` ca `I-PER` (în interiorul unei entități de tip persoană).
+
+S-ar putea să credeți că modelul a greșit în acest caz, deoarece a atribuit eticheta `I-PER` tuturor acestor patru tokeni, dar acesta nu este în întregime adevărat. Există, de fapt, două formate pentru labelurile `B-` și `I-`: *IOB1* și *IOB2*. Formatul IOB2 (în roz mai jos), este cel pe care l-am introdus, în timp ce formatul IOB1 (în albastru), utilizează labelurile care încep cu `B-` doar pentru a separa două entități adiacente de același tip. Modelul pe care îl utilizăm a fost fine-tuned pe un dataset care utilizează acel format, ceea ce explică de ce atribuie labelul `I-PER` tokenului `S`.
+
+<div class="flex justify-center">
+<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter6/IOB_versions.svg" alt="IOB1 vs IOB2 format"/>
+<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter6/IOB_versions-dark.svg" alt="IOB1 vs IOB2 format"/>
+</div>
+
+Cu maparea aceasta, suntem gat a să reproducem(aproape în total) rezultat primului pipeline -- noi putem lua scorul și labelul fiecărui token care nu a fost clasificat ca `O`:
+
+```py
+results = []
+tokens = inputs.tokens()
+
+for idx, pred in enumerate(predictions):
+    label = model.config.id2label[pred]
+    if label != "O":
+        results.append(
+            {"entity": label, "score": probabilities[idx][pred], "word": tokens[idx]}
+        )
+
+print(results)
+```
+
+```python out
+[{'entity': 'I-PER', 'score': 0.9993828, 'index': 4, 'word': 'S'},
+ {'entity': 'I-PER', 'score': 0.99815476, 'index': 5, 'word': '##yl'},
+ {'entity': 'I-PER', 'score': 0.99590725, 'index': 6, 'word': '##va'},
+ {'entity': 'I-PER', 'score': 0.9992327, 'index': 7, 'word': '##in'},
+ {'entity': 'I-ORG', 'score': 0.97389334, 'index': 12, 'word': 'Hu'},
+ {'entity': 'I-ORG', 'score': 0.976115, 'index': 13, 'word': '##gging'},
+ {'entity': 'I-ORG', 'score': 0.98879766, 'index': 14, 'word': 'Face'},
+ {'entity': 'I-LOC', 'score': 0.99321055, 'index': 16, 'word': 'Brooklyn'}]
+```
+
+Acest lucru este foarte similar cu ce am avut mai devreme, cu o excepție: pipelineul de asemenea ne-a oferit informație despre `start` și `end` al fiecărei entități în propoziția originală. Acum e momentul când offset mappingul nostru ne va ajuta. Pentru a obține offseturile, noi trebuie să setăm `return_offsets_mapping=True` când aplicăm tokenizerul pe inputurile noastre:
+
+```py
+inputs_with_offsets = tokenizer(example, return_offsets_mapping=True)
+inputs_with_offsets["offset_mapping"]
+```
+
+```python out
+[(0, 0), (0, 2), (3, 7), (8, 10), (11, 12), (12, 14), (14, 16), (16, 18), (19, 22), (23, 24), (25, 29), (30, 32),
+ (33, 35), (35, 40), (41, 45), (46, 48), (49, 57), (57, 58), (0, 0)]
+```
+
+Fiecare tuple este spanul de text care corespunde fiecărui token, unde `(0, 0)` este rezervat pentru tokenii speciali. Noi am văzut înainte că tokenul la indexul 5 este `##yl`, care are aici `(12, 14)` ca offsets. Dacă luăm sliceul corespunzător în exemplul nostru:
+
+```py
+example[12:14]
+```
+
+noi obținem spanul propriu de text fără `##`:
+
+```python out
+yl
+```
+
+Folosind aceasta, putem acum completa rezultatele anterioare:
+
+
+```py
+results = []
+inputs_with_offsets = tokenizer(example, return_offsets_mapping=True)
+tokens = inputs_with_offsets.tokens()
+offsets = inputs_with_offsets["offset_mapping"]
+
+for idx, pred in enumerate(predictions):
+    label = model.config.id2label[pred]
+    if label != "O":
+        start, end = offsets[idx]
+        results.append(
+            {
+                "entity": label,
+                "score": probabilities[idx][pred],
+                "word": tokens[idx],
+                "start": start,
+                "end": end,
+            }
+        )
+
+print(results)
+```
+
+```python out
+[{'entity': 'I-PER', 'score': 0.9993828, 'index': 4, 'word': 'S', 'start': 11, 'end': 12},
+ {'entity': 'I-PER', 'score': 0.99815476, 'index': 5, 'word': '##yl', 'start': 12, 'end': 14},
+ {'entity': 'I-PER', 'score': 0.99590725, 'index': 6, 'word': '##va', 'start': 14, 'end': 16},
+ {'entity': 'I-PER', 'score': 0.9992327, 'index': 7, 'word': '##in', 'start': 16, 'end': 18},
+ {'entity': 'I-ORG', 'score': 0.97389334, 'index': 12, 'word': 'Hu', 'start': 33, 'end': 35},
+ {'entity': 'I-ORG', 'score': 0.976115, 'index': 13, 'word': '##gging', 'start': 35, 'end': 40},
+ {'entity': 'I-ORG', 'score': 0.98879766, 'index': 14, 'word': 'Face', 'start': 41, 'end': 45},
+ {'entity': 'I-LOC', 'score': 0.99321055, 'index': 16, 'word': 'Brooklyn', 'start': 49, 'end': 57}]
+```
+
+Acest răspuns e același răspuns pe care l-am primit de la primul pipeline:
+
+### Gruparea entităților[[grouping-entities]]
+
+Utilizarea offseturilor pentru a determina cheile de start și de sfârșit pentru fiecare entitate este util, dar această informație nu este strict necesară. Când dorim să grupăm entitățile împreună, totuși, offseturile ne vor salva o mulțime de messy code. De exemplu, dacă am dori să grupăm împreună tokenii `Hu`, `##gging` și `Face`, am putea crea reguli speciale care să spună că primele două ar trebui să fie atașate și să înlăturăm `##`, iar `Face` ar trebui adăugat cu un spațiu, deoarece nu începe cu `##` -- dar acest lucru ar funcționa doar pentru acest tip particular de tokenizer. Ar trebui să scriem un alt set de reguli pentru un tokenizer SentencePiece sau unul Byte-Pair-Encoding (discutat mai târziu în acest capitol).
+
+Cu offseturile, tot acel cod custom dispare: pur și simplu putem lua spanul din textul original care începe cu primul token și se termină cu ultimul token. Deci, în cazul tokenurilor `Hu`, `##gging` și `Face`, ar trebui să începem la caracterul 33 (începutul lui `Hu`) și să ne oprim înainte de caracterul 45 (sfârșitul lui `Face`):
+
+```py
+example[33:45]
+```
+
+```python out
+Hugging Face
+```
+
+Pentru a scrie codul care post-procesează predicțiile în timp ce grupăm entitățile, vom grupa entitățile care sunt consecutive și labeled cu `I-XXX`, cu excepția primeia, care poate fi labeled ca `B-XXX` sau `I-XXX` (decidem să oprim gruparea unei entități atunci când întâlnim un `O`, un nou tip de entitate, sau un `B-XXX` care ne spune că o entitate de același tip începe):
+
+```py
+import numpy as np
+
+results = []
+inputs_with_offsets = tokenizer(example, return_offsets_mapping=True)
+tokens = inputs_with_offsets.tokens()
+offsets = inputs_with_offsets["offset_mapping"]
+
+idx = 0
+while idx < len(predictions):
+    pred = predictions[idx]
+    label = model.config.id2label[pred]
+    if label != "O":
+        # Remove the B- or I-
+        label = label[2:]
+        start, _ = offsets[idx]
+
+        # Grab all the tokens labeled with I-label
+        all_scores = []
+        while (
+            idx < len(predictions)
+            and model.config.id2label[predictions[idx]] == f"I-{label}"
+        ):
+            all_scores.append(probabilities[idx][pred])
+            _, end = offsets[idx]
+            idx += 1
+
+        # The score is the mean of all the scores of the tokens in that grouped entity
+        score = np.mean(all_scores).item()
+        word = example[start:end]
+        results.append(
+            {
+                "entity_group": label,
+                "score": score,
+                "word": word,
+                "start": start,
+                "end": end,
+            }
+        )
+    idx += 1
+
+print(results)
+```
+
+Și obținem aceleași răspuns ca de la pipelineul secundar!
+
+```python out
+[{'entity_group': 'PER', 'score': 0.9981694, 'word': 'Sylvain', 'start': 11, 'end': 18},
+ {'entity_group': 'ORG', 'score': 0.97960204, 'word': 'Hugging Face', 'start': 33, 'end': 45},
+ {'entity_group': 'LOC', 'score': 0.99321055, 'word': 'Brooklyn', 'start': 49, 'end': 57}]
+```
+
+Alt exemplu de sarcină unde offseturile sunt extrem de useful pentru răspunderea la întrebări. Scufundându-ne în pipelineuri, un lucru pe care îl vom face în următoarea secțiune, ne vom premite să ne uităm peste o caracteristică a tokenizerului în librăria 🤗 Transformers: vom avea de-a face cu overflowing tokens când truncăm un input de o anumită lungime.
+
diff --git a/chapters/ro/chapter 6/3b.mdx b/chapters/ro/chapter 6/3b.mdx
new file mode 100644
index 000000000..08acea387
--- /dev/null
+++ b/chapters/ro/chapter 6/3b.mdx	
@@ -0,0 +1,643 @@
+<FrameworkSwitchCourse {fw} />
+
+# Tokenizeri rapizi în pipelineul QA[[fast-tokenizers-in-the-qa-pipeline]]
+
+{#if fw === 'pt'}
+
+<CourseFloatingBanner chapter={6}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter6/section3b_pt.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter6/section3b_pt.ipynb"},
+]} />
+
+{:else}
+
+<CourseFloatingBanner chapter={6}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter6/section3b_tf.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter6/section3b_tf.ipynb"},
+]} />
+
+{/if}
+
+Acum ne vom aprofunda în pipelineul `question-answering` și să vedem cum putem valorifica offesturile pentru a primi răspunzuri la întrebări la îndemână din context, asemănător cum am făcut cu entitățile grupate în secțiunea precedentă. Pe urmă vom vedea cum vom face față contextelor foarte lungi care ajung truncate. Puteți trece peste această secțiune dacă nu sunteți interesat în întrebarea care răspunde la sarcina aceasta.
+
+{#if fw === 'pt'}
+
+<Youtube id="_wxyB3j3mk4"/>
+
+{:else}
+
+<Youtube id="b3u8RzBCX9Y"/>
+
+{/if}
+
+## Folosind `question-answering` pipeline[[using-the-question-answering-pipeline]]
+
+Cum am văzut în [Capitolul 1](/course/chapter1), noi putem folosi pipelineul `question-answering` ca acesta pentru a răspunde la o întrebare:
+
+```py
+from transformers import pipeline
+
+question_answerer = pipeline("question-answering")
+context = """
+🤗 Transformers is backed by the three most popular deep learning libraries — Jax, PyTorch, and TensorFlow — with a seamless integration
+between them. It's straightforward to train your models with one before loading them for inference with the other.
+"""
+question = "Which deep learning libraries back 🤗 Transformers?"
+question_answerer(question=question, context=context)
+```
+
+```python out
+{'score': 0.97773,
+ 'start': 78,
+ 'end': 105,
+ 'answer': 'Jax, PyTorch and TensorFlow'}
+```
+
+Spre deosebire de alte pipelineuri, care nu put trunca și face split la text care este mai lung decât lungimea maxim acceptată de model(și, prin urmare, pot pierde informații la sfârșitul unui document), accest pipeline poate face față contextelor foarte lungi și va returna răspunsul la întrebare chiar dacă aceasta se află la sfârșit:
+
+```py
+long_context = """
+🤗 Transformers: State of the Art NLP
+
+🤗 Transformers provides thousands of pretrained models to perform tasks on texts such as classification, information extraction,
+question answering, summarization, translation, text generation and more in over 100 languages.
+Its aim is to make cutting-edge NLP easier to use for everyone.
+
+🤗 Transformers provides APIs to quickly download and use those pretrained models on a given text, fine-tune them on your own datasets and
+then share them with the community on our model hub. At the same time, each python module defining an architecture is fully standalone and
+can be modified to enable quick research experiments.
+
+Why should I use transformers?
+
+1. Easy-to-use state-of-the-art models:
+  - High performance on NLU and NLG tasks.
+  - Low barrier to entry for educators and practitioners.
+  - Few user-facing abstractions with just three classes to learn.
+  - A unified API for using all our pretrained models.
+  - Lower compute costs, smaller carbon footprint:
+
+2. Researchers can share trained models instead of always retraining.
+  - Practitioners can reduce compute time and production costs.
+  - Dozens of architectures with over 10,000 pretrained models, some in more than 100 languages.
+
+3. Choose the right framework for every part of a model's lifetime:
+  - Train state-of-the-art models in 3 lines of code.
+  - Move a single model between TF2.0/PyTorch frameworks at will.
+  - Seamlessly pick the right framework for training, evaluation and production.
+
+4. Easily customize a model or an example to your needs:
+  - We provide examples for each architecture to reproduce the results published by its original authors.
+  - Model internals are exposed as consistently as possible.
+  - Model files can be used independently of the library for quick experiments.
+
+🤗 Transformers is backed by the three most popular deep learning libraries — Jax, PyTorch and TensorFlow — with a seamless integration
+between them. It's straightforward to train your models with one before loading them for inference with the other.
+"""
+question_answerer(question=question, context=long_context)
+```
+
+```python out
+{'score': 0.97149,
+ 'start': 1892,
+ 'end': 1919,
+ 'answer': 'Jax, PyTorch and TensorFlow'}
+```
+
+Hai să vedem cum el face toate astea!
+
+## Folosind un model pentru răspunderea la întrebări[[using-a-model-for-question-answering]]
+
+Ca în cazul oricărui altui pipeline, începem prin tokenizarea datelor de intrare și apoi le trimitem prin model. Checkpointul utilizat în mod implicit pentru pipelineul `question-answering` este [`distilbert-base-cased-distilled-squad`](https://huggingface.co/distilbert-base-cased-distilled-squad) ("squad" din nume provine de la datasetul pe care modelul a fost ajustat; vom vorbi mai multe despre datasetul SQuAD în [Capitolul 7](/course/chapter7/7)):
+
+{#if fw === 'pt'}
+
+```py
+from transformers import AutoTokenizer, AutoModelForQuestionAnswering
+
+model_checkpoint = "distilbert-base-cased-distilled-squad"
+tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
+model = AutoModelForQuestionAnswering.from_pretrained(model_checkpoint)
+
+inputs = tokenizer(question, context, return_tensors="pt")
+outputs = model(**inputs)
+```
+
+{:else}
+
+```py
+from transformers import AutoTokenizer, TFAutoModelForQuestionAnswering
+
+model_checkpoint = "distilbert-base-cased-distilled-squad"
+tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
+model = TFAutoModelForQuestionAnswering.from_pretrained(model_checkpoint)
+
+inputs = tokenizer(question, context, return_tensors="tf")
+outputs = model(**inputs)
+```
+
+{/if}
+
+Observați că noi tokenizăm întrebrea și contextul ca o perecehe, cu întrebarea prima.
+
+
+<div class="flex justify-center">
+<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter6/question_tokens.svg" alt="An example of tokenization of question and context"/>
+<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter6/question_tokens-dark.svg" alt="An example of tokenization of question and context"/>
+</div>
+
+Modelele create pentru răspunderea la întrebări funcționează puțin diferit de modelele pe care le-am văzut până acum. Folosind imaginea de mai sus ca exemplu, modelul a fost antrenat pentru a prezice indicele tokenului cu care începe răspunsului (aici 21) și indicele simbolului la care se termină răspunsul (aici 24). Acesta este motivul pentru care modelele respective nu returnează un singur tensor de logits, ci două: unul pentru logits-ul corespunzători tokenului cu care începe răspunsului și unul pentru logits-ul corespunzător tokenului de sfârșit al răspunsului. Deoarece în acest caz avem un singur input care conține 66 de token-uri, obținem:
+
+```py
+start_logits = outputs.start_logits
+end_logits = outputs.end_logits
+print(start_logits.shape, end_logits.shape)
+```
+
+{#if fw === 'pt'}
+
+```python out
+torch.Size([1, 66]) torch.Size([1, 66])
+```
+
+{:else}
+
+```python out
+(1, 66) (1, 66)
+```
+
+{/if}
+
+Pentru a converti acești logits în probabilități, vom aplica o funcție softmax - dar înainte de aceasta, trebuie să ne asigurăm că mascăm indicii care nu fac parte din context. Inputul nostru este `[CLS] întrebare [SEP] context [SEP]`, deci trebuie să mascăm token-urile întrebării, precum și tokenul `[SEP]`. Cu toate acestea, vom păstra simbolul `[CLS]`, deoarece unele modele îl folosesc pentru a indica faptul că răspunsul nu se află în context.
+
+Deoarece vom aplica ulterior un softmax, trebuie doar să înlocuim logiturile pe care dorim să le mascăm cu un număr negativ mare. Aici, folosim `-10000`:
+
+{#if fw === 'pt'}
+
+```py
+import torch
+
+sequence_ids = inputs.sequence_ids()
+# Mask everything apart from the tokens of the context
+mask = [i != 1 for i in sequence_ids]
+# Unmask the [CLS] token
+mask[0] = False
+mask = torch.tensor(mask)[None]
+
+start_logits[mask] = -10000
+end_logits[mask] = -10000
+```
+
+{:else}
+
+```py
+import tensorflow as tf
+
+sequence_ids = inputs.sequence_ids()
+# Mask everything apart from the tokens of the context
+mask = [i != 1 for i in sequence_ids]
+# Unmask the [CLS] token
+mask[0] = False
+mask = tf.constant(mask)[None]
+
+start_logits = tf.where(mask, -10000, start_logits)
+end_logits = tf.where(mask, -10000, end_logits)
+```
+
+{/if}
+
+Acum că am mascat în mod corespunzător logiturile corespunzătoare pozițiilor pe care nu dorim să le prezicem, putem aplica softmax:
+
+{#if fw === 'pt'}
+
+```py
+start_probabilities = torch.nn.functional.softmax(start_logits, dim=-1)[0]
+end_probabilities = torch.nn.functional.softmax(end_logits, dim=-1)[0]
+```
+
+{:else}
+
+```py
+start_probabilities = tf.math.softmax(start_logits, axis=-1)[0].numpy()
+end_probabilities = tf.math.softmax(end_logits, axis=-1)[0].numpy()
+```
+
+{/if}
+
+La acest stadiu, am putea lua argmax al probabilităților de început și de sfârșit - dar am putea ajunge la un indice de început care este mai mare decât indicele de sfârșit, deci trebuie să luăm câteva precauții suplimentare. Vom calcula probabilitățile fiecărui  `start_index` și `end_index` posibil în cazul în care `start_index <= end_index`, apoi vom lua un tuple `(start_index, end_index)` cu cea mai mare probabilitate.
+
+Presupunând că evenimentele "The answer starts at `start_index`" și "The answer ends at `end_index`" sunt independente, probabilitatea ca răspunsul să înceapă la `start_index` și să se termine la `end_index` este:
+
+$$\mathrm{start\_probabilities}[\mathrm{start\_index}] \times \mathrm{end\_probabilities}[\mathrm{end\_index}]$$ 
+
+Deci, pentru a calcula toate scorurile, trebuie doar să calculăm toate produsele \\(\mathrm{start\_probabilities}[\mathrm{start\_index}] \times \mathrm{end\_probabilities}[\mathrm{end\_index}]\\) unde `start_index <= end_index`.
+
+Mai întâi hai să calculăm toate produsele posibile:
+
+```py
+scores = start_probabilities[:, None] * end_probabilities[None, :]
+```
+
+{#if fw === 'pt'}
+
+Apoi vom masca valorile în care `start_index > end_index` prin stabilirea lor la `0` (celelalte probabilități sunt toate numere pozitive). Funcția `torch.triu()` returnează partea triunghiulară superioară a tensorului 2D trecut ca argument, deci va face această mascare pentru noi:
+
+```py
+scores = torch.triu(score)
+```
+
+{:else}
+
+Apoi vom masca valorile în care `start_index > end_index` prin stabilirea lor la `0` (celelalte probabilități sunt toate numere pozitive). Funcția `np.triu()` returnează partea triunghiulară superioară a tensorului 2D trecut ca argument, deci va face această mascare pentru noi:
+
+```py
+import numpy as np
+
+scores = np.triu(scores)
+```
+
+{/if}
+
+Acum trebuie doar să obținem indicele maximului. Deoarece PyTorch va returna indicele în tensorul aplatizat, trebuie să folosim operațiile floor division `//` și modulusul `%` pentru a obține `start_index` și `end_index`:
+
+```py
+max_index = scores.argmax().item()
+start_index = max_index // scores.shape[1]
+end_index = max_index % scores.shape[1]
+print(scores[start_index, end_index])
+```
+
+Nu am terminat încă, dar cel puțin avem deja scorul corect pentru răspuns (puteți verifica acest lucru comparându-l cu primul rezultat din secțiunea anterioară):
+
+```python out
+0.97773
+```
+
+<Tip>
+
+✏️ **Încercați!** Calculați indicii de început și de sfârșit pentru cele mai probabile cinci răspunsuri.
+
+</Tip>
+
+Avem `start_index` și `end_index` ale răspunsului în termeni de tokens, deci acum trebuie doar să convertim în character indices în context. Acesta este momentul în care offseturile vor fi foarte utile. Putem să le luăm și să le folosim așa cum am făcut în sarcina de clasificare a tokenurilor:
+
+```py
+inputs_with_offsets = tokenizer(question, context, return_offsets_mapping=True)
+offsets = inputs_with_offsets["offset_mapping"]
+
+start_char, _ = offsets[start_index]
+_, end_char = offsets[end_index]
+answer = context[start_char:end_char]
+```
+
+Acum trebuie doar să formatăm totul pentru a obține rezultatul nostru:
+
+```py
+result = {
+    "answer": answer,
+    "start": start_char,
+    "end": end_char,
+    "score": scores[start_index, end_index],
+}
+print(result)
+```
+
+```python out
+{'answer': 'Jax, PyTorch and TensorFlow',
+ 'start': 78,
+ 'end': 105,
+ 'score': 0.97773}
+```
+
+Grozav! Este la fel ca în primul nostru exemplu!
+
+<Tip>
+
+✏️ **Încercați!** Utilizați cele mai bune scoruri pe care le-ați calculat anterior pentru a afișa cele mai probabile cinci răspunsuri. Pentru a vă verifica rezultatele, întoarceți-vă la primul pipeline și introduceți `top_k=5` atunci când îl apelați.
+
+</Tip>
+
+## Gestionarea contextelor lungi[[handling-long-contexts]]
+
+Dacă încercăm să tokenizăm întrebarea și contextul lung pe care le-am folosit ca un exemplu anterior, vom obține un număr de tokenuri mai mare decât lungimea maximă utilizată în pipelineul `question-answering` (care este 384):
+
+```py
+inputs = tokenizer(question, long_context)
+print(len(inputs["input_ids"]))
+```
+
+```python out
+461
+```
+
+Prin urmare, va trebui să trunchiem inputurile la lungimea maximă. Există mai multe modalități prin care putem face acest lucru, dar nu dorim să trunchiem întrebarea, ci doar contextul. Deoarece contextul este a doua propoziție, vom utiliza strategia de trunchiere `"only_second"`. Problema care apare atunci este că răspunsul la întrebare poate să nu fie în contextul trunchiat. Aici, de exemplu, am ales o întrebare la care răspunsul se află spre sfârșitul contextului, iar atunci când îl trunchiem, răspunsul nu este prezent:
+
+```py
+inputs = tokenizer(question, long_context, max_length=384, truncation="only_second")
+print(tokenizer.decode(inputs["input_ids"]))
+```
+
+```python out
+"""
+[CLS] Which deep learning libraries back [UNK] Transformers? [SEP] [UNK] Transformers : State of the Art NLP
+
+[UNK] Transformers provides thousands of pretrained models to perform tasks on texts such as classification, information extraction,
+question answering, summarization, translation, text generation and more in over 100 languages.
+Its aim is to make cutting-edge NLP easier to use for everyone.
+
+[UNK] Transformers provides APIs to quickly download and use those pretrained models on a given text, fine-tune them on your own datasets and
+then share them with the community on our model hub. At the same time, each python module defining an architecture is fully standalone and
+can be modified to enable quick research experiments.
+
+Why should I use transformers?
+
+1. Easy-to-use state-of-the-art models:
+  - High performance on NLU and NLG tasks.
+  - Low barrier to entry for educators and practitioners.
+  - Few user-facing abstractions with just three classes to learn.
+  - A unified API for using all our pretrained models.
+  - Lower compute costs, smaller carbon footprint:
+
+2. Researchers can share trained models instead of always retraining.
+  - Practitioners can reduce compute time and production costs.
+  - Dozens of architectures with over 10,000 pretrained models, some in more than 100 languages.
+
+3. Choose the right framework for every part of a model's lifetime:
+  - Train state-of-the-art models in 3 lines of code.
+  - Move a single model between TF2.0/PyTorch frameworks at will.
+  - Seamlessly pick the right framework for training, evaluation and production.
+
+4. Easily customize a model or an example to your needs:
+  - We provide examples for each architecture to reproduce the results published by its original authors.
+  - Model internal [SEP]
+"""
+```
+
+Aceasta înseamnă că modelul va avea dificultăți în a alege răspunsul corect. Pentru a rezolva acest lucru, pipelineul `question-answering` ne permite să împărțim contextul în bucăți mai mici, specificând lungimea maximă. Pentru a ne asigura că nu împărțim contextul exact în locul nepotrivit pentru a face posibilă găsirea răspunsului, aceasta include și o anumită suprapunere între bucăți.
+
+Putem cere tokenizerului (rapid sau lent) să facă acest lucru pentru noi adăugând `return_overflowing_tokens=True`, și putem specifica suprapunerea dorită cu argumentul `stride`. Iată un exemplu, folosind o propoziție mai mică:
+
+```py
+sentence = "This sentence is not too long but we are going to split it anyway."
+inputs = tokenizer(
+    sentence, truncation=True, return_overflowing_tokens=True, max_length=6, stride=2
+)
+
+for ids in inputs["input_ids"]:
+    print(tokenizer.decode(ids))
+```
+
+```python out
+'[CLS] This sentence is not [SEP]'
+'[CLS] is not too long [SEP]'
+'[CLS] too long but we [SEP]'
+'[CLS] but we are going [SEP]'
+'[CLS] are going to split [SEP]'
+'[CLS] to split it anyway [SEP]'
+'[CLS] it anyway. [SEP]'
+```
+
+După cum putem vedea, propoziția a fost împărțită în bucăți astfel încât fiecare intrare din `inputs["input_ids"]` să aibă cel mult 6 token-uri (aici ar trebui să adăugăm padding pentru ca ultima intrare să aibă aceeași dimensiune ca celelalte) și există o suprapunere de 2 tokenuri între fiecare intrare.
+
+Să aruncăm o privire mai atentă la rezultatul tokenizării:
+
+```py
+print(inputs.keys())
+```
+
+```python out
+dict_keys(['input_ids', 'attention_mask', 'overflow_to_sample_mapping'])
+```
+
+Așa cum era de așteptat, obținem ID-uri de intrare și un attention mask. Ultima cheie, `overflow_to_sample_mapping`, este o hartă care ne spune cărei propoziții îi corespunde fiecare dintre rezultate - aici avem 7 rezultate care provin toate din (singura) propoziție pe care am transmis-o tokenizerului:
+
+```py
+print(inputs["overflow_to_sample_mapping"])
+```
+
+```python out
+[0, 0, 0, 0, 0, 0, 0]
+```
+
+Acest lucru este mai util atunci când tokenizăm mai multe propoziții împreună. De exemplu, aceasta:
+
+```py
+sentences = [
+    "This sentence is not too long but we are going to split it anyway.",
+    "This sentence is shorter but will still get split.",
+]
+inputs = tokenizer(
+    sentences, truncation=True, return_overflowing_tokens=True, max_length=6, stride=2
+)
+
+print(inputs["overflow_to_sample_mapping"])
+```
+
+gets us:
+
+```python out
+[0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1]
+```
+
+ceea ce înseamnă că prima propoziție este împărțită în 7 fragmente ca înainte, iar următoarele 4 fragmente provin din a doua propoziție.
+
+Acum să ne întoarcem la contextul nostru lung. În mod implicit, pipelineul `question-answering` utilizează o lungime maximă de 384, așa cum am menționat mai devreme, și un stride de 128, care corespund modului în care modelul a fost fine-tuned (puteți ajusta acești parametri prin trecerea argumentelor `max_seq_len` și `stride` atunci când apelați pipelineul). Astfel, vom utiliza acești parametri la tokenizare. Vom adăuga, de asemenea, padding (pentru a avea sampleuri de aceeași lungime, astfel încât să putem construi tensori), precum și pentru a solicita offsets:
+
+```py
+inputs = tokenizer(
+    question,
+    long_context,
+    stride=128,
+    max_length=384,
+    padding="longest",
+    truncation="only_second",
+    return_overflowing_tokens=True,
+    return_offsets_mapping=True,
+)
+```
+
+Aceste "inputuri" vor conține ID-urile de input și attention maskurile așteptate de model, precum și offseturile și "overflow_to_sample_mapping" despre care tocmai am vorbit. Deoarece cei doi nu sunt parametri utilizați de model, îi vom scoate din `inputs` (și nu vom stoca harta, deoarece nu este utilă aici) înainte de a-l converti într-un tensor:
+
+{#if fw === 'pt'}
+
+```py
+_ = inputs.pop("overflow_to_sample_mapping")
+offsets = inputs.pop("offset_mapping")
+
+inputs = inputs.convert_to_tensors("pt")
+print(inputs["input_ids"].shape)
+```
+
+```python out
+torch.Size([2, 384])
+```
+
+{:else}
+
+```py
+_ = inputs.pop("overflow_to_sample_mapping")
+offsets = inputs.pop("offset_mapping")
+
+inputs = inputs.convert_to_tensors("tf")
+print(inputs["input_ids"].shape)
+```
+
+```python out
+(2, 384)
+```
+
+{/if}
+
+Contextul nostru lung a fost împărțit în două, ceea ce înseamnă că, după ce trece prin modelul nostru, vom avea două seturi de logits de început și de sfârșit:
+
+```py
+outputs = model(**inputs)
+
+start_logits = outputs.start_logits
+end_logits = outputs.end_logits
+print(start_logits.shape, end_logits.shape)
+```
+
+{#if fw === 'pt'}
+
+```python out
+torch.Size([2, 384]) torch.Size([2, 384])
+```
+
+{:else}
+
+```python out
+(2, 384) (2, 384)
+```
+
+{/if}
+
+Ca și înainte, mai întâi mascăm tokenii care nu fac parte din context înainte de a lua softmax. De asemenea, mascăm toți padding tokens(marcate de attention mask):
+
+{#if fw === 'pt'}
+
+```py
+sequence_ids = inputs.sequence_ids()
+# Mask everything apart from the tokens of the context
+mask = [i != 1 for i in sequence_ids]
+# Unmask the [CLS] token
+mask[0] = False
+# Mask all the [PAD] tokens
+mask = torch.logical_or(torch.tensor(mask)[None], (inputs["attention_mask"] == 0))
+
+start_logits[mask] = -10000
+end_logits[mask] = -10000
+```
+
+{:else}
+
+```py
+sequence_ids = inputs.sequence_ids()
+# Mask everything apart from the tokens of the context
+mask = [i != 1 for i in sequence_ids]
+# Unmask the [CLS] token
+mask[0] = False
+# Mask all the [PAD] tokens
+mask = tf.math.logical_or(tf.constant(mask)[None], inputs["attention_mask"] == 0)
+
+start_logits = tf.where(mask, -10000, start_logits)
+end_logits = tf.where(mask, -10000, end_logits)
+```
+
+{/if}
+
+Then we can use the softmax to convert our logits to probabilities:
+
+{#if fw === 'pt'}
+
+```py
+start_probabilities = torch.nn.functional.softmax(start_logits, dim=-1)
+end_probabilities = torch.nn.functional.softmax(end_logits, dim=-1)
+```
+
+{:else}
+
+```py
+start_probabilities = tf.math.softmax(start_logits, axis=-1).numpy()
+end_probabilities = tf.math.softmax(end_logits, axis=-1).numpy()
+```
+
+{/if}
+
+Următorul pas este similar cu ceea ce am făcut pentru contextul mic, dar îl repetăm pentru fiecare dintre cele două chunkuri. Atribuim un scor tuturor intervalelor posibile de răspuns, apoi luăm intervalul cu cel mai bun scor:
+
+{#if fw === 'pt'}
+
+```py
+candidates = []
+for start_probs, end_probs in zip(start_probabilities, end_probabilities):
+    scores = start_probs[:, None] * end_probs[None, :]
+    idx = torch.triu(scores).argmax().item()
+
+    start_idx = idx // scores.shape[1]
+    end_idx = idx % scores.shape[1]
+    score = scores[start_idx, end_idx].item()
+    candidates.append((start_idx, end_idx, score))
+
+print(candidates)
+```
+
+{:else}
+
+```py
+candidates = []
+for start_probs, end_probs in zip(start_probabilities, end_probabilities):
+    scores = start_probs[:, None] * end_probs[None, :]
+    idx = np.triu(scores).argmax().item()
+
+    start_idx = idx // scores.shape[1]
+    end_idx = idx % scores.shape[1]
+    score = scores[start_idx, end_idx].item()
+    candidates.append((start_idx, end_idx, score))
+
+print(candidates)
+```
+
+{/if}
+
+```python out
+[(0, 18, 0.33867), (173, 184, 0.97149)]
+```
+
+Cei doi candidați corespund celor mai bune răspunsuri pe care modelul le-a putut găsi în fiecare parte. Modelul este mult mai încrezător că răspunsul corect se află în a doua parte (ceea ce este un semn bun!). Acum trebuie doar să facem map celor două intervale de tokenuri cu intervalele de caractere din context (trebuie să o punem în corespondență doar pe a doua pentru a avea răspunsul nostru, dar este interesant să vedem ce a ales modelul în prima parte).
+
+<Tip>
+
+✏️ **Încercați!** Adaptați codul de mai sus pentru a returna scorurile și spanurile intervalele pentru cele mai probabile cinci răspunsuri (în total, nu pe chunk).
+
+</Tip>
+
+`offsets`-urile pe care le-am luat mai devreme este de fapt o listă de offsets, cu o listă pentru fiecare chunk de text:
+
+```py
+for candidate, offset in zip(candidates, offsets):
+    start_token, end_token, score = candidate
+    start_char, _ = offset[start_token]
+    _, end_char = offset[end_token]
+    answer = long_context[start_char:end_char]
+    result = {"answer": answer, "start": start_char, "end": end_char, "score": score}
+    print(result)
+```
+
+```python out
+{'answer': '\n🤗 Transformers: State of the Art NLP', 'start': 0, 'end': 37, 'score': 0.33867}
+{'answer': 'Jax, PyTorch and TensorFlow', 'start': 1892, 'end': 1919, 'score': 0.97149}
+```
+
+Dacă ignorăm primul rezultat, obținem același rezultat ca și pipelineul noastru pentru acest context lung - yay!
+
+<Tip>
+
+✏️ **Încercați!** Utilizați cele mai bune scoruri pe care le-ați calculat înainte pentru a afișa cele mai probabile cinci răspunsuri (pentru întregul context, nu pentru fiecare chunk). Pentru a vă verifica rezultatele, întoarceți-vă la primul pipeline și introduceți `top_k=5` atunci când îl apelați.
+
+</Tip>
+
+Aici se încheie scufundarea noastră în capacitățile tokenizerului. Vom pune toate acestea din nou în practică în capitolul următor, când vă vom arăta cum să ajustați un model pentru o serie de sarcini NLP comune.
diff --git a/chapters/ro/chapter 6/4.mdx b/chapters/ro/chapter 6/4.mdx
new file mode 100644
index 000000000..e87d27c57
--- /dev/null
+++ b/chapters/ro/chapter 6/4.mdx	
@@ -0,0 +1,122 @@
+# Normalization and pre-tokenization[[normalization-and-pre-tokenization]]
+
+<CourseFloatingBanner chapter={6}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter6/section4.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter6/section4.ipynb"},
+]} />
+
+Înainte de a analiza în profunzime cei mai comuni trei algoritmi de subword tokenization utilizați cu modelele Transformer (Byte-Pair Encoding [BPE], WordPiece și Unigram), vom arunca mai întâi o privire la preprocesarea pe care fiecare tokenizer o aplică textului. Iată o prezentare generală a etapelor din pipelineul de tokenizare:
+
+<div class="flex justify-center">
+<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter6/tokenization_pipeline.svg" alt="The tokenization pipeline.">
+<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter6/tokenization_pipeline-dark.svg" alt="The tokenization pipeline.">
+</div>
+
+Înainte de a împărți un text în subtokens (în conformitate cu modelul său), tokenizerul efectuează doi pași: _normalization__ și _pre-tokenization_.
+
+## Normalization[[normalization]]
+
+<Youtube id="4IIC2jI9CaU"/>
+
+Etapa de normalizare implică o curățare generală, cum ar fi eliminarea spațiilor inutile, a le face minuscule, și/sau ștergerea accentelor. Dacă sunteți familiarizat cu [Unicode normalization](http://www.unicode.org/reports/tr15/) (cum ar fi NFC sau NFKC), acest lucru poate fi aplicat și de tokenizer.
+
+`Tokenizer`-ul 🤗 Transformers are un atribut numit `backend_tokenizer` care oferă acces la tokenizatorul de bază din biblioteca 🤗 Tokenizers:
+
+```py
+from transformers import AutoTokenizer
+
+tokenizer = AutoTokenizer.from_pretrained("bert-base-uncased")
+print(type(tokenizer.backend_tokenizer))
+```
+
+```python out
+<class 'tokenizers.Tokenizer'>
+```
+
+Atributul `normalizer` al obiectului `tokenizer` are o metodă `normalize_str()` pe care o putem folosi pentru a vedea cum se realizează normalizarea:
+
+```py
+print(tokenizer.backend_tokenizer.normalizer.normalize_str("Héllò hôw are ü?"))
+```
+
+```python out
+'hello how are u?'
+```
+
+În acest exemplu, din moment ce am ales checkpointul `bert-base-uncased`, normalizarea a aplicat scrierea cu minusculă și a eliminat accentele.
+
+<Tip>
+
+✏️ **Încercați!** Încărcați un tokenizer din checkpointul `bert-base-cased` și treceți-i același exemplu. Care sunt principalele diferențe pe care le puteți observa între versiunile cased și uncased ale tokenizerului?
+
+</Tip>
+
+## Pre-tokenization[[pre-tokenization]]
+
+<Youtube id="grlLV8AIXug"/>
+
+După cum vom vedea în secțiunile următoare, un tokenizer nu poate fi antrenat doar pe text raw. În schimb, trebuie mai întâi să împărțim textele în entități mici, cum ar fi cuvintele. Aici intervine etapa de pre-tokenizare. După cum am văzut în [Capitolul 2](/course/chapter2), un tokenizer bazat pe cuvinte poate împărți pur și simplu un text raw în cuvinte pe baza spațiului și a punctuației. Aceste cuvinte vor fi limitele subtokenurilor pe care tokenizerul le poate învăța în timpul instruirii sale.
+
+Pentru a vedea cum un tokenizator rapid efectuează pre-tokenizarea, putem utiliza metoda `pre_tokenize_str()` a atributului `pre_tokenizer` al obiectului `tokenizer`:
+
+```py
+tokenizer.backend_tokenizer.pre_tokenizer.pre_tokenize_str("Hello, how are  you?")
+```
+
+```python out
+[('Hello', (0, 5)), (',', (5, 6)), ('how', (7, 10)), ('are', (11, 14)), ('you', (16, 19)), ('?', (19, 20))]
+```
+
+Observați cum tokenizatorul ține deja evidența offseturilor, acesta fiind modul în care ne poate oferi mappingul offseturilor pe care l-am folosit în secțiunea anterioară. Aici, tokenizatorul ignoră cele două spații și le înlocuiește cu unul singur, dar offsetul sare între `are` și `you` pentru a ține cont de acest lucru.
+
+Deoarece utilizăm un tokenizer BERT, pre-tokenizarea implică separarea spațiilor și a punctuației. Alți tokenizatori pot avea reguli diferite pentru acest pas. De exemplu, dacă folosim tokenizatorul GPT-2:
+
+```py
+tokenizer = AutoTokenizer.from_pretrained("gpt2")
+tokenizer.backend_tokenizer.pre_tokenizer.pre_tokenize_str("Hello, how are  you?")
+```
+
+va despărți în spații și punctuație, dar va păstra spațiile și le va înlocui cu un simbol `Ġ`, permițându-i să recupereze spațiile originale dacă facem decode tokenilor:
+
+```python out
+[('Hello', (0, 5)), (',', (5, 6)), ('Ġhow', (6, 10)), ('Ġare', (10, 14)), ('Ġ', (14, 15)), ('Ġyou', (15, 19)),
+ ('?', (19, 20))]
+```
+
+De asemenea, rețineți că, spre deosebire de tokenizatorul BERT, acest tokenizator nu ignoră spațiul dublu.
+
+Pentru un ultim exemplu, să aruncăm o privire la tokenizerul T5, care se bazează pe algoritmul SentencePiece:
+
+```py
+tokenizer = AutoTokenizer.from_pretrained("t5-small")
+tokenizer.backend_tokenizer.pre_tokenizer.pre_tokenize_str("Hello, how are  you?")
+```
+
+```python out
+[('▁Hello,', (0, 6)), ('▁how', (7, 10)), ('▁are', (11, 14)), ('▁you?', (16, 20))]
+```
+
+Ca și tokenizatorul GPT-2, acesta păstrează spațiile și le înlocuiește cu un token specific (`_`), dar tokenizatorul T5 separă doar spațiile, nu și punctuația. De asemenea, observați că a adăugat un spațiu implicit la începutul propoziției (înainte de `Hello`) și a ignorat spațiul dublu dintre `are` și `you`.
+
+Acum că am văzut puțin din modul în care diferite tokenizere procesează textul, putem începe să explorăm algoritmii care stau la baza acestora. Vom începe cu o privire rapidă asupra SentencePiece, care se aplică pe scară largă; apoi, în următoarele trei secțiuni, vom examina modul în care funcționează cei trei algoritmi principali utilizați pentru tokenizarea subcuvintelor.
+
+## SentencePiece[[sentencepiece]]
+
+[SentencePiece](https://github.com/google/sentencepiece) este un algoritm de tokenizare pentru preprocesarea textului pe care îl puteți utiliza cu oricare dintre modelele pe care le vom vedea în următoarele trei secțiuni. Acesta consideră textul ca o secvență de caractere Unicode și înlocuiește spațiile cu un caracter special, `▁`. Folosit împreună cu algoritmul Unigram (a se vedea [secțiunea 7](/course/chapter7/7)), nu necesită nici măcar o etapă de pre-tokenizare, ceea ce este foarte util pentru limbile în care nu se folosește caracterul spațiu (cum ar fi chineza sau japoneza).
+
+Cealaltă caracteristică principală a SentencePiece este *reversible tokenization*: deoarece nu există un tratament special al spațiilor, decodarea tokenurilor se face pur și simplu prin concatenarea lor și înlocuirea `_` cu spații - acest lucru rezultă în textul normalizat. După cum am văzut mai devreme, tokenizatorul BERT elimină spațiile care se repetă, deci tokenizarea sa nu este reversibilă.
+
+## Prezentare generală a algoritmului[[algorithm-overview]]
+
+În următoarele secțiuni, vom analiza cei trei algoritmi principali de tokenizare a subcuvintelor: BPE (utilizat de GPT-2 și alții), WordPiece (utilizat de exemplu de BERT) și Unigram (utilizat de T5 și alții). Înainte de a începe, iată o scurtă prezentare generală a modului în care funcționează fiecare dintre acestea. Nu ezitați să reveniți la acest tabel după ce citiți fiecare dintre secțiunile următoare, dacă încă nu are sens pentru dumneavoastră.
+
+Model | BPE | WordPiece | Unigram
+:----:|:---:|:---------:|:------:
+Training | Pornește de la un vocabular restrâns și învață reguli de îmbinare a tokenilor |  Pornește de la un vocabular restrâns și învață reguli de îmbinare a tokenilor | Pornește de la un vocabular mare și învață regulile de eliminare a tokenilor
+Training step | Combină tokenii corespunzători celei mai comune perechi | Combină tokenii corespunzători perechii cu cel mai bun scor pe baza frecvenței perechii, privilegiind perechile în care fiecare token individual este mai puțin frecvent| Elimină toți tokenii din vocabular care vor minimiza pierderea calculată pe întregul corpus
+Learns | Reguli de combinare și un vocabular| Doar un vocabular| Un vocabular cu un anumit scor pentru fiecare token
+Encoding | Împarte un cuvânt în caractere și aplică îmbinările învățate în timpul antrenării | Găsește cel mai lung subcuvânt începând de la început care se află în vocabular, apoi face același lucru pentru restul cuvântului | Găsește cea mai probabilă împărțire în tokens, folosind scorurile învățate în timpul antrenării
+
+Acum hai să trecem la BPE!
\ No newline at end of file
diff --git a/chapters/ro/chapter 6/5.mdx b/chapters/ro/chapter 6/5.mdx
new file mode 100644
index 000000000..91c26b82f
--- /dev/null
+++ b/chapters/ro/chapter 6/5.mdx	
@@ -0,0 +1,360 @@
+# Tokenizarea Byte-Pair Encoding[[byte-pair-encoding-tokenization]]
+
+<CourseFloatingBanner chapter={6}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter6/section5.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter6/section5.ipynb"},
+]} />
+
+Byte-Pair Encoding (BPE) a fost inițial dezvoltat ca un algoritm de comprimare a textelor și apoi utilizat de OpenAI pentru tokenizare la preantrenarea modelului GPT. Acesta este utilizat de o mulțime de modele Transformers, inclusiv GPT, GPT-2, RoBERTa, BART și DeBERTa.
+
+<Youtube id="HEikzVL-lZU"/>
+
+<Tip>
+
+💡 Această secțiune acoperă BPE în profunzime, mergând până la prezentarea unei implementări complete. Puteți sări la sfârșit dacă doriți doar o prezentare generală a algoritmului de tokenizare.
+
+</Tip>
+
+## Algoritmul de antrenare[[training-algorithm]]
+
+Antrenarea BPE începe prin calcularea setului unic de cuvinte utilizate în corpus (după finalizarea etapelor de normalizare și pre-tokenizare), apoi construirea vocabularului prin preluarea tuturor simbolurilor utilizate pentru scrierea acestor cuvinte. Ca un exemplu foarte simplu, să spunem că corpusul nostru utilizează aceste cinci cuvinte:
+
+```
+"hug", "pug", "pun", "bun", "hugs"
+```
+
+Vocabularul de bază va fi atunci `["b", "g", "h", "n", "p", "s", "u"]`. Pentru cazurile din lumea reală, vocabularul de bază va conține cel puțin toate caracterele ASCII și, probabil, și unele caractere Unicode. Dacă un exemplu pe care îl tokenizați utilizează un caracter care nu se află în corpusul de antrenare, acel caracter va fi convertit într-un token necunoscut. Acesta este unul dintre motivele pentru care o mulțime de modele NLP sunt foarte proaste la analizarea conținutului cu emoji, de exemplu.
+
+<Tip>
+
+Tokenizerele GPT-2 și RoBERTa (care sunt destul de asemănătoare) au o modalitate inteligentă de a rezolva acest lucru: ele nu privesc cuvintele ca fiind scrise cu caractere Unicode, ci cu bytes. În acest fel, vocabularul de bază are o dimensiune mică (256), dar fiecare caracter la care vă puteți gândi va fi inclus și nu va ajunge să fie convertit într-un token necunoscut. Acest truc se numește *byte-level BPE*.
+
+</Tip>
+
+După obținerea acestui vocabular de bază, adăugăm noi tokeni până când se atinge dimensiunea dorită a vocabularului prin învățarea prin *merges*, care sunt reguli de merge a două elemente ale vocabularului existent într-unul nou. Astfel, la început, aceste fuziuni vor crea tokenuri cu două caractere, iar apoi, pe măsură ce antrenamentul progresează, subwords mai lungi.
+
+În orice etapă din timpul antrenării tokenizerului, algoritmul BPE va căuta cea mai frecventă pereche de tokenuri existente (prin "pereche" înțelegem aici doi tokeni consecutivi într-un cuvânt). Acea pereche cea mai frecventă este cea care va fi mergea, iar noi ștergem și repetăm pentru pasul următor.
+
+Revenind la exemplul nostru anterior, să presupunem că cuvintele au următoarele frecvențe:
+
+```
+("hug", 10), ("pug", 5), ("pun", 12), ("bun", 4), ("hugs", 5)
+```
+
+înțelegând că `"hug"` a fost prezent de 10 ori în corpus, `"pug"` de 5 ori, `"pun"` de 12 ori, `"bun"` de 4 ori, iar `"hugs"` de 5 ori. Începem antrenamentul împărțind fiecare cuvânt în caractere (cele care formează vocabularul nostru inițial), astfel încât să putem vedea fiecare cuvânt ca pe o listă de tokeni:
+
+```
+("h" "u" "g", 10), ("p" "u" "g", 5), ("p" "u" "n", 12), ("b" "u" "n", 4), ("h" "u" "g" "s", 5)
+```
+
+Apoi ne uităm la perechi. Perechea `("h", "u")` este prezentă în cuvintele `"hug"` și `"hugs"`, deci de 15 ori în total în corpus. Totuși, nu este cea mai frecventă pereche: această onoare revine perechii `("u", "g")`, care este prezentă în cuvintele `"hug"`, `"pug"` și `"hugs"`, pentru un total de 20 de ori în vocabular.
+
+Astfel, prima regulă de merge învățată de tokenizer este `("u", "g") -> "ug"`, ceea ce înseamnă că `"ug"` va fi adăugat la vocabular, iar perechea ar trebui să fie merged în toate cuvintele din corpus. La sfârșitul acestei etape, vocabularul și corpus-ul arată astfel:
+
+```
+Vocabulary: ["b", "g", "h", "n", "p", "s", "u", "ug"]
+Corpus: ("h" "ug", 10), ("p" "ug", 5), ("p" "u" "n", 12), ("b" "u" "n", 4), ("h" "ug" "s", 5)
+```
+
+Acum avem câteva perechi care rezultă într-un token mai lung de două caractere: perechea `("h", "ug")`, de exemplu (prezentă de 15 ori în corpus). Cea mai frecventă pereche în această etapă este `("u", "n")`, prezentă însă de 16 ori în corpus, astfel încât a doua regulă de îmbinare învățată este `("u", "n") -> "un"`. Adăugarea acestei reguli la vocabular și mergingul tuturor aparițiilor existente ne conduce la:
+
+```
+Vocabulary: ["b", "g", "h", "n", "p", "s", "u", "ug", "un"]
+Corpus: ("h" "ug", 10), ("p" "ug", 5), ("p" "un", 12), ("b" "un", 4), ("h" "ug" "s", 5)
+```
+
+Acum, cea mai frecventă pereche este `("h", "ug")`, așa că învățăm regula de erge `("h", "ug") -> "hug"`, care ne oferă primul nostru simbol din trei litere. După fuzionare, corpusul arată astfel:
+
+```
+Vocabulary: ["b", "g", "h", "n", "p", "s", "u", "ug", "un", "hug"]
+Corpus: ("hug", 10), ("p" "ug", 5), ("p" "un", 12), ("b" "un", 4), ("hug" "s", 5)
+```
+
+Și continuăm astfel până când ajungem la dimensiunea dorită a vocabularului.
+
+<Tip>
+
+✏️ **Acum e rândul tău!** Care crezi că va fi următoarea regulă de fuziune?
+
+</Tip>
+
+## Algoritmul de tokenizare[[tokenization-algorithm]]
+
+Tokenizarea urmează îndeaproape procesul de antrenare, în sensul că noile inputuri sunt tokenizate prin aplicarea următoarelor etape:
+
+1. Normalizare
+2. Pre-tokenizare
+3. Divizarea cuvintelor în caractere individuale
+4. Aplicarea regulilor de merge învățate în ordine asupra acestor împărțiri
+
+Să luăm exemplul pe care l-am folosit în timpul antrenamentului, cu cele trei reguli de merge învățate:
+
+```
+("u", "g") -> "ug"
+("u", "n") -> "un"
+("h", "ug") -> "hug"
+```
+
+Cuvântul `"bug"` va fi tokenizat ca `["b", "ug"]`. Cu toate acestea, cuvântul `"mug"` va fi tokenizat ca `["[UNK]", "ug"]` deoarece litera `"m"` nu a fost în vocabularul de bază. De asemenea, cuvântul `"thug"` va fi tokenizat ca `["[UNK]", "hug"]`: litera `"t"` nu se află în vocabularul de bază, iar aplicarea regulilor de merge duce mai întâi la fuzionarea lui `"u"` și `"g"` și apoi la fuzionarea lui `"h"` și `"ug"`.
+
+<Tip>
+
+✏️ **Acum e rândul tău!** Cum crezi că va fi tokenizat cuvântul `"unhug"`?
+
+</Tip>
+
+## Implementarea BPE[[implementing-bpe]]
+
+Acum să aruncăm o privire la implementarea algoritmului BPE. Aceasta nu va fi o versiune optimizată pe care o puteți utiliza pe un corpus mare; dorim doar să vă arătăm codul pentru a putea înțelege algoritmul puțin mai bine.
+
+În primul rând avem nevoie de un corpus, așa că haideți să creăm unul simplu cu câteva propoziții:
+
+```python
+corpus = [
+    "This is the Hugging Face Course.",
+    "This chapter is about tokenization.",
+    "This section shows several tokenizer algorithms.",
+    "Hopefully, you will be able to understand how they are trained and generate tokens.",
+]
+```
+
+Apoi, trebuie să pre-tokenizăm acest corpus în cuvinte. Deoarece replicăm un tokenizator BPE (precum GPT-2), vom utiliza tokenizatorul `gpt2` pentru pre-tokenizare:
+
+```python
+from transformers import AutoTokenizer
+
+tokenizer = AutoTokenizer.from_pretrained("gpt2")
+```
+
+Apoi, calculăm frecvențele fiecărui cuvânt din corpus la fel ca în cazul pre-tokenizării:
+
+```python
+from collections import defaultdict
+
+word_freqs = defaultdict(int)
+
+for text in corpus:
+    words_with_offsets = tokenizer.backend_tokenizer.pre_tokenizer.pre_tokenize_str(text)
+    new_words = [word for word, offset in words_with_offsets]
+    for word in new_words:
+        word_freqs[word] += 1
+
+print(word_freqs)
+```
+
+```python out
+defaultdict(int, {'This': 3, 'Ġis': 2, 'Ġthe': 1, 'ĠHugging': 1, 'ĠFace': 1, 'ĠCourse': 1, '.': 4, 'Ġchapter': 1,
+    'Ġabout': 1, 'Ġtokenization': 1, 'Ġsection': 1, 'Ġshows': 1, 'Ġseveral': 1, 'Ġtokenizer': 1, 'Ġalgorithms': 1,
+    'Hopefully': 1, ',': 1, 'Ġyou': 1, 'Ġwill': 1, 'Ġbe': 1, 'Ġable': 1, 'Ġto': 1, 'Ġunderstand': 1, 'Ġhow': 1,
+    'Ġthey': 1, 'Ġare': 1, 'Ġtrained': 1, 'Ġand': 1, 'Ġgenerate': 1, 'Ġtokens': 1})
+```
+
+Următorul pas este calcularea vocabularului de bază, format din toate caracterele utilizate în corpus:
+
+```python
+alphabet = []
+
+for word in word_freqs.keys():
+    for letter in word:
+        if letter not in alphabet:
+            alphabet.append(letter)
+alphabet.sort()
+
+print(alphabet)
+```
+
+```python out
+[ ',', '.', 'C', 'F', 'H', 'T', 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'k', 'l', 'm', 'n', 'o', 'p', 'r', 's',
+  't', 'u', 'v', 'w', 'y', 'z', 'Ġ']
+```
+
+De asemenea, adăugăm tokenurile speciale utilizate de model la începutul vocabularului respectiv. În cazul GPT-2, singurul simbol special este `"<|endoftext|>"`:
+
+```python
+vocab = ["<|endoftext|>"] + alphabet.copy()
+```
+
+Acum trebuie să împărțim fiecare cuvânt în caractere individuale, pentru a putea începe antrenarea:
+
+```python
+splits = {word: [c for c in word] for word in word_freqs.keys()}
+```
+
+Acum că suntem pregătiți pentru antrenare, să scriem o funcție care calculează frecvența fiecărei perechi. Va trebui să folosim această funcție la fiecare etapă a antrenare:
+
+```python
+def compute_pair_freqs(splits):
+    pair_freqs = defaultdict(int)
+    for word, freq in word_freqs.items():
+        split = splits[word]
+        if len(split) == 1:
+            continue
+        for i in range(len(split) - 1):
+            pair = (split[i], split[i + 1])
+            pair_freqs[pair] += freq
+    return pair_freqs
+```
+
+Să aruncăm o privire la o parte din acest dicționar după separările inițiale:
+
+```python
+pair_freqs = compute_pair_freqs(splits)
+
+for i, key in enumerate(pair_freqs.keys()):
+    print(f"{key}: {pair_freqs[key]}")
+    if i >= 5:
+        break
+```
+
+```python out
+('T', 'h'): 3
+('h', 'i'): 3
+('i', 's'): 5
+('Ġ', 'i'): 2
+('Ġ', 't'): 7
+('t', 'h'): 3
+```
+
+Acum, pentru a găsi cea mai frecventă pereche este nevoie doar de o loop rapid:
+
+```python
+best_pair = ""
+max_freq = None
+
+for pair, freq in pair_freqs.items():
+    if max_freq is None or max_freq < freq:
+        best_pair = pair
+        max_freq = freq
+
+print(best_pair, max_freq)
+```
+
+```python out
+('Ġ', 't') 7
+```
+
+Așadar, prima îmbinare care trebuie învățată este `('Ġ', 't') -> 'Ġt'`, și adăugăm `'Ġt'` la vocabular:
+
+```python
+merges = {("Ġ", "t"): "Ġt"}
+vocab.append("Ġt")
+```
+
+Pentru a continua, trebuie să aplicăm aceast merge în dicționarul nostru `splits`. Să scriem o altă funcție pentru acest lucru:
+
+```python
+def merge_pair(a, b, splits):
+    for word in word_freqs:
+        split = splits[word]
+        if len(split) == 1:
+            continue
+
+        i = 0
+        while i < len(split) - 1:
+            if split[i] == a and split[i + 1] == b:
+                split = split[:i] + [a + b] + split[i + 2 :]
+            else:
+                i += 1
+        splits[word] = split
+    return splits
+```
+
+Și putem arunca o privire la rezultatul primului merge:
+
+```py
+splits = merge_pair("Ġ", "t", splits)
+print(splits["Ġtrained"])
+```
+
+```python out
+['Ġt', 'r', 'a', 'i', 'n', 'e', 'd']
+```
+
+Acum avem tot ce ne trebuie pentru a face bucle până când vom învăța toate mergeu-rile dorite. Ne focusăm pe o mărime a vocabularui de 50:
+
+```python
+vocab_size = 50
+
+while len(vocab) < vocab_size:
+    pair_freqs = compute_pair_freqs(splits)
+    best_pair = ""
+    max_freq = None
+    for pair, freq in pair_freqs.items():
+        if max_freq is None or max_freq < freq:
+            best_pair = pair
+            max_freq = freq
+    splits = merge_pair(*best_pair, splits)
+    merges[best_pair] = best_pair[0] + best_pair[1]
+    vocab.append(best_pair[0] + best_pair[1])
+```
+
+Ca rezultat, am învățat 19 reguli de merge(vocabularul inițial avea o dimensiune de 31 -- 30 de caractere din alfabet, plus simbolul special):
+
+```py
+print(merges)
+```
+
+```python out
+{('Ġ', 't'): 'Ġt', ('i', 's'): 'is', ('e', 'r'): 'er', ('Ġ', 'a'): 'Ġa', ('Ġt', 'o'): 'Ġto', ('e', 'n'): 'en',
+ ('T', 'h'): 'Th', ('Th', 'is'): 'This', ('o', 'u'): 'ou', ('s', 'e'): 'se', ('Ġto', 'k'): 'Ġtok',
+ ('Ġtok', 'en'): 'Ġtoken', ('n', 'd'): 'nd', ('Ġ', 'is'): 'Ġis', ('Ġt', 'h'): 'Ġth', ('Ġth', 'e'): 'Ġthe',
+ ('i', 'n'): 'in', ('Ġa', 'b'): 'Ġab', ('Ġtoken', 'i'): 'Ġtokeni'}
+```
+
+Iar vocabularul este compus din simbolul special, alfabetul inițial și toate rezultatele merge-urilor:
+
+```py
+print(vocab)
+```
+
+```python out
+['<|endoftext|>', ',', '.', 'C', 'F', 'H', 'T', 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'k', 'l', 'm', 'n', 'o',
+ 'p', 'r', 's', 't', 'u', 'v', 'w', 'y', 'z', 'Ġ', 'Ġt', 'is', 'er', 'Ġa', 'Ġto', 'en', 'Th', 'This', 'ou', 'se',
+ 'Ġtok', 'Ġtoken', 'nd', 'Ġis', 'Ġth', 'Ġthe', 'in', 'Ġab', 'Ġtokeni']
+```
+
+<Tip>
+
+💡 Folosind `train_new_from_iterator()` pe același corpus nu va rezulta exact același vocabular. Acest lucru se datorează faptului că atunci când există o alegere a celei mai frecvente perechi, am selectat-o pe prima întâlnită, în timp ce biblioteca 🤗 Tokenizers o selectează pe prima pe baza ID-urilor sale interne.
+
+</Tip>
+
+Pentru a tokeniza un text nou, îl pre-tokenizăm, îl împărțim, apoi aplicăm toate regulile de merge învățate:
+
+```python
+def tokenize(text):
+    pre_tokenize_result = tokenizer._tokenizer.pre_tokenizer.pre_tokenize_str(text)
+    pre_tokenized_text = [word for word, offset in pre_tokenize_result]
+    splits = [[l for l in word] for word in pre_tokenized_text]
+    for pair, merge in merges.items():
+        for idx, split in enumerate(splits):
+            i = 0
+            while i < len(split) - 1:
+                if split[i] == pair[0] and split[i + 1] == pair[1]:
+                    split = split[:i] + [merge] + split[i + 2 :]
+                else:
+                    i += 1
+            splits[idx] = split
+
+    return sum(splits, [])
+```
+
+Putem încerca acest lucru pe orice text compus din caractere din alfabet:
+
+```py
+tokenize("This is not a token.")
+```
+
+```python out
+['This', 'Ġis', 'Ġ', 'n', 'o', 't', 'Ġa', 'Ġtoken', '.']
+```
+
+<Tip warning={true}>
+
+⚠️ Implementarea noastră va arunca o eroare dacă există un caracter necunoscut, deoarece nu am făcut nimic pentru a le gestiona. GPT-2 nu are de fapt un token necunoscut (este imposibil să obțineți un caracter necunoscut atunci când utilizați BPE la nivel de bytes), dar acest lucru s-ar putea întâmpla aici deoarece nu am inclus toate byte-urile posibile în vocabularul inițial. Acest aspect al BPE depășește domeniul de aplicare al acestei secțiuni, așa că am omis detaliile.
+
+</Tip>
+
+Asta e tot pentru algoritmul BPE! În continuare, ne vom uita la WordPiece.
\ No newline at end of file
diff --git a/chapters/ro/chapter 6/6.mdx b/chapters/ro/chapter 6/6.mdx
new file mode 100644
index 000000000..c2b0e6450
--- /dev/null
+++ b/chapters/ro/chapter 6/6.mdx	
@@ -0,0 +1,375 @@
+# Tokenizarea WordPiece[[wordpiece-tokenization]]
+
+<CourseFloatingBanner chapter={6}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter6/section6.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter6/section6.ipynb"},
+]} />
+
+WordPiece este algoritmul de tokenizare dezvoltat de Google pentru preantrenarea BERT. De atunci, acesta a fost reutilizat în numeroase modele Transformers bazate pe BERT, cum ar fi DistilBERT, MobileBERT, Funnel Transformers și MPNET. Este foarte similar cu BPE în ceea ce privește antrenarea, dar tokenizarea efectivă se face diferit.
+
+<Youtube id="qpv6ms_t_1A"/>
+
+<Tip>
+
+💡 Această secțiune acoperă WordPiece în profunzime, mergând până la prezentarea unei implementări complete. Puteți sări la sfârșit dacă doriți doar o prezentare generală a algoritmului de tokenizare.
+
+</Tip>
+
+## Algoritmul de antrenare[[training-algorithm]]
+
+<Tip warning={true}>
+
+⚠️ Google nu a publicat niciodată implementarea sa a algoritmului de formare a WordPiece, astfel încât ceea ce urmează este cea mai bună presupunere a noastră bazată pe literatura publicată. Este posibil să nu fie 100% exactă.
+
+</Tip>
+
+La fel ca BPE, WordPiece pornește de la un vocabular restrâns care include simbolurile speciale utilizate de model și alfabetul inițial. Deoarece identifică subcuvinte prin adăugarea unui prefix (cum ar fi `##` pentru BERT), fiecare cuvânt este inițial împărțit prin adăugarea prefixului respectiv la toate caracterele din cuvânt. Astfel, de exemplu, `"word"` este împărțit astfel:
+
+```
+w ##o ##r ##d
+```
+
+Astfel, alfabetul inițial conține toate caracterele prezente la începutul unui cuvânt și caracterele prezente în interiorul unui cuvânt cu prefixul WordPiece.
+
+Apoi, la fel ca BPE, WordPiece învață reguli de merge. Principala diferență este modul în care este selectată perechea care urmează să fie merged. În loc să selecteze cea mai frecventă pereche, WordPiece calculează un scor pentru fiecare pereche, utilizând următoarea formulă:
+
+$$\mathrm{score} = (\mathrm{freq\_of\_pair}) / (\mathrm{freq\_of\_first\_element} \times \mathrm{freq\_of\_second\_element})$$
+
+Împărțind frecvența perechii la produsul frecvențelor fiecărei părți a acesteia, algoritmul prioritizează fuzionarea perechilor în care părțile individuale sunt mai puțin frecvente în vocabular. De exemplu, nu va fuziona neapărat `("un", "##able")` chiar dacă această pereche apare foarte frecvent în vocabular, deoarece cele două perechi `"un"` și `"##able"` vor apărea probabil fiecare într-o mulțime de alte cuvinte și vor avea o frecvență ridicată. În schimb, o pereche precum `("hu", "##gging")` va fi probabil fuzionată mai repede (presupunând că cuvântul "hugging" apare frecvent în vocabular), deoarece `"hu"` și `"##gging"` sunt probabil mai puțin frecvente individual.
+
+Să ne uităm la același vocabular pe care l-am folosit în exemplul de antrenare BPE:
+
+```
+("hug", 10), ("pug", 5), ("pun", 12), ("bun", 4), ("hugs", 5)
+```
+
+Spliturile aici vor fi:
+
+```
+("h" "##u" "##g", 10), ("p" "##u" "##g", 5), ("p" "##u" "##n", 12), ("b" "##u" "##n", 4), ("h" "##u" "##g" "##s", 5)
+```
+
+deci vocabularul inițial va fi `["b", "h", "p", "##g", "##n", "##s", "##u"]` (dacă uităm deocamdată de tokenurile speciale). Cea mai frecventă pereche este `("##u", "##g")` (prezentă de 20 de ori), dar frecvența individuală a lui `"##u"` este foarte mare, astfel încât scorul său nu este cel mai mare (este 1 / 36). Toate perechile cu un `"##u"` au de fapt același scor (1 / 36), astfel încât cel mai bun scor revine perechii `("##g", "##s")` - singura fără un `"##u"` - cu 1 / 20, iar prima îmbinare învățată este `("##g", "##s") -> ("##gs")`.
+
+Rețineți că atunci când facem merge, eliminăm `##` dintre cele două tokenuri, deci adăugăm `"##gs"` la vocabular și aplicăm merge în cuvintele din corpus:
+
+```
+Vocabulary: ["b", "h", "p", "##g", "##n", "##s", "##u", "##gs"]
+Corpus: ("h" "##u" "##g", 10), ("p" "##u" "##g", 5), ("p" "##u" "##n", 12), ("b" "##u" "##n", 4), ("h" "##u" "##gs", 5)
+```
+
+În acest moment, `"##u"` se află în toate perechile posibile, deci toate au același scor. Să spunem că în acest caz, prima pereche este merged, deci `("h", "##u") -> "hu"`. Acest lucru ne duce la:
+
+```
+Vocabulary: ["b", "h", "p", "##g", "##n", "##s", "##u", "##gs", "hu"]
+Corpus: ("hu" "##g", 10), ("p" "##u" "##g", 5), ("p" "##u" "##n", 12), ("b" "##u" "##n", 4), ("hu" "##gs", 5)
+```
+
+Apoi, următorul scor cu cel mai bun rezultat este împărțit de `("hu", "##g")` și `("hu", "##gs")` (cu 1/15, comparativ cu 1/21 pentru toate celelalte perechi), astfel încât prima pereche cu cel mai mare scor este merged
+
+```
+Vocabulary: ["b", "h", "p", "##g", "##n", "##s", "##u", "##gs", "hu", "hug"]
+Corpus: ("hug", 10), ("p" "##u" "##g", 5), ("p" "##u" "##n", 12), ("b" "##u" "##n", 4), ("hu" "##gs", 5)
+```
+
+și continuăm astfel până când ajungem la dimensiunea dorită a vocabularului.
+
+<Tip>
+
+✏️ **Acum e rândul tău!** Care va fi următoarea regulă de merge?
+
+</Tip>
+
+## Algoritm de tokenizare[[tokenization-algorithm]]
+
+Tokenizarea diferă în WordPiece și BPE prin faptul că WordPiece salvează doar vocabularul final, nu și regulile de merge învățate. Pornind de la cuvântul de tokenizat, WordPiece găsește cel mai lung subcuvânt care se află în vocabular, apoi îl împarte. De exemplu, dacă folosim vocabularul învățat în exemplul de mai sus, pentru cuvântul `"hugs"` cel mai lung subcuvânt de la început care se află în vocabular este `"hug"`, așa că împărțim acolo și obținem `["hug", "##s"]`. Apoi continuăm cu `"##s"`, care se află în vocabular, deci tokenizarea lui `"hugs"` este `["hug", "##s"]`.
+
+Cu BPE, am fi aplicat mergeurile învățate în ordine și am fi tokenizat acest lucru ca `["hu", "##gs"]`, deci encodingul este diferit.
+
+Ca un alt exemplu, să vedem cum ar fi tokenizat cuvântul `"bugs"`. `"b"` este cel mai lung subcuvânt care începe de la începutul cuvântului care se află în vocabular, așa că îl împărțim acolo și obținem `["b", "##ugs"]`. Apoi, `"##u"` este cel mai lung subcuvânt care începe de la începutul cuvântului `"##ugs"` care se află în vocabular, deci îl separăm și obținem `["b", "##u, "##gs"]`. În cele din urmă, `"##gs"` se află în vocabular, deci această ultimă listă este tokenizarea lui `"bugs"`.
+
+Atunci când tokenizarea ajunge într-un stadiu în care nu este posibilă găsirea unui subcuvânt în vocabular, întregul cuvânt este tokenizat ca necunoscut - astfel, de exemplu, `"mug"` ar fi tokenizat ca `["[UNK]"]`, la fel ca `"bum"` (chiar dacă putem începe cu `"b"` și `"##u"`, `"##m"` nu face parte din vocabular, iar tokenizarea rezultată va fi `["[UNK]"]`, nu `["b", "##u", "[UNK]"]`). Aceasta este o altă diferență față de BPE, care ar clasifica doar caracterele individuale care nu se află în vocabular ca necunoscute.
+
+<Tip>
+
+✏️ **Acum e rândul tău!** Cum va fi tokenizat cuvântul `"pugs"`?
+
+</Tip>
+
+## Implementând WordPiece[[implementing-wordpiece]]
+
+Acum să aruncăm o privire la o implementare a algoritmului WordPiece. La fel ca în cazul BPE, acest lucru este doar pedagogic și nu veți putea să îl utilizați pe un corpus mare.
+
+Vom utiliza același corpus ca în exemplul BPE:
+
+```python
+corpus = [
+    "This is the Hugging Face Course.",
+    "This chapter is about tokenization.",
+    "This section shows several tokenizer algorithms.",
+    "Hopefully, you will be able to understand how they are trained and generate tokens.",
+]
+```
+
+În primul rând, trebuie să pre-tokenizăm corpusul în cuvinte. Deoarece replicăm un tokenizator WordPiece (precum BERT), vom utiliza tokenizatorul `bert-base-cased` pentru pre-tokenizare:
+
+```python
+from transformers import AutoTokenizer
+
+tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
+```
+
+Apoi, calculăm frecvențele fiecărui cuvânt din corpus la fel ca în cazul pre-tokenizării:
+
+```python
+from collections import defaultdict
+
+word_freqs = defaultdict(int)
+for text in corpus:
+    words_with_offsets = tokenizer.backend_tokenizer.pre_tokenizer.pre_tokenize_str(text)
+    new_words = [word for word, offset in words_with_offsets]
+    for word in new_words:
+        word_freqs[word] += 1
+
+word_freqs
+```
+
+```python out
+defaultdict(
+    int, {'This': 3, 'is': 2, 'the': 1, 'Hugging': 1, 'Face': 1, 'Course': 1, '.': 4, 'chapter': 1, 'about': 1,
+    'tokenization': 1, 'section': 1, 'shows': 1, 'several': 1, 'tokenizer': 1, 'algorithms': 1, 'Hopefully': 1,
+    ',': 1, 'you': 1, 'will': 1, 'be': 1, 'able': 1, 'to': 1, 'understand': 1, 'how': 1, 'they': 1, 'are': 1,
+    'trained': 1, 'and': 1, 'generate': 1, 'tokens': 1})
+```
+
+După cum am văzut mai devreme, alfabetul este setul unic compus din toate primele litere ale cuvintelor și toate celelalte litere care apar în cuvintele cu prefixul `##`:
+
+```python
+alphabet = []
+for word in word_freqs.keys():
+    if word[0] not in alphabet:
+        alphabet.append(word[0])
+    for letter in word[1:]:
+        if f"##{letter}" not in alphabet:
+            alphabet.append(f"##{letter}")
+
+alphabet.sort()
+alphabet
+
+print(alphabet)
+```
+
+```python out
+['##a', '##b', '##c', '##d', '##e', '##f', '##g', '##h', '##i', '##k', '##l', '##m', '##n', '##o', '##p', '##r', '##s',
+ '##t', '##u', '##v', '##w', '##y', '##z', ',', '.', 'C', 'F', 'H', 'T', 'a', 'b', 'c', 'g', 'h', 'i', 's', 't', 'u',
+ 'w', 'y']
+```
+
+De asemenea, adăugăm simbolurile speciale utilizate de model la începutul vocabularului respectiv. În cazul BERT, este vorba de lista `["[PAD]", "[UNK]", "[CLS]", "[SEP]", "[MASK]"]``:
+
+```python
+vocab = ["[PAD]", "[UNK]", "[CLS]", "[SEP]", "[MASK]"] + alphabet.copy()
+```
+
+Apoi trebuie să împărțim fiecare cuvânt, cu toate literele care nu sunt primele cu prefixul `##`:
+
+```python
+splits = {
+    word: [c if i == 0 else f"##{c}" for i, c in enumerate(word)]
+    for word in word_freqs.keys()
+}
+```
+
+Acum că suntem pregătiți pentru antrenare, să scriem o funcție care calculează scorul fiecărei perechi. Va trebui să folosim această funcție la fiecare etapă a antrenării:
+
+```python
+def compute_pair_scores(splits):
+    letter_freqs = defaultdict(int)
+    pair_freqs = defaultdict(int)
+    for word, freq in word_freqs.items():
+        split = splits[word]
+        if len(split) == 1:
+            letter_freqs[split[0]] += freq
+            continue
+        for i in range(len(split) - 1):
+            pair = (split[i], split[i + 1])
+            letter_freqs[split[i]] += freq
+            pair_freqs[pair] += freq
+        letter_freqs[split[-1]] += freq
+
+    scores = {
+        pair: freq / (letter_freqs[pair[0]] * letter_freqs[pair[1]])
+        for pair, freq in pair_freqs.items()
+    }
+    return scores
+```
+
+Să aruncăm o privire la o parte din acest dicționar după separările inițiale:
+
+```python
+pair_scores = compute_pair_scores(splits)
+for i, key in enumerate(pair_scores.keys()):
+    print(f"{key}: {pair_scores[key]}")
+    if i >= 5:
+        break
+```
+
+```python out
+('T', '##h'): 0.125
+('##h', '##i'): 0.03409090909090909
+('##i', '##s'): 0.02727272727272727
+('i', '##s'): 0.1
+('t', '##h'): 0.03571428571428571
+('##h', '##e'): 0.011904761904761904
+```
+
+Acum, pentru a găsi perechea cu cel mai bun scor este nevoie doar de un loop rapid:
+
+```python
+best_pair = ""
+max_score = None
+for pair, score in pair_scores.items():
+    if max_score is None or max_score < score:
+        best_pair = pair
+        max_score = score
+
+print(best_pair, max_score)
+```
+
+```python out
+('a', '##b') 0.2
+```
+
+Așadar, primul merge de învățat este `('a', '##b') -> 'ab'`, iar noi adăugăm `'ab'` la vocabular:
+
+```python
+vocab.append("ab")
+```
+
+Pentru a continua, trebuie să aplicăm aceast merge în dicționarul nostru `splits`. Să scriem o altă funcție pentru acest lucru:
+
+```python
+def merge_pair(a, b, splits):
+    for word in word_freqs:
+        split = splits[word]
+        if len(split) == 1:
+            continue
+        i = 0
+        while i < len(split) - 1:
+            if split[i] == a and split[i + 1] == b:
+                merge = a + b[2:] if b.startswith("##") else a + b
+                split = split[:i] + [merge] + split[i + 2 :]
+            else:
+                i += 1
+        splits[word] = split
+    return splits
+```
+
+Și putem arunca o privire la rezultatul primului merge:
+
+```py
+splits = merge_pair("a", "##b", splits)
+splits["about"]
+```
+
+```python out
+['ab', '##o', '##u', '##t']
+```
+
+Acum avem tot ce ne trebuie pentru a face bucle până când vom învăța toate merge-urile dorite. Să ne propunem un vocabular de mărimea 70:
+
+```python
+vocab_size = 70
+while len(vocab) < vocab_size:
+    scores = compute_pair_scores(splits)
+    best_pair, max_score = "", None
+    for pair, score in scores.items():
+        if max_score is None or max_score < score:
+            best_pair = pair
+            max_score = score
+    splits = merge_pair(*best_pair, splits)
+    new_token = (
+        best_pair[0] + best_pair[1][2:]
+        if best_pair[1].startswith("##")
+        else best_pair[0] + best_pair[1]
+    )
+    vocab.append(new_token)
+```
+
+Ne putem uita apoi la vocabularul generat:
+
+```py
+print(vocab)
+```
+
+```python out
+['[PAD]', '[UNK]', '[CLS]', '[SEP]', '[MASK]', '##a', '##b', '##c', '##d', '##e', '##f', '##g', '##h', '##i', '##k',
+ '##l', '##m', '##n', '##o', '##p', '##r', '##s', '##t', '##u', '##v', '##w', '##y', '##z', ',', '.', 'C', 'F', 'H',
+ 'T', 'a', 'b', 'c', 'g', 'h', 'i', 's', 't', 'u', 'w', 'y', 'ab', '##fu', 'Fa', 'Fac', '##ct', '##ful', '##full', '##fully',
+ 'Th', 'ch', '##hm', 'cha', 'chap', 'chapt', '##thm', 'Hu', 'Hug', 'Hugg', 'sh', 'th', 'is', '##thms', '##za', '##zat',
+ '##ut']
+```
+
+După cum putem vedea, în comparație cu BPE, acest tokenizator învață părțile din cuvinte ca tokenuri puțin mai repede.
+
+<Tip>
+
+💡 Folosind `train_new_from_iterator()` pe același corpus nu va rezulta exact același vocabular. Acest lucru se datorează faptului că biblioteca 🤗 Tokenizers nu implementează WordPiece pentru antrenare (deoarece nu suntem complet siguri cum funcționează intern), ci utilizează BPE în schimb.
+
+</Tip>
+
+Pentru a tokeniza un text nou, îl pre-tokenizăm, îl împărțim, apoi aplicăm algoritmul de tokenizare pe fiecare cuvânt. Adică, căutăm cel mai mare subcuvânt începând de la începutul primului cuvânt și îl împărțim, apoi repetăm procesul pentru a doua parte și așa mai departe pentru restul acelui cuvânt și pentru următoarele cuvinte din text:
+
+```python
+def encode_word(word):
+    tokens = []
+    while len(word) > 0:
+        i = len(word)
+        while i > 0 and word[:i] not in vocab:
+            i -= 1
+        if i == 0:
+            return ["[UNK]"]
+        tokens.append(word[:i])
+        word = word[i:]
+        if len(word) > 0:
+            word = f"##{word}"
+    return tokens
+```
+
+Haideți să-l testăm pe un cuvânt care se află în vocabular și pe altul care nu se află:
+
+
+```python
+print(encode_word("Hugging"))
+print(encode_word("HOgging"))
+```
+
+```python out
+['Hugg', '##i', '##n', '##g']
+['[UNK]']
+```
+
+Acum, scriem o funcție care tokenizează un text:
+
+```python
+def tokenize(text):
+    pre_tokenize_result = tokenizer._tokenizer.pre_tokenizer.pre_tokenize_str(text)
+    pre_tokenized_text = [word for word, offset in pre_tokenize_result]
+    encoded_words = [encode_word(word) for word in pre_tokenized_text]
+    return sum(encoded_words, [])
+```
+
+Îl putem încerca pe orice text:
+
+```python
+tokenize("This is the Hugging Face course!")
+```
+
+```python out
+['Th', '##i', '##s', 'is', 'th', '##e', 'Hugg', '##i', '##n', '##g', 'Fac', '##e', 'c', '##o', '##u', '##r', '##s',
+ '##e', '[UNK]']
+```
+
+Asta e tot pentru algoritmul WordPiece! Acum să aruncăm o privire la Unigram.
diff --git a/chapters/ro/chapter 6/7.mdx b/chapters/ro/chapter 6/7.mdx
new file mode 100644
index 000000000..14744a854
--- /dev/null
+++ b/chapters/ro/chapter 6/7.mdx	
@@ -0,0 +1,381 @@
+# Tokenizarea Unigram[[unigram-tokenization]]
+
+<CourseFloatingBanner chapter={6}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter6/section7.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter6/section7.ipynb"},
+]} />
+
+Algoritmul Unigram este adesea utilizat în SentencePiece, care este algoritmul de tokenizare utilizat de modele precum AlBERT, T5, mBART, Big Bird și XLNet.
+
+<Youtube id="TGZfZVuF9Yc"/>
+
+<Tip>
+
+💡 Această secțiune acoperă Unigram în profunzime, mergând până la prezentarea unei implementări complete. Puteți sări la sfârșit dacă doriți doar o prezentare generală a algoritmului de tokenizare.
+
+</Tip>
+
+## Algoritm de antrenare[[training-algorithm]]
+
+În comparație cu BPE și WordPiece, Unigram lucrează în cealaltă direcție: pornește de la un vocabular mare și elimină tokeni din acesta până când ajunge la dimensiunea dorită. Există mai multe opțiuni pentru a construi acel vocabular de bază: putem lua, de exemplu, cele mai comune substrings din cuvintele pre-tokenizate sau putem aplica BPE pe corpusul inițial cu o dimensiune mare a vocabularului.
+
+La fiecare etapă a antrenării, algoritmul Unigram calculează o pierdere pe corpus oferit, având în vedere vocabularul curent. Apoi, pentru fiecare simbol din vocabular, algoritmul calculează cu cât ar crește pierderea globală dacă simbolul ar fi eliminat și caută simbolurile care ar crește cel mai puțin pierderea. Aceste simboluri au cel mai redus efect asupra pierderii globale din corpus, deci, într-un fel, sunt "mai puțin necesare" și sunt cei mai buni candidați pentru eliminare.
+
+Aceasta este o operațiune foarte costisitoare, așa că nu eliminăm doar simbolul asociat cu cea mai mică creștere a pierderii, ci procentul \\(p\\) (\\(p\\) fiind un hyperparameter pe care îl poți controla, de obicei 10 sau 20) din simbolurile asociate cu cea mai mică creștere a pierderilor. Acest proces este se repetă până când vocabularul atinge dimensiunea dorită.
+
+Rețineți că nu eliminăm niciodată caracterele de bază, pentru a ne asigura că orice cuvânt poate fi tokenizat.
+
+Acum, acest lucru este încă puțin vag: partea principală a algoritmului este de a calcula o pierdere asupra corpusului și de a vedea cum se schimbă atunci când eliminăm unele tokenuri din vocabular, dar nu am explicat încă cum să facem acest lucru. Acest pas se bazează pe algoritmul de tokenizare al unui model Unigram, așa că îl vom analiza în continuare.
+
+Vom reutiliza corpusul din exemplele anterioare:
+
+```
+("hug", 10), ("pug", 5), ("pun", 12), ("bun", 4), ("hugs", 5)
+```
+
+iar pentru acest exemplu, vom lua toate substringurile stricte pentru vocabularul inițial:
+
+```
+["h", "u", "g", "hu", "ug", "p", "pu", "n", "un", "b", "bu", "s", "hug", "gs", "ugs"]
+```
+
+## Algoritm de tokenizare[[tokenization-algorithm]]
+
+Un model Unigram este un tip de model lingvistic care consideră că fiecare token este independent de tokenii anteriori. Este cel mai simplu model lingvistic, în sensul că probabilitatea simbolului X având în vedere contextul anterior este doar probabilitatea simbolului X. Astfel, dacă am utiliza un model lingvistic Unigram pentru a genera text, am prezice întotdeauna simbolul cel mai frecvent.
+
+Probabilitatea unui token dat este frecvența sa (numărul de ori în care îl găsim) în corpusul original, împărțită la suma tuturor aparițiilor tuturor tokenilor din vocabular (pentru a ne asigura că probabilitățile sunt egale cu 1). De exemplu, `"ug"` este prezent în `"hug"`, `"pug"`, și `"hugs"`, deci are o frecvență de 20 în corpus-ul nostru.
+
+Iată frecvențele tuturor subcuvintelor posibile din vocabular:
+
+```
+("h", 15) ("u", 36) ("g", 20) ("hu", 15) ("ug", 20) ("p", 17) ("pu", 17) ("n", 16)
+("un", 16) ("b", 4) ("bu", 4) ("s", 5) ("hug", 15) ("gs", 5) ("ugs", 5)
+```
+
+Astfel, suma tuturor frecvențelor este 210, iar probabilitatea subcuvântului `"ug"` este 20/210.
+
+<Tip>
+
+✏️ **Acum este rândul tău!** Scrie codul pentru a calcula frecvențele de mai sus și verifică de două ori dacă rezultatele afișate sunt corecte, precum și suma totală.
+
+</Tip>
+
+Acum, pentru a tokeniza un cuvânt dat, ne uităm la toate segmentările posibile în tokeni și calculăm probabilitatea fiecăruia în conformitate cu modelul Unigram. Deoarece toate token-urile sunt considerate independente, această probabilitate este doar produsul probabilității fiecărui token. De exemplu, tokenizarea `["p", "u", "g"]` a lui `"pug"` are probabilitatea:
+
+$$P([``p", ``u", ``g"]) = P(``p") \times P(``u") \times P(``g") = \frac{5}{210} \times \frac{36}{210} \times \frac{20}{210} = 0.000389$$
+
+Comparativ, tokenizarea `["pu", "g"]` are probabilitatea:
+
+$$P([``pu", ``g"]) = P(``pu") \times P(``g") = \frac{5}{210} \times \frac{20}{210} = 0.0022676$$
+
+astfel încât una este mult mai probabilă decât alta. În general, tokenizările cu cei mai puțini tokeni posibili vor avea cea mai mare probabilitate (din cauza acelei împărțiri la 210 repetată pentru fiecare token), ceea ce corespunde cu ceea ce dorim intuitiv: să împărțim un cuvânt în cel mai mic număr de tokenuri posibil.
+
+Tokenizarea unui cuvânt cu modelul Unigram este atunci tokenizarea cu cea mai mare probabilitate. În exemplul `"pug"`, iată probabilitățile pe care le-am obține pentru fiecare segmentare posibilă:
+
+```
+["p", "u", "g"] : 0.000389
+["p", "ug"] : 0.0022676
+["pu", "g"] : 0.0022676
+```
+
+Astfel, `"pug"` ar fi tokenizat ca `["p", "ug"]` sau `["pu", "g"]`, în funcție de care dintre aceste segmentări este întâlnită prima (rețineți că într-un corpus mai mare, cazurile de egalitate ca acesta vor fi rare).
+
+În acest caz, a fost ușor să găsim toate segmentările posibile și să le calculăm probabilitățile, dar în general va fi puțin mai greu. Există un algoritm clasic utilizat pentru acest lucru, numit *algoritmul Viterbi*. În esență, putem construi un grafic pentru a detecta segmentările posibile ale unui cuvânt dat, spunând că există o ramură de la caracterul _a_ la caracterul _b_ dacă subcuvântul de la _a_ la _b_ se află în vocabular, și atribuind ramurii respective probabilitatea subcuvântului.
+
+Pentru a găsi calea din acest grafic care va avea cel mai bun scor, algoritmul Viterbi determină, pentru fiecare poziție din cuvânt, segmentarea cu cel mai bun scor care se termină la poziția respectivă. Deoarece mergem de la început la sfârșit, cel mai bun scor poate fi găsit prin parcurgerea în buclă a tuturor subcuvintelor care se termină la poziția curentă și apoi folosind cel mai bun scor de tokenizare de la poziția la care începe acest subcuvânt. Apoi, trebuie doar să derulăm calea parcursă pentru a ajunge la sfârșit.
+
+Să aruncăm o privire la un exemplu folosind vocabularul nostru și cuvântul `"unhug"`. Pentru fiecare poziție, subcuvintele cu cele mai bune scoruri care se termină acolo sunt următoarele:
+
+```
+Character 0 (u): "u" (score 0.171429)
+Character 1 (n): "un" (score 0.076191)
+Character 2 (h): "un" "h" (score 0.005442)
+Character 3 (u): "un" "hu" (score 0.005442)
+Character 4 (g): "un" "hug" (score 0.005442)
+```
+
+Astfel, `"unhug"` ar fi tokenizat ca `["un", "hug"]`.
+
+<Tip>
+
+✏️ **Acum e rândul tău!** Determinați tokenizarea cuvântului `"huggun"` și scorul acestuia.
+
+</Tip>
+
+## Înapoi la antrenare[[back-to-training]]
+
+Acum că am văzut cum funcționează tokenizarea, putem analiza mai în profunzime pierderea utilizată în timpul antrenării. În orice etapă dată, această pierdere este calculată prin tokenizarea fiecărui cuvânt din corpus, utilizând vocabularul curent și modelul Unigram determinat de frecvențele fiecărui token din corpus (după cum am văzut mai devreme).
+
+Fiecare cuvânt din corpus are un scor, iar pierderea este negative log likelihood a acestor scoruri - adică suma pentru toate cuvintele din corpus a tuturor `-log(P(word))`.
+
+Să ne întoarcem la exemplul nostru cu următorul corpus:
+
+```
+("hug", 10), ("pug", 5), ("pun", 12), ("bun", 4), ("hugs", 5)
+```
+
+Tokenizarea fiecărui cuvânt cu scorurile lor respective este:
+
+```
+"hug": ["hug"] (score 0.071428)
+"pug": ["pu", "g"] (score 0.007710)
+"pun": ["pu", "n"] (score 0.006168)
+"bun": ["bu", "n"] (score 0.001451)
+"hugs": ["hug", "s"] (score 0.001701)
+```
+
+Deci, pierderea este:
+
+```
+10 * (-log(0.071428)) + 5 * (-log(0.007710)) + 12 * (-log(0.006168)) + 4 * (-log(0.001451)) + 5 * (-log(0.001701)) = 169.8
+```
+
+Acum trebuie să calculăm modul în care eliminarea fiecărui token afectează pierderea. Acest lucru este destul de plictisitor, așa că îl vom face doar pentru doi tokeni aici și vom păstra întregul proces pentru atunci când vom avea cod care să ne ajute. În acest caz (foarte) special, aveam două tokenizări echivalente ale tuturor cuvintelor: după cum am văzut mai devreme, de exemplu, `"pug"` ar putea fi tokenizat `["p", "ug"]` cu același scor. Astfel, eliminarea simbolului `"pu"` din vocabular va produce exact aceeași pierdere.
+
+Pe de altă parte, eliminarea lui `"hug"` va agrava pierderea, deoarece tokenizarea lui `"hug"` și `"hugs"` va deveni:
+
+```
+"hug": ["hu", "g"] (score 0.006802)
+"hugs": ["hu", "gs"] (score 0.001701)
+```
+
+Aceste modificări vor determina creșterea pierderii cu:
+
+```
+- 10 * (-log(0.071428)) + 10 * (-log(0.006802)) = 23.5
+```
+
+Prin urmare, tokenul `"pu"` va fi probabil eliminat din vocabular, dar nu și `"hug"`.
+
+## Implementarea Unigram[[implementarea-unigram]]
+
+Acum să implementăm în cod tot ceea ce am văzut până acum. Ca și în cazul BPE și WordPiece, aceasta nu este o implementare eficientă a algoritmului Unigram (dimpotrivă), dar ar trebui să vă ajute să-l înțelegeți puțin mai bine.
+
+Vom folosi ca exemplu același corpus ca și până acum:
+
+```python
+corpus = [
+    "This is the Hugging Face Course.",
+    "This chapter is about tokenization.",
+    "This section shows several tokenizer algorithms.",
+    "Hopefully, you will be able to understand how they are trained and generate tokens.",
+]
+```
+
+De data aceasta, vom folosi `xlnet-base-cased` ca modelul nostru:
+
+```python
+from transformers import AutoTokenizer
+
+tokenizer = AutoTokenizer.from_pretrained("xlnet-base-cased")
+```
+
+Ca și pentru BPE și WordPiece, începem prin a număra numărul de apariții ale fiecărui cuvânt în corpus:
+
+```python
+from collections import defaultdict
+
+word_freqs = defaultdict(int)
+for text in corpus:
+    words_with_offsets = tokenizer.backend_tokenizer.pre_tokenizer.pre_tokenize_str(text)
+    new_words = [word for word, offset in words_with_offsets]
+    for word in new_words:
+        word_freqs[word] += 1
+
+word_freqs
+```
+
+Apoi, trebuie să inițializăm vocabularul nostru la ceva mai mare decât dimensiunea vocabularului pe care o vom dori la final. Trebuie să includem toate caracterele de bază (altfel nu vom putea tokeniza fiecare cuvânt), dar pentru substringurile mai mari le vom păstra doar pe cele mai comune, așa că le vom sorta după frecvență:
+
+```python
+char_freqs = defaultdict(int)
+subwords_freqs = defaultdict(int)
+for word, freq in word_freqs.items():
+    for i in range(len(word)):
+        char_freqs[word[i]] += freq
+        # Loop through the subwords of length at least 2
+        for j in range(i + 2, len(word) + 1):
+            subwords_freqs[word[i:j]] += freq
+
+# Sortarea subcuvintelor după frecvență
+sorted_subwords = sorted(subwords_freqs.items(), key=lambda x: x[1], reverse=True)
+sorted_subwords[:10]
+```
+
+```python out
+[('▁t', 7), ('is', 5), ('er', 5), ('▁a', 5), ('▁to', 4), ('to', 4), ('en', 4), ('▁T', 3), ('▁Th', 3), ('▁Thi', 3)]
+```
+
+Grupăm caracterele cu cele mai bune subcuvinte pentru a ajunge la un vocabular inițial de dimensiunea 300:
+
+```python
+token_freqs = list(char_freqs.items()) + sorted_subwords[: 300 - len(char_freqs)]
+token_freqs = {token: freq for token, freq in token_freqs}
+```
+
+<Tip>
+
+💡 SentencePiece utilizează un algoritm mai eficient numit Enhanced Suffix Array (ESA) pentru a crea vocabularul inițial.
+
+</Tip>
+
+În continuare, calculăm suma tuturor frecvențelor, pentru a converti frecvențele în probabilități. Pentru modelul nostru, vom stoca logaritmii probabilităților, deoarece este mai stabil din punct de vedere numeric să adăugăm logaritmi decât să multiplicăm numere mici, iar acest lucru va simplifica calcularea pierderii modelului:
+
+```python
+from math import log
+
+total_sum = sum([freq for token, freq in token_freqs.items()])
+model = {token: -log(freq / total_sum) for token, freq in token_freqs.items()}
+```
+
+Acum funcția principală este cea care tokenizează cuvintele folosind algoritmul Viterbi. După cum am văzut mai devreme, acest algoritm calculează cea mai bună segmentare a fiecărui substringur din cuvânt, pe care o vom stoca într-o variabilă numită `best_segmentations`. Vom stoca un dicționar pentru fiecare poziție din cuvânt (de la 0 la lungimea totală a acestuia), cu două chei: indicele de început al ultimului token din cea mai bună segmentare și scorul celei mai bune segmentări. Cu ajutorul indicelui de început al ultimului token, vom putea extrage segmentarea completă odată ce lista este complet populată.
+
+Popularea listei se face cu doar două bucle: bucla principală trece peste fiecare poziție de început, iar a doua bucla încearcă toate subcuvintele care încep la acea poziție de început. Dacă substringul se află în vocabular, avem o nouă segmentare a cuvântului până la acea poziție finală, pe care o comparăm cu cea din `best_segmentations`.
+
+Odată ce bucla principală este terminată, pornim de la sfârșit și sărim de la o poziție de început la alta, înregistrând tokenii pe parcurs, până când ajungem la începutul cuvântului:
+
+```python
+def encode_word(word, model):
+    best_segmentations = [{"start": 0, "score": 1}] + [
+        {"start": None, "score": None} for _ in range(len(word))
+    ]
+    for start_idx in range(len(word)):
+        # This should be properly filled by the previous steps of the loop
+        best_score_at_start = best_segmentations[start_idx]["score"]
+        for end_idx in range(start_idx + 1, len(word) + 1):
+            token = word[start_idx:end_idx]
+            if token in model and best_score_at_start is not None:
+                score = model[token] + best_score_at_start
+                # If we have found a better segmentation ending at end_idx, we update
+                if (
+                    best_segmentations[end_idx]["score"] is None
+                    or best_segmentations[end_idx]["score"] > score
+                ):
+                    best_segmentations[end_idx] = {"start": start_idx, "score": score}
+
+    segmentation = best_segmentations[-1]
+    if segmentation["score"] is None:
+        # We did not find a tokenization of the word -> unknown
+        return ["<unk>"], None
+
+    score = segmentation["score"]
+    start = segmentation["start"]
+    end = len(word)
+    tokens = []
+    while start != 0:
+        tokens.insert(0, word[start:end])
+        next_start = best_segmentations[start]["start"]
+        end = start
+        start = next_start
+    tokens.insert(0, word[start:end])
+    return tokens, score
+```
+
+Putem încerca deja modelul nostru inițial pe câteva cuvinte:
+
+```python
+print(encode_word("Hopefully", model))
+print(encode_word("This", model))
+```
+
+```python out
+(['H', 'o', 'p', 'e', 'f', 'u', 'll', 'y'], 41.5157494601402)
+(['This'], 6.288267030694535)
+```
+
+Acum este ușor de calculat pierderea modelului pe corpus!
+
+```python
+def compute_loss(model):
+    loss = 0
+    for word, freq in word_freqs.items():
+        _, word_loss = encode_word(word, model)
+        loss += freq * word_loss
+    return loss
+```
+
+Putem verifica dacă funcționează pe modelul pe care îl avem:
+
+```python
+compute_loss(model)
+```
+
+```python out
+413.10377642940875
+```
+
+Nici calcularea scorurilor pentru fiecare token nu este foarte dificilă; trebuie doar să calculăm pierderea pentru modelele obținute prin ștergerea fiecărui tokeb:
+
+```python
+import copy
+
+
+def compute_scores(model):
+    scores = {}
+    model_loss = compute_loss(model)
+    for token, score in model.items():
+        # We always keep tokens of length 1
+        if len(token) == 1:
+            continue
+        model_without_token = copy.deepcopy(model)
+        _ = model_without_token.pop(token)
+        scores[token] = compute_loss(model_without_token) - model_loss
+    return scores
+```
+
+Îl putem încerca pe un token dat:
+
+```python
+scores = compute_scores(model)
+print(scores["ll"])
+print(scores["his"])
+```
+
+Deoarece `"ll"` este folosit în tokenizarea lui `"Hopefully"`, iar eliminarea lui ne va face, probabil, să folosim tokenul `"l"` de două ori în schimb, ne așteptăm să aibă o pierdere pozitivă. `"his"` este folosit doar în interiorul cuvântului `"This"`, care este tokenizat ca el însuși, deci ne așteptăm să aibă o pierdere zero. Iată rezultatele:
+
+```python out
+6.376412403623874
+0.0
+```
+
+<Tip>
+
+💡 Această abordare este foarte ineficientă, astfel încât SentencePiece utilizează o aproximare a pierderii modelului fără simbolul X: în loc să înceapă de la zero, înlocuiește simbolul X cu segmentarea sa în vocabularul rămas. În acest fel, toate scorurile pot fi calculate odată, în același timp cu pierderea modelului.
+
+</Tip>
+
+Cu toate acestea la locul lor, ultimul lucru pe care trebuie să îl facem este să adăugăm la vocabular tokeni speciali utilizate de model, apoi să facem o buclă până când am eliminat suficienți tokeni din vocabular pentru a ajunge la dimensiunea dorită:
+
+```python
+percent_to_remove = 0.1
+while len(model) > 100:
+    scores = compute_scores(model)
+    sorted_scores = sorted(scores.items(), key=lambda x: x[1])
+    # Remove percent_to_remove tokens with the lowest scores.
+    for i in range(int(len(model) * percent_to_remove)):
+        _ = token_freqs.pop(sorted_scores[i][0])
+
+    total_sum = sum([freq for token, freq in token_freqs.items()])
+    model = {token: -log(freq / total_sum) for token, freq in token_freqs.items()}
+```
+
+Apoi, pentru a tokeniza un text, trebuie doar să aplicăm pre-tokenizarea și apoi să folosim funcția `encode_word()`:
+
+```python
+def tokenize(text, model):
+    words_with_offsets = tokenizer.backend_tokenizer.pre_tokenizer.pre_tokenize_str(text)
+    pre_tokenized_text = [word for word, offset in words_with_offsets]
+    encoded_words = [encode_word(word, model)[0] for word in pre_tokenized_text]
+    return sum(encoded_words, [])
+
+
+tokenize("This is the Hugging Face course.", model)
+```
+
+```python out
+['▁This', '▁is', '▁the', '▁Hugging', '▁Face', '▁', 'c', 'ou', 'r', 's', 'e', '.']
+```
+
+Asta e tot pentru Unigram! Sperăm că până acum vă simțiți ca un expert în toate lucrurile legate de tokenizer. În secțiunea următoare, vom aprofunda elementele de bază ale bibliotecii 🤗 Tokenizers și vă vom arăta cum le puteți utiliza pentru a vă construi propriul tokenizer.
diff --git a/chapters/ro/chapter 6/8.mdx b/chapters/ro/chapter 6/8.mdx
new file mode 100644
index 000000000..4e41c84cb
--- /dev/null
+++ b/chapters/ro/chapter 6/8.mdx	
@@ -0,0 +1,566 @@
+# Construirea unui tokenizer, bloc cu bloc[[building-a-tokenizer-block-by-block]]
+
+<CourseFloatingBanner chapter={6}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter6/section8.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter6/section8.ipynb"},
+]} />
+
+După cum am văzut în secțiunile anterioare, tokenizarea cuprinde mai multe etape:
+
+- Normalizare (orice curățare a textului care este considerată necesară, cum ar fi eliminarea spațiilor sau a accentelor, normalizarea Unicode etc.)
+- Pre-tokenizarea (împărțirea inputului în cuvinte)
+- Rularea inputului prin model (utilizarea cuvintelor pre-tokenizate pentru a produce o secvență de tokeni)
+- Post-procesare (adăugarea tokenilor speciali ale tokenizerului, generarea attention maskului și a ID-urilor de tip token)
+
+Ca un reminder, iată o altă perspectivă asupra procesului general:
+
+<div class="flex justify-center">
+<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter6/tokenization_pipeline.svg" alt="The tokenization pipeline.">
+<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter6/tokenization_pipeline-dark.svg" alt="The tokenization pipeline.">
+</div>
+
+Biblioteca 🤗 Tokenizers a fost construită pentru a oferi mai multe opțiuni pentru fiecare dintre acești pași, pe care le puteți amesteca și combina împreună. În această secțiune vom vedea cum putem construi un tokenizer de la zero, spre deosebire de antrenarea unui tokenizer nou dintr-unul vechi, așa cum am făcut în [secțiunea 2](/course/chapter6/2). Veți putea apoi să construiți orice fel de tokenizer la care vă puteți gândi!
+
+<Youtube id="MR8tZm5ViWU"/>
+
+Mai exact, biblioteca este construită în jurul unei clase centrale `Tokenizer` cu building grupate în submodule:
+
+- `normalizers` conține toate tipurile posibile de `Normalizer` pe care le puteți folosi (lista completă [aici](https://huggingface.co/docs/tokenizers/api/normalizers)).
+- `pre_tokenizers` coține toate tipurile de `PreTokenizer` pe care le poți folosi(lista completă [aici](https://huggingface.co/docs/tokenizers/api/pre-tokenizers)).
+- `models` conține diferitele tipuri de `Model` pe care le puteți folosi, precum `BPE`, `WordPiece` și `Unigram` (lista completă [aici](https://huggingface.co/docs/tokenizers/api/models)).
+- `trainers` conține toate tipurile diferite de `Trainer` pe care le puteți folosi pentru a vă antrena modelul pe un corpus (unul pentru fiecare tip de model; lista completă [aici](https://huggingface.co/docs/tokenizers/api/trainers)).
+- `post_processors` conține diferitele tipuri de `PostProcessor` pe care le puteți utiliza (lista completă [aici](https://huggingface.co/docs/tokenizers/api/post-processors)).
+- `decoders` conține diferitele tipuri de `Decoder` pe care le puteți utiliza pentru a decoda rezultatele tokenizării (lista completă [aici](https://huggingface.co/docs/tokenizers/components#decoders)).
+
+Puteți găsi întreaga listă de blocuri [aici](https://huggingface.co/docs/tokenizers/components).
+
+## Obținerea unui corpus[[acquiring-a-corpus]]
+
+Pentru a antrena noul nostru tokenizer, vom utiliza un corpus mic de text (astfel încât exemplele să ruleze rapid). Pașii pentru obținerea corpusului sunt similari cu cei pe care i-am urmat la [începutul acestui capitol](/course/chapter6/2), dar de data aceasta vom utiliza datasetul [WikiText-2](https://huggingface.co/datasets/wikitext):
+
+```python
+from datasets import load_dataset
+
+dataset = load_dataset("wikitext", name="wikitext-2-raw-v1", split="train")
+
+
+def get_training_corpus():
+    for i in range(0, len(dataset), 1000):
+        yield dataset[i : i + 1000]["text"]
+```
+
+Funcția `get_training_corpus()` este un generator care va produce batch-uri de 1 000 de texte, pe care le vom utiliza pentru a antrena tokenizerul.
+
+🤗 Tokenizers pot fi, de asemenea, antrenate direct pe fișiere text. Iată cum putem genera un fișier text care să conțină toate textele/inputurile din WikiText-2 pe care le putem utiliza local:
+
+```python
+with open("wikitext-2.txt", "w", encoding="utf-8") as f:
+    for i in range(len(dataset)):
+        f.write(dataset[i]["text"] + "\n")
+```
+
+În continuare vă vom arăta cum să vă construiți propriile tokenizere BERT, GPT-2 și XLNet, bloc cu bloc. Acest lucru ne va oferi un exemplu pentru fiecare dintre cei trei algoritmi principali de tokenizare: WordPiece, BPE și Unigram. Să începem cu BERT!
+
+## Construirea unui tokenizator WordPiece de la zero[[building-a-wordpiece-tokenizer-from-scratch]]
+
+Pentru a construi un tokenizer cu biblioteca 🤗 Tokenizers, începem prin a inițializa un obiect `Tokenizer` cu un `model`, apoi îi setăm atributele `normalizer`, `pre_tokenizer`, `post_processor` și `decoder` la valorile dorite.
+
+Pentru acest exemplu, vom crea un `Tokenizer` cu un model WordPiece:
+
+```python
+from tokenizers import (
+    decoders,
+    models,
+    normalizers,
+    pre_tokenizers,
+    processors,
+    trainers,
+    Tokenizer,
+)
+
+tokenizer = Tokenizer(models.WordPiece(unk_token="[UNK]"))
+```
+
+Trebuie să specificăm `unk_token` astfel încât modelul să știe ce să returneze atunci când întâlnește caractere necunoscute. Alte argumente pe care le putem seta aici includ `vocab` al modelului nostru (vom antrena modelul, deci nu este nevoie să setăm acest lucru) și `max_input_chars_per_word`, care specifică o lungime maximă pentru fiecare cuvânt (cuvintele mai lungi decât valoarea trecută vor fi divizate).
+
+Primul pas al tokenizării este normalizarea, așa că să începem cu aceasta. Deoarece BERT este utilizat pe scară largă, există un `BertNormalizer` cu opțiunile clasice pe care le putem seta pentru BERT: `lowercase` și `strip_accents`, care se explică de la sine; `clean_text` pentru a elimina toate caracterele de control și a înlocui spațiile repetate cu unul singur; și `handle_chinese_chars`, care plasează spații în jurul caracterelor chinezești. Pentru a replica tokenizerul `bert-base-uncased`, putem seta doar acest normalizator:
+
+```python
+tokenizer.normalizer = normalizers.BertNormalizer(lowercase=True)
+```
+
+În general, atunci când construiți un nou tokenizer, nu veți avea acces la un normalizator atât de util, deja implementat în biblioteca 🤗 Tokenizers - așa că să vedem cum să creăm manual normalizatorul BERT. Biblioteca oferă un normalizator `Lowercase` și un normalizator `StripAccents` și puteți compune mai multe normalizatoare folosind un `Sequence`:
+
+```python
+tokenizer.normalizer = normalizers.Sequence(
+    [normalizers.NFD(), normalizers.Lowercase(), normalizers.StripAccents()]
+)
+```
+
+De asemenea, folosim un normalizator Unicode `NFD`, deoarece în caz contrar normalizatorul `StripAccents` nu va recunoaște corect caracterele accentuate și astfel nu le va elimina.
+
+După cum am mai văzut, putem folosi metoda `normalize_str()` a `normalizer` pentru a verifica efectele pe care le are asupra unui text dat:
+
+```python
+print(tokenizer.normalizer.normalize_str("Héllò hôw are ü?"))
+```
+
+```python out
+hello how are u?
+```
+
+<Tip>
+
+**Pentru a merge mai departe** Dacă testați cele două versiuni ale normalizatorilor anteriori pe un șir care conține caracterul Unicode `u"\u0085"` veți observa cu siguranță că acești doi normalizatori nu sunt exact echivalenți.
+Pentru a nu complica prea mult versiunea cu `normalizers.Sequence` , nu am inclus înlocuirile Regex pe care `BertNormalizer` le cere atunci când argumentul `clean_text` este setat la `True` - care este comportamentul implicit. Dar nu vă faceți griji: este posibil să obțineți exact aceeași normalizare fără a utiliza utilul `BertNormalizer` prin adăugarea a două `normalizers.Replace` la secvența normalizers.
+
+
+</Tip>
+
+Urmează etapa de pre-tokenizare. Din nou, există un `BertPreTokenizer` pre-construit pe care îl putem utiliza:
+
+```python
+tokenizer.pre_tokenizer = pre_tokenizers.BertPreTokenizer()
+```
+
+Sau îl putem construi de la zero:
+
+```python
+tokenizer.pre_tokenizer = pre_tokenizers.Whitespace()
+```
+
+Rețineți că pre-tokenizatorul `Whitespace` separă spațiul și toate caracterele care nu sunt litere, cifre sau caracterul underscore, deci tehnic separă spațiul și punctuația:
+
+```python
+tokenizer.pre_tokenizer.pre_tokenize_str("Let's test my pre-tokenizer.")
+```
+
+```python out
+[('Let', (0, 3)), ("'", (3, 4)), ('s', (4, 5)), ('test', (6, 10)), ('my', (11, 13)), ('pre', (14, 17)),
+ ('-', (17, 18)), ('tokenizer', (18, 27)), ('.', (27, 28))]
+```
+
+Dacă doriți să separați doar spațiile, ar trebui să utilizați în schimb pre-tokenizerul `WhitespaceSplit`:
+
+```python
+pre_tokenizer = pre_tokenizers.WhitespaceSplit()
+pre_tokenizer.pre_tokenize_str("Let's test my pre-tokenizer.")
+```
+
+```python out
+[("Let's", (0, 5)), ('test', (6, 10)), ('my', (11, 13)), ('pre-tokenizer.', (14, 28))]
+```
+
+Ca și în cazul normalizatorilor, puteți utiliza un `Sequence` pentru a compune mai mulți pre-tokenizeri:
+
+```python
+pre_tokenizer = pre_tokenizers.Sequence(
+    [pre_tokenizers.WhitespaceSplit(), pre_tokenizers.Punctuation()]
+)
+pre_tokenizer.pre_tokenize_str("Let's test my pre-tokenizer.")
+```
+
+```python out
+[('Let', (0, 3)), ("'", (3, 4)), ('s', (4, 5)), ('test', (6, 10)), ('my', (11, 13)), ('pre', (14, 17)),
+ ('-', (17, 18)), ('tokenizer', (18, 27)), ('.', (27, 28))]
+```
+
+Următorul pas în pipelineul de tokenizare este rularea inputurilor prin model. Am specificat deja modelul nostru în inițializare, dar mai trebuie să îl antrenăm, ceea ce va necesita un `WordPieceTrainer`. Principalul lucru de reținut atunci când inițializați un trainer în 🤗 Tokenizers este că trebuie să îi transmiteți toți tokenii speciali pe care intenționați să îi utilizați - în caz contrar, acesta nu le va adăuga la vocabular, deoarece acestea nu se află în corpusul de antrenare:
+
+```python
+special_tokens = ["[UNK]", "[PAD]", "[CLS]", "[SEP]", "[MASK]"]
+trainer = trainers.WordPieceTrainer(vocab_size=25000, special_tokens=special_tokens)
+```
+
+Pe lângă specificarea `vocab_size` și `special_tokens`, putem seta `min_frequency` (numărul de ori în care un simbol trebuie să apară pentru a fi inclus în vocabular) sau putem schimba `continuing_subword_prefix` (dacă dorim să folosim ceva diferit de `##`).
+
+Pentru a antrena modelul nostru folosind iteratorul pe care l-am definit anterior, trebuie doar să executăm această comandă:
+
+```python
+tokenizer.train_from_iterator(get_training_corpus(), trainer=trainer)
+```
+
+De asemenea, putem utiliza fișiere text pentru a ne antrena tokenizerul, care ar arăta astfel (în prealabil, reinițializăm modelul cu un `WordPiece` gol):
+
+```python
+tokenizer.model = models.WordPiece(unk_token="[UNK]")
+tokenizer.train(["wikitext-2.txt"], trainer=trainer)
+```
+
+În ambele cazuri, putem apoi testa tokenizerul pe un text prin apelarea metodei `encode()`:
+
+```python
+encoding = tokenizer.encode("Let's test this tokenizer.")
+print(encoding.tokens)
+```
+
+```python out
+['let', "'", 's', 'test', 'this', 'tok', '##eni', '##zer', '.']
+```
+
+`encoding`-ul obținut este un `Encoding`, care conține toate rezultatele necesare ale tokenizerului în diferitele sale atribute: `ids`, `type_ids`, `tokens`, `offsets`, `attention_mask`, `special_tokens_mask`, și `overflowing`.
+
+Ultimul pas în pipelineul de tokenizare este postprocesarea. Trebuie să adăugăm tokenul `[CLS]` la început și tokenul `[SEP]` la sfârșit (sau după fiecare propoziție, dacă avem o pereche de propoziții). Vom folosi un `TemplateProcessor` pentru aceasta, dar mai întâi trebuie să cunoaștem ID-urile tokenilor `[CLS]` și `[SEP]` din vocabular:
+
+```python
+cls_token_id = tokenizer.token_to_id("[CLS]")
+sep_token_id = tokenizer.token_to_id("[SEP]")
+print(cls_token_id, sep_token_id)
+```
+
+```python out
+(2, 3)
+```
+
+Pentru a scrie templateul pentru `TemplateProcessor`, trebuie să specificăm cum să tratăm o singură propoziție și o pereche de propoziții. Pentru ambele, scriem tokeni speciali pe care dorim să îi folosim; prima (sau singura) propoziție este reprezentată de `$A`, în timp ce a doua propoziție (dacă facem encoding unei perechi) este reprezentată de `$B`. Pentru fiecare dintre acestea (tokeni speciali și propoziții), specificăm și ID-ul tipului de token corespunzător după două puncte.
+
+Modelul clasic BERT este astfel definit după cum urmează:
+
+```python
+tokenizer.post_processor = processors.TemplateProcessing(
+    single=f"[CLS]:0 $A:0 [SEP]:0",
+    pair=f"[CLS]:0 $A:0 [SEP]:0 $B:1 [SEP]:1",
+    special_tokens=[("[CLS]", cls_token_id), ("[SEP]", sep_token_id)],
+)
+```
+
+Rețineți că trebuie să transmitem ID-urile tokenilor speciali, astfel încât tokenizerul să le poată converti corect în ID-urile lor.
+
+Odată ce acest lucru este adăugat, revenind la exemplul nostru anterior vom obține:
+
+```python
+encoding = tokenizer.encode("Let's test this tokenizer.")
+print(encoding.tokens)
+```
+
+```python out
+['[CLS]', 'let', "'", 's', 'test', 'this', 'tok', '##eni', '##zer', '.', '[SEP]']
+```
+
+Și pe o pereche de propoziții, obținem rezultatul corect:
+
+```python
+encoding = tokenizer.encode("Let's test this tokenizer...", "on a pair of sentences.")
+print(encoding.tokens)
+print(encoding.type_ids)
+```
+
+```python out
+['[CLS]', 'let', "'", 's', 'test', 'this', 'tok', '##eni', '##zer', '...', '[SEP]', 'on', 'a', 'pair', 'of', 'sentences', '.', '[SEP]']
+[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1]
+```
+
+Aproape am terminat de construit acest tokenizer de la zero - ultimul pas este să includem un decodor:
+
+```python
+tokenizer.decoder = decoders.WordPiece(prefix="##")
+```
+
+Haideți să-l testăm pe `encoding`-ul nostru anterior:
+
+```python
+tokenizer.decode(encoding.ids)
+```
+
+```python out
+"let's test this tokenizer... on a pair of sentences."
+```
+
+Grozav! Putem salva tokenizatorul nostru într-un singur fișier JSON, astfel:
+
+```python
+tokenizer.save("tokenizer.json")
+```
+
+Apoi putem reîncărca acel fișier într-un obiect `Tokenizer` cu metoda `from_file()`:
+
+```python
+new_tokenizer = Tokenizer.from_file("tokenizer.json")
+```
+
+Pentru a utiliza acest tokenizer în 🤗 Transformers, trebuie să îl încorporăm în `PreTrainedTokenizerFast`. Putem fie să folosim clasa generică, fie, dacă tokenizerul nostru corespunde unui model existent, să folosim clasa respectivă (aici, `BertTokenizerFast`). Dacă aplicați această lecție pentru a construi un tokenizer nou, va trebui să utilizați prima opțiune.
+
+Pentru a include tokenizatorul într-un `PreTrainedTokenizerFast`, putem fie să transmitem tokenizerul construit ca `tokenizer_object`, fie să transmitem fișierul tokenizerului salvat ca `tokenizer_file`. Cel mai important lucru de reținut este că trebuie să setăm manual toți tokenii speciali, deoarece această clasă nu poate deduce din obiectul `tokenizer` care tokne este tokenul mască, tokenul `[CLS]`, etc.:
+
+```python
+from transformers import PreTrainedTokenizerFast
+
+wrapped_tokenizer = PreTrainedTokenizerFast(
+    tokenizer_object=tokenizer,
+    # tokenizer_file="tokenizer.json", # You can load from the tokenizer file, alternatively
+    unk_token="[UNK]",
+    pad_token="[PAD]",
+    cls_token="[CLS]",
+    sep_token="[SEP]",
+    mask_token="[MASK]",
+)
+```
+
+Dacă utilizați o clasă specifică de tokenizer (cum ar fi `BertTokenizerFast`), va trebui să specificați doar tokenii speciali care sunt diferiți de cei impliciți (aici, niciunul):
+
+```python
+from transformers import BertTokenizerFast
+
+wrapped_tokenizer = BertTokenizerFast(tokenizer_object=tokenizer)
+```
+
+Apoi puteți utiliza acest tokenizer ca orice alt tokenizer 🤗 Transformers. Îl puteți salva cu metoda `save_pretrained()` sau îl puteți încărca în Hub cu metoda `push_to_hub()`.
+
+Acum că am văzut cum să construim un tokenizer WordPiece, hai să facem același lucru pentru un tokenizer BPE. Vom merge un pic mai repede, deoarece cunoașteți toți pașii, și vom evidenția doar diferențele.
+
+## Construirea unui tokenizer BPE de la zero[[building-a-bpe-tokenizer-from-scratch]]
+
+Să construim acum un tokenizer GPT-2. Ca și pentru tokenizer BERT, începem prin inițializarea unui `Tokenizer` cu un model BPE:
+
+```python
+tokenizer = Tokenizer(models.BPE())
+```
+
+De asemenea, la fel ca în cazul BERT, am putea inițializa acest model cu un vocabular, dacă am avea unul (în acest caz, ar trebui să oferim `vocab` și `merges`), dar din moment ce vom antrena de la zero, nu avem nevoie să facem acest lucru. De asemenea, nu trebuie să specificăm un `unk_token` deoarece GPT-2 utilizează BPE la nivel de bytes, care nu necesită acest lucru.
+
+GPT-2 nu utilizează un normalizator, deci sărim peste acest pas și trecem direct la pre-tokenizare:
+
+```python
+tokenizer.pre_tokenizer = pre_tokenizers.ByteLevel(add_prefix_space=False)
+```
+
+Opțiunea pe care am adăugat-o aici la `ByteLevel` nu este pentru a adăuga un spațiu unei propoziții (care este implicit în caz contrar). Putem arunca o privire la pre-tokenizarea unui text exemplu ca înainte:
+
+```python
+tokenizer.pre_tokenizer.pre_tokenize_str("Let's test pre-tokenization!")
+```
+
+```python out
+[('Let', (0, 3)), ("'s", (3, 5)), ('Ġtest', (5, 10)), ('Ġpre', (10, 14)), ('-', (14, 15)),
+ ('tokenization', (15, 27)), ('!', (27, 28))]
+```
+
+Urmează modelul, care are nevoie de antrenare. Pentru GPT-2, singurul token special este tokenul de sfârșit de text:
+
+```python
+trainer = trainers.BpeTrainer(vocab_size=25000, special_tokens=["<|endoftext|>"])
+tokenizer.train_from_iterator(get_training_corpus(), trainer=trainer)
+```
+
+Ca și în cazul `WordPieceTrainer`, precum și `vocab_size` și `special_tokens`, putem specifica `min_frequency` dacă dorim, sau dacă avem un sufix de sfârșit de cuvânt (cum ar fi `</w>`), îl putem seta cu `end_of_word_suffix`.
+
+Acest tokenizer poate fi antrenat și pe fișiere text:
+
+```python
+tokenizer.model = models.BPE()
+tokenizer.train(["wikitext-2.txt"], trainer=trainer)
+```
+
+Să aruncăm o privire la tokenizarea unui exemplu de text:
+
+```python
+encoding = tokenizer.encode("Let's test this tokenizer.")
+print(encoding.tokens)
+```
+
+```python out
+['L', 'et', "'", 's', 'Ġtest', 'Ġthis', 'Ġto', 'ken', 'izer', '.']
+```
+
+Aplicăm postprocesarea la nivel de bytes pentru tokenizerul GPT-2 după cum urmează:
+
+```python
+tokenizer.post_processor = processors.ByteLevel(trim_offsets=False)
+```
+
+Opțiunea `trim_offsets = False` indică post-procesorului că ar trebui să lăsăm offseturile tokenilor care încep cu "Ġ" așa cum sunt: în acest fel, începutul offseturilor va indica spațiul dinaintea cuvântului, nu primul caracter al cuvântului (deoarece spațiul face parte din punct de vedere tehnic din token). Să aruncăm o privire asupra rezultatului cu textul pe căruia tocmai i-am făcut encoding, unde `'Ġtest'` este tokenul de la indexul 4:
+
+```python
+sentence = "Let's test this tokenizer."
+encoding = tokenizer.encode(sentence)
+start, end = encoding.offsets[4]
+sentence[start:end]
+```
+
+```python out
+' test'
+```
+
+În cele din urmă, adăugăm un decoder la nivel de bytes:
+
+```python
+tokenizer.decoder = decoders.ByteLevel()
+```
+
+și putem verifica de două ori dacă funcționează corect:
+
+```python
+tokenizer.decode(encoding.ids)
+```
+
+```python out
+"Let's test this tokenizer."
+```
+
+Grozav! Acum că am terminat, putem salva tokenizatorul ca înainte și îl putem încorpora într-un `PreTrainedTokenizerFast` sau `GPT2TokenizerFast` dacă dorim să îl folosim în 🤗 Transformers:
+
+```python
+from transformers import PreTrainedTokenizerFast
+
+wrapped_tokenizer = PreTrainedTokenizerFast(
+    tokenizer_object=tokenizer,
+    bos_token="<|endoftext|>",
+    eos_token="<|endoftext|>",
+)
+```
+
+or:
+
+```python
+from transformers import GPT2TokenizerFast
+
+wrapped_tokenizer = GPT2TokenizerFast(tokenizer_object=tokenizer)
+```
+
+Ca un ultim exemplu, vă vom arăta cum să construiți un tokenizer Unigram de la zero.
+
+## Construirea unui tokenizer Unigram de la zero[[building-a-unigram-tokenizer-from-scratch]]
+
+Să construim acum un tokenizer XLNet. Ca și în cazul tokenizerelor anterioare, începem prin inițializarea unui `Tokenizer` cu un model Unigram:
+
+```python
+tokenizer = Tokenizer(models.Unigram())
+```
+
+Din nou, am putea inițializa acest model cu un vocabular, dacă am avea unul.
+
+Pentru normalizare, XLNet utilizează câteva înlocuiri (care provin din SentencePiece):
+
+```python
+from tokenizers import Regex
+
+tokenizer.normalizer = normalizers.Sequence(
+    [
+        normalizers.Replace("``", '"'),
+        normalizers.Replace("''", '"'),
+        normalizers.NFKD(),
+        normalizers.StripAccents(),
+        normalizers.Replace(Regex(" {2,}"), " "),
+    ]
+)
+```
+
+Acest lucru înlocuitește <code>``</code> și <code>''</code> cu <code>"</code> și orice secvență de două sau mai multe spații cu un singur spațiu, precum și ștergerea accentelor în textele ce trebuie tokenizate.
+
+Pre-tokenizerul care trebuie utilizat pentru orice tokenizer SentencePiece este `Metaspace`:
+
+```python
+tokenizer.pre_tokenizer = pre_tokenizers.Metaspace()
+```
+
+Putem arunca o privire la pre-tokenizarea unui exemplu de text ca mai înainte:
+
+```python
+tokenizer.pre_tokenizer.pre_tokenize_str("Let's test the pre-tokenizer!")
+```
+
+```python out
+[("▁Let's", (0, 5)), ('▁test', (5, 10)), ('▁the', (10, 14)), ('▁pre-tokenizer!', (14, 29))]
+```
+
+Urmează modelul, care are nevoie de antrenare. XLNet are destul de mulți tokeni speciali:
+
+```python
+special_tokens = ["<cls>", "<sep>", "<unk>", "<pad>", "<mask>", "<s>", "</s>"]
+trainer = trainers.UnigramTrainer(
+    vocab_size=25000, special_tokens=special_tokens, unk_token="<unk>"
+)
+tokenizer.train_from_iterator(get_training_corpus(), trainer=trainer)
+```
+
+Un argument foarte important care nu trebuie uitat pentru `UnigramTrainer` este `unk_token`. Putem trece și alte argumente specifice algoritmului Unigram, cum ar fi `shrinking_factor` pentru fiecare pas în care eliminăm tokeni (valoarea implicită este 0,75) sau `max_piece_length` pentru a specifica lungimea maximă a unui token dat (valoarea implicită este 16).
+
+Acest tokenizer poate fi antrenat și pe fișiere text:
+
+```python
+tokenizer.model = models.Unigram()
+tokenizer.train(["wikitext-2.txt"], trainer=trainer)
+```
+
+Să aruncăm o privire la tokenizarea unui exemplu de text:
+
+```python
+encoding = tokenizer.encode("Let's test this tokenizer.")
+print(encoding.tokens)
+```
+
+```python out
+['▁Let', "'", 's', '▁test', '▁this', '▁to', 'ken', 'izer', '.']
+```
+
+O particularitate a XLNet este că pune tokenul `<cls>` la sfârșitul propoziției, cu un ID de tip 2 (pentru a-l distinge de ceilalți tokeni). Ca urmare, este făcut padding la stânga. Putem trata toți tokenii speciali și ID-urile de tip ale tokenilor cu un template, ca în cazul BERT, dar mai întâi trebuie să obținem ID-urile tokenilor `<cls>` și `<sep>`:
+
+```python
+cls_token_id = tokenizer.token_to_id("<cls>")
+sep_token_id = tokenizer.token_to_id("<sep>")
+print(cls_token_id, sep_token_id)
+```
+
+```python out
+0 1
+```
+
+Templateul arată astfel:
+
+```python
+tokenizer.post_processor = processors.TemplateProcessing(
+    single="$A:0 <sep>:0 <cls>:2",
+    pair="$A:0 <sep>:0 $B:1 <sep>:1 <cls>:2",
+    special_tokens=[("<sep>", sep_token_id), ("<cls>", cls_token_id)],
+)
+```
+
+Și putem testa că funcționează prin codificarea unei perechi de propoziții:
+
+```python
+encoding = tokenizer.encode("Let's test this tokenizer...", "on a pair of sentences!")
+print(encoding.tokens)
+print(encoding.type_ids)
+```
+
+```python out
+['▁Let', "'", 's', '▁test', '▁this', '▁to', 'ken', 'izer', '.', '.', '.', '<sep>', '▁', 'on', '▁', 'a', '▁pair', 
+  '▁of', '▁sentence', 's', '!', '<sep>', '<cls>']
+[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2]
+```
+
+În cele din urmă, adăugăm un decoder `Metaspace`:
+
+```python
+tokenizer.decoder = decoders.Metaspace()
+```
+
+și am terminat cu acest tokenizer! Putem salva tokenizerul ca înainte și îl putem încorpora într-un `PreTrainedTokenizerFast` sau `XLNetTokenizerFast` dacă dorim să îl folosim în 🤗 Transformers. Un lucru de reținut atunci când se utilizează `PreTrainedTokenizerFast` este că, pe lângă tokenii speciali, trebuie să spunem bibliotecii 🤗 Transformers să facă padding la stânga:
+
+```python
+from transformers import PreTrainedTokenizerFast
+
+wrapped_tokenizer = PreTrainedTokenizerFast(
+    tokenizer_object=tokenizer,
+    bos_token="<s>",
+    eos_token="</s>",
+    unk_token="<unk>",
+    pad_token="<pad>",
+    cls_token="<cls>",
+    sep_token="<sep>",
+    mask_token="<mask>",
+    padding_side="left",
+)
+```
+
+Sau alternativ:
+
+```python
+from transformers import XLNetTokenizerFast
+
+wrapped_tokenizer = XLNetTokenizerFast(tokenizer_object=tokenizer)
+```
+
+Acum că ați văzut cum sunt utilizate diferitele blocuri de construcție pentru a construi tokenizeri existenți, ar trebui să puteți scrie orice tokenizer doriți cu biblioteca 🤗 Tokenizers și să îl puteți utiliza în 🤗 Transformers.
diff --git a/chapters/ro/chapter 6/9.mdx b/chapters/ro/chapter 6/9.mdx
new file mode 100644
index 000000000..8fc71f8ea
--- /dev/null
+++ b/chapters/ro/chapter 6/9.mdx	
@@ -0,0 +1,16 @@
+# Tokenizers, verificați![[tokenizers-check]]
+
+<CourseFloatingBanner
+    chapter={6}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+Bună treabă la finalizarea acestui capitol!
+
+După această scufundare adâncă în tokenizers, ar trebui să:
+
+- Să fii capabil să antrenezi un nou tokenizer folosind unul vechi ca model
+- Să înțelegi modului de utilizare a offseturilor pentru a face map tokenilor în intervalul lor original de text
+- Cunoști diferențele dintre BPE, WordPiece și Unigram
+- Fii capabil să combini blocurile furnizate de biblioteca 🤗 Tokenizers pentru a vă construi propriul tokenizer
+- Să poți folosi acest tokenizer în cadrul bibliotecii 🤗 Transformers

From bff73e0bf5a20d21f697667e63d5c153068cb4ea Mon Sep 17 00:00:00 2001
From: "ludmila.friptu" <ludmila.friptu@iucosoft.com>
Date: Wed, 8 Jan 2025 13:04:22 +0200
Subject: [PATCH 011/167] Add chapter 2 with required modifications

---
 chapters/rum/chapter2/1.mdx |   7 +-
 chapters/rum/chapter2/2.mdx |   2 +-
 chapters/rum/chapter2/6.mdx |   2 +-
 chapters/rum/chapter2/7.mdx |  15 ++-
 chapters/rum/chapter2/8.mdx | 176 ++++++++++++++++++------------------
 5 files changed, 100 insertions(+), 102 deletions(-)

diff --git a/chapters/rum/chapter2/1.mdx b/chapters/rum/chapter2/1.mdx
index 75093a9f9..86957e266 100644
--- a/chapters/rum/chapter2/1.mdx
+++ b/chapters/rum/chapter2/1.mdx
@@ -9,11 +9,11 @@ După cum ați văzut în [Capitolul 1](/course/chapter1), modelele Transformer
 
 Biblioteca 🤗 Transformers a fost creată pentru a rezolva această problemă. Scopul său este de a oferi un singur API prin care orice model Transformer poate fi încărcat, instruit și salvat. Principalele caracteristici ale bibliotecii sunt:
 
-- ** Simplitate în utilizare**: Descărcarea, încărcarea și utilizarea unui model NLP de ultimă generație pentru inferență pot fi realizate în doar două linii de cod.
+- **Simplitate în utilizare**: Descărcarea, încărcarea și utilizarea unui model NLP de ultimă generație pentru inferență pot fi realizate în doar două linii de cod.
 - **Flexibilitate**: În esența lor, toate modelele sunt simple clase PyTorch `nn.Module` sau TensorFlow `tf.keras.Model` și pot fi manipulate ca orice alte modele în framework-urile lor respective de învățare automată (ML).
-- **Simplitate**: Aproape că nu se fac abstractizări în întreaga bibliotecă. „All in one file” este un concept de bază: trecerea înainte a unui model este definită în întregime într-un singur fișier, astfel încât codul în sine să fie ușor de înțeles și hackable.
+- **Simplitate**: Aproape că nu se fac abstractizări în întreaga bibliotecă. „All in one file” este un concept de bază: trecerea înainte a unui model este definită în întregime într-un singur fișier, astfel încât codul în sine să fie ușor de înțeles și de modificat.
 
-Această ultimă caracteristică face 🤗 Transformers destul de diferit de alte biblioteci ML. Modelele nu sunt construite pe module 
+Această ultimă caracteristică face 🤗 Transformers destul de diferită de alte biblioteci ML. Modelele nu sunt construite pe module 
 care sunt partajate între fișiere; în schimb, fiecare model are propriile sale straturi. În plus, pe lângă faptul că modelele sunt mai ușor de abordat și de înțeles, acest lucru vă permite să experimentați cu ușurință pe un model fără a le afecta pe celelalte.
 
 Acest capitol va începe cu un exemplu end-to-end în care folosim împreună un model și un tokenizer pentru a replica funcția `pipeline()` introdusă în [Capitolul 1](/course/chapter1). În continuare, vom discuta despre API-ul modelului: vom analiza clasele de model și de configurare și vă vom arăta cum să încărcați un model și cum acesta procesează intrările numerice pentru a genera predicții. 
@@ -24,5 +24,4 @@ Apoi vom analiza API-ul tokenizer, care este cealaltă componentă principală a
 <Tip>
 ⚠️  
 Pentru a beneficia de toate funcțiile disponibile cu Model Hub și 🤗 Transformers, vă recomandăm <a href="https://huggingface.co/join">să vă creați un cont</a>.
-
 </Tip>
\ No newline at end of file
diff --git a/chapters/rum/chapter2/2.mdx b/chapters/rum/chapter2/2.mdx
index b0f1c4855..9dc0501bc 100644
--- a/chapters/rum/chapter2/2.mdx
+++ b/chapters/rum/chapter2/2.mdx
@@ -33,7 +33,7 @@ Aceasta este prima secțiune în care conținutul este ușor diferit în funcți
 <Youtube id="wVN12smEvqg"/>
 {/if}
 
-Să începem cu un exemplu complet, aruncând o privire la ceea ce s-a întâmplat în spate atunci când am executat următorul cod în [Capitolul 1](/curs/capitol1):
+Să începem cu un exemplu complet, aruncând o privire la ceea ce s-a întâmplat în spate atunci când am executat următorul cod în [Capitolul 1](/course/chapter1):
 
 
 ```python
diff --git a/chapters/rum/chapter2/6.mdx b/chapters/rum/chapter2/6.mdx
index a95a92d56..5cff921c5 100644
--- a/chapters/rum/chapter2/6.mdx
+++ b/chapters/rum/chapter2/6.mdx
@@ -131,7 +131,7 @@ print(tokenizer.decode(ids))
 
 Tokenizatorul a adăugat cuvântul special `[CLS]` la început și cuvântul special `[SEP]` la sfârșit. Acest lucru se datorează faptului că modelul a fost preinstruit cu aceste cuvinte, deci pentru a obține aceleași rezultate pentru inferență trebuie să le adăugăm și pe acestea. Rețineți că unele modele nu adaugă cuvinte speciale sau adaugă cuvinte diferite; de asemenea, modelele pot adăuga aceste cuvinte speciale doar la început sau doar la sfârșit. În orice caz, tokenizatorul știe care sunt cele așteptate și se va ocupa de acest lucru pentru dumneavoastră.
 
-## Încheiere: De la tokenizer la model[[încheiere-de-la-tokenizator--model]]
+## Încheiere: De la tokenizer la model[[încheiere-de-la-tokenizator-la-model]]
 
 Acum că am văzut toți pașii individuali pe care îi utilizează obiectul `tokenizer` atunci când este aplicat pe texte, să vedem o ultimă dată cum poate gestiona secvențe multiple (padding!), secvențe foarte lungi (trunchiere!) și mai multe tipuri de tensori cu API-ul său principal:
 
diff --git a/chapters/rum/chapter2/7.mdx b/chapters/rum/chapter2/7.mdx
index 2e6f1175c..a9f4de595 100644
--- a/chapters/rum/chapter2/7.mdx
+++ b/chapters/rum/chapter2/7.mdx
@@ -4,16 +4,15 @@
     chapter={2}
     classNames="absolute z-10 right-0 top-0"
 />
-
  
-Ați făcut o treabă excelentă dacă ați urmat cursul până aici! Pentru a sintetiza, în acest capitol ați:
+Ați făcut o treabă excelentă dacă ați urmat cursul până aici! Pentru a sintetiza, în acest capitol:
 
-- Ați învățat elementele de bază ale unui model Transformer.
-- Ați învățat ce formează un pipeline de tokenizare.
-- Ați văzut cum să utilizați un model Transformer în practică.
-- Ați învățat cum să folosiți un tokenizer pentru a converti textul în tensori care sunt inteligibili pentru model.
+- Am învățat elementele de bază ale unui model Transformer.
+- Am învățat ce formează un pipeline de tokenizare.
+- Am văzut cum să utilizați un model Transformer în practică.
+- Am învățat cum să folosiți un tokenizer pentru a converti textul în tensori care sunt inteligibili pentru model.
 - Am configurat împreună un tokenizer și un model pentru a ajunge de la text la predicții.
-- Am învățat limitările ID-urilor de intrare și am învățat despre attention masks(măști de atenție).
-- V-ați antrenat cu ajutorul metodelor versatile și configurabile ale tokenizatorului.
+- Am învățat limitările ID-urilor de intrare și am învățat despre attention masks.
+- Ne-am antrenat cu ajutorul metodelor versatile și configurabile ale tokenizatorului.
 
 De acum înainte, ar trebui să puteți naviga liber prin documentele 🤗 Transformers: vocabularul va suna familiar și ați văzut deja metodele pe care le veți utiliza în majoritatea timpului.
\ No newline at end of file
diff --git a/chapters/rum/chapter2/8.mdx b/chapters/rum/chapter2/8.mdx
index c41f27936..300078152 100644
--- a/chapters/rum/chapter2/8.mdx
+++ b/chapters/rum/chapter2/8.mdx
@@ -2,223 +2,223 @@
 
 <!-- DISABLE-FRONTMATTER-SECTIONS -->
 
-# End-of-chapter quiz[[end-of-chapter-quiz]]
+# Quiz la final de capitol [[quiz-la-final-de-capitol]]
 
 <CourseFloatingBanner
     chapter={2}
     classNames="absolute z-10 right-0 top-0"
 />
 
-### 1. What is the order of the language modeling pipeline?
+### 1. Care este ordinea pipeline-ului de modelare a limbajului?
 
 <Question
 	choices={[
 		{
-			text: "First, the model, which handles text and returns raw predictions. The tokenizer then makes sense of these predictions and converts them back to text when needed.",
-			explain: "The model cannot understand text! The tokenizer must first tokenize the text and convert it to IDs so that it is understandable by the model."
+			text: "Primul, modelul, care gestionează textul și returnează predicții brute. Apoi, tokenizatorul interpretează aceste predicții și le convertește înapoi în text atunci când este necesar.",
+			explain: "Modelul nu poate înțelege textul! Tokenizatorul trebuie mai întâi să tokenizeze textul și să îl convertească în ID-uri, astfel încât să poată fi înțeles de model."
 		},
 		{
-			text: "First, the tokenizer, which handles text and returns IDs. The model handles these IDs and outputs a prediction, which can be some text.",
-			explain: "The model's prediction cannot be text straight away. The tokenizer has to be used in order to convert the prediction back to text!"
+			text: "Primul este tokenizatorul, care gestionează textul și returnează ID-uri. Modelul gestionează aceste ID-uri și generează o predicție, care poate fi un text.",
+			explain: "Predicția modelului nu poate fi transformată imediat în text. Trebuie utilizat tokenizatorul pentru a converti predicția înapoi în text!"
 		},
 		{
-			text: "The tokenizer handles text and returns IDs. The model handles these IDs and outputs a prediction. The tokenizer can then be used once again to convert these predictions back to some text.",
-			explain: "Correct! The tokenizer can be used for both tokenizing and de-tokenizing.",
+			text: "Tokenizatorul gestionează textul și returnează ID-uri. Modelul gestionează aceste ID-uri și generează o predicție. Tokenizatorul poate fi apoi utilizat din nou pentru a converti aceste predicții înapoi în text.",
+			explain: "Corect! Tokenizatorul poate fi utilizat atât pentru tokenizare, cât și pentru de-tokenizare.",
             correct: true
 		}
 	]}
 />
 
-### 2. How many dimensions does the tensor output by the base Transformer model have, and what are they?
+### 2. Câte dimensiuni are tensorul generat de modelul Transformer și care sunt acestea?
 
 <Question
 	choices={[
 		{
-			text: "2: The sequence length and the batch size",
-			explain: "False! The tensor output by the model has a third dimension: hidden size."
+			text: "2: Lungimea secvenței și mărimea lotului",
+			explain: "Fals! Tensor-ul generat de model are a treia dimensiune: mărimea ascunsă."
 		},
 		{
-			text: "2: The sequence length and the hidden size",
-			explain: "False! All Transformer models handle batches, even with a single sequence; that would be a batch size of 1!"
+			text: "2: Lungimea secvenței și mărimea ascunsă",
+			explain: "Fals! Toate modelele Transformer gestionează loturi, chiar și cu o singură secvență; aceasta ar fi o dimensiune a lotului de 1!"
 		},
 		{
-			text: "3: The sequence length, the batch size, and the hidden size",
-			explain: "Correct!",
+			text: "3: Lungimea secvenței, dimensiunea lotului și dimensiunea ascunsă",
+			explain: "Corect!",
             correct: true
 		}
 	]}
 />
 
-### 3. Which of the following is an example of subword tokenization?
+### 3. Care dintre următoarele este un exemplu de tokenizare a cuvintelor secundare?
 
 <Question
 	choices={[
 		{
 			text: "WordPiece",
-			explain: "Yes, that's one example of subword tokenization!",
+			explain: "Da, acesta este un exemplu de tokenizare a cuvintelor secundare!",
             correct: true
 		},
 		{
-			text: "Character-based tokenization",
-			explain: "Character-based tokenization is not a type of subword tokenization."
+			text: "Tokenizare bazată pe caractere",
+			explain: "Tokenizarea bazată pe caractere nu este un tip de tokenizare a cuvintelor secundare."
 		},
 		{
-			text: "Splitting on whitespace and punctuation",
-			explain: "That's a word-based tokenization scheme!"
+			text: "Separarea pe baza spațiului și a punctuației",
+			explain: "Corect, aceasta este o schemă de tokenizare bazată pe cuvinte!"
 		},
 		{
 			text: "BPE",
-			explain: "Yes, that's one example of subword tokenization!",
+			explain: "Da, acesta este un exemplu de tokenizare a cuvintelor secundare!",
             correct: true
         },
 		{
 			text: "Unigram",
-			explain: "Yes, that's one example of subword tokenization!",
+			explain: "Da, acesta este un exemplu de tokenizare a cuvintelor secundare!",
             correct: true
         },
 		{
-			text: "None of the above",
-			explain: "Incorrect!"
+			text: "Nimic din cele de mai sus",
+			explain: "Incorect!"
         }
 	]}
 />
 
-### 4. What is a model head?
+### 4. Ce este un model head?
 
 <Question
 	choices={[
 		{
-			text: "A component of the base Transformer network that redirects tensors to their correct layers",
-			explain: "Incorrect! There's no such component."
+			text: "O componentă a rețelei Transformer de bază care redirecționează tensorii către straturile lor corecte",
+			explain: "Incorect! Nu există o astfel de componentă."
 		},
 		{
-			text: "Also known as the self-attention mechanism, it adapts the representation of a token according to the other tokens of the sequence",
-			explain: "Incorrect! The self-attention layer does contain attention \"heads,\" but these are not adaptation heads."
+			text: "Cunoscut și sub denumirea de mecanism de auto-atenție, acesta adaptează reprezentarea unui token în funcție de celelalte token-uri din secvență",
+			explain: "Incorect! Layerul de auto-atenție conține „heads” de atenție, dar nu acestea sunt adaptation heads."
 		},
 		{
-			text: "An additional component, usually made up of one or a few layers, to convert the transformer predictions to a task-specific output",
-			explain: "That's right. Adaptation heads, also known simply as heads, come up in different forms: language modeling heads, question answering heads, sequence classification heads... ",
+			text: "O componentă suplimentară, alcătuită de obicei din unul sau mai multe straturi, pentru a converti predicțiile transformatorului într-o sarcină specifică de ieșire",
+			explain: "Corect. Adaptation heads (sau simplu heads) apar în diverse forme: language modeling heads, question answering heads, sequence classification heads...",
 			correct: true
 		} 
 	]}
 />
 
 {#if fw === 'pt'}
-### 5. What is an AutoModel?
+### 5. Ce este un AutoModel?
 
 <Question
 	choices={[
 		{
-			text: "A model that automatically trains on your data",
-			explain: "Incorrect. Are you mistaking this with our <a href='https://huggingface.co/autotrain'>AutoTrain</a> product?"
+			text: "Un model care se antrenează automat pe baza datelor dumneavoastră",
+			explain: "Incorect. Poate îl confundați cu produsul nostru <a href='https://huggingface.co/autotrain'>AutoTrain</a>?"
 		},
 		{
-			text: "An object that returns the correct architecture based on the checkpoint",
-			explain: "Exactly: the <code>AutoModel</code> only needs to know the checkpoint from which to initialize to return the correct architecture.",
+			text: "Un obiect care returnează arhitectura corespunzătoare bazată pe checkpoint.",
+			explain: "Exact: <code>AutoModel</code> are nevoie doar să știe checkpoint-ul din care să se inițializeze pentru a returna arhitectura corectă.",
 			correct: true
 		},
 		{
-			text: "A model that automatically detects the language used for its inputs to load the correct weights",
-			explain: "Incorrect; while some checkpoints and models are capable of handling multiple languages, there are no built-in tools for automatic checkpoint selection according to language. You should head over to the <a href='https://huggingface.co/models'>Model Hub</a> to find the best checkpoint for your task!"
+			text: "Un model care detectează automat limba utilizată pentru intrările sale pentru a încărca ponderile corecte",
+			explain: "Incorect; deși unele checkpoint-uri și modele pot gestiona mai multe limbi, nu există instrumente integrate pentru selectarea automată a checkpoint-ului în funcție de limbă. Ar trebui să consultați <a href='https://huggingface.co/models'>Model Hub</a> pentru a găsi cel mai bun checkpoint pentru sarcina dumneavoastră!"
 		} 
 	]}
 />
 
 {:else}
-### 5. What is an TFAutoModel?
+### 5. Ce este un TFAutoModel?
 
 <Question
 	choices={[
 		{
-			text: "A model that automatically trains on your data",
-			explain: "Incorrect. Are you mistaking this with our <a href='https://huggingface.co/autotrain'>AutoTrain</a> product?"
+			text: "Un model care se antrenează automat pe baza datelor dumneavoastră",
+			explain: "Incorect. Poate îl confundați cu produsul nostru <a href='https://huggingface.co/autotrain'>AutoTrain</a>?"
 		},
 		{
-			text: "An object that returns the correct architecture based on the checkpoint",
-			explain: "Exactly: the <code>TFAutoModel</code> only needs to know the checkpoint from which to initialize to return the correct architecture.",
+			text: "Un obiect care returnează arhitectura corespunzătoare bazată pe checkpoint",
+			explain: "Exact: <code>TFAutoModel</code> are nevoie doar să știe checkpoint-ul din care să se inițializeze pentru a returna arhitectura corectă.",
 			correct: true
 		},
 		{
-			text: "A model that automatically detects the language used for its inputs to load the correct weights",
-			explain: "Incorrect; while some checkpoints and models are capable of handling multiple languages, there are no built-in tools for automatic checkpoint selection according to language. You should head over to the <a href='https://huggingface.co/models'>Model Hub</a> to find the best checkpoint for your task!"
+			text: "Un model care detectează automat limba utilizată pentru intrările sale pentru a încărca ponderile corecte",
+			explain: "Incorect; deși unele checkpoint-uri și modele pot gestiona mai multe limbi, nu există instrumente integrate pentru selectarea automată a checkpoint-ului în funcție de limbă. Ar trebui să consultați <a href='https://huggingface.co/models'>Model Hub</a> pentru a găsi cel mai bun checkpoint pentru sarcina dumneavoastră!"
 		} 
 	]}
 />
 
 {/if}
 
-### 6. What are the techniques to be aware of when batching sequences of different lengths together?
+### 6. Care sunt tehnicile de care trebuie să țineți cont atunci când grupați secvențe de diferite lungimi?
 
 <Question
 	choices={[
 		{
-			text: "Truncating",
-			explain: "Yes, truncation is a correct way of evening out sequences so that they fit in a rectangular shape. Is it the only one, though?",
+			text: "Trunchierea",
+			explain: "Da, trunchierea este o modalitate corectă de a uniformiza secvențele astfel încât acestea să se încadreze într-o formă dreptunghiulară. Este totuși singura modalitate?",
 			correct: true
 		},
 		{
 			text: "Returning tensors",
-			explain: "While the other techniques allow you to return rectangular tensors, returning tensors isn't helpful when batching sequences together."
+			explain: "Deși celelalte tehnici vă permit să returnați tensori dreptunghiulari, doar a returna tensori nu ajută când combinați secvențele într-un lot."
 		},
 		{
 			text: "Padding",
-			explain: "Yes, padding is a correct way of evening out sequences so that they fit in a rectangular shape. Is it the only one, though?",
+			explain: "Da, padding-ul este o modalitate corectă de a egaliza secvențele, astfel încât să se potrivească într-o formă dreptunghiulară. Este, însă, singura?",
 			correct: true
 		}, 
 		{
 			text: "Attention masking",
-			explain: "Absolutely! Attention masks are of prime importance when handling sequences of different lengths. That's not the only technique to be aware of, however.",
+			explain: "Absolut! Măștile de atenție sunt extrem de importante atunci când gestionați secvențe de lungimi diferite. Totuși, nu este singura tehnică de care trebuie să țineți cont.",
 			correct: true
 		} 
 	]}
 />
 
-### 7. What is the point of applying a SoftMax function to the logits output by a sequence classification model?
+### 7. Care este scopul aplicării unei funcții SoftMax asupra logit-urilor produse de un model de clasificare a secvențelor?
 
 <Question
 	choices={[
 		{
-			text: "It softens the logits so that they're more reliable.",
-			explain: "No, the SoftMax function does not affect the reliability of results."
+			text: "Le atenuează logiturile pentru a fi mai de încredere.",
+			explain: "Nu, funcția SoftMax nu afectează fiabilitatea rezultatelor."
 		},
 		{
-			text: "It applies a lower and upper bound so that they're understandable.",
-			explain: "Correct! The resulting values are bound between 0 and 1. That's not the only reason we use a SoftMax function, though.",
+			text: "Aplică o limită inferioară și superioară astfel încât valorile să fie inteligibile.",
+			explain: "Corect! Valorile rezultate sunt cuprinse între 0 și 1. Totuși, nu este singurul motiv pentru care folosim o funcție SoftMax.",
             correct: true
 		},
 		{
-			text: "The total sum of the output is then 1, resulting in a possible probabilistic interpretation.",
-			explain: "Correct! That's not the only reason we use a SoftMax function, though.",
+			text: "Suma totală a ieșirii devine 1, ducând la o interpretare probabilistică posibilă.",
+			explain: "Corect! Totuși, nu este singurul motiv pentru care folosim o funcție SoftMax.",
             correct: true
 		}
 	]}
 />
 
-### 8. What method is most of the tokenizer API centered around?
+### 8. În jurul cărei metode se concentrează cea mai mare parte a API-ului tokenizer?
 
 <Question
 	choices={[
 		{
-			text: "<code>encode</code>, as it can encode text into IDs and IDs into predictions",
-			explain: "Wrong! While the <code>encode</code> method does exist on tokenizers, it does not exist on models."
+			text: "<code>encode</code>, deoarece poate codifica textul în ID-uri și ID-urile în predicții",
+			explain: "Greșit! Deși metoda <code>encode</code> există pe tokenizers, ea nu există pe modele."
 		},
 		{
-			text: "Calling the tokenizer object directly.",
-			explain: "Exactly! The <code>__call__</code> method of the tokenizer is a very powerful method which can handle pretty much anything. It is also the method used to retrieve predictions from a model.",
+			text: "Apelarea directă a obiectului tokenizer.",
+			explain: "Exact! Metoda <code>__call__</code> a tokenizatorului este foarte puternică și poate gestiona aproape orice. Este și metoda folosită pentru a obține predicții de la un model.",
 			correct: true
 		},
 		{
 			text: "<code>pad</code>",
-			explain: "Wrong! Padding is very useful, but it's just one part of the tokenizer API."
+			explain: "Greșit! Padding-ul este foarte util, dar este doar o parte a API-ului tokenizer."
 		},
 		{
 			text: "<code>tokenize</code>",
-			explain: "The <code>tokenize</code> method is arguably one of the most useful methods, but it isn't the core of the tokenizer API."
+			explain: "Metoda <code>tokenize</code> este, fără îndoială, una dintre cele mai utile, dar nu reprezintă nucleul API-ului tokenizer."
 		}
 	]}
 />
 
-### 9. What does the `result` variable contain in this code sample?
+### 9. Ce conține variabila `result` în acest exemplu de cod?
 
 ```py
 from transformers import AutoTokenizer
@@ -230,23 +230,23 @@ result = tokenizer.tokenize("Hello!")
 <Question
 	choices={[
 		{
-			text: "A list of strings, each string being a token",
-			explain: "Absolutely! Convert this to IDs, and send them to a model!",
+			text: "O listă de șiruri de caractere, fiecare șir fiind un token",
+			explain: "Desigur! Convertiți aceste șiruri în ID-uri și transmiteți-le către un model!",
             correct: true
 		},
 		{
-			text: "A list of IDs",
-			explain: "Incorrect; that's what the <code>__call__</code> or <code>convert_tokens_to_ids</code> method is for!"
+			text: "O listă de ID-uri",
+			explain: "Incorect; pentru asta folosim metoda <code>__call__</code> sau <code>convert_tokens_to_ids</code>!"
 		},
 		{
-			text: "A string containing all of the tokens",
-			explain: "This would be suboptimal, as the goal is to split the string into multiple tokens."
+			text: "Un șir care conține toate token-urile",
+			explain: "Nu ar fi optim, deoarece scopul este de a separa șirul inițial în mai multe token-uri."
 		}
 	]}
 />
 
 {#if fw === 'pt'}
-### 10. Is there something wrong with the following code?
+### 10. Este ceva greșit în următorul cod?
 
 ```py
 from transformers import AutoTokenizer, AutoModel
@@ -261,23 +261,23 @@ result = model(**encoded)
 <Question
 	choices={[
 		{
-			text: "No, it seems correct.",
-			explain: "Unfortunately, coupling a model with a tokenizer that was trained with a different checkpoint is rarely a good idea. The model was not trained to make sense out of this tokenizer's output, so the model output (if it can even run!) will not make any sense."
+			text: "Nu, pare corect.",
+			explain: "Din păcate, asocierea unui model cu un tokenizator care a fost antrenat cu un alt checkpoint rareori este o idee bună. Modelul nu a fost antrenat să interpreteze ieșirea acestui tokenizator, așa că ieșirea modelului (dacă va rula chiar!) nu va avea sens."
 		},
 		{
-			text: "The tokenizer and model should always be from the same checkpoint.",
-			explain: "Right!",
+			text: "Tokenizerul și modelul trebuie să provină întotdeauna din același checkpoint.",
+			explain: "Corect!",
             correct: true
 		},
 		{
-			text: "It's good practice to pad and truncate with the tokenizer as every input is a batch.",
-			explain: "It's true that every model input needs to be a batch. However, truncating or padding this sequence wouldn't necessarily make sense as there is only one of it, and those are techniques to batch together a list of sentences."
+			text: "Este o bună practică să folosiți trunchierea și padding-ul cu tokenizatorul, întrucât fiecare intrare este un lot.",
+			explain: "Este adevărat că orice intrare de model are nevoie să fie sub formă de lot. Totuși, trunchierea sau padding-ul acestei secvențe nu ar avea neapărat sens deoarece este singura intrare, iar aceste tehnici se folosesc pentru a trata o listă de propoziții."
 		}
 	]}
 />
 
 {:else}
-### 10. Is there something wrong with the following code?
+### 10. Este ceva greșit în următorul cod?
 
 ```py
 from transformers import AutoTokenizer, TFAutoModel
@@ -292,19 +292,19 @@ result = model(**encoded)
 <Question
 	choices={[
 		{
-			text: "No, it seems correct.",
-			explain: "Unfortunately, coupling a model with a tokenizer that was trained with a different checkpoint is rarely a good idea. The model was not trained to make sense out of this tokenizer's output, so the model output (if it can even run!) will not make any sense."
+			text: "Nu, pare corect.",
+			explain: "Din păcate, asocierea unui model cu un tokenizator care a fost antrenat cu un alt checkpoint rareori este o idee bună. Modelul nu a fost antrenat să interpreteze ieșirea acestui tokenizator, așa că ieșirea modelului (dacă va rula chiar!) nu va avea sens."
 		},
 		{
-			text: "The tokenizer and model should always be from the same checkpoint.",
-			explain: "Right!",
+			text: "Tokenizerul și modelul trebuie să provină întotdeauna din același checkpoint.",
+			explain: "Corect!",
             correct: true
 		},
 		{
-			text: "It's good practice to pad and truncate with the tokenizer as every input is a batch.",
-			explain: "It's true that every model input needs to be a batch. However, truncating or padding this sequence wouldn't necessarily make sense as there is only one of it, and those are techniques to batch together a list of sentences."
+			text: "Este o bună practică să folosiți trunchierea și padding-ul cu tokenizatorul, întrucât fiecare intrare este un lot.",
+			explain: "Este adevărat că orice intrare de model are nevoie să fie sub formă de lot. Totuși, trunchierea sau padding-ul acestei secvențe nu ar avea neapărat sens deoarece este singura intrare, iar aceste tehnici se folosesc pentru a trata o listă de propoziții."
 		}
 	]}
 />
 
-{/if}
+{/if}
\ No newline at end of file

From abd846ce9a2facc1b409cdbd31b273a2957d11d4 Mon Sep 17 00:00:00 2001
From: "ludmila.friptu" <ludmila.friptu@iucosoft.com>
Date: Wed, 8 Jan 2025 13:10:14 +0200
Subject: [PATCH 012/167] Add chapter 3

---
 chapters/rum/chapter3/1.mdx    |  26 +++
 chapters/rum/chapter3/2.mdx    | 385 +++++++++++++++++++++++++++++++++
 chapters/rum/chapter3/3.mdx    | 171 +++++++++++++++
 chapters/rum/chapter3/3_tf.mdx | 198 +++++++++++++++++
 chapters/rum/chapter3/4.mdx    | 359 ++++++++++++++++++++++++++++++
 chapters/rum/chapter3/5.mdx    |  25 +++
 chapters/rum/chapter3/6.mdx    | 301 ++++++++++++++++++++++++++
 7 files changed, 1465 insertions(+)
 create mode 100644 chapters/rum/chapter3/1.mdx
 create mode 100644 chapters/rum/chapter3/2.mdx
 create mode 100644 chapters/rum/chapter3/3.mdx
 create mode 100644 chapters/rum/chapter3/3_tf.mdx
 create mode 100644 chapters/rum/chapter3/4.mdx
 create mode 100644 chapters/rum/chapter3/5.mdx
 create mode 100644 chapters/rum/chapter3/6.mdx

diff --git a/chapters/rum/chapter3/1.mdx b/chapters/rum/chapter3/1.mdx
new file mode 100644
index 000000000..564d72960
--- /dev/null
+++ b/chapters/rum/chapter3/1.mdx
@@ -0,0 +1,26 @@
+<FrameworkSwitchCourse {fw} />
+
+# Introducere[[introducere]]
+
+<CourseFloatingBanner
+    chapter={3}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+În [Capitolul 2](/course/chapter2) am explorat modul de utilizare a tokenizerelor și a modelelor preantrenate pentru a efectua predicții. Dar ce se întâmplă dacă doriți să ajustați un model preantrenat pentru propriul dvs. set de date? Iată subiectul acestui capitol! Veți învăța:
+
+{#if fw === 'pt'}
+* Cum să configurați un set mare de date din Hub
+* Cum să utilizați API-ul  `Trainer` pentru a ajusta un model
+* Cum să utilizați o buclă de instruire personalizată
+* Cum să profitați de biblioteca Accelerate 🤗 pentru a rula cu ușurință bucla de instruire personalizată pe orice configurație distribuită
+
+{:else}
+* Cum să configurați un set mare de date din Hub
+* Cum să utilizați Keras pentru a ajusta un model
+* Cum să utilizați Keras pentru a obține predicții
+* Cum să utilizați o măsură personalizată
+
+{/if}
+
+Pentru a încărca checkpoint-urile antrenate în Hugging Face Hub, veți avea nevoie de un cont huggingface.co: [creați un cont](https://huggingface.co/join)
diff --git a/chapters/rum/chapter3/2.mdx b/chapters/rum/chapter3/2.mdx
new file mode 100644
index 000000000..9292cd061
--- /dev/null
+++ b/chapters/rum/chapter3/2.mdx
@@ -0,0 +1,385 @@
+<FrameworkSwitchCourse {fw} />
+
+# Prelucrarea datelor[[prelucrarea-datelor]]
+
+{#if fw === 'pt'}
+
+<CourseFloatingBanner chapter={3}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter3/section2_pt.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter3/section2_pt.ipynb"},
+]} />
+
+{:else}
+
+<CourseFloatingBanner chapter={3}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter3/section2_tf.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter3/section2_tf.ipynb"},
+]} />
+
+{/if}
+
+{#if fw === 'pt'}
+Continuând cu exemplul din [capitolul anterior](/course/chapter2), iată cum am antrena un clasificator de secvențe pe un lot în PyTorch:
+
+```python
+import torch
+from transformers import AdamW, AutoTokenizer, AutoModelForSequenceClassification
+
+# La fel ca înainte
+checkpoint = "bert-base-uncased"
+tokenizer = AutoTokenizer.from_pretrained(checkpoint)
+model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
+sequences = [
+    "I've been waiting for a HuggingFace course my whole life.",
+    "This course is amazing!",
+]
+batch = tokenizer(sequences, padding=True, truncation=True, return_tensors="pt")
+
+# Ceva nou
+batch["labels"] = torch.tensor([1, 1])
+
+optimizer = AdamW(model.parameters())
+loss = model(**batch).loss
+loss.backward()
+optimizer.step()
+```
+{:else}
+Continuând cu exemplul din [capitolul anterior](/course/chapter2), iată cum am antrena un clasificator de secvențe pe un lot în TensorFlow:
+
+```python
+import tensorflow as tf
+import numpy as np
+from transformers import AutoTokenizer, TFAutoModelForSequenceClassification
+
+# La fel ca înainte
+checkpoint = "bert-base-uncased"
+tokenizer = AutoTokenizer.from_pretrained(checkpoint)
+model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint)
+sequences = [
+    "I've been waiting for a HuggingFace course my whole life.",
+    "This course is amazing!",
+]
+batch = dict(tokenizer(sequences, padding=True, truncation=True, return_tensors="tf"))
+
+# Ceva nou
+model.compile(optimizer="adam", loss="sparse_categorical_crossentropy")
+labels = tf.convert_to_tensor([1, 1])
+model.train_on_batch(batch, labels)
+```
+{/if}
+
+Desigur, doar antrenarea modelului pe două propoziții nu va da rezultate foarte bune. Pentru a obține rezultate mai bune, va trebui să pregătiți un set de date mai mare.
+
+În această secțiune vom folosi ca exemplu setul de date MRPC (Microsoft Research Paraphrase Corpus), introdus într-o [lucrare](https://www.aclweb.org/anthology/I05-5002.pdf) de William B. Dolan și Chris Brockett. Setul de date este format din 5 801 perechi de propoziții, cu o etichetă care indică dacă acestea sunt parafrazări sau nu (adică, dacă ambele propoziții înseamnă același lucru). L-am selectat pentru acest capitol deoarece este un set de date mic, astfel încât este ușor de experimentat cu formarea pe acesta.
+
+### Încărcarea unui set de date din Hub[[încărcarea-unui-set-de-date-din-Hub]]
+
+{#if fw === 'pt'}
+<Youtube id="_BZearw7f0w"/>
+{:else}
+<Youtube id="W_gMJF0xomE"/>
+{/if}
+
+Hub-ul nu conține doar modele, ci și multe seturi de date în limbi diferite. Puteți naviga printre seturile de date [aici](https://huggingface.co/datasets) și vă recomandăm să încercați să încărcați și să procesați un nou set de date după ce ați parcurs această secțiune (consultați documentația generală [aici](https://huggingface.co/docs/datasets/loading)). Dar, pentru moment, să ne concentrăm asupra setului de date MRPC! Acesta este unul dintre cele 10 seturi de date care compun [GLUE benchmark](https://gluebenchmark.com/), care este un benchmark academic utilizat pentru a măsura performanța modelelor ML în 10 sarcini diferite de clasificare a textului.
+
+Biblioteca 🤗 Datasets oferă o comandă foarte simplă pentru a descărca și stoca în cache un set de date pe Hub. Putem descărca setul de date MRPC astfel:
+
+<Tip>
+⚠️ **Atenție** Asigurați-vă că `datasets` este instalat prin rularea `pip install datasets`. Apoi, încărcați setul de date MRPC și tipăriți-l pentru a vedea ce conține.
+</Tip> 
+
+```py
+from datasets import load_dataset
+
+raw_datasets = load_dataset("glue", "mrpc")
+raw_datasets
+```
+
+```python out
+DatasetDict({
+    train: Dataset({
+        features: ['sentence1', 'sentence2', 'label', 'idx'],
+        num_rows: 3668
+    })
+    validation: Dataset({
+        features: ['sentence1', 'sentence2', 'label', 'idx'],
+        num_rows: 408
+    })
+    test: Dataset({
+        features: ['sentence1', 'sentence2', 'label', 'idx'],
+        num_rows: 1725
+    })
+})
+```
+
+După cum puteți vedea, obținem un obiect `DatasetDict` care conține setul de instruire, setul de validare și setul de testare. Fiecare dintre acestea conține mai multe coloane (`sentence1`, `sentence2`, `label` și `idx`) și un număr de rânduri variabil, care reprezintă numărul de elemente din fiecare set (astfel, există 3.668 de perechi de propoziții în setul de instruire, 408 în setul de validare și 1.725 în setul de testare).
+
+Această comandă descarcă și pune în cache setul de date, implicit în *~/.cache/huggingface/datasets*. Reamintim din capitolul 2 că puteți personaliza folderul cache prin setarea variabilei de mediu `HF_HOME`.
+
+Putem accesa fiecare pereche de propoziții din obiectul nostru `raw_datasets` prin indexare, ca într-un dicționar:
+
+```py
+raw_train_dataset = raw_datasets["train"]
+raw_train_dataset[0]
+```
+
+```python out
+{'idx': 0,
+ 'label': 1,
+ 'sentence1': 'Amrozi accused his brother , whom he called " the witness " , of deliberately distorting his evidence .',
+ 'sentence2': 'Referring to him as only " the witness " , Amrozi accused his brother of deliberately distorting his evidence .'}
+```
+
+Putem vedea că etichetele sunt deja numere întregi, deci nu va trebui să efectuăm nicio prelucrare prealabilă. Pentru a ști ce număr întreg corespunde fiecărei etichete, putem inspecta `features` din `raw_train_dataset`. Acest lucru ne va indica tipul fiecărei coloane:
+
+```py
+raw_train_dataset.features
+```
+
+```python out
+{'sentence1': Value(dtype='string', id=None),
+ 'sentence2': Value(dtype='string', id=None),
+ 'label': ClassLabel(num_classes=2, names=['not_equivalent', 'equivalent'], names_file=None, id=None),
+ 'idx': Value(dtype='int32', id=None)}
+```
+
+În culise, `label` este de tipul `ClassLabel`, iar maparea numerelor întregi și numele etichetei este stocată în folderul *names*. `0` corespunde la `not_equivalent`, iar `1` corespunde la `equivalent`.
+
+<Tip>
+
+✏️ **Încercați!** Uitați-vă la elementul 15 din setul de antrenament și la elementul 87 din setul de validare. Care sunt etichetele lor?
+
+</Tip>
+
+### Preprocesarea unui set de date[[preprocesarea-unui-set-de-date]]
+
+{#if fw === 'pt'}
+<Youtube id="0u3ioSwev3s"/>
+{:else}
+<Youtube id="P-rZWqcB6CE"/>
+{/if}
+
+Pentru a preprocesa setul de date, trebuie să convertim textul în numere pe care modelul le înțelege. După cum ați văzut în [capitolul anterior](/course/chapter2), acest lucru se face cu ajutorul unui tokenizer. Putem furniza tokenizatorului o propoziție sau o listă de propoziții, astfel încât putem tokeniza direct primele propoziții și toate propozițiile secundare din fiecare pereche, astfel:
+
+```py
+from transformers import AutoTokenizer
+
+checkpoint = "bert-base-uncased"
+tokenizer = AutoTokenizer.from_pretrained(checkpoint)
+tokenized_sentences_1 = tokenizer(raw_datasets["train"]["sentence1"])
+tokenized_sentences_2 = tokenizer(raw_datasets["train"]["sentence2"])
+```
+
+Cu toate acestea, nu putem pur și simplu să transmitem două secvențe modelului și să obținem o predicție care să indice dacă cele două propoziții sunt parafraze sau nu. Trebuie să tratăm cele două secvențe ca pe o pereche și să aplicăm preprocesarea corespunzătoare. Din fericire, tokenizatorul poate, de asemenea, să ia o pereche de secvențe și să le pregătească în modul în care se așteaptă modelul nostru BERT: 
+
+```py
+inputs = tokenizer("This is the first sentence.", "This is the second one.")
+inputs
+```
+
+```python out
+{ 
+  'input_ids': [101, 2023, 2003, 1996, 2034, 6251, 1012, 102, 2023, 2003, 1996, 2117, 2028, 1012, 102],
+  'token_type_ids': [0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1],
+  'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]
+}
+```
+
+Am discutat despre cheile `input_ids` și `attention_mask` în [Capitolul 2](/course/chapter2), dar am amânat discuția despre `token_type_ids`. În acest exemplu, aceasta este ceea ce îi spune modelului care parte a intrării este prima propoziție și care este a doua propoziție.
+
+<Tip>
+
+✏️ **Încercați!** Luați elementul 15 din setul de antrenament și tokenizați cele două propoziții separat apoi ca pe o pereche. Care este diferența dintre cele două rezultate?
+
+</Tip>
+
+Dacă decodificăm ID-urile din `input_ids` înapoi în cuvinte:
+
+```py
+tokenizer.convert_ids_to_tokens(inputs["input_ids"])
+```
+
+Vom obține:
+
+```python out
+['[CLS]', 'this', 'is', 'the', 'first', 'sentence', '.', '[SEP]', 'this', 'is', 'the', 'second', 'one', '.', '[SEP]']
+```
+
+Astfel, modelul se așteaptă ca intrările să fie de forma `[CLS] sentence1 [SEP] sentence2 [SEP]` atunci când există două propoziții. Alinierea acestui lucru cu `token_type_ids` ne dă:
+
+```python out
+['[CLS]', 'this', 'is', 'the', 'first', 'sentence', '.', '[SEP]', 'this', 'is', 'the', 'second', 'one', '.', '[SEP]']
+[      0,      0,    0,     0,       0,          0,   0,       0,      1,    1,     1,        1,     1,   1,       1]
+```
+
+După cum puteți vedea, părțile de intrare corespunzătoare `[CLS] sentence1 [SEP]` au toate un ID de tip token de `0`, în timp ce celelalte părți, corespunzătoare `sentence2 [SEP]`, au toate un ID de tip token de `1`.
+
+Rețineți că, dacă selectați un checkpoint diferit, nu veți avea neapărat `token_type_ids` în intrările dvs. tokenizate (de exemplu, acestea nu sunt returnate dacă utilizați un model DistilBERT). Acestea sunt returnate numai atunci când modelul va ști ce să facă cu ele, deoarece le-a văzut în timpul preinstruirii sale. 
+
+Aici, BERT este preinstruit cu ID-uri de tip token și, pe lângă obiectivul de modelare a limbajului mascat despre care am vorbit în [[Chapter 1]](/course/chapter1), are un obiectiv suplimentar numit _next sentence prediction_. Obiectivul acestei sarcini este de a modela relația dintre perechile de propoziții.
+
+În cazul predicției propoziției următoare, modelul primește perechi de propoziții (cu token-uri mascate aleatoriu) și i se cere să prezică dacă a doua propoziție o urmează pe prima. Pentru ca sarcina să nu fie complicată, jumătate din timp propozițiile se succed reciproc în documentul original din care au fost extrase, iar cealaltă jumătate din timp cele două propoziții provin din două documente diferite. 
+
+În general, nu trebuie să vă faceți griji dacă există sau nu `token_type_ids` în intrările dvs. tokenizate: atâta timp cât utilizați același checkpoint pentru tokenizator și model, totul va fi bine, deoarece tokenizatorul știe ce să furnizeze modelului său.
+
+Acum că am văzut cum tokenizatorul nostru poate trata o pereche de propoziții, îl putem folosi pentru a tokeniza întregul nostru set de date: la fel ca în [previous chapter](/course/chapter2), putem furniza tokenizatorului o listă de perechi de propoziții oferindu-i lista primelor propoziții, apoi lista celor de-a doua propoziții. Acest lucru este, de asemenea, compatibil cu opțiunile de padding și trunchiere pe care le-am văzut în [Chapter 2](/course/chapter2). Așadar, o modalitate de preprocesare a setului de date de instruire este:
+
+```py
+tokenized_dataset = tokenizer(
+    raw_datasets["train"]["sentence1"],
+    raw_datasets["train"]["sentence2"],
+    padding=True,
+    truncation=True,
+)
+```
+
+Această metodă funcționează corespunzător, dar are dezavantajul de a returna un dicționar (cu cheile noastre, `input_ids`, `attention_mask` și `token_type_ids`, și valori care sunt liste ale listelor). De asemenea, va funcționa numai dacă aveți suficientă memorie RAM pentru a stoca întregul set de date în timpul tokenizării (în timp ce seturile de date din biblioteca 🤗 Datasets sunt fișiere [Apache Arrow](https://arrow.apache.org/) stocate pe disc, deci păstrați încărcate în memorie numai eșantioanele pe care le solicitați).
+
+Pentru a păstra informațiile sub forma unui set de date, vom utiliza metoda [`Dataset.map()`](https://huggingface.co/docs/datasets/package_reference/main_classes#datasets.Dataset.map). Acest lucru ne permite, de asemenea, o flexibilitate sporită, în cazul în care avem nevoie de mai multe preprocesări decât simpla tokenizare. Metoda `map()` funcționează prin aplicarea unei funcții pe fiecare element al setului de date, deci să definim o funcție care să tokenizeze intrările noastre:
+
+```py
+def tokenize_function(example):
+    return tokenizer(example["sentence1"], example["sentence2"], truncation=True)
+```
+
+Această funcție acceptă un dicționar (precum elementele din setul nostru de date) și returnează un nou dicționar cu cheile `input_ids`, `attention_mask` și `token_type_ids`. Rețineți că funcționează și în cazul în care dicționarul `example` conține mai multe eșantioane (fiecare cheie fiind o listă de propoziții), deoarece `tokenizer` funcționează pe liste de perechi de propoziții, așa cum am văzut anterior. Acest lucru ne va permite să folosim opțiunea `batched=True` în apelul nostru la `map()`, ceea ce va accelera foarte mult tokenizarea. `tokenizer` este susținut de un tokenizer scris în Rust din biblioteca [🤗 Tokenizers](https://github.com/huggingface/tokenizers). Acest tokenizator poate fi foarte rapid, dar numai dacă îi oferim o mulțime de intrări deodată.
+
+Rețineți că am omis deocamdată argumentul `padding` în funcția noastră de tokenizare. Acest lucru se datorează faptului că umplerea tuturor eșantioanelor la lungimea maximă nu este eficientă: este mai bine să umplem eșantioanele atunci când construim un lot, deoarece atunci trebuie să umplem doar la lungimea maximă din acel lot, și nu la lungimea maximă din întregul set de date. Acest lucru poate economisi mult timp și putere de procesare atunci când intrările au lungimi variate! 
+
+Iată cum aplicăm funcția de tokenizare la toate seturile noastre de date simultan. Utilizăm `batched=True` în apelul către `map`, astfel încât funcția să fie aplicată la mai multe elemente ale setului nostru de date simultan, și nu la fiecare element în parte. Acest lucru permite o preprocesare mai rapidă.
+
+```py
+tokenized_datasets = raw_datasets.map(tokenize_function, batched=True)
+tokenized_datasets
+```
+
+Modul în care biblioteca 🤗 Datasets aplică această procesare este prin adăugarea de noi câmpuri la seturile de date, câte unul pentru fiecare cheie din dicționarul returnat de funcția de preprocesare:
+
+```python out
+DatasetDict({
+    train: Dataset({
+        features: ['attention_mask', 'idx', 'input_ids', 'label', 'sentence1', 'sentence2', 'token_type_ids'],
+        num_rows: 3668
+    })
+    validation: Dataset({
+        features: ['attention_mask', 'idx', 'input_ids', 'label', 'sentence1', 'sentence2', 'token_type_ids'],
+        num_rows: 408
+    })
+    test: Dataset({
+        features: ['attention_mask', 'idx', 'input_ids', 'label', 'sentence1', 'sentence2', 'token_type_ids'],
+        num_rows: 1725
+    })
+})
+```
+
+Puteți utiliza chiar și multiprocesarea atunci când aplicați funcția de preprocesare cu `map()` prin transmiterea unui argument `num_proc`. Nu am făcut acest lucru aici deoarece biblioteca 🤗 Tokenizers utilizează deja mai multe fire pentru a tokeniza mai rapid eșantioanele noastre, dar dacă nu utilizați un tokenizator rapid susținut de această bibliotecă, acest lucru v-ar putea accelera preprocesarea.
+
+Funcția noastră `tokenize_function` returnează un dicționar cu cheile `input_ids`, `attention_mask` și `token_type_ids`, astfel încât aceste trei câmpuri sunt adăugate la toate diviziunile setului nostru de date. Rețineți că am fi putut, de asemenea, să modificăm câmpurile existente dacă funcția noastră de preprocesare a returnat o nouă valoare pentru o cheie existentă în setul de date căruia i-am aplicat funcția `map()`.
+
+Ultimul lucru pe care va trebui să îl facem este să umplem toate exemplele la lungimea celui mai lung element atunci când grupăm elementele împreună - o tehnică la care ne referim ca *umplere dinamică*.
+
+### Umplere dinamică[[umplere-dinamică]]
+
+<Youtube id="7q5NyFT8REg"/>
+
+{#if fw === 'pt'}
+Funcția care este responsabilă de combinarea eșantioanelor în cadrul unui lot se numește *funcție de concatenare*. Este un argument pe care îl puteți trece atunci când construiți un `DataLoader`, implicit fiind o funcție care va converti eșantioanele în tensori PyTorch și le va concatena (recursiv dacă elementele sunt liste, tupluri sau dicționare). Acest lucru nu va fi posibil în cazul nostru, deoarece intrările pe care le avem nu vor fi toate de aceeași dimensiune. Am amânat în mod deliberat umplerea, pentru a o aplica doar în funcție de necesități la fiecare lot și pentru a evita să avem intrări prea lungi cu o mulțime de umpluturi. Acest lucru va accelera antrenamentul destul de mult, dar rețineți că, dacă vă antrenați pe o TPU, acest lucru poate cauza probleme - TPU preferă formele fixe, chiar și atunci când acest lucru necesită o umplutură suplimentară.
+
+{:else}
+
+Funcția care este responsabilă de reunirea eșantioanelor în cadrul unui lot se numește *funcție de colaționare*. Funcția de colaționare implicită este o funcție care va converti eșantioanele în tf.Tensor și le va concatena (recursiv dacă elementele dvs. sunt liste, tuples sau dicționare). Acest lucru nu va fi posibil în cazul nostru, deoarece intrările pe care le avem nu vor fi toate de aceeași dimensiune. Am amânat în mod deliberat umplerea, pentru a o aplica doar în funcție de necesități la fiecare lot și pentru a evita să avem intrări prea lungi cu o mulțime de umpluturi. Acest lucru va accelera antrenamentul destul de mult, dar rețineți că, dacă vă antrenați pe o TPU, acest lucru poate cauza probleme - TPU preferă formele fixe, chiar și atunci când acest lucru necesită o umplutură suplimentară.
+
+{/if}
+
+Pentru a face acest lucru în practică, trebuie să definim o funcție de colaționare care va aplica cantitatea corectă de umplutură elementelor din setul de date pe care dorim să le grupăm. Din fericire, biblioteca 🤗 Transformers ne oferă o astfel de funcție prin `DataCollatorWithPadding`. Aceasta preia un tokenizer atunci când o instanțiați (pentru a ști ce token de umplutură să utilizați și dacă modelul se așteaptă ca umplutura să fie la stânga sau la dreapta intrărilor) și va face tot ceea ce aveți nevoie:
+
+{#if fw === 'pt'}
+```py
+from transformers import DataCollatorWithPadding
+
+data_collator = DataCollatorWithPadding(tokenizer=tokenizer)
+```
+{:else}
+```py
+from transformers import DataCollatorWithPadding
+
+data_collator = DataCollatorWithPadding(tokenizer=tokenizer, return_tensors="tf")
+```
+{/if}
+
+Pentru a testa această nouă opțiune, să luăm câteva eșantioane din setul nostru de formare pe care dorim să le grupăm. Aici, eliminăm coloanele `idx`, `sentence1` și `sentence2` deoarece nu vor fi necesare și conțin șiruri de caractere (și nu putem crea tensori cu șiruri de caractere) și aruncăm o privire la lungimile fiecărei intrări din lot:
+
+```py
+samples = tokenized_datasets["train"][:8]
+samples = {k: v for k, v in samples.items() if k not in ["idx", "sentence1", "sentence2"]}
+[len(x) for x in samples["input_ids"]]
+```
+
+```python out
+[50, 59, 47, 67, 59, 50, 62, 32]
+```
+
+Nici o surpriză, obținem eșantioane de diferite lungimi, de la 32 la 67. Umplerea dinamică înseamnă că toate eșantioanele din acest lot ar trebui să fie umplute la o lungime de 67, lungimea maximă din cadrul lotului. Fără umplutură dinamică, toate eșantioanele ar trebui să fie umplute la lungimea maximă din întregul set de date sau la lungimea maximă pe care modelul o poate accepta. Să verificăm de două ori dacă `data_collator` completează dinamic lotul în mod corespunzător:
+
+```py
+batch = data_collator(samples)
+{k: v.shape for k, v in batch.items()}
+```
+
+{#if fw === 'tf'}
+
+```python out
+{'attention_mask': TensorShape([8, 67]),
+ 'input_ids': TensorShape([8, 67]),
+ 'token_type_ids': TensorShape([8, 67]),
+ 'labels': TensorShape([8])}
+```
+
+{:else}
+
+```python out
+{'attention_mask': torch.Size([8, 67]),
+ 'input_ids': torch.Size([8, 67]),
+ 'token_type_ids': torch.Size([8, 67]),
+ 'labels': torch.Size([8])}
+```
+
+Perfect! Acum că am trecut de la text brut la loturi cu care modelul nostru se poate descurca, suntem gata să îl ajustăm!
+
+{/if}
+
+<Tip>
+
+✏️ **Încearcați!** Replicați preprocesarea pe setul de date GLUE SST-2. Acesta este puțin diferit, deoarece este compus din propoziții simple în loc de perechi, dar restul lucrurilor pe care le-am făcut ar trebui să fie la fel. Pentru o provocare mai dificilă, încercați să scrieți o funcție de preprocesare care să funcționeze pe oricare dintre sarcinile GLUE.
+
+</Tip>
+
+{#if fw === 'tf'}
+
+Acum că avem setul nostru de date și un compilator de date, trebuie să le punem împreună. Am putea încărca manual loturi și să le asamblăm, dar este mult de lucru și probabil nici nu este foarte eficient. În schimb, există o metodă simplă care oferă o soluție performantă la această problemă: `to_tf_dataset()`. Aceasta va înfășura un `tf.data.Dataset` în jurul setului dvs. de date, cu o funcție de colaționare opțională. `tf.data.Dataset` este un format TensorFlow nativ pe care Keras îl poate utiliza pentru `model.fit()`, astfel încât această metodă convertește imediat un set de date 🤗 într-un format care este pregătit pentru antrenament. Să o vedem în acțiune cu setul nostru de date!
+
+```py
+tf_train_dataset = tokenized_datasets["train"].to_tf_dataset(
+    columns=["attention_mask", "input_ids", "token_type_ids"],
+    label_cols=["labels"],
+    shuffle=True,
+    collate_fn=data_collator,
+    batch_size=8,
+)
+
+tf_validation_dataset = tokenized_datasets["validation"].to_tf_dataset(
+    columns=["attention_mask", "input_ids", "token_type_ids"],
+    label_cols=["labels"],
+    shuffle=False,
+    collate_fn=data_collator,
+    batch_size=8,
+)
+```
+
+Și asta este tot! Putem folosi aceste seturi de date în cursul următor, unde instruirea va fi extrem de simplă după toată munca grea de preprocesare a datelor.
+
+{/if}
diff --git a/chapters/rum/chapter3/3.mdx b/chapters/rum/chapter3/3.mdx
new file mode 100644
index 000000000..eb50bf596
--- /dev/null
+++ b/chapters/rum/chapter3/3.mdx
@@ -0,0 +1,171 @@
+<FrameworkSwitchCourse {fw} />
+
+# Ajustarea unui model folosind Trainer API[[ajustarea-unui-model-folosind-trainer-api]]
+
+<CourseFloatingBanner chapter={3}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter3/section3.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter3/section3.ipynb"},
+]} />
+
+<Youtube id="nvBXf7s7vTI"/>
+
+🤗 Transformers oferă o clasă `Trainer` pentru a vă ajuta să reglați mai bine oricare dintre modelele preinstruite pe care le oferă pe setul dvs. de date. După ce ați făcut toată munca de preprocesare a datelor din ultima secțiune, vă mai rămân doar câțiva pași pentru a defini clasa `Trainer`. Cea mai dificilă parte va fi probabil pregătirea mediului pentru a rula `Trainer.train()`, deoarece acesta va rula foarte lent pe un CPU. Dacă nu aveți un GPU configurat, puteți obține acces gratuit la GPU-uri sau TPU-uri pe [Google Colab] (https://colab.research.google.com/).
+
+Exemplele de cod de mai jos presupun că ați executat deja exemplele din secțiunea anterioară. Iată un scurt rezumat care recapitulează ceea ce aveți nevoie:
+
+```py
+from datasets import load_dataset
+from transformers import AutoTokenizer, DataCollatorWithPadding
+
+raw_datasets = load_dataset("glue", "mrpc")
+checkpoint = "bert-base-uncased"
+tokenizer = AutoTokenizer.from_pretrained(checkpoint)
+
+
+def tokenize_function(example):
+    return tokenizer(example["sentence1"], example["sentence2"], truncation=True)
+
+
+tokenized_datasets = raw_datasets.map(tokenize_function, batched=True)
+data_collator = DataCollatorWithPadding(tokenizer=tokenizer)
+```
+
+### Antrenarea[[antrenarea]]
+
+Primul pas înainte de a ne defini modelul `Trainer` este să definim o clasă `TrainingArguments` care va conține toți hiperparametrii pe care `Trainer` îi va utiliza pentru formare și evaluare. Singurul argument pe care trebuie să îl furnizați este un folder în care va fi salvat modelul antrenat, precum și punctele de control de pe parcurs. Pentru tot restul, puteți lăsa valorile implicite, care ar trebui să funcționeze destul de bine pentru o ajustare de bază.
+ 
+```py
+from transformers import TrainingArguments
+
+training_args = TrainingArguments("test-trainer")
+```
+
+<Tip>
+
+💡 Dacă doriți să încărcați automat modelul în Hub în timpul instruirii, treceți `push_to_hub=True` în `TrainingArguments`. Vom afla mai multe despre acest lucru în [Capitolul 4](/course/chapter4/3)
+
+</Tip>
+
+Al doilea pas este să ne definim modelul. Ca și în [capitolul anterior](/course/chapter2), vom folosi clasa `AutoModelForSequenceClassification`, cu două etichete:
+
+```py
+from transformers import AutoModelForSequenceClassification
+
+model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
+```
+
+Veți observa că, spre deosebire de [Capitolul 2](/course/chapter2), veți primi un avertisment după instanțierea acestui model preinstruit. Acest lucru se datorează faptului că BERT nu a fost instruit în prealabil cu privire la clasificarea perechilor de propoziții, astfel încât head-ul modelului instruit în prealabil a fost eliminat și a fost adăugat în schimb un nou head adecvat pentru clasificarea secvențelor. Avertizările indică faptul că unele ponderi nu au fost utilizate (cele corespunzătoare head-ului de preformare eliminat) și că altele au fost inițializate aleatoriu (cele pentru noul head). În încheiere, vă încurajează să antrenați modelul, ceea ce vom face acum.
+
+Odată ce avem modelul nostru, putem defini un `Trainer` transmițându-i toate obiectele construite până acum - `modelul`, `training_args`, seturile de date de formare și validare, `data_collator` și `tokenizer`:
+
+```py
+from transformers import Trainer
+
+trainer = Trainer(
+    model,
+    training_args,
+    train_dataset=tokenized_datasets["train"],
+    eval_dataset=tokenized_datasets["validation"],
+    data_collator=data_collator,
+    tokenizer=tokenizer,
+)
+```
+
+Rețineți că atunci când treceți `tokenizer` așa cum am făcut aici, `data_collator` implicit folosit de `Trainer` va fi un `DataCollatorWithPadding` așa cum a fost definit anterior, deci puteți sări peste linia `data_collator=data_collator` în acest apel. Era totuși important să vă arăt această parte a procesării în secțiunea 2!
+
+Pentru a regla cu precizie modelul pe setul nostru de date, trebuie doar să apelăm metoda `train()` a `Trainer`:
+
+```py
+trainer.train()
+```
+
+Acest lucru va începe reglarea fină (care ar trebui să dureze câteva minute pe un GPU) și va raporta valoarea pierderii de formare la fiecare 500 de pași. Cu toate acestea, nu vă va spune cât de bine (sau rău) funcționează modelul dumneavoastră. Acest lucru se datorează faptului că:
+
+1. Nu am precizat că `Trainer` trebuie să evalueze în timpul antrenamentului prin setarea `evaluation_strategy` la `„steps”` (evaluare la fiecare `eval_steps`) sau `„epoch”` (evaluare la sfârșitul fiecărei epoch).
+2. Nu am furnizat pentru `Trainer` o funcție `compute_metrics()` pentru a calcula o valoare metrică în timpul evaluării (altfel evaluarea ar fi afișat doar pierderea, care nu este un număr foarte intuitiv).
+
+### Evaluarea[[evaluarea]]
+
+Să vedem cum putem construi o funcție utilă `compute_metrics()` și să o folosim data viitoare când ne antrenăm. Funcția trebuie să preia un obiect `EvalPrediction` (care este un tuple numit cu un câmp `predictions` și un câmp `label_ids`) și va returna un dicționar care mapează șiruri de caractere în valori float. Pentru a obține unele predicții de la modelul nostru, putem utiliza comanda `Trainer.predict()`:
+
+```py
+predictions = trainer.predict(tokenized_datasets["validation"])
+print(predictions.predictions.shape, predictions.label_ids.shape)
+```
+
+```python out
+(408, 2) (408,)
+```
+
+Rezultatul metodei `predict()` este un alt tuple numit cu trei câmpuri: `predictions`, `label_ids` și `metrics`. Câmpul `metrics` va conține doar pierderea pe setul de date transmis, precum și unele valori metrice de timp (cât timp a durat predicția, în total și în medie). După ce vom finaliza funcția `compute_metrics()` și o vom transmite către `Trainer`, acest câmp va conține și metrica returnată de `compute_metrics()`.
+
+După cum puteți vedea, `predictions` este un array bidimensional cu forma 408 x 2 (408 fiind numărul de elemente din setul de date pe care l-am folosit). Acestea sunt logits pentru fiecare element al setului de date pe care l-am transmis la `predict()` (după cum ați văzut în [capitolul anterior](/course/chapter2), toate modelele Transformer returnează logits). Pentru a le transforma în predicții pe care le putem compara cu etichetele noastre, trebuie să luăm indicele cu valoarea maximă pe a doua axă:
+
+```py
+import numpy as np
+
+preds = np.argmax(predictions.predictions, axis=-1)
+```
+
+Acum putem compara `preds` cu etichetele. Pentru a construi funcția noastră `compute_metric()`, ne vom baza pe  valorile metrice din biblioteca 🤗 [Evaluate](https://github.com/huggingface/evaluate/). Putem încărca  valorile metrice asociate cu setul de date MRPC la fel de ușor cum am încărcat setul de date, de data aceasta cu funcția `evaluate.load()`. Obiectul returnat are o metodă `compute()` pe care o putem utiliza pentru a efectua calculul metric:
+
+```py
+import evaluate
+
+metric = evaluate.load("glue", "mrpc")
+metric.compute(predictions=preds, references=predictions.label_ids)
+```
+
+```python out
+{'accuracy': 0.8578431372549019, 'f1': 0.8996539792387542}
+```
+
+Rezultatele exacte pe care le obțineți pot varia, deoarece inițializarea aleatorie a head-ului modelului poate schimba parametrii obținuți. Aici, putem vedea că modelul nostru are o precizie de 85,78% pe setul de validare și un scor F1 de 89,97. Acestea sunt cele două valori metrice utilizate pentru a evalua rezultatele pe setul de date MRPC pentru criteriul de referință GLUE. Tabelul din [lucrarea BERT] (https://arxiv.org/pdf/1810.04805.pdf) a raportat un scor F1 de 88,9 pentru modelul de bază. Acesta a fost modelul „fără casare”, în timp ce noi folosim în prezent modelul „cu casare”, ceea ce explică rezultatul mai bun.
+
+Adunând totul, obținem funcția noastră `compute_metrics()`:
+
+```py
+def compute_metrics(eval_preds):
+    metric = evaluate.load("glue", "mrpc")
+    logits, labels = eval_preds
+    predictions = np.argmax(logits, axis=-1)
+    return metric.compute(predictions=predictions, references=labels)
+```
+
+Și pentru a vedea cum se utilizează în practică pentru a raporta datele metrice la sfârșitul fiecărei perioade, iată cum definim un nou `Trainer` cu această funcție `compute_metrics()`:
+
+```py
+training_args = TrainingArguments("test-trainer", evaluation_strategy="epoch")
+model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
+
+trainer = Trainer(
+    model,
+    training_args,
+    train_dataset=tokenized_datasets["train"],
+    eval_dataset=tokenized_datasets["validation"],
+    data_collator=data_collator,
+    tokenizer=tokenizer,
+    compute_metrics=compute_metrics,
+)
+```
+
+Rețineți că creăm un nou `TrainingArguments` cu `evaluation_strategy` setat la `„epoch”` și un nou model - în caz contrar, am continua doar instruirea modelului pe care l-am instruit deja. Pentru a lansa o nouă rulare de formare, executăm:
+
+```py
+trainer.train()
+```
+
+De data aceasta, acesta va raporta pierderea de validare și metrica la sfârșitul fiecărei perioade, pe lângă valoarea pierderii de formare. Din nou, scorul exact de acuratețe/F1 pe care îl veți obține ar putea fi puțin diferit de ceea ce am găsit noi, din cauza inițializării aleatorii a modelului, dar ar trebui să fie în aceeași zonă.
+
+Modelul `Trainer` va funcționa din start pe mai multe GPU sau TPU și oferă o mulțime de opțiuni, cum ar fi formarea cu precizie mixtă (utilizați `fp16 = True` în argumentele de formare). Vom trece în revistă toate funcțiile pe care le suportă în capitolul 10.
+
+Aceasta încheie introducerea la reglarea fină cu ajutorul API-ului `Trainer`. În [Capitolul 7](/course/chapter7) va fi prezentat un exemplu de efectuare a acestei operații pentru cele mai comune sarcini NLP, dar pentru moment să analizăm cum se poate face același lucru în PyTorch pur.
+
+<Tip>
+
+✏️ **Încercați!** Ajustați un model pe setul de date GLUE SST-2, folosind procesarea datelor efectuată în secțiunea 2.
+
+</Tip>
+
diff --git a/chapters/rum/chapter3/3_tf.mdx b/chapters/rum/chapter3/3_tf.mdx
new file mode 100644
index 000000000..ede281693
--- /dev/null
+++ b/chapters/rum/chapter3/3_tf.mdx
@@ -0,0 +1,198 @@
+<FrameworkSwitchCourse {fw} />
+
+# Ajustarea unui model cu Keras[[ajustarea-unui-model-cu-keras]]
+
+<CourseFloatingBanner chapter={3}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter3/section3_tf.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter3/section3_tf.ipynb"},
+]} />
+
+După ce ați efectuat toate lucrările de preprocesare a datelor din ultima secțiune, mai aveți doar câțiva pași de făcut pentru a antrena modelul. Rețineți, totuși, că comanda `model.fit()` va rula foarte lent pe un CPU. Dacă nu aveți un GPU configurat, puteți obține acces gratuit la GPU sau TPU pe [Google Colab] (https://colab.research.google.com/).
+
+Exemplele de cod de mai jos presupun că ați executat deja exemplele din secțiunea anterioară. Iată un scurt rezumat care recapitulează ceea ce aveți nevoie:
+
+```py
+from datasets import load_dataset
+from transformers import AutoTokenizer, DataCollatorWithPadding
+import numpy as np
+
+raw_datasets = load_dataset("glue", "mrpc")
+checkpoint = "bert-base-uncased"
+tokenizer = AutoTokenizer.from_pretrained(checkpoint)
+
+
+def tokenize_function(example):
+    return tokenizer(example["sentence1"], example["sentence2"], truncation=True)
+
+
+tokenized_datasets = raw_datasets.map(tokenize_function, batched=True)
+
+data_collator = DataCollatorWithPadding(tokenizer=tokenizer, return_tensors="tf")
+
+tf_train_dataset = tokenized_datasets["train"].to_tf_dataset(
+    columns=["attention_mask", "input_ids", "token_type_ids"],
+    label_cols=["labels"],
+    shuffle=True,
+    collate_fn=data_collator,
+    batch_size=8,
+)
+
+tf_validation_dataset = tokenized_datasets["validation"].to_tf_dataset(
+    columns=["attention_mask", "input_ids", "token_type_ids"],
+    label_cols=["labels"],
+    shuffle=False,
+    collate_fn=data_collator,
+    batch_size=8,
+)
+```
+
+### Antrenarea[[antrenarea]]
+
+Modelele TensorFlow importate din 🤗 Transformers sunt deja modele Keras. În cele ce urmează găsiți o scurtă introducere în Keras.
+
+<Youtube id="rnTGBy2ax1c"/>
+
+Aceasta înseamnă că, odată ce avem datele noastre, este nevoie de foarte puțină muncă pentru a începe antrenarea pe baza acestora.
+
+<Youtube id="AUozVp78dhk"/>
+
+Ca și în [capitolul anterior](/course/chapter2), vom folosi clasa `TFAutoModelForSequenceClassification`, cu două etichete: 
+
+```py
+from transformers import TFAutoModelForSequenceClassification
+
+model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
+```
+
+Veți observa că, spre deosebire de [Capitolul 2](/course/chapter2), veți primi un avertisment după instanțierea acestui model preinstruit. Acest lucru se datorează faptului că BERT nu a fost preinstruit pentru clasificarea perechilor de propoziții, astfel încât head-ul modelului preinstruit a fost eliminat și a fost introdus în schimb un nou head adecvat pentru clasificarea secvențelor. Avertizările indică faptul că unele ponderi nu au fost utilizate (cele corespunzătoare head-ului de preformare eliminat) și că altele au fost inițializate aleatoriu (cele pentru noul head). În încheiere, vă încurajează să antrenați modelul, ceea ce vom face acum.
+
+Pentru reglarea fină a modelului pe setul nostru de date, trebuie doar să `compilăm()` modelul nostru și apoi să transmitem datele noastre metodei `fit()`. Aceasta va începe procesul de reglare fină (care ar trebui să dureze câteva minute pe un GPU) și va raporta pierderea de formare pe parcurs, plus pierderea de validare la sfârșitul fiecărei epoci.
+
+<Tip>
+
+Rețineți că modelele 🤗 Transformers au o abilitate specială pe care majoritatea modelelor Keras nu o au - ele pot utiliza automat o valoare adecvată a pierderii pe care o calculează intern. Ele vor utiliza această valoare în mod implicit dacă nu setați un argument de pierdere în `compile()`. Rețineți că pentru a utiliza  valoarea internă a pierderii va trebui să transmiteți etichetele ca parte a datelor de intrare, nu ca etichetă separată, care este modul normal de utilizare a etichetelor cu modelele Keras. Veți vedea exemple în acest sens în partea 2 a cursului, unde definirea funcției de pierdere corecte poate fi complicată. Cu toate acestea, pentru clasificarea secvențelor, o funcție de pierdere Keras standard funcționează bine, așa că aceasta este cea pe care o vom utiliza aici.
+
+</Tip>
+
+```py
+from tensorflow.keras.losses import SparseCategoricalCrossentropy
+
+model.compile(
+    optimizer="adam",
+    loss=SparseCategoricalCrossentropy(from_logits=True),
+    metrics=["accuracy"],
+)
+model.fit(
+    tf_train_dataset,
+    validation_data=tf_validation_dataset,
+)
+```
+
+<Tip warning={true}>
+
+Remarcați o problemă foarte des întâlnită aici - *puteți* doar să transmiteți numele pierderii ca șir de caractere către Keras, dar în mod implicit Keras va presupune că ați aplicat deja un softmax rezultatelor dvs. Cu toate acestea, multe modele produc valorile chiar înainte de aplicarea softmax, care sunt cunoscute și sub numele de *logits*. Trebuie să spunem funcției de pierdere că asta face modelul nostru, iar singura modalitate de a face acest lucru este să o apelăm direct, mai degrabă decât prin nume cu un șir.
+
+</Tip>
+
+
+### Îmbunătățirea performanțelor de instruire[[Îmbunătățirea-performanțelor-de-instruire]]
+
+<Youtube id="cpzq6ESSM5c"/>
+
+Dacă încercați codul de mai sus, acesta rulează cu siguranță, dar veți constata că valoarea pierderii scade doar lent sau sporadic. Cauza principală
+este *rata de învățare*. Ca și în cazul pierderii, atunci când îi transmitem lui Keras numele unui optimizator ca șir de caractere, Keras inițializează
+optimizatorul respectiv cu valori implicite pentru toți parametrii, inclusiv rata de învățare. Totuși, din experiența îndelungată, știm
+că modelele transformatoare beneficiază de o rată de învățare mult mai mică decât cea implicită pentru Adam, care este 1e-3, scrisă și
+ca 10 la puterea -3, sau 0,001. 5e-5 (0,00005), care este de aproximativ douăzeci de ori mai mică, este un punct de plecare mult mai bun.
+
+În plus față de scăderea ratei de învățare, avem un al doilea as în mânecă: putem reduce încet rata de învățare
+pe parcursul instruirii. În literatura de specialitate, veți vedea uneori că acest lucru este denumit *decădere* sau *analizare*
+a ratei de învățare. În Keras, cel mai bun mod de a face acest lucru este de a utiliza un *programator al ratei de învățare*. Un program bun de utilizat este
+`PolynomialDecay` - în ciuda numelui, cu setările implicite, acesta pur și simplu scade liniar rata de învățare de la valoarea inițială
+până la valoarea finală pe parcursul instruirii, ceea ce este exact ceea ce ne dorim. Pentru a utiliza corect un programator,
+totuși, trebuie să îi spunem cât va dura antrenamentul. Calculăm acest lucru ca `num_train_steps` mai jos.
+
+```py
+from tensorflow.keras.optimizers.schedules import PolynomialDecay
+
+batch_size = 8
+num_epochs = 3
+# Numărul etapelor de formare este numărul de eșantioane din setul de date, împărțit la dimensiunea lotului, apoi înmulțit
+# cu numărul total de epoci. Rețineți că setul de date tf_train_dataset de aici este un set de date tf.data.Dataset în loturi,
+# nu setul de date original Hugging Face, deci len() este deja num_samples // batch_size.
+num_train_steps = len(tf_train_dataset) * num_epochs
+lr_scheduler = PolynomialDecay(
+    initial_learning_rate=5e-5, end_learning_rate=0.0, decay_steps=num_train_steps
+)
+from tensorflow.keras.optimizers import Adam
+
+opt = Adam(learning_rate=lr_scheduler)
+```
+
+<Tip>
+
+Biblioteca Transformers 🤗 are, de asemenea, o funcție `create_optimizer()` care va crea un optimizator `AdamW` cu rata de învățare în scădere. Aceasta este o scurtătură convenabilă pe care o veți vedea în detaliu în secțiunile viitoare ale cursului.
+
+</Tip>
+
+Acum avem optimizatorul nostru complet nou și putem încerca să ne antrenăm cu el. În primul rând, să reîncărcăm modelul, pentru a reseta modificările aduse ponderilor în urma instruirii pe care tocmai am efectuat-o, iar apoi îl putem compila cu noul optimizator:
+
+```py
+import tensorflow as tf
+
+model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
+loss = tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True)
+model.compile(optimizer=opt, loss=loss, metrics=["accuracy"])
+```
+
+Acum, ne potrivim din nou:
+
+```py
+model.fit(tf_train_dataset, validation_data=tf_validation_dataset, epochs=3)
+```
+
+<Tip>
+
+💡 Dacă doriți să încărcați automat modelul dvs. în Hub în timpul instruirii, puteți trece un `PushToHubCallback` în metoda `model.fit()`. Vom afla mai multe despre acest lucru în [Capitolul 4](/course/chapter4/3)
+
+</Tip>
+
+### Predicțiile modelului[[predicțiile-modelului]]
+
+<Youtube id="nx10eh4CoOs"/>
+
+
+Este foarte interesant să ne antrenăm și să vedem cum scade valoarea pierderii, dar ce se întâmplă dacă dorim să obținem rezultate de la modelul antrenat, fie pentru a calcula anumiți parametri, fie pentru a utiliza modelul în producție? Pentru a face acest lucru, putem folosi metoda `predict()`. Aceasta va returna *logit-urile* din rezultatele modelului, unul pentru fiecare clasă.
+
+```py
+preds = model.predict(tf_validation_dataset)["logits"]
+```
+
+Putem converti aceste logiți în predicții de clasă ale modelului folosind `argmax` pentru a găsi cel mai mare logit, care corespunde celei mai probabile clase:
+
+```py
+class_preds = np.argmax(preds, axis=1)
+print(preds.shape, class_preds.shape)
+```
+
+```python out
+(408, 2) (408,)
+```
+Acum, să folosim `preds` pentru a calcula niște indicatori! Putem încărca indicatorii de măsurare asociați cu setul de date MRPC la fel de ușor cum am încărcat setul de date, de data aceasta cu funcția `evaluate.load()`. Obiectul returnat are o metodă `compute()` pe care o putem folosi pentru a face calculul metric:
+
+```py
+import evaluate
+
+metric = evaluate.load("glue", "mrpc")
+metric.compute(predictions=class_preds, references=raw_datasets["validation"]["label"])
+```
+
+```python out
+{'accuracy': 0.8578431372549019, 'f1': 0.8996539792387542}
+```
+
+Rezultatele exacte pe care le obțineți pot varia, deoarece inițializarea aleatorie a head-ului modelului poate schimba parametrii obținuți. Aici, putem vedea că modelul nostru are o precizie de 85,78% pe setul de validare și un scor F1 de 89,97. Acestea sunt cele două metrici utilizate pentru a evalua rezultatele pe setul de date MRPC pentru criteriul de referință GLUE. Tabelul din [lucrarea BERT] (https://arxiv.org/pdf/1810.04805.pdf) a raportat un scor F1 de 88,9 pentru modelul de bază. Acesta a fost modelul `uncased`, în timp ce noi folosim în prezent modelul `cased`, ceea ce explică rezultatul mai bun.
+
+Aceasta încheie introducerea la ajustarea fină utilizând API-ul Keras. În [Capitolul 7](/course/chapter7) va fi prezentat un exemplu de efectuare a acestui lucru pentru cele mai comune sarcini NLP. Dacă doriți să vă perfecționați abilitățile cu API-ul Keras, încercați să reglați un model pe setul de date GLUE SST-2, utilizând prelucrarea datelor pe care ați făcut-o în secțiunea 2.
diff --git a/chapters/rum/chapter3/4.mdx b/chapters/rum/chapter3/4.mdx
new file mode 100644
index 000000000..9477601a0
--- /dev/null
+++ b/chapters/rum/chapter3/4.mdx
@@ -0,0 +1,359 @@
+# O instruire completă[[o-instruire-completă]]
+
+<CourseFloatingBanner chapter={3}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter3/section4.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter3/section4.ipynb"},
+]} />
+
+<Youtube id="Dh9CL8fyG80"/>
+
+Acum vom vedea cum să obținem aceleași rezultate ca în secțiunea anterioară, dar fără să folosim clasa `Trainer`. Din nou, presupunem că ați parcurs deja procesarea datelor din secțiunea 2. Iată un scurt rezumat al tot ceea ce veți avea nevoie:
+
+```py
+from datasets import load_dataset
+from transformers import AutoTokenizer, DataCollatorWithPadding
+
+raw_datasets = load_dataset("glue", "mrpc")
+checkpoint = "bert-base-uncased"
+tokenizer = AutoTokenizer.from_pretrained(checkpoint)
+
+
+def tokenize_function(example):
+    return tokenizer(example["sentence1"], example["sentence2"], truncation=True)
+
+
+tokenized_datasets = raw_datasets.map(tokenize_function, batched=True)
+data_collator = DataCollatorWithPadding(tokenizer=tokenizer)
+```
+
+### Pregătirea pentru antrenament[[pregătirea-pentru-antrenament]]
+
+Înainte de a scrie efectiv bucla de antrenament, va trebui să definim câteva obiecte. Primele sunt încărcătoarele de date (dataloaders) pe care le vom folosi pentru a itera pe loturi (batches). Dar, înainte de a putea defini acele încărcătoare de date, trebuie să aplicăm un pic de postprocesare dataset-urilor noastre `tokenized_datasets`, pentru a ne ocupa de câteva lucruri pe care `Trainer` le făcea automat pentru noi. Mai exact, trebuie să:
+
+- Eliminăm coloanele care corespund valorilor pe care modelul nu le așteaptă (cum ar fi coloanele `sentence1` și `sentence2`).
+- Redenumim coloana `label` în `labels` (pentru că modelul se așteaptă ca argumentul să se numească `labels`).
+- Setăm formatul dataset-urilor astfel încât să returneze tensori PyTorch în loc de liste.
+
+`tokenized_datasets` are câte o metodă pentru fiecare dintre acești pași:
+
+```py
+tokenized_datasets = tokenized_datasets.remove_columns(["sentence1", "sentence2", "idx"])
+tokenized_datasets = tokenized_datasets.rename_column("label", "labels")
+tokenized_datasets.set_format("torch")
+tokenized_datasets["train"].column_names
+```
+
+Putem apoi să verificăm că rezultatul are doar coloanele pe care modelul le va accepta:
+
+```python
+["attention_mask", "input_ids", "labels", "token_type_ids"]
+```
+
+Acum, după ce am terminat acest pas, putem defini foarte ușor încărcătoarele de date:
+
+```py
+from torch.utils.data import DataLoader
+
+train_dataloader = DataLoader(
+    tokenized_datasets["train"], shuffle=True, batch_size=8, collate_fn=data_collator
+)
+eval_dataloader = DataLoader(
+    tokenized_datasets["validation"], batch_size=8, collate_fn=data_collator
+)
+```
+
+Pentru a verifica rapid că nu există nicio eroare în procesarea datelor, putem inspecta un batch astfel:
+
+```py
+for batch in train_dataloader:
+    break
+{k: v.shape for k, v in batch.items()}
+```
+
+```python out
+{'attention_mask': torch.Size([8, 65]),
+ 'input_ids': torch.Size([8, 65]),
+ 'labels': torch.Size([8]),
+ 'token_type_ids': torch.Size([8, 65])}
+```
+
+Observați că formele reale ar putea fi ușor diferite pentru voi, pentru că am setat `shuffle=True` în încărcătorul de date de antrenament și pentru că împachetăm (padding) la lungimea maximă în interiorul lotului.
+
+Acum că am terminat complet procesarea datelor (un obiectiv satisfăcător, dar uneori greu de atins pentru orice practician ML), să trecem la model. Îl instanțiem exact ca în secțiunea anterioară:
+
+```py
+from transformers import AutoModelForSequenceClassification
+
+model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
+```
+
+Pentru a ne asigura că totul va decurge fără probleme în timpul antrenamentului, trecem lotul nostru prin model:
+
+```py
+outputs = model(**batch)
+print(outputs.loss, outputs.logits.shape)
+```
+
+```python out
+tensor(0.5441, grad_fn=<NllLossBackward>) torch.Size([8, 2])
+```
+
+Toate modelele 🤗 Transformers vor returna pierderea (loss) când `labels` sunt furnizate, și, de asemenea, obținem logits (două pentru fiecare intrare în lot, deci un tensor de mărimea 8 x 2).
+
+Suntem aproape gata să scriem bucla de antrenament! Ne mai lipsesc două lucruri: un optimizer și un scheduler pentru rata de învățare. Pentru că încercăm să reproducem ceea ce făcea `Trainer`, vom folosi aceleași valori implicite. Optimizer-ul folosit de `Trainer` este `AdamW`, care este același cu Adam, dar cu o abordare particulară pentru regularizarea weight decay (vedeți lucrarea ["Decoupled Weight Decay Regularization"](https://arxiv.org/abs/1711.05101) de Ilya Loshchilov și Frank Hutter):
+
+```py
+from transformers import AdamW
+
+optimizer = AdamW(model.parameters(), lr=5e-5)
+```
+
+În final, scheduler-ul pentru rata de învățare folosit implicit este doar o descreștere liniară de la valoarea maximă (5e-5) la 0. Pentru a-l defini corect, trebuie să știm numărul de pași de antrenament pe care îi vom face, care este numărul de epoci dorit înmulțit cu numărul de loturi de antrenament (care este lungimea dataloader-ului nostru de antrenament). `Trainer` folosește trei epoci implicit, așa că vom urma acest exemplu:
+
+```py
+from transformers import get_scheduler
+
+num_epochs = 3
+num_training_steps = num_epochs * len(train_dataloader)
+lr_scheduler = get_scheduler(
+    "linear",
+    optimizer=optimizer,
+    num_warmup_steps=0,
+    num_training_steps=num_training_steps,
+)
+print(num_training_steps)
+```
+
+```python out
+1377
+```
+
+### Bucla de antrenament[[bucla-de-antrenament]]
+
+Încă un lucru: vom dori să folosim GPU-ul dacă avem acces la unul (pe un CPU, antrenamentul poate dura câteva ore în loc de câteva minute). Pentru asta, definim un `device` pe care vom pune modelul și loturile noastre:
+
+```py
+import torch
+
+device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")
+model.to(device)
+device
+```
+
+```python out
+device(type='cuda')
+```
+
+Acum suntem gata de antrenament! Pentru a ne face o idee despre momentul în care se va termina antrenamentul, adăugăm o bară de progres peste numărul de pași de antrenament, folosind biblioteca `tqdm`:
+
+```py
+from tqdm.auto import tqdm
+
+progress_bar = tqdm(range(num_training_steps))
+
+model.train()
+for epoch in range(num_epochs):
+    for batch in train_dataloader:
+        batch = {k: v.to(device) for k, v in batch.items()}
+        outputs = model(**batch)
+        loss = outputs.loss
+        loss.backward()
+
+        optimizer.step()
+        lr_scheduler.step()
+        optimizer.zero_grad()
+        progress_bar.update(1)
+```
+
+Observați că partea principală a buclei de antrenament arată foarte asemănător cu cea din introducere. Nu am cerut niciun raport, așa că această buclă de antrenament nu ne va spune nimic despre performanța modelului. Pentru a avea feedback, trebuie să adăugăm o buclă de evaluare.
+
+
+### Bucla de evaluare[[ bucla-de-evaluare]]
+
+Ca și înainte, vom folosi o metrică oferită de biblioteca 🤗 Evaluate. Am văzut deja metoda `metric.compute()`, dar metricle pot de fapt să acumuleze loturi pentru noi în timp ce parcurgem bucla de predicție, cu metoda `add_batch()`. Odată ce am acumulat toate loturile, putem obține rezultatul final cu `metric.compute()`. Iată cum să implementăm toate acestea într-o buclă de evaluare:
+
+```py
+import evaluate
+
+metric = evaluate.load("glue", "mrpc")
+model.eval()
+for batch in eval_dataloader:
+    batch = {k: v.to(device) for k, v in batch.items()}
+    with torch.no_grad():
+        outputs = model(**batch)
+
+    logits = outputs.logits
+    predictions = torch.argmax(logits, dim=-1)
+    metric.add_batch(predictions=predictions, references=batch["labels"])
+
+metric.compute()
+```
+
+```python out
+{'accuracy': 0.8431372549019608, 'f1': 0.8907849829351535}
+```
+
+Din nou, rezultatele voastre vor fi ușor diferite din cauza aleatorietății în inițializarea layer-ului final (model head) și a amestecării datelor, dar ar trebui să fie în aceeași zonă valorică.
+
+<Tip>
+
+✏️ **Încercați!** Modificați bucla de antrenament anterioară pentru a vă rafina modelul pe dataset-ul SST-2.
+
+</Tip>
+
+### Îmbunătățiți circuitul de antrenament cu 🤗 Accelerate[[îmbunătățiți-circuitul-de-antrenament-cu-accelerate]]
+
+<Youtube id="s7dy8QRgjJ0" />
+
+Bucla de antrenament pe care am definit-o anterior funcționează bine pe un singur CPU sau GPU. Dar, folosind biblioteca [🤗 Accelerate](https://github.com/huggingface/accelerate), cu doar câteva ajustări putem activa antrenarea distribuită pe mai multe GPU-uri sau TPU-uri. Pornind de la crearea încărcătoarelor de date de antrenament și validare, iată cum arată bucla noastră manuală de antrenament:
+
+```py
+from transformers import AdamW, AutoModelForSequenceClassification, get_scheduler
+
+model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
+optimizer = AdamW(model.parameters(), lr=3e-5)
+
+device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")
+model.to(device)
+
+num_epochs = 3
+num_training_steps = num_epochs * len(train_dataloader)
+lr_scheduler = get_scheduler(
+    "linear",
+    optimizer=optimizer,
+    num_warmup_steps=0,
+    num_training_steps=num_training_steps,
+)
+
+progress_bar = tqdm(range(num_training_steps))
+
+model.train()
+for epoch in range(num_epochs):
+    for batch in train_dataloader:
+        batch = {k: v.to(device) for k, v in batch.items()}
+        outputs = model(**batch)
+        loss = outputs.loss
+        loss.backward()
+
+        optimizer.step()
+        lr_scheduler.step()
+        optimizer.zero_grad()
+        progress_bar.update(1)
+```
+
+Iar aici sunt modificările:
+
+```diff
++ from accelerate import Accelerator
+  from transformers import AdamW, AutoModelForSequenceClassification, get_scheduler
+
++ accelerator = Accelerator()
+
+  model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
+  optimizer = AdamW(model.parameters(), lr=3e-5)
+
+- device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")
+- model.to(device)
+
++ train_dataloader, eval_dataloader, model, optimizer = accelerator.prepare(
++     train_dataloader, eval_dataloader, model, optimizer
++ )
+
+  num_epochs = 3
+  num_training_steps = num_epochs * len(train_dataloader)
+  lr_scheduler = get_scheduler(
+      "linear",
+      optimizer=optimizer,
+      num_warmup_steps=0,
+      num_training_steps=num_training_steps
+  )
+
+  progress_bar = tqdm(range(num_training_steps))
+
+  model.train()
+  for epoch in range(num_epochs):
+      for batch in train_dataloader:
+-         batch = {k: v.to(device) for k, v in batch.items()}
+          outputs = model(**batch)
+          loss = outputs.loss
+-         loss.backward()
++         accelerator.backward(loss)
+
+          optimizer.step()
+          lr_scheduler.step()
+          optimizer.zero_grad()
+          progress_bar.update(1)
+```
+
+Prima linie de adăugat este linia de import. A doua linie instanțiază un obiect `Accelerator` care va examina mediul și va inițializa setarea distribuită corespunzătoare. 🤗 Accelerate se ocupă de plasarea pe device pentru voi, așa că puteți elimina liniile care pun modelul pe device (sau, dacă preferați, le puteți schimba să folosească `accelerator.device` în loc de `device`).
+
+Apoi, partea principală a muncii este făcută în linia care trimite dataloaders, modelul și optimizer-ul la `accelerator.prepare()`. Aceasta va împacheta acele obiecte în containerul potrivit pentru a vă asigura că antrenarea distribuită funcționează corespunzător. Restul modificărilor constau în eliminarea liniei care mută lotul pe `device` (din nou, dacă doriți să o păstrați puteți doar să o schimbați să folosească `accelerator.device`) și înlocuirea `loss.backward()` cu `accelerator.backward(loss)`.
+
+<Tip>
+⚠️ Pentru a beneficia de creșterea vitezei oferită de Cloud TPU-uri, vă recomandăm să împachetați mostrele la o lungime fixă folosind argumentele `padding="max_length"` și `max_length` ale tokenizer-ului.
+</Tip>
+
+Dacă vreți să copiați și să lipiți pentru a vă juca, iată cum arată bucla completă de antrenament cu 🤗 Accelerate:
+
+```py
+from accelerate import Accelerator
+from transformers import AdamW, AutoModelForSequenceClassification, get_scheduler
+
+accelerator = Accelerator()
+
+model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
+optimizer = AdamW(model.parameters(), lr=3e-5)
+
+train_dl, eval_dl, model, optimizer = accelerator.prepare(
+    train_dataloader, eval_dataloader, model, optimizer
+)
+
+num_epochs = 3
+num_training_steps = num_epochs * len(train_dl)
+lr_scheduler = get_scheduler(
+    "linear",
+    optimizer=optimizer,
+    num_warmup_steps=0,
+    num_training_steps=num_training_steps,
+)
+
+progress_bar = tqdm(range(num_training_steps))
+
+model.train()
+for epoch in range(num_epochs):
+    for batch in train_dl:
+        outputs = model(**batch)
+        loss = outputs.loss
+        accelerator.backward(loss)
+
+        optimizer.step()
+        lr_scheduler.step()
+        optimizer.zero_grad()
+        progress_bar.update(1)
+```
+
+Plasând acest cod într-un fișier `train.py` îl face rulabil pe orice tip de configurare distribuită. Pentru a-l încerca în configurarea voastră distribuită, rulați comanda:
+
+```bash
+accelerate config
+```
+
+care vă va cere să răspundeți la câteva întrebări și vă va crea un fișier de configurare folosit de comanda:
+
+```
+accelerate launch train.py
+```
+
+care va porni antrenarea distribuită.
+
+Dacă vreți să încercați asta într-un Notebook (de exemplu, pentru a-l testa cu TPU-uri pe Colab), doar lipiți codul într-o funcție `training_function()` și rulați într-o celulă finală:
+
+```python
+from accelerate import notebook_launcher
+
+notebook_launcher(training_function)
+```
+
+Puteți găsi mai multe exemple în [repo-ul 🤗 Accelerate](https://github.com/huggingface/accelerate/tree/main/examples).
\ No newline at end of file
diff --git a/chapters/rum/chapter3/5.mdx b/chapters/rum/chapter3/5.mdx
new file mode 100644
index 000000000..acd5cfe51
--- /dev/null
+++ b/chapters/rum/chapter3/5.mdx
@@ -0,0 +1,25 @@
+<FrameworkSwitchCourse {fw} />
+
+# Fine-tuning, Check![[fine-tuning-check]]
+
+<CourseFloatingBanner
+    chapter={3}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+A fost distractiv! În primele două capitole ați învățat despre modele și tokenizere, iar acum știți cum să le ajustați fin (fine-tune) pentru propriile date. Pentru a recapitula, în acest capitol ați:
+
+{#if fw === 'pt'}
+* Ați învățat despre dataset-urile din [Hub](https://huggingface.co/datasets)
+* Ați învățat cum să încărcați și să preprocessați dataset-uri, inclusiv folosind împachetare dinamică (dynamic padding) și colatori
+* Ați implementat propria ajustare fină (fine-tuning) și evaluare a unui model
+* Ați implementat o buclă de antrenament la un nivel mai scăzut (lower-level)
+* Ați folosit 🤗 Accelerate pentru a adapta cu ușurință bucla voastră de antrenament, astfel încât să funcționeze pentru mai multe GPU-uri sau TPU-uri
+
+{:else}
+* Ați învățat despre dataset-urile din [Hub](https://huggingface.co/datasets)
+* Ați învățat cum să încărcați și să preprocessați dataset-uri
+* Ați învățat cum să ajustați fin și să evaluați un model cu Keras
+* Ați implementat o metrică personalizată
+
+{/if}
diff --git a/chapters/rum/chapter3/6.mdx b/chapters/rum/chapter3/6.mdx
new file mode 100644
index 000000000..225615087
--- /dev/null
+++ b/chapters/rum/chapter3/6.mdx
@@ -0,0 +1,301 @@
+<FrameworkSwitchCourse {fw} />
+
+<!-- DISABLE-FRONTMATTER-SECTIONS -->
+
+# End-of-chapter quiz[[end-of-chapter-quiz]]
+
+<CourseFloatingBanner
+    chapter={3}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+Testați-vă cunoștințele din acest capitol!
+
+### 1. Dataset-ul `emotion` conține mesaje de pe Twitter etichetate cu emoții. Căutați-l în [Hub](https://huggingface.co/datasets) și citiți descrierea dataset-ului. Care dintre acestea nu este una dintre emoțiile sale de bază?
+
+<Question
+	choices={[
+		{
+			text: "Bucurie",
+			explain: "Încercați din nou - această emoție este prezentă în acel set de date!"
+		},
+		{
+			text: "Iubire",
+			explain: "Încercați din nou - această emoție este prezentă în acel set de date!"
+		},
+		{
+			text: "Confuzie",
+			explain: "Corect! Confuzia nu este una dintre cele șase emoții de bază.",
+            correct: true
+		},
+        {
+			text: "Surpriză",
+			explain: "Surpriză! Încercați din nou!"
+		}
+	]}
+/>
+
+### 2. Căutați dataset-ul `ar_sarcasm` în [Hub](https://huggingface.co/datasets). Ce tip de sarcină suportă?
+
+<Question
+	choices={[
+		{
+			text: "Clasificarea sentimentelor",
+			explain: "Corect! Puteți verifica etichetele (tags) din descrierea dataset-ului.",
+            correct: true
+		},
+		{
+			text: "Traducere automată (Machine translation)",
+			explain: "Nu este corect — aruncați din nou o privire la <a href='https://huggingface.co/datasets/ar_sarcasm'>descrierea dataset-ului</a>!"
+		},
+		{
+			text: "Named entity recognition",
+			explain: "Nu este corect — aruncați din nou o privire la <a href='https://huggingface.co/datasets/ar_sarcasm'>descrierea dataset-ului</a>!"
+		},
+        {
+			text: "Răspuns la întrebări (Question answering)",
+			explain: "Din păcate, nu ați răspuns corect. Încercați din nou!"
+		}
+	]}
+/>
+
+### 3. Cum se așteaptă modelul BERT ca o pereche de propoziții să fie procesată?
+
+<Question
+	choices={[
+		{
+			text: "Tokens_of_sentence_1 [SEP] Tokens_of_sentence_2",
+			explain: "Este nevoie de un token special <code>[SEP]</code> pentru a separa cele două propoziții, dar nu este singurul lucru necesar!"
+		},
+		{
+			text: "[CLS] Tokens_of_sentence_1 Tokens_of_sentence_2",
+			explain: "Este nevoie de un token special <code>[CLS]</code> la început, dar nu este singurul lucru necesar!"
+		},
+		{
+			text: "[CLS] Tokens_of_sentence_1 [SEP] Tokens_of_sentence_2 [SEP]",
+			explain: "Corect!",
+            correct: true
+		},
+        {
+			text: "[CLS] Tokens_of_sentence_1 [SEP] Tokens_of_sentence_2",
+			explain: "Este nevoie atât de un token special <code>[CLS]</code> la început, cât și de un token special <code>[SEP]</code> pentru a separa cele două propoziții, dar mai lipsește ceva!"
+		}
+	]}
+/>
+
+{#if fw === 'pt'}
+### 4. Care sunt avantajele metodei `Dataset.map()`?
+
+<Question
+	choices={[
+		{
+			text: "Rezultatele funcției sunt memorate în cache, astfel încât nu va dura nimic dacă reexecutăm codul.",
+			explain: "Acesta este într-adevăr unul dintre avantajele acestei metode! Totuși, nu este singurul...",
+            correct: true
+		},
+		{
+			text: "Poate aplica multiprocessing pentru a rula mai rapid decât aplicând funcția pe fiecare element din dataset.",
+			explain: "Aceasta este o caracteristică interesantă, dar nu este unica!",
+            correct: true
+		},
+		{
+			text: "Nu încarcă întregul set de date în memorie, salvând rezultatele de îndată ce este procesat un element.",
+			explain: "Acesta este un avantaj al acestei metode. Există însă și altele!",
+            correct: true
+		},
+	]}
+/>
+
+### 5. Ce înseamnă umplerea dinamică (dynamic padding)?
+
+<Question
+	choices={[
+		{
+			text: "E atunci când împachetezi intrările pentru fiecare lot la lungimea maximă din întregul dataset.",
+			explain: "Este adevărat că împachetăm când creăm lotul, dar nu până la lungimea maximă din întregul set de date."
+		},
+		{
+			text: "E atunci când împachetezi intrările în momentul creării lotului, la lungimea maximă a propozițiilor din acel lot.",
+			explain: "Corect! Partea „dinamică” vine din faptul că mărimea fiecărui lot este stabilită în momentul creării, iar ca urmare, toate loturile ar putea avea forme diferite.",
+            correct: true
+		},
+		{
+			text: "E atunci când împachetezi intrările astfel încât fiecare propoziție să aibă același număr de tokeni ca precedenta în dataset.",
+			explain: "Nu este corect, și nici nu are sens să ne uităm la ordinea din dataset, din moment ce îl amestecăm în timpul antrenamentului."
+		},
+	]}
+/>
+
+### 6. Care este scopul unei funcții de „collate”?
+
+<Question
+	choices={[
+		{
+			text: "Asigură că toate secvențele din setul de date au aceeași lungime.",
+			explain: "O funcție de collate se ocupă de manipularea loturilor individuale, nu a întregului set de date. În plus, vorbim despre funcțiile de collate în general, nu despre <code>DataCollatorWithPadding</code> în mod specific."
+		},
+		{
+			text: "Reunește toate probele într-un lot.",
+			explain: "Corect! Puteți transmite funcția de collate ca argument al unui <code>DataLoader</code>. Noi am folosit funcția <code>DataCollatorWithPadding</code>, care împachetează toate elementele dintr-un lot astfel încât să aibă aceeași lungime.",
+            correct: true
+		},
+		{
+			text: "Preprocesează întregul set de date.",
+			explain: "Aceasta ar fi o funcție de preprocessing, nu o funcție de collate."
+		},
+        {
+			text: "Trunchiază secvențele din setul de date.",
+			explain: "O funcție de collate se ocupă de manipularea loturilor individuale, nu a întregului set de date. Dacă sunteți interesați de trunchiere, puteți folosi argumentul <code>truncate</code> al <code>tokenizer</code>."
+		}
+	]}
+/>
+
+### 7. Ce se întâmplă când instanțiați una dintre clasele `AutoModelForXxx` cu un model de limbaj preantrenat (cum ar fi `bert-base-uncased`), care corespunde unei alte sarcini decât cea pentru care a fost antrenat?
+
+<Question
+	choices={[
+		{
+			text: "Nimic, dar primești un avertisment.",
+			explain: "Primiți un avertisment, dar asta nu e tot!"
+		},
+		{
+			text: "Head-ul modelului preantrenat este eliminat, iar în locul lui este inserat un head nou, potrivit pentru sarcină.",
+			explain: "Corect. De exemplu, când am folosit <code>AutoModelForSequenceClassification</code> cu <code>bert-base-uncased</code>, am primit avertismente la instanțierea modelului. Head-ul preantrenat nu este folosit pentru sarcina de clasificare secvențială, așa că este eliminat și un nou head este instanțiat cu greutăți inițializate aleator.",
+            correct: true
+		},
+		{
+			text: "Head-ul modelului preantrenat este eliminat.",
+			explain: "Mai trebuie să se întâmple și altceva. Încercați din nou!"
+		},
+        {
+			text: "Nimic, pentru că modelul poate fi ajustat fin (fine-tuned) chiar și pentru o altă sarcină.",
+			explain: "Head-ul preantrenat al modelului nu a fost antrenat pentru această sarcină, deci trebuie eliminat!"
+		}
+	]}
+/>
+
+### 8. Care este scopul folosirii `TrainingArguments`?
+
+<Question
+	choices={[
+		{
+			text: "Conține toți hiperparametrii folosiți pentru antrenare și evaluare cu <code>Trainer</code>.",
+			explain: "Corect!",
+            correct: true
+		},
+		{
+			text: "Specifică dimensiunea modelului.",
+			explain: "Dimensiunea modelului este definită de configurația modelului, nu de clasa <code>TrainingArguments</code>."
+		},
+		{
+			text: "Conține doar hiperparametrii folosiți pentru evaluare.",
+			explain: "În exemplu, am specificat și unde va fi salvat modelul și checkpoint-urile. Încercați din nou!"
+		},
+        {
+			text: "Conține doar hiperparametrii folosiți pentru antrenare.",
+			explain: "În exemplu, am folosit și un <code>evaluation_strategy</code>, așadar acest lucru afectează evaluarea. Încercați din nou!"
+		}
+	]}
+/>
+
+### 9. De ce ar trebui să folosiți biblioteca 🤗 Accelerate?
+
+<Question
+	choices={[
+		{
+			text: "Oferă acces la modele mai rapide.",
+			explain: "Nu, biblioteca 🤗 Accelerate nu oferă niciun model."
+		},
+		{
+			text: "Oferă o API la nivel înalt, astfel încât să nu fie nevoie să implementați propria buclă de antrenament.",
+			explain: "Asta am făcut cu <code>Trainer</code>, nu cu biblioteca 🤗 Accelerate. Încercați din nou!"
+		},
+		{
+			text: "Face ca buclele noastre de antrenament să funcționeze pe strategii distribuite.",
+			explain: "Corect! Cu 🤗 Accelerate, buclele voastre de antrenament vor funcționa pentru mai multe GPU-uri și TPU-uri.",
+            correct: true
+		},
+        {
+			text: "Oferă mai multe funcții de optimizare.",
+			explain: "Nu, biblioteca 🤗 Accelerate nu oferă nicio funcție de optimizare."
+		}
+	]}
+/>
+
+{:else}
+### 4. Ce se întâmplă când instanțiați una dintre clasele `TFAutoModelForXxx` cu un model de limbaj preantrenat (cum ar fi `bert-base-uncased`), care corespunde unei alte sarcini decât cea pentru care a fost antrenat?
+
+<Question
+	choices={[
+		{
+			text: "Nimic, dar primești un avertisment.",
+			explain: "Primiți un avertisment, dar asta nu e tot!"
+		},
+		{
+			text: "Head-ul modelului preantrenat este eliminat, iar în locul lui este inserat un head nou, potrivit pentru sarcină.",
+			explain: "Corect. De exemplu, când am folosit <code>TFAutoModelForSequenceClassification</code> cu <code>bert-base-uncased</code>, am primit avertismente la instanțierea modelului. Head-ul preantrenat nu este folosit pentru sarcina de clasificare secvențială, așa că este eliminat și un nou head este instanțiat cu greutăți inițializate aleator.",
+            correct: true
+		},
+		{
+			text: "Head-ul modelului preantrenat este eliminat.",
+			explain: "Mai trebuie să se întâmple și altceva. Încercați din nou!"
+		},
+        {
+			text: "Nimic, pentru că modelul poate fi ajustat fin (fine-tuned) chiar și pentru o altă sarcină.",
+			explain: "Head-ul preantrenat al modelului nu a fost antrenat pentru această sarcină, deci trebuie eliminat!"
+		}
+	]}
+/>
+
+### 5. Modelele TensorFlow din `transformers` sunt deja modele Keras. Ce avantaj oferă acest lucru?
+
+<Question
+	choices={[
+		{
+			text: "Modelele funcționează pe un TPU din start.",
+			explain: "Ești pe aproape! Totuși, sunt necesare câteva modificări suplimentare. De exemplu, trebuie să rulați totul într-un context <code>TPUStrategy</code>, inclusiv inițializarea modelului."
+		},
+		{
+			text: "Puteți valorifica metodele existente precum <code>compile()</code>, <code>fit()</code> și <code>predict()</code>.",
+			explain: "Corect! Odată ce aveți datele, antrenarea necesită foarte puțin efort.",
+            correct: true
+		},
+		{
+			text: "Învățați atât Keras, cât și transformers.",
+			explain: "Corect, dar căutăm altceva :)",
+			correct: true
+		},
+        {
+			text: "Puteți calcula cu ușurință metrici legate de dataset.",
+			explain: "Keras ne ajută la antrenarea și evaluarea modelului, nu la calcularea metricilor legate de dataset."
+		}
+	]}
+/>
+
+### 6. Cum vă puteți defini propria metrică personalizată?
+
+<Question
+	choices={[
+		{
+			text: "Prin moștenirea <code>tf.keras.metrics.Metric</code>.",
+			explain: "Perfect!",
+			correct: true
+		},
+		{
+			text: "Folosind API-ul funcțional Keras.",
+			explain: "Mai încearcă!"
+		},
+		{
+			text: "Folosind o funcție apelabilă cu semnătura <code>metric_fn(y_true, y_pred)</code>.",
+			explain: "Corect!",
+			correct: true
+		},
+        {
+			text: "Căutând pe Google.",
+			explain: "Nu este răspunsul pe care îl căutăm, dar probabil v-ar putea ajuta să-l găsiți.",
+			correct: true
+		}
+	]}
+/>
+
+{/if}
\ No newline at end of file

From 3b79756af2d004b5885b3fad7df31d440c827c68 Mon Sep 17 00:00:00 2001
From: Angroys <120798951+Angroys@users.noreply.github.com>
Date: Thu, 9 Jan 2025 00:24:58 +0200
Subject: [PATCH 013/167] Done the first three sections of the 7th chapter

---
 chapters/ro/{chapter 6 => chapter6}/1.mdx  |    0
 chapters/ro/{chapter 6 => chapter6}/10.mdx |    0
 chapters/ro/{chapter 6 => chapter6}/2.mdx  |    0
 chapters/ro/{chapter 6 => chapter6}/3.mdx  |    0
 chapters/ro/{chapter 6 => chapter6}/3b.mdx |    0
 chapters/ro/{chapter 6 => chapter6}/4.mdx  |    0
 chapters/ro/{chapter 6 => chapter6}/5.mdx  |    0
 chapters/ro/{chapter 6 => chapter6}/6.mdx  |    0
 chapters/ro/{chapter 6 => chapter6}/7.mdx  |    0
 chapters/ro/{chapter 6 => chapter6}/8.mdx  |    0
 chapters/ro/{chapter 6 => chapter6}/9.mdx  |    0
 chapters/ro/chapter7/1.mdx                 |   38 +
 chapters/ro/chapter7/2.mdx                 |  983 ++++++++++++++++
 chapters/ro/chapter7/3.mdx                 | 1044 +++++++++++++++++
 chapters/ro/chapter7/4.mdx                 | 1002 ++++++++++++++++
 chapters/ro/chapter7/5.mdx                 | 1072 +++++++++++++++++
 chapters/ro/chapter7/6.mdx                 |  914 +++++++++++++++
 chapters/ro/chapter7/7.mdx                 | 1203 ++++++++++++++++++++
 chapters/ro/chapter7/8.mdx                 |   22 +
 chapters/ro/chapter7/9.mdx                 |  329 ++++++
 20 files changed, 6607 insertions(+)
 rename chapters/ro/{chapter 6 => chapter6}/1.mdx (100%)
 rename chapters/ro/{chapter 6 => chapter6}/10.mdx (100%)
 rename chapters/ro/{chapter 6 => chapter6}/2.mdx (100%)
 rename chapters/ro/{chapter 6 => chapter6}/3.mdx (100%)
 rename chapters/ro/{chapter 6 => chapter6}/3b.mdx (100%)
 rename chapters/ro/{chapter 6 => chapter6}/4.mdx (100%)
 rename chapters/ro/{chapter 6 => chapter6}/5.mdx (100%)
 rename chapters/ro/{chapter 6 => chapter6}/6.mdx (100%)
 rename chapters/ro/{chapter 6 => chapter6}/7.mdx (100%)
 rename chapters/ro/{chapter 6 => chapter6}/8.mdx (100%)
 rename chapters/ro/{chapter 6 => chapter6}/9.mdx (100%)
 create mode 100644 chapters/ro/chapter7/1.mdx
 create mode 100644 chapters/ro/chapter7/2.mdx
 create mode 100644 chapters/ro/chapter7/3.mdx
 create mode 100644 chapters/ro/chapter7/4.mdx
 create mode 100644 chapters/ro/chapter7/5.mdx
 create mode 100644 chapters/ro/chapter7/6.mdx
 create mode 100644 chapters/ro/chapter7/7.mdx
 create mode 100644 chapters/ro/chapter7/8.mdx
 create mode 100644 chapters/ro/chapter7/9.mdx

diff --git a/chapters/ro/chapter 6/1.mdx b/chapters/ro/chapter6/1.mdx
similarity index 100%
rename from chapters/ro/chapter 6/1.mdx
rename to chapters/ro/chapter6/1.mdx
diff --git a/chapters/ro/chapter 6/10.mdx b/chapters/ro/chapter6/10.mdx
similarity index 100%
rename from chapters/ro/chapter 6/10.mdx
rename to chapters/ro/chapter6/10.mdx
diff --git a/chapters/ro/chapter 6/2.mdx b/chapters/ro/chapter6/2.mdx
similarity index 100%
rename from chapters/ro/chapter 6/2.mdx
rename to chapters/ro/chapter6/2.mdx
diff --git a/chapters/ro/chapter 6/3.mdx b/chapters/ro/chapter6/3.mdx
similarity index 100%
rename from chapters/ro/chapter 6/3.mdx
rename to chapters/ro/chapter6/3.mdx
diff --git a/chapters/ro/chapter 6/3b.mdx b/chapters/ro/chapter6/3b.mdx
similarity index 100%
rename from chapters/ro/chapter 6/3b.mdx
rename to chapters/ro/chapter6/3b.mdx
diff --git a/chapters/ro/chapter 6/4.mdx b/chapters/ro/chapter6/4.mdx
similarity index 100%
rename from chapters/ro/chapter 6/4.mdx
rename to chapters/ro/chapter6/4.mdx
diff --git a/chapters/ro/chapter 6/5.mdx b/chapters/ro/chapter6/5.mdx
similarity index 100%
rename from chapters/ro/chapter 6/5.mdx
rename to chapters/ro/chapter6/5.mdx
diff --git a/chapters/ro/chapter 6/6.mdx b/chapters/ro/chapter6/6.mdx
similarity index 100%
rename from chapters/ro/chapter 6/6.mdx
rename to chapters/ro/chapter6/6.mdx
diff --git a/chapters/ro/chapter 6/7.mdx b/chapters/ro/chapter6/7.mdx
similarity index 100%
rename from chapters/ro/chapter 6/7.mdx
rename to chapters/ro/chapter6/7.mdx
diff --git a/chapters/ro/chapter 6/8.mdx b/chapters/ro/chapter6/8.mdx
similarity index 100%
rename from chapters/ro/chapter 6/8.mdx
rename to chapters/ro/chapter6/8.mdx
diff --git a/chapters/ro/chapter 6/9.mdx b/chapters/ro/chapter6/9.mdx
similarity index 100%
rename from chapters/ro/chapter 6/9.mdx
rename to chapters/ro/chapter6/9.mdx
diff --git a/chapters/ro/chapter7/1.mdx b/chapters/ro/chapter7/1.mdx
new file mode 100644
index 000000000..82f8c9611
--- /dev/null
+++ b/chapters/ro/chapter7/1.mdx
@@ -0,0 +1,38 @@
+<FrameworkSwitchCourse {fw} />
+
+# Introduction[[introduction]]
+
+<CourseFloatingBanner
+    chapter={7}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+În [Capitolul 3](/course/chapter3), ați văzut cum să faceți fine-tune unui model pentru clasificarea textului. În acest capitol, vom aborda următoarele sarcini NLP:
+
+- Clasificarea tokenilor
+- Masked language modeling (precum BERT)
+- Sumarizare
+- Traducere
+- Preantrenare pentru causal language modeling (precum GPT-2)
+- Răspunderea la întrebări
+
+{#if fw === 'pt'}
+
+Pentru a face acest lucru, va trebui să valorificați tot ceea ce ați învățat despre API-ul `Trainer` și biblioteca 🤗 Accelerate în [Capitolul 3](/course/chapter3), biblioteca 🤗 Datasets în [Capitolul 5](/course/chapter5) și biblioteca 🤗 Tokenizers în [Capitolul 6](/course/chapter6). De asemenea, vom încărca rezultatele noastre în Model Hub, așa cum am făcut în [Capitolul 4](/course/chapter4), astfel încât acesta este cu adevărat capitolul în care totul se unește!
+
+Fiecare secțiune poate fi citită independent și vă va arăta cum să antrenați un model cu API-ul `Trainer` sau cu propria buclă de antrenament, utilizând 🤗 Accelerate. Nu ezitați să săriți peste oricare dintre cele două părți și să vă concentrați pe cea care vă interesează cel mai mult: API-ul `Trainer` este excelent pentru fine-tuning sau antrenarea modelului vostru fără a vă face griji cu privire la ceea ce se întâmplă în spatele scenei, în timp ce bucla de antrenament cu `Accelerate` vă va permite să personalizați mai ușor orice parte doriți.
+
+{:else}
+
+Pentru a face acest lucru, va trebui să valorificați tot ceea ce ați învățat despre API-ul `Trainer` și biblioteca 🤗 Accelerate în [Capitolul 3](/course/chapter3), biblioteca 🤗 Datasets în [Capitolul 5](/course/chapter5) și biblioteca 🤗 Tokenizers în [Capitolul 6](/course/chapter6). De asemenea, vom încărca rezultatele noastre în Model Hub, așa cum am făcut în [Capitolul 4](/course/chapter4), astfel încât acesta este cu adevărat capitolul în care totul se unește!
+
+Fiecare secțiune poate fi citită independent.
+
+{/if}
+
+
+<Tip>
+
+Dacă citiți secțiunile în succesiune, veți observa că acestea au destul de mult cod și proză în comun. Repetarea este intenționată, pentru a vă permite să intrați (sau să reveniți mai târziu) la orice sarcină care vă interesează și să găsiți un exemplu.
+
+</Tip>
diff --git a/chapters/ro/chapter7/2.mdx b/chapters/ro/chapter7/2.mdx
new file mode 100644
index 000000000..108806a81
--- /dev/null
+++ b/chapters/ro/chapter7/2.mdx
@@ -0,0 +1,983 @@
+<FrameworkSwitchCourse {fw} />
+
+# Clasificarea tokenilor[[token-classification]]
+
+{#if fw === 'pt'}
+
+<CourseFloatingBanner chapter={7}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter7/section2_pt.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter7/section2_pt.ipynb"},
+]} />
+
+{:else}
+
+<CourseFloatingBanner chapter={7}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter7/section2_tf.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter7/section2_tf.ipynb"},
+]} />
+
+{/if}
+
+Prima aplicație pe care o vom explora este clasificarea tokenilor. Această sarcină generică cuprinde orice problemă care poate fi formulată ca "atribuirea unui label fiecărui token dintr-o propoziție", cum ar fi:
+
+- **Named entity recognition(NER)**: Găsirea entităților (cum ar fi persoane, locații sau organizații) într-o propoziție. Acest lucru poate fi formulat ca atribuirea unui label fiecărui token, având o clasă pentru fiecare entitate și o clasă pentru "nicio entitate".
+- **Part-of-speech tagging (POS)**: Marchează fiecare cuvânt dintr-o propoziție ca corespunzând unei anumite părți de vorbire (cum ar fi substantiv, verb, adjectiv etc.).
+- **Chunking**: Găsirea tokenilor care aparțin aceleiași entități. Această sarcină (care poate fi combinată cu POS sau NER) poate fi formulată ca atribuirea unui label (de obicei `B-`) tuturor tokenilor care se află la începutul unui chunk, a unui alt label (de obicei `I-`) la tokeni care se află în interiorul unui chunk și a unui al treilea label (de obicei `O`) la tokeni care nu aparțin niciunui chunk.
+
+<Youtube id="wVHdVlPScxA"/>
+
+Desigur, există multe alte tipuri de probleme de clasificare a tokenilor; acestea sunt doar câteva exemple reprezentative. În această secțiune, vom pune la punct un model (BERT) pe o sarcină NER, care va fi apoi capabil să calculeze predicții precum aceasta:
+
+<iframe src="https://course-demos-bert-finetuned-ner.hf.space" frameBorder="0" height="350" title="Gradio app" class="block dark:hidden container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
+
+<a class="flex justify-center" href="/huggingface-course/bert-finetuned-ner">
+<img class="block dark:hidden lg:w-3/5" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/model-eval-bert-finetuned-ner.png" alt="One-hot encoding labels pentru răspunderea la întrebări."/>
+<img class="hidden dark:block lg:w-3/5" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/model-eval-bert-finetuned-ner-dark.png" alt="One-hot encoded labels pentru răspunderea la întrebări."/>
+</a>
+
+Puteți găsi modelul pe care îl vom antrena și încărca în Hub și puteți verifica de două ori predicțiile sale [aici](https://huggingface.co/huggingface-course/bert-finetuned-ner?text=My+name+is+Sylvain+and+I+work+at+Hugging+Face+in+Brooklyn).
+
+## Pregătirea datelor[[preparing-the-data]]
+
+În primul rând, avem nevoie de un dataset adecvat pentru clasificarea simbolurilor. În această secțiune vom utiliza [datasetul CoNLL-2003] (https://huggingface.co/datasets/conll2003), care conține știri de la Reuters.
+
+<Tip>
+
+💡 Atât timp cât datasetul vostru constă în texte împărțite în cuvinte cu labelurile corespunzătoare, veți putea adapta procedurile de preprocesare a datelor descrise aici la propriul dataset. Consultați [Capitolul 5](/course/chapter5) dacă aveți nevoie de o recapitulare a modului de încărcare a propriilor date personalizate într-un `Dataset`.
+
+</Tip>
+
+### Datasetul CoNLL-2003 [[the-conll-2003-dataset]]
+
+Pentru a încărca dataetul CoNLL-2003, folosim metoda `load_dataset()` din biblioteca 🤗 Datasets:
+
+```py
+from datasets import load_dataset
+
+raw_datasets = load_dataset("conll2003")
+```
+
+Acest lucru va descărca și va stoca în cache datasetul, așa cum am văzut în [Capitolul 3](/course/chapter3) pentru setul de date GLUE MRPC. Inspectarea acestui obiect ne arată coloanele prezente și împărțirea între seturile de antrenare, validare și testare:
+
+```py
+raw_datasets
+```
+
+```python out
+DatasetDict({
+    train: Dataset({
+        features: ['chunk_tags', 'id', 'ner_tags', 'pos_tags', 'tokens'],
+        num_rows: 14041
+    })
+    validation: Dataset({
+        features: ['chunk_tags', 'id', 'ner_tags', 'pos_tags', 'tokens'],
+        num_rows: 3250
+    })
+    test: Dataset({
+        features: ['chunk_tags', 'id', 'ner_tags', 'pos_tags', 'tokens'],
+        num_rows: 3453
+    })
+})
+```
+
+În special, putem vedea că datasetul conține labeluri pentru cele trei sarcini pe care le-am menționat mai devreme: NER, POS și Chunking. O mare diferență față de alte datseturi este că textele de intrare nu sunt prezentate ca propoziții sau documente, ci ca liste de cuvinte (ultima coloană se numește `tokens`, dar conține cuvinte în sensul că acestea sunt inputuri pre-tokenizate care mai trebuie să treacă prin tokenizer pentru tokenizarea subcuvintelor).
+
+Să aruncăm o privire la primul element al setului de formare:
+
+```py
+raw_datasets["train"][0]["tokens"]
+```
+
+```python out
+['EU', 'rejects', 'German', 'call', 'to', 'boycott', 'British', 'lamb', '.']
+```
+
+Deoarece dorim să efectuăm named entity recognition, ne vom uita la etichetele NER:
+
+```py
+raw_datasets["train"][0]["ner_tags"]
+```
+
+```python out
+[3, 0, 7, 0, 0, 0, 7, 0, 0]
+```
+
+Acestea sunt labelurile ca numere întregi pregătite pentru antrenare, dar nu sunt neapărat utile atunci când dorim să inspectăm datele. La fel ca în cazul clasificării textului, putem accesa corespondența dintre aceste numere întregi și numele labelurilor consultând atributul `features` al datasetului nostru:
+
+```py
+ner_feature = raw_datasets["train"].features["ner_tags"]
+ner_feature
+```
+
+```python out
+Sequence(feature=ClassLabel(num_classes=9, names=['O', 'B-PER', 'I-PER', 'B-ORG', 'I-ORG', 'B-LOC', 'I-LOC', 'B-MISC', 'I-MISC'], names_file=None, id=None), length=-1, id=None)
+```
+
+Deci, această coloană conține elemente care sunt secvențe a `ClassLabel`. Tipul elementelor din secvență se află în atributul `feature` al acestei `ner_feature`, iar noi putem accesa lista de nume consultând atributul `names` al acelei `feature`:
+
+```py
+label_names = ner_feature.feature.names
+label_names
+```
+
+```python out
+['O', 'B-PER', 'I-PER', 'B-ORG', 'I-ORG', 'B-LOC', 'I-LOC', 'B-MISC', 'I-MISC']
+```
+
+Am văzut deja aceste labeluri atunci când am cercetat pipelineul `token-classification` în [Capitolul 6](/course/chapter6/3), dar pentru o reîmprospătare rapidă:
+
+- `O` înseamnă că cuvântul nu corespunde niciunei entități.
+- `B-PER`/`I-PER` înseamnă că cuvântul corespunde începutului/este în interiorul unei entități de tip *persoană*.
+- `B-ORG`/`I-ORG` înseamnă că cuvântul corespunde începutului/este în interiorul unei entități de tip *organizaționale*.
+- `B-LOC`/`I-LOC` înseamnă că cuvântul corespunde începutului/este în interiorul unei entități de tip  *locație*.
+- `B-MISC`/`I-MISC` înseamnă că cuvântul corespunde începutului/este în interiorul unei entități de tip *miscellaneous.
+
+Acum, decodificarea labelurilor pe care le-am văzut mai devreme ne dă următorul rezultat:
+
+```python
+words = raw_datasets["train"][0]["tokens"]
+labels = raw_datasets["train"][0]["ner_tags"]
+line1 = ""
+line2 = ""
+for word, label in zip(words, labels):
+    full_label = label_names[label]
+    max_length = max(len(word), len(full_label))
+    line1 += word + " " * (max_length - len(word) + 1)
+    line2 += full_label + " " * (max_length - len(full_label) + 1)
+
+print(line1)
+print(line2)
+```
+
+```python out
+'EU    rejects German call to boycott British lamb .'
+'B-ORG O       B-MISC O    O  O       B-MISC  O    O'
+```
+
+Și pentru un exemplu de amestecare a labelurilor `B-` și `I-`, iată ce ne oferă același cod pentru elementul din setul de antrenare de la indexul 4:
+
+```python out
+'Germany \'s representative to the European Union \'s veterinary committee Werner Zwingmann said on Wednesday consumers should buy sheepmeat from countries other than Britain until the scientific advice was clearer .'
+'B-LOC   O  O              O  O   B-ORG    I-ORG O  O          O         B-PER  I-PER     O    O  O         O         O      O   O         O    O         O     O    B-LOC   O     O   O          O      O   O       O'
+```
+
+După cum putem vedea, entităților care cuprind două cuvinte, precum "Uniunea Europeană" și "Werner Zwingmann", li se atribuie un label `B-` pentru primul cuvânt și un label `I-` pentru al doilea.
+
+<Tip>
+
+✏️ **E rândul tău!** Afișați aceleași două propoziții cu labelurile POS sau chunking.
+
+</Tip>
+
+### Procesarea datelor[[processing-the-data]]
+
+<Youtube id="iY2AZYdZAr0"/>
+
+Ca de obicei, textele noastre trebuie să fie convertite în ID-uri token înainte ca modelul să le poată înțelege. După cum am văzut în [Capitolul 6](/course/chapter6/), o mare diferență în cazul sarcinilor de clasificare a tokenilor este că avem inputuri pre-tokenizate. Din fericire, API-ul tokenizerului poate face față acestei situații destul de ușor; trebuie doar să avertizăm `tokenizerul` cu un indicator special.
+
+Pentru început, hai să creăm obiectul `tokenizer`. După cum am mai spus, vom utiliza un model BERT preantrenat, deci vom începe prin a descărca și a stoca în cache tokenizerul asociat:
+
+```python
+from transformers import AutoTokenizer
+
+model_checkpoint = "bert-base-cased"
+tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
+```
+
+Puteți înlocui `model_checkpoint` cu orice alt model preferat din [Hub](https://huggingface.co/models) sau cu un folder local în care ați salvat un model preantreant și un tokenizer. Singura constrângere este că tokenizerul trebuie să fie susținut de biblioteca 🤗 Tokenizers, pentru ca să existe o versiune "rapidă" disponibilă. Puteți vedea toate arhitecturile care vin cu o versiune rapidă în [acest tabel mare] (https://huggingface.co/transformers/#supported-frameworks), iar pentru a verifica dacă obiectul `tokenizer` pe care îl utilizați este într-adevăr susținut de 🤗 Tokenizers, vă puteți uita la atributul său `is_fast`:
+
+```py
+tokenizer.is_fast
+```
+
+```python out
+True
+```
+
+Pentru a tokeniza un input pre-tokenizat, putem utiliza `tokenizer` ca de obicei și să adăugăm `is_split_into_words=True`:
+
+```py
+inputs = tokenizer(raw_datasets["train"][0]["tokens"], is_split_into_words=True)
+inputs.tokens()
+```
+
+```python out
+['[CLS]', 'EU', 'rejects', 'German', 'call', 'to', 'boycott', 'British', 'la', '##mb', '.', '[SEP]']
+```
+
+După cum putem vedea, tokenizerul a adăugat tokenii speciali utilizați de model (`[CLS]` la început și `[SEP]` la sfârșit) și a lăsat majoritatea cuvintelor neatinse. Cu toate acestea, cuvântul `lamb` a fost tokenizat în două subcuvinte, `la` și `##mb`. Acest lucru introduce o neconcordanță între inputurile noastre și labeluri: lista de labeluri are doar 9 elemente, în timp ce inputurile noastre au acum 12 tokeni. Să luăm în considerare tokenii speciali este ușor (știm că sunt la început și la sfârșit), dar trebuie să ne asigurăm că aliniem toate labelurile cu cuvintele corespunzătoare.
+
+Din fericire, pentru că folosim un tokenizer rapid, avem acces la superputerile 🤗 Tokenizers, ceea ce înseamnă că putem mapa cu ușurință fiecare token la cuvântul corespunzător (după cum se vede în [Capitolul 6](/course/chapter6/3)):
+
+```py
+inputs.word_ids()
+```
+
+```python out
+[None, 0, 1, 2, 3, 4, 5, 6, 7, 7, 8, None]
+```
+
+Cu puțină muncă, putem apoi extinde lista de labeluri pentru a se potrivi cu tokenii. Prima regulă pe care o vom aplica este că tokenii special primesc un label `-100`. Acest lucru se datorează faptului că în mod implicit `-100` este un indice care este ignorat în funcția de pierdere pe care o vom utiliza (cross entropy). Apoi, fiecare token primește același label ca și tokenul care a inițiat cuvântul în care se află, deoarece fac parte din aceeași entitate. Pentru tokenii din interiorul unui cuvânt, dar care nu se află la început, înlocuim `B-` cu `I-` (deoarece tokenul nu începe entitatea):
+
+
+```python
+def align_labels_with_tokens(labels, word_ids):
+    new_labels = []
+    current_word = None
+    for word_id in word_ids:
+        if word_id != current_word:
+            # Start of a new word!
+            current_word = word_id
+            label = -100 if word_id is None else labels[word_id]
+            new_labels.append(label)
+        elif word_id is None:
+            # Special token
+            new_labels.append(-100)
+        else:
+            # Same word as previous token
+            label = labels[word_id]
+            # If the label is B-XXX we change it to I-XXX
+            if label % 2 == 1:
+                label += 1
+            new_labels.append(label)
+
+    return new_labels
+```
+
+Hai să îl încercăm cu prima noastră propoziție:
+
+```py
+labels = raw_datasets["train"][0]["ner_tags"]
+word_ids = inputs.word_ids()
+print(labels)
+print(align_labels_with_tokens(labels, word_ids))
+```
+
+```python out
+[3, 0, 7, 0, 0, 0, 7, 0, 0]
+[-100, 3, 0, 7, 0, 0, 0, 7, 0, 0, 0, -100]
+```
+
+După cum putem vedea, funcția noastră a adăugat `-100` pentru cei doi tokeni speciali de la început și de la sfârșit, și un nou `0` pentru cuvântul nostru care a fost împărțit în doi tokeni.
+
+<Tip>
+
+✏️ ** Rândul tău!** Unii cercetători preferă să atribuie un singur label pe cuvânt și să atribuie `-100` celorlalți subtokeni dintr-un cuvânt dat. Aceasta are loc pentru a evita ca cuvintele lungi care se împart în mai mulți subtokeni să contribuie puternic la pierdere. Modificați funcția anterioară pentru a alinia labelurile cu ID-urile de input urmând această regulă.
+
+</Tip>
+
+Pentru a preprocesa întregul nostru dataset, trebuie să tokenizăm toate inputurile și să aplicăm `align_labels_with_tokens()` pe toate labelurile. Pentru a profita de viteza tokenizerului nostru rapid, este mai bine să tokenizăm multe texte în același timp, așa că vom scrie o funcție care procesează o listă de exemple și vom folosi metoda `Dataset.map()` cu opțiunea `batched=True`. Singurul lucru diferit față de exemplul nostru anterior este că funcția `word_ids()` trebuie să obțină indexul exemplului din care dorim ID-urile cuvintelor atunci când inputurile către tokenizer sunt liste de texte (sau, în cazul nostru, liste de liste de cuvinte), așa că adăugăm și acest lucru:
+
+```py
+def tokenize_and_align_labels(examples):
+    tokenized_inputs = tokenizer(
+        examples["tokens"], truncation=True, is_split_into_words=True
+    )
+    all_labels = examples["ner_tags"]
+    new_labels = []
+    for i, labels in enumerate(all_labels):
+        word_ids = tokenized_inputs.word_ids(i)
+        new_labels.append(align_labels_with_tokens(labels, word_ids))
+
+    tokenized_inputs["labels"] = new_labels
+    return tokenized_inputs
+```
+
+Rețineți că nu am completat încă inputurile; vom face acest lucru mai târziu, atunci când vom crea batchurile cu un data collator.
+
+Acum putem aplica toate aceste preprocesări dintr-o dată celorlalte fracțiuni ale datasetului nostru:
+
+```py
+tokenized_datasets = raw_datasets.map(
+    tokenize_and_align_labels,
+    batched=True,
+    remove_columns=raw_datasets["train"].column_names,
+)
+```
+
+Am făcut partea cea mai grea! Acum, că datele au fost preprocesate, antrenarea efectivă va semăna mult cu ceea ce am făcut în [Capitolul 3](/course/chapter3).
+
+{#if fw === 'pt'}
+
+## Fine-tuningul modelului cu `Trainer` API[[fine-tuning-the-model-with-the-trainer-api]]
+
+Codul real care utilizează `Trainer` va fi același ca înainte; singurele modificări sunt modul în care datele sunt collated într-un batch și metric computation function.
+
+{:else}
+
+## Fine-tuningul modelului cu Keras[[fine-tuning-the-model-with-keras]]
+
+Codul real care utilizează `Keras` va fi același ca înainte; singurele modificări sunt modul în care datele sunt collated într-un batch și metric computation function.
+
+{/if}
+
+
+### Data collation[[data-collation]]
+
+Nu putem folosi doar un `DataCollatorWithPadding` ca în [Capitolul 3](/course/chapter3) deoarece acesta doar adaugă padding inputurilor(input IDs, attention mask, and token type IDs). Aici labelurile noastre ar trebui să fie padded exact în același mod ca și inputurile, astfel încât să rămână de aceeași dimensiune, folosind `-100` ca valoare, astfel încât predicțiile corespunzătoare să fie ignorate în calculul pierderilor.
+
+Toate acestea sunt realizate de un [`DataCollatorForTokenClassification`](https://huggingface.co/transformers/main_classes/data_collator.html#datacollatorfortokenclassification). La fel ca `DataCollatorWithPadding`, acesta ia `tokenizer`-ul folosit pentru preprocesarea inputurilor:
+
+{#if fw === 'pt'}
+
+```py
+from transformers import DataCollatorForTokenClassification
+
+data_collator = DataCollatorForTokenClassification(tokenizer=tokenizer)
+```
+
+{:else}
+
+```py
+from transformers import DataCollatorForTokenClassification
+
+data_collator = DataCollatorForTokenClassification(
+    tokenizer=tokenizer, return_tensors="tf"
+)
+```
+
+{/if}
+
+Pentru a testa acest lucru pe câteva sampleuri, îl putem apela doar pe o listă de exemple din setul nostru de antrenat tokenizat:
+
+```py
+batch = data_collator([tokenized_datasets["train"][i] for i in range(2)])
+batch["labels"]
+```
+
+```python out
+tensor([[-100,    3,    0,    7,    0,    0,    0,    7,    0,    0,    0, -100],
+        [-100,    1,    2, -100, -100, -100, -100, -100, -100, -100, -100, -100]])
+```
+
+Hai să comparăm acest lucru cu labelurile pentru primul și al doilea element din datasetul nostru:
+
+```py
+for i in range(2):
+    print(tokenized_datasets["train"][i]["labels"])
+```
+
+```python out
+[-100, 3, 0, 7, 0, 0, 0, 7, 0, 0, 0, -100]
+[-100, 1, 2, -100]
+```
+
+{#if fw === 'pt'}
+
+După cum se poate observa, al doilea set de labeluri a fost padded la lungimea primului folosind `-100`.
+
+{:else}
+
+Data collatorul nostru de date este gata de utilizare! Acum să îl folosim pentru a crea un `tf.data.Dataset` cu metoda `to_tf_dataset()`. De asemenea, puteți utiliza `model.prepare_tf_dataset()` pentru a face acest lucru cu un pic mai puțin cod repetitiv - veți vedea acest lucru în unele dintre celelalte secțiuni ale acestui capitol.
+
+```py
+tf_train_dataset = tokenized_datasets["train"].to_tf_dataset(
+    columns=["attention_mask", "input_ids", "labels", "token_type_ids"],
+    collate_fn=data_collator,
+    shuffle=True,
+    batch_size=16,
+)
+
+tf_eval_dataset = tokenized_datasets["validation"].to_tf_dataset(
+    columns=["attention_mask", "input_ids", "labels", "token_type_ids"],
+    collate_fn=data_collator,
+    shuffle=False,
+    batch_size=16,
+)
+```
+
+
+Următoarea oprire: modelul în sine.
+
+{/if}
+
+{#if fw === 'tf'}
+
+### Definirea modelului[[defining-the-model]]
+
+Deoarece lucrăm la o problemă de clasificare a tokenilor, vom utiliza clasa `TFAutoModelForTokenClassification`. Principalul lucru de care trebuie să ne amintim atunci când definim acest model este să transmitem informații privind numărul de labeluri pe care le avem. Cel mai simplu mod de a face acest lucru este să transmiteți acest număr cu argumentul `num_labels`, dar dacă dorim un inference widget frumos care să funcționeze ca cel pe care l-am văzut la începutul acestei secțiuni, este mai bine să setați în schimb corespondențele corecte ale labelurilor.
+
+Acestea ar trebui să fie stabilite de două dicționare, `id2label` și `label2id`, care conțin corespondența de la ID la label și viceversa:
+
+```py
+id2label = {i: label for i, label in enumerate(label_names)}
+label2id = {v: k for k, v in id2label.items()}
+``` 
+
+Acum putem să le transmitem metodei `TFAutoModelForTokenClassification.from_pretrained()`, iar acestea vor fi setate în configurația modelului, apoi salvate corespunzător și încărcate în Hub:
+
+```py
+from transformers import TFAutoModelForTokenClassification
+
+model = TFAutoModelForTokenClassification.from_pretrained(
+    model_checkpoint,
+    id2label=id2label,
+    label2id=label2id,
+)
+```
+
+La fel ca atunci când am definit `TFAutoModelForSequenceClassification` în [Capitolul 3](/course/chapter3), crearea modelului emite un avertisment că unele weights nu au fost utilizate (cele din headul de preantrenare) și că alte weights sunt inițializate aleatoriu (cele din headul de clasificare a tokenilor noi) și că acest model ar trebui să fie antrenat. Vom face acest lucru într-un minut, dar mai întâi să verificăm de două ori că modelul nostru are numărul corect de labeluri:
+
+```python
+model.config.num_labels
+```
+
+```python out
+9
+```
+
+<Tip warning={true}>
+
+⚠️ Dacă aveți un model cu un număr greșit de labeluri, veți primi o eroare obscură atunci când apelați `model.fit()` mai târziu. Acest lucru poate fi enervant pentru debbuging, așa că asigurați-vă că faceți această verificare pentru a confirma că aveți numărul așteptat de labeluri.
+
+</Tip>
+
+### Fine-tuningul modelului[[fine-tuning-the-model]]
+
+Acum suntem gata să ne antrenăm modelul! Totuși, mai avem doar câteva lucruri de făcut mai întâi: ar trebui să ne conectăm la Hugging Face și să definim hiperparametrii noștri de antrenare. Dacă lucrați într-un notebook, există o funcție convenabilă pentru a vă ajuta cu acest lucru:
+
+```python
+from huggingface_hub import notebook_login
+
+notebook_login()
+```
+
+Aceasta va afișa un widget în care puteți introduce datele tale de autentificare Hugging Face.
+
+Dacă nu lucrați într-un notebook, tastați următoarea linie în terminal:
+
+```bash
+huggingface-cli login
+```
+
+După autentificare, putem pregăti tot ce avem nevoie pentru a compila modelul nostru. 🤗 Transformers oferă o funcție convenabilă `create_optimizer()` care vă va oferi un optimizator `AdamW` cu setări adecvate pentru weight decay și learning rate decay, ambele îmbunătățind performanța modelului vsotru în comparație cu optimizatorul `Adam` încorporat:
+
+```python
+from transformers import create_optimizer
+import tensorflow as tf
+
+# Antrenarea în mixed-precision float16
+# Comentați această linie dacă utilizați un GPU care nu va beneficia de acest lucru
+tf.keras.mixed_precision.set_global_policy("mixed_float16")
+
+# Numărul de etape de antrenare este numărul de sampleuri din dataset, împărțit la dimensiunea batch-ului, apoi multiplicat
+# cu numărul total de epoci. Rețineți că tf_train_dataset de aici este un batched tf.data.Dataset,
+# nu este originalul Hugging Face Dataset, deci len() este deja num_samples // batch_size.
+num_epochs = 3
+num_train_steps = len(tf_train_dataset) * num_epochs
+
+optimizer, schedule = create_optimizer(
+    init_lr=2e-5,
+    num_warmup_steps=0,
+    num_train_steps=num_train_steps,
+    weight_decay_rate=0.01,
+)
+model.compile(optimizer=optimizer)
+```
+
+Rețineți, de asemenea, că nu furnizăm un argument `loss` la `compile()`. Acest lucru se datorează faptului că modelele pot calcula de fapt pierderea intern - dacă compilați fără o pierdere și furnizați labelurile în dicționarul de intrare (așa cum facem în dataseturile noastre), atunci modelul se va antrena folosind acea pierdere internă, care va fi adecvată pentru sarcina și tipul de model pe care le-ați ales.
+
+În continuare, definim un `PushToHubCallback` pentru a încărca modelul nostru în Hub în timpul antrenării și pentru a potrivi modelul cu acel callback:
+
+```python
+from transformers.keras_callbacks import PushToHubCallback
+
+callback = PushToHubCallback(output_dir="bert-finetuned-ner", tokenizer=tokenizer)
+
+model.fit(
+    tf_train_dataset,
+    validation_data=tf_eval_dataset,
+    callbacks=[callback],
+    epochs=num_epochs,
+)
+```
+
+Puteți specifica numele complet al repositoriului către care doriți să efectuați push cu argumentul `hub_model_id` (în special, va trebui să utilizați acest argument pentru a efectua push către o organizație). De exemplu, atunci când am trimis modelul către organizația [`huggingface-course`](https://huggingface.co/huggingface-course), am adăugat `hub_model_id="huggingface-course/bert-finetuned-ner"`. În mod implicit, repositoriul utilizat va fi în namespace-ul denumit după directory output pe care l-ați stabilit, de exemplu `"cool_huggingface_user/bert-finetuned-ner"`.
+
+<Tip>
+
+💡 Dacă directory output pe care îl utilizați există deja, acesta trebuie să fie o clonă locală a repositoriului către care doriți să faceți push. Dacă nu este, veți primi o eroare atunci când apelați `model.fit()` și va trebui să setați un nume nou.
+
+</Tip>
+
+Rețineți că, în timpul antrenamentului, de fiecare dată când modelul este salvat (aici, la fiecare epocă), acesta este încărcat pe Hub în fundal. În acest fel, veți putea să reluați formarea pe o altă mașină, dacă este necesar.
+
+În acest stadiu, puteți utiliza inference widget de pe Model Hub pentru a testa modelul vostru și pentru a-l partaja cu prietenii. Ați făcut fine-tune cu succes unui model pentru o sarcină de clasificare a tokenilor - felicitări! Dar cât de bun este modelul nostru, de fapt? Ar trebui să evaluăm anumiți parametri pentru a afla.
+
+{/if}
+
+
+### Metrici[[metrics]]
+
+{#if fw === 'pt'}
+
+Pentru ca `Trainer` să calculeze o metrică în fiecare epocă, va trebui să definim o funcție `compute_metrics()` care primește matricele de predicții și labelurile și returnează un dicționar cu numele și valorile metricilor.
+
+Frameworkul tradițional utilizat pentru a evalua predicția clasificării a tokenilor este [*seqeval*](https://github.com/chakki-works/seqeval). Pentru a utiliza această metrică, trebuie mai întâi să instalăm biblioteca *seqeval*:
+
+```py
+!pip install seqeval
+```
+
+Apoi îl putem încărca prin intermediul funcției `evaluate.load()` așa cum am făcut în [Capitolul 3](/course/chapter3):
+
+{:else}
+
+Frameworkul tradițional utilizat pentru a evalua predicția clasificării tokenilor este [*seqeval*](https://github.com/chakki-works/seqeval). Pentru a utiliza această metrică, trebuie mai întâi să instalăm biblioteca *seqeval*:
+
+```py
+!pip install seqeval
+```
+
+Apoi îl putem încărca prin intermediul funcției `evaluate.load()` așa cum am făcut în [Capitolul 3](/course/chapter3):
+
+{/if}
+
+```py
+import evaluate
+
+metric = evaluate.load("seqeval")
+```
+
+Această metrică nu se comportă ca precizia standard: de fapt, va lua listele de labeluri ca șiruri de caractere, nu ca numere întregi, deci va trebui să decodificăm complet predicțiile și labelurile înainte de a le trece în metrice. Să vedem cum funcționează. În primul rând, vom obține labelurile pentru primul nostru exemplu de antrenare:
+
+```py
+labels = raw_datasets["train"][0]["ner_tags"]
+labels = [label_names[i] for i in labels]
+labels
+```
+
+```python out
+['B-ORG', 'O', 'B-MISC', 'O', 'O', 'O', 'B-MISC', 'O', 'O']
+```
+
+Putem apoi crea predicții false pentru acestea prin simpla schimbare a valorii la indexul 2:
+
+```py
+predictions = labels.copy()
+predictions[2] = "O"
+metric.compute(predictions=[predictions], references=[labels])
+```
+
+Rețineți că metrica ia o listă de predicții (nu doar una) și o listă de labels. Iată rezultatul:
+
+```python out
+{'MISC': {'precision': 1.0, 'recall': 0.5, 'f1': 0.67, 'number': 2},
+ 'ORG': {'precision': 1.0, 'recall': 1.0, 'f1': 1.0, 'number': 1},
+ 'overall_precision': 1.0,
+ 'overall_recall': 0.67,
+ 'overall_f1': 0.8,
+ 'overall_accuracy': 0.89}
+```
+
+{#if fw === 'pt'}
+
+Acesta trimite înapoi o mulțime de informații! Noi obținem precizia, recallul și scorul F1 pentru fiecare entitate în parte, precum și scorul general. Pentru calculul nostru metric, vom păstra doar scorul global, dar nu ezitați să modificați funcția `compute_metrics()` pentru a returna toate metricile pe care doriți să le raportați.
+
+Această funcție `compute_metrics()` ia mai întâi argmaxul logiturilor pentru a le converti în predicții (ca de obicei, logiturile și probabilitățile sunt în aceeași ordine, deci nu trebuie să aplicăm softmaxul). Apoi trebuie să convertim atât labelurile, cât și predicțiile din numere întregi în șiruri de caractere. Eliminăm toate valorile în care labelul este `-100`, apoi transmitem rezultatele metodei `metric.compute()`:
+
+```py
+import numpy as np
+
+
+def compute_metrics(eval_preds):
+    logits, labels = eval_preds
+    predictions = np.argmax(logits, axis=-1)
+
+    # Remove ignored index (special tokens) and convert to labels
+    true_labels = [[label_names[l] for l in label if l != -100] for label in labels]
+    true_predictions = [
+        [label_names[p] for (p, l) in zip(prediction, label) if l != -100]
+        for prediction, label in zip(predictions, labels)
+    ]
+    all_metrics = metric.compute(predictions=true_predictions, references=true_labels)
+    return {
+        "precision": all_metrics["overall_precision"],
+        "recall": all_metrics["overall_recall"],
+        "f1": all_metrics["overall_f1"],
+        "accuracy": all_metrics["overall_accuracy"],
+    }
+```
+
+Acum că acest lucru este făcut, suntem aproape gata să definim `Trainer`-ul nostru. Avem nevoie doar de un `model` pentru a face fine-tune!
+
+{:else}
+
+Aceasta trimite înapoi o mulțime de informații! Obținem precizia, recallul și scorul F1 pentru fiecare entitate în parte, precum și în ansamblu. Acum să vedem ce se întâmplă dacă încercăm să folosim predicțiile modelului nostru real pentru a calcula niște scoruri reale.
+
+TensorFlow nu apreciază concatenarea predicțiilor noastre, deoarece acestea au lungimi de secvențe variabile. Aceasta înseamnă că nu putem folosi pur și simplu `model.predict()` - dar asta nu ne va opri. Vom obține unele predicții pe rând și le vom concatena într-o singură listă mare și lungă, eliminând simbolurile `-100` care indică mascarea/paddingul, apoi vom calcula metrici pe lista de la sfârșit:
+
+```py
+import numpy as np
+
+all_predictions = []
+all_labels = []
+for batch in tf_eval_dataset:
+    logits = model.predict_on_batch(batch)["logits"]
+    labels = batch["labels"]
+    predictions = np.argmax(logits, axis=-1)
+    for prediction, label in zip(predictions, labels):
+        for predicted_idx, label_idx in zip(prediction, label):
+            if label_idx == -100:
+                continue
+            all_predictions.append(label_names[predicted_idx])
+            all_labels.append(label_names[label_idx])
+metric.compute(predictions=[all_predictions], references=[all_labels])
+```
+
+
+```python out
+{'LOC': {'precision': 0.91, 'recall': 0.92, 'f1': 0.91, 'number': 1668},
+ 'MISC': {'precision': 0.70, 'recall': 0.79, 'f1': 0.74, 'number': 702},
+ 'ORG': {'precision': 0.85, 'recall': 0.90, 'f1': 0.88, 'number': 1661},
+ 'PER': {'precision': 0.95, 'recall': 0.95, 'f1': 0.95, 'number': 1617},
+ 'overall_precision': 0.87,
+ 'overall_recall': 0.91,
+ 'overall_f1': 0.89,
+ 'overall_accuracy': 0.97}
+```
+
+Cum s-a descurcat modelul tău, comparativ cu al nostru? Dacă ați obținut cifre similare, antrenarea a fost un succes!
+
+{/if}
+
+{#if fw === 'pt'}
+
+### Definirea modelului[[defining-the-model]]
+
+Deoarece lucrăm la o problemă de clasificare a tokenilor, vom utiliza clasa `AutoModelForTokenClassification`. Principalul lucru de care trebuie să ne amintim atunci când definim acest model este să transmitem informații privind numărul de labeluri pe care le avem. Cel mai simplu mod de a face acest lucru este să transmiteți acest număr cu argumentul `num_labels`, dar dacă dorim un inferencea widget frumos care să funcționeze ca cel pe care l-am văzut la începutul acestei secțiuni, este mai bine să setați în schimb corespondențele corecte ale labelurilor.
+
+Acestea ar trebui să fie stabilite de două dicționare, `id2label` și `label2id`, care conțin corespondențele de la ID la labeluri și viceversa:
+
+```py
+id2label = {i: label for i, label in enumerate(label_names)}
+label2id = {v: k for k, v in id2label.items()}
+```
+
+Acum putem doar să le transmitem metodei `AutoModelForTokenClassification.from_pretrained()`, iar acestea vor fi setate în configurația modelului și apoi salvate și încărcate corespunzător în Hub:
+
+```py
+from transformers import AutoModelForTokenClassification
+
+model = AutoModelForTokenClassification.from_pretrained(
+    model_checkpoint,
+    id2label=id2label,
+    label2id=label2id,
+)
+```
+
+La fel ca atunci când am definit `AutoModelForSequenceClassification` în [Capitolul 3](/course/chapter3), crearea modelului emite un avertisment că unele weights nu au fost utilizate (cele din headul de antrenare) și alte weights sunt inițializate aleatoriu (cele din headul de clasificare a tokenilor noi) și că acest model ar trebui să fie format. Vom face acest lucru într-un minut, dar mai întâi să verificăm de două ori că modelul nostru are numărul corect de labeluri:
+
+```python
+model.config.num_labels
+```
+
+```python out
+9
+```
+
+<Tip warning={true}>
+
+⚠️ Dacă aveți un model cu un număr greșit de labeluri, veți primi o eroare obscură atunci când apelați metoda `Trainer.train()` mai târziu (ceva de genul "CUDA error: device-side assert triggered"). Aceasta este cauza numărul unu a erorilor raportate de utilizatori pentru astfel de erori, așa că asigurați-vă că faceți această verificare pentru a confirma că aveți numărul de labeluri așteptat.
+
+</Tip>
+
+### Fine-tuningul modelului[[fine-tuning-the-model]]
+
+Acum suntem gata să ne antrenăm modelul! Trebuie doar să facem ultimele două lucruri înainte de a defini modelul nostru `Trainer`: să ne conectăm la Hugging Face și să definim argumentele de antrenare. Dacă lucrați într-un notebook, există o funcție convenabilă pentru a vă ajuta cu acest lucru:
+
+```python
+from huggingface_hub import notebook_login
+
+notebook_login()
+```
+
+Aceasta va afișa un widget în care puteți introduce datele tale de autentificare Hugging Face.
+
+Dacă nu lucrați într-un notebook, tastați următoarea linie în terminal:
+
+```bash
+huggingface-cli login
+```
+
+Odată făcut acest lucru, putem defini`TrainingArguments`:
+
+```python
+from transformers import TrainingArguments
+
+args = TrainingArguments(
+    "bert-finetuned-ner",
+    evaluation_strategy="epoch",
+    save_strategy="epoch",
+    learning_rate=2e-5,
+    num_train_epochs=3,
+    weight_decay=0.01,
+    push_to_hub=True,
+)
+```
+
+Ați mai văzut cele mai multe dintre acestea: stabilim niște hiperparametri (cum ar fi learning rate, numărul de epoci pentru care să ne antrenăm și weights decay) și specificăm `push_to_hub=True` pentru a indica faptul că dorim să salvăm modelul și să îl evaluăm la sfârșitul fiecărei epoci și că dorim să încărcăm rezultatele noastre în Model Hub. Rețineți că puteți specifica numele repositoriului către care doriți să faceți push cu argumentul `hub_model_id` (în special, va trebui să utilizați acest argument pentru a face push către o organizație). De exemplu, atunci când am trimis modelul către organizația [`huggingface-course`](https://huggingface.co/huggingface-course), am adăugat `hub_model_id="huggingface-course/bert-finetuned-ner"` la `TrainingArguments`. În mod implicit, repositoriul utilizat va fi în namespaceul tău și denumit după output directory-ul pe care l-ați setat, deci în cazul nostru va fi `"sgugger/bert-finetuned-ner"`.
+
+<Tip>
+
+💡 Dacă output directory-ul pe care îl utilizați există deja, acesta trebuie să fie o clonă locală a repositoriul către care doriți să faceți push. Dacă nu este așa, veți primi o eroare la definirea `Trainer` și va trebui să setați un nume nou.
+
+</Tip>
+
+În final, transmitem totul către `Trainer` și lansăm antrenarea:
+
+```python
+from transformers import Trainer
+
+trainer = Trainer(
+    model=model,
+    args=args,
+    train_dataset=tokenized_datasets["train"],
+    eval_dataset=tokenized_datasets["validation"],
+    data_collator=data_collator,
+    compute_metrics=compute_metrics,
+    tokenizer=tokenizer,
+)
+trainer.train()
+```
+
+Rețineți că, în timpul antrenării, de fiecare dată când modelul este salvat (aici, la fiecare epocă), acesta este încărcat pe Hub în fundal. În acest fel, veți putea să reluați antrenareape o altă mașină, dacă este necesar.
+
+Odată ce antrenamentul este complet, folosim metoda `push_to_hub()` pentru a ne asigura că încărcăm cea mai recentă versiune a modelului:
+
+```py
+trainer.push_to_hub(commit_message="Training complete")
+```
+
+Această comandă returnează URL-ul comitului pe care tocmai l-ai făcut, dacă doriți să o inspectați:
+
+```python out
+'https://huggingface.co/sgugger/bert-finetuned-ner/commit/26ab21e5b1568f9afeccdaed2d8715f571d786ed'
+```
+
+De asemenea, `Trainer` redactează un model card cu toate rezultatele evaluării și o încarcă. În acest stadiu, puteți utiliza inference widgetul de pe Model Hub pentru a testa modelul și a-l partaja cu prietenii. Ați făcut fine-tune cu succes un model pentru o sarcină de clasificare a tokenilor - felicitări!
+
+Dacă doriți să vă scufundați puțin mai profund în bucla de antrenare, vă vom arăta acum cum să faceți același lucru utilizând 🤗 Accelerate.
+
+## Un training loop personalizat[[a-custom-training-loop]]
+
+Să aruncăm acum o privire la training loopul complet, astfel încât să puteți personaliza cu ușurință părțile de care aveți nevoie. Va semăna foarte mult cu ceea ce am făcut în [Capitolul 3](/course/chapter3/4), cu câteva modificări pentru evaluare.
+
+### Pregătiți totul pentru antrenare[[preparing-everything-for-training]]
+
+Mai întâi trebuie să construim `DataLoader`s din dataseturile noastre. Vom reutiliza `data_collator` ca un `collate_fn` și vom amesteca setul de antrenare, dar nu și setul de validare:
+
+```py
+from torch.utils.data import DataLoader
+
+train_dataloader = DataLoader(
+    tokenized_datasets["train"],
+    shuffle=True,
+    collate_fn=data_collator,
+    batch_size=8,
+)
+eval_dataloader = DataLoader(
+    tokenized_datasets["validation"], collate_fn=data_collator, batch_size=8
+)
+```
+
+În continuare, reinstanțiem modelul, pentru a ne asigura că nu continuăm fine-tuningul de dinainte, ci pornim din nou de la modelul preantrenat BERT:
+
+```py
+model = AutoModelForTokenClassification.from_pretrained(
+    model_checkpoint,
+    id2label=id2label,
+    label2id=label2id,
+)
+```
+
+Atunci vom avea nevoie de un optimizator. Vom folosi clasicul `AdamW`, care este ca `Adam`, dar cu o corecție în modul în care se aplică weight decay-ul:
+
+```py
+from torch.optim import AdamW
+
+optimizer = AdamW(model.parameters(), lr=2e-5)
+```
+
+Odată ce avem toate aceste obiecte, le putem trimite la metoda `accelerator.prepare()`:
+
+```py
+from accelerate import Accelerator
+
+accelerator = Accelerator()
+model, optimizer, train_dataloader, eval_dataloader = accelerator.prepare(
+    model, optimizer, train_dataloader, eval_dataloader
+)
+```
+
+<Tip>
+
+🚨 Dacă vă antrenați pe un TPU, va trebui să mutați tot codul începând de la celula de mai sus într-o funcție de antrenament dedicată. Consultați [Capitolul 3](/course/chapter3) pentru mai multe detalii.
+
+</Tip>
+
+Acum că am trimis `train_dataloader` la `accelerator.prepare()`, putem utiliza lungimea acestuia pentru a calcula numărul de pași de antrenare. Rețineți că ar trebui să facem întotdeauna acest lucru după ce pregătim dataloaderul, deoarece această metodă îi va modifica lungimea. Utilizăm un classic liner schedule de la rata de învățare la 0:
+
+```py
+from transformers import get_scheduler
+
+num_train_epochs = 3
+num_update_steps_per_epoch = len(train_dataloader)
+num_training_steps = num_train_epochs * num_update_steps_per_epoch
+
+lr_scheduler = get_scheduler(
+    "linear",
+    optimizer=optimizer,
+    num_warmup_steps=0,
+    num_training_steps=num_training_steps,
+)
+```
+
+În cele din urmă, pentru a trimite modelul nostru către Hub, va trebui să creăm un obiect `Repository` într-un folder de lucru. În primul rând, conectați-vă la Hugging Face, dacă nu sunteți deja conectat. Vom determina numele repositoriului pornind de la ID-ul modelului pe care dorim să îl dăm modelului nostru (nu ezitați să înlocuiți `repo_name` cu propriul nume; trebuie doar să conțină numele vostru de utilizator, ceea ce face funcția `get_full_repo_name()`):
+
+```py
+from huggingface_hub import Repository, get_full_repo_name
+
+model_name = "bert-finetuned-ner-accelerate"
+repo_name = get_full_repo_name(model_name)
+repo_name
+```
+
+```python out
+'sgugger/bert-finetuned-ner-accelerate'
+```
+
+Apoi putem clona acel repositoriu într-un folder local. Dacă există deja, acest folder local ar trebui să fie o clonă existentă a repositoriului cu care lucrăm:
+
+```py
+output_dir = "bert-finetuned-ner-accelerate"
+repo = Repository(output_dir, clone_from=repo_name)
+```
+
+Acum putem încărca orice salvăm în `output_dir` prin apelarea metodei `repo.push_to_hub()`. Acest lucru ne va ajuta să încărcăm modelele intermediare la sfârșitul fiecărei epoci.
+
+### Loopul de antrenare[[training-loop]]
+
+Acum suntem pregătiți să scriem bucla de antrenare completă. Pentru a simplifica partea sa de evaluare, definim funcția `postprocess()` care preia predicțiile și labelurile și le convertește în liste de șiruri de caractere, așa cum se așteaptă obiectul nostru `metric`:
+
+```py
+def postprocess(predictions, labels):
+    predictions = predictions.detach().cpu().clone().numpy()
+    labels = labels.detach().cpu().clone().numpy()
+
+    # Remove ignored index (special tokens) and convert to labels
+    true_labels = [[label_names[l] for l in label if l != -100] for label in labels]
+    true_predictions = [
+        [label_names[p] for (p, l) in zip(prediction, label) if l != -100]
+        for prediction, label in zip(predictions, labels)
+    ]
+    return true_labels, true_predictions
+```
+
+Apoi putem scrie bucla de antrenare. După definirea unei bare de progres pentru a urmări modul în care decurge antrenarea, bucla are trei părți:
+
+- Antrenarea în sine, care este iterația clasică peste `train_dataloader`, trecerea înainte prin model, apoi trecerea înapoi și pasul optimizatorului.
+- Evaluarea, în care există o noutate după obținerea outputurilor modelului nostru pe un batch: din moment ce două procese pot ar fi putut face padding inputurilor și labelurile la forme diferite, trebuie să folosim `accelerator.pad_across_processes()` pentru a face predicțiile și labelurile să aibă aceeași formă înainte de a apela metoda `gather()`. Dacă nu facem acest lucru, evaluarea va da eroare sau se va bloca pentru totdeauna. Apoi trimitem rezultatele la `metric.add_batch()` și apelăm `metric.compute()` odată ce bucla de evaluare s-a încheiat.
+- Salvarea și încărcarea, unde mai întâi salvăm modelul și tokenizerul, apoi apelăm `repo.push_to_hub()`. Observați că folosim argumentul `blocking=False` pentru a spune bibliotecii 🤗 Hub să efectueze push-ul într-un proces asincron. În acest fel, antrenamentul continuă normal, iar această instrucțiune (lungă) este executată în fundal.
+
+Iată codul complet pentru bucla de antrenare:
+
+```py
+from tqdm.auto import tqdm
+import torch
+
+progress_bar = tqdm(range(num_training_steps))
+
+for epoch in range(num_train_epochs):
+    # Training
+    model.train()
+    for batch in train_dataloader:
+        outputs = model(**batch)
+        loss = outputs.loss
+        accelerator.backward(loss)
+
+        optimizer.step()
+        lr_scheduler.step()
+        optimizer.zero_grad()
+        progress_bar.update(1)
+
+    # Evaluation
+    model.eval()
+    for batch in eval_dataloader:
+        with torch.no_grad():
+            outputs = model(**batch)
+
+        predictions = outputs.logits.argmax(dim=-1)
+        labels = batch["labels"]
+
+        # Necessary to pad predictions and labels for being gathered
+        predictions = accelerator.pad_across_processes(predictions, dim=1, pad_index=-100)
+        labels = accelerator.pad_across_processes(labels, dim=1, pad_index=-100)
+
+        predictions_gathered = accelerator.gather(predictions)
+        labels_gathered = accelerator.gather(labels)
+
+        true_predictions, true_labels = postprocess(predictions_gathered, labels_gathered)
+        metric.add_batch(predictions=true_predictions, references=true_labels)
+
+    results = metric.compute()
+    print(
+        f"epoch {epoch}:",
+        {
+            key: results[f"overall_{key}"]
+            for key in ["precision", "recall", "f1", "accuracy"]
+        },
+    )
+
+    # Save and upload
+    accelerator.wait_for_everyone()
+    unwrapped_model = accelerator.unwrap_model(model)
+    unwrapped_model.save_pretrained(output_dir, save_function=accelerator.save)
+    if accelerator.is_main_process:
+        tokenizer.save_pretrained(output_dir)
+        repo.push_to_hub(
+            commit_message=f"Training in progress epoch {epoch}", blocking=False
+        )
+```
+
+În cazul în care este prima dată când vedeți un model salvat cu 🤗 Accelerate, să ne oprim puțin pentru a inspecta cele trei linii de cod care îl însoțesc:
+
+```py
+accelerator.wait_for_everyone()
+unwrapped_model = accelerator.unwrap_model(model)
+unwrapped_model.save_pretrained(output_dir, save_function=accelerator.save)
+```
+
+Prima linie se explică de la sine: aceasta spune tuturor proceselor să aștepte până când toată lumea se află în etapa respectivă înainte de a continua. Acest lucru are rolul de a ne asigura că avem același model în fiecare proces înainte de a salva. Apoi luăm `unwrapped_model`, care este modelul de bază pe care l-am definit. Metoda `accelerator.prepare()` modifică modelul pentru a funcționa în antrenarea distribuită, deci nu va mai avea metoda `save_pretrained()`; metoda `accelerator.unwrap_model()` anulează acest pas. În cele din urmă, apelăm metoda `save_pretrained()`, dar îi spunem să folosească metoda `accelerator.save()` în loc de `torch.save()`.
+
+Odată făcut acest lucru, ar trebui să aveți un model care produce rezultate destul de asemănătoare cu cel antrenat cu `Trainer`. Puteți verifica modelul pe care l-am antrenat folosind acest cod la [*huggingface-course/bert-finetuned-ner-accelerate*] (https://huggingface.co/huggingface-course/bert-finetuned-ner-accelerate). Și dacă doriți să testați orice modificări ale buclei de antrenare, le puteți implementa direct prin editarea codului prezentat mai sus!
+
+
+{/if}
+
+## Utilizarea model fine-tuned[[using-the-fine-tuned-model]]
+
+V-am arătat deja cum puteți utiliza modelul pe care l-am ajustat pe Model Hub cu inference widget. Pentru a-l utiliza la nivel local într-un `pipeline`, trebuie doar să specificați identificatorul de model corespunzător:
+
+```py
+from transformers import pipeline
+
+# Replace this with your own checkpoint
+model_checkpoint = "huggingface-course/bert-finetuned-ner"
+token_classifier = pipeline(
+    "token-classification", model=model_checkpoint, aggregation_strategy="simple"
+)
+token_classifier("My name is Sylvain and I work at Hugging Face in Brooklyn.")
+```
+
+```python out
+[{'entity_group': 'PER', 'score': 0.9988506, 'word': 'Sylvain', 'start': 11, 'end': 18},
+ {'entity_group': 'ORG', 'score': 0.9647625, 'word': 'Hugging Face', 'start': 33, 'end': 45},
+ {'entity_group': 'LOC', 'score': 0.9986118, 'word': 'Brooklyn', 'start': 49, 'end': 57}]
+```
+
+Grozav! Modelul nostru funcționează la fel de bine ca cel implicit pentru aceast pipeline!
\ No newline at end of file
diff --git a/chapters/ro/chapter7/3.mdx b/chapters/ro/chapter7/3.mdx
new file mode 100644
index 000000000..de3da9a1f
--- /dev/null
+++ b/chapters/ro/chapter7/3.mdx
@@ -0,0 +1,1044 @@
+<FrameworkSwitchCourse {fw} />
+
+# Fine-tuning a masked language model[[fine-tuning-a-masked-language-model]]
+
+{#if fw === 'pt'}
+
+<CourseFloatingBanner chapter={7}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter7/section3_pt.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter7/section3_pt.ipynb"},
+]} />
+
+{:else}
+
+<CourseFloatingBanner chapter={7}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter7/section3_tf.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter7/section3_tf.ipynb"},
+]} />
+
+{/if}
+
+For many NLP applications involving Transformer models, you can simply take a pretrained model from the Hugging Face Hub and fine-tune it directly on your data for the task at hand. Provided that the corpus used for pretraining is not too different from the corpus used for fine-tuning, transfer learning will usually produce good results. 
+
+However, there are a few cases where you'll want to first fine-tune the language models on your data, before training a task-specific head. For example, if your dataset contains legal contracts or scientific articles, a vanilla Transformer model like BERT will typically treat the domain-specific words in your corpus as rare tokens, and the resulting performance may be less than satisfactory. By fine-tuning the language model on in-domain data you can boost the performance of many downstream tasks, which means you usually only have to do this step once!
+
+This process of fine-tuning a pretrained language model on in-domain data is usually called _domain adaptation_. It was popularized in 2018 by [ULMFiT](https://arxiv.org/abs/1801.06146), which was one of the first neural architectures (based on LSTMs) to make transfer learning really work for NLP. An example of domain adaptation with ULMFiT is shown in the image below; in this section we'll do something similar, but with a Transformer instead of an LSTM!
+
+<div class="flex justify-center">
+<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/ulmfit.svg" alt="ULMFiT."/>
+<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/ulmfit-dark.svg" alt="ULMFiT."/>
+</div>
+
+By the end of this section you'll have a [masked language model](https://huggingface.co/huggingface-course/distilbert-base-uncased-finetuned-imdb?text=This+is+a+great+%5BMASK%5D.) on the Hub that can autocomplete sentences as shown below:
+
+<iframe src="https://course-demos-distilbert-base-uncased-finetuned-imdb.hf.space" frameBorder="0" height="300" title="Gradio app" class="block dark:hidden container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
+
+Let's dive in!
+
+<Youtube id="mqElG5QJWUg"/>
+
+<Tip>
+
+🙋 If the terms "masked language modeling" and "pretrained model" sound unfamiliar to you, go check out [Chapter 1](/course/chapter1), where we explain all these core concepts, complete with videos!
+
+</Tip>
+
+## Picking a pretrained model for masked language modeling[[picking-a-pretrained-model-for-masked-language-modeling]]
+
+To get started, let's pick a suitable pretrained model for masked language modeling. As shown in the following screenshot, you can find a list of candidates by applying the "Fill-Mask" filter on the [Hugging Face Hub](https://huggingface.co/models?pipeline_tag=fill-mask&sort=downloads):
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/mlm-models.png" alt="Hub models." width="80%"/>
+</div>
+
+Although the BERT and RoBERTa family of models are the most downloaded, we'll use a model called [DistilBERT](https://huggingface.co/distilbert-base-uncased) 
+that can be trained much faster with little to no loss in downstream performance. This model was trained using a special technique called [_knowledge distillation_](https://en.wikipedia.org/wiki/Knowledge_distillation), where a large "teacher model" like BERT is used to guide the training of a "student model" that has far fewer parameters. An explanation of the details of knowledge distillation would take us too far afield in this section, but if you're interested you can read all about it in [_Natural Language Processing with Transformers_](https://www.oreilly.com/library/view/natural-language-processing/9781098136789/) (colloquially known as the Transformers textbook).
+
+{#if fw === 'pt'}
+
+Let's go ahead and download DistilBERT using the `AutoModelForMaskedLM` class:
+
+```python
+from transformers import AutoModelForMaskedLM
+
+model_checkpoint = "distilbert-base-uncased"
+model = AutoModelForMaskedLM.from_pretrained(model_checkpoint)
+```
+
+We can see how many parameters this model has by calling the `num_parameters()` method:
+
+```python
+distilbert_num_parameters = model.num_parameters() / 1_000_000
+print(f"'>>> DistilBERT number of parameters: {round(distilbert_num_parameters)}M'")
+print(f"'>>> BERT number of parameters: 110M'")
+```
+
+```python out
+'>>> DistilBERT number of parameters: 67M'
+'>>> BERT number of parameters: 110M'
+```
+
+{:else}
+
+Let's go ahead and download DistilBERT using the `AutoModelForMaskedLM` class:
+
+```python
+from transformers import TFAutoModelForMaskedLM
+
+model_checkpoint = "distilbert-base-uncased"
+model = TFAutoModelForMaskedLM.from_pretrained(model_checkpoint)
+```
+
+We can see how many parameters this model has by calling the `summary()` method:
+
+```python
+model.summary()
+```
+
+```python out
+Model: "tf_distil_bert_for_masked_lm"
+_________________________________________________________________
+Layer (type)                 Output Shape              Param #   
+=================================================================
+distilbert (TFDistilBertMain multiple                  66362880  
+_________________________________________________________________
+vocab_transform (Dense)      multiple                  590592    
+_________________________________________________________________
+vocab_layer_norm (LayerNorma multiple                  1536      
+_________________________________________________________________
+vocab_projector (TFDistilBer multiple                  23866170  
+=================================================================
+Total params: 66,985,530
+Trainable params: 66,985,530
+Non-trainable params: 0
+_________________________________________________________________
+```
+
+{/if}
+
+With around 67 million parameters, DistilBERT is approximately two times smaller than the BERT base model, which roughly translates into a two-fold speedup in training -- nice! Let's now see what kinds of tokens this model predicts are the most likely completions of a small sample of text:
+
+```python
+text = "This is a great [MASK]."
+```
+
+As humans, we can imagine many possibilities for the `[MASK]` token, such as "day", "ride", or "painting". For pretrained models, the predictions depend on the corpus the model was trained on, since it learns to pick up the statistical patterns present in the data. Like BERT, DistilBERT was pretrained on the [English Wikipedia](https://huggingface.co/datasets/wikipedia) and [BookCorpus](https://huggingface.co/datasets/bookcorpus) datasets, so we expect the predictions for `[MASK]` to reflect these domains. To predict the mask we need DistilBERT's tokenizer to produce the inputs for the model, so let's download that from the Hub as well:
+
+```python
+from transformers import AutoTokenizer
+
+tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
+```
+
+With a tokenizer and a model, we can now pass our text example to the model, extract the logits, and print out the top 5 candidates:
+
+{#if fw === 'pt'}
+
+```python
+import torch
+
+inputs = tokenizer(text, return_tensors="pt")
+token_logits = model(**inputs).logits
+# Find the location of [MASK] and extract its logits
+mask_token_index = torch.where(inputs["input_ids"] == tokenizer.mask_token_id)[1]
+mask_token_logits = token_logits[0, mask_token_index, :]
+# Pick the [MASK] candidates with the highest logits
+top_5_tokens = torch.topk(mask_token_logits, 5, dim=1).indices[0].tolist()
+
+for token in top_5_tokens:
+    print(f"'>>> {text.replace(tokenizer.mask_token, tokenizer.decode([token]))}'")
+```
+
+{:else}
+
+```python
+import numpy as np
+import tensorflow as tf
+
+inputs = tokenizer(text, return_tensors="np")
+token_logits = model(**inputs).logits
+# Find the location of [MASK] and extract its logits
+mask_token_index = np.argwhere(inputs["input_ids"] == tokenizer.mask_token_id)[0, 1]
+mask_token_logits = token_logits[0, mask_token_index, :]
+# Pick the [MASK] candidates with the highest logits
+# We negate the array before argsort to get the largest, not the smallest, logits
+top_5_tokens = np.argsort(-mask_token_logits)[:5].tolist()
+
+for token in top_5_tokens:
+    print(f">>> {text.replace(tokenizer.mask_token, tokenizer.decode([token]))}")
+```
+
+{/if}
+
+```python out
+'>>> This is a great deal.'
+'>>> This is a great success.'
+'>>> This is a great adventure.'
+'>>> This is a great idea.'
+'>>> This is a great feat.'
+```
+
+We can see from the outputs that the model's predictions refer to everyday terms, which is perhaps not surprising given the foundation of English Wikipedia. Let's see how we can change this domain to something a bit more niche -- highly polarized movie reviews!
+
+
+## The dataset[[the-dataset]]
+
+To showcase domain adaptation, we'll use the famous [Large Movie Review Dataset](https://huggingface.co/datasets/imdb) (or IMDb for short), which is a corpus of movie reviews that is often used to benchmark sentiment analysis models. By fine-tuning DistilBERT on this corpus, we expect the language model will adapt its vocabulary from the factual data of Wikipedia that it was pretrained on to the more subjective elements of movie reviews. We can get the data from the Hugging Face Hub with the `load_dataset()` function from 🤗 Datasets:
+
+```python
+from datasets import load_dataset
+
+imdb_dataset = load_dataset("imdb")
+imdb_dataset
+```
+
+```python out
+DatasetDict({
+    train: Dataset({
+        features: ['text', 'label'],
+        num_rows: 25000
+    })
+    test: Dataset({
+        features: ['text', 'label'],
+        num_rows: 25000
+    })
+    unsupervised: Dataset({
+        features: ['text', 'label'],
+        num_rows: 50000
+    })
+})
+```
+
+We can see that the `train` and `test` splits each consist of 25,000 reviews, while there is an unlabeled split called `unsupervised` that contains 50,000 reviews. Let's take a look at a few samples to get an idea of what kind of text we're dealing with. As we've done in previous chapters of the course, we'll chain the `Dataset.shuffle()` and `Dataset.select()` functions to create a random sample:
+
+```python
+sample = imdb_dataset["train"].shuffle(seed=42).select(range(3))
+
+for row in sample:
+    print(f"\n'>>> Review: {row['text']}'")
+    print(f"'>>> Label: {row['label']}'")
+```
+
+```python out
+
+'>>> Review: This is your typical Priyadarshan movie--a bunch of loony characters out on some silly mission. His signature climax has the entire cast of the film coming together and fighting each other in some crazy moshpit over hidden money. Whether it is a winning lottery ticket in Malamaal Weekly, black money in Hera Pheri, "kodokoo" in Phir Hera Pheri, etc., etc., the director is becoming ridiculously predictable. Don\'t get me wrong; as clichéd and preposterous his movies may be, I usually end up enjoying the comedy. However, in most his previous movies there has actually been some good humor, (Hungama and Hera Pheri being noteworthy ones). Now, the hilarity of his films is fading as he is using the same formula over and over again.<br /><br />Songs are good. Tanushree Datta looks awesome. Rajpal Yadav is irritating, and Tusshar is not a whole lot better. Kunal Khemu is OK, and Sharman Joshi is the best.'
+'>>> Label: 0'
+
+'>>> Review: Okay, the story makes no sense, the characters lack any dimensionally, the best dialogue is ad-libs about the low quality of movie, the cinematography is dismal, and only editing saves a bit of the muddle, but Sam" Peckinpah directed the film. Somehow, his direction is not enough. For those who appreciate Peckinpah and his great work, this movie is a disappointment. Even a great cast cannot redeem the time the viewer wastes with this minimal effort.<br /><br />The proper response to the movie is the contempt that the director San Peckinpah, James Caan, Robert Duvall, Burt Young, Bo Hopkins, Arthur Hill, and even Gig Young bring to their work. Watch the great Peckinpah films. Skip this mess.'
+'>>> Label: 0'
+
+'>>> Review: I saw this movie at the theaters when I was about 6 or 7 years old. I loved it then, and have recently come to own a VHS version. <br /><br />My 4 and 6 year old children love this movie and have been asking again and again to watch it. <br /><br />I have enjoyed watching it again too. Though I have to admit it is not as good on a little TV.<br /><br />I do not have older children so I do not know what they would think of it. <br /><br />The songs are very cute. My daughter keeps singing them over and over.<br /><br />Hope this helps.'
+'>>> Label: 1'
+```
+
+Yep, these are certainly movie reviews, and if you're old enough you may even understand the comment in the last review about owning a VHS version 😜! Although we won't need the labels for language modeling, we can already see that a `0` denotes a negative review, while a `1` corresponds to a positive one.
+
+<Tip>
+
+✏️ **Try it out!** Create a random sample of the `unsupervised` split and verify that the labels are neither `0` nor `1`. While you're at it, you could also check that the labels in the `train` and `test` splits are indeed `0` or `1` -- this is a useful sanity check that every NLP practitioner should perform at the start of a new project!
+
+</Tip>
+
+Now that we've had a quick look at the data, let's dive into preparing it for masked language modeling. As we'll see, there are some additional steps that one needs to take compared to the sequence classification tasks we saw in [Chapter 3](/course/chapter3). Let's go!
+
+## Preprocessing the data[[preprocessing-the-data]]
+
+<Youtube id="8PmhEIXhBvI"/>
+
+For both auto-regressive and masked language modeling, a common preprocessing step is to concatenate all the examples and then split the whole corpus into chunks of equal size. This is quite different from our usual approach, where we simply tokenize individual examples. Why concatenate everything together? The reason is that individual examples might get truncated if they're too long, and that would result in losing information that might be useful for the language modeling task!
+
+So to get started, we'll first tokenize our corpus as usual, but _without_ setting the `truncation=True` option in our tokenizer. We'll also grab the word IDs if they are available ((which they will be if we're using a fast tokenizer, as described in [Chapter 6](/course/chapter6/3)), as we will need them later on to do whole word masking. We'll wrap this in a simple function, and while we're at it we'll remove the `text` and `label` columns since we don't need them any longer:
+
+```python
+def tokenize_function(examples):
+    result = tokenizer(examples["text"])
+    if tokenizer.is_fast:
+        result["word_ids"] = [result.word_ids(i) for i in range(len(result["input_ids"]))]
+    return result
+
+
+# Use batched=True to activate fast multithreading!
+tokenized_datasets = imdb_dataset.map(
+    tokenize_function, batched=True, remove_columns=["text", "label"]
+)
+tokenized_datasets
+```
+
+```python out
+DatasetDict({
+    train: Dataset({
+        features: ['attention_mask', 'input_ids', 'word_ids'],
+        num_rows: 25000
+    })
+    test: Dataset({
+        features: ['attention_mask', 'input_ids', 'word_ids'],
+        num_rows: 25000
+    })
+    unsupervised: Dataset({
+        features: ['attention_mask', 'input_ids', 'word_ids'],
+        num_rows: 50000
+    })
+})
+```
+
+Since DistilBERT is a BERT-like model, we can see that the encoded texts consist of the `input_ids` and `attention_mask` that we've seen in other chapters, as well as the `word_ids` we added. 
+
+Now that we've tokenized our movie reviews, the next step is to group them all together and split the result into chunks. But how big should these chunks be? This will ultimately be determined by the amount of GPU memory that you have available, but a good starting point is to see what the model's maximum context size is. This can be inferred by inspecting the `model_max_length` attribute of the tokenizer:
+
+```python
+tokenizer.model_max_length
+```
+
+```python out
+512
+```
+
+This value is derived from the *tokenizer_config.json* file associated with a checkpoint; in this case we can see that the context size is 512 tokens, just like with BERT.
+
+<Tip>
+
+✏️ **Try it out!** Some Transformer models, like [BigBird](https://huggingface.co/google/bigbird-roberta-base) and [Longformer](hf.co/allenai/longformer-base-4096), have a much longer context length than BERT and other early Transformer models. Instantiate the tokenizer for one of these checkpoints and verify that the `model_max_length` agrees with what's quoted on its model card.
+
+</Tip>
+
+So, in order to run our experiments on GPUs like those found on Google Colab, we'll pick something a bit smaller that can fit in memory:
+
+```python
+chunk_size = 128
+```
+
+<Tip warning={true}>
+
+Note that using a small chunk size can be detrimental in real-world scenarios, so you should use a size that corresponds to the use case you will apply your model to.
+
+</Tip>
+
+Now comes the fun part. To show how the concatenation works, let's take a few reviews from our tokenized training set and print out the number of tokens per review:
+
+```python
+# Slicing produces a list of lists for each feature
+tokenized_samples = tokenized_datasets["train"][:3]
+
+for idx, sample in enumerate(tokenized_samples["input_ids"]):
+    print(f"'>>> Review {idx} length: {len(sample)}'")
+```
+
+```python out
+'>>> Review 0 length: 200'
+'>>> Review 1 length: 559'
+'>>> Review 2 length: 192'
+```
+
+We can then concatenate all these examples with a simple dictionary comprehension, as follows:
+
+```python
+concatenated_examples = {
+    k: sum(tokenized_samples[k], []) for k in tokenized_samples.keys()
+}
+total_length = len(concatenated_examples["input_ids"])
+print(f"'>>> Concatenated reviews length: {total_length}'")
+```
+
+```python out
+'>>> Concatenated reviews length: 951'
+```
+
+Great, the total length checks out -- so now let's split the concatenated reviews into chunks of the size given by `chunk_size`. To do so, we iterate over the features in `concatenated_examples` and use a list comprehension to create slices of each feature. The result is a dictionary of chunks for each feature:
+
+```python
+chunks = {
+    k: [t[i : i + chunk_size] for i in range(0, total_length, chunk_size)]
+    for k, t in concatenated_examples.items()
+}
+
+for chunk in chunks["input_ids"]:
+    print(f"'>>> Chunk length: {len(chunk)}'")
+```
+
+```python out
+'>>> Chunk length: 128'
+'>>> Chunk length: 128'
+'>>> Chunk length: 128'
+'>>> Chunk length: 128'
+'>>> Chunk length: 128'
+'>>> Chunk length: 128'
+'>>> Chunk length: 128'
+'>>> Chunk length: 55'
+```
+
+As you can see in this example, the last chunk will generally be smaller than the maximum chunk size. There are two main strategies for dealing with this:
+
+* Drop the last chunk if it's smaller than `chunk_size`.
+* Pad the last chunk until its length equals `chunk_size`.
+
+We'll take the first approach here, so let's wrap all of the above logic in a single function that we can apply to our tokenized datasets:
+
+```python
+def group_texts(examples):
+    # Concatenate all texts
+    concatenated_examples = {k: sum(examples[k], []) for k in examples.keys()}
+    # Compute length of concatenated texts
+    total_length = len(concatenated_examples[list(examples.keys())[0]])
+    # We drop the last chunk if it's smaller than chunk_size
+    total_length = (total_length // chunk_size) * chunk_size
+    # Split by chunks of max_len
+    result = {
+        k: [t[i : i + chunk_size] for i in range(0, total_length, chunk_size)]
+        for k, t in concatenated_examples.items()
+    }
+    # Create a new labels column
+    result["labels"] = result["input_ids"].copy()
+    return result
+```
+
+Note that in the last step of `group_texts()` we create a new `labels` column which is a copy of the `input_ids` one. As we'll see shortly, that's because in masked language modeling the objective is to predict randomly masked tokens in the input batch, and by creating a `labels` column we provide the ground truth for our language model to learn from. 
+
+Let's now apply `group_texts()` to our tokenized datasets using our trusty `Dataset.map()` function:
+
+```python
+lm_datasets = tokenized_datasets.map(group_texts, batched=True)
+lm_datasets
+```
+
+```python out
+DatasetDict({
+    train: Dataset({
+        features: ['attention_mask', 'input_ids', 'labels', 'word_ids'],
+        num_rows: 61289
+    })
+    test: Dataset({
+        features: ['attention_mask', 'input_ids', 'labels', 'word_ids'],
+        num_rows: 59905
+    })
+    unsupervised: Dataset({
+        features: ['attention_mask', 'input_ids', 'labels', 'word_ids'],
+        num_rows: 122963
+    })
+})
+```
+
+You can see that grouping and then chunking the texts has produced many more examples than our original 25,000 for the `train` and `test` splits. That's because we now have examples involving _contiguous tokens_ that span across multiple examples from the original corpus. You can see this explicitly by looking for the special `[SEP]` and `[CLS]` tokens in one of the chunks:
+
+```python
+tokenizer.decode(lm_datasets["train"][1]["input_ids"])
+```
+
+```python out
+".... at.......... high. a classic line : inspector : i'm here to sack one of your teachers. student : welcome to bromwell high. i expect that many adults of my age think that bromwell high is far fetched. what a pity that it isn't! [SEP] [CLS] homelessness ( or houselessness as george carlin stated ) has been an issue for years but never a plan to help those on the street that were once considered human who did everything from going to school, work, or vote for the matter. most people think of the homeless"
+```
+
+In this example you can see two overlapping movie reviews, one about a high school movie and the other about homelessness. Let's also check out what the labels look like for masked language modeling:
+
+```python out
+tokenizer.decode(lm_datasets["train"][1]["labels"])
+```
+
+```python out
+".... at.......... high. a classic line : inspector : i'm here to sack one of your teachers. student : welcome to bromwell high. i expect that many adults of my age think that bromwell high is far fetched. what a pity that it isn't! [SEP] [CLS] homelessness ( or houselessness as george carlin stated ) has been an issue for years but never a plan to help those on the street that were once considered human who did everything from going to school, work, or vote for the matter. most people think of the homeless"
+```
+
+As expected from our `group_texts()` function above, this looks identical to the decoded `input_ids` -- but then how can our model possibly learn anything? We're missing a key step: inserting `[MASK]` tokens at random positions in the inputs! Let's see how we can do this on the fly during fine-tuning using a special data collator.
+
+## Fine-tuning DistilBERT with the `Trainer` API[[fine-tuning-distilbert-with-the-trainer-api]]
+
+Fine-tuning a masked language model is almost identical to fine-tuning a sequence classification model, like we did in [Chapter 3](/course/chapter3). The only difference is that we need a special data collator that can randomly mask some of the tokens in each batch of texts. Fortunately, 🤗 Transformers comes prepared with a dedicated `DataCollatorForLanguageModeling` for just this task. We just have to pass it the tokenizer and an `mlm_probability` argument that specifies what fraction of the tokens to mask. We'll pick 15%, which is the amount used for BERT and a common choice in the literature:
+
+```python
+from transformers import DataCollatorForLanguageModeling
+
+data_collator = DataCollatorForLanguageModeling(tokenizer=tokenizer, mlm_probability=0.15)
+```
+
+To see how the random masking works, let's feed a few examples to the data collator. Since it expects a list of `dict`s, where each `dict` represents a single chunk of contiguous text, we first iterate over the dataset before feeding the batch to the collator. We remove the `"word_ids"` key for this data collator as it does not expect it:
+
+```python
+samples = [lm_datasets["train"][i] for i in range(2)]
+for sample in samples:
+    _ = sample.pop("word_ids")
+
+for chunk in data_collator(samples)["input_ids"]:
+    print(f"\n'>>> {tokenizer.decode(chunk)}'")
+```
+
+```python output
+'>>> [CLS] bromwell [MASK] is a cartoon comedy. it ran at the same [MASK] as some other [MASK] about school life, [MASK] as " teachers ". [MASK] [MASK] [MASK] in the teaching [MASK] lead [MASK] to believe that bromwell high\'[MASK] satire is much closer to reality than is " teachers ". the scramble [MASK] [MASK] financially, the [MASK]ful students whogn [MASK] right through [MASK] pathetic teachers\'pomp, the pettiness of the whole situation, distinction remind me of the schools i knew and their students. when i saw [MASK] episode in [MASK] a student repeatedly tried to burn down the school, [MASK] immediately recalled. [MASK]...'
+
+'>>> .... at.. [MASK]... [MASK]... high. a classic line plucked inspector : i\'[MASK] here to [MASK] one of your [MASK]. student : welcome to bromwell [MASK]. i expect that many adults of my age think that [MASK]mwell [MASK] is [MASK] fetched. what a pity that it isn\'t! [SEP] [CLS] [MASK]ness ( or [MASK]lessness as george 宇in stated )公 been an issue for years but never [MASK] plan to help those on the street that were once considered human [MASK] did everything from going to school, [MASK], [MASK] vote for the matter. most people think [MASK] the homeless'
+```
+
+Nice, it worked! We can see that the `[MASK]` token has been randomly inserted at various locations in our text. These will be the tokens which our model will have to predict during training -- and the beauty of the data collator is that it will randomize the `[MASK]` insertion with every batch! 
+
+<Tip>
+
+✏️ **Try it out!** Run the code snippet above several times to see the random masking happen in front of your very eyes! Also replace the `tokenizer.decode()` method with `tokenizer.convert_ids_to_tokens()` to see that sometimes a single token from a given word is masked, and not the others.
+
+</Tip>
+
+{#if fw === 'pt'}
+
+One side effect of random masking is that our evaluation metrics will not be deterministic when using the `Trainer`, since we use the same data collator for the training and test sets. We'll see later, when we look at fine-tuning with 🤗 Accelerate, how we can use the flexibility of a custom evaluation loop to freeze the randomness.
+
+{/if}
+
+When training models for masked language modeling, one technique that can be used is to mask whole words together, not just individual tokens. This approach is called _whole word masking_. If we want to use whole word masking, we will need to build a data collator ourselves. A data collator is just a function that takes a list of samples and converts them into a batch, so let's do this now! We'll use the word IDs computed earlier to make a map between word indices and the corresponding tokens, then randomly decide which words to mask and apply that mask on the inputs. Note that the labels are all `-100` except for the ones corresponding to mask words.
+
+{#if fw === 'pt'}
+
+```py
+import collections
+import numpy as np
+
+from transformers import default_data_collator
+
+wwm_probability = 0.2
+
+
+def whole_word_masking_data_collator(features):
+    for feature in features:
+        word_ids = feature.pop("word_ids")
+
+        # Create a map between words and corresponding token indices
+        mapping = collections.defaultdict(list)
+        current_word_index = -1
+        current_word = None
+        for idx, word_id in enumerate(word_ids):
+            if word_id is not None:
+                if word_id != current_word:
+                    current_word = word_id
+                    current_word_index += 1
+                mapping[current_word_index].append(idx)
+
+        # Randomly mask words
+        mask = np.random.binomial(1, wwm_probability, (len(mapping),))
+        input_ids = feature["input_ids"]
+        labels = feature["labels"]
+        new_labels = [-100] * len(labels)
+        for word_id in np.where(mask)[0]:
+            word_id = word_id.item()
+            for idx in mapping[word_id]:
+                new_labels[idx] = labels[idx]
+                input_ids[idx] = tokenizer.mask_token_id
+        feature["labels"] = new_labels
+
+    return default_data_collator(features)
+```
+
+{:else}
+
+```py
+import collections
+import numpy as np
+
+from transformers.data.data_collator import tf_default_data_collator
+
+wwm_probability = 0.2
+
+
+def whole_word_masking_data_collator(features):
+    for feature in features:
+        word_ids = feature.pop("word_ids")
+
+        # Create a map between words and corresponding token indices
+        mapping = collections.defaultdict(list)
+        current_word_index = -1
+        current_word = None
+        for idx, word_id in enumerate(word_ids):
+            if word_id is not None:
+                if word_id != current_word:
+                    current_word = word_id
+                    current_word_index += 1
+                mapping[current_word_index].append(idx)
+
+        # Randomly mask words
+        mask = np.random.binomial(1, wwm_probability, (len(mapping),))
+        input_ids = feature["input_ids"]
+        labels = feature["labels"]
+        new_labels = [-100] * len(labels)
+        for word_id in np.where(mask)[0]:
+            word_id = word_id.item()
+            for idx in mapping[word_id]:
+                new_labels[idx] = labels[idx]
+                input_ids[idx] = tokenizer.mask_token_id
+        feature["labels"] = new_labels
+
+    return tf_default_data_collator(features)
+```
+
+{/if}
+
+Next, we can try it on the same samples as before:
+
+```py
+samples = [lm_datasets["train"][i] for i in range(2)]
+batch = whole_word_masking_data_collator(samples)
+
+for chunk in batch["input_ids"]:
+    print(f"\n'>>> {tokenizer.decode(chunk)}'")
+```
+
+```python out
+'>>> [CLS] bromwell high is a cartoon comedy [MASK] it ran at the same time as some other programs about school life, such as " teachers ". my 35 years in the teaching profession lead me to believe that bromwell high\'s satire is much closer to reality than is " teachers ". the scramble to survive financially, the insightful students who can see right through their pathetic teachers\'pomp, the pettiness of the whole situation, all remind me of the schools i knew and their students. when i saw the episode in which a student repeatedly tried to burn down the school, i immediately recalled.....'
+
+'>>> .... [MASK] [MASK] [MASK] [MASK]....... high. a classic line : inspector : i\'m here to sack one of your teachers. student : welcome to bromwell high. i expect that many adults of my age think that bromwell high is far fetched. what a pity that it isn\'t! [SEP] [CLS] homelessness ( or houselessness as george carlin stated ) has been an issue for years but never a plan to help those on the street that were once considered human who did everything from going to school, work, or vote for the matter. most people think of the homeless'
+```
+
+<Tip>
+
+✏️ **Try it out!** Run the code snippet above several times to see the random masking happen in front of your very eyes! Also replace the `tokenizer.decode()` method with `tokenizer.convert_ids_to_tokens()` to see that the tokens from a given word are always masked together.
+
+</Tip>
+
+Now that we have two data collators, the rest of the fine-tuning steps are standard. Training can take a while on Google Colab if you're not lucky enough to score a mythical P100 GPU 😭, so we'll first downsample the size of the training set to a few thousand examples. Don't worry, we'll still get a pretty decent language model! A quick way to downsample a dataset in 🤗 Datasets is via the `Dataset.train_test_split()` function that we saw in [Chapter 5](/course/chapter5):
+
+```python
+train_size = 10_000
+test_size = int(0.1 * train_size)
+
+downsampled_dataset = lm_datasets["train"].train_test_split(
+    train_size=train_size, test_size=test_size, seed=42
+)
+downsampled_dataset
+```
+
+```python out
+DatasetDict({
+    train: Dataset({
+        features: ['attention_mask', 'input_ids', 'labels', 'word_ids'],
+        num_rows: 10000
+    })
+    test: Dataset({
+        features: ['attention_mask', 'input_ids', 'labels', 'word_ids'],
+        num_rows: 1000
+    })
+})
+```
+
+This has automatically created new `train` and `test` splits, with the training set size set to 10,000 examples and the validation set to 10% of that -- feel free to increase this if you have a beefy GPU! The next thing we need to do is log in to the Hugging Face Hub. If you're running this code in a notebook, you can do so with the following utility function:
+
+```python
+from huggingface_hub import notebook_login
+
+notebook_login()
+```
+
+which will display a widget where you can enter your credentials. Alternatively, you can run: 
+
+```
+huggingface-cli login
+```
+
+in your favorite terminal and log in there. 
+
+{#if fw === 'tf'}
+
+Once we're logged in, we can create our `tf.data` datasets. To do so, we'll use the `prepare_tf_dataset()` method, which uses our model to automatically infer which columns should go into the dataset. If you want to control exactly which columns to use, you can use the `Dataset.to_tf_dataset()` method instead. To keep things simple, we'll just use the standard data collator here, but you can also try the whole word masking collator and compare the results as an exercise:
+
+```python
+tf_train_dataset = model.prepare_tf_dataset(
+    downsampled_dataset["train"],
+    collate_fn=data_collator,
+    shuffle=True,
+    batch_size=32,
+)
+
+tf_eval_dataset = model.prepare_tf_dataset(
+    downsampled_dataset["test"],
+    collate_fn=data_collator,
+    shuffle=False,
+    batch_size=32,
+)
+```
+
+Next, we set up our training hyperparameters and compile our model. We use the `create_optimizer()` function from the 🤗 Transformers library, which gives us an `AdamW` optimizer with linear learning rate decay. We also use the model's built-in loss, which is the default when no loss is specified as an argument to `compile()`, and we set the training precision to `"mixed_float16"`. Note that if you're using a Colab GPU or other GPU that does not have accelerated float16 support, you should probably comment out that line.
+
+In addition, we set up a `PushToHubCallback` that will save the model to the Hub after each epoch. You can specify the name of the repository you want to push to with the `hub_model_id` argument (in particular, you will have to use this argument to push to an organization). For instance, to push the model to the [`huggingface-course` organization](https://huggingface.co/huggingface-course), we added `hub_model_id="huggingface-course/distilbert-finetuned-imdb"`. By default, the repository used will be in your namespace and named after the output directory you set, so in our case it will be `"lewtun/distilbert-finetuned-imdb"`.
+
+```python
+from transformers import create_optimizer
+from transformers.keras_callbacks import PushToHubCallback
+import tensorflow as tf
+
+num_train_steps = len(tf_train_dataset)
+optimizer, schedule = create_optimizer(
+    init_lr=2e-5,
+    num_warmup_steps=1_000,
+    num_train_steps=num_train_steps,
+    weight_decay_rate=0.01,
+)
+model.compile(optimizer=optimizer)
+
+# Train in mixed-precision float16
+tf.keras.mixed_precision.set_global_policy("mixed_float16")
+
+model_name = model_checkpoint.split("/")[-1]
+callback = PushToHubCallback(
+    output_dir=f"{model_name}-finetuned-imdb", tokenizer=tokenizer
+)
+```
+
+We're now ready to run `model.fit()` -- but before doing so let's briefly look at _perplexity_, which is a common metric to evaluate the performance of language models.
+
+{:else}
+
+Once we're logged in, we can specify the arguments for the `Trainer`:
+
+```python
+from transformers import TrainingArguments
+
+batch_size = 64
+# Show the training loss with every epoch
+logging_steps = len(downsampled_dataset["train"]) // batch_size
+model_name = model_checkpoint.split("/")[-1]
+
+training_args = TrainingArguments(
+    output_dir=f"{model_name}-finetuned-imdb",
+    overwrite_output_dir=True,
+    evaluation_strategy="epoch",
+    learning_rate=2e-5,
+    weight_decay=0.01,
+    per_device_train_batch_size=batch_size,
+    per_device_eval_batch_size=batch_size,
+    push_to_hub=True,
+    fp16=True,
+    logging_steps=logging_steps,
+)
+```
+
+Here we tweaked a few of the default options, including `logging_steps` to ensure we track the training loss with each epoch. We've also used `fp16=True` to enable mixed-precision training, which gives us another boost in speed. By default, the `Trainer` will remove any columns that are not part of the model's `forward()` method. This means that if you're using the whole word masking collator, you'll also need to set `remove_unused_columns=False` to ensure we don't lose the `word_ids` column during training.
+
+Note that you can specify the name of the repository you want to push to with the `hub_model_id` argument (in particular, you will have to use this argument to push to an organization). For instance, when we pushed the model to the [`huggingface-course` organization](https://huggingface.co/huggingface-course), we added `hub_model_id="huggingface-course/distilbert-finetuned-imdb"` to `TrainingArguments`. By default, the repository used will be in your namespace and named after the output directory you set, so in our case it will be `"lewtun/distilbert-finetuned-imdb"`.
+
+We now have all the ingredients to instantiate the `Trainer`. Here we just use the standard `data_collator`, but you can try the whole word masking collator and compare the results as an exercise: 
+
+```python
+from transformers import Trainer
+
+trainer = Trainer(
+    model=model,
+    args=training_args,
+    train_dataset=downsampled_dataset["train"],
+    eval_dataset=downsampled_dataset["test"],
+    data_collator=data_collator,
+    tokenizer=tokenizer,
+)
+```
+
+We're now ready to run `trainer.train()` -- but before doing so let's briefly look at _perplexity_, which is a common metric to evaluate the performance of language models.
+
+{/if}
+
+### Perplexity for language models[[perplexity-for-language-models]]
+
+<Youtube id="NURcDHhYe98"/>
+
+Unlike other tasks like text classification or question answering where we're given a labeled corpus to train on, with language modeling we don't have any explicit labels. So how do we determine what makes a good language model? Like with the autocorrect feature in your phone, a good language model is one that assigns high probabilities to sentences that are grammatically correct, and low probabilities to nonsense sentences. To give you a better idea of what this looks like, you can find whole sets of "autocorrect fails" online, where the model in a person's phone has produced some rather funny (and often inappropriate) completions! 
+
+{#if fw === 'pt'}
+
+Assuming our test set consists mostly of sentences that are grammatically correct, then one way to measure the quality of our language model is to calculate the probabilities it assigns to the next word in all the sentences of the test set. High probabilities indicates that the model is not "surprised" or "perplexed" by the unseen examples, and suggests it has learned the basic patterns of grammar in the language. There are various mathematical definitions of perplexity, but the one we'll use defines it as the exponential of the cross-entropy loss. Thus, we can calculate the perplexity of our pretrained model by using the `Trainer.evaluate()` function to compute the cross-entropy loss on the test set and then taking the exponential of the result:
+
+```python
+import math
+
+eval_results = trainer.evaluate()
+print(f">>> Perplexity: {math.exp(eval_results['eval_loss']):.2f}")
+```
+
+{:else}
+
+Assuming our test set consists mostly of sentences that are grammatically correct, then one way to measure the quality of our language model is to calculate the probabilities it assigns to the next word in all the sentences of the test set. High probabilities indicates that the model indicates that the model is not "surprised" or "perplexed" by the unseen examples, and suggests it has learned the basic patterns of grammar in the language. There are various mathematical definitions of perplexity, but the one we'll use defines it as the exponential of the cross-entropy loss. Thus, we can calculate the perplexity of our pretrained model by using the `model.evaluate()` method to compute the cross-entropy loss on the test set and then taking the exponential of the result:
+
+```python
+import math
+
+eval_loss = model.evaluate(tf_eval_dataset)
+print(f"Perplexity: {math.exp(eval_loss):.2f}")
+```
+
+{/if}
+
+```python out
+>>> Perplexity: 21.75
+```
+
+A lower perplexity score means a better language model, and we can see here that our starting model has a somewhat large value. Let's see if we can lower it by fine-tuning! To do that, we first run the training loop:
+
+{#if fw === 'pt'}
+
+```python
+trainer.train()
+```
+
+{:else}
+
+```python
+model.fit(tf_train_dataset, validation_data=tf_eval_dataset, callbacks=[callback])
+```
+
+{/if}
+
+and then compute the resulting perplexity on the test set as before:
+
+{#if fw === 'pt'}
+
+```python
+eval_results = trainer.evaluate()
+print(f">>> Perplexity: {math.exp(eval_results['eval_loss']):.2f}")
+```
+
+{:else}
+
+```python
+eval_loss = model.evaluate(tf_eval_dataset)
+print(f"Perplexity: {math.exp(eval_loss):.2f}")
+```
+
+{/if}
+
+```python out
+>>> Perplexity: 11.32
+```
+
+Nice -- this is quite a reduction in perplexity, which tells us the model has learned something about the domain of movie reviews!
+
+{#if fw === 'pt'}
+
+Once training is finished, we can push the model card with the training information to the Hub (the checkpoints are saved during training itself):
+
+```python
+trainer.push_to_hub()
+```
+
+{/if}
+
+<Tip>
+
+✏️ **Your turn!** Run the training above after changing the data collator to the whole word masking collator. Do you get better results?
+
+</Tip>
+
+{#if fw === 'pt'} 
+
+In our use case we didn't need to do anything special with the training loop, but in some cases you might need to implement some custom logic. For these applications, you can use 🤗 Accelerate -- let's take a look!
+
+## Fine-tuning DistilBERT with 🤗 Accelerate[[fine-tuning-distilbert-with-accelerate]]
+
+As we saw with the `Trainer`, fine-tuning a masked language model is very similar to the text classification example from [Chapter 3](/course/chapter3). In fact, the only subtlety is the use of a special data collator, and we've already covered that earlier in this section! 
+
+However, we saw that `DataCollatorForLanguageModeling` also applies random masking with each evaluation, so we'll see some fluctuations in our perplexity scores with each training run. One way to eliminate this source of randomness is to apply the masking _once_ on the whole test set, and then use the default data collator in 🤗 Transformers to collect the batches during evaluation. To see how this works, let's implement a simple function that applies the masking on a batch, similar to our first encounter with `DataCollatorForLanguageModeling`:
+
+```python
+def insert_random_mask(batch):
+    features = [dict(zip(batch, t)) for t in zip(*batch.values())]
+    masked_inputs = data_collator(features)
+    # Create a new "masked" column for each column in the dataset
+    return {"masked_" + k: v.numpy() for k, v in masked_inputs.items()}
+```
+
+Next, we'll apply this function to our test set and drop the unmasked columns so we can replace them with the masked ones. You can use whole word masking by replacing the `data_collator` above with the appropriate one, in which case you should remove the first line here:
+
+```py
+downsampled_dataset = downsampled_dataset.remove_columns(["word_ids"])
+eval_dataset = downsampled_dataset["test"].map(
+    insert_random_mask,
+    batched=True,
+    remove_columns=downsampled_dataset["test"].column_names,
+)
+eval_dataset = eval_dataset.rename_columns(
+    {
+        "masked_input_ids": "input_ids",
+        "masked_attention_mask": "attention_mask",
+        "masked_labels": "labels",
+    }
+)
+```
+
+We can then set up the dataloaders as usual, but we'll use the `default_data_collator` from 🤗 Transformers for the evaluation set:
+
+```python
+from torch.utils.data import DataLoader
+from transformers import default_data_collator
+
+batch_size = 64
+train_dataloader = DataLoader(
+    downsampled_dataset["train"],
+    shuffle=True,
+    batch_size=batch_size,
+    collate_fn=data_collator,
+)
+eval_dataloader = DataLoader(
+    eval_dataset, batch_size=batch_size, collate_fn=default_data_collator
+)
+```
+
+Form here, we follow the standard steps with 🤗 Accelerate. The first order of business is to load a fresh version of the pretrained model:
+
+```
+model = AutoModelForMaskedLM.from_pretrained(model_checkpoint)
+```
+
+Then we need to specify the optimizer; we'll use the standard `AdamW`:
+
+```python
+from torch.optim import AdamW
+
+optimizer = AdamW(model.parameters(), lr=5e-5)
+```
+
+With these objects, we can now prepare everything for training with the `Accelerator` object:
+
+```python
+from accelerate import Accelerator
+
+accelerator = Accelerator()
+model, optimizer, train_dataloader, eval_dataloader = accelerator.prepare(
+    model, optimizer, train_dataloader, eval_dataloader
+)
+```
+
+Now that our model, optimizer, and dataloaders are configured, we can specify the learning rate scheduler as follows:
+
+```python
+from transformers import get_scheduler
+
+num_train_epochs = 3
+num_update_steps_per_epoch = len(train_dataloader)
+num_training_steps = num_train_epochs * num_update_steps_per_epoch
+
+lr_scheduler = get_scheduler(
+    "linear",
+    optimizer=optimizer,
+    num_warmup_steps=0,
+    num_training_steps=num_training_steps,
+)
+```
+
+There is just one last thing to do before training: create a model repository on the Hugging Face Hub! We can use the 🤗 Hub library to first generate the full name of our repo:
+
+```python
+from huggingface_hub import get_full_repo_name
+
+model_name = "distilbert-base-uncased-finetuned-imdb-accelerate"
+repo_name = get_full_repo_name(model_name)
+repo_name
+```
+
+```python out
+'lewtun/distilbert-base-uncased-finetuned-imdb-accelerate'
+```
+
+then create and clone the repository using the `Repository` class from 🤗 Hub:
+
+```python
+from huggingface_hub import Repository
+
+output_dir = model_name
+repo = Repository(output_dir, clone_from=repo_name)
+```
+
+With that done, it's just a simple matter of writing out the full training and evaluation loop:
+
+```python
+from tqdm.auto import tqdm
+import torch
+import math
+
+progress_bar = tqdm(range(num_training_steps))
+
+for epoch in range(num_train_epochs):
+    # Training
+    model.train()
+    for batch in train_dataloader:
+        outputs = model(**batch)
+        loss = outputs.loss
+        accelerator.backward(loss)
+
+        optimizer.step()
+        lr_scheduler.step()
+        optimizer.zero_grad()
+        progress_bar.update(1)
+
+    # Evaluation
+    model.eval()
+    losses = []
+    for step, batch in enumerate(eval_dataloader):
+        with torch.no_grad():
+            outputs = model(**batch)
+
+        loss = outputs.loss
+        losses.append(accelerator.gather(loss.repeat(batch_size)))
+
+    losses = torch.cat(losses)
+    losses = losses[: len(eval_dataset)]
+    try:
+        perplexity = math.exp(torch.mean(losses))
+    except OverflowError:
+        perplexity = float("inf")
+
+    print(f">>> Epoch {epoch}: Perplexity: {perplexity}")
+
+    # Save and upload
+    accelerator.wait_for_everyone()
+    unwrapped_model = accelerator.unwrap_model(model)
+    unwrapped_model.save_pretrained(output_dir, save_function=accelerator.save)
+    if accelerator.is_main_process:
+        tokenizer.save_pretrained(output_dir)
+        repo.push_to_hub(
+            commit_message=f"Training in progress epoch {epoch}", blocking=False
+        )
+```
+
+```python out
+>>> Epoch 0: Perplexity: 11.397545307900472
+>>> Epoch 1: Perplexity: 10.904909330983092
+>>> Epoch 2: Perplexity: 10.729503505340409
+```
+
+Cool, we've been able to evaluate perplexity with each epoch and ensure that multiple training runs are reproducible!
+
+{/if}
+
+## Using our fine-tuned model[[using-our-fine-tuned-model]]
+
+You can interact with your fine-tuned model either by using its widget on the Hub or locally with the `pipeline` from 🤗 Transformers. Let's use the latter to download our model using the `fill-mask` pipeline:
+
+```python
+from transformers import pipeline
+
+mask_filler = pipeline(
+    "fill-mask", model="huggingface-course/distilbert-base-uncased-finetuned-imdb"
+)
+```
+
+We can then feed the pipeline our sample text of "This is a great [MASK]" and see what the top 5 predictions are:
+
+```python
+preds = mask_filler(text)
+
+for pred in preds:
+    print(f">>> {pred['sequence']}")
+```
+
+```python out
+'>>> this is a great movie.'
+'>>> this is a great film.'
+'>>> this is a great story.'
+'>>> this is a great movies.'
+'>>> this is a great character.'
+```
+
+Neat -- our model has clearly adapted its weights to predict words that are more strongly associated with movies!
+
+<Youtube id="0Oxphw4Q9fo"/>
+
+This wraps up our first experiment with training a language model. In [section 6](/course/en/chapter7/6) you'll learn how to train an auto-regressive model like GPT-2 from scratch; head over there if you'd like to see how you can pretrain your very own Transformer model!
+
+<Tip>
+
+✏️ **Try it out!** To quantify the benefits of domain adaptation, fine-tune a classifier on the IMDb labels for both the pretrained and fine-tuned DistilBERT checkpoints. If you need a refresher on text classification, check out [Chapter 3](/course/chapter3). 
+
+</Tip>
diff --git a/chapters/ro/chapter7/4.mdx b/chapters/ro/chapter7/4.mdx
new file mode 100644
index 000000000..cdae18d5b
--- /dev/null
+++ b/chapters/ro/chapter7/4.mdx
@@ -0,0 +1,1002 @@
+<FrameworkSwitchCourse {fw} />
+
+# Translation[[translation]]
+
+{#if fw === 'pt'}
+
+<CourseFloatingBanner chapter={7}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter7/section4_pt.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter7/section4_pt.ipynb"},
+]} />
+
+{:else}
+
+<CourseFloatingBanner chapter={7}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter7/section4_tf.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter7/section4_tf.ipynb"},
+]} />
+
+{/if}
+
+Let's now dive into translation. This is another [sequence-to-sequence task](/course/chapter1/7), which means it's a problem that can be formulated as going from one sequence to another. In that sense the problem is pretty close to [summarization](/course/chapter7/6), and you could adapt what we will see here to other sequence-to-sequence problems such as:
+
+- **Style transfer**: Creating a model that *translates* texts written in a certain style to another (e.g., formal to casual or Shakespearean English to modern English)
+- **Generative question answering**: Creating a model that generates answers to questions, given a context
+
+<Youtube id="1JvfrvZgi6c"/>
+
+If you have a big enough corpus of texts in two (or more) languages, you can train a new translation model from scratch like we will in the section on [causal language modeling](/course/chapter7/6). It will be faster, however, to fine-tune an existing translation model, be it a multilingual one like mT5 or mBART that you want to fine-tune to a specific language pair, or even a model specialized for translation from one language to another that you want to fine-tune to your specific corpus.
+
+In this section, we will fine-tune a Marian model pretrained to translate from English to French (since a lot of Hugging Face employees speak both those languages) on the [KDE4 dataset](https://huggingface.co/datasets/kde4), which is a dataset of localized files for the [KDE apps](https://apps.kde.org/). The model we will use has been pretrained on a large corpus of French and English texts taken from the [Opus dataset](https://opus.nlpl.eu/), which actually contains the KDE4 dataset. But even if the pretrained model we use has seen that data during its pretraining, we will see that we can get a better version of it after fine-tuning.
+
+Once we're finished, we will have a model able to make predictions like this one:
+
+<iframe src="https://course-demos-marian-finetuned-kde4-en-to-fr.hf.space" frameBorder="0" height="350" title="Gradio app" class="block dark:hidden container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
+
+<a class="flex justify-center" href="/huggingface-course/marian-finetuned-kde4-en-to-fr">
+<img class="block dark:hidden lg:w-3/5" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/modeleval-marian-finetuned-kde4-en-to-fr.png" alt="One-hot encoded labels for question answering."/>
+<img class="hidden dark:block lg:w-3/5" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/modeleval-marian-finetuned-kde4-en-to-fr-dark.png" alt="One-hot encoded labels for question answering."/>
+</a>
+
+As in the previous sections, you can find the actual model that we'll train and upload to the Hub using the code below and double-check its predictions [here](https://huggingface.co/huggingface-course/marian-finetuned-kde4-en-to-fr?text=This+plugin+allows+you+to+automatically+translate+web+pages+between+several+languages.).
+
+## Preparing the data[[preparing-the-data]]
+
+To fine-tune or train a translation model from scratch, we will need a dataset suitable for the task. As mentioned previously, we'll use the [KDE4 dataset](https://huggingface.co/datasets/kde4) in this section, but you can adapt the code to use your own data quite easily, as long as you have pairs of sentences in the two languages you want to translate from and into. Refer back to [Chapter 5](/course/chapter5) if you need a reminder of how to load your custom data in a `Dataset`.
+
+### The KDE4 dataset[[the-kde4-dataset]]
+
+As usual, we download our dataset using the `load_dataset()` function:
+
+```py
+from datasets import load_dataset
+
+raw_datasets = load_dataset("kde4", lang1="en", lang2="fr")
+```
+
+If you want to work with a different pair of languages, you can specify them by their codes. A total of 92 languages are available for this dataset; you can see them all by expanding the language tags on its [dataset card](https://huggingface.co/datasets/kde4).
+
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/language_tags.png" alt="Language available for the KDE4 dataset." width="100%">
+
+Let's have a look at the dataset:
+
+```py
+raw_datasets
+```
+
+```python out
+DatasetDict({
+    train: Dataset({
+        features: ['id', 'translation'],
+        num_rows: 210173
+    })
+})
+```
+
+We have 210,173 pairs of sentences, but in one single split, so we will need to create our own validation set. As we saw in [Chapter 5](/course/chapter5), a `Dataset` has a `train_test_split()` method that can help us. We'll provide a seed for reproducibility:
+
+```py
+split_datasets = raw_datasets["train"].train_test_split(train_size=0.9, seed=20)
+split_datasets
+```
+
+```python out
+DatasetDict({
+    train: Dataset({
+        features: ['id', 'translation'],
+        num_rows: 189155
+    })
+    test: Dataset({
+        features: ['id', 'translation'],
+        num_rows: 21018
+    })
+})
+```
+
+We can rename the `"test"` key to `"validation"` like this:
+
+```py
+split_datasets["validation"] = split_datasets.pop("test")
+```
+
+Now let's take a look at one element of the dataset:
+
+```py
+split_datasets["train"][1]["translation"]
+```
+
+```python out
+{'en': 'Default to expanded threads',
+ 'fr': 'Par défaut, développer les fils de discussion'}
+```
+
+We get a dictionary with two sentences in the pair of languages we requested. One particularity of this dataset full of technical computer science terms is that they are all fully translated in French. However, French engineers leave most computer science-specific words in English when they talk. Here, for instance, the word "threads" might well appear in a French sentence, especially in a technical conversation; but in this dataset it has been translated into the more correct "fils de discussion." The pretrained model we use, which has been pretrained on a larger corpus of French and English sentences, takes the easier option of leaving the word as is:
+
+```py
+from transformers import pipeline
+
+model_checkpoint = "Helsinki-NLP/opus-mt-en-fr"
+translator = pipeline("translation", model=model_checkpoint)
+translator("Default to expanded threads")
+```
+
+```python out
+[{'translation_text': 'Par défaut pour les threads élargis'}]
+```
+
+Another example of this behavior can be seen with the word "plugin," which isn't officially a French word but which most native speakers will understand and not bother to translate.
+In the KDE4 dataset this word has been translated in French into the more official "module d'extension":
+
+```py
+split_datasets["train"][172]["translation"]
+```
+
+```python out
+{'en': 'Unable to import %1 using the OFX importer plugin. This file is not the correct format.',
+ 'fr': "Impossible d'importer %1 en utilisant le module d'extension d'importation OFX. Ce fichier n'a pas un format correct."}
+```
+
+Our pretrained model, however, sticks with the compact and familiar English word:
+
+```py
+translator(
+    "Unable to import %1 using the OFX importer plugin. This file is not the correct format."
+)
+```
+
+```python out
+[{'translation_text': "Impossible d'importer %1 en utilisant le plugin d'importateur OFX. Ce fichier n'est pas le bon format."}]
+```
+
+It will be interesting to see if our fine-tuned model picks up on those particularities of the dataset (spoiler alert: it will).
+
+<Youtube id="0Oxphw4Q9fo"/>
+
+<Tip>
+
+✏️ **Your turn!** Another English word that is often used in French is "email." Find the first sample in the training dataset that uses this word. How is it translated? How does the pretrained model translate the same English sentence?
+
+</Tip>
+
+### Processing the data[[processing-the-data]]
+
+<Youtube id="XAR8jnZZuUs"/>
+
+You should know the drill by now: the texts all need to be converted into sets of token IDs so the model can make sense of them. For this task, we'll need to tokenize both the inputs and the targets. Our first task is to create our `tokenizer` object. As noted earlier, we'll be using a Marian English to French pretrained model. If you are trying this code with another pair of languages, make sure to adapt the model checkpoint. The [Helsinki-NLP](https://huggingface.co/Helsinki-NLP) organization provides more than a thousand models in multiple languages.
+
+```python
+from transformers import AutoTokenizer
+
+model_checkpoint = "Helsinki-NLP/opus-mt-en-fr"
+tokenizer = AutoTokenizer.from_pretrained(model_checkpoint, return_tensors="pt")
+```
+
+You can also replace the `model_checkpoint` with any other model you prefer from the [Hub](https://huggingface.co/models), or a local folder where you've saved a pretrained model and a tokenizer.
+
+<Tip>
+
+💡 If you are using a multilingual tokenizer such as mBART, mBART-50, or M2M100, you will need to set the language codes of your inputs and targets in the tokenizer by setting `tokenizer.src_lang` and `tokenizer.tgt_lang` to the right values.
+
+</Tip>
+
+The preparation of our data is pretty straightforward. There's just one thing to remember; you need to ensure that the tokenizer processes the targets in the output language (here, French). You can do this by passing the targets to the `text_targets` argument of the tokenizer's `__call__` method.
+
+To see how this works, let's process one sample of each language in the training set:
+
+```python
+en_sentence = split_datasets["train"][1]["translation"]["en"]
+fr_sentence = split_datasets["train"][1]["translation"]["fr"]
+
+inputs = tokenizer(en_sentence, text_target=fr_sentence)
+inputs
+```
+
+```python out
+{'input_ids': [47591, 12, 9842, 19634, 9, 0], 'attention_mask': [1, 1, 1, 1, 1, 1], 'labels': [577, 5891, 2, 3184, 16, 2542, 5, 1710, 0]}
+```
+
+As we can see, the output contains the input IDs associated with the English sentence, while the IDs associated with the French one are stored in the `labels` field. If you forget to indicate that you are tokenizing labels, they will be tokenized by the input tokenizer, which in the case of a Marian model is not going to go well at all:
+
+```python
+wrong_targets = tokenizer(fr_sentence)
+print(tokenizer.convert_ids_to_tokens(wrong_targets["input_ids"]))
+print(tokenizer.convert_ids_to_tokens(inputs["labels"]))
+```
+
+```python out
+['▁Par', '▁dé', 'f', 'aut', ',', '▁dé', 've', 'lop', 'per', '▁les', '▁fil', 's', '▁de', '▁discussion', '</s>']
+['▁Par', '▁défaut', ',', '▁développer', '▁les', '▁fils', '▁de', '▁discussion', '</s>']
+```
+
+As we can see, using the English tokenizer to preprocess a French sentence results in a lot more tokens, since the tokenizer doesn't know any French words (except those that also appear in the English language, like "discussion").
+
+Since `inputs` is a dictionary with our usual keys (input IDs, attention mask, etc.), the last step is to define the preprocessing function we will apply on the datasets:
+
+```python
+max_length = 128
+
+
+def preprocess_function(examples):
+    inputs = [ex["en"] for ex in examples["translation"]]
+    targets = [ex["fr"] for ex in examples["translation"]]
+    model_inputs = tokenizer(
+        inputs, text_target=targets, max_length=max_length, truncation=True
+    )
+    return model_inputs
+```
+
+Note that we set the same maximum length for our inputs and outputs. Since the texts we're dealing with seem pretty short, we use 128.
+
+<Tip>
+
+💡 If you are using a T5 model (more specifically, one of the `t5-xxx` checkpoints), the model will expect the text inputs to have a prefix indicating the task at hand, such as `translate: English to French:`.
+
+</Tip>
+
+<Tip warning={true}>
+
+⚠️ We don't pay attention to the attention mask of the targets, as the model won't expect it. Instead, the labels corresponding to a padding token should be set to `-100` so they are ignored in the loss computation. This will be done by our data collator later on since we are applying dynamic padding, but if you use padding here, you should adapt the preprocessing function to set all labels that correspond to the padding token to `-100`.
+
+</Tip>
+
+We can now apply that preprocessing in one go on all the splits of our dataset:
+
+```py
+tokenized_datasets = split_datasets.map(
+    preprocess_function,
+    batched=True,
+    remove_columns=split_datasets["train"].column_names,
+)
+```
+
+Now that the data has been preprocessed, we are ready to fine-tune our pretrained model!
+
+{#if fw === 'pt'}
+
+## Fine-tuning the model with the `Trainer` API[[fine-tuning-the-model-with-the-trainer-api]]
+
+The actual code using the `Trainer` will be the same as before, with just one little change: we use a [`Seq2SeqTrainer`](https://huggingface.co/transformers/main_classes/trainer.html#seq2seqtrainer) here, which is a subclass of `Trainer` that will allow us to properly deal with the evaluation, using the `generate()` method to predict outputs from the inputs. We'll dive into that in more detail when we talk about the metric computation.
+
+First things first, we need an actual model to fine-tune. We'll use the usual `AutoModel` API:
+
+```py
+from transformers import AutoModelForSeq2SeqLM
+
+model = AutoModelForSeq2SeqLM.from_pretrained(model_checkpoint)
+```
+
+{:else}
+
+## Fine-tuning the model with Keras[[fine-tuning-the-model-with-keras]]
+
+First things first, we need an actual model to fine-tune. We'll use the usual `AutoModel` API:
+
+```py
+from transformers import TFAutoModelForSeq2SeqLM
+
+model = TFAutoModelForSeq2SeqLM.from_pretrained(model_checkpoint, from_pt=True)
+```
+
+<Tip warning={false}>
+
+💡 The `Helsinki-NLP/opus-mt-en-fr` checkpoint only has PyTorch weights, so
+you'll get an error if you try to load the model without using the
+`from_pt=True` argument in the `from_pretrained()` method. When you specify
+`from_pt=True`, the library will automatically download and convert the
+PyTorch weights for you. As you can see, it is very simple to switch between
+frameworks in 🤗 Transformers!
+
+</Tip>
+
+{/if}
+
+Note that this time we are using a model that was trained on a translation task and can actually be used already, so there is no warning about missing weights or newly initialized ones.
+
+### Data collation[[data-collation]]
+
+We'll need a data collator to deal with the padding for dynamic batching. We can't just use a `DataCollatorWithPadding` like in [Chapter 3](/course/chapter3) in this case, because that only pads the inputs (input IDs, attention mask, and token type IDs). Our labels should also be padded to the maximum length encountered in the labels. And, as mentioned previously, the padding value used to pad the labels should be `-100` and not the padding token of the tokenizer, to make sure those padded values are ignored in the loss computation.
+
+This is all done by a [`DataCollatorForSeq2Seq`](https://huggingface.co/transformers/main_classes/data_collator.html#datacollatorforseq2seq). Like the `DataCollatorWithPadding`, it takes the `tokenizer` used to preprocess the inputs, but it also takes the `model`. This is because this data collator will also be responsible for preparing the decoder input IDs, which are shifted versions of the labels with a special token at the beginning. Since this shift is done slightly differently for different architectures, the `DataCollatorForSeq2Seq` needs to know the `model` object:
+
+{#if fw === 'pt'}
+
+```py
+from transformers import DataCollatorForSeq2Seq
+
+data_collator = DataCollatorForSeq2Seq(tokenizer, model=model)
+```
+
+{:else}
+
+```py
+from transformers import DataCollatorForSeq2Seq
+
+data_collator = DataCollatorForSeq2Seq(tokenizer, model=model, return_tensors="tf")
+```
+
+{/if}
+
+To test this on a few samples, we just call it on a list of examples from our tokenized training set:
+
+```py
+batch = data_collator([tokenized_datasets["train"][i] for i in range(1, 3)])
+batch.keys()
+```
+
+```python out
+dict_keys(['attention_mask', 'input_ids', 'labels', 'decoder_input_ids'])
+```
+
+We can check our labels have been padded to the maximum length of the batch, using `-100`:
+
+```py
+batch["labels"]
+```
+
+```python out
+tensor([[  577,  5891,     2,  3184,    16,  2542,     5,  1710,     0,  -100,
+          -100,  -100,  -100,  -100,  -100,  -100],
+        [ 1211,     3,    49,  9409,  1211,     3, 29140,   817,  3124,   817,
+           550,  7032,  5821,  7907, 12649,     0]])
+```
+
+And we can also have a look at the decoder input IDs, to see that they are shifted versions of the labels:
+
+```py
+batch["decoder_input_ids"]
+```
+
+```python out
+tensor([[59513,   577,  5891,     2,  3184,    16,  2542,     5,  1710,     0,
+         59513, 59513, 59513, 59513, 59513, 59513],
+        [59513,  1211,     3,    49,  9409,  1211,     3, 29140,   817,  3124,
+           817,   550,  7032,  5821,  7907, 12649]])
+```
+
+Here are the labels for the first and second elements in our dataset:
+
+```py
+for i in range(1, 3):
+    print(tokenized_datasets["train"][i]["labels"])
+```
+
+```python out
+[577, 5891, 2, 3184, 16, 2542, 5, 1710, 0]
+[1211, 3, 49, 9409, 1211, 3, 29140, 817, 3124, 817, 550, 7032, 5821, 7907, 12649, 0]
+```
+
+{#if fw === 'pt'}
+
+We will pass this `data_collator` along to the `Seq2SeqTrainer`. Next, let's have a look at the metric.
+
+{:else}
+
+We can now use this `data_collator` to convert each of our datasets to a `tf.data.Dataset`, ready for training:
+
+```python
+tf_train_dataset = model.prepare_tf_dataset(
+    tokenized_datasets["train"],
+    collate_fn=data_collator,
+    shuffle=True,
+    batch_size=32,
+)
+tf_eval_dataset = model.prepare_tf_dataset(
+    tokenized_datasets["validation"],
+    collate_fn=data_collator,
+    shuffle=False,
+    batch_size=16,
+)
+```
+
+{/if}
+
+
+### Metrics[[metrics]]
+
+<Youtube id="M05L1DhFqcw"/>
+
+{#if fw === 'pt'}
+
+The feature that `Seq2SeqTrainer` adds to its superclass `Trainer` is the ability to use the `generate()` method during evaluation or prediction. During training, the model will use the `decoder_input_ids` with an attention mask ensuring it does not use the tokens after the token it's trying to predict, to speed up training. During inference we won't be able to use those since we won't have labels, so it's a good idea to evaluate our model with the same setup.
+
+As we saw in [Chapter 1](/course/chapter1/6), the decoder performs inference by predicting tokens one by one -- something that's implemented behind the scenes in 🤗 Transformers by the `generate()` method. The `Seq2SeqTrainer` will let us use that method for evaluation if we set `predict_with_generate=True`.
+
+{/if}
+
+The traditional metric used for translation is the [BLEU score](https://en.wikipedia.org/wiki/BLEU), introduced in [a 2002 article](https://aclanthology.org/P02-1040.pdf) by Kishore Papineni et al. The BLEU score evaluates how close the translations are to their labels. It does not measure the intelligibility or grammatical correctness of the model's generated outputs, but uses statistical rules to ensure that all the words in the generated outputs also appear in the targets. In addition, there are rules that penalize repetitions of the same words if they are not also repeated in the targets (to avoid the model outputting sentences like `"the the the the the"`) and output sentences that are shorter than those in the targets (to avoid the model outputting sentences like `"the"`).
+
+One weakness with BLEU is that it expects the text to already be tokenized, which makes it difficult to compare scores between models that use different tokenizers. So instead, the most commonly used metric for benchmarking translation models today is [SacreBLEU](https://github.com/mjpost/sacrebleu), which addresses this weakness (and others) by standardizing the tokenization step. To use this metric, we first need to install the SacreBLEU library:
+
+```py
+!pip install sacrebleu
+```
+
+We can then load it via `evaluate.load()` like we did in [Chapter 3](/course/chapter3):
+
+```py
+import evaluate
+
+metric = evaluate.load("sacrebleu")
+```
+
+This metric will take texts as inputs and targets. It is designed to accept several acceptable targets, as there are often multiple acceptable translations of the same sentence -- the dataset we're using only provides one, but it's not uncommon in NLP to find datasets that give several sentences as labels. So, the predictions should be a list of sentences, but the references should be a list of lists of sentences.
+
+Let's try an example:
+
+```py
+predictions = [
+    "This plugin lets you translate web pages between several languages automatically."
+]
+references = [
+    [
+        "This plugin allows you to automatically translate web pages between several languages."
+    ]
+]
+metric.compute(predictions=predictions, references=references)
+```
+
+```python out
+{'score': 46.750469682990165,
+ 'counts': [11, 6, 4, 3],
+ 'totals': [12, 11, 10, 9],
+ 'precisions': [91.67, 54.54, 40.0, 33.33],
+ 'bp': 0.9200444146293233,
+ 'sys_len': 12,
+ 'ref_len': 13}
+```
+
+This gets a BLEU score of 46.75, which is rather good -- for reference, the original Transformer model in the ["Attention Is All You Need" paper](https://arxiv.org/pdf/1706.03762.pdf) achieved a BLEU score of 41.8 on a similar translation task between English and French! (For more information about the individual metrics, like `counts` and `bp`, see the [SacreBLEU repository](https://github.com/mjpost/sacrebleu/blob/078c440168c6adc89ba75fe6d63f0d922d42bcfe/sacrebleu/metrics/bleu.py#L74).) On the other hand, if we try with the two bad types of predictions (lots of repetitions or too short) that often come out of translation models, we will get rather bad BLEU scores:
+
+```py
+predictions = ["This This This This"]
+references = [
+    [
+        "This plugin allows you to automatically translate web pages between several languages."
+    ]
+]
+metric.compute(predictions=predictions, references=references)
+```
+
+```python out
+{'score': 1.683602693167689,
+ 'counts': [1, 0, 0, 0],
+ 'totals': [4, 3, 2, 1],
+ 'precisions': [25.0, 16.67, 12.5, 12.5],
+ 'bp': 0.10539922456186433,
+ 'sys_len': 4,
+ 'ref_len': 13}
+```
+
+```py
+predictions = ["This plugin"]
+references = [
+    [
+        "This plugin allows you to automatically translate web pages between several languages."
+    ]
+]
+metric.compute(predictions=predictions, references=references)
+```
+
+```python out
+{'score': 0.0,
+ 'counts': [2, 1, 0, 0],
+ 'totals': [2, 1, 0, 0],
+ 'precisions': [100.0, 100.0, 0.0, 0.0],
+ 'bp': 0.004086771438464067,
+ 'sys_len': 2,
+ 'ref_len': 13}
+```
+
+The score can go from 0 to 100, and higher is better.
+
+{#if fw === 'tf'}
+
+To get from the model outputs to texts the metric can use, we will use the `tokenizer.batch_decode()` method. We just have to clean up all the `-100`s in the labels; the tokenizer will automatically do the same for the padding token. Let's define a function that takes our model and a dataset and computes metrics on it. We're also going to use a trick that dramatically increases performance - compiling our generation code with [XLA](https://www.tensorflow.org/xla), TensorFlow's accelerated linear algebra compiler. XLA applies various optimizations to the model's computation graph, and results in significant improvements to speed and memory usage. As described in the Hugging Face [blog](https://huggingface.co/blog/tf-xla-generate), XLA works best when our input shapes don't vary too much. To handle this, we'll pad our inputs to multiples of 128, and make a new dataset with the padding collator, and then we'll apply the `@tf.function(jit_compile=True)` decorator to our generation function, which marks the whole function for compilation with XLA. 
+
+```py
+import numpy as np
+import tensorflow as tf
+from tqdm import tqdm
+
+generation_data_collator = DataCollatorForSeq2Seq(
+    tokenizer, model=model, return_tensors="tf", pad_to_multiple_of=128
+)
+
+tf_generate_dataset = model.prepare_tf_dataset(
+    tokenized_datasets["validation"],
+    collate_fn=generation_data_collator,
+    shuffle=False,
+    batch_size=8,
+)
+
+
+@tf.function(jit_compile=True)
+def generate_with_xla(batch):
+    return model.generate(
+        input_ids=batch["input_ids"],
+        attention_mask=batch["attention_mask"],
+        max_new_tokens=128,
+    )
+
+
+def compute_metrics():
+    all_preds = []
+    all_labels = []
+
+    for batch, labels in tqdm(tf_generate_dataset):
+        predictions = generate_with_xla(batch)
+        decoded_preds = tokenizer.batch_decode(predictions, skip_special_tokens=True)
+        labels = labels.numpy()
+        labels = np.where(labels != -100, labels, tokenizer.pad_token_id)
+        decoded_labels = tokenizer.batch_decode(labels, skip_special_tokens=True)
+        decoded_preds = [pred.strip() for pred in decoded_preds]
+        decoded_labels = [[label.strip()] for label in decoded_labels]
+        all_preds.extend(decoded_preds)
+        all_labels.extend(decoded_labels)
+
+    result = metric.compute(predictions=all_preds, references=all_labels)
+    return {"bleu": result["score"]}
+```
+
+{:else}
+
+To get from the model outputs to texts the metric can use, we will use the `tokenizer.batch_decode()` method. We just have to clean up all the `-100`s in the labels (the tokenizer will automatically do the same for the padding token):
+
+```py
+import numpy as np
+
+
+def compute_metrics(eval_preds):
+    preds, labels = eval_preds
+    # In case the model returns more than the prediction logits
+    if isinstance(preds, tuple):
+        preds = preds[0]
+
+    decoded_preds = tokenizer.batch_decode(preds, skip_special_tokens=True)
+
+    # Replace -100s in the labels as we can't decode them
+    labels = np.where(labels != -100, labels, tokenizer.pad_token_id)
+    decoded_labels = tokenizer.batch_decode(labels, skip_special_tokens=True)
+
+    # Some simple post-processing
+    decoded_preds = [pred.strip() for pred in decoded_preds]
+    decoded_labels = [[label.strip()] for label in decoded_labels]
+
+    result = metric.compute(predictions=decoded_preds, references=decoded_labels)
+    return {"bleu": result["score"]}
+```
+
+{/if}
+
+Now that this is done, we are ready to fine-tune our model!
+
+
+### Fine-tuning the model[[fine-tuning-the-model]]
+
+The first step is to log in to Hugging Face, so you're able to upload your results to the Model Hub. There's a convenience function to help you with this in a notebook:
+
+```python
+from huggingface_hub import notebook_login
+
+notebook_login()
+```
+
+This will display a widget where you can enter your Hugging Face login credentials.
+
+If you aren't working in a notebook, just type the following line in your terminal:
+
+```bash
+huggingface-cli login
+```
+
+{#if fw === 'tf'}
+
+Before we start, let's see what kind of results we get from our model without any training:
+
+```py
+print(compute_metrics())
+```
+
+```
+{'bleu': 33.26983701454733}
+```
+
+Once this is done, we can prepare everything we need to compile and train our model. Note the use of `tf.keras.mixed_precision.set_global_policy("mixed_float16")` -- this will tell Keras to train using float16, which can give a significant speedup on GPUs that support it (Nvidia 20xx/V100 or newer).
+
+```python
+from transformers import create_optimizer
+from transformers.keras_callbacks import PushToHubCallback
+import tensorflow as tf
+
+# The number of training steps is the number of samples in the dataset, divided by the batch size then multiplied
+# by the total number of epochs. Note that the tf_train_dataset here is a batched tf.data.Dataset,
+# not the original Hugging Face Dataset, so its len() is already num_samples // batch_size.
+num_epochs = 3
+num_train_steps = len(tf_train_dataset) * num_epochs
+
+optimizer, schedule = create_optimizer(
+    init_lr=5e-5,
+    num_warmup_steps=0,
+    num_train_steps=num_train_steps,
+    weight_decay_rate=0.01,
+)
+model.compile(optimizer=optimizer)
+
+# Train in mixed-precision float16
+tf.keras.mixed_precision.set_global_policy("mixed_float16")
+```
+
+Next, we define a `PushToHubCallback` to upload our model to the Hub during training, as we saw in [section 2]((/course/chapter7/2)), and then we simply fit the model with that callback:
+
+```python
+from transformers.keras_callbacks import PushToHubCallback
+
+callback = PushToHubCallback(
+    output_dir="marian-finetuned-kde4-en-to-fr", tokenizer=tokenizer
+)
+
+model.fit(
+    tf_train_dataset,
+    validation_data=tf_eval_dataset,
+    callbacks=[callback],
+    epochs=num_epochs,
+)
+```
+
+Note that you can specify the name of the repository you want to push to with the `hub_model_id` argument (in particular, you will have to use this argument to push to an organization). For instance, when we pushed the model to the [`huggingface-course` organization](https://huggingface.co/huggingface-course), we added `hub_model_id="huggingface-course/marian-finetuned-kde4-en-to-fr"` to `Seq2SeqTrainingArguments`. By default, the repository used will be in your namespace and named after the output directory you set, so here it will be `"sgugger/marian-finetuned-kde4-en-to-fr"` (which is the model we linked to at the beginning of this section).
+
+<Tip>
+
+💡 If the output directory you are using already exists, it needs to be a local clone of the repository you want to push to. If it isn't, you'll get an error when calling `model.fit()` and will need to set a new name.
+
+</Tip>
+
+Finally, let's see what our metrics look like now that training has finished:
+
+```py
+print(compute_metrics())
+```
+
+```
+{'bleu': 57.334066271545865}
+```
+
+At this stage, you can use the inference widget on the Model Hub to test your model and share it with your friends. You have successfully fine-tuned a model on a translation task -- congratulations!
+
+{:else}
+
+Once this is done, we can define our `Seq2SeqTrainingArguments`. Like for the `Trainer`, we use a subclass of `TrainingArguments` that contains a few more fields:
+
+```python
+from transformers import Seq2SeqTrainingArguments
+
+args = Seq2SeqTrainingArguments(
+    f"marian-finetuned-kde4-en-to-fr",
+    evaluation_strategy="no",
+    save_strategy="epoch",
+    learning_rate=2e-5,
+    per_device_train_batch_size=32,
+    per_device_eval_batch_size=64,
+    weight_decay=0.01,
+    save_total_limit=3,
+    num_train_epochs=3,
+    predict_with_generate=True,
+    fp16=True,
+    push_to_hub=True,
+)
+```
+
+Apart from the usual hyperparameters (like learning rate, number of epochs, batch size, and some weight decay), here are a few changes compared to what we saw in the previous sections:
+
+- We don't set any regular evaluation, as evaluation takes a while; we will just evaluate our model once before training and after.
+- We set `fp16=True`, which speeds up training on modern GPUs.
+- We set `predict_with_generate=True`, as discussed above.
+- We use `push_to_hub=True` to upload the model to the Hub at the end of each epoch.
+
+Note that you can specify the full name of the repository you want to push to with the `hub_model_id` argument (in particular, you will have to use this argument to push to an organization). For instance, when we pushed the model to the [`huggingface-course` organization](https://huggingface.co/huggingface-course), we added `hub_model_id="huggingface-course/marian-finetuned-kde4-en-to-fr"` to `Seq2SeqTrainingArguments`. By default, the repository used will be in your namespace and named after the output directory you set, so in our case it will be `"sgugger/marian-finetuned-kde4-en-to-fr"` (which is the model we linked to at the beginning of this section).
+
+<Tip>
+
+💡 If the output directory you are using already exists, it needs to be a local clone of the repository you want to push to. If it isn't, you'll get an error when defining your `Seq2SeqTrainer` and will need to set a new name.
+
+</Tip>
+
+
+Finally, we just pass everything to the `Seq2SeqTrainer`:
+
+```python
+from transformers import Seq2SeqTrainer
+
+trainer = Seq2SeqTrainer(
+    model,
+    args,
+    train_dataset=tokenized_datasets["train"],
+    eval_dataset=tokenized_datasets["validation"],
+    data_collator=data_collator,
+    tokenizer=tokenizer,
+    compute_metrics=compute_metrics,
+)
+```
+
+Before training, we'll first look at the score our model gets, to double-check that we're not making things worse with our fine-tuning. This command will take a bit of time, so you can grab a coffee while it executes:
+
+```python
+trainer.evaluate(max_length=max_length)
+```
+
+```python out
+{'eval_loss': 1.6964408159255981,
+ 'eval_bleu': 39.26865061007616,
+ 'eval_runtime': 965.8884,
+ 'eval_samples_per_second': 21.76,
+ 'eval_steps_per_second': 0.341}
+```
+
+A BLEU score of 39 is not too bad, which reflects the fact that our model is already good at translating English sentences to French ones.
+
+Next is the training, which will also take a bit of time:
+
+```python
+trainer.train()
+```
+
+Note that while the training happens, each time the model is saved (here, every epoch) it is uploaded to the Hub in the background. This way, you will be able to to resume your training on another machine if necessary.
+
+Once training is done, we evaluate our model again -- hopefully we will see some amelioration in the BLEU score!
+
+```py
+trainer.evaluate(max_length=max_length)
+```
+
+```python out
+{'eval_loss': 0.8558505773544312,
+ 'eval_bleu': 52.94161337775576,
+ 'eval_runtime': 714.2576,
+ 'eval_samples_per_second': 29.426,
+ 'eval_steps_per_second': 0.461,
+ 'epoch': 3.0}
+```
+
+That's a nearly 14-point improvement, which is great.
+
+Finally, we use the `push_to_hub()` method to make sure we upload the latest version of the model. The `Trainer` also drafts a model card with all the evaluation results and uploads it. This model card contains metadata that helps the Model Hub pick the widget for the inference demo. Usually, there is no need to say anything as it can infer the right widget from the model class, but in this case, the same model class can be used for all kinds of sequence-to-sequence problems, so we specify it's a translation model:
+
+```py
+trainer.push_to_hub(tags="translation", commit_message="Training complete")
+```
+
+This command returns the URL of the commit it just did, if you want to inspect it:
+
+```python out
+'https://huggingface.co/sgugger/marian-finetuned-kde4-en-to-fr/commit/3601d621e3baae2bc63d3311452535f8f58f6ef3'
+```
+
+At this stage, you can use the inference widget on the Model Hub to test your model and share it with your friends. You have successfully fine-tuned a model on a translation task -- congratulations!
+
+If you want to dive a bit more deeply into the training loop, we will now show you how to do the same thing using 🤗 Accelerate.
+
+{/if}
+
+{#if fw === 'pt'}
+
+## A custom training loop[[a-custom-training-loop]]
+
+Let's now take a look at the full training loop, so you can easily customize the parts you need. It will look a lot like what we did in [section 2](/course/chapter7/2) and [Chapter 3](/course/chapter3/4).
+
+### Preparing everything for training[[preparing-everything-for-training]]
+
+You've seen all of this a few times now, so we'll go through the code quite quickly. First we'll build the `DataLoader`s from our datasets, after setting the datasets to the `"torch"` format so we get PyTorch tensors:
+
+```py
+from torch.utils.data import DataLoader
+
+tokenized_datasets.set_format("torch")
+train_dataloader = DataLoader(
+    tokenized_datasets["train"],
+    shuffle=True,
+    collate_fn=data_collator,
+    batch_size=8,
+)
+eval_dataloader = DataLoader(
+    tokenized_datasets["validation"], collate_fn=data_collator, batch_size=8
+)
+```
+
+Next we reinstantiate our model, to make sure we're not continuing the fine-tuning from before but starting from the pretrained model again:
+
+```py
+model = AutoModelForSeq2SeqLM.from_pretrained(model_checkpoint)
+```
+
+Then we will need an optimizer:
+
+```py
+from transformers import AdamW
+
+optimizer = AdamW(model.parameters(), lr=2e-5)
+```
+
+Once we have all those objects, we can send them to the `accelerator.prepare()` method. Remember that if you want to train on TPUs in a Colab notebook, you will need to move all of this code into a training function, and that shouldn't execute any cell that instantiates an `Accelerator`.
+
+```py
+from accelerate import Accelerator
+
+accelerator = Accelerator()
+model, optimizer, train_dataloader, eval_dataloader = accelerator.prepare(
+    model, optimizer, train_dataloader, eval_dataloader
+)
+```
+
+Now that we have sent our `train_dataloader` to `accelerator.prepare()`, we can use its length to compute the number of training steps. Remember we should always do this after preparing the dataloader, as that method will change the length of the `DataLoader`. We use a classic linear schedule from the learning rate to 0:
+
+```py
+from transformers import get_scheduler
+
+num_train_epochs = 3
+num_update_steps_per_epoch = len(train_dataloader)
+num_training_steps = num_train_epochs * num_update_steps_per_epoch
+
+lr_scheduler = get_scheduler(
+    "linear",
+    optimizer=optimizer,
+    num_warmup_steps=0,
+    num_training_steps=num_training_steps,
+)
+```
+
+Lastly, to push our model to the Hub, we will need to create a `Repository` object in a working folder. First log in to the Hugging Face Hub, if you're not logged in already. We'll determine the repository name from the model ID we want to give our model (feel free to replace the `repo_name` with your own choice; it just needs to contain your username, which is what the function `get_full_repo_name()` does):
+
+```py
+from huggingface_hub import Repository, get_full_repo_name
+
+model_name = "marian-finetuned-kde4-en-to-fr-accelerate"
+repo_name = get_full_repo_name(model_name)
+repo_name
+```
+
+```python out
+'sgugger/marian-finetuned-kde4-en-to-fr-accelerate'
+```
+
+Then we can clone that repository in a local folder. If it already exists, this local folder should be a clone of the repository we are working with:
+
+```py
+output_dir = "marian-finetuned-kde4-en-to-fr-accelerate"
+repo = Repository(output_dir, clone_from=repo_name)
+```
+
+We can now upload anything we save in `output_dir` by calling the `repo.push_to_hub()` method. This will help us upload the intermediate models at the end of each epoch.
+
+### Training loop[[training-loop]]
+
+We are now ready to write the full training loop. To simplify its evaluation part, we define this `postprocess()` function that takes predictions and labels and converts them to the lists of strings our `metric` object will expect:
+
+```py
+def postprocess(predictions, labels):
+    predictions = predictions.cpu().numpy()
+    labels = labels.cpu().numpy()
+
+    decoded_preds = tokenizer.batch_decode(predictions, skip_special_tokens=True)
+
+    # Replace -100 in the labels as we can't decode them.
+    labels = np.where(labels != -100, labels, tokenizer.pad_token_id)
+    decoded_labels = tokenizer.batch_decode(labels, skip_special_tokens=True)
+
+    # Some simple post-processing
+    decoded_preds = [pred.strip() for pred in decoded_preds]
+    decoded_labels = [[label.strip()] for label in decoded_labels]
+    return decoded_preds, decoded_labels
+```
+
+The training loop looks a lot like the ones in [section 2](/course/chapter7/2) and [Chapter 3](/course/chapter3), with a few differences in the evaluation part -- so let's focus on that!
+
+The first thing to note is that we use the `generate()` method to compute predictions, but this is a method on our base model, not the wrapped model 🤗 Accelerate created in the `prepare()` method. That's why we unwrap the model first, then call this method.
+
+The second thing is that, like with [token classification](/course/chapter7/2), two processes may have padded the inputs and labels to different shapes, so we use `accelerator.pad_across_processes()` to make the predictions and labels the same shape before calling the `gather()` method. If we don't do this, the evaluation will either error out or hang forever.
+
+```py
+from tqdm.auto import tqdm
+import torch
+
+progress_bar = tqdm(range(num_training_steps))
+
+for epoch in range(num_train_epochs):
+    # Training
+    model.train()
+    for batch in train_dataloader:
+        outputs = model(**batch)
+        loss = outputs.loss
+        accelerator.backward(loss)
+
+        optimizer.step()
+        lr_scheduler.step()
+        optimizer.zero_grad()
+        progress_bar.update(1)
+
+    # Evaluation
+    model.eval()
+    for batch in tqdm(eval_dataloader):
+        with torch.no_grad():
+            generated_tokens = accelerator.unwrap_model(model).generate(
+                batch["input_ids"],
+                attention_mask=batch["attention_mask"],
+                max_length=128,
+            )
+        labels = batch["labels"]
+
+        # Necessary to pad predictions and labels for being gathered
+        generated_tokens = accelerator.pad_across_processes(
+            generated_tokens, dim=1, pad_index=tokenizer.pad_token_id
+        )
+        labels = accelerator.pad_across_processes(labels, dim=1, pad_index=-100)
+
+        predictions_gathered = accelerator.gather(generated_tokens)
+        labels_gathered = accelerator.gather(labels)
+
+        decoded_preds, decoded_labels = postprocess(predictions_gathered, labels_gathered)
+        metric.add_batch(predictions=decoded_preds, references=decoded_labels)
+
+    results = metric.compute()
+    print(f"epoch {epoch}, BLEU score: {results['score']:.2f}")
+
+    # Save and upload
+    accelerator.wait_for_everyone()
+    unwrapped_model = accelerator.unwrap_model(model)
+    unwrapped_model.save_pretrained(output_dir, save_function=accelerator.save)
+    if accelerator.is_main_process:
+        tokenizer.save_pretrained(output_dir)
+        repo.push_to_hub(
+            commit_message=f"Training in progress epoch {epoch}", blocking=False
+        )
+```
+
+```python out
+epoch 0, BLEU score: 53.47
+epoch 1, BLEU score: 54.24
+epoch 2, BLEU score: 54.44
+```
+
+Once this is done, you should have a model that has results pretty similar to the one trained with the `Seq2SeqTrainer`. You can check the one we trained using this code at [*huggingface-course/marian-finetuned-kde4-en-to-fr-accelerate*](https://huggingface.co/huggingface-course/marian-finetuned-kde4-en-to-fr-accelerate). And if you want to test out any tweaks to the training loop, you can directly implement them by editing the code shown above!
+
+{/if}
+
+## Using the fine-tuned model[[using-the-fine-tuned-model]]
+
+We've already shown you how you can use the model we fine-tuned on the Model Hub with the inference widget. To use it locally in a `pipeline`, we just have to specify the proper model identifier:
+
+```py
+from transformers import pipeline
+
+# Replace this with your own checkpoint
+model_checkpoint = "huggingface-course/marian-finetuned-kde4-en-to-fr"
+translator = pipeline("translation", model=model_checkpoint)
+translator("Default to expanded threads")
+```
+
+```python out
+[{'translation_text': 'Par défaut, développer les fils de discussion'}]
+```
+
+As expected, our pretrained model adapted its knowledge to the corpus we fine-tuned it on, and instead of leaving the English word "threads" alone, it now translates it to the French official version. It's the same for "plugin":
+
+```py
+translator(
+    "Unable to import %1 using the OFX importer plugin. This file is not the correct format."
+)
+```
+
+```python out
+[{'translation_text': "Impossible d'importer %1 en utilisant le module externe d'importation OFX. Ce fichier n'est pas le bon format."}]
+```
+
+Another great example of domain adaptation!
+
+<Tip>
+
+✏️ **Your turn!** What does the model return on the sample with the word "email" you identified earlier?
+
+</Tip>
diff --git a/chapters/ro/chapter7/5.mdx b/chapters/ro/chapter7/5.mdx
new file mode 100644
index 000000000..b8afcfaa0
--- /dev/null
+++ b/chapters/ro/chapter7/5.mdx
@@ -0,0 +1,1072 @@
+<FrameworkSwitchCourse {fw} />
+
+# Summarization[[summarization]]
+
+{#if fw === 'pt'}
+
+<CourseFloatingBanner chapter={7}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter7/section5_pt.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter7/section5_pt.ipynb"},
+]} />
+
+{:else}
+
+<CourseFloatingBanner chapter={7}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter7/section5_tf.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter7/section5_tf.ipynb"},
+]} />
+
+{/if}
+
+
+In this section we'll take a look at how Transformer models can be used to condense long documents into summaries, a task known as _text summarization_. This is one of the most challenging NLP tasks as it requires a range of abilities, such as understanding long passages and generating coherent text that captures the main topics in a document. However, when done well, text summarization is a powerful tool that can speed up various business processes by relieving the burden of domain experts to read long documents in detail.
+
+<Youtube id="yHnr5Dk2zCI"/>
+
+Although there already exist various fine-tuned models for summarization on the [Hugging Face Hub](https://huggingface.co/models?pipeline_tag=summarization&sort=downloads), almost all of these are only suitable for English documents. So, to add a twist in this section, we'll train a bilingual model for English and Spanish. By the end of this section, you'll have a [model](https://huggingface.co/huggingface-course/mt5-small-finetuned-amazon-en-es) that can summarize customer reviews like the one shown here:
+
+<iframe src="https://course-demos-mt5-small-finetuned-amazon-en-es.hf.space" frameBorder="0" height="400" title="Gradio app" class="block dark:hidden container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
+
+As we'll see, these summaries are concise because they're learned from the titles that customers provide in their product reviews. Let's start by putting together a suitable bilingual corpus for this task.
+
+## Preparing a multilingual corpus[[preparing-a-multilingual-corpus]]
+
+We'll use the [Multilingual Amazon Reviews Corpus](https://huggingface.co/datasets/amazon_reviews_multi) to create our bilingual summarizer. This corpus consists of Amazon product reviews in six languages and is typically used to benchmark multilingual classifiers. However, since each review is accompanied by a short title, we can use the titles as the target summaries for our model to learn from! To get started, let's download the English and Spanish subsets from the Hugging Face Hub:
+
+```python
+from datasets import load_dataset
+
+spanish_dataset = load_dataset("amazon_reviews_multi", "es")
+english_dataset = load_dataset("amazon_reviews_multi", "en")
+english_dataset
+```
+
+```python out
+DatasetDict({
+    train: Dataset({
+        features: ['review_id', 'product_id', 'reviewer_id', 'stars', 'review_body', 'review_title', 'language', 'product_category'],
+        num_rows: 200000
+    })
+    validation: Dataset({
+        features: ['review_id', 'product_id', 'reviewer_id', 'stars', 'review_body', 'review_title', 'language', 'product_category'],
+        num_rows: 5000
+    })
+    test: Dataset({
+        features: ['review_id', 'product_id', 'reviewer_id', 'stars', 'review_body', 'review_title', 'language', 'product_category'],
+        num_rows: 5000
+    })
+})
+```
+
+As you can see, for each language there are 200,000 reviews for the `train` split, and 5,000 reviews for each of the `validation` and `test` splits. The review information we are interested in is contained in the `review_body` and `review_title` columns. Let's take a look at a few examples by creating a simple function that takes a random sample from the training set with the techniques we learned in [Chapter 5](/course/chapter5):
+
+```python
+def show_samples(dataset, num_samples=3, seed=42):
+    sample = dataset["train"].shuffle(seed=seed).select(range(num_samples))
+    for example in sample:
+        print(f"\n'>> Title: {example['review_title']}'")
+        print(f"'>> Review: {example['review_body']}'")
+
+
+show_samples(english_dataset)
+```
+
+```python out
+'>> Title: Worked in front position, not rear'
+'>> Review: 3 stars because these are not rear brakes as stated in the item description. At least the mount adapter only worked on the front fork of the bike that I got it for.'
+
+'>> Title: meh'
+'>> Review: Does it’s job and it’s gorgeous but mine is falling apart, I had to basically put it together again with hot glue'
+
+'>> Title: Can\'t beat these for the money'
+'>> Review: Bought this for handling miscellaneous aircraft parts and hanger "stuff" that I needed to organize; it really fit the bill. The unit arrived quickly, was well packaged and arrived intact (always a good sign). There are five wall mounts-- three on the top and two on the bottom. I wanted to mount it on the wall, so all I had to do was to remove the top two layers of plastic drawers, as well as the bottom corner drawers, place it when I wanted and mark it; I then used some of the new plastic screw in wall anchors (the 50 pound variety) and it easily mounted to the wall. Some have remarked that they wanted dividers for the drawers, and that they made those. Good idea. My application was that I needed something that I can see the contents at about eye level, so I wanted the fuller-sized drawers. I also like that these are the new plastic that doesn\'t get brittle and split like my older plastic drawers did. I like the all-plastic construction. It\'s heavy duty enough to hold metal parts, but being made of plastic it\'s not as heavy as a metal frame, so you can easily mount it to the wall and still load it up with heavy stuff, or light stuff. No problem there. For the money, you can\'t beat it. Best one of these I\'ve bought to date-- and I\'ve been using some version of these for over forty years.'
+```
+
+<Tip>
+
+✏️ **Try it out!** Change the random seed in the `Dataset.shuffle()` command to explore other reviews in the corpus. If you're a Spanish speaker, take a look at some of the reviews in `spanish_dataset` to see if the titles also seem like reasonable summaries.
+
+</Tip>
+
+This sample shows the diversity of reviews one typically finds online, ranging from positive to negative (and everything in between!). Although the example with the "meh" title is not very informative, the other titles look like decent summaries of the reviews themselves. Training a summarization model on all 400,000 reviews would take far too long on a single GPU, so instead we'll focus on generating summaries for a single domain of products. To get a feel for what domains we can choose from, let's convert `english_dataset` to a `pandas.DataFrame` and compute the number of reviews per product category:
+
+```python
+english_dataset.set_format("pandas")
+english_df = english_dataset["train"][:]
+# Show counts for top 20 products
+english_df["product_category"].value_counts()[:20]
+```
+
+```python out
+home                      17679
+apparel                   15951
+wireless                  15717
+other                     13418
+beauty                    12091
+drugstore                 11730
+kitchen                   10382
+toy                        8745
+sports                     8277
+automotive                 7506
+lawn_and_garden            7327
+home_improvement           7136
+pet_products               7082
+digital_ebook_purchase     6749
+pc                         6401
+electronics                6186
+office_product             5521
+shoes                      5197
+grocery                    4730
+book                       3756
+Name: product_category, dtype: int64
+```
+
+The most popular products in the English dataset are about household items, clothing, and wireless electronics. To stick with the Amazon theme, though, let's focus on summarizing book reviews -- after all, this is what the company was founded on! We can see two product categories that fit the bill (`book` and `digital_ebook_purchase`), so let's filter the datasets in both languages for just these products. As we saw in [Chapter 5](/course/chapter5), the `Dataset.filter()` function allows us to slice a dataset very efficiently, so we can define a simple function to do this:
+
+```python
+def filter_books(example):
+    return (
+        example["product_category"] == "book"
+        or example["product_category"] == "digital_ebook_purchase"
+    )
+```
+
+Now when we apply this function to `english_dataset` and `spanish_dataset`, the result will contain just those rows involving the book categories. Before applying the filter, let's switch the format of `english_dataset` from `"pandas"` back to `"arrow"`:
+
+```python
+english_dataset.reset_format()
+```
+
+We can then apply the filter function, and as a sanity check let's inspect a sample of reviews to see if they are indeed about books:
+
+```python
+spanish_books = spanish_dataset.filter(filter_books)
+english_books = english_dataset.filter(filter_books)
+show_samples(english_books)
+```
+
+```python out
+'>> Title: I\'m dissapointed.'
+'>> Review: I guess I had higher expectations for this book from the reviews. I really thought I\'d at least like it. The plot idea was great. I loved Ash but, it just didnt go anywhere. Most of the book was about their radio show and talking to callers. I wanted the author to dig deeper so we could really get to know the characters. All we know about Grace is that she is attractive looking, Latino and is kind of a brat. I\'m dissapointed.'
+
+'>> Title: Good art, good price, poor design'
+'>> Review: I had gotten the DC Vintage calendar the past two years, but it was on backorder forever this year and I saw they had shrunk the dimensions for no good reason. This one has good art choices but the design has the fold going through the picture, so it\'s less aesthetically pleasing, especially if you want to keep a picture to hang. For the price, a good calendar'
+
+'>> Title: Helpful'
+'>> Review: Nearly all the tips useful and. I consider myself an intermediate to advanced user of OneNote. I would highly recommend.'
+```
+
+Okay, we can see that the reviews are not strictly about books and might refer to things like calendars and electronic applications such as OneNote. Nevertheless, the domain seems about right to train a summarization model on. Before we look at various models that are suitable for this task, we have one last bit of data preparation to do: combining the English and Spanish reviews as a single `DatasetDict` object. 🤗 Datasets provides a handy `concatenate_datasets()` function that (as the name suggests) will stack two `Dataset` objects on top of each other. So, to create our bilingual dataset, we'll loop over each split, concatenate the datasets for that split, and shuffle the result to ensure our model doesn't overfit to a single language:
+
+```python
+from datasets import concatenate_datasets, DatasetDict
+
+books_dataset = DatasetDict()
+
+for split in english_books.keys():
+    books_dataset[split] = concatenate_datasets(
+        [english_books[split], spanish_books[split]]
+    )
+    books_dataset[split] = books_dataset[split].shuffle(seed=42)
+
+# Peek at a few examples
+show_samples(books_dataset)
+```
+
+```python out
+'>> Title: Easy to follow!!!!'
+'>> Review: I loved The dash diet weight loss Solution. Never hungry. I would recommend this diet. Also the menus are well rounded. Try it. Has lots of the information need thanks.'
+
+'>> Title: PARCIALMENTE DAÑADO'
+'>> Review: Me llegó el día que tocaba, junto a otros libros que pedí, pero la caja llegó en mal estado lo cual dañó las esquinas de los libros porque venían sin protección (forro).'
+
+'>> Title: no lo he podido descargar'
+'>> Review: igual que el anterior'
+```
+
+This certainly looks like a mix of English and Spanish reviews! Now that we have a training corpus, one final thing to check is the distribution of words in the reviews and their titles. This is especially important for summarization tasks, where short reference summaries in the data can bias the model to only output one or two words in the generated summaries. The plots below show the word distributions, and we can see that the titles are heavily skewed toward just 1-2 words:
+
+<div class="flex justify-center">
+<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/review-lengths.svg" alt="Word count distributions for the review titles and texts."/>
+<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/review-lengths-dark.svg" alt="Word count distributions for the review titles and texts."/>
+</div>
+
+To deal with this, we'll filter out the examples with very short titles so that our model can produce more interesting summaries. Since we're dealing with English and Spanish texts, we can use a rough heuristic to split the titles on whitespace and then use our trusty `Dataset.filter()` method as follows:
+
+```python
+books_dataset = books_dataset.filter(lambda x: len(x["review_title"].split()) > 2)
+```
+
+Now that we've prepared our corpus, let's take a look at a few possible Transformer models that one might fine-tune on it!
+
+## Models for text summarization[[models-for-text-summarization]]
+
+If you think about it, text summarization is a similar sort of task to machine translation: we have a body of text like a review that we'd like to "translate" into a shorter version that captures the salient features of the input. Accordingly, most Transformer models for summarization adopt the encoder-decoder architecture that we first encountered in [Chapter 1](/course/chapter1), although there are some exceptions like the GPT family of models which can also be used for summarization in few-shot settings. The following table lists some popular pretrained models that can be fine-tuned for summarization.
+
+| Transformer model | Description                                                                                                                                                                                                    | Multilingual? |
+| :---------: | -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | :-----------: |
+|    [GPT-2](https://huggingface.co/gpt2-xl)    | Although trained as an auto-regressive language model, you can make GPT-2 generate summaries by appending "TL;DR" at the end of the input text.                                                                          |      ❌       |
+|   [PEGASUS](https://huggingface.co/google/pegasus-large)   | Uses a pretraining objective to predict masked sentences in multi-sentence texts. This pretraining objective is closer to summarization than vanilla language modeling and scores highly on popular benchmarks. |      ❌       |
+|     [T5](https://huggingface.co/t5-base)      | A universal Transformer architecture that formulates all tasks in a text-to-text framework; e.g., the input format for the model to summarize a document is `summarize: ARTICLE`.                              |      ❌       |
+|     [mT5](https://huggingface.co/google/mt5-base)     | A multilingual version of T5, pretrained on the multilingual Common Crawl corpus (mC4), covering 101 languages.                                                                                                |      ✅       |
+|    [BART](https://huggingface.co/facebook/bart-base)     | A novel Transformer architecture with both an encoder and a decoder stack trained to reconstruct corrupted input that combines the pretraining schemes of BERT and GPT-2.                                    |      ❌       |
+|  [mBART-50](https://huggingface.co/facebook/mbart-large-50)   | A multilingual version of BART, pretrained on 50 languages.                                                                                                                                                     |      ✅       |
+
+As you can see from this table, the majority of Transformer models for summarization (and indeed most NLP tasks) are monolingual. This is great if your task is in a "high-resource" language like English or German, but less so for the thousands of other languages in use across the world. Fortunately, there is a class of multilingual Transformer models, like mT5 and mBART, that come to the rescue. These models are pretrained using language modeling, but with a twist: instead of training on a corpus of one language, they are trained jointly on texts in over 50 languages at once!
+
+We'll focus on mT5, an interesting architecture based on T5 that was pretrained in a text-to-text framework. In T5, every NLP task is formulated in terms of a prompt prefix like `summarize:` which conditions the model to adapt the generated text to the prompt. As shown in the figure below, this makes T5 extremely versatile, as you can solve many tasks with a single model!
+
+<div class="flex justify-center">
+<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/t5.svg" alt="Different tasks performed by the T5 architecture."/>
+<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/t5-dark.svg" alt="Different tasks performed by the T5 architecture."/>
+</div>
+
+mT5 doesn't use prefixes, but shares much of the versatility of T5 and has the advantage of being multilingual. Now that we've picked a model, let's take a look at preparing our data for training.
+
+
+<Tip>
+
+✏️ **Try it out!** Once you've worked through this section, see how well mT5 compares to mBART by fine-tuning the latter with the same techniques. For bonus points, you can also try fine-tuning T5 on just the English reviews. Since T5 has a special prefix prompt, you'll need to prepend `summarize:` to the input examples in the preprocessing steps below.
+
+</Tip>
+
+## Preprocessing the data[[preprocessing-the-data]]
+
+<Youtube id="1m7BerpSq8A"/>
+
+Our next task is to tokenize and encode our reviews and their titles. As usual, we begin by loading the tokenizer associated with the pretrained model checkpoint. We'll use `mt5-small` as our checkpoint so we can fine-tune the model in a reasonable amount of time:
+
+```python
+from transformers import AutoTokenizer
+
+model_checkpoint = "google/mt5-small"
+tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
+```
+
+<Tip>
+
+💡 In the early stages of your NLP projects, a good practice is to train a class of "small" models on a small sample of data. This allows you to debug and iterate faster toward an end-to-end workflow. Once you are confident in the results, you can always scale up the model by simply changing the model checkpoint!
+
+</Tip>
+
+Let's test out the mT5 tokenizer on a small example:
+
+```python
+inputs = tokenizer("I loved reading the Hunger Games!")
+inputs
+```
+
+```python out
+{'input_ids': [336, 259, 28387, 11807, 287, 62893, 295, 12507, 1], 'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1, 1]}
+```
+
+Here we can see the familiar `input_ids` and `attention_mask` that we encountered in our first fine-tuning experiments back in [Chapter 3](/course/chapter3). Let's decode these input IDs with the tokenizer's `convert_ids_to_tokens()` function to see what kind of tokenizer we're dealing with:
+
+```python
+tokenizer.convert_ids_to_tokens(inputs.input_ids)
+```
+
+```python out
+['▁I', '▁', 'loved', '▁reading', '▁the', '▁Hung', 'er', '▁Games', '</s>']
+```
+
+The special Unicode character `▁` and end-of-sequence token `</s>` indicate that we're dealing with the SentencePiece tokenizer, which is based on the Unigram segmentation algorithm discussed in [Chapter 6](/course/chapter6). Unigram is especially useful for multilingual corpora since it allows SentencePiece to be agnostic about accents, punctuation, and the fact that many languages, like Japanese, do not have whitespace characters.
+
+To tokenize our corpus, we have to deal with a subtlety associated with summarization: because our labels are also text, it is possible that they exceed the model's maximum context size. This means we need to apply truncation to both the reviews and their titles to ensure we don't pass excessively long inputs to our model. The tokenizers in 🤗 Transformers provide a nifty `text_target` argument that allows you to tokenize the labels in parallel to the inputs. Here is an example of how the inputs and targets are processed for mT5:
+
+```python
+max_input_length = 512
+max_target_length = 30
+
+
+def preprocess_function(examples):
+    model_inputs = tokenizer(
+        examples["review_body"],
+        max_length=max_input_length,
+        truncation=True,
+    )
+    labels = tokenizer(
+        examples["review_title"], max_length=max_target_length, truncation=True
+    )
+    model_inputs["labels"] = labels["input_ids"]
+    return model_inputs
+```
+
+Let's walk through this code to understand what's happening. The first thing we've done is define values for `max_input_length` and `max_target_length`, which set the upper limits for how long our reviews and titles can be. Since the review body is typically much larger than the title, we've scaled these values accordingly.
+
+With `preprocess_function()`, it is then a simple matter to tokenize the whole corpus using the handy `Dataset.map()` function we've used extensively throughout this course:
+
+```python
+tokenized_datasets = books_dataset.map(preprocess_function, batched=True)
+```
+
+Now that the corpus has been preprocessed, let's take a look at some metrics that are commonly used for summarization. As we'll see, there is no silver bullet when it comes to measuring the quality of machine-generated text.
+
+<Tip>
+
+💡 You may have noticed that we used `batched=True` in our `Dataset.map()` function above. This encodes the examples in batches of 1,000 (the default) and allows you to make use of the multithreading capabilities of the fast tokenizers in 🤗 Transformers. Where possible, try using `batched=True` to get the most out of your preprocessing!
+
+</Tip>
+
+
+## Metrics for text summarization[[metrics-for-text-summarization]]
+
+<Youtube id="TMshhnrEXlg"/>
+
+In comparison to most of the other tasks we've covered in this course, measuring the performance of text generation tasks like summarization or translation is not as straightforward. For example, given a review like "I loved reading the Hunger Games", there are multiple valid summaries, like "I loved the Hunger Games" or "Hunger Games is a great read". Clearly, applying some sort of exact match between the generated summary and the label is not a good solution -- even humans would fare poorly under such a metric, because we all have our own writing style.
+
+For summarization, one of the most commonly used metrics is the [ROUGE score](https://en.wikipedia.org/wiki/ROUGE_(metric)) (short for Recall-Oriented Understudy for Gisting Evaluation). The basic idea behind this metric is to compare a generated summary against a set of reference summaries that are typically created by humans. To make this more precise, suppose we want to compare the following two summaries:
+
+```python
+generated_summary = "I absolutely loved reading the Hunger Games"
+reference_summary = "I loved reading the Hunger Games"
+```
+
+One way to compare them could be to count the number of overlapping words, which in this case would be 6. However, this is a bit crude, so instead ROUGE is based on computing the _precision_ and _recall_ scores for the overlap.
+
+<Tip>
+
+🙋 Don't worry if this is the first time you've heard of precision and recall -- we'll go through some explicit examples together to make it all clear. These metrics are usually encountered in classification tasks, so if you want to understand how precision and recall are defined in that context, we recommend checking out the `scikit-learn` [guides](https://scikit-learn.org/stable/auto_examples/model_selection/plot_precision_recall.html).
+
+</Tip>
+
+For ROUGE, recall measures how much of the reference summary is captured by the generated one. If we are just comparing words, recall can be calculated according to the following formula:
+
+$$ \mathrm{Recall} = \frac{\mathrm{Number\,of\,overlapping\, words}}{\mathrm{Total\, number\, of\, words\, in\, reference\, summary}} $$
+
+For our simple example above, this formula gives a perfect recall of 6/6 = 1; i.e., all the words in the reference summary have been produced by the model. This may sound great, but imagine if our generated summary had been "I really really loved reading the Hunger Games all night". This would also have perfect recall, but is arguably a worse summary since it is verbose. To deal with these scenarios we also compute the precision, which in the ROUGE context measures how much of the generated summary was relevant:
+
+$$ \mathrm{Precision} = \frac{\mathrm{Number\,of\,overlapping\, words}}{\mathrm{Total\, number\, of\, words\, in\, generated\, summary}} $$
+
+Applying this to our verbose summary gives a precision of 6/10  = 0.6, which is considerably worse than the precision of 6/7 = 0.86 obtained by our shorter one. In practice, both precision and recall are usually computed, and then the F1-score (the harmonic mean of precision and recall) is reported. We can do this easily in 🤗 Datasets by first installing the `rouge_score` package:
+
+```py
+!pip install rouge_score
+```
+
+and then loading the ROUGE metric as follows:
+
+```python
+import evaluate
+
+rouge_score = evaluate.load("rouge")
+```
+
+Then we can use the `rouge_score.compute()` function to calculate all the metrics at once:
+
+```python
+scores = rouge_score.compute(
+    predictions=[generated_summary], references=[reference_summary]
+)
+scores
+```
+
+```python out
+{'rouge1': AggregateScore(low=Score(precision=0.86, recall=1.0, fmeasure=0.92), mid=Score(precision=0.86, recall=1.0, fmeasure=0.92), high=Score(precision=0.86, recall=1.0, fmeasure=0.92)),
+ 'rouge2': AggregateScore(low=Score(precision=0.67, recall=0.8, fmeasure=0.73), mid=Score(precision=0.67, recall=0.8, fmeasure=0.73), high=Score(precision=0.67, recall=0.8, fmeasure=0.73)),
+ 'rougeL': AggregateScore(low=Score(precision=0.86, recall=1.0, fmeasure=0.92), mid=Score(precision=0.86, recall=1.0, fmeasure=0.92), high=Score(precision=0.86, recall=1.0, fmeasure=0.92)),
+ 'rougeLsum': AggregateScore(low=Score(precision=0.86, recall=1.0, fmeasure=0.92), mid=Score(precision=0.86, recall=1.0, fmeasure=0.92), high=Score(precision=0.86, recall=1.0, fmeasure=0.92))}
+```
+
+Whoa, there's a lot of information in that output -- what does it all mean? First, 🤗 Datasets actually computes confidence intervals for precision, recall, and F1-score; these are the `low`, `mid`, and `high` attributes you can see here. Moreover, 🤗 Datasets computes a variety of ROUGE scores which are based on different types of text granularity when comparing the generated and reference summaries. The `rouge1` variant is the overlap of unigrams -- this is just a fancy way of saying the overlap of words and is exactly the metric we've discussed above. To verify this, let's pull out the `mid` value of our scores:
+
+```python
+scores["rouge1"].mid
+```
+
+```python out
+Score(precision=0.86, recall=1.0, fmeasure=0.92)
+```
+
+Great, the precision and recall numbers match up! Now what about those other ROUGE scores? `rouge2` measures the overlap between bigrams (think the overlap of pairs of words), while `rougeL` and `rougeLsum` measure the longest matching sequences of words by looking for the longest common substrings in the generated and reference summaries. The "sum" in `rougeLsum` refers to the fact that this metric is computed over a whole summary, while `rougeL` is computed as the average over individual sentences.
+
+<Tip>
+
+✏️ **Try it out!** Create your own example of a generated and reference summary and see if the resulting ROUGE scores agree with a manual calculation based on the formulas for precision and recall. For bonus points, split the text into bigrams and compare the precision and recall for the `rouge2` metric.
+
+</Tip>
+
+We'll use these ROUGE scores to track the performance of our model, but before doing that let's do something every good NLP practitioner should do: create a strong, yet simple baseline!
+
+### Creating a strong baseline[[creating-a-strong-baseline]]
+
+A common baseline for text summarization is to simply take the first three sentences of an article, often called the _lead-3_ baseline. We could use full stops to track the sentence boundaries, but this will fail on acronyms like "U.S." or "U.N." -- so instead we'll use the `nltk` library, which includes a better algorithm to handle these cases. You can install the package using `pip` as follows:
+
+```python
+!pip install nltk
+```
+
+and then download the punctuation rules:
+
+```python
+import nltk
+
+nltk.download("punkt")
+```
+
+Next, we import the sentence tokenizer from `nltk` and create a simple function to extract the first three sentences in a review. The convention in text summarization is to separate each summary with a newline, so let's also include this and test it on a training example:
+
+```python
+from nltk.tokenize import sent_tokenize
+
+
+def three_sentence_summary(text):
+    return "\n".join(sent_tokenize(text)[:3])
+
+
+print(three_sentence_summary(books_dataset["train"][1]["review_body"]))
+```
+
+```python out
+'I grew up reading Koontz, and years ago, I stopped,convinced i had "outgrown" him.'
+'Still,when a friend was looking for something suspenseful too read, I suggested Koontz.'
+'She found Strangers.'
+```
+
+This seems to work, so let's now implement a function that extracts these "summaries" from a dataset and computes the ROUGE scores for the baseline:
+
+```python
+def evaluate_baseline(dataset, metric):
+    summaries = [three_sentence_summary(text) for text in dataset["review_body"]]
+    return metric.compute(predictions=summaries, references=dataset["review_title"])
+```
+
+We can then use this function to compute the ROUGE scores over the validation set and prettify them a bit using Pandas:
+
+```python
+import pandas as pd
+
+score = evaluate_baseline(books_dataset["validation"], rouge_score)
+rouge_names = ["rouge1", "rouge2", "rougeL", "rougeLsum"]
+rouge_dict = dict((rn, round(score[rn].mid.fmeasure * 100, 2)) for rn in rouge_names)
+rouge_dict
+```
+
+```python out
+{'rouge1': 16.74, 'rouge2': 8.83, 'rougeL': 15.6, 'rougeLsum': 15.96}
+```
+
+We can see that the `rouge2` score is significantly lower than the rest; this likely reflects the fact that review titles are typically concise and so the lead-3 baseline is too verbose. Now that we have a good baseline to work from, let's turn our attention toward fine-tuning mT5!
+
+{#if fw === 'pt'}
+
+## Fine-tuning mT5 with the `Trainer` API[[fine-tuning-mt5-with-the-trainer-api]]
+
+Fine-tuning a model for summarization is very similar to the other tasks we've covered in this chapter. The first thing we need to do is load the pretrained model from the `mt5-small` checkpoint. Since summarization is a sequence-to-sequence task, we can load the model with the `AutoModelForSeq2SeqLM` class, which will automatically download and cache the weights:
+
+```python
+from transformers import AutoModelForSeq2SeqLM
+
+model = AutoModelForSeq2SeqLM.from_pretrained(model_checkpoint)
+```
+
+{:else}
+
+## Fine-tuning mT5 with Keras[[fine-tuning-mt5-with-keras]]
+
+Fine-tuning a model for summarization is very similar to the other tasks we've covered in this chapter. The first thing we need to do is load the pretrained model from the `mt5-small` checkpoint. Since summarization is a sequence-to-sequence task, we can load the model with the `TFAutoModelForSeq2SeqLM` class, which will automatically download and cache the weights:
+
+```python
+from transformers import TFAutoModelForSeq2SeqLM
+
+model = TFAutoModelForSeq2SeqLM.from_pretrained(model_checkpoint)
+```
+
+{/if}
+
+<Tip>
+
+💡 If you're wondering why you don't see any warnings about fine-tuning the model on a downstream task, that's because for sequence-to-sequence tasks we keep all the weights of the network. Compare this to our text classification model in [Chapter 3](/course/chapter3), where the head of the pretrained model was replaced with a randomly initialized network.
+
+</Tip>
+
+The next thing we need to do is log in to the Hugging Face Hub. If you're running this code in a notebook, you can do so with the following utility function:
+
+```python
+from huggingface_hub import notebook_login
+
+notebook_login()
+```
+
+which will display a widget where you can enter your credentials. Alternatively, you can run this command in your terminal and log in there:
+
+```
+huggingface-cli login
+```
+
+{#if fw === 'pt'}
+
+We'll need to generate summaries in order to compute ROUGE scores during training. Fortunately, 🤗 Transformers provides dedicated `Seq2SeqTrainingArguments` and `Seq2SeqTrainer` classes that can do this for us automatically! To see how this works, let's first define the hyperparameters and other arguments for our experiments:
+
+```python
+from transformers import Seq2SeqTrainingArguments
+
+batch_size = 8
+num_train_epochs = 8
+# Show the training loss with every epoch
+logging_steps = len(tokenized_datasets["train"]) // batch_size
+model_name = model_checkpoint.split("/")[-1]
+
+args = Seq2SeqTrainingArguments(
+    output_dir=f"{model_name}-finetuned-amazon-en-es",
+    evaluation_strategy="epoch",
+    learning_rate=5.6e-5,
+    per_device_train_batch_size=batch_size,
+    per_device_eval_batch_size=batch_size,
+    weight_decay=0.01,
+    save_total_limit=3,
+    num_train_epochs=num_train_epochs,
+    predict_with_generate=True,
+    logging_steps=logging_steps,
+    push_to_hub=True,
+)
+```
+
+Here, the `predict_with_generate` argument has been set to indicate that we should generate summaries during evaluation so that we can compute ROUGE scores for each epoch. As discussed in [Chapter 1](/course/chapter1), the decoder performs inference by predicting tokens one by one, and this is implemented by the model's `generate()` method. Setting `predict_with_generate=True` tells the `Seq2SeqTrainer` to use that method for evaluation. We've also adjusted some of the default hyperparameters, like the learning rate, number of epochs, and weight decay, and we've set the `save_total_limit` option to only save up to 3 checkpoints during training -- this is because even the "small" version of mT5 uses around a GB of hard drive space, and we can save a bit of room by limiting the number of copies we save.
+
+The `push_to_hub=True` argument will allow us to push the model to the Hub after training; you'll find the repository under your user profile in the location defined by `output_dir`. Note that you can specify the name of the repository you want to push to with the `hub_model_id` argument (in particular, you will have to use this argument to push to an organization). For instance, when we pushed the model to the [`huggingface-course` organization](https://huggingface.co/huggingface-course), we added `hub_model_id="huggingface-course/mt5-finetuned-amazon-en-es"` to `Seq2SeqTrainingArguments`.
+
+The next thing we need to do is provide the trainer with a `compute_metrics()` function so that we can evaluate our model during training. For summarization this is a bit more involved than simply calling `rouge_score.compute()` on the model's predictions, since we need to _decode_ the outputs and labels into text before we can compute the ROUGE scores. The following function does exactly that, and also makes use of the `sent_tokenize()` function from `nltk` to separate the summary sentences with newlines:
+
+```python
+import numpy as np
+
+
+def compute_metrics(eval_pred):
+    predictions, labels = eval_pred
+    # Decode generated summaries into text
+    decoded_preds = tokenizer.batch_decode(predictions, skip_special_tokens=True)
+    # Replace -100 in the labels as we can't decode them
+    labels = np.where(labels != -100, labels, tokenizer.pad_token_id)
+    # Decode reference summaries into text
+    decoded_labels = tokenizer.batch_decode(labels, skip_special_tokens=True)
+    # ROUGE expects a newline after each sentence
+    decoded_preds = ["\n".join(sent_tokenize(pred.strip())) for pred in decoded_preds]
+    decoded_labels = ["\n".join(sent_tokenize(label.strip())) for label in decoded_labels]
+    # Compute ROUGE scores
+    result = rouge_score.compute(
+        predictions=decoded_preds, references=decoded_labels, use_stemmer=True
+    )
+    # Extract the median scores
+    result = {key: value.mid.fmeasure * 100 for key, value in result.items()}
+    return {k: round(v, 4) for k, v in result.items()}
+```
+
+{/if}
+
+Next, we need to define a data collator for our sequence-to-sequence task. Since mT5 is an encoder-decoder Transformer model, one subtlety with preparing our batches is that during decoding we need to shift the labels to the right by one. This is required to ensure that the decoder only sees the previous ground truth labels and not the current or future ones, which would be easy for the model to memorize. This is similar to how masked self-attention is applied to the inputs in a task like [causal language modeling](/course/chapter7/6).
+
+Luckily, 🤗 Transformers provides a `DataCollatorForSeq2Seq` collator that will dynamically pad the inputs and the labels for us. To instantiate this collator, we simply need to provide the `tokenizer` and `model`:
+
+{#if fw === 'pt'}
+
+```python
+from transformers import DataCollatorForSeq2Seq
+
+data_collator = DataCollatorForSeq2Seq(tokenizer, model=model)
+```
+
+{:else}
+
+```python
+from transformers import DataCollatorForSeq2Seq
+
+data_collator = DataCollatorForSeq2Seq(tokenizer, model=model, return_tensors="tf")
+```
+
+{/if}
+
+Let's see what this collator produces when fed a small batch of examples. First, we need to remove the columns with strings because the collator won't know how to pad these elements:
+
+```python
+tokenized_datasets = tokenized_datasets.remove_columns(
+    books_dataset["train"].column_names
+)
+```
+
+Since the collator expects a list of `dict`s, where each `dict` represents a single example in the dataset, we also need to wrangle the data into the expected format before passing it to the data collator:
+
+```python
+features = [tokenized_datasets["train"][i] for i in range(2)]
+data_collator(features)
+```
+
+```python out
+{'attention_mask': tensor([[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
+         1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0],
+        [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
+         1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]]), 'input_ids': tensor([[  1494,    259,   8622,    390,    259,    262,   2316,   3435,    955,
+            772,    281,    772,   1617,    263,    305,  14701,    260,   1385,
+           3031,    259,  24146,    332,   1037,    259,  43906,    305,    336,
+            260,      1,      0,      0,      0,      0,      0,      0],
+        [   259,  27531,  13483,    259,   7505,    260, 112240,  15192,    305,
+          53198,    276,    259,  74060,    263,    260,    459,  25640,    776,
+           2119,    336,    259,   2220,    259,  18896,    288,   4906,    288,
+           1037,   3931,    260,   7083, 101476,   1143,    260,      1]]), 'labels': tensor([[ 7483,   259,  2364, 15695,     1,  -100],
+        [  259, 27531, 13483,   259,  7505,     1]]), 'decoder_input_ids': tensor([[    0,  7483,   259,  2364, 15695,     1],
+        [    0,   259, 27531, 13483,   259,  7505]])}
+```
+
+The main thing to notice here is that the first example is longer than the second one, so the `input_ids` and `attention_mask` of the second example have been padded on the right with a `[PAD]` token (whose ID is `0`). Similarly, we can see that the `labels` have been padded with `-100`s, to make sure the padding tokens are ignored by the loss function. And finally, we can see a new `decoder_input_ids` which has shifted the labels to the right by inserting a `[PAD]` token in the first entry.
+
+{#if fw === 'pt'}
+
+We finally have all the ingredients we need to train with! We now simply need to instantiate the trainer with the standard arguments:
+
+```python
+from transformers import Seq2SeqTrainer
+
+trainer = Seq2SeqTrainer(
+    model,
+    args,
+    train_dataset=tokenized_datasets["train"],
+    eval_dataset=tokenized_datasets["validation"],
+    data_collator=data_collator,
+    tokenizer=tokenizer,
+    compute_metrics=compute_metrics,
+)
+```
+
+and launch our training run:
+
+```python
+trainer.train()
+```
+
+During training, you should see the training loss decrease and the ROUGE scores increase with each epoch. Once the training is complete, you can see the final ROUGE scores by running `Trainer.evaluate()`:
+
+```python
+trainer.evaluate()
+```
+
+```python out
+{'eval_loss': 3.028524398803711,
+ 'eval_rouge1': 16.9728,
+ 'eval_rouge2': 8.2969,
+ 'eval_rougeL': 16.8366,
+ 'eval_rougeLsum': 16.851,
+ 'eval_gen_len': 10.1597,
+ 'eval_runtime': 6.1054,
+ 'eval_samples_per_second': 38.982,
+ 'eval_steps_per_second': 4.914}
+```
+
+From the scores we can see that our model has handily outperformed our lead-3 baseline -- nice! The final thing to do is push the model weights to the Hub, as follows:
+
+```
+trainer.push_to_hub(commit_message="Training complete", tags="summarization")
+```
+
+```python out
+'https://huggingface.co/huggingface-course/mt5-finetuned-amazon-en-es/commit/aa0536b829b28e73e1e4b94b8a5aacec420d40e0'
+```
+
+This will save the checkpoint and configuration files to `output_dir`, before uploading all the files to the Hub. By specifying the `tags` argument, we also ensure that the widget on the Hub will be one for a summarization pipeline instead of the default text generation one associated with the mT5 architecture (for more information about model tags, see the [🤗 Hub documentation](https://huggingface.co/docs/hub/main#how-is-a-models-type-of-inference-api-and-widget-determined)). The output from `trainer.push_to_hub()` is a URL to the Git commit hash, so you can easily see the changes that were made to the model repository!
+
+To wrap up this section, let's take a look at how we can also fine-tune mT5 using the low-level features provided by 🤗 Accelerate.
+
+{:else}
+
+We're almost ready to train! We just need to convert our datasets to `tf.data.Dataset`s using the data collator we defined above, and then `compile()` and `fit()` the model. First, the datasets:
+
+```python
+tf_train_dataset = model.prepare_tf_dataset(
+    tokenized_datasets["train"],
+    collate_fn=data_collator,
+    shuffle=True,
+    batch_size=8,
+)
+tf_eval_dataset = model.prepare_tf_dataset(
+    tokenized_datasets["validation"],
+    collate_fn=data_collator,
+    shuffle=False,
+    batch_size=8,
+)
+```
+
+Now, we define our training hyperparameters and compile:
+
+```python
+from transformers import create_optimizer
+import tensorflow as tf
+
+# The number of training steps is the number of samples in the dataset, divided by the batch size then multiplied
+# by the total number of epochs. Note that the tf_train_dataset here is a batched tf.data.Dataset,
+# not the original Hugging Face Dataset, so its len() is already num_samples // batch_size.
+num_train_epochs = 8
+num_train_steps = len(tf_train_dataset) * num_train_epochs
+model_name = model_checkpoint.split("/")[-1]
+
+optimizer, schedule = create_optimizer(
+    init_lr=5.6e-5,
+    num_warmup_steps=0,
+    num_train_steps=num_train_steps,
+    weight_decay_rate=0.01,
+)
+
+model.compile(optimizer=optimizer)
+
+# Train in mixed-precision float16
+tf.keras.mixed_precision.set_global_policy("mixed_float16")
+```
+
+And finally, we fit the model. We use a `PushToHubCallback` to save the model to the Hub after each epoch, which will allow us to use it for inference later:
+
+```python
+from transformers.keras_callbacks import PushToHubCallback
+
+callback = PushToHubCallback(
+    output_dir=f"{model_name}-finetuned-amazon-en-es", tokenizer=tokenizer
+)
+
+model.fit(
+    tf_train_dataset, validation_data=tf_eval_dataset, callbacks=[callback], epochs=8
+)
+```
+
+We got some loss values during training, but really we'd like to see the ROUGE metrics we computed earlier. To get those metrics, we'll need to generate outputs from the model and convert them to strings. Let's build some lists of labels and predictions for the ROUGE metric to compare (note that if you get import errors for this section, you may need to`!pip install tqdm`). We're also going to use a trick that dramatically increases performance - compiling our generation code with [XLA](https://www.tensorflow.org/xla), TensorFlow's accelerated linear algebra compiler. XLA applies various optimizations to the model's computation graph, and results in significant improvements to speed and memory usage. As described in the Hugging Face [blog](https://huggingface.co/blog/tf-xla-generate), XLA works best when our input shapes don't vary too much. To handle this, we'll pad our inputs to multiples of 128, and make a new dataset with the padding collator, and then we'll apply the `@tf.function(jit_compile=True)` decorator to our generation function, which marks the whole function for compilation with XLA. 
+
+```python
+from tqdm import tqdm
+import numpy as np
+
+generation_data_collator = DataCollatorForSeq2Seq(
+    tokenizer, model=model, return_tensors="tf", pad_to_multiple_of=320
+)
+
+tf_generate_dataset = model.prepare_tf_dataset(
+    tokenized_datasets["validation"],
+    collate_fn=generation_data_collator,
+    shuffle=False,
+    batch_size=8,
+    drop_remainder=True,
+)
+
+
+@tf.function(jit_compile=True)
+def generate_with_xla(batch):
+    return model.generate(
+        input_ids=batch["input_ids"],
+        attention_mask=batch["attention_mask"],
+        max_new_tokens=32,
+    )
+
+
+all_preds = []
+all_labels = []
+for batch, labels in tqdm(tf_generate_dataset):
+    predictions = generate_with_xla(batch)
+    decoded_preds = tokenizer.batch_decode(predictions, skip_special_tokens=True)
+    labels = labels.numpy()
+    labels = np.where(labels != -100, labels, tokenizer.pad_token_id)
+    decoded_labels = tokenizer.batch_decode(labels, skip_special_tokens=True)
+    decoded_preds = ["\n".join(sent_tokenize(pred.strip())) for pred in decoded_preds]
+    decoded_labels = ["\n".join(sent_tokenize(label.strip())) for label in decoded_labels]
+    all_preds.extend(decoded_preds)
+    all_labels.extend(decoded_labels)
+```
+
+Once we have our lists of label and prediction strings, computing the ROUGE score is easy:
+
+```python
+result = rouge_score.compute(
+    predictions=decoded_preds, references=decoded_labels, use_stemmer=True
+)
+result = {key: value.mid.fmeasure * 100 for key, value in result.items()}
+{k: round(v, 4) for k, v in result.items()}
+```
+
+```
+{'rouge1': 31.4815, 'rouge2': 25.4386, 'rougeL': 31.4815, 'rougeLsum': 31.4815}
+```
+
+
+{/if}
+
+{#if fw === 'pt'}
+
+## Fine-tuning mT5 with 🤗 Accelerate[[fine-tuning-mt5-with-accelerate]]
+
+Fine-tuning our model with 🤗 Accelerate is very similar to the text classification example we encountered in [Chapter 3](/course/chapter3). The main differences will be the need to explicitly generate our summaries during training and define how we compute the ROUGE scores (recall that the `Seq2SeqTrainer` took care of the generation for us). Let's take a look how we can implement these two requirements within 🤗 Accelerate!
+
+### Preparing everything for training[[preparing-everything-for-training]]
+
+The first thing we need to do is create a `DataLoader` for each of our splits. Since the PyTorch dataloaders expect batches of tensors, we need to set the format to `"torch"` in our datasets:
+
+```python
+tokenized_datasets.set_format("torch")
+```
+
+Now that we've got datasets consisting of just tensors, the next thing to do is instantiate the `DataCollatorForSeq2Seq` again. For this we need to provide a fresh version of the model, so let's load it again from our cache:
+
+```python
+model = AutoModelForSeq2SeqLM.from_pretrained(model_checkpoint)
+```
+
+We can then instantiate the data collator and use this to define our dataloaders:
+
+```python
+from torch.utils.data import DataLoader
+
+batch_size = 8
+train_dataloader = DataLoader(
+    tokenized_datasets["train"],
+    shuffle=True,
+    collate_fn=data_collator,
+    batch_size=batch_size,
+)
+eval_dataloader = DataLoader(
+    tokenized_datasets["validation"], collate_fn=data_collator, batch_size=batch_size
+)
+```
+
+The next thing to do is define the optimizer we want to use. As in our other examples, we'll use `AdamW`, which works well for most problems:
+
+```python
+from torch.optim import AdamW
+
+optimizer = AdamW(model.parameters(), lr=2e-5)
+```
+
+Finally, we feed our model, optimizer, and dataloaders to the `accelerator.prepare()` method:
+
+```python
+from accelerate import Accelerator
+
+accelerator = Accelerator()
+model, optimizer, train_dataloader, eval_dataloader = accelerator.prepare(
+    model, optimizer, train_dataloader, eval_dataloader
+)
+```
+
+<Tip>
+
+🚨 If you're training on a TPU, you'll need to move all the code above into a dedicated training function. See [Chapter 3](/course/chapter3) for more details.
+
+</Tip>
+
+Now that we've prepared our objects, there are three remaining things to do:
+
+* Define the learning rate schedule.
+* Implement a function to post-process the summaries for evaluation.
+* Create a repository on the Hub that we can push our model to.
+
+For the learning rate schedule, we'll use the standard linear one from previous sections:
+
+```python
+from transformers import get_scheduler
+
+num_train_epochs = 10
+num_update_steps_per_epoch = len(train_dataloader)
+num_training_steps = num_train_epochs * num_update_steps_per_epoch
+
+lr_scheduler = get_scheduler(
+    "linear",
+    optimizer=optimizer,
+    num_warmup_steps=0,
+    num_training_steps=num_training_steps,
+)
+```
+
+For post-processing, we need a function that splits the generated summaries into sentences that are separated by newlines. This is the format the ROUGE metric expects, and we can achieve this with the following snippet of code:
+
+```python
+def postprocess_text(preds, labels):
+    preds = [pred.strip() for pred in preds]
+    labels = [label.strip() for label in labels]
+
+    # ROUGE expects a newline after each sentence
+    preds = ["\n".join(nltk.sent_tokenize(pred)) for pred in preds]
+    labels = ["\n".join(nltk.sent_tokenize(label)) for label in labels]
+
+    return preds, labels
+```
+
+This should look familiar to you if you recall how we defined the `compute_metrics()` function of the `Seq2SeqTrainer`. 
+
+Finally, we need to create a model repository on the Hugging Face Hub. For this, we can use the appropriately titled 🤗 Hub library. We just need to define a name for our repository, and the library has a utility function to combine the repository ID with the user profile:
+
+```python
+from huggingface_hub import get_full_repo_name
+
+model_name = "test-bert-finetuned-squad-accelerate"
+repo_name = get_full_repo_name(model_name)
+repo_name
+```
+
+```python out
+'lewtun/mt5-finetuned-amazon-en-es-accelerate'
+```
+
+Now we can use this repository name to clone a local version to our results directory that will store the training artifacts:
+
+```python
+from huggingface_hub import Repository
+
+output_dir = "results-mt5-finetuned-squad-accelerate"
+repo = Repository(output_dir, clone_from=repo_name)
+```
+
+This will allow us to push the artifacts back to the Hub by calling the `repo.push_to_hub()` method during training! Let's now wrap up our analysis by writing out the training loop.
+
+### Training loop[[training-loop]]
+
+The training loop for summarization is quite similar to the other 🤗 Accelerate examples that we've encountered and is roughly split into four main steps:
+
+1. Train the model by iterating over all the examples in `train_dataloader` for each epoch.
+2. Generate model summaries at the end of each epoch, by first generating the tokens and then decoding them (and the reference summaries) into text.
+3. Compute the ROUGE scores using the same techniques we saw earlier.
+4. Save the checkpoints and push everything to the Hub. Here we rely on the nifty `blocking=False` argument of the `Repository` object so that we can push the checkpoints per epoch _asynchronously_. This allows us to continue training without having to wait for the somewhat slow upload associated with a GB-sized model!
+
+These steps can be seen in the following block of code:
+
+```python
+from tqdm.auto import tqdm
+import torch
+import numpy as np
+
+progress_bar = tqdm(range(num_training_steps))
+
+for epoch in range(num_train_epochs):
+    # Training
+    model.train()
+    for step, batch in enumerate(train_dataloader):
+        outputs = model(**batch)
+        loss = outputs.loss
+        accelerator.backward(loss)
+
+        optimizer.step()
+        lr_scheduler.step()
+        optimizer.zero_grad()
+        progress_bar.update(1)
+
+    # Evaluation
+    model.eval()
+    for step, batch in enumerate(eval_dataloader):
+        with torch.no_grad():
+            generated_tokens = accelerator.unwrap_model(model).generate(
+                batch["input_ids"],
+                attention_mask=batch["attention_mask"],
+            )
+
+            generated_tokens = accelerator.pad_across_processes(
+                generated_tokens, dim=1, pad_index=tokenizer.pad_token_id
+            )
+            labels = batch["labels"]
+
+            # If we did not pad to max length, we need to pad the labels too
+            labels = accelerator.pad_across_processes(
+                batch["labels"], dim=1, pad_index=tokenizer.pad_token_id
+            )
+
+            generated_tokens = accelerator.gather(generated_tokens).cpu().numpy()
+            labels = accelerator.gather(labels).cpu().numpy()
+
+            # Replace -100 in the labels as we can't decode them
+            labels = np.where(labels != -100, labels, tokenizer.pad_token_id)
+            if isinstance(generated_tokens, tuple):
+                generated_tokens = generated_tokens[0]
+            decoded_preds = tokenizer.batch_decode(
+                generated_tokens, skip_special_tokens=True
+            )
+            decoded_labels = tokenizer.batch_decode(labels, skip_special_tokens=True)
+
+            decoded_preds, decoded_labels = postprocess_text(
+                decoded_preds, decoded_labels
+            )
+
+            rouge_score.add_batch(predictions=decoded_preds, references=decoded_labels)
+
+    # Compute metrics
+    result = rouge_score.compute()
+    # Extract the median ROUGE scores
+    result = {key: value.mid.fmeasure * 100 for key, value in result.items()}
+    result = {k: round(v, 4) for k, v in result.items()}
+    print(f"Epoch {epoch}:", result)
+
+    # Save and upload
+    accelerator.wait_for_everyone()
+    unwrapped_model = accelerator.unwrap_model(model)
+    unwrapped_model.save_pretrained(output_dir, save_function=accelerator.save)
+    if accelerator.is_main_process:
+        tokenizer.save_pretrained(output_dir)
+        repo.push_to_hub(
+            commit_message=f"Training in progress epoch {epoch}", blocking=False
+        )
+```
+
+```python out
+Epoch 0: {'rouge1': 5.6351, 'rouge2': 1.1625, 'rougeL': 5.4866, 'rougeLsum': 5.5005}
+Epoch 1: {'rouge1': 9.8646, 'rouge2': 3.4106, 'rougeL': 9.9439, 'rougeLsum': 9.9306}
+Epoch 2: {'rouge1': 11.0872, 'rouge2': 3.3273, 'rougeL': 11.0508, 'rougeLsum': 10.9468}
+Epoch 3: {'rouge1': 11.8587, 'rouge2': 4.8167, 'rougeL': 11.7986, 'rougeLsum': 11.7518}
+Epoch 4: {'rouge1': 12.9842, 'rouge2': 5.5887, 'rougeL': 12.7546, 'rougeLsum': 12.7029}
+Epoch 5: {'rouge1': 13.4628, 'rouge2': 6.4598, 'rougeL': 13.312, 'rougeLsum': 13.2913}
+Epoch 6: {'rouge1': 12.9131, 'rouge2': 5.8914, 'rougeL': 12.6896, 'rougeLsum': 12.5701}
+Epoch 7: {'rouge1': 13.3079, 'rouge2': 6.2994, 'rougeL': 13.1536, 'rougeLsum': 13.1194}
+Epoch 8: {'rouge1': 13.96, 'rouge2': 6.5998, 'rougeL': 13.9123, 'rougeLsum': 13.7744}
+Epoch 9: {'rouge1': 14.1192, 'rouge2': 7.0059, 'rougeL': 14.1172, 'rougeLsum': 13.9509}
+```
+
+And that's it! Once you run this, you'll have a model and results that are pretty similar to the ones we obtained with the `Trainer`.
+
+{/if}
+
+## Using your fine-tuned model[[using-your-fine-tuned-model]]
+
+Once you've pushed the model to the Hub, you can play with it either via the inference widget or with a `pipeline` object, as follows:
+
+```python
+from transformers import pipeline
+
+hub_model_id = "huggingface-course/mt5-small-finetuned-amazon-en-es"
+summarizer = pipeline("summarization", model=hub_model_id)
+```
+
+We can feed some examples from the test set (which the model has not seen) to our pipeline to get a feel for the quality of the summaries. First let's implement a simple function to show the review, title, and generated summary together:
+
+```python
+def print_summary(idx):
+    review = books_dataset["test"][idx]["review_body"]
+    title = books_dataset["test"][idx]["review_title"]
+    summary = summarizer(books_dataset["test"][idx]["review_body"])[0]["summary_text"]
+    print(f"'>>> Review: {review}'")
+    print(f"\n'>>> Title: {title}'")
+    print(f"\n'>>> Summary: {summary}'")
+```
+
+Let's take a look at one of the English examples we get:
+
+```python
+print_summary(100)
+```
+
+```python out
+'>>> Review: Nothing special at all about this product... the book is too small and stiff and hard to write in. The huge sticker on the back doesn’t come off and looks super tacky. I would not purchase this again. I could have just bought a journal from the dollar store and it would be basically the same thing. It’s also really expensive for what it is.'
+
+'>>> Title: Not impressed at all... buy something else'
+
+'>>> Summary: Nothing special at all about this product'
+```
+
+This is not too bad! We can see that our model has actually been able to perform _abstractive_ summarization by augmenting parts of the review with new words. And perhaps the coolest aspect of our model is that it is bilingual, so we can also generate summaries of Spanish reviews:
+
+```python
+print_summary(0)
+```
+
+```python out
+'>>> Review: Es una trilogia que se hace muy facil de leer. Me ha gustado, no me esperaba el final para nada'
+
+'>>> Title: Buena literatura para adolescentes'
+
+'>>> Summary: Muy facil de leer'
+```
+
+The summary translates into "Very easy to read" in English, which we can see in this case was extracted directly from the review. Nevertheless, this shows the versatility of the mT5 model and has given you a taste of what it's like to deal with a multilingual corpus!
+
+Next, we'll turn our attention to a slightly more complex task: training a language model from scratch.
diff --git a/chapters/ro/chapter7/6.mdx b/chapters/ro/chapter7/6.mdx
new file mode 100644
index 000000000..44551f15d
--- /dev/null
+++ b/chapters/ro/chapter7/6.mdx
@@ -0,0 +1,914 @@
+<FrameworkSwitchCourse {fw} />
+
+# Training a causal language model from scratch[[training-a-causal-language-model-from-scratch]]
+
+{#if fw === 'pt'}
+
+<CourseFloatingBanner chapter={7}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter7/section6_pt.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter7/section6_pt.ipynb"},
+]} />
+
+{:else}
+
+<CourseFloatingBanner chapter={7}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter7/section6_tf.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter7/section6_tf.ipynb"},
+]} />
+
+{/if}
+
+Up until now, we've mostly been using pretrained models and fine-tuning them for new use cases by reusing the weights from pretraining. As we saw in [Chapter 1](/course/chapter1), this is commonly referred to as _transfer learning_, and it's a very successful strategy for applying Transformer models to most real-world use cases where labeled data is sparse. In this chapter, we'll take a different approach and train a completely new model from scratch. This is a good approach to take if you have a lot of data and it is very different from the pretraining data used for the available models. However, it also requires considerably more compute resources to pretrain a language model than just to fine-tune an existing one. Examples where it can make sense to train a new model include for datasets consisting of musical notes, molecular sequences such as DNA, or programming languages. The latter have recently gained traction thanks to tools such as TabNine and GitHub's Copilot, powered by OpenAI's Codex model, that can generate long sequences of code. This task of text generation is best addressed with auto-regressive or causal language models such as GPT-2.
+
+In this section we will build a scaled-down version of a code generation model: we'll focus on one-line completions instead of full functions or classes, using a subset of Python code. When working with data in Python you are in frequent contact with the Python data science stack, consisting of the `matplotlib`, `seaborn`, `pandas`, and `scikit-learn` libraries. When using those frameworks it's common to need to look up specific commands, so it would be nice if we could use a model to complete these calls for us.
+
+<Youtube id="Vpjb1lu0MDk"/>
+
+In [Chapter 6](/course/chapter6) we created an efficient tokenizer to process Python source code, but what we still need is a large-scale dataset to pretrain a model on. Here, we'll apply our tokenizer to a corpus of Python code derived from GitHub repositories. We will then use the `Trainer` API and 🤗 Accelerate to train the model. Let's get to it!
+
+<iframe src="https://course-demos-codeparrot-ds.hf.space" frameBorder="0" height="300" title="Gradio app" class="block dark:hidden container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
+
+This is actually showcasing the model that was trained and uploaded to the Hub using the code shown in this section. You can find it [here](https://huggingface.co/huggingface-course/codeparrot-ds?text=plt.imshow%28). Note that since there is some randomization happening in the text generation, you will probably get a slightly different result.
+ 
+## Gathering the data[[gathering-the-data]]
+
+Python code is abundantly available from code repositories such as GitHub, which we can use to create a dataset by scraping for every Python repository. This was the approach taken in the [Transformers textbook](https://learning.oreilly.com/library/view/natural-language-processing/9781098136789/) to pretrain a large GPT-2 model. Using a GitHub dump of about 180 GB containing roughly 20 million Python files called `codeparrot`, the authors built a dataset that they then shared on the [Hugging Face Hub](https://huggingface.co/datasets/transformersbook/codeparrot).
+
+However, training on the full corpus is time- and compute-consuming, and we only need the subset of the dataset concerned with the Python data science stack. So, let's start by filtering the `codeparrot` dataset for all files that include any of the libraries in this stack. Because of the dataset's size, we want to avoid downloading it; instead, we'll use the streaming feature to filter it on the fly. To help us filter the code samples using the libraries we mentioned earlier, we'll use the following function:
+
+```py
+def any_keyword_in_string(string, keywords):
+    for keyword in keywords:
+        if keyword in string:
+            return True
+    return False
+```
+
+Let's test it on two examples:
+
+```py
+filters = ["pandas", "sklearn", "matplotlib", "seaborn"]
+example_1 = "import numpy as np"
+example_2 = "import pandas as pd"
+
+print(
+    any_keyword_in_string(example_1, filters), any_keyword_in_string(example_2, filters)
+)
+```
+
+```python out
+False True
+```
+
+We can use this to create a function that will stream the dataset and filter the elements we want:
+
+```py
+from collections import defaultdict
+from tqdm import tqdm
+from datasets import Dataset
+
+
+def filter_streaming_dataset(dataset, filters):
+    filtered_dict = defaultdict(list)
+    total = 0
+    for sample in tqdm(iter(dataset)):
+        total += 1
+        if any_keyword_in_string(sample["content"], filters):
+            for k, v in sample.items():
+                filtered_dict[k].append(v)
+    print(f"{len(filtered_dict['content'])/total:.2%} of data after filtering.")
+    return Dataset.from_dict(filtered_dict)
+```
+
+Then we can simply apply this function to the streaming dataset:
+
+```py
+# This cell will take a very long time to execute, so you should skip it and go to
+# the next one!
+from datasets import load_dataset
+
+split = "train"  # "valid"
+filters = ["pandas", "sklearn", "matplotlib", "seaborn"]
+
+data = load_dataset(f"transformersbook/codeparrot-{split}", split=split, streaming=True)
+filtered_data = filter_streaming_dataset(data, filters)
+```
+
+```python out
+3.26% of data after filtering.
+```
+
+This leaves us with about 3% of the original dataset, which is still quite sizable -- the resulting dataset is 6 GB and consists of 600,000 Python scripts!
+
+Filtering the full dataset can take 2-3h depending on your machine and bandwidth. If you don't want to go through this lengthy process yourself, we provide the filtered dataset on the Hub for you to download:
+
+```py
+from datasets import load_dataset, DatasetDict
+
+ds_train = load_dataset("huggingface-course/codeparrot-ds-train", split="train")
+ds_valid = load_dataset("huggingface-course/codeparrot-ds-valid", split="validation")
+
+raw_datasets = DatasetDict(
+    {
+        "train": ds_train,  # .shuffle().select(range(50000)),
+        "valid": ds_valid,  # .shuffle().select(range(500))
+    }
+)
+
+raw_datasets
+```
+
+```python out
+DatasetDict({
+    train: Dataset({
+        features: ['repo_name', 'path', 'copies', 'size', 'content', 'license'],
+        num_rows: 606720
+    })
+    valid: Dataset({
+        features: ['repo_name', 'path', 'copies', 'size', 'content', 'license'],
+        num_rows: 3322
+    })
+})
+```
+
+<Tip>
+
+Pretraining the language model will take a while. We suggest that you first run the training loop on a sample of the data by uncommenting the two partial lines above, and make sure that the training successfully completes and the models are stored. Nothing is more frustrating than a training run failing at the last step because you forgot to create a folder or because there's a typo at the end of the training loop!
+
+</Tip>
+
+Let's look at an example from the dataset. We'll just show the first 200 characters of each field:
+
+```py
+for key in raw_datasets["train"][0]:
+    print(f"{key.upper()}: {raw_datasets['train'][0][key][:200]}")
+```
+
+```python out
+'REPO_NAME: kmike/scikit-learn'
+'PATH: sklearn/utils/__init__.py'
+'COPIES: 3'
+'SIZE: 10094'
+'''CONTENT: """
+The :mod:`sklearn.utils` module includes various utilites.
+"""
+
+from collections import Sequence
+
+import numpy as np
+from scipy.sparse import issparse
+import warnings
+
+from .murmurhash import murm
+LICENSE: bsd-3-clause'''
+```
+
+We can see that the `content` field contains the code that we want our model to train on. Now that we have a dataset, we need to prepare the texts so they're in a format suitable for pretraining.
+
+## Preparing the dataset[[preparing-the-dataset]]
+
+<Youtube id="ma1TrR7gE7I"/>
+
+The first step will be to tokenize the data, so we can use it for training. Since our goal is to mainly autocomplete short function calls, we can keep the context size relatively small. This has the benefit that we can train the model much faster and it requires significantly less memory. If it is important for your application to have more context (for example, if you want the model to write unit tests based on a file with the function definition), make sure you increase that number, but also keep in mind that this comes with a greater GPU memory footprint. For now, let's fix the context size at 128 tokens, as opposed to the 1,024 or 2,048 used in GPT-2 or GPT-3, respectively.
+
+Most documents contain many more than 128 tokens, so simply truncating the inputs to the maximum length would eliminate a large fraction of our dataset. Instead, we'll use the `return_overflowing_tokens` option to tokenize the whole input and split it into several chunks, as we did in [Chapter 6](/course/chapter6/4). We'll also use the `return_length` option to return the length of each created chunk automatically. Often the last chunk will be smaller than the context size, and we'll get rid of these pieces to avoid padding issues; we don't really need them as we have plenty of data anyway.
+
+<div class="flex justify-center">
+<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/chunking_texts.svg" alt="Chunking a large texts in several pieces."/>
+<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/chunking_texts-dark.svg" alt="Chunking a large texts in several pieces."/>
+</div>
+
+Let's see exactly how this works by looking at the first two examples:
+
+```py
+from transformers import AutoTokenizer
+
+context_length = 128
+tokenizer = AutoTokenizer.from_pretrained("huggingface-course/code-search-net-tokenizer")
+
+outputs = tokenizer(
+    raw_datasets["train"][:2]["content"],
+    truncation=True,
+    max_length=context_length,
+    return_overflowing_tokens=True,
+    return_length=True,
+)
+
+print(f"Input IDs length: {len(outputs['input_ids'])}")
+print(f"Input chunk lengths: {(outputs['length'])}")
+print(f"Chunk mapping: {outputs['overflow_to_sample_mapping']}")
+```
+
+```python out
+Input IDs length: 34
+Input chunk lengths: [128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 117, 128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 41]
+Chunk mapping: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]
+```
+
+We can see that we get 34 segments in total from those two examples. Looking at the chunk lengths, we can see that the chunks at the ends of both documents have less than 128 tokens (117 and 41, respectively). These represent just a small fraction of the total chunks that we have, so we can safely throw them away. With the `overflow_to_sample_mapping` field, we can also reconstruct which chunks belonged to which input samples.
+
+With this operation we're using a handy feature of the `Dataset.map()` function in 🤗 Datasets, which is that it does not require one-to-one maps; as we saw in [section 3](/course/chapter7/3), we can create batches with more or fewer elements than the input batch. This is useful when doing operations like data augmentation or data filtering that change the number of elements. In our case, when tokenizing each element into chunks of the specified context size, we create many samples from each document. We just need to make sure to delete the existing columns, since they have a conflicting size. If we wanted to keep them, we could repeat them appropriately and return them within the `Dataset.map()` call:
+
+```py
+def tokenize(element):
+    outputs = tokenizer(
+        element["content"],
+        truncation=True,
+        max_length=context_length,
+        return_overflowing_tokens=True,
+        return_length=True,
+    )
+    input_batch = []
+    for length, input_ids in zip(outputs["length"], outputs["input_ids"]):
+        if length == context_length:
+            input_batch.append(input_ids)
+    return {"input_ids": input_batch}
+
+
+tokenized_datasets = raw_datasets.map(
+    tokenize, batched=True, remove_columns=raw_datasets["train"].column_names
+)
+tokenized_datasets
+```
+
+```python out
+DatasetDict({
+    train: Dataset({
+        features: ['input_ids'],
+        num_rows: 16702061
+    })
+    valid: Dataset({
+        features: ['input_ids'],
+        num_rows: 93164
+    })
+})
+```
+
+We now have 16.7 million examples with 128 tokens each, which corresponds to about 2.1 billion tokens in total. For reference, OpenAI's GPT-3 and Codex models are trained on 300 and 100 billion tokens, respectively, where the Codex models are initialized from the GPT-3 checkpoints. Our goal in this section is not to compete with these models, which can generate long, coherent texts, but to create a scaled-down version providing a quick autocomplete function for data scientists.
+
+Now that we have the dataset ready, let's set up the model!
+
+<Tip>
+
+✏️ **Try it out!** Getting rid of all the chunks that are smaller than the context size wasn't a big issue here because we're using small context windows. As you increase the context size (or if you have a corpus of short documents), the fraction of chunks that are thrown away will also grow. A more efficient way to prepare the data is to join all the tokenized samples in a batch with an `eos_token_id` token in between, and then perform the chunking on the concatenated sequences. As an exercise, modify the `tokenize()` function to make use of that approach. Note that you'll want to set `truncation=False` and remove the other arguments from the tokenizer to get the full sequence of token IDs.
+
+</Tip>
+
+
+## Initializing a new model[[initializing-a-new-model]]
+
+Our first step is to freshly initialize a GPT-2 model. We'll use the same configuration for our model as for the small GPT-2 model, so we load the pretrained configuration, make sure that the tokenizer size matches the model vocabulary size and pass the `bos` and `eos` (beginning and end of sequence) token IDs:
+
+{#if fw === 'pt'}
+
+```py
+from transformers import AutoTokenizer, GPT2LMHeadModel, AutoConfig
+
+config = AutoConfig.from_pretrained(
+    "gpt2",
+    vocab_size=len(tokenizer),
+    n_ctx=context_length,
+    bos_token_id=tokenizer.bos_token_id,
+    eos_token_id=tokenizer.eos_token_id,
+)
+```
+
+With that configuration, we can load a new model. Note that this is the first time we don't use the `from_pretrained()` function, since we're actually initializing a model ourself:
+
+```py
+model = GPT2LMHeadModel(config)
+model_size = sum(t.numel() for t in model.parameters())
+print(f"GPT-2 size: {model_size/1000**2:.1f}M parameters")
+```
+
+```python out
+GPT-2 size: 124.2M parameters
+```
+
+{:else}
+
+```py
+from transformers import AutoTokenizer, TFGPT2LMHeadModel, AutoConfig
+
+config = AutoConfig.from_pretrained(
+    "gpt2",
+    vocab_size=len(tokenizer),
+    n_ctx=context_length,
+    bos_token_id=tokenizer.bos_token_id,
+    eos_token_id=tokenizer.eos_token_id,
+)
+```
+
+With that configuration, we can load a new model. Note that this is the first time we don't use the `from_pretrained()` function, since we're actually initializing a model ourself:
+
+```py
+model = TFGPT2LMHeadModel(config)
+model(model.dummy_inputs)  # Builds the model
+model.summary()
+```
+
+```python out
+_________________________________________________________________
+Layer (type)                 Output Shape              Param #   
+=================================================================
+transformer (TFGPT2MainLayer multiple                  124242432 
+=================================================================
+Total params: 124,242,432
+Trainable params: 124,242,432
+Non-trainable params: 0
+_________________________________________________________________
+```
+
+{/if}
+
+Our model has 124M parameters that we'll have to tune. Before we can start training, we need to set up a data collator that will take care of creating the batches. We can use the `DataCollatorForLanguageModeling` collator, which is designed specifically for language modeling (as the name subtly suggests). Besides stacking and padding batches, it also takes care of creating the language model labels -- in causal language modeling the inputs serve as labels too (just shifted by one element), and this data collator creates them on the fly during training so we don't need to duplicate the `input_ids`.
+
+Note that `DataCollatorForLanguageModeling` supports both masked language modeling (MLM) and causal language modeling (CLM). By default it prepares data for MLM, but we can switch to CLM by setting the argument `mlm=False`:
+
+{#if fw === 'pt'}
+
+```py
+from transformers import DataCollatorForLanguageModeling
+
+tokenizer.pad_token = tokenizer.eos_token
+data_collator = DataCollatorForLanguageModeling(tokenizer, mlm=False)
+```
+
+{:else}
+
+```py
+from transformers import DataCollatorForLanguageModeling
+
+tokenizer.pad_token = tokenizer.eos_token
+data_collator = DataCollatorForLanguageModeling(tokenizer, mlm=False, return_tensors="tf")
+```
+
+{/if}
+
+Let's have a look at an example:
+
+```py
+out = data_collator([tokenized_datasets["train"][i] for i in range(5)])
+for key in out:
+    print(f"{key} shape: {out[key].shape}")
+```
+
+{#if fw === 'pt'}
+
+```python out
+input_ids shape: torch.Size([5, 128])
+attention_mask shape: torch.Size([5, 128])
+labels shape: torch.Size([5, 128])
+```
+
+{:else}
+
+```python out
+input_ids shape: (5, 128)
+attention_mask shape: (5, 128)
+labels shape: (5, 128)
+```
+
+{/if}
+
+We can see that the examples have been stacked and all the tensors have the same shape.
+
+{#if fw === 'tf'}
+
+Now we can use the `prepare_tf_dataset()` method to convert our datasets to TensorFlow datasets with the data collator we created above:
+
+```python
+tf_train_dataset = model.prepare_tf_dataset(
+    tokenized_datasets["train"],
+    collate_fn=data_collator,
+    shuffle=True,
+    batch_size=32,
+)
+tf_eval_dataset = model.prepare_tf_dataset(
+    tokenized_datasets["valid"],
+    collate_fn=data_collator,
+    shuffle=False,
+    batch_size=32,
+)
+```
+
+{/if}
+
+<Tip warning={true}>
+
+⚠️ Shifting the inputs and labels to align them happens inside the model, so the data collator just copies the inputs to create the labels.
+
+</Tip>
+
+
+Now we have everything in place to actually train our model -- that wasn't so much work after all! Before we start training we should log in to Hugging Face. If you're working in a notebook, you can do so with the following utility function:
+
+```python
+from huggingface_hub import notebook_login
+
+notebook_login()
+```
+
+This will display a widget where you can enter your Hugging Face login credentials.
+
+If you aren't working in a notebook, just type the following line in your terminal:
+
+```bash
+huggingface-cli login
+```
+
+{#if fw === 'pt'}
+
+All that's left to do is configure the training arguments and fire up the `Trainer`. We'll use a cosine learning rate schedule with some warmup and an effective batch size of 256 (`per_device_train_batch_size` * `gradient_accumulation_steps`). Gradient accumulation is used when a single batch does not fit into memory, and incrementally builds up the gradient through several forward/backward passes. We'll see this in action when we create the training loop with 🤗 Accelerate.
+
+```py
+from transformers import Trainer, TrainingArguments
+
+args = TrainingArguments(
+    output_dir="codeparrot-ds",
+    per_device_train_batch_size=32,
+    per_device_eval_batch_size=32,
+    evaluation_strategy="steps",
+    eval_steps=5_000,
+    logging_steps=5_000,
+    gradient_accumulation_steps=8,
+    num_train_epochs=1,
+    weight_decay=0.1,
+    warmup_steps=1_000,
+    lr_scheduler_type="cosine",
+    learning_rate=5e-4,
+    save_steps=5_000,
+    fp16=True,
+    push_to_hub=True,
+)
+
+trainer = Trainer(
+    model=model,
+    tokenizer=tokenizer,
+    args=args,
+    data_collator=data_collator,
+    train_dataset=tokenized_datasets["train"],
+    eval_dataset=tokenized_datasets["valid"],
+)
+```
+
+Now we can just start the `Trainer` and wait for training to finish. Depending on whether you run it on the full or a subset of the training set this will take 20 or 2 hours, respectively, so grab a few coffees and a good book to read!
+
+```py
+trainer.train()
+```
+
+After training completes, we can push the model and tokenizer to the Hub:
+
+```py
+trainer.push_to_hub()
+```
+
+{:else}
+
+All that's left to do is configure the training hyperparameters and call `compile()` and `fit()`. We'll use a learning rate schedule with some warmup to improve the stability of training:
+
+```py
+from transformers import create_optimizer
+import tensorflow as tf
+
+num_train_steps = len(tf_train_dataset)
+optimizer, schedule = create_optimizer(
+    init_lr=5e-5,
+    num_warmup_steps=1_000,
+    num_train_steps=num_train_steps,
+    weight_decay_rate=0.01,
+)
+model.compile(optimizer=optimizer)
+
+# Train in mixed-precision float16
+tf.keras.mixed_precision.set_global_policy("mixed_float16")
+```
+
+Now we can just call `model.fit()` and wait for training to finish. Depending on whether you run it on the full or a subset of the training set this will take 20 or 2 hours, respectively, so grab a few coffees and a good book to read! After training completes we can push the model and tokenizer to the Hub:
+
+```py
+from transformers.keras_callbacks import PushToHubCallback
+
+callback = PushToHubCallback(output_dir="codeparrot-ds", tokenizer=tokenizer)
+
+model.fit(tf_train_dataset, validation_data=tf_eval_dataset, callbacks=[callback])
+```
+
+{/if}
+
+<Tip>
+
+✏️ **Try it out!** It only took us about 30 lines of code in addition to the `TrainingArguments` to get from raw texts to training GPT-2. Try it out with your own dataset and see if you can get good results! 
+
+</Tip>
+
+<Tip>
+
+{#if fw === 'pt'}
+
+💡 If you have access to a machine with multiple GPUs, try to run the code there. The `Trainer` automatically manages multiple machines, and this can speed up training tremendously.
+
+{:else}
+
+💡 If you have access to a machine with multiple GPUs, you can try using a `MirroredStrategy` context to substantially speed up training. You'll need to create a `tf.distribute.MirroredStrategy` object, and make sure that any `to_tf_dataset()` or `prepare_tf_dataset()` methods as well as model creation and the call to `fit()` are all run in its `scope()` context. You can see documentation on this [here](https://www.tensorflow.org/guide/distributed_training#use_tfdistributestrategy_with_keras_modelfit).
+
+{/if}
+
+</Tip>
+
+## Code generation with a pipeline[[code-generation-with-a-pipeline]]
+
+Now is the moment of truth: let's see how well the trained model actually works! We can see in the logs that the loss went down steadily, but to put the model to the test let's take a look at how well it works on some prompts. To do that we'll wrap the model in a text generation `pipeline`, and we'll put it on the GPU for fast generations if there is one available:
+
+{#if fw === 'pt'}
+
+```py
+import torch
+from transformers import pipeline
+
+device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")
+pipe = pipeline(
+    "text-generation", model="huggingface-course/codeparrot-ds", device=device
+)
+```
+
+{:else}
+
+```py
+from transformers import pipeline
+
+course_model = TFGPT2LMHeadModel.from_pretrained("huggingface-course/codeparrot-ds")
+course_tokenizer = AutoTokenizer.from_pretrained("huggingface-course/codeparrot-ds")
+pipe = pipeline(
+    "text-generation", model=course_model, tokenizer=course_tokenizer, device=0
+)
+```
+
+{/if}
+
+Let's start with the simple task of creating a scatter plot:
+
+```py
+txt = """\
+# create some data
+x = np.random.randn(100)
+y = np.random.randn(100)
+
+# create scatter plot with x, y
+"""
+print(pipe(txt, num_return_sequences=1)[0]["generated_text"])
+```
+
+```python out
+# create some data
+x = np.random.randn(100)
+y = np.random.randn(100)
+
+# create scatter plot with x, y
+plt.scatter(x, y)
+
+# create scatter
+```
+
+The result looks correct. Does it also work for a `pandas` operation? Let's see if we can create a `DataFrame` from two arrays:
+
+```py
+txt = """\
+# create some data
+x = np.random.randn(100)
+y = np.random.randn(100)
+
+# create dataframe from x and y
+"""
+print(pipe(txt, num_return_sequences=1)[0]["generated_text"])
+```
+
+```python out
+# create some data
+x = np.random.randn(100)
+y = np.random.randn(100)
+
+# create dataframe from x and y
+df = pd.DataFrame({'x': x, 'y': y})
+df.insert(0,'x', x)
+for
+```
+
+Nice, that's the correct answer -- although it then inserts the column `x` again. Since the number of generated tokens is limited, the following `for` loop is cut off. Let's see if we can do something a bit more complex and have the model help us use the `groupby` operation: 
+
+```py
+txt = """\
+# dataframe with profession, income and name
+df = pd.DataFrame({'profession': x, 'income':y, 'name': z})
+
+# calculate the mean income per profession
+"""
+print(pipe(txt, num_return_sequences=1)[0]["generated_text"])
+```
+
+```python out
+# dataframe with profession, income and name
+df = pd.DataFrame({'profession': x, 'income':y, 'name': z})
+
+# calculate the mean income per profession
+profession = df.groupby(['profession']).mean()
+
+# compute the
+```
+
+Not bad; that's the right way to do it. Finally, let's see if we can also use it for `scikit-learn` and set up a Random Forest model:
+
+```py
+txt = """
+# import random forest regressor from scikit-learn
+from sklearn.ensemble import RandomForestRegressor
+
+# fit random forest model with 300 estimators on X, y:
+"""
+print(pipe(txt, num_return_sequences=1)[0]["generated_text"])
+```
+
+```python out
+# import random forest regressor from scikit-learn
+from sklearn.ensemble import RandomForestRegressor
+
+# fit random forest model with 300 estimators on X, y:
+rf = RandomForestRegressor(n_estimators=300, random_state=random_state, max_depth=3)
+rf.fit(X, y)
+rf
+```
+
+{#if fw === 'tf'}
+
+Looking at these few examples, it seems that the model has learned some of the syntax of the Python data science stack. Of course, we would need to evaluate the model more thoroughly before deploying it in the real world, but this is still an impressive prototype.
+
+{:else}
+
+Looking at these few examples, it seems that the model has learned some of the syntax of the Python data science stack (of course, we would need to evaluate it more thoroughly before deploying the model in the real world). Sometimes it requires more customization of the model training to achieve the necessary performance for a given use case, however. For example, what if we would like to dynamically update the batch size or have a conditional training loop that skips bad examples on the fly? One option would be to subclass the `Trainer` and add the necessary changes, but sometimes it's simpler to write the training loop from scratch. That's where 🤗 Accelerate comes in.
+
+{/if}
+
+{#if fw === 'pt'}
+
+## Training with 🤗 Accelerate[[training-with-accelerate]]
+
+We've seen how to train a model with the `Trainer`, which can allow for some customization. However, sometimes we want full control over the training loop, or we want to make some exotic changes. In this case 🤗 Accelerate is a great choice, and in this section we'll go through the steps to use it to train our model. To make things more interesting, we'll also add a twist to the training loop.
+
+<Youtube id="Hm8_PgVTFuc"/>
+
+Since we are mainly interested in sensible autocompletion for the the data science libraries, it makes sense to give more weight to training samples that make more use of these libraries. We can easily identify these examples through the use of keywords such as `plt`, `pd`, `sk`, `fit`, and `predict`, which are the most frequent import names for `matplotlib.pyplot`, `pandas`, and `sklearn` as well as the fit/predict pattern of the latter. If these are each represented as a single token, we can easily check if they occur in the input sequence. Tokens can have a whitespace prefix, so we'll also check for those versions in the tokenizer vocabulary. To verify that it works, we'll add one test token which should be split into multiple tokens:
+
+```py
+keytoken_ids = []
+for keyword in [
+    "plt",
+    "pd",
+    "sk",
+    "fit",
+    "predict",
+    " plt",
+    " pd",
+    " sk",
+    " fit",
+    " predict",
+    "testtest",
+]:
+    ids = tokenizer([keyword]).input_ids[0]
+    if len(ids) == 1:
+        keytoken_ids.append(ids[0])
+    else:
+        print(f"Keyword has not single token: {keyword}")
+```
+
+```python out
+'Keyword has not single token: testtest'
+```
+
+Great, that seems to work nicely! We can now write a custom loss function that takes the input sequence, the logits, and the key tokens we just selected as inputs. First we need to align the logits and inputs: the input sequence shifted by one to the right forms the labels, since the next token is the label for the current token. We can achieve this by starting the labels from the second token of the input sequence, since the model does not make a prediction for the first token anyway. Then we cut off the last logit, as we don't have a label for the token that follows the full input sequence. With that we can compute the loss per sample and count the occurrences of all keywords in each sample. Finally, we calculate the weighted average over all samples using the occurrences as weights. Since we don't want to throw away all the samples that have no keywords, we add 1 to the weights:
+
+```py
+from torch.nn import CrossEntropyLoss
+import torch
+
+
+def keytoken_weighted_loss(inputs, logits, keytoken_ids, alpha=1.0):
+    # Shift so that tokens < n predict n
+    shift_labels = inputs[..., 1:].contiguous()
+    shift_logits = logits[..., :-1, :].contiguous()
+    # Calculate per-token loss
+    loss_fct = CrossEntropyLoss(reduce=False)
+    loss = loss_fct(shift_logits.view(-1, shift_logits.size(-1)), shift_labels.view(-1))
+    # Resize and average loss per sample
+    loss_per_sample = loss.view(shift_logits.size(0), shift_logits.size(1)).mean(axis=1)
+    # Calculate and scale weighting
+    weights = torch.stack([(inputs == kt).float() for kt in keytoken_ids]).sum(
+        axis=[0, 2]
+    )
+    weights = alpha * (1.0 + weights)
+    # Calculate weighted average
+    weighted_loss = (loss_per_sample * weights).mean()
+    return weighted_loss
+```
+
+Before we can start training with this awesome new loss function, we need to prepare a few things:
+
+- We need dataloaders to load the data in batches.
+- We need to set up weight decay parameters.
+- From time to time we want to evaluate, so it makes sense to wrap the evaluation code in a function.
+
+Let's start with the dataloaders. We only need to set the dataset's format to `"torch"`, and then we can pass it to a PyTorch `DataLoader` with the appropriate batch size:
+
+```py
+from torch.utils.data.dataloader import DataLoader
+
+tokenized_datasets.set_format("torch")
+train_dataloader = DataLoader(tokenized_datasets["train"], batch_size=32, shuffle=True)
+eval_dataloader = DataLoader(tokenized_datasets["valid"], batch_size=32)
+```
+
+Next, we group the parameters so that the optimizer knows which ones will get an additional weight decay. Usually, all bias and LayerNorm weights terms are exempt from this; here's how we can do this:
+
+```py
+weight_decay = 0.1
+
+
+def get_grouped_params(model, no_decay=["bias", "LayerNorm.weight"]):
+    params_with_wd, params_without_wd = [], []
+    for n, p in model.named_parameters():
+        if any(nd in n for nd in no_decay):
+            params_without_wd.append(p)
+        else:
+            params_with_wd.append(p)
+    return [
+        {"params": params_with_wd, "weight_decay": weight_decay},
+        {"params": params_without_wd, "weight_decay": 0.0},
+    ]
+```
+
+Since we want to evaluate the model regularly on the validation set during training, let's write a function for that as well. It just runs through the evaluation dataloader and gathers all the losses across processes:
+
+```py
+def evaluate():
+    model.eval()
+    losses = []
+    for step, batch in enumerate(eval_dataloader):
+        with torch.no_grad():
+            outputs = model(batch["input_ids"], labels=batch["input_ids"])
+
+        losses.append(accelerator.gather(outputs.loss))
+    loss = torch.mean(torch.cat(losses))
+    try:
+        perplexity = torch.exp(loss)
+    except OverflowError:
+        perplexity = float("inf")
+    return loss.item(), perplexity.item()
+```
+
+With the `evaluate()` function we can report loss and [perplexity](/course/chapter7/3) at regular intervals. Next, we redefine our model to make sure we train from scratch again:
+
+```py
+model = GPT2LMHeadModel(config)
+```
+
+We can then define our optimizer, using the function from before to split the parameters for weight decay:
+
+```py
+from torch.optim import AdamW
+
+optimizer = AdamW(get_grouped_params(model), lr=5e-4)
+```
+
+Now let's prepare the model, optimizer, and dataloaders so we can start training:
+
+```py
+from accelerate import Accelerator
+
+accelerator = Accelerator(fp16=True)
+
+model, optimizer, train_dataloader, eval_dataloader = accelerator.prepare(
+    model, optimizer, train_dataloader, eval_dataloader
+)
+```
+
+<Tip>
+
+🚨 If you're training on a TPU, you'll need to move all the code starting at the cell above into a dedicated training function. See [Chapter 3](/course/chapter3) for more details.
+
+</Tip>
+
+Now that we have sent our `train_dataloader` to `accelerator.prepare()`, we can use its length to compute the number of training steps. Remember that we should always do this after preparing the dataloader, as that method will change its length. We use a classic linear schedule from the learning rate to 0:
+
+```py
+from transformers import get_scheduler
+
+num_train_epochs = 1
+num_update_steps_per_epoch = len(train_dataloader)
+num_training_steps = num_train_epochs * num_update_steps_per_epoch
+
+lr_scheduler = get_scheduler(
+    name="linear",
+    optimizer=optimizer,
+    num_warmup_steps=1_000,
+    num_training_steps=num_training_steps,
+)
+```
+
+Lastly, to push our model to the Hub, we will need to create a `Repository` object in a working folder. First log in to the Hugging Face Hub, if you aren't logged in already. We'll determine the repository name from the model ID we want to give our model (feel free to replace the `repo_name` with your own choice; it just needs to contain your username, which is what the function `get_full_repo_name()` does):
+
+```py
+from huggingface_hub import Repository, get_full_repo_name
+
+model_name = "codeparrot-ds-accelerate"
+repo_name = get_full_repo_name(model_name)
+repo_name
+```
+
+```python out
+'sgugger/codeparrot-ds-accelerate'
+```
+
+Then we can clone that repository in a local folder. If it already exists, this local folder should be an existing clone of the repository we are working with:
+
+```py
+output_dir = "codeparrot-ds-accelerate"
+repo = Repository(output_dir, clone_from=repo_name)
+```
+
+We can now upload anything we save in `output_dir` by calling the `repo.push_to_hub()` method. This will help us upload the intermediate models at the end of each epoch.
+
+Before we train, let's run a quick test to see if the evaluation function works properly:
+
+```py
+evaluate()
+```
+
+```python out
+(10.934126853942871, 56057.14453125)
+```
+
+Those are very high values for loss and perplexity, but that's not surprising as we haven't trained the model yet. With that, we have everything prepared to write the core part of the training script: the training loop. In the training loop we iterate over the dataloader and pass the batches to the model. With the logits, we can then evaluate our custom loss function. We scale the loss by the number of gradient accumulation steps so as not to create larger losses when aggregating more steps. Before we optimize, we also clip the gradients for better convergence. Finally, every few steps we evaluate the model on the evaluation set with our new `evaluate()` function:
+
+```py
+from tqdm.notebook import tqdm
+
+gradient_accumulation_steps = 8
+eval_steps = 5_000
+
+model.train()
+completed_steps = 0
+for epoch in range(num_train_epochs):
+    for step, batch in tqdm(
+        enumerate(train_dataloader, start=1), total=num_training_steps
+    ):
+        logits = model(batch["input_ids"]).logits
+        loss = keytoken_weighted_loss(batch["input_ids"], logits, keytoken_ids)
+        if step % 100 == 0:
+            accelerator.print(
+                {
+                    "samples": step * samples_per_step,
+                    "steps": completed_steps,
+                    "loss/train": loss.item() * gradient_accumulation_steps,
+                }
+            )
+        loss = loss / gradient_accumulation_steps
+        accelerator.backward(loss)
+        if step % gradient_accumulation_steps == 0:
+            accelerator.clip_grad_norm_(model.parameters(), 1.0)
+            optimizer.step()
+            lr_scheduler.step()
+            optimizer.zero_grad()
+            completed_steps += 1
+        if (step % (eval_steps * gradient_accumulation_steps)) == 0:
+            eval_loss, perplexity = evaluate()
+            accelerator.print({"loss/eval": eval_loss, "perplexity": perplexity})
+            model.train()
+            accelerator.wait_for_everyone()
+            unwrapped_model = accelerator.unwrap_model(model)
+            unwrapped_model.save_pretrained(output_dir, save_function=accelerator.save)
+            if accelerator.is_main_process:
+                tokenizer.save_pretrained(output_dir)
+                repo.push_to_hub(
+                    commit_message=f"Training in progress step {step}", blocking=False
+                )
+```
+
+And that's it -- you now have your own custom training loop for causal language models such as GPT-2 that you can further customize to your needs. 
+
+<Tip>
+
+✏️ **Try it out!** Either create your own custom loss function tailored to your use case, or add another custom step into the training loop.
+
+</Tip>
+
+<Tip>
+
+✏️ **Try it out!** When running long training experiments it's a good idea to log important metrics using tools such as TensorBoard or Weights & Biases. Add proper logging to the training loop so you can always check how the training is going.
+
+</Tip>
+
+{/if}
diff --git a/chapters/ro/chapter7/7.mdx b/chapters/ro/chapter7/7.mdx
new file mode 100644
index 000000000..34556be21
--- /dev/null
+++ b/chapters/ro/chapter7/7.mdx
@@ -0,0 +1,1203 @@
+<FrameworkSwitchCourse {fw} />
+
+# Question answering[[question-answering]]
+
+{#if fw === 'pt'}
+
+<CourseFloatingBanner chapter={7}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter7/section7_pt.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter7/section7_pt.ipynb"},
+]} />
+
+{:else}
+
+<CourseFloatingBanner chapter={7}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter7/section7_tf.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter7/section7_tf.ipynb"},
+]} />
+
+{/if}
+
+Time to look at question answering! This task comes in many flavors, but the one we'll focus on in this section is called *extractive* question answering. This involves posing questions about a document and identifying the answers as _spans of text_ in the document itself.
+
+<Youtube id="ajPx5LwJD-I"/>
+
+We will fine-tune a BERT model on the [SQuAD dataset](https://rajpurkar.github.io/SQuAD-explorer/), which consists of questions posed by crowdworkers on a set of Wikipedia articles. This will give us a model able to compute predictions like this one:
+
+<iframe src="https://course-demos-bert-finetuned-squad.hf.space" frameBorder="0" height="450" title="Gradio app" class="block dark:hidden container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
+
+This is actually showcasing the model that was trained and uploaded to the Hub using the code shown in this section. You can find it and double-check the predictions [here](https://huggingface.co/huggingface-course/bert-finetuned-squad?context=%F0%9F%A4%97+Transformers+is+backed+by+the+three+most+popular+deep+learning+libraries+%E2%80%94+Jax%2C+PyTorch+and+TensorFlow+%E2%80%94+with+a+seamless+integration+between+them.+It%27s+straightforward+to+train+your+models+with+one+before+loading+them+for+inference+with+the+other.&question=Which+deep+learning+libraries+back+%F0%9F%A4%97+Transformers%3F).
+
+<Tip>
+
+💡 Encoder-only models like BERT tend to be great at extracting answers to factoid questions like "Who invented the Transformer architecture?" but fare poorly when given open-ended questions like "Why is the sky blue?" In these more challenging cases, encoder-decoder models like T5 and BART are typically used to synthesize the information in a way that's quite similar to [text summarization](/course/chapter7/5). If you're interested in this type of *generative* question answering, we recommend checking out our [demo](https://yjernite.github.io/lfqa.html) based on the [ELI5 dataset](https://huggingface.co/datasets/eli5).
+
+</Tip>
+
+## Preparing the data[[preparing-the-data]]
+
+The dataset that is used the most as an academic benchmark for extractive question answering is [SQuAD](https://rajpurkar.github.io/SQuAD-explorer/), so that's the one we'll use here. There is also a harder [SQuAD v2](https://huggingface.co/datasets/squad_v2) benchmark, which includes questions that don't have an answer. As long as your own dataset contains a column for contexts, a column for questions, and a column for answers, you should be able to adapt the steps below.
+
+### The SQuAD dataset[[the-squad-dataset]]
+
+As usual, we can download and cache the dataset in just one step thanks to `load_dataset()`:
+
+```py
+from datasets import load_dataset
+
+raw_datasets = load_dataset("squad")
+```
+
+We can then have a look at this object to learn more about the SQuAD dataset:
+
+```py
+raw_datasets
+```
+
+```python out
+DatasetDict({
+    train: Dataset({
+        features: ['id', 'title', 'context', 'question', 'answers'],
+        num_rows: 87599
+    })
+    validation: Dataset({
+        features: ['id', 'title', 'context', 'question', 'answers'],
+        num_rows: 10570
+    })
+})
+```
+
+It looks like we have everything we need with the `context`, `question`, and `answers` fields, so let's print those for the first element of our training set:
+
+```py
+print("Context: ", raw_datasets["train"][0]["context"])
+print("Question: ", raw_datasets["train"][0]["question"])
+print("Answer: ", raw_datasets["train"][0]["answers"])
+```
+
+```python out
+Context: 'Architecturally, the school has a Catholic character. Atop the Main Building\'s gold dome is a golden statue of the Virgin Mary. Immediately in front of the Main Building and facing it, is a copper statue of Christ with arms upraised with the legend "Venite Ad Me Omnes". Next to the Main Building is the Basilica of the Sacred Heart. Immediately behind the basilica is the Grotto, a Marian place of prayer and reflection. It is a replica of the grotto at Lourdes, France where the Virgin Mary reputedly appeared to Saint Bernadette Soubirous in 1858. At the end of the main drive (and in a direct line that connects through 3 statues and the Gold Dome), is a simple, modern stone statue of Mary.'
+Question: 'To whom did the Virgin Mary allegedly appear in 1858 in Lourdes France?'
+Answer: {'text': ['Saint Bernadette Soubirous'], 'answer_start': [515]}
+```
+
+The `context` and `question` fields are very straightforward to use. The `answers` field is a bit trickier as it comports a dictionary with two fields that are both lists. This is the format that will be expected by the `squad` metric during evaluation; if you are using your own data, you don't necessarily need to worry about putting the answers in the same format. The `text` field is rather obvious, and the `answer_start` field contains the starting character index of each answer in the context.
+
+During training, there is only one possible answer. We can double-check this by using the `Dataset.filter()` method:
+
+```py
+raw_datasets["train"].filter(lambda x: len(x["answers"]["text"]) != 1)
+```
+
+```python out
+Dataset({
+    features: ['id', 'title', 'context', 'question', 'answers'],
+    num_rows: 0
+})
+```
+
+For evaluation, however, there are several possible answers for each sample, which may be the same or different:
+
+```py
+print(raw_datasets["validation"][0]["answers"])
+print(raw_datasets["validation"][2]["answers"])
+```
+
+```python out
+{'text': ['Denver Broncos', 'Denver Broncos', 'Denver Broncos'], 'answer_start': [177, 177, 177]}
+{'text': ['Santa Clara, California', "Levi's Stadium", "Levi's Stadium in the San Francisco Bay Area at Santa Clara, California."], 'answer_start': [403, 355, 355]}
+```
+
+We won't dive into the evaluation script as it will all be wrapped up by a 🤗 Datasets metric for us, but the short version is that some of the questions have several possible answers, and this script will compare a predicted answer to all the acceptable answers and take the best score. If we take a look at the sample at index 2, for instance:
+
+```py
+print(raw_datasets["validation"][2]["context"])
+print(raw_datasets["validation"][2]["question"])
+```
+
+```python out
+'Super Bowl 50 was an American football game to determine the champion of the National Football League (NFL) for the 2015 season. The American Football Conference (AFC) champion Denver Broncos defeated the National Football Conference (NFC) champion Carolina Panthers 24–10 to earn their third Super Bowl title. The game was played on February 7, 2016, at Levi\'s Stadium in the San Francisco Bay Area at Santa Clara, California. As this was the 50th Super Bowl, the league emphasized the "golden anniversary" with various gold-themed initiatives, as well as temporarily suspending the tradition of naming each Super Bowl game with Roman numerals (under which the game would have been known as "Super Bowl L"), so that the logo could prominently feature the Arabic numerals 50.'
+'Where did Super Bowl 50 take place?'
+```
+
+we can see that the answer can indeed be one of the three possibilities we saw before.
+
+### Processing the training data[[processing-the-training-data]]
+
+<Youtube id="qgaM0weJHpA"/>
+
+Let's start with preprocessing the training data. The hard part will be to generate labels for the question's answer, which will be the start and end positions of the tokens corresponding to the answer inside the context.
+
+But let's not get ahead of ourselves. First, we need to convert the text in the input into IDs the model can make sense of, using a tokenizer:
+
+```py
+from transformers import AutoTokenizer
+
+model_checkpoint = "bert-base-cased"
+tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
+```
+
+As mentioned previously, we'll be fine-tuning a BERT model, but you can use any other model type as long as it has a fast tokenizer implemented. You can see all the architectures that come with a fast version in [this big table](https://huggingface.co/transformers/#supported-frameworks), and to check that the `tokenizer` object you're using is indeed backed by 🤗 Tokenizers you can look at its `is_fast` attribute:
+
+```py
+tokenizer.is_fast
+```
+
+```python out
+True
+```
+
+We can pass to our tokenizer the question and the context together, and it will properly insert the special tokens to form a sentence like this:
+
+```
+[CLS] question [SEP] context [SEP]
+```
+
+Let's double-check:
+
+```py
+context = raw_datasets["train"][0]["context"]
+question = raw_datasets["train"][0]["question"]
+
+inputs = tokenizer(question, context)
+tokenizer.decode(inputs["input_ids"])
+```
+
+```python out
+'[CLS] To whom did the Virgin Mary allegedly appear in 1858 in Lourdes France? [SEP] Architecturally, '
+'the school has a Catholic character. Atop the Main Building\'s gold dome is a golden statue of the Virgin '
+'Mary. Immediately in front of the Main Building and facing it, is a copper statue of Christ with arms '
+'upraised with the legend " Venite Ad Me Omnes ". Next to the Main Building is the Basilica of the Sacred '
+'Heart. Immediately behind the basilica is the Grotto, a Marian place of prayer and reflection. It is a '
+'replica of the grotto at Lourdes, France where the Virgin Mary reputedly appeared to Saint Bernadette '
+'Soubirous in 1858. At the end of the main drive ( and in a direct line that connects through 3 statues '
+'and the Gold Dome ), is a simple, modern stone statue of Mary. [SEP]'
+```
+
+The labels will then be the index of the tokens starting and ending the answer, and the model will be tasked to predicted one start and end logit per token in the input, with the theoretical labels being as follow:
+
+<div class="flex justify-center">
+<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/qa_labels.svg" alt="One-hot encoded labels for question answering."/>
+<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/qa_labels-dark.svg" alt="One-hot encoded labels for question answering."/>
+</div>
+
+In this case the context is not too long, but some of the examples in the dataset have very long contexts that will exceed the maximum length we set (which is 384 in this case). As we saw in [Chapter 6](/course/chapter6/4) when we explored the internals of the `question-answering` pipeline, we will deal with long contexts by creating several training features from one sample of our dataset, with a sliding window between them.
+
+To see how this works using the current example, we can limit the length to 100 and use a sliding window of 50 tokens. As a reminder, we use:
+
+- `max_length` to set the maximum length (here 100)
+- `truncation="only_second"` to truncate the context (which is in the second position) when the question with its context is too long
+- `stride` to set the number of overlapping tokens between two successive chunks (here 50)
+- `return_overflowing_tokens=True` to let the tokenizer know we want the overflowing tokens
+
+```py
+inputs = tokenizer(
+    question,
+    context,
+    max_length=100,
+    truncation="only_second",
+    stride=50,
+    return_overflowing_tokens=True,
+)
+
+for ids in inputs["input_ids"]:
+    print(tokenizer.decode(ids))
+```
+
+```python out
+'[CLS] To whom did the Virgin Mary allegedly appear in 1858 in Lourdes France? [SEP] Architecturally, the school has a Catholic character. Atop the Main Building\'s gold dome is a golden statue of the Virgin Mary. Immediately in front of the Main Building and facing it, is a copper statue of Christ with arms upraised with the legend " Venite Ad Me Omnes ". Next to the Main Building is the Basilica of the Sacred Heart. Immediately behind the basi [SEP]'
+'[CLS] To whom did the Virgin Mary allegedly appear in 1858 in Lourdes France? [SEP] the Main Building and facing it, is a copper statue of Christ with arms upraised with the legend " Venite Ad Me Omnes ". Next to the Main Building is the Basilica of the Sacred Heart. Immediately behind the basilica is the Grotto, a Marian place of prayer and reflection. It is a replica of the grotto at Lourdes, France where the Virgin [SEP]'
+'[CLS] To whom did the Virgin Mary allegedly appear in 1858 in Lourdes France? [SEP] Next to the Main Building is the Basilica of the Sacred Heart. Immediately behind the basilica is the Grotto, a Marian place of prayer and reflection. It is a replica of the grotto at Lourdes, France where the Virgin Mary reputedly appeared to Saint Bernadette Soubirous in 1858. At the end of the main drive ( and in a direct line that connects through 3 [SEP]'
+'[CLS] To whom did the Virgin Mary allegedly appear in 1858 in Lourdes France? [SEP]. It is a replica of the grotto at Lourdes, France where the Virgin Mary reputedly appeared to Saint Bernadette Soubirous in 1858. At the end of the main drive ( and in a direct line that connects through 3 statues and the Gold Dome ), is a simple, modern stone statue of Mary. [SEP]'
+```
+
+As we can see, our example has been in split into four inputs, each of them containing the question and some part of the context. Note that the answer to the question ("Bernadette Soubirous") only appears in the third and last inputs, so by dealing with long contexts in this way we will create some training examples where the answer is not included in the context. For those examples, the labels will be `start_position = end_position = 0` (so we predict the `[CLS]` token). We will also set those labels in the unfortunate case where the answer has been truncated so that we only have the start (or end) of it. For the examples where the answer is fully in the context, the labels will be the index of the token where the answer starts and the index of the token where the answer ends.
+
+The dataset provides us with the start character of the answer in the context, and by adding the length of the answer, we can find the end character in the context. To map those to token indices, we will need to use the offset mappings we studied in [Chapter 6](/course/chapter6/4). We can have our tokenizer return these by passing along `return_offsets_mapping=True`:
+
+```py
+inputs = tokenizer(
+    question,
+    context,
+    max_length=100,
+    truncation="only_second",
+    stride=50,
+    return_overflowing_tokens=True,
+    return_offsets_mapping=True,
+)
+inputs.keys()
+```
+
+```python out
+dict_keys(['input_ids', 'token_type_ids', 'attention_mask', 'offset_mapping', 'overflow_to_sample_mapping'])
+```
+
+As we can see, we get back the usual input IDs, token type IDs, and attention mask, as well as the offset mapping we required and an extra key, `overflow_to_sample_mapping`. The corresponding value will be of use to us when we tokenize several texts at the same time (which we should do to benefit from the fact that our tokenizer is backed by Rust). Since one sample can give several features, it maps each feature to the example it originated from. Because here we only tokenized one example, we get a list of `0`s:
+
+```py
+inputs["overflow_to_sample_mapping"]
+```
+
+```python out
+[0, 0, 0, 0]
+```
+
+But if we tokenize more examples, this will become more useful:
+
+```py
+inputs = tokenizer(
+    raw_datasets["train"][2:6]["question"],
+    raw_datasets["train"][2:6]["context"],
+    max_length=100,
+    truncation="only_second",
+    stride=50,
+    return_overflowing_tokens=True,
+    return_offsets_mapping=True,
+)
+
+print(f"The 4 examples gave {len(inputs['input_ids'])} features.")
+print(f"Here is where each comes from: {inputs['overflow_to_sample_mapping']}.")
+```
+
+```python out
+'The 4 examples gave 19 features.'
+'Here is where each comes from: [0, 0, 0, 0, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3].'
+```
+
+As we can see, the first three examples (at indices 2, 3, and 4 in the training set) each gave four features and the last example (at index 5 in the training set) gave 7 features.
+
+This information will be useful to map each feature we get to its corresponding label. As mentioned earlier, those labels are:
+
+- `(0, 0)` if the answer is not in the corresponding span of the context
+- `(start_position, end_position)` if the answer is in the corresponding span of the context, with `start_position` being the index of the token (in the input IDs) at the start of the answer and `end_position` being the index of the token (in the input IDs) where the answer ends
+
+To determine which of these is the case and, if relevant, the positions of the tokens, we first find the indices that start and end the context in the input IDs. We could use the token type IDs to do this, but since those do not necessarily exist for all models (DistilBERT does not require them, for instance), we'll instead use the `sequence_ids()` method of the `BatchEncoding` our tokenizer returns. 
+
+Once we have those token indices, we look at the corresponding offsets, which are tuples of two integers representing the span of characters inside the original context. We can thus detect if the chunk of the context in this feature starts after the answer or ends before the answer begins (in which case the label is `(0, 0)`). If that's not the case, we loop to find the first and last token of the answer:
+
+```py
+answers = raw_datasets["train"][2:6]["answers"]
+start_positions = []
+end_positions = []
+
+for i, offset in enumerate(inputs["offset_mapping"]):
+    sample_idx = inputs["overflow_to_sample_mapping"][i]
+    answer = answers[sample_idx]
+    start_char = answer["answer_start"][0]
+    end_char = answer["answer_start"][0] + len(answer["text"][0])
+    sequence_ids = inputs.sequence_ids(i)
+
+    # Find the start and end of the context
+    idx = 0
+    while sequence_ids[idx] != 1:
+        idx += 1
+    context_start = idx
+    while sequence_ids[idx] == 1:
+        idx += 1
+    context_end = idx - 1
+
+    # If the answer is not fully inside the context, label is (0, 0)
+    if offset[context_start][0] > start_char or offset[context_end][1] < end_char:
+        start_positions.append(0)
+        end_positions.append(0)
+    else:
+        # Otherwise it's the start and end token positions
+        idx = context_start
+        while idx <= context_end and offset[idx][0] <= start_char:
+            idx += 1
+        start_positions.append(idx - 1)
+
+        idx = context_end
+        while idx >= context_start and offset[idx][1] >= end_char:
+            idx -= 1
+        end_positions.append(idx + 1)
+
+start_positions, end_positions
+```
+
+```python out
+([83, 51, 19, 0, 0, 64, 27, 0, 34, 0, 0, 0, 67, 34, 0, 0, 0, 0, 0],
+ [85, 53, 21, 0, 0, 70, 33, 0, 40, 0, 0, 0, 68, 35, 0, 0, 0, 0, 0])
+```
+
+Let's take a look at a few results to verify that our approach is correct. For the first feature we find `(83, 85)` as labels, so let's compare the theoretical answer with the decoded span of tokens from 83 to 85 (inclusive):
+
+```py
+idx = 0
+sample_idx = inputs["overflow_to_sample_mapping"][idx]
+answer = answers[sample_idx]["text"][0]
+
+start = start_positions[idx]
+end = end_positions[idx]
+labeled_answer = tokenizer.decode(inputs["input_ids"][idx][start : end + 1])
+
+print(f"Theoretical answer: {answer}, labels give: {labeled_answer}")
+```
+
+```python out
+'Theoretical answer: the Main Building, labels give: the Main Building'
+```
+
+So that's a match! Now let's check index 4, where we set the labels to `(0, 0)`, which means the answer is not in the context chunk of that feature:
+
+```py
+idx = 4
+sample_idx = inputs["overflow_to_sample_mapping"][idx]
+answer = answers[sample_idx]["text"][0]
+
+decoded_example = tokenizer.decode(inputs["input_ids"][idx])
+print(f"Theoretical answer: {answer}, decoded example: {decoded_example}")
+```
+
+```python out
+'Theoretical answer: a Marian place of prayer and reflection, decoded example: [CLS] What is the Grotto at Notre Dame? [SEP] Architecturally, the school has a Catholic character. Atop the Main Building\'s gold dome is a golden statue of the Virgin Mary. Immediately in front of the Main Building and facing it, is a copper statue of Christ with arms upraised with the legend " Venite Ad Me Omnes ". Next to the Main Building is the Basilica of the Sacred Heart. Immediately behind the basilica is the Grot [SEP]'
+```
+
+Indeed, we don't see the answer inside the context.
+
+<Tip>
+
+✏️ **Your turn!** When using the XLNet architecture, padding is applied on the left and the question and context are switched. Adapt all the code we just saw to the XLNet architecture (and add `padding=True`). Be aware that the `[CLS]` token may not be at the 0 position with padding applied.
+
+</Tip>
+
+Now that we have seen step by step how to preprocess our training data, we can group it in a function we will apply on the whole training dataset. We'll pad every feature to the maximum length we set, as most of the contexts will be long (and the corresponding samples will be split into several features), so there is no real benefit to applying dynamic padding here:
+
+```py
+max_length = 384
+stride = 128
+
+
+def preprocess_training_examples(examples):
+    questions = [q.strip() for q in examples["question"]]
+    inputs = tokenizer(
+        questions,
+        examples["context"],
+        max_length=max_length,
+        truncation="only_second",
+        stride=stride,
+        return_overflowing_tokens=True,
+        return_offsets_mapping=True,
+        padding="max_length",
+    )
+
+    offset_mapping = inputs.pop("offset_mapping")
+    sample_map = inputs.pop("overflow_to_sample_mapping")
+    answers = examples["answers"]
+    start_positions = []
+    end_positions = []
+
+    for i, offset in enumerate(offset_mapping):
+        sample_idx = sample_map[i]
+        answer = answers[sample_idx]
+        start_char = answer["answer_start"][0]
+        end_char = answer["answer_start"][0] + len(answer["text"][0])
+        sequence_ids = inputs.sequence_ids(i)
+
+        # Find the start and end of the context
+        idx = 0
+        while sequence_ids[idx] != 1:
+            idx += 1
+        context_start = idx
+        while sequence_ids[idx] == 1:
+            idx += 1
+        context_end = idx - 1
+
+        # If the answer is not fully inside the context, label is (0, 0)
+        if offset[context_start][0] > start_char or offset[context_end][1] < end_char:
+            start_positions.append(0)
+            end_positions.append(0)
+        else:
+            # Otherwise it's the start and end token positions
+            idx = context_start
+            while idx <= context_end and offset[idx][0] <= start_char:
+                idx += 1
+            start_positions.append(idx - 1)
+
+            idx = context_end
+            while idx >= context_start and offset[idx][1] >= end_char:
+                idx -= 1
+            end_positions.append(idx + 1)
+
+    inputs["start_positions"] = start_positions
+    inputs["end_positions"] = end_positions
+    return inputs
+```
+
+Note that we defined two constants to determine the maximum length used as well as the length of the sliding window, and that we added a tiny bit of cleanup before tokenizing: some of the questions in the SQuAD dataset have extra spaces at the beginning and the end that don't add anything (and take up space when being tokenized if you use a model like RoBERTa), so we removed those extra spaces.
+
+To apply this function to the whole training set, we use the `Dataset.map()` method with the `batched=True` flag. It's necessary here as we are changing the length of the dataset (since one example can give several training features):
+
+```py
+train_dataset = raw_datasets["train"].map(
+    preprocess_training_examples,
+    batched=True,
+    remove_columns=raw_datasets["train"].column_names,
+)
+len(raw_datasets["train"]), len(train_dataset)
+```
+
+```python out
+(87599, 88729)
+```
+
+As we can see, the preprocessing added roughly 1,000 features. Our training set is now ready to be used -- let's dig into the preprocessing of the validation set!
+
+### Processing the validation data[[processing-the-validation-data]]
+
+Preprocessing the validation data will be slightly easier as we don't need to generate labels (unless we want to compute a validation loss, but that number won't really help us understand how good the model is). The real joy will be to interpret the predictions of the model into spans of the original context. For this, we will just need to store both the offset mappings and some way to match each created feature to the original example it comes from. Since there is an ID column in the original dataset, we'll use that ID.
+
+The only thing we'll add here is a tiny bit of cleanup of the offset mappings. They will contain offsets for the question and the context, but once we're in the post-processing stage we won't have any way to know which part of the input IDs corresponded to the context and which part was the question (the `sequence_ids()` method we used is available for the output of the tokenizer only). So, we'll set the offsets corresponding to the question to `None`:
+
+```py
+def preprocess_validation_examples(examples):
+    questions = [q.strip() for q in examples["question"]]
+    inputs = tokenizer(
+        questions,
+        examples["context"],
+        max_length=max_length,
+        truncation="only_second",
+        stride=stride,
+        return_overflowing_tokens=True,
+        return_offsets_mapping=True,
+        padding="max_length",
+    )
+
+    sample_map = inputs.pop("overflow_to_sample_mapping")
+    example_ids = []
+
+    for i in range(len(inputs["input_ids"])):
+        sample_idx = sample_map[i]
+        example_ids.append(examples["id"][sample_idx])
+
+        sequence_ids = inputs.sequence_ids(i)
+        offset = inputs["offset_mapping"][i]
+        inputs["offset_mapping"][i] = [
+            o if sequence_ids[k] == 1 else None for k, o in enumerate(offset)
+        ]
+
+    inputs["example_id"] = example_ids
+    return inputs
+```
+
+We can apply this function on the whole validation dataset like before:
+
+```py
+validation_dataset = raw_datasets["validation"].map(
+    preprocess_validation_examples,
+    batched=True,
+    remove_columns=raw_datasets["validation"].column_names,
+)
+len(raw_datasets["validation"]), len(validation_dataset)
+```
+
+```python out
+(10570, 10822)
+```
+
+In this case we've only added a couple of hundred samples, so it appears the contexts in the validation dataset are a bit shorter.
+
+Now that we have preprocessed all the data, we can get to the training. 
+
+{#if fw === 'pt'}
+
+## Fine-tuning the model with the `Trainer` API[[fine-tuning-the-model-with-the-trainer-api]]
+
+The training code for this example will look a lot like the code in the previous sections -- the hardest thing will be to write the `compute_metrics()` function. Since we padded all the samples to the maximum length we set, there is no data collator to define, so this metric computation is really the only thing we have to worry about. The difficult part will be to post-process the model predictions into spans of text in the original examples; once we have done that, the metric from the 🤗 Datasets library will do most of the work for us.
+
+{:else}
+
+## Fine-tuning the model with Keras[[fine-tuning-the-model-with-keras]]
+
+The training code for this example will look a lot like the code in the previous sections, but computing the metrics will be uniquely challenging. Since we padded all the samples to the maximum length we set, there is no data collator to define, so this metric computation is really the only thing we have to worry about. The hard part will be to post-process the model predictions into spans of text in the original examples; once we have done that, the metric from the 🤗 Datasets library will do most of the work for us.
+
+{/if}
+
+### Post-processing[[post-processing]]
+
+{#if fw === 'pt'}
+
+<Youtube id="BNy08iIWVJM"/>
+
+{:else}
+
+<Youtube id="VN67ZpN33Ss"/>
+
+{/if}
+
+The model will output logits for the start and end positions of the answer in the input IDs, as we saw during our exploration of the [`question-answering` pipeline](/course/chapter6/3b). The post-processing step will be similar to what we did there, so here's a quick reminder of the actions we took:
+
+- We masked the start and end logits corresponding to tokens outside of the context.
+- We then converted the start and end logits into probabilities using a softmax.
+- We attributed a score to each `(start_token, end_token)` pair by taking the product of the corresponding two probabilities.
+- We looked for the pair with the maximum score that yielded a valid answer (e.g., a `start_token` lower than `end_token`).
+
+Here we will change this process slightly because we don't need to compute actual scores (just the predicted answer). This means we can skip the softmax step. To go faster, we also won't score all the possible `(start_token, end_token)` pairs, but only the ones corresponding to the highest `n_best` logits (with `n_best=20`). Since we will skip the softmax, those scores will be logit scores, and will be obtained by taking the sum of the start and end logits (instead of the product, because of the rule \\(\log(ab) = \log(a) + \log(b)\\)).
+
+To demonstrate all of this, we will need some kind of predictions. Since we have not trained our model yet, we are going to use the default model for the QA pipeline to generate some predictions on a small part of the validation set. We can use the same processing function as before; because it relies on the global constant `tokenizer`, we just have to change that object to the tokenizer of the model we want to use temporarily:
+
+```python
+small_eval_set = raw_datasets["validation"].select(range(100))
+trained_checkpoint = "distilbert-base-cased-distilled-squad"
+
+tokenizer = AutoTokenizer.from_pretrained(trained_checkpoint)
+eval_set = small_eval_set.map(
+    preprocess_validation_examples,
+    batched=True,
+    remove_columns=raw_datasets["validation"].column_names,
+)
+```
+
+Now that the preprocessing is done, we change the tokenizer back to the one we originally picked:
+
+```python
+tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
+```
+
+We then remove the columns of our `eval_set` that are not expected by the model, build a batch with all of that small validation set, and pass it through the model. If a GPU is available, we use it to go faster:
+
+{#if fw === 'pt'}
+
+```python
+import torch
+from transformers import AutoModelForQuestionAnswering
+
+eval_set_for_model = eval_set.remove_columns(["example_id", "offset_mapping"])
+eval_set_for_model.set_format("torch")
+
+device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")
+batch = {k: eval_set_for_model[k].to(device) for k in eval_set_for_model.column_names}
+trained_model = AutoModelForQuestionAnswering.from_pretrained(trained_checkpoint).to(
+    device
+)
+
+with torch.no_grad():
+    outputs = trained_model(**batch)
+```
+
+Since the `Trainer` will give us predictions as NumPy arrays, we grab the start and end logits and convert them to that format:
+
+```python
+start_logits = outputs.start_logits.cpu().numpy()
+end_logits = outputs.end_logits.cpu().numpy()
+```
+
+{:else}
+
+```python
+import tensorflow as tf
+from transformers import TFAutoModelForQuestionAnswering
+
+eval_set_for_model = eval_set.remove_columns(["example_id", "offset_mapping"])
+eval_set_for_model.set_format("numpy")
+
+batch = {k: eval_set_for_model[k] for k in eval_set_for_model.column_names}
+trained_model = TFAutoModelForQuestionAnswering.from_pretrained(trained_checkpoint)
+
+outputs = trained_model(**batch)
+```
+
+For ease of experimentation, let's convert these outputs to NumPy arrays:
+
+```python
+start_logits = outputs.start_logits.numpy()
+end_logits = outputs.end_logits.numpy()
+```
+
+{/if}
+
+Now, we need to find the predicted answer for each example in our `small_eval_set`. One example may have been split into several features in `eval_set`, so the first step is to map each example in `small_eval_set` to the corresponding features in `eval_set`:
+
+```python
+import collections
+
+example_to_features = collections.defaultdict(list)
+for idx, feature in enumerate(eval_set):
+    example_to_features[feature["example_id"]].append(idx)
+```
+
+With this in hand, we can really get to work by looping through all the examples and, for each example, through all the associated features. As we said before, we'll look at the logit scores for the `n_best` start logits and end logits, excluding positions that give:
+
+- An answer that wouldn't be inside the context
+- An answer with negative length
+- An answer that is too long (we limit the possibilities at `max_answer_length=30`)
+
+Once we have all the scored possible answers for one example, we just pick the one with the best logit score:
+
+```python
+import numpy as np
+
+n_best = 20
+max_answer_length = 30
+predicted_answers = []
+
+for example in small_eval_set:
+    example_id = example["id"]
+    context = example["context"]
+    answers = []
+
+    for feature_index in example_to_features[example_id]:
+        start_logit = start_logits[feature_index]
+        end_logit = end_logits[feature_index]
+        offsets = eval_set["offset_mapping"][feature_index]
+
+        start_indexes = np.argsort(start_logit)[-1 : -n_best - 1 : -1].tolist()
+        end_indexes = np.argsort(end_logit)[-1 : -n_best - 1 : -1].tolist()
+        for start_index in start_indexes:
+            for end_index in end_indexes:
+                # Skip answers that are not fully in the context
+                if offsets[start_index] is None or offsets[end_index] is None:
+                    continue
+                # Skip answers with a length that is either < 0 or > max_answer_length.
+                if (
+                    end_index < start_index
+                    or end_index - start_index + 1 > max_answer_length
+                ):
+                    continue
+
+                answers.append(
+                    {
+                        "text": context[offsets[start_index][0] : offsets[end_index][1]],
+                        "logit_score": start_logit[start_index] + end_logit[end_index],
+                    }
+                )
+
+    best_answer = max(answers, key=lambda x: x["logit_score"])
+    predicted_answers.append({"id": example_id, "prediction_text": best_answer["text"]})
+```
+
+The final format of the predicted answers is the one that will be expected by the metric we will use. As usual, we can load it with the help of the 🤗 Evaluate library:
+
+```python
+import evaluate
+
+metric = evaluate.load("squad")
+```
+
+This metric expects the predicted answers in the format we saw above (a list of dictionaries with one key for the ID of the example and one key for the predicted text) and the theoretical answers in the format below (a list of dictionaries with one key for the ID of the example and one key for the possible answers):
+
+```python
+theoretical_answers = [
+    {"id": ex["id"], "answers": ex["answers"]} for ex in small_eval_set
+]
+```
+
+We can now check that we get sensible results by looking at the first element of both lists:
+
+```python
+print(predicted_answers[0])
+print(theoretical_answers[0])
+```
+
+```python out
+{'id': '56be4db0acb8001400a502ec', 'prediction_text': 'Denver Broncos'}
+{'id': '56be4db0acb8001400a502ec', 'answers': {'text': ['Denver Broncos', 'Denver Broncos', 'Denver Broncos'], 'answer_start': [177, 177, 177]}}
+```
+
+Not too bad! Now let's have a look at the score the metric gives us:
+
+```python
+metric.compute(predictions=predicted_answers, references=theoretical_answers)
+```
+
+```python out
+{'exact_match': 83.0, 'f1': 88.25}
+```
+
+Again, that's rather good considering that according to [its paper](https://arxiv.org/abs/1910.01108v2) DistilBERT fine-tuned on SQuAD obtains 79.1 and 86.9 for those scores on the whole dataset.
+
+{#if fw === 'pt'}
+
+Now let's put everything we just did in a `compute_metrics()` function that we will use in the `Trainer`. Normally, that `compute_metrics()` function only receives a tuple `eval_preds` with logits and labels. Here we will need a bit more, as we have to look in the dataset of features for the offset and in the dataset of examples for the original contexts, so we won't be able to use this function to get regular evaluation results during training. We will only use it at the end of training to check the results.
+
+The `compute_metrics()` function groups the same steps as before; we just add a small check in case we don't come up with any valid answers (in which case we predict an empty string).
+
+{:else}
+
+Now let's put everything we just did in a `compute_metrics()` function that we will use after training our model. We will need to pass a bit more than just the output logits, as we have to look in the dataset of features for the offset and in the dataset of examples for the original contexts:
+
+{/if}
+
+```python
+from tqdm.auto import tqdm
+
+
+def compute_metrics(start_logits, end_logits, features, examples):
+    example_to_features = collections.defaultdict(list)
+    for idx, feature in enumerate(features):
+        example_to_features[feature["example_id"]].append(idx)
+
+    predicted_answers = []
+    for example in tqdm(examples):
+        example_id = example["id"]
+        context = example["context"]
+        answers = []
+
+        # Loop through all features associated with that example
+        for feature_index in example_to_features[example_id]:
+            start_logit = start_logits[feature_index]
+            end_logit = end_logits[feature_index]
+            offsets = features[feature_index]["offset_mapping"]
+
+            start_indexes = np.argsort(start_logit)[-1 : -n_best - 1 : -1].tolist()
+            end_indexes = np.argsort(end_logit)[-1 : -n_best - 1 : -1].tolist()
+            for start_index in start_indexes:
+                for end_index in end_indexes:
+                    # Skip answers that are not fully in the context
+                    if offsets[start_index] is None or offsets[end_index] is None:
+                        continue
+                    # Skip answers with a length that is either < 0 or > max_answer_length
+                    if (
+                        end_index < start_index
+                        or end_index - start_index + 1 > max_answer_length
+                    ):
+                        continue
+
+                    answer = {
+                        "text": context[offsets[start_index][0] : offsets[end_index][1]],
+                        "logit_score": start_logit[start_index] + end_logit[end_index],
+                    }
+                    answers.append(answer)
+
+        # Select the answer with the best score
+        if len(answers) > 0:
+            best_answer = max(answers, key=lambda x: x["logit_score"])
+            predicted_answers.append(
+                {"id": example_id, "prediction_text": best_answer["text"]}
+            )
+        else:
+            predicted_answers.append({"id": example_id, "prediction_text": ""})
+
+    theoretical_answers = [{"id": ex["id"], "answers": ex["answers"]} for ex in examples]
+    return metric.compute(predictions=predicted_answers, references=theoretical_answers)
+```
+
+We can check it works on our predictions:
+
+```python
+compute_metrics(start_logits, end_logits, eval_set, small_eval_set)
+```
+
+```python out
+{'exact_match': 83.0, 'f1': 88.25}
+```
+
+Looking good! Now let's use this to fine-tune our model.
+
+### Fine-tuning the model[[fine-tuning-the-model]]
+
+{#if fw === 'pt'}
+
+We are now ready to train our model. Let's create it first, using the `AutoModelForQuestionAnswering` class like before:
+
+```python
+model = AutoModelForQuestionAnswering.from_pretrained(model_checkpoint)
+```
+
+{:else}
+
+We are now ready to train our model. Let's create it first, using the `TFAutoModelForQuestionAnswering` class like before:
+
+```python
+model = TFAutoModelForQuestionAnswering.from_pretrained(model_checkpoint)
+```
+
+{/if}
+
+As usual, we get a warning that some weights are not used (the ones from the pretraining head) and some others are initialized randomly (the ones for the question answering head). You should be used to this by now, but that means this model is not ready to be used just yet and needs fine-tuning -- good thing we're about to do that!
+
+To be able to push our model to the Hub, we'll need to log in to Hugging Face. If you're running this code in a notebook, you can do so with the following utility function, which displays a widget where you can enter your login credentials:
+
+```python
+from huggingface_hub import notebook_login
+
+notebook_login()
+```
+
+If you aren't working in a notebook, just type the following line in your terminal:
+
+```bash
+huggingface-cli login
+```
+
+{#if fw === 'pt'}
+
+Once this is done, we can define our `TrainingArguments`. As we said when we defined our function to compute the metric, we won't be able to have a regular evaluation loop because of the signature of the `compute_metrics()` function. We could write our own subclass of `Trainer` to do this (an approach you can find in the [question answering example script](https://github.com/huggingface/transformers/blob/master/examples/pytorch/question-answering/trainer_qa.py)), but that's a bit too long for this section. Instead, we will only evaluate the model at the end of training here and show you how to do a regular evaluation in "A custom training loop" below.
+
+This is really where the `Trainer` API shows its limits and the 🤗 Accelerate library shines: customizing the class to a specific use case can be painful, but tweaking a fully exposed training loop is easy.
+
+Let's take a look at our `TrainingArguments`:
+
+```python
+from transformers import TrainingArguments
+
+args = TrainingArguments(
+    "bert-finetuned-squad",
+    evaluation_strategy="no",
+    save_strategy="epoch",
+    learning_rate=2e-5,
+    num_train_epochs=3,
+    weight_decay=0.01,
+    fp16=True,
+    push_to_hub=True,
+)
+```
+
+We've seen most of these before: we set some hyperparameters (like the learning rate, the number of epochs we train for, and some weight decay) and indicate that we want to save the model at the end of every epoch, skip evaluation, and upload our results to the Model Hub. We also enable mixed-precision training with `fp16=True`, as it can speed up the training nicely on a recent GPU.
+
+{:else}
+
+Now that's done, we can create our TF Datasets. We can use the simple default data collator this time:
+
+```python
+from transformers import DefaultDataCollator
+
+data_collator = DefaultDataCollator(return_tensors="tf")
+```
+
+And now we create the datasets as usual.
+
+```python
+tf_train_dataset = model.prepare_tf_dataset(
+    train_dataset,
+    collate_fn=data_collator,
+    shuffle=True,
+    batch_size=16,
+)
+tf_eval_dataset = model.prepare_tf_dataset(
+    validation_dataset,
+    collate_fn=data_collator,
+    shuffle=False,
+    batch_size=16,
+)
+```
+
+Next, we set up our training hyperparameters and compile our model:
+
+```python
+from transformers import create_optimizer
+from transformers.keras_callbacks import PushToHubCallback
+import tensorflow as tf
+
+# The number of training steps is the number of samples in the dataset, divided by the batch size then multiplied
+# by the total number of epochs. Note that the tf_train_dataset here is a batched tf.data.Dataset,
+# not the original Hugging Face Dataset, so its len() is already num_samples // batch_size.
+num_train_epochs = 3
+num_train_steps = len(tf_train_dataset) * num_train_epochs
+optimizer, schedule = create_optimizer(
+    init_lr=2e-5,
+    num_warmup_steps=0,
+    num_train_steps=num_train_steps,
+    weight_decay_rate=0.01,
+)
+model.compile(optimizer=optimizer)
+
+# Train in mixed-precision float16
+tf.keras.mixed_precision.set_global_policy("mixed_float16")
+```
+
+Finally, we're ready to train with `model.fit()`. We use a `PushToHubCallback` to upload the model to the Hub after each epoch.
+
+{/if}
+
+By default, the repository used will be in your namespace and named after the output directory you set, so in our case it will be in `"sgugger/bert-finetuned-squad"`. We can override this by passing a `hub_model_id`; for instance, to push the model to the `huggingface_course` organization we used `hub_model_id="huggingface_course/bert-finetuned-squad"` (which is the model we linked to at the beginning of this section).
+
+{#if fw === 'pt'}
+
+<Tip>
+
+💡 If the output directory you are using exists, it needs to be a local clone of the repository you want to push to (so set a new name if you get an error when defining your `Trainer`).
+
+</Tip>
+
+Finally, we just pass everything to the `Trainer` class and launch the training:
+
+```python
+from transformers import Trainer
+
+trainer = Trainer(
+    model=model,
+    args=args,
+    train_dataset=train_dataset,
+    eval_dataset=validation_dataset,
+    tokenizer=tokenizer,
+)
+trainer.train()
+```
+
+{:else}
+
+```python
+from transformers.keras_callbacks import PushToHubCallback
+
+callback = PushToHubCallback(output_dir="bert-finetuned-squad", tokenizer=tokenizer)
+
+# We're going to do validation afterwards, so no validation mid-training
+model.fit(tf_train_dataset, callbacks=[callback], epochs=num_train_epochs)
+```
+
+{/if}
+
+Note that while the training happens, each time the model is saved (here, every epoch) it is uploaded to the Hub in the background. This way, you will be able to to resume your training on another machine if necessary. The whole training takes a while (a little over an hour on a Titan RTX), so you can grab a coffee or reread some of the parts of the course that you've found more challenging while it proceeds. Also note that as soon as the first epoch is finished, you will see some weights uploaded to the Hub and you can start playing with your model on its page.
+
+{#if fw === 'pt'}
+
+Once the training is complete, we can finally evaluate our model (and pray we didn't spend all that compute time on nothing). The `predict()` method of the `Trainer` will return a tuple where the first elements will be the predictions of the model (here a pair with the start and end logits). We send this to our `compute_metrics()` function:
+
+```python
+predictions, _, _ = trainer.predict(validation_dataset)
+start_logits, end_logits = predictions
+compute_metrics(start_logits, end_logits, validation_dataset, raw_datasets["validation"])
+```
+
+{:else}
+
+Once the training is complete, we can finally evaluate our model (and pray we didn't spend all that compute time on nothing). The `predict()` method of our `model` will take care of getting predictions, and since we did all the hard work of defining a `compute_metrics()` function earlier, we can get our results in a single line:
+
+```python
+predictions = model.predict(tf_eval_dataset)
+compute_metrics(
+    predictions["start_logits"],
+    predictions["end_logits"],
+    validation_dataset,
+    raw_datasets["validation"],
+)
+```
+
+{/if}
+
+```python out
+{'exact_match': 81.18259224219489, 'f1': 88.67381321905516}
+```
+
+Great! As a comparison, the baseline scores reported in the BERT article for this model are 80.8 and 88.5, so we're right where we should be.
+
+{#if fw === 'pt'}
+
+Finally, we use the `push_to_hub()` method to make sure we upload the latest version of the model:
+
+```py
+trainer.push_to_hub(commit_message="Training complete")
+```
+
+This returns the URL of the commit it just did, if you want to inspect it:
+
+```python out
+'https://huggingface.co/sgugger/bert-finetuned-squad/commit/9dcee1fbc25946a6ed4bb32efb1bd71d5fa90b68'
+```
+
+The `Trainer` also drafts a model card with all the evaluation results and uploads it.
+
+{/if}
+
+At this stage, you can use the inference widget on the Model Hub to test the model and share it with your friends, family, and favorite pets. You have successfully fine-tuned a model on a question answering task -- congratulations!
+
+<Tip>
+
+✏️ **Your turn!** Try another model architecture to see if it performs better on this task!
+
+</Tip>
+
+{#if fw === 'pt'}
+
+If you want to dive a bit more deeply into the training loop, we will now show you how to do the same thing using 🤗  Accelerate.
+
+## A custom training loop[[a-custom-training-loop]]
+
+Let's now have a look at the full training loop, so you can easily customize the parts you need. It will look a lot like the training loop in [Chapter 3](/course/chapter3/4), with the exception of the evaluation loop. We will be able to evaluate the model regularly since we're not constrained by the `Trainer` class anymore.
+
+### Preparing everything for training[[preparing-everything-for-training]]
+
+First we need to build the `DataLoader`s from our datasets. We set the format of those datasets to `"torch"`, and remove the columns in the validation set that are not used by the model. Then, we can use the `default_data_collator` provided by Transformers as a `collate_fn` and shuffle the training set, but not the validation set:
+
+```py
+from torch.utils.data import DataLoader
+from transformers import default_data_collator
+
+train_dataset.set_format("torch")
+validation_set = validation_dataset.remove_columns(["example_id", "offset_mapping"])
+validation_set.set_format("torch")
+
+train_dataloader = DataLoader(
+    train_dataset,
+    shuffle=True,
+    collate_fn=default_data_collator,
+    batch_size=8,
+)
+eval_dataloader = DataLoader(
+    validation_set, collate_fn=default_data_collator, batch_size=8
+)
+```
+
+Next we reinstantiate our model, to make sure we're not continuing the fine-tuning from before but starting from the BERT pretrained model again:
+
+```py
+model = AutoModelForQuestionAnswering.from_pretrained(model_checkpoint)
+```
+
+Then we will need an optimizer. As usual we use the classic `AdamW`, which is like Adam, but with a fix in the way weight decay is applied:
+
+```py
+from torch.optim import AdamW
+
+optimizer = AdamW(model.parameters(), lr=2e-5)
+```
+
+Once we have all those objects, we can send them to the `accelerator.prepare()` method. Remember that if you want to train on TPUs in a Colab notebook, you will need to move all of this code into a training function, and that shouldn't execute any cell that instantiates an `Accelerator`. We can force mixed-precision training by passing `fp16=True` to the `Accelerator` (or, if you are executing the code as a script, just make sure to fill in the 🤗 Accelerate `config` appropriately).
+
+```py
+from accelerate import Accelerator
+
+accelerator = Accelerator(fp16=True)
+model, optimizer, train_dataloader, eval_dataloader = accelerator.prepare(
+    model, optimizer, train_dataloader, eval_dataloader
+)
+```
+
+As you should know from the previous sections, we can only use the `train_dataloader` length to compute the number of training steps after it has gone through the `accelerator.prepare()` method. We use the same linear schedule as in the previous sections:
+
+```py
+from transformers import get_scheduler
+
+num_train_epochs = 3
+num_update_steps_per_epoch = len(train_dataloader)
+num_training_steps = num_train_epochs * num_update_steps_per_epoch
+
+lr_scheduler = get_scheduler(
+    "linear",
+    optimizer=optimizer,
+    num_warmup_steps=0,
+    num_training_steps=num_training_steps,
+)
+```
+
+To push our model to the Hub, we will need to create a `Repository` object in a working folder. First log in to the Hugging Face Hub, if you're not logged in already. We'll determine the repository name from the model ID we want to give our model (feel free to replace the `repo_name` with your own choice; it just needs to contain your username, which is what the function `get_full_repo_name()` does):
+
+```py
+from huggingface_hub import Repository, get_full_repo_name
+
+model_name = "bert-finetuned-squad-accelerate"
+repo_name = get_full_repo_name(model_name)
+repo_name
+```
+
+```python out
+'sgugger/bert-finetuned-squad-accelerate'
+```
+
+Then we can clone that repository in a local folder. If it already exists, this local folder should be a clone of the repository we are working with:
+
+```py
+output_dir = "bert-finetuned-squad-accelerate"
+repo = Repository(output_dir, clone_from=repo_name)
+```
+
+We can now upload anything we save in `output_dir` by calling the `repo.push_to_hub()` method. This will help us upload the intermediate models at the end of each epoch.
+
+## Training loop[[training-loop]]
+
+We are now ready to write the full training loop. After defining a progress bar to follow how training goes, the loop has three parts:
+
+- The training in itself, which is the classic iteration over the `train_dataloader`, forward pass through the model, then backward pass and optimizer step.
+- The evaluation, in which we gather all the values for `start_logits` and `end_logits` before converting them to NumPy arrays. Once the evaluation loop is finished, we concatenate all the results. Note that we need to truncate because the `Accelerator` may have added a few samples at the end to ensure we have the same number of examples in each process.
+- Saving and uploading, where we first save the model and the tokenizer, then call `repo.push_to_hub()`. As we did before, we use the argument `blocking=False` to tell the 🤗 Hub library to push in an asynchronous process. This way, training continues normally and this (long) instruction is executed in the background.
+
+Here's the complete code for the training loop:
+
+```py
+from tqdm.auto import tqdm
+import torch
+
+progress_bar = tqdm(range(num_training_steps))
+
+for epoch in range(num_train_epochs):
+    # Training
+    model.train()
+    for step, batch in enumerate(train_dataloader):
+        outputs = model(**batch)
+        loss = outputs.loss
+        accelerator.backward(loss)
+
+        optimizer.step()
+        lr_scheduler.step()
+        optimizer.zero_grad()
+        progress_bar.update(1)
+
+    # Evaluation
+    model.eval()
+    start_logits = []
+    end_logits = []
+    accelerator.print("Evaluation!")
+    for batch in tqdm(eval_dataloader):
+        with torch.no_grad():
+            outputs = model(**batch)
+
+        start_logits.append(accelerator.gather(outputs.start_logits).cpu().numpy())
+        end_logits.append(accelerator.gather(outputs.end_logits).cpu().numpy())
+
+    start_logits = np.concatenate(start_logits)
+    end_logits = np.concatenate(end_logits)
+    start_logits = start_logits[: len(validation_dataset)]
+    end_logits = end_logits[: len(validation_dataset)]
+
+    metrics = compute_metrics(
+        start_logits, end_logits, validation_dataset, raw_datasets["validation"]
+    )
+    print(f"epoch {epoch}:", metrics)
+
+    # Save and upload
+    accelerator.wait_for_everyone()
+    unwrapped_model = accelerator.unwrap_model(model)
+    unwrapped_model.save_pretrained(output_dir, save_function=accelerator.save)
+    if accelerator.is_main_process:
+        tokenizer.save_pretrained(output_dir)
+        repo.push_to_hub(
+            commit_message=f"Training in progress epoch {epoch}", blocking=False
+        )
+```
+
+In case this is the first time you're seeing a model saved with 🤗 Accelerate, let's take a moment to inspect the three lines of code that go with it:
+
+```py
+accelerator.wait_for_everyone()
+unwrapped_model = accelerator.unwrap_model(model)
+unwrapped_model.save_pretrained(output_dir, save_function=accelerator.save)
+```
+
+The first line is self-explanatory: it tells all the processes to wait until everyone is at that stage before continuing. This is to make sure we have the same model in every process before saving. Then we grab the `unwrapped_model`, which is the base model we defined. The `accelerator.prepare()` method changes the model to work in distributed training, so it won't have the `save_pretrained()` method anymore; the `accelerator.unwrap_model()` method undoes that step. Lastly, we call `save_pretrained()` but tell that method to use `accelerator.save()` instead of `torch.save()`. 
+
+Once this is done, you should have a model that produces results pretty similar to the one trained with the `Trainer`. You can check the model we trained using this code at [*huggingface-course/bert-finetuned-squad-accelerate*](https://huggingface.co/huggingface-course/bert-finetuned-squad-accelerate). And if you want to test out any tweaks to the training loop, you can directly implement them by editing the code shown above!
+
+{/if}
+
+## Using the fine-tuned model[[using-the-fine-tuned-model]]
+
+We've already shown you how you can use the model we fine-tuned on the Model Hub with the inference widget. To use it locally in a `pipeline`, you just have to specify the model identifier:
+
+```py
+from transformers import pipeline
+
+# Replace this with your own checkpoint
+model_checkpoint = "huggingface-course/bert-finetuned-squad"
+question_answerer = pipeline("question-answering", model=model_checkpoint)
+
+context = """
+🤗 Transformers is backed by the three most popular deep learning libraries — Jax, PyTorch and TensorFlow — with a seamless integration
+between them. It's straightforward to train your models with one before loading them for inference with the other.
+"""
+question = "Which deep learning libraries back 🤗 Transformers?"
+question_answerer(question=question, context=context)
+```
+
+```python out
+{'score': 0.9979003071784973,
+ 'start': 78,
+ 'end': 105,
+ 'answer': 'Jax, PyTorch and TensorFlow'}
+```
+
+Great! Our model is working as well as the default one for this pipeline!
diff --git a/chapters/ro/chapter7/8.mdx b/chapters/ro/chapter7/8.mdx
new file mode 100644
index 000000000..78693b25b
--- /dev/null
+++ b/chapters/ro/chapter7/8.mdx
@@ -0,0 +1,22 @@
+# Mastering NLP[[mastering-nlp]]
+
+<CourseFloatingBanner
+    chapter={7}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+If you've made it this far in the course, congratulations -- you now have all the knowledge and tools you need to tackle (almost) any NLP task with 🤗 Transformers and the Hugging Face ecosystem!
+
+We have seen a lot of different data collators, so we made this little video to help you find which one to use for each task:
+
+<Youtube id="-RPeakdlHYo"/>
+
+After completing this lightning tour through the core NLP tasks, you should:
+
+* Know which architectures (encoder, decoder, or encoder-decoder) are best suited for each task
+* Understand the difference between pretraining and fine-tuning a language model
+* Know how to train Transformer models using either the `Trainer` API and distributed training features of 🤗 Accelerate or TensorFlow and Keras, depending on which track you've been following
+* Understand the meaning and limitations of metrics like ROUGE and BLEU for text generation tasks
+* Know how to interact with your fine-tuned models, both on the Hub and using the `pipeline` from 🤗 Transformers
+
+Despite all this knowledge, there will come a time when you'll either encounter a difficult bug in your code or have a question about how to solve a particular NLP problem. Fortunately, the Hugging Face community is here to help you! In the final chapter of this part of the course, we'll explore how you can debug your Transformer models and ask for help effectively.
\ No newline at end of file
diff --git a/chapters/ro/chapter7/9.mdx b/chapters/ro/chapter7/9.mdx
new file mode 100644
index 000000000..cb517efbf
--- /dev/null
+++ b/chapters/ro/chapter7/9.mdx
@@ -0,0 +1,329 @@
+<FrameworkSwitchCourse {fw} />
+
+<!-- DISABLE-FRONTMATTER-SECTIONS -->
+
+# End-of-chapter quiz[[end-of-chapter-quiz]]
+
+<CourseFloatingBanner
+    chapter={7}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+Let's test what you learned in this chapter!
+
+### 1. Which of the following tasks can be framed as a token classification problem?
+
+<Question
+	choices={[
+		{
+			text: "Find the grammatical components in a sentence.",
+			explain: "Correct! We can then label each word as a noun, verb, etc.",
+			correct: true
+		},
+		{
+			text: "Find whether a sentence is grammatically correct or not.",
+			explain: "No, this is a sequence classification problem."
+		},
+		{
+			text: "Find the persons mentioned in a sentence.",
+			explain: "Correct! We can label each word as person or not person.",
+            correct: true
+		},
+        {
+			text: "Find the chunk of words in a sentence that answers a question.",
+			explain: "No, that would be a question answering problem."
+		}
+	]}
+/>
+
+### 2. What part of the preprocessing for token classification differs from the other preprocessing pipelines?
+
+<Question
+	choices={[
+		{
+			text: "There is no need to do anything; the texts are already tokenized.",
+			explain: "The texts are indeed given as separate words, but we still need to apply the subword tokenization model."
+		},
+		{
+			text: "The texts are given as words, so we only need to apply subword tokenization.",
+			explain: "Correct! This is different from the usual preprocessing, where we need to apply the full tokenization pipeline. Can you think of another difference?",
+			correct: true
+		},
+		{
+			text: "We use <code>-100</code> to label the special tokens.",
+			explain: "That's not specific to token classification -- we always use <code>-100</code> as the label for tokens we want to ignore in the loss."
+		},
+		{
+			text: "We need to make sure to truncate or pad the labels to the same size as the inputs, when applying truncation/padding.",
+			explain: "Indeed! That's not the only difference, though.",
+			correct: true
+		}
+	]}
+/>
+
+### 3. What problem arises when we tokenize the words in a token classification problem and want to label the tokens?
+
+<Question
+	choices={[
+		{
+			text: "The tokenizer adds special tokens and we have no labels for them.",
+			explain: "We label these <code>-100</code> so they are ignored in the loss."
+		},
+		{
+			text: "Each word can produce several tokens, so we end up with more tokens than we have labels.",
+			explain: "That is the main problem, and we need to align the original labels with the tokens.",
+			correct: true
+		},
+		{
+			text: "The added tokens have no labels, so there is no problem.",
+			explain: "That's incorrect; we need as many labels as we have tokens or our models will error out."
+		}
+	]}
+/>
+
+### 4. What does "domain adaptation" mean?
+
+<Question
+	choices={[
+		{
+			text: "It's when we run a model on a dataset and get the predictions for each sample in that dataset.",
+			explain: "No, this is just running inference."
+		},
+		{
+			text: "It's when we train a model on a dataset.",
+			explain: "No, this is training a model; there is no adaptation here."
+		},
+		{
+			text: "It's when we fine-tune a pretrained model on a new dataset, and it gives predictions that are more adapted to that dataset",
+			explain: "Correct! The model adapted its knowledge to the new dataset.",
+            correct: true
+		},
+        {
+			text: "It's when we add misclassified samples to a dataset to make our model more robust.",
+			explain: "That's certainly something you should do if you retrain your model regularly, but it's not domain adaptation."
+		}
+	]}
+/>
+
+### 5. What are the labels in a masked language modeling problem?
+
+<Question
+	choices={[
+		{
+			text: "Some of the tokens in the input sentence are randomly masked and the labels are the original input tokens.",
+			explain: "That's it!",
+            correct: true
+		},
+		{
+			text: "Some of the tokens in the input sentence are randomly masked and the labels are the original input tokens, shifted to the left.",
+			explain: "No, shifting the labels to the left corresponds to predicting the next word, which is causal language modeling."
+		},
+		{
+			text: "Some of the tokens in the input sentence are randomly masked, and the label is whether the sentence is positive or negative.",
+			explain: "That's a sequence classification problem with some data augmentation, not masked language modeling."
+		},
+        {
+			text: "Some of the tokens in the two input sentences are randomly masked, and the label is whether the two sentences are similar or not.",
+			explain: "That's a sequence classification problem with some data augmentation, not masked language modeling."
+		}
+	]}
+/>
+
+### 6. Which of these tasks can be seen as a sequence-to-sequence problem?
+
+<Question
+	choices={[
+		{
+			text: "Writing short reviews of long documents",
+			explain: "Yes, that's a summarization problem. Try another answer!",
+            correct: true
+		},
+		{
+			text: "Answering questions about a document",
+			explain: "This can be framed as a sequence-to-sequence problem. It's not the only right answer, though.",
+            correct: true
+		},
+		{
+			text: "Translating a text in Chinese into English",
+			explain: "That's definitely a sequence-to-sequence problem. Can you spot another one?",
+            correct: true
+		},
+        {
+			text: "Fixing the messages sent by my nephew/friend so they're in proper English",
+			explain: "That's a kind of translation problem, so definitely a sequence-to-sequence task. This isn't the only right answer, though!",
+			correct: true
+		}
+	]}
+/>
+
+### 7. What is the proper way to preprocess the data for a sequence-to-sequence problem?
+
+<Question
+	choices={[
+		{
+			text: "The inputs and targets have to be sent together to the tokenizer with <code>inputs=...</code> and <code>targets=...</code>.",
+			explain: "This might be an API we add in the future, but that's not possible right now."
+		},
+		{
+			text: "The inputs and the targets both have to be preprocessed, in two separate calls to the tokenizer.",
+			explain: "That is true, but incomplete. There is something you need to do to make sure the tokenizer processes both properly."
+		},
+		{
+			text: "As usual, we just have to tokenize the inputs.",
+			explain: "Not in a sequence classification problem; the targets are also texts we need to convert into numbers!"
+		},
+        {
+			text: "The inputs have to be sent to the tokenizer, and the targets too, but under a special context manager.",
+			explain: "That's correct, the tokenizer needs to be put into target mode by that context manager.",
+			correct: true
+		}
+	]}
+/>
+
+{#if fw === 'pt'}
+
+### 8. Why is there a specific subclass of `Trainer` for sequence-to-sequence problems?
+
+<Question
+	choices={[
+		{
+			text: "Because sequence-to-sequence problems use a custom loss, to ignore the labels set to <code>-100</code>",
+			explain: "That's not a custom loss at all, but the way the loss is always computed."
+		},
+		{
+			text: "Because sequence-to-sequence problems require a special evaluation loop",
+			explain: "That's correct. Sequence-to-sequence models' predictions are often run using the <code>generate()</code> method.",
+			correct: true
+		},
+		{
+			text: "Because the targets are texts in sequence-to-sequence problems",
+			explain: "The <code>Trainer</code> doesn't really care about that since they have been preprocessed before."
+		},
+        {
+			text: "Because we use two models in sequence-to-sequence problems",
+			explain: "We do use two models in a way, an encoder and a decoder, but they are grouped together in one model."
+		}
+	]}
+/>
+
+{:else}
+
+### 9. Why is it often unnecessary to specify a loss when calling `compile()` on a Transformer model?
+
+<Question
+	choices={[
+		{
+			text: "Because Transformer models are trained with unsupervised learning",
+			explain: "Not quite -- even unsupervised learning needs a loss function!"
+		},
+		{
+			text: "Because the model's internal loss output is used by default",
+			explain: "That's correct!",
+			correct: true
+		},
+		{
+			text: "Because we compute metrics after training instead",
+			explain: "We do often do that, but it doesn't explain where we get the loss value we optimize in training."
+		},
+        {
+			text: "Because loss is specified in `model.fit()` instead",
+			explain: "No, the loss function is always fixed once you run `model.compile()`, and can't be changed in `model.fit()`."
+		}
+	]}
+/>
+
+{/if}
+
+### 10. When should you pretrain a new model?
+
+<Question
+	choices={[
+		{
+			text: "When there is no pretrained model available for your specific language",
+			explain: "That's correct.",
+			correct: true
+		},
+		{
+			text: "When you have lots of data available, even if there is a pretrained model that could work on it",
+			explain: "In this case, you should probably use the pretrained model and fine-tune it on your data, to avoid huge compute costs."
+		},
+		{
+			text: "When you have concerns about the bias of the pretrained model you are using",
+			explain: "That is true, but you have to make very sure the data you will use for training is really better.",
+			correct: true
+		},
+        {
+			text: "When the pretrained models available are just not good enough",
+			explain: "Are you sure you've properly debugged your training, then?"
+		}
+	]}
+/>
+
+### 11. Why is it easy to pretrain a language model on lots and lots of texts?
+
+<Question
+	choices={[
+		{
+			text: "Because there are plenty of texts available on the internet",
+			explain: "Although true, that doesn't really answer the question. Try again!"
+		},
+		{
+			text: "Because the pretraining objective does not require humans to label the data",
+			explain: "That's correct, language modeling is a self-supervised problem.",
+			correct: true
+		},
+		{
+			text: "Because the 🤗 Transformers library only requires a few lines of code to start the training",
+			explain: "Although true, that doesn't really answer the question asked. Try another answer!"
+		}
+	]}
+/>
+
+### 12. What are the main challenges when preprocessing data for a question answering task?
+
+<Question
+	choices={[
+		{
+			text: "You need to tokenize the inputs.",
+			explain: "That's correct, but is it really a main challenge?"
+		},
+		{
+			text: "You need to deal with very long contexts, which give several training features that may or may not have the answer in them.",
+			explain: "This is definitely one of the challenges.",
+			correct: true
+		},
+		{
+			text: "You need to tokenize the answers to the question as well as the inputs.",
+			explain: "No, unless you are framing your question answering problem as a sequence-to-sequence task."
+		},
+       {
+			text: "From the answer span in the text, you have to find the start and end token in the tokenized input.",
+			explain: "That's one of the hard parts, yes!",
+			correct: true
+		}
+	]}
+/>
+
+### 13. How is post-processing usually done in question answering?
+
+<Question
+	choices={[
+		{
+			text: "The model gives you the start and end positions of the answer, and you just have to decode the corresponding span of tokens.",
+			explain: "That could be one way to do it, but it's a bit too simplistic."
+		},
+		{
+			text: "The model gives you the start and end positions of the answer for each feature created by one example, and you just have to decode the corresponding span of tokens in the one that has the best score.",
+			explain: "That's close to the post-processing we studied, but it's not entirely right."
+		},
+		{
+			text: "The model gives you the start and end positions of the answer for each feature created by one example, and you just have to match them to the span in the context for the one that has the best score.",
+			explain: "That's it in a nutshell!",
+			correct: true
+		},
+        {
+			text: "The model generates an answer, and you just have to decode it.",
+			explain: "No, unless you are framing your question answering problem as a sequence-to-sequence task."
+		}
+	]}
+/>

From 5681ee4c9d309c24437582c84ecf8aa20381e477 Mon Sep 17 00:00:00 2001
From: Angroys <120798951+Angroys@users.noreply.github.com>
Date: Thu, 16 Jan 2025 21:12:41 +0200
Subject: [PATCH 014/167] done until section 6

---
 chapters/ro/chapter7/3.mdx | 207 +++++++++++++++--------------
 chapters/ro/chapter7/4.mdx | 259 ++++++++++++++++++-------------------
 chapters/ro/chapter7/5.mdx | 246 ++++++++++++++++++-----------------
 chapters/ro/chapter7/6.mdx | 136 +++++++++----------
 chapters/ro/chapter7/7.mdx |   2 +-
 5 files changed, 425 insertions(+), 425 deletions(-)

diff --git a/chapters/ro/chapter7/3.mdx b/chapters/ro/chapter7/3.mdx
index de3da9a1f..9c33524f7 100644
--- a/chapters/ro/chapter7/3.mdx
+++ b/chapters/ro/chapter7/3.mdx
@@ -1,6 +1,6 @@
 <FrameworkSwitchCourse {fw} />
 
-# Fine-tuning a masked language model[[fine-tuning-a-masked-language-model]]
+# Fine-tuningul unui masked language model[[fine-tuning-a-masked-language-model]]
 
 {#if fw === 'pt'}
 
@@ -22,45 +22,45 @@
 
 {/if}
 
-For many NLP applications involving Transformer models, you can simply take a pretrained model from the Hugging Face Hub and fine-tune it directly on your data for the task at hand. Provided that the corpus used for pretraining is not too different from the corpus used for fine-tuning, transfer learning will usually produce good results. 
+Pentru multe aplicații NLP care implică modele Transformer, puteți lua pur și simplu un model preantrenat de pe Hugging Face Hub și să îl faceți fine-tune direct pe datele voastre pentru sarcina dată. Cu condiția că corpusul utilizat pentru preantrenare să nu fie prea diferit de corpusul utilizat pentru fine-tuning, învățarea prin transfer va produce de obicei rezultate bune.
 
-However, there are a few cases where you'll want to first fine-tune the language models on your data, before training a task-specific head. For example, if your dataset contains legal contracts or scientific articles, a vanilla Transformer model like BERT will typically treat the domain-specific words in your corpus as rare tokens, and the resulting performance may be less than satisfactory. By fine-tuning the language model on in-domain data you can boost the performance of many downstream tasks, which means you usually only have to do this step once!
+Cu toate acestea, există câteva cazuri în care veți dori să faceți fine-tune mai întâi modelelor lingvistice pe datele voastre, înainte de a antrena un head specific sarcinii. De exemplu, dacă datasetul vostru conține contracte juridice sau articole științifice, un model Transformer obișnuit, precum BERT, va trata de obicei cuvintele specifice domeniului din corpus ca pe niște tokeni rari, iar performanța rezultată poate fi mai puțin satisfăcătoare. Prin fine-tuningul  modelului lingvistic pe baza datelor din domeniu, puteți crește performanța multor sarcini, ceea ce înseamnă că, de obicei, trebuie să efectuați acest pas o singură dată!
 
-This process of fine-tuning a pretrained language model on in-domain data is usually called _domain adaptation_. It was popularized in 2018 by [ULMFiT](https://arxiv.org/abs/1801.06146), which was one of the first neural architectures (based on LSTMs) to make transfer learning really work for NLP. An example of domain adaptation with ULMFiT is shown in the image below; in this section we'll do something similar, but with a Transformer instead of an LSTM!
+Acest proces de fine-tuning a unui model lingvistic preantrenat pe date din domeniu se numește de obicei _adaptare la domeniu_. Acesta a fost popularizat în 2018 de [ULMFiT](https://arxiv.org/abs/1801.06146), care a fost una dintre primele arhitecturi neuronale (bazate pe LSTM-uri) care a făcut ca învățarea prin transfer să funcționeze cu adevărat pentru NLP. Un exemplu de adaptare la domeniu cu ULMFiT este prezentat în imaginea de mai jos; în această secțiune vom face ceva similar, dar cu un Transformer în loc de un LSTM!
 
 <div class="flex justify-center">
 <img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/ulmfit.svg" alt="ULMFiT."/>
 <img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/ulmfit-dark.svg" alt="ULMFiT."/>
 </div>
 
-By the end of this section you'll have a [masked language model](https://huggingface.co/huggingface-course/distilbert-base-uncased-finetuned-imdb?text=This+is+a+great+%5BMASK%5D.) on the Hub that can autocomplete sentences as shown below:
+Până la sfârșitul acestei secțiuni, veți avea un [model de limbaj mascat](https://huggingface.co/huggingface-course/distilbert-base-uncased-finetuned-imdb?text=This+is+a+great+%5BMASK%5D.) pe Hub, care poate completa automat propoziții, după cum se poate vedea mai jos:
 
 <iframe src="https://course-demos-distilbert-base-uncased-finetuned-imdb.hf.space" frameBorder="0" height="300" title="Gradio app" class="block dark:hidden container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
 
-Let's dive in!
+Hai să începem!
 
 <Youtube id="mqElG5QJWUg"/>
 
 <Tip>
 
-🙋 If the terms "masked language modeling" and "pretrained model" sound unfamiliar to you, go check out [Chapter 1](/course/chapter1), where we explain all these core concepts, complete with videos!
+🙋 Dacă termenii "masked language modeling" și "pretrained model" nu vă sună familiar, mergeți să verificați [Capitolul 1](/course/chapter1), unde vă explicăm toate aceste concepte de bază, cu videoclipuri!
 
 </Tip>
 
-## Picking a pretrained model for masked language modeling[[picking-a-pretrained-model-for-masked-language-modeling]]
+## Alegerea unui model preantrenat pentru masked language modeling[[picking-a-pretrained-model-for-masked-language-modeling]]
 
-To get started, let's pick a suitable pretrained model for masked language modeling. As shown in the following screenshot, you can find a list of candidates by applying the "Fill-Mask" filter on the [Hugging Face Hub](https://huggingface.co/models?pipeline_tag=fill-mask&sort=downloads):
+Pentru a începe, să alegem un model preantrenat adecvat pentru modelarea limbajului mascat. După cum se vede în următoarea captură de ecran, puteți găsi o listă de candidați prin aplicarea filtrului "Fill-Mask" pe [Hugging Face Hub](https://huggingface.co/models?pipeline_tag=fill-mask&sort=downloads):
 
 <div class="flex justify-center">
 <img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/mlm-models.png" alt="Hub models." width="80%"/>
 </div>
 
-Although the BERT and RoBERTa family of models are the most downloaded, we'll use a model called [DistilBERT](https://huggingface.co/distilbert-base-uncased) 
-that can be trained much faster with little to no loss in downstream performance. This model was trained using a special technique called [_knowledge distillation_](https://en.wikipedia.org/wiki/Knowledge_distillation), where a large "teacher model" like BERT is used to guide the training of a "student model" that has far fewer parameters. An explanation of the details of knowledge distillation would take us too far afield in this section, but if you're interested you can read all about it in [_Natural Language Processing with Transformers_](https://www.oreilly.com/library/view/natural-language-processing/9781098136789/) (colloquially known as the Transformers textbook).
+Deși modelele din familia BERT și RoBERTa sunt cele mai descărcate, vom utiliza un model numit [DistilBERT](https://huggingface.co/distilbert-base-uncased)
+care poate fi antrenat mult mai rapid, cu o pierdere mică sau nulă a performanței în aval. Acest model a fost antrenat folosind o tehnică specială numită [_knowledge distillation_](https://en.wikipedia.org/wiki/Knowledge_distillation), în care un "model profesor" mare, precum BERT, este folosit pentru a ghida antrenarea unui "model elev" care are mult mai puțini parametrii. O explicație a detaliilor privind distilarea cunoștințelor ne-ar duce prea departe în această secțiune, dar dacă ești interesat, poți citi totul despre aceasta în [_Natural Language Processing with Transformers_](https://www.oreilly.com/library/view/natural-language-processing/9781098136789/) (cunoscut sub numele colocvial de Transformers textbooks).
 
 {#if fw === 'pt'}
 
-Let's go ahead and download DistilBERT using the `AutoModelForMaskedLM` class:
+Să continuăm și să descărcăm modelul DistilBERT folosind clasa `AutoModelForMaskedLM`:
 
 ```python
 from transformers import AutoModelForMaskedLM
@@ -69,7 +69,7 @@ model_checkpoint = "distilbert-base-uncased"
 model = AutoModelForMaskedLM.from_pretrained(model_checkpoint)
 ```
 
-We can see how many parameters this model has by calling the `num_parameters()` method:
+Putem vedea câți parametri are acest model prin apelarea metodei `num_parameters()`:
 
 ```python
 distilbert_num_parameters = model.num_parameters() / 1_000_000
@@ -84,7 +84,7 @@ print(f"'>>> BERT number of parameters: 110M'")
 
 {:else}
 
-Let's go ahead and download DistilBERT using the `AutoModelForMaskedLM` class:
+Să continuăm și să descărcăm modelul DistilBERT folosind clasa `TFAutoModelForMaskedLM`:
 
 ```python
 from transformers import TFAutoModelForMaskedLM
@@ -93,7 +93,7 @@ model_checkpoint = "distilbert-base-uncased"
 model = TFAutoModelForMaskedLM.from_pretrained(model_checkpoint)
 ```
 
-We can see how many parameters this model has by calling the `summary()` method:
+Putem vedea câți parametri are acest model prin apelarea metodei `summary()`:
 
 ```python
 model.summary()
@@ -120,13 +120,13 @@ _________________________________________________________________
 
 {/if}
 
-With around 67 million parameters, DistilBERT is approximately two times smaller than the BERT base model, which roughly translates into a two-fold speedup in training -- nice! Let's now see what kinds of tokens this model predicts are the most likely completions of a small sample of text:
+Cu aproximativ 67 de milioane de parametri, DistilBERT este de aproximativ două ori mai mic decât modelul de bază BERT, ceea ce se traduce aproximativ printr-o creștere de două ori a vitezei de antrenare - super! Să vedem acum ce tipuri de tokeni prezice acest model ca fiind cele mai probabile completări ale unui mic sample de text:
 
 ```python
 text = "This is a great [MASK]."
 ```
 
-As humans, we can imagine many possibilities for the `[MASK]` token, such as "day", "ride", or "painting". For pretrained models, the predictions depend on the corpus the model was trained on, since it learns to pick up the statistical patterns present in the data. Like BERT, DistilBERT was pretrained on the [English Wikipedia](https://huggingface.co/datasets/wikipedia) and [BookCorpus](https://huggingface.co/datasets/bookcorpus) datasets, so we expect the predictions for `[MASK]` to reflect these domains. To predict the mask we need DistilBERT's tokenizer to produce the inputs for the model, so let's download that from the Hub as well:
+Ca oameni, ne putem imagina multe posibilități pentru tokenul `[MASK]`, cum ar fi "day", "ride" sau "painting". Pentru modelele preantrenate, predicțiile depind de corpusul pe care modelul a fost antrenat, deoarece acesta învață să detecteze tiparele statistice prezente în date. La fel ca BERT, DistilBERT a fost preantrenat pe dataseturile [English Wikipedia](https://huggingface.co/datasets/wikipedia) și [BookCorpus](https://huggingface.co/datasets/bookcorpus), astfel încât ne așteptăm ca predicțiile pentru `[MASK]` să reflecte aceste domenii. Pentru a prezice masca, avem nevoie de tokenizerul DistilBERT pentru a produce inputurile pentru model, deci hai să-l descărcăm și pe acesta din Hub:
 
 ```python
 from transformers import AutoTokenizer
@@ -134,7 +134,7 @@ from transformers import AutoTokenizer
 tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
 ```
 
-With a tokenizer and a model, we can now pass our text example to the model, extract the logits, and print out the top 5 candidates:
+Cu un tokenizer și un model, putem acum să transmitem exemplul nostru de text modelului, să extragem logiturile și să tipărim primii 5 candidați:
 
 {#if fw === 'pt'}
 
@@ -181,13 +181,12 @@ for token in top_5_tokens:
 '>>> This is a great idea.'
 '>>> This is a great feat.'
 ```
+Putem vedea din rezultate că predicțiile modelului se referă la termeni din viața de zi cu zi, ceea ce poate că nu este surprinzător având în vedere fundamentul Wikipedia în limba engleză. Să vedem cum putem schimba acest domeniu în ceva puțin mai nișat - recenzii de filme foarte polarizate!
 
-We can see from the outputs that the model's predictions refer to everyday terms, which is perhaps not surprising given the foundation of English Wikipedia. Let's see how we can change this domain to something a bit more niche -- highly polarized movie reviews!
 
+## Datasetul[[the-dataset]]
 
-## The dataset[[the-dataset]]
-
-To showcase domain adaptation, we'll use the famous [Large Movie Review Dataset](https://huggingface.co/datasets/imdb) (or IMDb for short), which is a corpus of movie reviews that is often used to benchmark sentiment analysis models. By fine-tuning DistilBERT on this corpus, we expect the language model will adapt its vocabulary from the factual data of Wikipedia that it was pretrained on to the more subjective elements of movie reviews. We can get the data from the Hugging Face Hub with the `load_dataset()` function from 🤗 Datasets:
+Pentru a prezenta adaptarea la domeniu, vom utiliza faimosul [Large Movie Review Dataset] (https://huggingface.co/datasets/imdb) (sau IMDb pe scurt), care este un corpus de recenzii de filme care este adesea utilizat pentru a evalua modelele de analiză a sentimentelor. Prin fine-tuningul aplicat asupra DistilBERT pe acest corpus, ne așteptăm ca modelul de limbaj să își adapteze vocabularul de la datele factuale din Wikipedia pe care a fost antrenat în prealabil la elementele mai subiective ale recenziilor de film. Putem obține datele din Hugging Face Hub cu funcția `load_dataset()` din 🤗 Datasets:
 
 ```python
 from datasets import load_dataset
@@ -213,7 +212,7 @@ DatasetDict({
 })
 ```
 
-We can see that the `train` and `test` splits each consist of 25,000 reviews, while there is an unlabeled split called `unsupervised` that contains 50,000 reviews. Let's take a look at a few samples to get an idea of what kind of text we're dealing with. As we've done in previous chapters of the course, we'll chain the `Dataset.shuffle()` and `Dataset.select()` functions to create a random sample:
+Putem vedea că segmentele `train` și `test` conțin fiecare 25.000 de recenzii, în timp ce există un segment fără label numită `unsupervised` care conține 50.000 de recenzii. Să aruncăm o privire la câteva sampleuri pentru a ne face o idee despre tipul de text cu care avem de-a face. Așa cum am făcut în capitolele anterioare ale cursului, vom combina funcțiile `Dataset.shuffle()` și `Dataset.select()` pentru a crea un sample aleatoriu:
 
 ```python
 sample = imdb_dataset["train"].shuffle(seed=42).select(range(3))
@@ -235,23 +234,23 @@ for row in sample:
 '>>> Label: 1'
 ```
 
-Yep, these are certainly movie reviews, and if you're old enough you may even understand the comment in the last review about owning a VHS version 😜! Although we won't need the labels for language modeling, we can already see that a `0` denotes a negative review, while a `1` corresponds to a positive one.
+Da, acestea sunt cu siguranță recenzii de film și, dacă sunteți suficient de bătrâni, ați putea chiar înțelege comentariul din ultima recenzie despre deținerea unei versiuni VHS 😜! Deși nu vom avea nevoie de labeluri pentru modelarea limbajului, putem vedea deja că un `0` denotă o recenzie negativă, în timp ce un `1` corespunde uneia pozitive.
 
 <Tip>
 
-✏️ **Try it out!** Create a random sample of the `unsupervised` split and verify that the labels are neither `0` nor `1`. While you're at it, you could also check that the labels in the `train` and `test` splits are indeed `0` or `1` -- this is a useful sanity check that every NLP practitioner should perform at the start of a new project!
+✏️ **Încearcă!** Creați un sample aleatoriu din segmentul `unsupervised` și verificați că labelurile nu sunt nici `0`, nici `1`. În același timp, ați putea verifica și dacă labelurile din segmentele `train` și `test` sunt într-adevăr `0` sau `1` - aceasta este o verificare utilă pe care orice practicant NLP ar trebui să o efectueze la începutul unui nou proiect!
 
 </Tip>
 
-Now that we've had a quick look at the data, let's dive into preparing it for masked language modeling. As we'll see, there are some additional steps that one needs to take compared to the sequence classification tasks we saw in [Chapter 3](/course/chapter3). Let's go!
+Acum că am aruncat o privire rapidă asupra datelor, să ne apucăm să le pregătim pentru modelarea limbajului mascat. După cum vom vedea, există câteva etape suplimentare pe care trebuie să le parcurgem în comparație cu sarcinile de clasificare a secvențelor pe care le-am văzut în [Capitolul 3](/course/chapter3). Să începem!
 
-## Preprocessing the data[[preprocessing-the-data]]
+## Preprocesarea datelor[[preprocessing-the-data]]
 
 <Youtube id="8PmhEIXhBvI"/>
 
-For both auto-regressive and masked language modeling, a common preprocessing step is to concatenate all the examples and then split the whole corpus into chunks of equal size. This is quite different from our usual approach, where we simply tokenize individual examples. Why concatenate everything together? The reason is that individual examples might get truncated if they're too long, and that would result in losing information that might be useful for the language modeling task!
+Atât pentru auto-regressive cât și pentru masked language modeling, un pas comun de preprocesare este concatenarea tuturor exemplelor și apoi împărțirea întregului corpus în bucăți de dimensiuni egale. Acest lucru este destul de diferit de abordarea noastră obișnuită, în care pur și simplu tokenizăm exemplele individuale. De ce să concatenăm totul împreună? Motivul este că exemplele individuale ar putea fi trunchiate dacă sunt prea lungi, ceea ce ar duce la pierderea de informații care ar putea fi utile pentru sarcina de modelare a limbajului!
 
-So to get started, we'll first tokenize our corpus as usual, but _without_ setting the `truncation=True` option in our tokenizer. We'll also grab the word IDs if they are available ((which they will be if we're using a fast tokenizer, as described in [Chapter 6](/course/chapter6/3)), as we will need them later on to do whole word masking. We'll wrap this in a simple function, and while we're at it we'll remove the `text` and `label` columns since we don't need them any longer:
+Deci, pentru a începe, vom tokeniza mai întâi corpusul nostru ca de obicei, dar _fără_ a seta opțiunea `truncation=True` în tokenizerul nostru. De asemenea, vom prelua ID-urile cuvintelor dacă acestea sunt disponibile (ceea ce va fi cazul dacă folosim un tokenizer rapid, așa cum este descris în [Capitolul 6](/course/chapter6/3)), deoarece vom avea nevoie de ele mai târziu pentru a face mascarea întregului cuvânt. Vom include acest lucru într-o funcție simplă și, în același timp, vom elimina coloanele `text` și `label`, deoarece nu mai avem nevoie de ele:
 
 ```python
 def tokenize_function(examples):
@@ -261,7 +260,7 @@ def tokenize_function(examples):
     return result
 
 
-# Use batched=True to activate fast multithreading!
+# Utilizați batched=True pentru a activa multithreadingul!
 tokenized_datasets = imdb_dataset.map(
     tokenize_function, batched=True, remove_columns=["text", "label"]
 )
@@ -285,9 +284,9 @@ DatasetDict({
 })
 ```
 
-Since DistilBERT is a BERT-like model, we can see that the encoded texts consist of the `input_ids` and `attention_mask` that we've seen in other chapters, as well as the `word_ids` we added. 
+Deoarece DistilBERT este un model de tip BERT, putem vedea că textele codate constau din `input_ids` și `attention_mask` pe care le-am văzut în alte capitole, precum și din `word_ids` pe care le-am adăugat.
 
-Now that we've tokenized our movie reviews, the next step is to group them all together and split the result into chunks. But how big should these chunks be? This will ultimately be determined by the amount of GPU memory that you have available, but a good starting point is to see what the model's maximum context size is. This can be inferred by inspecting the `model_max_length` attribute of the tokenizer:
+Acum că am tokenizat recenziile de filme, următorul pas este să le grupăm pe toate și să împărțim rezultatul în chunkuri. Dar cât de mari ar trebui să fie aceste chunkuri? Acest lucru va fi determinat în cele din urmă de cantitatea de memorie GPU pe care o aveți disponibilă, dar un bun punct de plecare este să vedeți care este dimensiunea maximă a contextului modelului. Aceasta poate fi dedusă prin inspectarea atributului `model_max_length` al tokenizerului:
 
 ```python
 tokenizer.model_max_length
@@ -297,15 +296,15 @@ tokenizer.model_max_length
 512
 ```
 
-This value is derived from the *tokenizer_config.json* file associated with a checkpoint; in this case we can see that the context size is 512 tokens, just like with BERT.
+Această valoare este derivată din fișierul *tokenizer_config.json* asociat cu un checkpoint; în acest caz putem vedea că dimensiunea contextului este de 512 tokeni, la fel ca în cazul BERT.
 
 <Tip>
 
-✏️ **Try it out!** Some Transformer models, like [BigBird](https://huggingface.co/google/bigbird-roberta-base) and [Longformer](hf.co/allenai/longformer-base-4096), have a much longer context length than BERT and other early Transformer models. Instantiate the tokenizer for one of these checkpoints and verify that the `model_max_length` agrees with what's quoted on its model card.
+✏️ **Încearcă!** Unele modele Transformer, precum [BigBird](https://huggingface.co/google/bigbird-roberta-base) și [Longformer](hf.co/allenai/longformer-base-4096), au o lungime de context mult mai mare decât BERT și alte modele Transformer mai vechi. Inițializați tokenizerul pentru unul dintre aceste checkpointuri și verificați dacă `model_max_length` este în concordanță cu ceea ce este menționat pe model card.
 
 </Tip>
 
-So, in order to run our experiments on GPUs like those found on Google Colab, we'll pick something a bit smaller that can fit in memory:
+Prin urmare, pentru a derula experimentele pe GPU-uri precum cele de pe Google Colab, vom alege ceva mai mic care să încapă în memorie:
 
 ```python
 chunk_size = 128
@@ -313,14 +312,14 @@ chunk_size = 128
 
 <Tip warning={true}>
 
-Note that using a small chunk size can be detrimental in real-world scenarios, so you should use a size that corresponds to the use case you will apply your model to.
+Rețineți că utilizarea unei dimensiuni mici a chunkurilor poate fi dăunător în scenariile din lumea reală, astfel încât ar trebui să utilizați o dimensiune care corespunde cazului de utilizare la care veți aplica modelul.
 
 </Tip>
 
-Now comes the fun part. To show how the concatenation works, let's take a few reviews from our tokenized training set and print out the number of tokens per review:
+Acum vine partea distractivă. Pentru a arăta cum funcționează concatenarea, să luăm câteva recenzii din setul nostru de antrenare tokenizat și să imprimăm numărul de tokeni per recenzie:
 
 ```python
-# Slicing produces a list of lists for each feature
+# Slicingul produce o listă de liste pentru fiecare caracteristică
 tokenized_samples = tokenized_datasets["train"][:3]
 
 for idx, sample in enumerate(tokenized_samples["input_ids"]):
@@ -333,7 +332,7 @@ for idx, sample in enumerate(tokenized_samples["input_ids"]):
 '>>> Review 2 length: 192'
 ```
 
-We can then concatenate all these examples with a simple dictionary comprehension, as follows:
+Putem apoi concatena toate aceste exemple cu un dictionary comprehension, după cum urmează:
 
 ```python
 concatenated_examples = {
@@ -347,7 +346,7 @@ print(f"'>>> Concatenated reviews length: {total_length}'")
 '>>> Concatenated reviews length: 951'
 ```
 
-Great, the total length checks out -- so now let's split the concatenated reviews into chunks of the size given by `chunk_size`. To do so, we iterate over the features in `concatenated_examples` and use a list comprehension to create slices of each feature. The result is a dictionary of chunks for each feature:
+Minunat, lungimea totală se verifică - așa că acum să împărțim recenziile concatenate în chunkuri de dimensiunea dată de `chunk_size`. Pentru a face acest lucru, iterăm peste caracteristicile din `concatenated_examples` și folosim un list comprehension pentru a crea slice-uri ale fiecărei caracteristici. Rezultatul este un dicționar de chunkuri pentru fiecare caracteristică:
 
 ```python
 chunks = {
@@ -370,34 +369,34 @@ for chunk in chunks["input_ids"]:
 '>>> Chunk length: 55'
 ```
 
-As you can see in this example, the last chunk will generally be smaller than the maximum chunk size. There are two main strategies for dealing with this:
+După cum puteți vedea în acest exemplu, ultimul fragment va fi în general mai mic decât dimensiunea maximă a fragmentului. Există două strategii principale pentru a face față acestei situații:
 
-* Drop the last chunk if it's smaller than `chunk_size`.
-* Pad the last chunk until its length equals `chunk_size`.
+* Aruncați ultimul chunk dacă este mai mic decât `chunk_size`.
+* Faceți padding ultimului chunk până când lungimea sa este egală cu `chunk_size`.
 
-We'll take the first approach here, so let's wrap all of the above logic in a single function that we can apply to our tokenized datasets:
+Vom adopta prima abordare aici, așa că hai să încorporăm toată logica de mai sus într-o singură funcție pe care o putem aplica dataseturilor tokenizate:
 
 ```python
 def group_texts(examples):
-    # Concatenate all texts
+    # Concatenarea tuturor textelor
     concatenated_examples = {k: sum(examples[k], []) for k in examples.keys()}
-    # Compute length of concatenated texts
+    # Calcularea lungimii textelor concatenate
     total_length = len(concatenated_examples[list(examples.keys())[0]])
-    # We drop the last chunk if it's smaller than chunk_size
+    # Renunțăm la ultimul chunk dacă este mai mic decât chunk_size
     total_length = (total_length // chunk_size) * chunk_size
-    # Split by chunks of max_len
+    # Împărțiți pe bucăți de max_len
     result = {
         k: [t[i : i + chunk_size] for i in range(0, total_length, chunk_size)]
         for k, t in concatenated_examples.items()
     }
-    # Create a new labels column
+    # Creați o nouă coloană de labeluri
     result["labels"] = result["input_ids"].copy()
     return result
 ```
 
-Note that in the last step of `group_texts()` we create a new `labels` column which is a copy of the `input_ids` one. As we'll see shortly, that's because in masked language modeling the objective is to predict randomly masked tokens in the input batch, and by creating a `labels` column we provide the ground truth for our language model to learn from. 
+Observați că în ultimul pas al `group_texts()` creăm o nouă coloană `labels` care este o copie a coloanei `input_ids`. După cum vom vedea în curând, acest lucru se datorează faptului că în modelarea limbajului mascat obiectivul este de a prezice tokeni mascați aleatoriu în input batch, iar prin crearea unei coloane `labels` furnizăm adevărul de bază din care modelul nostru de limbaj poate să învețe.
 
-Let's now apply `group_texts()` to our tokenized datasets using our trusty `Dataset.map()` function:
+Să aplicăm acum funcția `group_texts()` dataseturilor tokenizate folosind funcția noastră de încredere `Dataset.map()`:
 
 ```python
 lm_datasets = tokenized_datasets.map(group_texts, batched=True)
@@ -421,7 +420,7 @@ DatasetDict({
 })
 ```
 
-You can see that grouping and then chunking the texts has produced many more examples than our original 25,000 for the `train` and `test` splits. That's because we now have examples involving _contiguous tokens_ that span across multiple examples from the original corpus. You can see this explicitly by looking for the special `[SEP]` and `[CLS]` tokens in one of the chunks:
+Puteți vedea că gruparea și apoi fragmentarea textelor a produs mult mai multe exemple decât cele 25.000 inițiale pentru spliturile `train` și `test`. Acest lucru se datorează faptului că acum avem exemple care implică _contigous tokens_ care se întind pe mai multe exemple din corpusul original. Puteți vedea acest lucru în mod explicit căutând tokenii speciali `[SEP]` și `[CLS]` într-unul dintre chunkuri:
 
 ```python
 tokenizer.decode(lm_datasets["train"][1]["input_ids"])
@@ -431,7 +430,7 @@ tokenizer.decode(lm_datasets["train"][1]["input_ids"])
 ".... at.......... high. a classic line : inspector : i'm here to sack one of your teachers. student : welcome to bromwell high. i expect that many adults of my age think that bromwell high is far fetched. what a pity that it isn't! [SEP] [CLS] homelessness ( or houselessness as george carlin stated ) has been an issue for years but never a plan to help those on the street that were once considered human who did everything from going to school, work, or vote for the matter. most people think of the homeless"
 ```
 
-In this example you can see two overlapping movie reviews, one about a high school movie and the other about homelessness. Let's also check out what the labels look like for masked language modeling:
+În acest exemplu puteți vedea două recenzii de film care se suprapun, una despre un film de liceu și cealaltă despre persoanele fără adăpost. Să verificăm, de asemenea, cum arată labelurile pentru modelarea limbajului mascat:
 
 ```python out
 tokenizer.decode(lm_datasets["train"][1]["labels"])
@@ -441,11 +440,11 @@ tokenizer.decode(lm_datasets["train"][1]["labels"])
 ".... at.......... high. a classic line : inspector : i'm here to sack one of your teachers. student : welcome to bromwell high. i expect that many adults of my age think that bromwell high is far fetched. what a pity that it isn't! [SEP] [CLS] homelessness ( or houselessness as george carlin stated ) has been an issue for years but never a plan to help those on the street that were once considered human who did everything from going to school, work, or vote for the matter. most people think of the homeless"
 ```
 
-As expected from our `group_texts()` function above, this looks identical to the decoded `input_ids` -- but then how can our model possibly learn anything? We're missing a key step: inserting `[MASK]` tokens at random positions in the inputs! Let's see how we can do this on the fly during fine-tuning using a special data collator.
+Așa cum era de așteptat de la funcția noastră `group_texts()` de mai sus, acest lucru pare identic cu `input_ids` decodificat - dar atunci cum poate modelul nostru să învețe ceva? Ne lipsește un pas cheie: inserarea tokenilor `[MASK]` în poziții aleatorii în inputuri! Să vedem cum putem face acest lucru din mers, în timpul fine-tuningului, folosind un data collator special.
 
-## Fine-tuning DistilBERT with the `Trainer` API[[fine-tuning-distilbert-with-the-trainer-api]]
+## Fine-tuningul asupra DistilBERT cu API-ul `Trainer`[[fine-tuning-distilbert-with-the-trainer-api]]
 
-Fine-tuning a masked language model is almost identical to fine-tuning a sequence classification model, like we did in [Chapter 3](/course/chapter3). The only difference is that we need a special data collator that can randomly mask some of the tokens in each batch of texts. Fortunately, 🤗 Transformers comes prepared with a dedicated `DataCollatorForLanguageModeling` for just this task. We just have to pass it the tokenizer and an `mlm_probability` argument that specifies what fraction of the tokens to mask. We'll pick 15%, which is the amount used for BERT and a common choice in the literature:
+Fine-tuningul unui model lingvistic mascat este aproape identic cu fine-tuningul a unui model de clasificare a secvențelor, așa cum am făcut în [Capitolul 3](/course/chapter3). Singura diferență este că avem nevoie de un data collator care poate masca aleatoriu o parte dintre tokeni din fiecare batch de texte. Din fericire, 🤗 Transformers vine pregătit cu un `DataCollatorForLanguageModeling` dedicat tocmai pentru această sarcină. Trebuie doar să îi transmitem tokenizerul și un argument `mlm_probability` care specifică ce fracțiune din tokeni trebuie mascată. Vom alege 15%, care este cantitatea utilizată pentru BERT și o alegere comună în literatura de specialitate:
 
 ```python
 from transformers import DataCollatorForLanguageModeling
@@ -453,7 +452,7 @@ from transformers import DataCollatorForLanguageModeling
 data_collator = DataCollatorForLanguageModeling(tokenizer=tokenizer, mlm_probability=0.15)
 ```
 
-To see how the random masking works, let's feed a few examples to the data collator. Since it expects a list of `dict`s, where each `dict` represents a single chunk of contiguous text, we first iterate over the dataset before feeding the batch to the collator. We remove the `"word_ids"` key for this data collator as it does not expect it:
+Pentru a vedea cum funcționează mascarea aleatorie, să introducem câteva exemple în data collator. Deoarece se așteaptă la o listă de "dict"-uri, în care fiecare "dict" reprezintă un singur chunk de text continuu, mai întâi iterăm peste dataset înainte de a trimite batchul către data collator. Eliminăm cheia `"word_ids"` pentru acest data collator, deoarece acesta nu o așteaptă:
 
 ```python
 samples = [lm_datasets["train"][i] for i in range(2)]
@@ -470,21 +469,21 @@ for chunk in data_collator(samples)["input_ids"]:
 '>>> .... at.. [MASK]... [MASK]... high. a classic line plucked inspector : i\'[MASK] here to [MASK] one of your [MASK]. student : welcome to bromwell [MASK]. i expect that many adults of my age think that [MASK]mwell [MASK] is [MASK] fetched. what a pity that it isn\'t! [SEP] [CLS] [MASK]ness ( or [MASK]lessness as george 宇in stated )公 been an issue for years but never [MASK] plan to help those on the street that were once considered human [MASK] did everything from going to school, [MASK], [MASK] vote for the matter. most people think [MASK] the homeless'
 ```
 
-Nice, it worked! We can see that the `[MASK]` token has been randomly inserted at various locations in our text. These will be the tokens which our model will have to predict during training -- and the beauty of the data collator is that it will randomize the `[MASK]` insertion with every batch! 
+Frumos, a funcționat! Putem vedea că tokenul `[MASK]` a fost inserat aleatoriu în diferite locuri din textul nostru. Acestea vor fi tokenii pe care modelul nostru va trebui să le prezică în timpul antrenamentului - iar frumusețea data collatorului este că va introduce aleatoriu tokenul `[MASK]` cu fiecare batch!
 
 <Tip>
 
-✏️ **Try it out!** Run the code snippet above several times to see the random masking happen in front of your very eyes! Also replace the `tokenizer.decode()` method with `tokenizer.convert_ids_to_tokens()` to see that sometimes a single token from a given word is masked, and not the others.
+✏️ **Încercați!** Rulați fragmentul de cod de mai sus de mai multe ori pentru a vedea cum se întâmplă mascarea aleatorie în fața ochilor voștri! De asemenea, înlocuiți metoda `tokenizer.decode()` cu `tokenizer.convert_ids_to_tokens()` pentru a vedea că uneori un singur token dintr-un cuvânt dat este mascat, și nu celelalte.
 
 </Tip>
 
 {#if fw === 'pt'}
 
-One side effect of random masking is that our evaluation metrics will not be deterministic when using the `Trainer`, since we use the same data collator for the training and test sets. We'll see later, when we look at fine-tuning with 🤗 Accelerate, how we can use the flexibility of a custom evaluation loop to freeze the randomness.
+Un efect secundar al mascării aleatorii este faptul că metricile noastre de evaluare nu vor fi deterministe atunci când folosim `Trainer`, deoarece folosim același data collator pentru seturile de antrenare și testare. Vom vedea mai târziu, când ne vom uita la aplicarea fine-tuningului cu 🤗 Accelerate, cum putem folosi flexibilitatea unei bucle de evaluare personalizate pentru a îngheța caracterul aleatoriu.
 
 {/if}
 
-When training models for masked language modeling, one technique that can be used is to mask whole words together, not just individual tokens. This approach is called _whole word masking_. If we want to use whole word masking, we will need to build a data collator ourselves. A data collator is just a function that takes a list of samples and converts them into a batch, so let's do this now! We'll use the word IDs computed earlier to make a map between word indices and the corresponding tokens, then randomly decide which words to mask and apply that mask on the inputs. Note that the labels are all `-100` except for the ones corresponding to mask words.
+La antrenarea modelelor pentru modelarea limbajului mascat, o tehnică care poate fi utilizată este mascarea cuvintelor întregi împreună, nu doar a tokenilor individuali. Această abordare se numește _whole word masking_. Dacă dorim să utilizăm mascarea întregului cuvânt, va trebui să construim noi înșine un data collator. Un data collator este doar o funcție care preia o listă de sampleuri și le convertește într-un batch, așa că hai să facem asta acum! Vom utiliza ID-urile cuvintelor calculate mai devreme pentru a realiza o hartă între indicii cuvintelor și tokenii corespunzători, apoi vom decide aleatoriu ce cuvinte să mascăm și vom aplica masca respectivă asupra inputurilor. Rețineți că labelurile sunt toate `-100`, cu excepția celor care corespund cuvintelor mascate.
 
 {#if fw === 'pt'}
 
@@ -570,7 +569,7 @@ def whole_word_masking_data_collator(features):
 
 {/if}
 
-Next, we can try it on the same samples as before:
+În continuare, îl putem încerca pe aceleași sampleuri ca înainte:
 
 ```py
 samples = [lm_datasets["train"][i] for i in range(2)]
@@ -588,11 +587,11 @@ for chunk in batch["input_ids"]:
 
 <Tip>
 
-✏️ **Try it out!** Run the code snippet above several times to see the random masking happen in front of your very eyes! Also replace the `tokenizer.decode()` method with `tokenizer.convert_ids_to_tokens()` to see that the tokens from a given word are always masked together.
+✏️ **Încercați!** Rulați fragmentul de cod de mai sus de mai multe ori pentru a vedea cum se întâmplă mascarea aleatorie în fața ochilor voștri! De asemenea, înlocuiți metoda `tokenizer.decode()` cu `tokenizer.convert_ids_to_tokens()` pentru a vedea că tokenii dintr-un cuvânt dat sunt întotdeauna mascați împreună.
 
 </Tip>
 
-Now that we have two data collators, the rest of the fine-tuning steps are standard. Training can take a while on Google Colab if you're not lucky enough to score a mythical P100 GPU 😭, so we'll first downsample the size of the training set to a few thousand examples. Don't worry, we'll still get a pretty decent language model! A quick way to downsample a dataset in 🤗 Datasets is via the `Dataset.train_test_split()` function that we saw in [Chapter 5](/course/chapter5):
+Acum, că avem două data collators, restul pașilor fine-tuning sunt standard. Pregătirea poate dura ceva timp pe Google Colab dacă nu sunteți suficient de norocos să obțineți un GPU P100 mitic 😭, așa că vom reduce mai întâi dimensiunea setului de antrenare la câteva mii de exemple. Nu vă faceți griji, vom obține în continuare un model lingvistic destul de decent! O modalitate rapidă de a reduce sampleurile unui dataset în 🤗 Datasets este prin intermediul funcției `Dataset.train_test_split()` pe care am văzut-o în [Capitolul 5](/course/chapter5):
 
 ```python
 train_size = 10_000
@@ -617,7 +616,7 @@ DatasetDict({
 })
 ```
 
-This has automatically created new `train` and `test` splits, with the training set size set to 10,000 examples and the validation set to 10% of that -- feel free to increase this if you have a beefy GPU! The next thing we need to do is log in to the Hugging Face Hub. If you're running this code in a notebook, you can do so with the following utility function:
+Acest lucru a creat în mod automat noi splituri de `train` și `test`, cu dimensiunea setului de antrenare setată la 10.000 de exemple și a setului de validare la 10% din aceasta - nu ezitați să măriți această valoare dacă aveți un GPU puternic! Următorul lucru pe care trebuie să îl facem este să ne conectăm la Hugging Face Hub. Dacă executați acest cod într-un notebook, puteți face acest lucru cu următoarea funcție utilitară:
 
 ```python
 from huggingface_hub import notebook_login
@@ -625,7 +624,7 @@ from huggingface_hub import notebook_login
 notebook_login()
 ```
 
-which will display a widget where you can enter your credentials. Alternatively, you can run: 
+care va afișa un widget în care vă puteți introduce credențialele. Alternativ, puteți rula:
 
 ```
 huggingface-cli login
@@ -635,7 +634,7 @@ in your favorite terminal and log in there.
 
 {#if fw === 'tf'}
 
-Once we're logged in, we can create our `tf.data` datasets. To do so, we'll use the `prepare_tf_dataset()` method, which uses our model to automatically infer which columns should go into the dataset. If you want to control exactly which columns to use, you can use the `Dataset.to_tf_dataset()` method instead. To keep things simple, we'll just use the standard data collator here, but you can also try the whole word masking collator and compare the results as an exercise:
+Odată ce ne-am conectat, putem crea dataseturile `tf.data`. Pentru a face acest lucru, vom utiliza metoda `prepare_tf_dataset()`, care utilizează modelul nostru pentru a deduce automat ce coloane ar trebui să intre în dataset. Dacă doriți să controlați exact ce coloane să utilizați, puteți folosi în schimb metoda `Dataset.to_tf_dataset()`. Pentru a simplifica lucrurile, vom utiliza aici doar data collatorul standard, dar puteți încerca și whole word masking collator și puteți compara rezultatele ca un exercițiu:
 
 ```python
 tf_train_dataset = model.prepare_tf_dataset(
@@ -653,9 +652,9 @@ tf_eval_dataset = model.prepare_tf_dataset(
 )
 ```
 
-Next, we set up our training hyperparameters and compile our model. We use the `create_optimizer()` function from the 🤗 Transformers library, which gives us an `AdamW` optimizer with linear learning rate decay. We also use the model's built-in loss, which is the default when no loss is specified as an argument to `compile()`, and we set the training precision to `"mixed_float16"`. Note that if you're using a Colab GPU or other GPU that does not have accelerated float16 support, you should probably comment out that line.
+În continuare, setăm hiperparametrii de antrenare și compilăm modelul nostru. Utilizăm funcția `create_optimizer()` din biblioteca 🤗 Transformers, care ne oferă un optimizator `AdamW` cu o scădere liniară a ratei de învățare. Utilizăm, de asemenea, pierderea încorporată în model, care este cea implicită atunci când nu este specificată nicio pierdere ca argument pentru `compile()`, și setăm precizia de antrenare la `"mixed_float16"`. Rețineți că, dacă utilizați un GPU Colab sau alt GPU care nu are suport accelerat pentru float16, ar trebui probabil să comentați această linie.
 
-In addition, we set up a `PushToHubCallback` that will save the model to the Hub after each epoch. You can specify the name of the repository you want to push to with the `hub_model_id` argument (in particular, you will have to use this argument to push to an organization). For instance, to push the model to the [`huggingface-course` organization](https://huggingface.co/huggingface-course), we added `hub_model_id="huggingface-course/distilbert-finetuned-imdb"`. By default, the repository used will be in your namespace and named after the output directory you set, so in our case it will be `"lewtun/distilbert-finetuned-imdb"`.
+În plus, am configurat un `PushToHubCallback` care va salva modelul în Hub după fiecare epocă. Puteți specifica numele repositoriului către care doriți să faceți push cu argumentul `hub_model_id` (în special, va trebui să utilizați acest argument pentru a face push către o organizație). De exemplu, pentru a trimite modelul către organizația [`huggingface-course`](https://huggingface.co/huggingface-course), am adăugat `hub_model_id="huggingface-course/distilbert-finetuned-imdb"`. În mod implicit, repositoriul utilizat va fi în namespaceul vostru și numit după output directory-ul pe care l-ați stabilit, deci în cazul nostru va fi `"lewtun/distilbert-finetuned-imdb"`.
 
 ```python
 from transformers import create_optimizer
@@ -680,11 +679,11 @@ callback = PushToHubCallback(
 )
 ```
 
-We're now ready to run `model.fit()` -- but before doing so let's briefly look at _perplexity_, which is a common metric to evaluate the performance of language models.
+Acum suntem gata să executăm `model.fit()` - dar înainte de a face acest lucru, să ne uităm pe scurt la _perplexitate_, care este o metrică comună pentru a evalua performanța modelelor de limbaj.
 
 {:else}
 
-Once we're logged in, we can specify the arguments for the `Trainer`:
+Odată ce suntem conectați, putem specifica argumentele pentru `Trainer`:
 
 ```python
 from transformers import TrainingArguments
@@ -708,11 +707,11 @@ training_args = TrainingArguments(
 )
 ```
 
-Here we tweaked a few of the default options, including `logging_steps` to ensure we track the training loss with each epoch. We've also used `fp16=True` to enable mixed-precision training, which gives us another boost in speed. By default, the `Trainer` will remove any columns that are not part of the model's `forward()` method. This means that if you're using the whole word masking collator, you'll also need to set `remove_unused_columns=False` to ensure we don't lose the `word_ids` column during training.
+Aici am modificat câteva dintre opțiunile implicite, inclusiv `logging_steps` pentru a ne asigura că urmărim pierderea de antrenare cu fiecare epocă. De asemenea, am folosit `fp16=True` pentru a activa antrenarea cu precizie mixtă, ceea ce ne oferă un alt impuls vitezei. În mod implicit, `Trainer` va elimina toate coloanele care nu fac parte din metoda `forward()` a modelului. Aceasta înseamnă că, dacă utilizați whole word masking collator, va trebui să setați și `remove_unused_columns=False` pentru a vă asigura că nu pierdem coloana `word_ids` în timpul antrenamentului.
 
-Note that you can specify the name of the repository you want to push to with the `hub_model_id` argument (in particular, you will have to use this argument to push to an organization). For instance, when we pushed the model to the [`huggingface-course` organization](https://huggingface.co/huggingface-course), we added `hub_model_id="huggingface-course/distilbert-finetuned-imdb"` to `TrainingArguments`. By default, the repository used will be in your namespace and named after the output directory you set, so in our case it will be `"lewtun/distilbert-finetuned-imdb"`.
+Rețineți că puteți specifica numele repositoriului către care doriți să faceți push cu argumentul `hub_model_id` (în special, va trebui să utilizați acest argument pentru a face push către o organizație). De exemplu, atunci când am făcut push modelului către organizația [`huggingface-course`](https://huggingface.co/huggingface-course), am adăugat `hub_model_id="huggingface-course/distilbert-finetuned-imdb"` la `TrainingArguments`. În mod implicit, repositoriul utilizat va fi în namespaceul vostru și denumit după output directory-ul pe care l-ați stabilit, deci în cazul nostru va fi `"lewtun/distilbert-finetuned-imdb"`.
 
-We now have all the ingredients to instantiate the `Trainer`. Here we just use the standard `data_collator`, but you can try the whole word masking collator and compare the results as an exercise: 
+Acum avem toate ingredientele pentru inițializarea `Trainer`. Aici folosim doar `data_collator` standard, dar puteți încerca whole word masking collator și să comparați rezultatele ca un exercițiu:
 
 ```python
 from transformers import Trainer
@@ -727,19 +726,19 @@ trainer = Trainer(
 )
 ```
 
-We're now ready to run `trainer.train()` -- but before doing so let's briefly look at _perplexity_, which is a common metric to evaluate the performance of language models.
+Acum suntem gata să rulăm `trainer.train()` - dar înainte de a face acest lucru, să analizăm pe scurt _perplexitatea_, care este o metrică comună de evaluare a performanței modelelor de limbaj.
 
 {/if}
 
-### Perplexity for language models[[perplexity-for-language-models]]
+### Perplexity pentru language models[[perplexity-for-language-models]]
 
 <Youtube id="NURcDHhYe98"/>
 
-Unlike other tasks like text classification or question answering where we're given a labeled corpus to train on, with language modeling we don't have any explicit labels. So how do we determine what makes a good language model? Like with the autocorrect feature in your phone, a good language model is one that assigns high probabilities to sentences that are grammatically correct, and low probabilities to nonsense sentences. To give you a better idea of what this looks like, you can find whole sets of "autocorrect fails" online, where the model in a person's phone has produced some rather funny (and often inappropriate) completions! 
+Spre deosebire de alte sarcini, cum ar fi clasificarea textului sau răspunderea la întrebări, unde ni se oferă un corpus labeled pe care să antrenăm, cu modelarea limbajului nu avem labeluri explicite. Așadar, cum determinăm ce face un model lingvistic bun? La fel ca în cazul funcției de autocorectare din telefon, un model lingvistic bun este unul care atribuie probabilități ridicate propozițiilor corecte din punct de vedere gramatical și probabilități scăzute propozițiilor fără sens. Pentru a vă face o idee mai bună despre cum arată acest lucru, puteți găsi online seturi întregi de "autocorrect fails", în care modelul din telefonul unei persoane a produs niște completări destul de amuzante (și adesea nepotrivite)!
 
 {#if fw === 'pt'}
 
-Assuming our test set consists mostly of sentences that are grammatically correct, then one way to measure the quality of our language model is to calculate the probabilities it assigns to the next word in all the sentences of the test set. High probabilities indicates that the model is not "surprised" or "perplexed" by the unseen examples, and suggests it has learned the basic patterns of grammar in the language. There are various mathematical definitions of perplexity, but the one we'll use defines it as the exponential of the cross-entropy loss. Thus, we can calculate the perplexity of our pretrained model by using the `Trainer.evaluate()` function to compute the cross-entropy loss on the test set and then taking the exponential of the result:
+Presupunând că setul nostru de testare constă în cea mai mare parte din propoziții corecte din punct de vedere gramatical, atunci o modalitate de a măsura calitatea modelului nostru lingvistic este de a calcula probabilitățile pe care le atribuie următorului cuvânt în toate propozițiile din setul de testare. Probabilitatea ridicată indică faptul că modelul nu este "surprins" sau "perplex" de exemplele nevăzute și sugerează că a învățat tiparele gramaticale de bază ale limbii. Există diverse definiții matematice ale perplexității, dar cea pe care o vom utiliza o definește ca the exponential of the cross-entropy loss. Astfel, putem calcula perplexitatea modelului nostru preantrenat utilizând funcția `Trainer.evaluate()` pentru a calcula pierderea de cross-entropy pe setul de testare și apoi luând exponențiala rezultatului:
 
 ```python
 import math
@@ -750,7 +749,7 @@ print(f">>> Perplexity: {math.exp(eval_results['eval_loss']):.2f}")
 
 {:else}
 
-Assuming our test set consists mostly of sentences that are grammatically correct, then one way to measure the quality of our language model is to calculate the probabilities it assigns to the next word in all the sentences of the test set. High probabilities indicates that the model indicates that the model is not "surprised" or "perplexed" by the unseen examples, and suggests it has learned the basic patterns of grammar in the language. There are various mathematical definitions of perplexity, but the one we'll use defines it as the exponential of the cross-entropy loss. Thus, we can calculate the perplexity of our pretrained model by using the `model.evaluate()` method to compute the cross-entropy loss on the test set and then taking the exponential of the result:
+Presupunând că setul nostru de testare constă în cea mai mare parte din propoziții corecte din punct de vedere gramatical, atunci o modalitate de a măsura calitatea modelului nostru lingvistic este de a calcula probabilitățile pe care le atribuie următorului cuvânt în toate propozițiile din setul de testare. Probabilitățile ridicate indică faptul că modelul indică faptul că modelul nu este "surprins" sau "perplex" de exemplele nevăzute și sugerează că a învățat modelele de bază ale gramaticii limbii. Există diverse definiții matematice ale perplexității, dar cea pe care o vom folosi o definește ca the exponential of the cross-entropy loss. Astfel, putem calcula perplexitatea modelului nostru preantrenat folosind metoda `model.evaluate()` pentru a calcula pierderea de entropie încrucișată pe setul de testare și apoi luând exponențiala rezultatului:
 
 ```python
 import math
@@ -765,7 +764,7 @@ print(f"Perplexity: {math.exp(eval_loss):.2f}")
 >>> Perplexity: 21.75
 ```
 
-A lower perplexity score means a better language model, and we can see here that our starting model has a somewhat large value. Let's see if we can lower it by fine-tuning! To do that, we first run the training loop:
+Un scor de perplexitate mai mic înseamnă un model lingvistic mai bun, iar aici putem vedea că modelul nostru inițial are o valoare oarecum mare. Să vedem dacă o putem reduce prin fine-tuning! Pentru a face acest lucru, vom rula mai întâi bucla de antrenare:
 
 {#if fw === 'pt'}
 
@@ -781,7 +780,7 @@ model.fit(tf_train_dataset, validation_data=tf_eval_dataset, callbacks=[callback
 
 {/if}
 
-and then compute the resulting perplexity on the test set as before:
+și apoi calculați perplexitatea rezultată pe setul de testare ca înainte:
 
 {#if fw === 'pt'}
 
@@ -803,11 +802,11 @@ print(f"Perplexity: {math.exp(eval_loss):.2f}")
 >>> Perplexity: 11.32
 ```
 
-Nice -- this is quite a reduction in perplexity, which tells us the model has learned something about the domain of movie reviews!
+Grozav - aceasta este o reducere destul de mare a perplexității, ceea ce ne spune că modelul a învățat ceva despre domeniul recenziilor de filme!
 
 {#if fw === 'pt'}
 
-Once training is finished, we can push the model card with the training information to the Hub (the checkpoints are saved during training itself):
+Odată ce antrenarea este finalizată, putem trimite cardul modelului cu informațiile de antrenare către Hub (checkpointurile sunt salvate în timpul antrenare):
 
 ```python
 trainer.push_to_hub()
@@ -817,19 +816,19 @@ trainer.push_to_hub()
 
 <Tip>
 
-✏️ **Your turn!** Run the training above after changing the data collator to the whole word masking collator. Do you get better results?
+✏️ **Rândul tău!** Rulați antrenamentul de mai sus după schimbarea data collatorului cu whole word masking collator. Obțineți rezultate mai bune?
 
 </Tip>
 
 {#if fw === 'pt'} 
 
-In our use case we didn't need to do anything special with the training loop, but in some cases you might need to implement some custom logic. For these applications, you can use 🤗 Accelerate -- let's take a look!
+În cazul nostru de utilizare, nu a fost nevoie să facem nimic special cu bucla de antrenare, dar în unele cazuri s-ar putea să fie nevoie să implementați o logică personalizată. Pentru aceste aplicații, puteți utiliza 🤗 Accelerate -- să aruncăm o privire!
 
-## Fine-tuning DistilBERT with 🤗 Accelerate[[fine-tuning-distilbert-with-accelerate]]
+## Fine-tuningul DistilBERT cu 🤗 Accelerate[[fine-tuning-distilbert-with-accelerate]]
 
-As we saw with the `Trainer`, fine-tuning a masked language model is very similar to the text classification example from [Chapter 3](/course/chapter3). In fact, the only subtlety is the use of a special data collator, and we've already covered that earlier in this section! 
+Așa cum am văzut cu `Trainer`, fine-tuningul unui model de limbaj mascat este foarte asemănător cu exemplul de clasificare a textului din [Capitolul 3](/course/chapter3). De fapt, singura subtilitate este utilizarea unui data collator special, pe care l-am abordat mai devreme în această secțiune!
 
-However, we saw that `DataCollatorForLanguageModeling` also applies random masking with each evaluation, so we'll see some fluctuations in our perplexity scores with each training run. One way to eliminate this source of randomness is to apply the masking _once_ on the whole test set, and then use the default data collator in 🤗 Transformers to collect the batches during evaluation. To see how this works, let's implement a simple function that applies the masking on a batch, similar to our first encounter with `DataCollatorForLanguageModeling`:
+Cu toate acestea, am văzut că `DataCollatorForLanguageModeling` aplică, de asemenea, o mascare aleatorie cu fiecare evaluare, astfel încât vom vedea unele fluctuații în scorurile noastre de perplexitate cu fiecare rulare de antrenament. O modalitate de a elimina această sursă de dezordine este de a aplica mascarea _o singură dată_ pe întregul set de teste și apoi de a utiliza data collatorul implicit din 🤗 Transformers pentru a colecta batch-urile în timpul evaluării. Pentru a vedea cum funcționează acest lucru, să implementăm o funcție simplă care aplică mascarea pe un batch, similară cu prima noastră întâlnire cu `DataCollatorForLanguageModeling`:
 
 ```python
 def insert_random_mask(batch):
@@ -839,7 +838,7 @@ def insert_random_mask(batch):
     return {"masked_" + k: v.numpy() for k, v in masked_inputs.items()}
 ```
 
-Next, we'll apply this function to our test set and drop the unmasked columns so we can replace them with the masked ones. You can use whole word masking by replacing the `data_collator` above with the appropriate one, in which case you should remove the first line here:
+În continuare, vom aplica această funcție setului nostru de testare și vom elimina coloanele nemascate pentru a le putea înlocui cu cele mascate. Puteți utiliza whole word masking prin înlocuirea `data_collator` de mai sus cu cel corespunzător, caz în care trebuie să eliminați prima linie de aici:
 
 ```py
 downsampled_dataset = downsampled_dataset.remove_columns(["word_ids"])
@@ -857,7 +856,7 @@ eval_dataset = eval_dataset.rename_columns(
 )
 ```
 
-We can then set up the dataloaders as usual, but we'll use the `default_data_collator` from 🤗 Transformers for the evaluation set:
+Putem configura apoi dataloaderele ca de obicei, dar vom folosi `default_data_collator` de la 🤗 Transformers pentru setul de evaluare:
 
 ```python
 from torch.utils.data import DataLoader
@@ -875,13 +874,13 @@ eval_dataloader = DataLoader(
 )
 ```
 
-Form here, we follow the standard steps with 🤗 Accelerate. The first order of business is to load a fresh version of the pretrained model:
+De aici, vom urma pașii standard cu 🤗 Accelerate. În primul rând, se încarcă o versiune nouă a modelului antrenat:
 
 ```
 model = AutoModelForMaskedLM.from_pretrained(model_checkpoint)
 ```
 
-Then we need to specify the optimizer; we'll use the standard `AdamW`:
+Apoi trebuie să specificăm optimizatorul; vom folosi standardul `AdamW`:
 
 ```python
 from torch.optim import AdamW
@@ -889,7 +888,7 @@ from torch.optim import AdamW
 optimizer = AdamW(model.parameters(), lr=5e-5)
 ```
 
-With these objects, we can now prepare everything for training with the `Accelerator` object:
+Cu aceste obiecte, acum putem pregăti totul pentru antrenare cu obiectul `Accelerator`:
 
 ```python
 from accelerate import Accelerator
@@ -900,7 +899,7 @@ model, optimizer, train_dataloader, eval_dataloader = accelerator.prepare(
 )
 ```
 
-Now that our model, optimizer, and dataloaders are configured, we can specify the learning rate scheduler as follows:
+Acum că modelul, optimizatorul și dataloaderul sunt configurate, putem specifica learning rate schedulerul cum urmează:
 
 ```python
 from transformers import get_scheduler
@@ -917,7 +916,7 @@ lr_scheduler = get_scheduler(
 )
 ```
 
-There is just one last thing to do before training: create a model repository on the Hugging Face Hub! We can use the 🤗 Hub library to first generate the full name of our repo:
+Mai este un singur lucru de făcut înainte de antrenare: creați un repositoriu de modele pe Hugging Face Hub! Putem utiliza biblioteca 🤗 Hub pentru a genera mai întâi numele complet al repositoriul nostru:
 
 ```python
 from huggingface_hub import get_full_repo_name
@@ -931,7 +930,7 @@ repo_name
 'lewtun/distilbert-base-uncased-finetuned-imdb-accelerate'
 ```
 
-then create and clone the repository using the `Repository` class from 🤗 Hub:
+apoi creați și clonați repositoriul folosind clasa `Repository` din 🤗 Hub:
 
 ```python
 from huggingface_hub import Repository
@@ -940,7 +939,7 @@ output_dir = model_name
 repo = Repository(output_dir, clone_from=repo_name)
 ```
 
-With that done, it's just a simple matter of writing out the full training and evaluation loop:
+Odată făcut acest lucru, este doar o chestiune simplă de scriere a ciclului complet de antrenare și evaluare:
 
 ```python
 from tqdm.auto import tqdm
@@ -998,13 +997,13 @@ for epoch in range(num_train_epochs):
 >>> Epoch 2: Perplexity: 10.729503505340409
 ```
 
-Cool, we've been able to evaluate perplexity with each epoch and ensure that multiple training runs are reproducible!
+Mișto, am reușit să evaluăm perplexitatea cu fiecare epocă și să ne asigurăm că mai multe runde de antrenament sunt reproductibile!
 
 {/if}
 
-## Using our fine-tuned model[[using-our-fine-tuned-model]]
+## Utilizarea modelului fine-tuned[[using-our-fine-tuned-model]]
 
-You can interact with your fine-tuned model either by using its widget on the Hub or locally with the `pipeline` from 🤗 Transformers. Let's use the latter to download our model using the `fill-mask` pipeline:
+Puteți interacționa cu modelul vostru fine-tuned utilizând widgetul său de pe Hub, fie local cu `pipeline` din 🤗 Transformers. Să folosim aceasta din urmă pentru a descărca modelul nostru folosind pipelineuul `fill-mask`:
 
 ```python
 from transformers import pipeline
@@ -1014,7 +1013,7 @@ mask_filler = pipeline(
 )
 ```
 
-We can then feed the pipeline our sample text of "This is a great [MASK]" and see what the top 5 predictions are:
+Putem apoi să alimentăm pipelineul cu exemplul nostru de text "This is a hrea [MASK]" și să vedem care sunt primele 5 predicții:
 
 ```python
 preds = mask_filler(text)
@@ -1031,14 +1030,14 @@ for pred in preds:
 '>>> this is a great character.'
 ```
 
-Neat -- our model has clearly adapted its weights to predict words that are more strongly associated with movies!
+Frumos - modelul nostru și-a adaptat în mod clar weighturile pentru a prezice cuvintele care sunt asociate mai puternic cu filmele!
 
 <Youtube id="0Oxphw4Q9fo"/>
 
-This wraps up our first experiment with training a language model. In [section 6](/course/en/chapter7/6) you'll learn how to train an auto-regressive model like GPT-2 from scratch; head over there if you'd like to see how you can pretrain your very own Transformer model!
+Acest lucru încheie primul nostru experiment de antrenare a unui model lingvistic. În [secțiunea 6](/course/ro/chapter7/6) veți învăța cum să antrenați de la zero un model auto-regressive precum GPT-2; mergeți acolo dacă doriți să vedeți cum vă puteți preantrena propriul model Transformer!
 
 <Tip>
 
-✏️ **Try it out!** To quantify the benefits of domain adaptation, fine-tune a classifier on the IMDb labels for both the pretrained and fine-tuned DistilBERT checkpoints. If you need a refresher on text classification, check out [Chapter 3](/course/chapter3). 
+✏️ **Încercați!** Pentru a cuantifica beneficiile adaptării domeniului, faceți fine-tune unui clasificator pe labelurile IMDb atât pentru checkpointurile DistilBERT preantrenate, cât și pentru cele fine-tuned. Dacă aveți nevoie de o recapitulare a clasificării textului, consultați [Capitolul 3](/course/chapter3).
 
 </Tip>
diff --git a/chapters/ro/chapter7/4.mdx b/chapters/ro/chapter7/4.mdx
index cdae18d5b..ae1098e58 100644
--- a/chapters/ro/chapter7/4.mdx
+++ b/chapters/ro/chapter7/4.mdx
@@ -1,6 +1,6 @@
 <FrameworkSwitchCourse {fw} />
 
-# Translation[[translation]]
+# Traducere[[translation]]
 
 {#if fw === 'pt'}
 
@@ -22,35 +22,35 @@
 
 {/if}
 
-Let's now dive into translation. This is another [sequence-to-sequence task](/course/chapter1/7), which means it's a problem that can be formulated as going from one sequence to another. In that sense the problem is pretty close to [summarization](/course/chapter7/6), and you could adapt what we will see here to other sequence-to-sequence problems such as:
+Să trecem acum la traducere. Aceasta este o altă [sarcină de sequence-to-sequence](/course/chapter1/7), ceea ce înseamnă că este o problemă care poate fi formulată ca trecerea de la o secvență la alta. În acest sens, problema este destul de apropiată de [sumarizare](/course/chapter7/6) și ați putea adapta ceea ce vom vedea aici la alte probleme de la sequence-to-sequence, cum ar fi:
 
-- **Style transfer**: Creating a model that *translates* texts written in a certain style to another (e.g., formal to casual or Shakespearean English to modern English)
-- **Generative question answering**: Creating a model that generates answers to questions, given a context
+- **Style transfer**: Crearea unui model care *traduce* texte scrise într-un anumit stil în altul (de exemplu, din formal în casual sau din engleza Shakespeariană în engleza modernă)
+- **Generative question answering**: Crearea unui model care generează răspunsuri la întrebări, fiind dat un context
 
 <Youtube id="1JvfrvZgi6c"/>
 
-If you have a big enough corpus of texts in two (or more) languages, you can train a new translation model from scratch like we will in the section on [causal language modeling](/course/chapter7/6). It will be faster, however, to fine-tune an existing translation model, be it a multilingual one like mT5 or mBART that you want to fine-tune to a specific language pair, or even a model specialized for translation from one language to another that you want to fine-tune to your specific corpus.
+Dacă aveți un corpus suficient de mare de texte în două (sau mai multe) limbi, puteți antrena un nou model de traducere de la zero, așa cum vom face în secțiunea despre [causal language modeling] (/course/chapter7/6). Cu toate acestea, va fi mai rapid să faceți fine-tune unui model de traducere existent, fie că este vorba de un model multilingv precum mT5 sau mBART, pe care doriți să îi faceți fine-tune pentru o anumită pereche de limbi, sau chiar un model specializat pentru traducerea dintr-o limbă în alta, pe care doriți să îl perfecționați pentru corpusul vostru specific.
 
-In this section, we will fine-tune a Marian model pretrained to translate from English to French (since a lot of Hugging Face employees speak both those languages) on the [KDE4 dataset](https://huggingface.co/datasets/kde4), which is a dataset of localized files for the [KDE apps](https://apps.kde.org/). The model we will use has been pretrained on a large corpus of French and English texts taken from the [Opus dataset](https://opus.nlpl.eu/), which actually contains the KDE4 dataset. But even if the pretrained model we use has seen that data during its pretraining, we will see that we can get a better version of it after fine-tuning.
+În această secțiune, vom pune face fine-tune unui model Marian preantrenat pentru a traduce din engleză în franceză (deoarece mulți dintre angajații Hugging Face vorbesc ambele limbi) pe [datasetul KDE4](https://huggingface.co/datasets/kde4), care este un set de fișiere localizate pentru [KDE apps](https://apps.kde.org/). Modelul pe care îl vom utiliza a fost preantrenat pe un corpus mare de texte în franceză și engleză preluate din [datasetul Opus](https://opus.nlpl.eu/), care conține de fapt datasetul KDE4. Dar chiar dacă modelul preantrenat pe care îl folosim a văzut aceste date în timpul preantrenării sale, vom vedea că putem obține o versiune mai bună a acestuia după fine-tuning.
 
-Once we're finished, we will have a model able to make predictions like this one:
+Odată ce am terminat, vom avea un model capabil să facă predicții ca acesta:
 
 <iframe src="https://course-demos-marian-finetuned-kde4-en-to-fr.hf.space" frameBorder="0" height="350" title="Gradio app" class="block dark:hidden container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
 
 <a class="flex justify-center" href="/huggingface-course/marian-finetuned-kde4-en-to-fr">
-<img class="block dark:hidden lg:w-3/5" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/modeleval-marian-finetuned-kde4-en-to-fr.png" alt="One-hot encoded labels for question answering."/>
-<img class="hidden dark:block lg:w-3/5" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/modeleval-marian-finetuned-kde4-en-to-fr-dark.png" alt="One-hot encoded labels for question answering."/>
+<img class="block dark:hidden lg:w-3/5" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/modeleval-marian-finetuned-kde4-en-to-fr.png" alt="One-hot encoded labels pentru răspunderea la întrebări."/>
+<img class="hidden dark:block lg:w-3/5" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/modeleval-marian-finetuned-kde4-en-to-fr-dark.png" alt="One-hot encoded labels răspunderea la întrebări."/>
 </a>
 
-As in the previous sections, you can find the actual model that we'll train and upload to the Hub using the code below and double-check its predictions [here](https://huggingface.co/huggingface-course/marian-finetuned-kde4-en-to-fr?text=This+plugin+allows+you+to+automatically+translate+web+pages+between+several+languages.).
+Ca și în secțiunile anterioare, puteți găsi modelul pe care îl vom antrena și încărca în Hub utilizând codul de mai jos și puteți verifica predicțiile acestuia [aici](https://huggingface.co/huggingface-course/marian-finetuned-kde4-en-to-fr?text=This+plugin+allows+you+to+automatically+translate+web+pages+between+several+languages.).
 
-## Preparing the data[[preparing-the-data]]
+## Pregătirea datelor[[preparing-the-data]]
 
-To fine-tune or train a translation model from scratch, we will need a dataset suitable for the task. As mentioned previously, we'll use the [KDE4 dataset](https://huggingface.co/datasets/kde4) in this section, but you can adapt the code to use your own data quite easily, as long as you have pairs of sentences in the two languages you want to translate from and into. Refer back to [Chapter 5](/course/chapter5) if you need a reminder of how to load your custom data in a `Dataset`.
+Pentru a face fine-tune sau a antrena un model de traducere de la zero, vom avea nevoie de un dataset adecvat pentru această sarcină. După cum am menționat anterior, vom utiliza [datasetul KDE4](https://huggingface.co/datasets/kde4) în această secțiune, dar puteți adapta codul pentru a utiliza propriile date destul de ușor, atâta timp cât aveți perechi de propoziții în cele două limbi din și în care doriți să traduceți. Consultați [Capitolul 5](/course/chapter5) dacă aveți nevoie de o reamintire a modului de încărcare a datelor personalizate într-un `Dataset`.
 
-### The KDE4 dataset[[the-kde4-dataset]]
+### Datasetul KDE4[[the-kde4-dataset]]
 
-As usual, we download our dataset using the `load_dataset()` function:
+Ca de obicei, descărcăm datasetul nostru folosind funcția `load_dataset()`:
 
 ```py
 from datasets import load_dataset
@@ -58,11 +58,11 @@ from datasets import load_dataset
 raw_datasets = load_dataset("kde4", lang1="en", lang2="fr")
 ```
 
-If you want to work with a different pair of languages, you can specify them by their codes. A total of 92 languages are available for this dataset; you can see them all by expanding the language tags on its [dataset card](https://huggingface.co/datasets/kde4).
+Dacă doriți să lucrați cu o pereche de limbi diferită, le puteți specifica prin codurile lor. Un total de 92 de limbi sunt disponibile pentru acest dataset; le puteți vedea pe toate prin extinderea labelurilor de limbă pe [dataset cardul acesteia](https://huggingface.co/datasets/kde4).
 
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/language_tags.png" alt="Language available for the KDE4 dataset." width="100%">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/language_tags.png" alt="Limba disponibilă pentru datasetul KDE4." width="100%">
 
-Let's have a look at the dataset:
+Să aruncăm o privire la dataset:
 
 ```py
 raw_datasets
@@ -77,7 +77,7 @@ DatasetDict({
 })
 ```
 
-We have 210,173 pairs of sentences, but in one single split, so we will need to create our own validation set. As we saw in [Chapter 5](/course/chapter5), a `Dataset` has a `train_test_split()` method that can help us. We'll provide a seed for reproducibility:
+Avem 210 173 de perechi de propoziții, dar într-o singură împărțire, deci va trebui să ne creăm propriul set de validare. Așa cum am văzut în [Capitolul 5](/course/chapter5), un `Dataset` are o metodă `train_test_split()` care ne poate ajuta. Vom furniza un seed pentru reproductibilitate:
 
 ```py
 split_datasets = raw_datasets["train"].train_test_split(train_size=0.9, seed=20)
@@ -97,13 +97,13 @@ DatasetDict({
 })
 ```
 
-We can rename the `"test"` key to `"validation"` like this:
+Putem redenumi cheia `"test"` în `"validation"` astfel:
 
 ```py
 split_datasets["validation"] = split_datasets.pop("test")
 ```
 
-Now let's take a look at one element of the dataset:
+Acum să aruncăm o privire la un element al datasetului:
 
 ```py
 split_datasets["train"][1]["translation"]
@@ -114,7 +114,7 @@ split_datasets["train"][1]["translation"]
  'fr': 'Par défaut, développer les fils de discussion'}
 ```
 
-We get a dictionary with two sentences in the pair of languages we requested. One particularity of this dataset full of technical computer science terms is that they are all fully translated in French. However, French engineers leave most computer science-specific words in English when they talk. Here, for instance, the word "threads" might well appear in a French sentence, especially in a technical conversation; but in this dataset it has been translated into the more correct "fils de discussion." The pretrained model we use, which has been pretrained on a larger corpus of French and English sentences, takes the easier option of leaving the word as is:
+Obținem un dicționar cu două propoziții în perechea de limbi solicitate. O particularitate a acestui dataset plin de termeni tehnici din domeniul informaticii este că toate sunt traduse integral în franceză. Cu toate acestea, inginerii francezi lasă majoritatea cuvintelor specifice informaticii în engleză atunci când vorbesc. Aici, de exemplu, cuvântul "threads" ar putea foarte bine să apară într-o propoziție în limba franceză, în special într-o conversație tehnică; dar în acest dataset a fost tradus în "fils de discussion". Modelul preantrenat pe care îl folosim, care a fost preantrenat pe un corpus mai mare de propoziții în franceză și engleză, alege opțiunea mai ușoară de a lăsa cuvântul așa cum este:
 
 ```py
 from transformers import pipeline
@@ -128,8 +128,8 @@ translator("Default to expanded threads")
 [{'translation_text': 'Par défaut pour les threads élargis'}]
 ```
 
-Another example of this behavior can be seen with the word "plugin," which isn't officially a French word but which most native speakers will understand and not bother to translate.
-In the KDE4 dataset this word has been translated in French into the more official "module d'extension":
+Un alt exemplu al acestui comportament poate fi văzut cu cuvântul "plugin", care nu este oficial un cuvânt francez, dar pe care majoritatea vorbitorilor nativi îl vor înțelege și nu se vor obosi să îl traducă.
+În datasetul KDE4, acest cuvânt a fost tradus în franceză în termenul puțin mai oficial "module d'extension":
 
 ```py
 split_datasets["train"][172]["translation"]
@@ -140,7 +140,7 @@ split_datasets["train"][172]["translation"]
  'fr': "Impossible d'importer %1 en utilisant le module d'extension d'importation OFX. Ce fichier n'a pas un format correct."}
 ```
 
-Our pretrained model, however, sticks with the compact and familiar English word:
+Modelul nostru preantrenat, cu toate acestea, rămâne la cuvântul englez compact și familiar:
 
 ```py
 translator(
@@ -152,21 +152,21 @@ translator(
 [{'translation_text': "Impossible d'importer %1 en utilisant le plugin d'importateur OFX. Ce fichier n'est pas le bon format."}]
 ```
 
-It will be interesting to see if our fine-tuned model picks up on those particularities of the dataset (spoiler alert: it will).
+Va fi interesant de văzut dacă modelul nostru fine-tuned reține aceste particularități ale datasetului(spoiler alert: va reține).
 
 <Youtube id="0Oxphw4Q9fo"/>
 
 <Tip>
 
-✏️ **Your turn!** Another English word that is often used in French is "email." Find the first sample in the training dataset that uses this word. How is it translated? How does the pretrained model translate the same English sentence?
+✏️ **Rândul tău!** Un alt cuvânt englezesc care este adesea folosit în franceză este "email". Găsiți primul sample din datasetul de antrenare care utilizează acest cuvânt. Cum este tradus? Cum traduce modelul preantrenat aceeași propoziție în limba engleză?
 
 </Tip>
 
-### Processing the data[[processing-the-data]]
+### Procesarea datelor[[processing-the-data]]
 
 <Youtube id="XAR8jnZZuUs"/>
 
-You should know the drill by now: the texts all need to be converted into sets of token IDs so the model can make sense of them. For this task, we'll need to tokenize both the inputs and the targets. Our first task is to create our `tokenizer` object. As noted earlier, we'll be using a Marian English to French pretrained model. If you are trying this code with another pair of languages, make sure to adapt the model checkpoint. The [Helsinki-NLP](https://huggingface.co/Helsinki-NLP) organization provides more than a thousand models in multiple languages.
+Ar trebui să știți deja cum stă treaba: toate textele trebuie convertite în seturi de ID-uri token, astfel încât modelul să le poată înțelege. Pentru această sarcină, va trebui să tokenizăm atât inputurile, cât și targeturile. Prima noastră sarcină este să creăm obiectul `tokenizer`. După cum am menționat mai devreme, vom utiliza un model Marian preantrenat din engleză în franceză. Dacă încercați acest cod cu o altă pereche de limbi, asigurați-vă că adaptați checkpointul modelului. Organizația [Helsinki-NLP](https://huggingface.co/Helsinki-NLP) oferă mai mult de o mie de modele în mai multe limbi.
 
 ```python
 from transformers import AutoTokenizer
@@ -175,17 +175,17 @@ model_checkpoint = "Helsinki-NLP/opus-mt-en-fr"
 tokenizer = AutoTokenizer.from_pretrained(model_checkpoint, return_tensors="pt")
 ```
 
-You can also replace the `model_checkpoint` with any other model you prefer from the [Hub](https://huggingface.co/models), or a local folder where you've saved a pretrained model and a tokenizer.
+De asemenea, puteți înlocui `model_checkpoint` cu orice alt model preferat din [Hub](https://huggingface.co/models) sau cu un folder local în care ați salvat un model preantrenat și un tokenizer.
 
 <Tip>
 
-💡 If you are using a multilingual tokenizer such as mBART, mBART-50, or M2M100, you will need to set the language codes of your inputs and targets in the tokenizer by setting `tokenizer.src_lang` and `tokenizer.tgt_lang` to the right values.
+💡 Dacă utilizați un tokenizer multilingv, cum ar fi mBART, mBART-50 sau M2M100, va trebui să setați codurile de limbă ale inputurilor și targeturilor în tokenizer prin setarea `tokenizer.src_lang` și `tokenizer.tgt_lang` la valorile corecte.
 
 </Tip>
 
-The preparation of our data is pretty straightforward. There's just one thing to remember; you need to ensure that the tokenizer processes the targets in the output language (here, French). You can do this by passing the targets to the `text_targets` argument of the tokenizer's `__call__` method.
+Pregătirea datelor noastre este destul de simplă. Trebuie să rețineți un singur lucru; trebuie să vă asigurați că tokenizerul procesează targeturile în limba de ieșire (aici, franceză). Puteți face acest lucru trecând targeturile la argumentul `text_targets` al metodei `__call__` a tokenizerului.
 
-To see how this works, let's process one sample of each language in the training set:
+Pentru a vedea cum funcționează acest lucru, să procesăm un sample din fiecare limbă din setul de antrenare:
 
 ```python
 en_sentence = split_datasets["train"][1]["translation"]["en"]
@@ -199,7 +199,7 @@ inputs
 {'input_ids': [47591, 12, 9842, 19634, 9, 0], 'attention_mask': [1, 1, 1, 1, 1, 1], 'labels': [577, 5891, 2, 3184, 16, 2542, 5, 1710, 0]}
 ```
 
-As we can see, the output contains the input IDs associated with the English sentence, while the IDs associated with the French one are stored in the `labels` field. If you forget to indicate that you are tokenizing labels, they will be tokenized by the input tokenizer, which in the case of a Marian model is not going to go well at all:
+După cum putem vedea, rezultatul conține ID-urile de input asociate cu propoziția în limba engleză, în timp ce ID-urile asociate cu cea în limba franceză sunt stocate în câmpul `labels`. Dacă uitați să indicați că tokenizați labelurile, acestea vor fi tokenizate de către tokenizerul de input, ceea ce în cazul unui model Marian nu va merge deloc bine:
 
 ```python
 wrong_targets = tokenizer(fr_sentence)
@@ -212,9 +212,9 @@ print(tokenizer.convert_ids_to_tokens(inputs["labels"]))
 ['▁Par', '▁défaut', ',', '▁développer', '▁les', '▁fils', '▁de', '▁discussion', '</s>']
 ```
 
-As we can see, using the English tokenizer to preprocess a French sentence results in a lot more tokens, since the tokenizer doesn't know any French words (except those that also appear in the English language, like "discussion").
+După cum se poate observa, utilizarea tokenizerului englez pentru preprocesarea unei propoziții franceze are ca rezultat mult mai mulți tokeni, deoarece tokenizerul nu cunoaște niciun cuvânt francez (cu excepția celor care apar și în limba engleză, precum "discussion").
 
-Since `inputs` is a dictionary with our usual keys (input IDs, attention mask, etc.), the last step is to define the preprocessing function we will apply on the datasets:
+Deoarece `inputs` este un dicționar cu cheile noastre obișnuite (ID-uri de input, attention mask etc.), ultimul pas este să definim funcția de preprocesare pe care o vom aplica dataseturilor:
 
 ```python
 max_length = 128
@@ -229,21 +229,21 @@ def preprocess_function(examples):
     return model_inputs
 ```
 
-Note that we set the same maximum length for our inputs and outputs. Since the texts we're dealing with seem pretty short, we use 128.
+Rețineți că am stabilit aceeași lungime maximă pentru inputurile și outputurile noastre. Deoarece textele cu care avem de-a face par destul de scurte, vom folosi 128.
 
 <Tip>
 
-💡 If you are using a T5 model (more specifically, one of the `t5-xxx` checkpoints), the model will expect the text inputs to have a prefix indicating the task at hand, such as `translate: English to French:`.
+💡 Dacă utilizați un model T5 (mai precis, unul dintre checkpointurile `t5-xxx`), modelul se va aștepta ca inputurile text să aibă un prefix care să indice sarcina în cauză, cum ar fi `translate: din engleză în franceză:`.
 
 </Tip>
 
 <Tip warning={true}>
 
-⚠️ We don't pay attention to the attention mask of the targets, as the model won't expect it. Instead, the labels corresponding to a padding token should be set to `-100` so they are ignored in the loss computation. This will be done by our data collator later on since we are applying dynamic padding, but if you use padding here, you should adapt the preprocessing function to set all labels that correspond to the padding token to `-100`.
+⚠️ Nu acordăm atenție attention maskului a targeturilor, deoarece modelul nu se va aștepta la aceasta. În schimb, labelurile corespunzătoare unui padding token trebuie setate la `-100`, astfel încât acestea să fie ignorate în calculul pierderilor. Acest lucru va fi făcut mai târziu de data collatorul nostru, deoarece aplicăm padding dinamic, dar dacă utilizați padding aici, ar trebui să adaptați funcția de preprocesare pentru a seta toate labelurile care corespund simbolului de padding la `-100`.
 
 </Tip>
 
-We can now apply that preprocessing in one go on all the splits of our dataset:
+Acum putem aplica această preprocesare dintr-o singură dată pe toate diviziunile datasetului nostru:
 
 ```py
 tokenized_datasets = split_datasets.map(
@@ -253,15 +253,15 @@ tokenized_datasets = split_datasets.map(
 )
 ```
 
-Now that the data has been preprocessed, we are ready to fine-tune our pretrained model!
+Acum că datele au fost preprocesate, suntem pregătiți să facem fine-tune modelul nostru preantrenat!
 
 {#if fw === 'pt'}
 
-## Fine-tuning the model with the `Trainer` API[[fine-tuning-the-model-with-the-trainer-api]]
+## Fine-tuningul modelului cu API-ul `Trainer`[[fine-tuning-the-model-with-the-trainer-api]]
 
-The actual code using the `Trainer` will be the same as before, with just one little change: we use a [`Seq2SeqTrainer`](https://huggingface.co/transformers/main_classes/trainer.html#seq2seqtrainer) here, which is a subclass of `Trainer` that will allow us to properly deal with the evaluation, using the `generate()` method to predict outputs from the inputs. We'll dive into that in more detail when we talk about the metric computation.
+Codul real care utilizează `Trainer` va fi același ca înainte, cu o singură mică schimbare: folosim aici un [`Seq2SeqTrainer`](https://huggingface.co/transformers/main_classes/trainer.html#seq2seqtrainer), care este o subclasă a `Trainer` care ne va permite să ne ocupăm în mod corespunzător de evaluare, folosind metoda `generate()` pentru a prezice rezultatele din inputuri. Vom analiza acest aspect mai în detaliu atunci când vom vorbi despre calculul metricelor.
 
-First things first, we need an actual model to fine-tune. We'll use the usual `AutoModel` API:
+În primul rând, avem nevoie de un model pe care să îl aplicăm fine-tuningul. Vom utiliza API-ul obișnuit `AutoModel`:
 
 ```py
 from transformers import AutoModelForSeq2SeqLM
@@ -271,9 +271,9 @@ model = AutoModelForSeq2SeqLM.from_pretrained(model_checkpoint)
 
 {:else}
 
-## Fine-tuning the model with Keras[[fine-tuning-the-model-with-keras]]
+## Fine-tuningul modelului cu Keras[[fine-tuning-the-model-with-keras]]
 
-First things first, we need an actual model to fine-tune. We'll use the usual `AutoModel` API:
+În primul rând, avem nevoie de un model pe care să îl aplicăm fine-tuningul. Vom folosi API-ul obișnuit `AutoModel`:
 
 ```py
 from transformers import TFAutoModelForSeq2SeqLM
@@ -283,24 +283,24 @@ model = TFAutoModelForSeq2SeqLM.from_pretrained(model_checkpoint, from_pt=True)
 
 <Tip warning={false}>
 
-💡 The `Helsinki-NLP/opus-mt-en-fr` checkpoint only has PyTorch weights, so
-you'll get an error if you try to load the model without using the
-`from_pt=True` argument in the `from_pretrained()` method. When you specify
-`from_pt=True`, the library will automatically download and convert the
-PyTorch weights for you. As you can see, it is very simple to switch between
-frameworks in 🤗 Transformers!
+💡 Checkpointul `Helsinki-NLP/opus-mt-en-fr` are doar weighturi PyTorch, deci
+veți primi o eroare dacă încercați să încărcați modelul fără a utiliza argumentul
+`from_pt=True` în metoda `from_pretrained()`. Atunci când specificați
+`from_pt=True`, biblioteca va descărca și va converti automat
+weighturile PyTorch pentru voi. După cum puteți vedea, este foarte simplu să vă schimbați între
+frameworkuri în 🤗 Transformers!
 
 </Tip>
 
 {/if}
 
-Note that this time we are using a model that was trained on a translation task and can actually be used already, so there is no warning about missing weights or newly initialized ones.
+Rețineți că de data aceasta folosim un model care a fost antrenat pe o sarcină de traducere și care poate fi utilizat deja, astfel încât nu există niciun avertisment cu privire la weighturile lipsă sau la cele nou inițializate.
 
 ### Data collation[[data-collation]]
 
-We'll need a data collator to deal with the padding for dynamic batching. We can't just use a `DataCollatorWithPadding` like in [Chapter 3](/course/chapter3) in this case, because that only pads the inputs (input IDs, attention mask, and token type IDs). Our labels should also be padded to the maximum length encountered in the labels. And, as mentioned previously, the padding value used to pad the labels should be `-100` and not the padding token of the tokenizer, to make sure those padded values are ignored in the loss computation.
+Vom avea nevoie de un data collator care să se ocupe de paddingul pentru batching-ul dinamic. Nu putem folosi un `DataCollatorWithPadding` ca în [Capitolul 3](/course/chapter3) în acest caz, pentru că acesta doar face padding inputurilor (input Is, attention mask și token type IDs). Labelurile noastre ar trebui, de asemenea, să fie padded la lungimea maximă întâlnită în labeluri. Și, așa cum am menționat anterior, valoarea de padding utilizată pentru a face padding labelurilor ar trebui să fie `-100` și nu padding tokenul tokenizerului, pentru a ne asigura că aceste valori de padding sunt ignorate în calculul pierderilor.
 
-This is all done by a [`DataCollatorForSeq2Seq`](https://huggingface.co/transformers/main_classes/data_collator.html#datacollatorforseq2seq). Like the `DataCollatorWithPadding`, it takes the `tokenizer` used to preprocess the inputs, but it also takes the `model`. This is because this data collator will also be responsible for preparing the decoder input IDs, which are shifted versions of the labels with a special token at the beginning. Since this shift is done slightly differently for different architectures, the `DataCollatorForSeq2Seq` needs to know the `model` object:
+Toate acestea sunt realizate de un [`DataCollatorForSeq2Seq`](https://huggingface.co/transformers/main_classes/data_collator.html#datacollatorforseq2seq). Ca și `DataCollatorWithPadding`, acesta preia `tokenizer` utilizat pentru preprocesarea inputurilor, dar preia și `modelul`. Acest lucru se datorează faptului că acest data collator va fi, de asemenea, responsabil de pregătirea ID-urilor de input ale decoderului, care sunt versiuni schimbate ale labelurilor cu un token special la început. Deoarece această schimbare se face ușor diferit pentru diferite arhitecturi, `DataCollatorForSeq2Seq` trebuie să cunoască obiectul `model`:
 
 {#if fw === 'pt'}
 
@@ -320,7 +320,7 @@ data_collator = DataCollatorForSeq2Seq(tokenizer, model=model, return_tensors="t
 
 {/if}
 
-To test this on a few samples, we just call it on a list of examples from our tokenized training set:
+Pentru a testa acest lucru pe câteva sampleuri, îl apelăm doar pe o listă de sampleuri din setul nostru de antrenare tokenizat:
 
 ```py
 batch = data_collator([tokenized_datasets["train"][i] for i in range(1, 3)])
@@ -331,7 +331,7 @@ batch.keys()
 dict_keys(['attention_mask', 'input_ids', 'labels', 'decoder_input_ids'])
 ```
 
-We can check our labels have been padded to the maximum length of the batch, using `-100`:
+Putem verifica dacă labelurile noastre au fost padded la lungimea maximă a batchului, folosind `-100`:
 
 ```py
 batch["labels"]
@@ -344,7 +344,7 @@ tensor([[  577,  5891,     2,  3184,    16,  2542,     5,  1710,     0,  -100,
            550,  7032,  5821,  7907, 12649,     0]])
 ```
 
-And we can also have a look at the decoder input IDs, to see that they are shifted versions of the labels:
+De asemenea, putem arunca o privire la ID-urile de input ale decoderului, pentru a vedea că acestea sunt versiuni schimbate ale labelurilor:
 
 ```py
 batch["decoder_input_ids"]
@@ -357,7 +357,7 @@ tensor([[59513,   577,  5891,     2,  3184,    16,  2542,     5,  1710,     0,
            817,   550,  7032,  5821,  7907, 12649]])
 ```
 
-Here are the labels for the first and second elements in our dataset:
+Iată labelurile pentru primul și al doilea element din datasetul nostru:
 
 ```py
 for i in range(1, 3):
@@ -371,11 +371,11 @@ for i in range(1, 3):
 
 {#if fw === 'pt'}
 
-We will pass this `data_collator` along to the `Seq2SeqTrainer`. Next, let's have a look at the metric.
+Vom transmite acest `data_collator` către `Seq2SeqTrainer`. În continuare, să aruncăm o privire la metrice.
 
 {:else}
 
-We can now use this `data_collator` to convert each of our datasets to a `tf.data.Dataset`, ready for training:
+Acum putem folosi acest `data_collator` pentru a converti fiecare dintre dataseturile într-un `tf.data.Dataset`, gata pentru antrenare:
 
 ```python
 tf_train_dataset = model.prepare_tf_dataset(
@@ -395,27 +395,27 @@ tf_eval_dataset = model.prepare_tf_dataset(
 {/if}
 
 
-### Metrics[[metrics]]
+### Metrice[[metrics]]
 
 <Youtube id="M05L1DhFqcw"/>
 
 {#if fw === 'pt'}
 
-The feature that `Seq2SeqTrainer` adds to its superclass `Trainer` is the ability to use the `generate()` method during evaluation or prediction. During training, the model will use the `decoder_input_ids` with an attention mask ensuring it does not use the tokens after the token it's trying to predict, to speed up training. During inference we won't be able to use those since we won't have labels, so it's a good idea to evaluate our model with the same setup.
+Caracteristica pe care `Seq2SeqTrainer` o adaugă superclasei sale `Trainer` este capacitatea de a utiliza metoda `generate()` în timpul evaluării sau predicției. În timpul antrenării, modelul va utiliza `decoder_input_ids` cu un attention mask care asigură că nu utilizează tokenii de după tokenul pe care încearcă să îl prezică, pentru a accelera antrenarea. În timpul inferenței, nu le vom putea utiliza deoarece nu vom avea labeluri, deci este o idee bună să ne evaluăm modelul cu aceeași configurație.
 
-As we saw in [Chapter 1](/course/chapter1/6), the decoder performs inference by predicting tokens one by one -- something that's implemented behind the scenes in 🤗 Transformers by the `generate()` method. The `Seq2SeqTrainer` will let us use that method for evaluation if we set `predict_with_generate=True`.
+După cum am văzut în [Capitolul 1](/course/chapter1/6), decoderul realizează inferența prin prezicerea tokenilor unul câte unul - lucru care este implementat behind the scenes în 🤗 Transformers prin metoda `generate()`. `Seq2SeqTrainer` ne va permite să folosim această metodă pentru evaluare dacă setăm `predict_with_generate=True`.
 
 {/if}
 
-The traditional metric used for translation is the [BLEU score](https://en.wikipedia.org/wiki/BLEU), introduced in [a 2002 article](https://aclanthology.org/P02-1040.pdf) by Kishore Papineni et al. The BLEU score evaluates how close the translations are to their labels. It does not measure the intelligibility or grammatical correctness of the model's generated outputs, but uses statistical rules to ensure that all the words in the generated outputs also appear in the targets. In addition, there are rules that penalize repetitions of the same words if they are not also repeated in the targets (to avoid the model outputting sentences like `"the the the the the"`) and output sentences that are shorter than those in the targets (to avoid the model outputting sentences like `"the"`).
+Metricele tradiționale utilizate pentru traducere sunt [scorul BLEU](https://en.wikipedia.org/wiki/BLEU), introdus în [un articol din 2002](https://aclanthology.org/P02-1040.pdf) de Kishore Papineni et al. Scorul BLEU evaluează cât de apropiate sunt traducerile de labelurile lor. Acesta nu măsoară inteligibilitatea sau corectitudinea gramaticală a rezultatelor generate de model, ci utilizează reguli statistice pentru a se asigura că toate cuvintele din rezultatele generate apar și în targets. În plus, există reguli care penalizează repetițiile acelorași cuvinte dacă acestea nu sunt repetate și în targets(pentru a evita ca modelul să producă propoziții de tipul `"the the the the the the"`) și să producă propoziții care sunt mai scurte decât cele din targets(pentru a evita ca modelul să producă propoziții de tipul `"the"`).
 
-One weakness with BLEU is that it expects the text to already be tokenized, which makes it difficult to compare scores between models that use different tokenizers. So instead, the most commonly used metric for benchmarking translation models today is [SacreBLEU](https://github.com/mjpost/sacrebleu), which addresses this weakness (and others) by standardizing the tokenization step. To use this metric, we first need to install the SacreBLEU library:
+Un punct slab al BLEU este că se așteaptă ca textul să fie deja tokenizat, ceea ce face dificilă compararea scorurilor între modele care utilizează tokenizere diferite. În schimb, cea mai frecvent utilizată măsură pentru evaluarea comparativă a modelelor de traducere este [SacreBLEU](https://github.com/mjpost/sacrebleu), care abordează acest punct slab (și altele) prin standardizarea etapei de tokenizare. Pentru a utiliza această metrică, trebuie mai întâi să instalăm biblioteca SacreBLEU:
 
 ```py
 !pip install sacrebleu
 ```
 
-We can then load it via `evaluate.load()` like we did in [Chapter 3](/course/chapter3):
+Îl putem încărca apoi prin `evaluate.load()` așa cum am făcut în [Capitolul 3](/course/chapter3):
 
 ```py
 import evaluate
@@ -423,9 +423,9 @@ import evaluate
 metric = evaluate.load("sacrebleu")
 ```
 
-This metric will take texts as inputs and targets. It is designed to accept several acceptable targets, as there are often multiple acceptable translations of the same sentence -- the dataset we're using only provides one, but it's not uncommon in NLP to find datasets that give several sentences as labels. So, the predictions should be a list of sentences, but the references should be a list of lists of sentences.
+Această metrică va lua texte ca inputuri și targeturi. Este conceput pentru a lua mai multe obiective acceptabile, deoarece există adesea mai multe traduceri acceptabile ale aceleiași propoziții - datasetul pe care îl folosim oferă doar una, dar nu este neobișnuit în NLP să găsim dataseturi care oferă mai multe propoziții ca labeluri. Deci, predicțiile ar trebui să fie o listă de propoziții, dar referințele ar trebui să fie o listă de liste de propoziții.
 
-Let's try an example:
+Hai să încercăm acest exemplu:
 
 ```py
 predictions = [
@@ -449,7 +449,7 @@ metric.compute(predictions=predictions, references=references)
  'ref_len': 13}
 ```
 
-This gets a BLEU score of 46.75, which is rather good -- for reference, the original Transformer model in the ["Attention Is All You Need" paper](https://arxiv.org/pdf/1706.03762.pdf) achieved a BLEU score of 41.8 on a similar translation task between English and French! (For more information about the individual metrics, like `counts` and `bp`, see the [SacreBLEU repository](https://github.com/mjpost/sacrebleu/blob/078c440168c6adc89ba75fe6d63f0d922d42bcfe/sacrebleu/metrics/bleu.py#L74).) On the other hand, if we try with the two bad types of predictions (lots of repetitions or too short) that often come out of translation models, we will get rather bad BLEU scores:
+Se obține un scor BLEU de 46,75, ceea ce este destul de bine - ca referință, modelul original Transformer din lucrarea ["Attention Is All You Need"](https://arxiv.org/pdf/1706.03762.pdf) a obținut un scor BLEU de 41,8 la o sarcină similară de traducere între engleză și franceză! (Pentru mai multe informații despre parametrii individuali, precum `counts` și `bp`, consultați [repositoriul SacreBLEU](https://github.com/mjpost/sacrebleu/blob/078c440168c6adc89ba75fe6d63f0d922d42bcfe/sacrebleu/metrics/bleu.py#L74).) Pe de altă parte, dacă încercăm cu cele două tipuri de predicții proaste (multe repetări sau prea scurte) care rezultă adesea din modelele de traducere, vom obține scoruri BLEU destul de proaste:
 
 ```py
 predictions = ["This This This This"]
@@ -491,11 +491,11 @@ metric.compute(predictions=predictions, references=references)
  'ref_len': 13}
 ```
 
-The score can go from 0 to 100, and higher is better.
+Scorul poate varia de la 0 la 100, iar mai mare înseamnă un scor mai bun.
 
 {#if fw === 'tf'}
 
-To get from the model outputs to texts the metric can use, we will use the `tokenizer.batch_decode()` method. We just have to clean up all the `-100`s in the labels; the tokenizer will automatically do the same for the padding token. Let's define a function that takes our model and a dataset and computes metrics on it. We're also going to use a trick that dramatically increases performance - compiling our generation code with [XLA](https://www.tensorflow.org/xla), TensorFlow's accelerated linear algebra compiler. XLA applies various optimizations to the model's computation graph, and results in significant improvements to speed and memory usage. As described in the Hugging Face [blog](https://huggingface.co/blog/tf-xla-generate), XLA works best when our input shapes don't vary too much. To handle this, we'll pad our inputs to multiples of 128, and make a new dataset with the padding collator, and then we'll apply the `@tf.function(jit_compile=True)` decorator to our generation function, which marks the whole function for compilation with XLA. 
+Pentru a trece de la rezultatele modelului la texte pe care metricele le pot utiliza, vom utiliza metoda `tokenizer.batch_decode()`. Trebuie doar să curățăm toate `-100` din labeluri; tokenizerul va face automat același lucru pentru padding token. Să definim o funcție care să preia modelul nostru și un dataset și să calculeze metrici pe acesta. De asemenea, vom utiliza un truc care crește dramatic performanța - compilarea codului nostru de generare cu [XLA](https://www.tensorflow.org/xla), compilatorul accelerat de algebră liniară al TensorFlow. XLA aplică diverse optimizări graficului de calcul al modelului și are ca rezultat îmbunătățiri semnificative ale vitezei și utilizării memoriei. După cum se descrie în [blogul](https://huggingface.co/blog/tf-xla-generate) Hugging Face, XLA funcționează cel mai bine atunci când shaperulire noastre de input nu variază prea mult. Pentru a face față acestui lucru, vom aplica padding inputurilor cu multipli ai 128 și vom crea un nou dataset cu padding collatorul, iar apoi vom aplica decoratorul `@tf.function(jit_compile=True)` funcției noastre de generare, care marchează întreaga funcție pentru compilare cu XLA.
 
 ```py
 import numpy as np
@@ -544,7 +544,7 @@ def compute_metrics():
 
 {:else}
 
-To get from the model outputs to texts the metric can use, we will use the `tokenizer.batch_decode()` method. We just have to clean up all the `-100`s in the labels (the tokenizer will automatically do the same for the padding token):
+Pentru a trece de la rezultatele modelului la textele pe care metricele le pot utiliza, vom utiliza metoda `tokenizer.batch_decode()`. Trebuie doar să curățăm toate `-100` din labeluri(tokenizerul va face automat același lucru pentru padding token):
 
 ```py
 import numpy as np
@@ -572,12 +572,12 @@ def compute_metrics(eval_preds):
 
 {/if}
 
-Now that this is done, we are ready to fine-tune our model!
+Acum că am făcut acest lucru, suntem gata să facem fine-tune modelului!
 
 
-### Fine-tuning the model[[fine-tuning-the-model]]
+### Fine-tuningul modelului[[fine-tuning-the-model]]
 
-The first step is to log in to Hugging Face, so you're able to upload your results to the Model Hub. There's a convenience function to help you with this in a notebook:
+Primul pas pe care trebuie să îl faceți este să vă conectați la Hugging Face, astfel încât să vă puteți încărca rezultatele în Model Hub. Există o funcție convenabilă care vă ajuta cu acest lucru într-un notebook:
 
 ```python
 from huggingface_hub import notebook_login
@@ -585,9 +585,9 @@ from huggingface_hub import notebook_login
 notebook_login()
 ```
 
-This will display a widget where you can enter your Hugging Face login credentials.
+Aceasta va afișa un widget în care puteți introduce datele voastre de autentificare Hugging Face.
 
-If you aren't working in a notebook, just type the following line in your terminal:
+Dacă nu lucrați într-un notebook, tastați următoarea linie în terminal:
 
 ```bash
 huggingface-cli login
@@ -595,7 +595,7 @@ huggingface-cli login
 
 {#if fw === 'tf'}
 
-Before we start, let's see what kind of results we get from our model without any training:
+Înainte de a începe, să vedem ce fel de rezultate obținem de la modelul nostru fără niciun antrenament:
 
 ```py
 print(compute_metrics())
@@ -605,16 +605,16 @@ print(compute_metrics())
 {'bleu': 33.26983701454733}
 ```
 
-Once this is done, we can prepare everything we need to compile and train our model. Note the use of `tf.keras.mixed_precision.set_global_policy("mixed_float16")` -- this will tell Keras to train using float16, which can give a significant speedup on GPUs that support it (Nvidia 20xx/V100 or newer).
+Odată făcut acest lucru, putem pregăti tot ce avem nevoie pentru a compila și antrena modelul nostru. Observați utilizarea `tf.keras.mixed_precision.set_global_policy("mixed_float16")` -- aceasta îi va spune lui Keras să se antreneze folosind float16, ceea ce poate oferi o creștere semnificativă a vitezei pe GPU-urile care o acceptă (Nvidia 20xx/V100 sau mai noi).
 
 ```python
 from transformers import create_optimizer
 from transformers.keras_callbacks import PushToHubCallback
 import tensorflow as tf
 
-# The number of training steps is the number of samples in the dataset, divided by the batch size then multiplied
-# by the total number of epochs. Note that the tf_train_dataset here is a batched tf.data.Dataset,
-# not the original Hugging Face Dataset, so its len() is already num_samples // batch_size.
+# Numărul etapelor de antrenare este numărul de sampleuri din dataset, împărțit la dimensiunea batchului, apoi înmulțit
+# cu numărul total de epoci. Rețineți că datasetul tf_train_dataset de aici este un dataset tf.data.Dataset în batchuri,
+# nu datasetul original Hugging Face, deci len() este deja num_samples // batch_size.
 num_epochs = 3
 num_train_steps = len(tf_train_dataset) * num_epochs
 
@@ -626,11 +626,11 @@ optimizer, schedule = create_optimizer(
 )
 model.compile(optimizer=optimizer)
 
-# Train in mixed-precision float16
+# Antrenarea în float16 cu precizie mixtă
 tf.keras.mixed_precision.set_global_policy("mixed_float16")
 ```
 
-Next, we define a `PushToHubCallback` to upload our model to the Hub during training, as we saw in [section 2]((/course/chapter7/2)), and then we simply fit the model with that callback:
+În continuare, definim un `PushToHubCallback` pentru a încărca modelul nostru în Hub în timpul antrenamentului, așa cum am văzut în [secțiunea 2]((/course/chapter7/2)), iar apoi pur și simplu facem fit modelului cu acel callback:
 
 ```python
 from transformers.keras_callbacks import PushToHubCallback
@@ -647,15 +647,15 @@ model.fit(
 )
 ```
 
-Note that you can specify the name of the repository you want to push to with the `hub_model_id` argument (in particular, you will have to use this argument to push to an organization). For instance, when we pushed the model to the [`huggingface-course` organization](https://huggingface.co/huggingface-course), we added `hub_model_id="huggingface-course/marian-finetuned-kde4-en-to-fr"` to `Seq2SeqTrainingArguments`. By default, the repository used will be in your namespace and named after the output directory you set, so here it will be `"sgugger/marian-finetuned-kde4-en-to-fr"` (which is the model we linked to at the beginning of this section).
+Rețineți că puteți specifica numele repositoriului către care doriți să faceți push cu argumentul `hub_model_id` (în special, va trebui să utilizați acest argument pentru a face push către o organizație). De exemplu, atunci când am trimis modelul către organizația [`huggingface-course`](https://huggingface.co/huggingface-course), am adăugat `hub_model_id="huggingface-course/marian-finetuned-kde4-en-to-fr"` la `Seq2SeqTrainingArguments`. În mod implicit, repositoriul utilizat va fi în namespaceul vostru și denumit după output directory-ul pe care l-ați stabilit, deci aici va fi `"sgugger/marian-finetuned-kde4-en-to-fr"` (care este modelul la care am făcut legătura la începutul acestei secțiuni).
 
 <Tip>
 
-💡 If the output directory you are using already exists, it needs to be a local clone of the repository you want to push to. If it isn't, you'll get an error when calling `model.fit()` and will need to set a new name.
+💡 Dacă output directory-ul pe care îl utilizați există deja, acesta trebuie să fie o clonă locală a repositoriului către care doriți să faceți push. Dacă nu este, veți primi o eroare atunci când apelați `model.fit()` și va trebui să setați un nume nou.
 
 </Tip>
 
-Finally, let's see what our metrics look like now that training has finished:
+În cele din urmă, hai să vedem cum arată metricele noastre acum că antrenarea s-a încheiat:
 
 ```py
 print(compute_metrics())
@@ -665,11 +665,11 @@ print(compute_metrics())
 {'bleu': 57.334066271545865}
 ```
 
-At this stage, you can use the inference widget on the Model Hub to test your model and share it with your friends. You have successfully fine-tuned a model on a translation task -- congratulations!
+În acest moment, puteți utiliza widgetul de inferență de pe Model Hub pentru a testa modelul și pentru a-l partaja cu prietenii voștrii. Ați făcut fine-tune cu succes unui model pentru o sarcină de traducere - felicitări!
 
 {:else}
 
-Once this is done, we can define our `Seq2SeqTrainingArguments`. Like for the `Trainer`, we use a subclass of `TrainingArguments` that contains a few more fields:
+Odată făcut acest lucru, putem defini `Seq2SeqTrainingArguments`. Ca și pentru `Trainer`, folosim o subclasă a `TrainingArguments` care conține câteva câmpuri suplimentare:
 
 ```python
 from transformers import Seq2SeqTrainingArguments
@@ -690,23 +690,22 @@ args = Seq2SeqTrainingArguments(
 )
 ```
 
-Apart from the usual hyperparameters (like learning rate, number of epochs, batch size, and some weight decay), here are a few changes compared to what we saw in the previous sections:
+În afară de hiperparametrii obișnuiți (cum ar fi rata de învățare, numărul de epoci, dimensiunea batch-ului și o anumită scădere a weighturilor), aici sunt câteva schimbări în comparație cu ceea ce am văzut în secțiunile anterioare:
 
-- We don't set any regular evaluation, as evaluation takes a while; we will just evaluate our model once before training and after.
-- We set `fp16=True`, which speeds up training on modern GPUs.
-- We set `predict_with_generate=True`, as discussed above.
-- We use `push_to_hub=True` to upload the model to the Hub at the end of each epoch.
+- Nu setăm nicio evaluare periodică, deoarece evaluarea durează; ne vom evalua modelul doar o dată înainte și după antrenare.
+- Setăm `fp16=True`, care accelerează antrenarea pe GPU-urile moderne.
+- Setăm `predict_with_generate=True`, așa cum am discutat mai sus.
+- Utilizăm `push_to_hub=True` pentru a încărca modelul în Hub la sfârșitul fiecărei epoci.
 
-Note that you can specify the full name of the repository you want to push to with the `hub_model_id` argument (in particular, you will have to use this argument to push to an organization). For instance, when we pushed the model to the [`huggingface-course` organization](https://huggingface.co/huggingface-course), we added `hub_model_id="huggingface-course/marian-finetuned-kde4-en-to-fr"` to `Seq2SeqTrainingArguments`. By default, the repository used will be in your namespace and named after the output directory you set, so in our case it will be `"sgugger/marian-finetuned-kde4-en-to-fr"` (which is the model we linked to at the beginning of this section).
+Rețineți că puteți specifica numele complet al repositoriului către care doriți să faceți push cu argumentul `hub_model_id` (în special, va trebui să utilizați acest argument pentru a face push către o organizație). De exemplu, atunci când am trimis modelul către organizația [`huggingface-course`](https://huggingface.co/huggingface-course), am adăugat `hub_model_id="huggingface-course/marian-finetuned-kde4-en-to-fr"` la `Seq2SeqTrainingArguments`. În mod implicit, repositoriul utilizat va fi în namespaceul vostru și denumit după output directory-ul pe care l-ați stabilit, deci în cazul nostru va fi `"sgugger/marian-finetuned-kde4-en-to-fr"` (care este modelul la care am făcut legătura la începutul acestei secțiuni).
 
 <Tip>
 
-💡 If the output directory you are using already exists, it needs to be a local clone of the repository you want to push to. If it isn't, you'll get an error when defining your `Seq2SeqTrainer` and will need to set a new name.
+💡 Dacă output directory-ul pe care îl utilizați există deja, acesta trebuie să fie o clonă locală a repositoriului către care doriți să faceți push. În caz contrar, veți primi o eroare atunci când vă definiți `Seq2SeqTrainer` și va trebui să stabiliți un nume nou.
 
 </Tip>
 
-
-Finally, we just pass everything to the `Seq2SeqTrainer`:
+În final, transmitem totul către `Seq2SeqTrainer`:
 
 ```python
 from transformers import Seq2SeqTrainer
@@ -722,7 +721,7 @@ trainer = Seq2SeqTrainer(
 )
 ```
 
-Before training, we'll first look at the score our model gets, to double-check that we're not making things worse with our fine-tuning. This command will take a bit of time, so you can grab a coffee while it executes:
+Înainte de antrenare, ne vom uita mai întâi la scorul obținut de modelul nostru, pentru a verifica dacă nu înrăutățim lucrurile prin fine-tuning. Această comandă va dura ceva timp, așa că puteți lua o cafea sau două în timp ce se execută:
 
 ```python
 trainer.evaluate(max_length=max_length)
@@ -736,17 +735,17 @@ trainer.evaluate(max_length=max_length)
  'eval_steps_per_second': 0.341}
 ```
 
-A BLEU score of 39 is not too bad, which reflects the fact that our model is already good at translating English sentences to French ones.
+Un scor BLEU de 39 nu este prea rău, ceea ce reflectă faptul că modelul nostru este deja bun la traducerea propozițiilor din engleză în franceză.
 
-Next is the training, which will also take a bit of time:
+Urmează antrenarea, care va necesita, de asemenea, puțin timp:
 
 ```python
 trainer.train()
 ```
 
-Note that while the training happens, each time the model is saved (here, every epoch) it is uploaded to the Hub in the background. This way, you will be able to to resume your training on another machine if necessary.
+Rețineți că, în timpul antrenamentului, de fiecare dată când modelul este salvat (aici, la fiecare epocă), acesta este încărcat în Hub în fundal. În acest fel, veți putea să reluați antrenarea pe o altă mașină, dacă este necesar.
 
-Once training is done, we evaluate our model again -- hopefully we will see some amelioration in the BLEU score!
+Odată ce formarea este terminată, evaluăm din nou modelul nostru - sperăm că vom vedea o îmbunătățire a scorului BLEU!
 
 ```py
 trainer.evaluate(max_length=max_length)
@@ -761,35 +760,35 @@ trainer.evaluate(max_length=max_length)
  'epoch': 3.0}
 ```
 
-That's a nearly 14-point improvement, which is great.
+Aceasta este o îmbunătățire de aproape 14 puncte, ceea ce este minunat.
 
-Finally, we use the `push_to_hub()` method to make sure we upload the latest version of the model. The `Trainer` also drafts a model card with all the evaluation results and uploads it. This model card contains metadata that helps the Model Hub pick the widget for the inference demo. Usually, there is no need to say anything as it can infer the right widget from the model class, but in this case, the same model class can be used for all kinds of sequence-to-sequence problems, so we specify it's a translation model:
+În final, folosim metoda `push_to_hub()` pentru a ne asigura că încărcăm cea mai recentă versiune a modelului. De asemenea, `Trainer` redactează un model card cu toate rezultatele evaluării și o încarcă. Acest model card conține metadate care ajută Model Hub să aleagă widgetul pentru demonstrația de inferență. De obicei, nu este nevoie să se menționeze nimic, deoarece poate deduce widgetul potrivit din clasa modelului, dar în acest caz, aceeași clasă de model poate fi utilizată pentru toate tipurile de probleme de tip sequence-to-sequence, așa că specificăm că este un model de traducere:
 
 ```py
 trainer.push_to_hub(tags="translation", commit_message="Training complete")
 ```
 
-This command returns the URL of the commit it just did, if you want to inspect it:
+Această comandă returnează URL-ul comitului pe care tocmai l-am făcut, dacă doriți să îl inspectați:
 
 ```python out
 'https://huggingface.co/sgugger/marian-finetuned-kde4-en-to-fr/commit/3601d621e3baae2bc63d3311452535f8f58f6ef3'
 ```
 
-At this stage, you can use the inference widget on the Model Hub to test your model and share it with your friends. You have successfully fine-tuned a model on a translation task -- congratulations!
+În această etapă, puteți utiliza widget-ul de inferență de pe Model Hub pentru a vă testa modelul și pentru a-l partaja cu prietenii. Ați făcut fine-tune cu succes un model pentru o sarcină de traducere - felicitări!
 
-If you want to dive a bit more deeply into the training loop, we will now show you how to do the same thing using 🤗 Accelerate.
+Dacă doriți să pătrundeți puțin mai adânc în bucla de antrenare, vă vom arăta acum să faceți același lucru folosind 🤗 Accelerate.
 
 {/if}
 
 {#if fw === 'pt'}
 
-## A custom training loop[[a-custom-training-loop]]
+## O buclă de antrenare personalizată[[a-custom-training-loop]]
 
-Let's now take a look at the full training loop, so you can easily customize the parts you need. It will look a lot like what we did in [section 2](/course/chapter7/2) and [Chapter 3](/course/chapter3/4).
+Să aruncăm acum o privire la bucla de antrenare completă, astfel încât să puteți personaliza cu ușurință părțile de care aveți nevoie. Va arăta foarte asemănător cu ceea ce am făcut în [secțiunea 2](/course/chapter7/2) și [capitolul 3](/course/chapter7/4).
 
-### Preparing everything for training[[preparing-everything-for-training]]
+### Pregătirea tuturor lucrulilor pentru antrenare[[preparing-everything-for-training]]
 
-You've seen all of this a few times now, so we'll go through the code quite quickly. First we'll build the `DataLoader`s from our datasets, after setting the datasets to the `"torch"` format so we get PyTorch tensors:
+Ați văzut toate acestea de câteva ori până acum, așa că vom trece prin cod destul de repede. Mai întâi vom construi `DataLoader`s din dataseturile noastre, după ce vom seta dataseturile în formatul `"torch"` astfel încât să obținem tensori PyTorch:
 
 ```py
 from torch.utils.data import DataLoader
@@ -806,13 +805,13 @@ eval_dataloader = DataLoader(
 )
 ```
 
-Next we reinstantiate our model, to make sure we're not continuing the fine-tuning from before but starting from the pretrained model again:
+În continuare, reinițializăm modelul, pentru a ne asigura că nu continuăm fine-tuningul de dinainte, ci pornim din nou de la modelul preantrenat:
 
 ```py
 model = AutoModelForSeq2SeqLM.from_pretrained(model_checkpoint)
 ```
 
-Then we will need an optimizer:
+Pe urmă vom avea nevoie de un optimizator:
 
 ```py
 from transformers import AdamW
@@ -820,7 +819,7 @@ from transformers import AdamW
 optimizer = AdamW(model.parameters(), lr=2e-5)
 ```
 
-Once we have all those objects, we can send them to the `accelerator.prepare()` method. Remember that if you want to train on TPUs in a Colab notebook, you will need to move all of this code into a training function, and that shouldn't execute any cell that instantiates an `Accelerator`.
+Odată ce avem toate aceste obiecte, le putem trimite la metoda `accelerator.prepare()`. Amintiți-vă că, dacă doriți să vă antrenați pe un TPU într-un notebook Colab, va trebui să mutați tot acest cod într-o funcție de antrenare, care nu ar trebui să execute nicio celulă care inițializează un `Accelerator`.
 
 ```py
 from accelerate import Accelerator
@@ -831,7 +830,7 @@ model, optimizer, train_dataloader, eval_dataloader = accelerator.prepare(
 )
 ```
 
-Now that we have sent our `train_dataloader` to `accelerator.prepare()`, we can use its length to compute the number of training steps. Remember we should always do this after preparing the dataloader, as that method will change the length of the `DataLoader`. We use a classic linear schedule from the learning rate to 0:
+Acum că am trimis `train_dataloader` la `accelerator.prepare()`, putem utiliza lungimea acestuia pentru a calcula numărul de pași de antrenare. Amintiți-vă că trebuie să facem acest lucru întotdeauna după pregătirea data loaderului, deoarece metoda respectivă va modifica lungimea `DataLoader`. Utilizăm un program liniar clasic de la rata de învățare la 0:
 
 ```py
 from transformers import get_scheduler
@@ -848,7 +847,7 @@ lr_scheduler = get_scheduler(
 )
 ```
 
-Lastly, to push our model to the Hub, we will need to create a `Repository` object in a working folder. First log in to the Hugging Face Hub, if you're not logged in already. We'll determine the repository name from the model ID we want to give our model (feel free to replace the `repo_name` with your own choice; it just needs to contain your username, which is what the function `get_full_repo_name()` does):
+În cele din urmă, pentru a trimite modelul nostru către Hub, va trebui să creăm un obiect `Repository` într-un folder de lucru. În primul rând, conectați-vă la Hugging Face Hub, dacă nu sunteți deja conectat. Vom determina numele repositoriului pornind de la ID-ul modelului pe care dorim să îl atribuim modelului nostru (nu ezitați să înlocuiți `repo_name` cu propria alegere; acesta trebuie doar să conțină numele vostru de utilizator, ceea ce face funcția `get_full_repo_name()`):
 
 ```py
 from huggingface_hub import Repository, get_full_repo_name
@@ -862,18 +861,18 @@ repo_name
 'sgugger/marian-finetuned-kde4-en-to-fr-accelerate'
 ```
 
-Then we can clone that repository in a local folder. If it already exists, this local folder should be a clone of the repository we are working with:
+Apoi putem clona acel repositoriu într-un folder local. Dacă există deja, acest folder local ar trebui să fie o clonă a repositoriului cu care lucrăm:
 
 ```py
 output_dir = "marian-finetuned-kde4-en-to-fr-accelerate"
 repo = Repository(output_dir, clone_from=repo_name)
 ```
 
-We can now upload anything we save in `output_dir` by calling the `repo.push_to_hub()` method. This will help us upload the intermediate models at the end of each epoch.
+Acum putem încărca orice salvăm în `output_dir` prin apelarea metodei `repo.push_to_hub()`. Acest lucru ne va ajuta să încărcăm modelele intermediare la sfârșitul fiecărei epoci.
 
-### Training loop[[training-loop]]
+### Bucla de antrenare[[training-loop]]
 
-We are now ready to write the full training loop. To simplify its evaluation part, we define this `postprocess()` function that takes predictions and labels and converts them to the lists of strings our `metric` object will expect:
+Acum suntem pregătiți să scriem bucla de antrenare completă. Pentru a simplifica partea de evaluare, definim această funcție `postprocess()` care preia predicțiile și labelurile și le convertește în liste de stringuri pe care obiectul nostru `metric` le va aștepta:
 
 ```py
 def postprocess(predictions, labels):
@@ -892,11 +891,11 @@ def postprocess(predictions, labels):
     return decoded_preds, decoded_labels
 ```
 
-The training loop looks a lot like the ones in [section 2](/course/chapter7/2) and [Chapter 3](/course/chapter3), with a few differences in the evaluation part -- so let's focus on that!
+Bucla de antrenare seamănă foarte mult cu cele din [secțiunea 2](/course/chapter7/2) și [capitolul 3](/course/chapter3), cu câteva diferențe în partea de evaluare - așa că hai să ne concentrăm pe asta!
 
-The first thing to note is that we use the `generate()` method to compute predictions, but this is a method on our base model, not the wrapped model 🤗 Accelerate created in the `prepare()` method. That's why we unwrap the model first, then call this method.
+Primul lucru pe care îl putem remarca este că folosim metoda `generate()` pentru a calcula predicțiile, dar aceasta este o metodă a modelul nostru de bază, nu pe modelul wrapped 🤗 Accelerate creat în metoda `prepare()`. De aceea, mai întâi facem unwrap modelului, apoi apelăm această metodă.
 
-The second thing is that, like with [token classification](/course/chapter7/2), two processes may have padded the inputs and labels to different shapes, so we use `accelerator.pad_across_processes()` to make the predictions and labels the same shape before calling the `gather()` method. If we don't do this, the evaluation will either error out or hang forever.
+Al doilea lucru este că, la fel ca în cazul [token classification](/course/chapter7/2), este posibil ca două procese să fi făcut padding inputurilor și labelurilor cu forme diferite, așa că folosim `accelerator.pad_across_processes()` pentru a face predicțiile și labelurile de aceeași formă înainte de a apela metoda `gather()`. Dacă nu facem acest lucru, evaluarea va da o eroare sau se va bloca pentru totdeauna.
 
 ```py
 from tqdm.auto import tqdm
@@ -960,13 +959,13 @@ epoch 1, BLEU score: 54.24
 epoch 2, BLEU score: 54.44
 ```
 
-Once this is done, you should have a model that has results pretty similar to the one trained with the `Seq2SeqTrainer`. You can check the one we trained using this code at [*huggingface-course/marian-finetuned-kde4-en-to-fr-accelerate*](https://huggingface.co/huggingface-course/marian-finetuned-kde4-en-to-fr-accelerate). And if you want to test out any tweaks to the training loop, you can directly implement them by editing the code shown above!
+Odată făcut acest lucru, ar trebui să aveți un model care are rezultate destul de asemănătoare cu cel antrenat cu `Seq2SeqTrainer`. Îl puteți verifica pe cel pe care l-am antrenat folosind acest cod la [*huggingface-course/marian-finetuned-kde4-en-to-fr-accelerate*] (https://huggingface.co/huggingface-course/marian-finetuned-kde4-en-to-fr-accelerate). Și dacă doriți să testați orice modificări ale buclei de antrenare, le puteți implementa direct prin editarea codului prezentat mai sus!
 
 {/if}
 
-## Using the fine-tuned model[[using-the-fine-tuned-model]]
+## Utilizarea modelului fine-tuned[[using-the-fine-tuned-model]]
 
-We've already shown you how you can use the model we fine-tuned on the Model Hub with the inference widget. To use it locally in a `pipeline`, we just have to specify the proper model identifier:
+V-am arătat deja cum puteți utiliza modelul pe căruia i-am aplicat fine-tune pe Model Hub cu widgetul de inferență. Pentru a-l utiliza la nivel local într-un `pipeline`, trebuie doar să specificăm identificatorul de model corespunzător:
 
 ```py
 from transformers import pipeline
@@ -981,7 +980,7 @@ translator("Default to expanded threads")
 [{'translation_text': 'Par défaut, développer les fils de discussion'}]
 ```
 
-As expected, our pretrained model adapted its knowledge to the corpus we fine-tuned it on, and instead of leaving the English word "threads" alone, it now translates it to the French official version. It's the same for "plugin":
+Așa cum era de așteptat, modelul nostru preantrenat și-a adaptat cunoștințele la corpusul pe care i-am făcut fine-tune și, în loc să lase cuvântul englezesc "threads", acum îl traduce în versiunea oficială franceză. Același lucru este valabil și pentru "plugin":
 
 ```py
 translator(
@@ -993,10 +992,10 @@ translator(
 [{'translation_text': "Impossible d'importer %1 en utilisant le module externe d'importation OFX. Ce fichier n'est pas le bon format."}]
 ```
 
-Another great example of domain adaptation!
+Un alt exemplu excelent de adaptare a domeniului!
 
 <Tip>
 
-✏️ **Your turn!** What does the model return on the sample with the word "email" you identified earlier?
+✏️ **E rândul tău!** Care este rezultatul modelului pentru sampleul cuvântul "email" pe care l-ai identificat mai devreme?
 
 </Tip>
diff --git a/chapters/ro/chapter7/5.mdx b/chapters/ro/chapter7/5.mdx
index b8afcfaa0..84157cc3f 100644
--- a/chapters/ro/chapter7/5.mdx
+++ b/chapters/ro/chapter7/5.mdx
@@ -1,6 +1,6 @@
 <FrameworkSwitchCourse {fw} />
 
-# Summarization[[summarization]]
+# Sumarizare[[summarization]]
 
 {#if fw === 'pt'}
 
@@ -23,19 +23,20 @@
 {/if}
 
 
-In this section we'll take a look at how Transformer models can be used to condense long documents into summaries, a task known as _text summarization_. This is one of the most challenging NLP tasks as it requires a range of abilities, such as understanding long passages and generating coherent text that captures the main topics in a document. However, when done well, text summarization is a powerful tool that can speed up various business processes by relieving the burden of domain experts to read long documents in detail.
+În această secțiune vom analiza modul în care modelele Transformer pot fi utilizate pentru a condensa documente lungi în rezumate, o sarcină cunoscută sub numele de _text summarization_. Aceasta este una dintre cele mai dificile sarcini NLP, deoarece necesită o gamă largă de abilități, cum ar fi înțelegerea pasajelor lungi și generarea unui text coerent care integrează principalele subiecte dintr-un document. Cu toate acestea, atunci când este bine realizată, rezumarea textului este un instrument puternic care poate accelera diverse procese de business prin scutirea experților într-u anumit domeniu de a citi documente lungi în detaliu.
 
 <Youtube id="yHnr5Dk2zCI"/>
 
-Although there already exist various fine-tuned models for summarization on the [Hugging Face Hub](https://huggingface.co/models?pipeline_tag=summarization&sort=downloads), almost all of these are only suitable for English documents. So, to add a twist in this section, we'll train a bilingual model for English and Spanish. By the end of this section, you'll have a [model](https://huggingface.co/huggingface-course/mt5-small-finetuned-amazon-en-es) that can summarize customer reviews like the one shown here:
+Deși există deja diverse modele bine puse la punct pentru sumarizare pe [Hugging Face Hub] (https://huggingface.co/models?pipeline_tag=summarization&sort=downloads), aproape toate acestea sunt potrivite numai pentru documentele în limba engleză. Prin urmare, pentru a adăuga o întorsătură în această secțiune, vom antrena un model bilingv pentru engleză și spaniolă. Până la sfârșitul acestei secțiuni, veți avea un [model](https://huggingface.co/huggingface-course/mt5-small-finetuned-amazon-en-es) care poate rezuma recenziile clienților precum cel prezentat aici:
+
 
 <iframe src="https://course-demos-mt5-small-finetuned-amazon-en-es.hf.space" frameBorder="0" height="400" title="Gradio app" class="block dark:hidden container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
 
-As we'll see, these summaries are concise because they're learned from the titles that customers provide in their product reviews. Let's start by putting together a suitable bilingual corpus for this task.
+După cum vom vedea, aceste rezumate sunt concise deoarece sunt învățate din titlurile pe care clienții le furnizează în recenziile lor despre produse. Să începem prin alcătuirea unui corpus bilingv adecvat pentru această sarcină.
 
-## Preparing a multilingual corpus[[preparing-a-multilingual-corpus]]
+## Pregătirea unui corpus multilingv[[preparing-a-multilingual-corpus]]
 
-We'll use the [Multilingual Amazon Reviews Corpus](https://huggingface.co/datasets/amazon_reviews_multi) to create our bilingual summarizer. This corpus consists of Amazon product reviews in six languages and is typically used to benchmark multilingual classifiers. However, since each review is accompanied by a short title, we can use the titles as the target summaries for our model to learn from! To get started, let's download the English and Spanish subsets from the Hugging Face Hub:
+Vom utiliza [Multilingual Amazon Reviews Corpus] (https://huggingface.co/datasets/amazon_reviews_multi) pentru a crea bilingv summarizerul nostru. Acest corpus este format din recenzii ale produselor Amazon în șase limbi și este utilizat de obicei pentru a evalua clasificatoarele multilingve. Cu toate acestea, deoarece fiecare recenzie este însoțită de un titlu scurt, putem folosi titlurile ca rezumate țintă din care modelul nostru să învețe! Pentru a începe, să descărcăm subseturile în engleză și spaniolă de la Hugging Face Hub:
 
 ```python
 from datasets import load_dataset
@@ -62,7 +63,7 @@ DatasetDict({
 })
 ```
 
-As you can see, for each language there are 200,000 reviews for the `train` split, and 5,000 reviews for each of the `validation` and `test` splits. The review information we are interested in is contained in the `review_body` and `review_title` columns. Let's take a look at a few examples by creating a simple function that takes a random sample from the training set with the techniques we learned in [Chapter 5](/course/chapter5):
+După cum puteți vedea, pentru fiecare limbă există 200.000 de recenzii pentru splitul `train` și 5.000 de recenzii pentru fiecare dintre spliturile `validation` și `test`. Informațiile despre recenzii care ne interesează sunt conținute în coloanele `review_body` și `review_title`. Să analizăm câteva exemple prin crearea unei funcții simple care preia un sample aleatoriu din setul de antrenare cu ajutorul tehnicilor învățate în [Capitolul 5](/course/chapter5):
 
 ```python
 def show_samples(dataset, num_samples=3, seed=42):
@@ -88,11 +89,11 @@ show_samples(english_dataset)
 
 <Tip>
 
-✏️ **Try it out!** Change the random seed in the `Dataset.shuffle()` command to explore other reviews in the corpus. If you're a Spanish speaker, take a look at some of the reviews in `spanish_dataset` to see if the titles also seem like reasonable summaries.
+✏️ **Încercați!** Schimbați seedul aleatoriu în comanda `Dataset.shuffle()` pentru a explora alte recenzii din corpus. Dacă sunteți vorbitor de spaniolă, aruncați o privire la unele dintre recenziile din `spanish_dataset` pentru a vedea dacă și titlurile par a fi rezumate rezonabil.
 
 </Tip>
 
-This sample shows the diversity of reviews one typically finds online, ranging from positive to negative (and everything in between!). Although the example with the "meh" title is not very informative, the other titles look like decent summaries of the reviews themselves. Training a summarization model on all 400,000 reviews would take far too long on a single GPU, so instead we'll focus on generating summaries for a single domain of products. To get a feel for what domains we can choose from, let's convert `english_dataset` to a `pandas.DataFrame` and compute the number of reviews per product category:
+Acest sample arată diversitatea recenziilor pe care le găsim de obicei online, variind de la pozitive la negative (și totul între ele!). Deși exemplul cu titlul "meh" nu este foarte informativ, celelalte titluri par a fi rezumate decente ale recenziilor în sine. Antrenarea unui model de rezumare pe toate cele 400 000 de recenzii ar dura mult prea mult pe un singur GPU, așa că ne vom concentra pe generarea de rezumate pentru un singur domeniu de produse. Pentru a avea o idee despre domeniile din care putem alege, să convertim `english_dataset` într-un `pandas.DataFrame` și să calculăm numărul de recenzii per categorie de produse:
 
 ```python
 english_dataset.set_format("pandas")
@@ -125,7 +126,7 @@ book                       3756
 Name: product_category, dtype: int64
 ```
 
-The most popular products in the English dataset are about household items, clothing, and wireless electronics. To stick with the Amazon theme, though, let's focus on summarizing book reviews -- after all, this is what the company was founded on! We can see two product categories that fit the bill (`book` and `digital_ebook_purchase`), so let's filter the datasets in both languages for just these products. As we saw in [Chapter 5](/course/chapter5), the `Dataset.filter()` function allows us to slice a dataset very efficiently, so we can define a simple function to do this:
+Cele mai populare produse din datasetul în limba engleză sunt despre articole de uz casnic, îmbrăcăminte și electronice fără fir. Cu toate acestea, pentru a rămâne la Amazontheme, să ne concentrăm pe rezumatul recenziilor de cărți - la urma urmei, acesta este motivul pentru care compania a fost fondată! Putem vedea două categorii de produse care se potrivesc (`book` și `digital_ebook_purchase`), deci să filtrăm dataseturile în ambele limbi doar pentru aceste produse. După cum am văzut în [Capitolul 5](/course/chapter5), funcția `Dataset.filter()` ne permite să tăiem un datasetfoarte eficient, deci putem defini o funcție simplă pentru a face acest lucru:
 
 ```python
 def filter_books(example):
@@ -135,13 +136,13 @@ def filter_books(example):
     )
 ```
 
-Now when we apply this function to `english_dataset` and `spanish_dataset`, the result will contain just those rows involving the book categories. Before applying the filter, let's switch the format of `english_dataset` from `"pandas"` back to `"arrow"`:
+Acum, când aplicăm această funcție la `english_dataset` și `spanish_dataset`, rezultatul va conține doar acele rânduri care implică categoriile de cărți. Înainte de a aplica filtrul, să schimbăm formatul din `english_dataset` din `"pandas"` înapoi în `"arrow"`:
 
 ```python
 english_dataset.reset_format()
 ```
 
-We can then apply the filter function, and as a sanity check let's inspect a sample of reviews to see if they are indeed about books:
+Putem aplica apoi funcția de filtrare și, ca o verificare a corectitudinii, să inspectăm un sample de recenzii pentru a vedea dacă acestea sunt într-adevăr despre cărți:
 
 ```python
 spanish_books = spanish_dataset.filter(filter_books)
@@ -160,7 +161,7 @@ show_samples(english_books)
 '>> Review: Nearly all the tips useful and. I consider myself an intermediate to advanced user of OneNote. I would highly recommend.'
 ```
 
-Okay, we can see that the reviews are not strictly about books and might refer to things like calendars and electronic applications such as OneNote. Nevertheless, the domain seems about right to train a summarization model on. Before we look at various models that are suitable for this task, we have one last bit of data preparation to do: combining the English and Spanish reviews as a single `DatasetDict` object. 🤗 Datasets provides a handy `concatenate_datasets()` function that (as the name suggests) will stack two `Dataset` objects on top of each other. So, to create our bilingual dataset, we'll loop over each split, concatenate the datasets for that split, and shuffle the result to ensure our model doesn't overfit to a single language:
+Bine, putem vedea că recenziile nu sunt strict despre cărți și se pot referi la lucruri precum calendare și aplicații electronice precum OneNote. Cu toate acestea, domeniul pare potrivit pentru a antrena un model de sumarizare. Înainte de a analiza diferitele modele care sunt potrivite pentru această sarcină, trebuie să mai pregătim puțin datele: să combinăm recenziile în engleză și spaniolă ca un singur obiect `DatasetDict`. 🤗 Datasets oferă o funcție utilă `concatenate_datasets()` care (după cum sugerează și numele) va concatena două obiecte `Dataset` unul peste celălalt. Așadar, pentru a crea datasetul nostru bilingv, vom parcurge în buclă fiecare împărțire, vom concatena dataseturile pentru acel split și vom amesteca rezultatul pentru a ne asigura că modelul nostru nu se adaptează excesiv la o singură limbă:
 
 ```python
 from datasets import concatenate_datasets, DatasetDict
@@ -188,14 +189,14 @@ show_samples(books_dataset)
 '>> Review: igual que el anterior'
 ```
 
-This certainly looks like a mix of English and Spanish reviews! Now that we have a training corpus, one final thing to check is the distribution of words in the reviews and their titles. This is especially important for summarization tasks, where short reference summaries in the data can bias the model to only output one or two words in the generated summaries. The plots below show the word distributions, and we can see that the titles are heavily skewed toward just 1-2 words:
+Acest lucru arată cu siguranță ca un amestec de recenzii în engleză și spaniolă! Acum că avem un corpus de antrenament, un ultim lucru de verificat este distribuția cuvintelor în recenzii și în titlurile acestora. Acest lucru este deosebit de important pentru sarcinile de sumarizare, în cazul în care rezumatele scurte de referință din date pot influența modelul să producă doar unul sau două cuvinte în rezumatele generate. Graficele de mai jos arată distribuția cuvintelor și putem observa că titlurile sunt puternic înclinate spre 1-2 cuvinte:
 
 <div class="flex justify-center">
-<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/review-lengths.svg" alt="Word count distributions for the review titles and texts."/>
-<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/review-lengths-dark.svg" alt="Word count distributions for the review titles and texts."/>
+<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/review-lengths.svg" alt="Distribuția numărului de cuvinte pentru titlurile și textele recenziei."/>
+<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/review-lengths-dark.svg" alt="Distribuția numărului de cuvinte pentru titlurile și textele recenziei."/>
 </div>
 
-To deal with this, we'll filter out the examples with very short titles so that our model can produce more interesting summaries. Since we're dealing with English and Spanish texts, we can use a rough heuristic to split the titles on whitespace and then use our trusty `Dataset.filter()` method as follows:
+Pentru a rezolva acest lucru, vom filtra exemplele cu titluri foarte scurte, astfel încât modelul nostru să poată produce rezumate mai interesante. Deoarece avem de-a face cu texte în engleză și spaniolă, putem folosi rough heuristic pentru a face split titlurilor pe baza spațiului alb și apoi să folosim metoda noastră de încredere `Dataset.filter()` după cum urmează:
 
 ```python
 books_dataset = books_dataset.filter(lambda x: len(x["review_title"].split()) > 2)
@@ -203,34 +204,34 @@ books_dataset = books_dataset.filter(lambda x: len(x["review_title"].split()) >
 
 Now that we've prepared our corpus, let's take a look at a few possible Transformer models that one might fine-tune on it!
 
-## Models for text summarization[[models-for-text-summarization]]
+## Modele pentru sumarizarea textului[[models-for-text-summarization]]
 
-If you think about it, text summarization is a similar sort of task to machine translation: we have a body of text like a review that we'd like to "translate" into a shorter version that captures the salient features of the input. Accordingly, most Transformer models for summarization adopt the encoder-decoder architecture that we first encountered in [Chapter 1](/course/chapter1), although there are some exceptions like the GPT family of models which can also be used for summarization in few-shot settings. The following table lists some popular pretrained models that can be fine-tuned for summarization.
+Dacă vă gândiți bine, rezumarea textului este o sarcină similară cu machine translation: avem un corp de text, cum ar fi o recenzie, pe care am dori să o "traducem" într-o versiune mai scurtă care să capteze caracteristicile principale ale datelor de intrare. În consecință, majoritatea modelelor Transformer pentru rezumare adoptă arhitectura codificator-decodificator pe care am întâlnit-o pentru prima dată în [Capitolul 1](/course/chapter1), deși există unele excepții, cum ar fi familia de modele GPT, care poate fi, de asemenea, utilizată pentru rezumare în few-shot settings. Tabelul de mai jos enumeră câteva modele preantrenate populare care pot fi ajustate pentru sumarizare.
 
 | Transformer model | Description                                                                                                                                                                                                    | Multilingual? |
 | :---------: | -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | :-----------: |
-|    [GPT-2](https://huggingface.co/gpt2-xl)    | Although trained as an auto-regressive language model, you can make GPT-2 generate summaries by appending "TL;DR" at the end of the input text.                                                                          |      ❌       |
-|   [PEGASUS](https://huggingface.co/google/pegasus-large)   | Uses a pretraining objective to predict masked sentences in multi-sentence texts. This pretraining objective is closer to summarization than vanilla language modeling and scores highly on popular benchmarks. |      ❌       |
-|     [T5](https://huggingface.co/t5-base)      | A universal Transformer architecture that formulates all tasks in a text-to-text framework; e.g., the input format for the model to summarize a document is `summarize: ARTICLE`.                              |      ❌       |
-|     [mT5](https://huggingface.co/google/mt5-base)     | A multilingual version of T5, pretrained on the multilingual Common Crawl corpus (mC4), covering 101 languages.                                                                                                |      ✅       |
-|    [BART](https://huggingface.co/facebook/bart-base)     | A novel Transformer architecture with both an encoder and a decoder stack trained to reconstruct corrupted input that combines the pretraining schemes of BERT and GPT-2.                                    |      ❌       |
-|  [mBART-50](https://huggingface.co/facebook/mbart-large-50)   | A multilingual version of BART, pretrained on 50 languages.                                                                                                                                                     |      ✅       |
+|    [GPT-2](https://huggingface.co/gpt2-xl)    | Deși este antrenat ca un model lingvistic autoregresiv, puteți face GPT-2 să genereze rezumate prin adăugarea "TL;DR" la sfârșitul textului de intrare.                                                                          |      ❌       |
+|   [PEGASUS](https://huggingface.co/google/pegasus-large)   | Utilizează un obiectiv de preantrenare pentru a prezice propoziții mascate în texte cu mai multe propoziții. Acest obiectiv de preantrenare este mai apropiat de rezumare decât de vanilla language modeling și obține scoruri ridicate la standardele populare. |      ❌       |
+|     [T5](https://huggingface.co/t5-base)      | O arhitectură Transformer universală care formulează toate sarcinile într-un framework text-text; de exemplu, formatul de intrare pentru modelul de rezumare a unui document este `summarize: ARTICOL`.                              |      ❌       |
+|     [mT5](https://huggingface.co/google/mt5-base)     | O versiune multilingvă a T5, preantrenată pe corpusul multilingv Common Crawl (mC4), care acoperă 101 limbi.                                                                                                |      ✅       |
+|    [BART](https://huggingface.co/facebook/bart-base)     | O nouă arhitectură Transformer cu un encoder și un stack de decodere antrenate pentru a reconstrui intrarea coruptă care combină schemele de preantrenare ale BERT și GPT-2.                                   |      ❌       |
+|  [mBART-50](https://huggingface.co/facebook/mbart-large-50)   | O versiune multilingvă a BART, preantrenată pe 50 de limbi.                                                                                                                                                     |      ✅       |
 
-As you can see from this table, the majority of Transformer models for summarization (and indeed most NLP tasks) are monolingual. This is great if your task is in a "high-resource" language like English or German, but less so for the thousands of other languages in use across the world. Fortunately, there is a class of multilingual Transformer models, like mT5 and mBART, that come to the rescue. These models are pretrained using language modeling, but with a twist: instead of training on a corpus of one language, they are trained jointly on texts in over 50 languages at once!
+După cum puteți vedea din acest tabel, majoritatea modelelor Transformer pentru rezumare (și, într-adevăr, majoritatea sarcinilor NLP) sunt monolingve. Acest lucru este grozav dacă sarcina voastrăeste într-o limbă cu  multe resurse precum engleza sau germana, dar mai puțin pentru miile de alte limbi utilizate în întreaga lume. Din fericire, există o clasă de modele Transformer multilingve, precum mT5 și mBART, care vin în ajutor. Aceste modele sunt preantrenate folosind modelarea limbajului, dar cu o întorsătură: în loc să fie antrenate pe un corpus dintr-o singură limbă, ele sunt antrenate împreună pe texte în peste 50 de limbi deodată!
 
-We'll focus on mT5, an interesting architecture based on T5 that was pretrained in a text-to-text framework. In T5, every NLP task is formulated in terms of a prompt prefix like `summarize:` which conditions the model to adapt the generated text to the prompt. As shown in the figure below, this makes T5 extremely versatile, as you can solve many tasks with a single model!
+Ne vom concentra asupra mT5, o arhitectură interesantă bazată pe T5, care a fost preantrenată într-un cadru text-to-text. În T5, fiecare sarcină NLP este formulată în termenii unui prompt prefix precum `summarize:` care condiționează modelul să adapteze textul generat la prompt. După cum se arată în figura de mai jos, acest lucru face T5 extrem de versatil, deoarece puteți rezolva multe sarcini cu un singur model!
 
 <div class="flex justify-center">
-<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/t5.svg" alt="Different tasks performed by the T5 architecture."/>
-<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/t5-dark.svg" alt="Different tasks performed by the T5 architecture."/>
+<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/t5.svg" alt="Diferite sarcini îndeplinite de arhitectura T5."/>
+<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/t5-dark.svg" alt="Diferite sarcini îndeplinite de arhitectura T5."/>
 </div>
 
-mT5 doesn't use prefixes, but shares much of the versatility of T5 and has the advantage of being multilingual. Now that we've picked a model, let's take a look at preparing our data for training.
+mT5 nu utilizează prefixe, dar împărtășește o mare parte din versatilitatea T5 și are avantajul de a fi multilingv. Acum că am ales un model, să aruncăm o privire la pregătirea datelor noastre pentru antrenare.
 
 
 <Tip>
 
-✏️ **Try it out!** Once you've worked through this section, see how well mT5 compares to mBART by fine-tuning the latter with the same techniques. For bonus points, you can also try fine-tuning T5 on just the English reviews. Since T5 has a special prefix prompt, you'll need to prepend `summarize:` to the input examples in the preprocessing steps below.
+✏️ **Încercați!** După ce ați parcurs această secțiune, vedeți cât de bine se compară mT5 cu mBART prin aplicarea fine-tuningului acestuia din urmă cu aceleași tehnici. Pentru puncte bonus, puteți încerca, de asemenea, fine-tuningul a T5 doar pe recenziile în limba engleză. Deoarece T5 are un prefix prompt special, va trebui să adăugați `summarize:` la exemplele de intrare în pașii de preprocesare de mai jos.
 
 </Tip>
 
@@ -238,7 +239,7 @@ mT5 doesn't use prefixes, but shares much of the versatility of T5 and has the a
 
 <Youtube id="1m7BerpSq8A"/>
 
-Our next task is to tokenize and encode our reviews and their titles. As usual, we begin by loading the tokenizer associated with the pretrained model checkpoint. We'll use `mt5-small` as our checkpoint so we can fine-tune the model in a reasonable amount of time:
+Următoarea noastră sarcină este să tokenizăm și să codificăm recenziile și titlurile acestora. Ca de obicei, începem prin încărcarea tokenizelui asociat cu checkpointul modelului preantrenat. Vom folosi `mt5-small` ca checkpoint, astfel încât să putem face fine-tune modelului într-un timp rezonabil:
 
 ```python
 from transformers import AutoTokenizer
@@ -249,11 +250,11 @@ tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
 
 <Tip>
 
-💡 In the early stages of your NLP projects, a good practice is to train a class of "small" models on a small sample of data. This allows you to debug and iterate faster toward an end-to-end workflow. Once you are confident in the results, you can always scale up the model by simply changing the model checkpoint!
+💡 În stadiile inițiale ale proiectelor NLP, o bună practică este de a antrena o clasă de modele "mici" pe un sample mic de date. Acest lucru vă permite să faceți debug și să iterați mai rapid către un flux de lucru end-to-end. Odată ce sunteți încrezător în rezultate, puteți oricând să măriți modelul prin simpla schimbare a checkpointului modelului!
 
 </Tip>
 
-Let's test out the mT5 tokenizer on a small example:
+Să testăm tokenizerul mT5 pe un mic exemplu:
 
 ```python
 inputs = tokenizer("I loved reading the Hunger Games!")
@@ -264,7 +265,7 @@ inputs
 {'input_ids': [336, 259, 28387, 11807, 287, 62893, 295, 12507, 1], 'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1, 1]}
 ```
 
-Here we can see the familiar `input_ids` and `attention_mask` that we encountered in our first fine-tuning experiments back in [Chapter 3](/course/chapter3). Let's decode these input IDs with the tokenizer's `convert_ids_to_tokens()` function to see what kind of tokenizer we're dealing with:
+Aici putem vedea binecunoscutele `input_ids` și `attention_mask` pe care le-am întâlnit în primele noastre experimente de fine-tuning în [Capitolul 3](/course/chapter3). Să decodificăm aceste ID-uri de intrare cu funcția `convert_ids_to_tokens()` a tokenizerului pentru a vedea cu ce fel de tokenizer avem de-a face:
 
 ```python
 tokenizer.convert_ids_to_tokens(inputs.input_ids)
@@ -274,9 +275,9 @@ tokenizer.convert_ids_to_tokens(inputs.input_ids)
 ['▁I', '▁', 'loved', '▁reading', '▁the', '▁Hung', 'er', '▁Games', '</s>']
 ```
 
-The special Unicode character `▁` and end-of-sequence token `</s>` indicate that we're dealing with the SentencePiece tokenizer, which is based on the Unigram segmentation algorithm discussed in [Chapter 6](/course/chapter6). Unigram is especially useful for multilingual corpora since it allows SentencePiece to be agnostic about accents, punctuation, and the fact that many languages, like Japanese, do not have whitespace characters.
+Caracterul Unicode special `▁` și tokenul de sfârșit de secvență `</s>` indică faptul că avem de-a face cu tokenizeerul SentencePiece, care se bazează pe algoritmul de segmentare Unigram discutat în [Capitolul 6](/course/chapter6). Unigram este deosebit de util pentru corpusurile multilingve, deoarece permite SentencePiece să fie agnostic în ceea ce privește accentele, punctuația și faptul că multe limbi, precum japoneza, nu au caractere de spațiu alb.
 
-To tokenize our corpus, we have to deal with a subtlety associated with summarization: because our labels are also text, it is possible that they exceed the model's maximum context size. This means we need to apply truncation to both the reviews and their titles to ensure we don't pass excessively long inputs to our model. The tokenizers in 🤗 Transformers provide a nifty `text_target` argument that allows you to tokenize the labels in parallel to the inputs. Here is an example of how the inputs and targets are processed for mT5:
+Pentru a tokeniza corpusul nostru, trebuie să ne ocupăm de o subtilitate asociată cu rezumarea: deoarece labelurile noastre sunt, de asemenea, text, este posibil ca acestea să depășească dimensiunea maximă a contextului modelului. Acest lucru înseamnă că trebuie să aplicăm trunchierea atât a recenziilor, cât și a titlurilor acestora, pentru a ne asigura că nu trecem inputuri excesiv de lungi modelului nostru. Tokenizerele din 🤗 Transformers oferă un argument ingenios, `text_target`,  care vă permite să tokenizați labelurile în paralel cu inputurile. Iată un exemplu al modului în care inputurile și targeturile sunt procesate pentru mT5:
 
 ```python
 max_input_length = 512
@@ -296,59 +297,60 @@ def preprocess_function(examples):
     return model_inputs
 ```
 
-Let's walk through this code to understand what's happening. The first thing we've done is define values for `max_input_length` and `max_target_length`, which set the upper limits for how long our reviews and titles can be. Since the review body is typically much larger than the title, we've scaled these values accordingly.
+Să parcurgem acest cod pentru a înțelege ce se întâmplă. Primul lucru pe care l-am făcut a fost să definim valorile pentru `max_input_length` și `max_target_length`, care stabilesc limitele superioare pentru cât de lungi pot fi recenziile și titlurile noastre. Deoarece corpul recenziei este de obicei mult mai mare decât titlul, am mărit aceste valori în consecință.
 
-With `preprocess_function()`, it is then a simple matter to tokenize the whole corpus using the handy `Dataset.map()` function we've used extensively throughout this course:
+Cu ajutorul funcției `preprocess_function()`, este simplu să tokenizăm întregul corpus cu ajutorul funcției practice `Dataset.map()` pe care am folosit-o la greu pe parcursul acestui curs:
 
 ```python
 tokenized_datasets = books_dataset.map(preprocess_function, batched=True)
 ```
 
-Now that the corpus has been preprocessed, let's take a look at some metrics that are commonly used for summarization. As we'll see, there is no silver bullet when it comes to measuring the quality of machine-generated text.
+Acum că corpusul a fost preprocesat, să aruncăm o privire asupra unor metrici care sunt utilizate în mod obișnuit pentru sumarizare. După cum vom vedea, nu există un glonț de argint atunci când vine vorba de măsurarea calității textului generat de calculator.
 
 <Tip>
 
-💡 You may have noticed that we used `batched=True` in our `Dataset.map()` function above. This encodes the examples in batches of 1,000 (the default) and allows you to make use of the multithreading capabilities of the fast tokenizers in 🤗 Transformers. Where possible, try using `batched=True` to get the most out of your preprocessing!
+💡 Poate ați observat că am folosit `batched=True` în funcția noastră `Dataset.map()` de mai sus. Aceasta codifică exemplele în batchuri de 1.000 (implicit) și vă permite să utilizați capacitățile multithreading ale tokenizerilor rapizi din 🤗 Transformers. Atunci când este posibil, încercați să utilizați `batched=True` pentru a profita la maximum de preprocesare!
 
 </Tip>
 
 
-## Metrics for text summarization[[metrics-for-text-summarization]]
+## Metrice pentru sumarizare[[metrics-for-text-summarization]]
 
 <Youtube id="TMshhnrEXlg"/>
 
-In comparison to most of the other tasks we've covered in this course, measuring the performance of text generation tasks like summarization or translation is not as straightforward. For example, given a review like "I loved reading the Hunger Games", there are multiple valid summaries, like "I loved the Hunger Games" or "Hunger Games is a great read". Clearly, applying some sort of exact match between the generated summary and the label is not a good solution -- even humans would fare poorly under such a metric, because we all have our own writing style.
+În comparație cu majoritatea celorlalte sarcini pe care le-am abordat în acest curs, măsurarea performanței sarcinilor de generare a textului, precum sumarizare sau traducerea, nu este la fel de simplă. De exemplu, având în vedere o recenzie precum "Mi-a plăcut să citesc Hunger Games", există mai multe rezumate valide, precum "Mi-a plăcut Hunger Games" sau "Hunger Games este o lectură excelentă". În mod clar, aplicarea unui exact match între rezumatul generat și label nu este o soluție bună - chiar și oamenii s-ar descurca prost cu un astfel de metric, deoarece toți avem propriul nostru stil de scriere.
 
-For summarization, one of the most commonly used metrics is the [ROUGE score](https://en.wikipedia.org/wiki/ROUGE_(metric)) (short for Recall-Oriented Understudy for Gisting Evaluation). The basic idea behind this metric is to compare a generated summary against a set of reference summaries that are typically created by humans. To make this more precise, suppose we want to compare the following two summaries:
+Pentru rezumare, una dintre cele mai frecvent utilizate metrici este [ROUGE score](https://en.wikipedia.org/wiki/ROUGE_(metric)) (prescurtarea de la Recall-Oriented Understudy for Gisting Evaluation). Ideea de bază din spatele acestei metrici este de a compara un rezumat generat cu un set de rezumate de referință care sunt de obicei create de oameni. Pentru a face acest lucru mai precis, să presupunem că dorim să comparăm următoarele două rezumate:
 
 ```python
 generated_summary = "I absolutely loved reading the Hunger Games"
 reference_summary = "I loved reading the Hunger Games"
 ```
 
-One way to compare them could be to count the number of overlapping words, which in this case would be 6. However, this is a bit crude, so instead ROUGE is based on computing the _precision_ and _recall_ scores for the overlap.
+O modalitate de a le compara ar fi să numărați numărul de cuvinte care se suprapun, care în acest caz ar fi 6. Cu toate acestea, acest lucru este un pic crud, astfel încât, în schimb, ROUGE se bazează pe calcularea scorurilor _preicision_ și _recall_ pentru suprapunere.
 
 <Tip>
 
-🙋 Don't worry if this is the first time you've heard of precision and recall -- we'll go through some explicit examples together to make it all clear. These metrics are usually encountered in classification tasks, so if you want to understand how precision and recall are defined in that context, we recommend checking out the `scikit-learn` [guides](https://scikit-learn.org/stable/auto_examples/model_selection/plot_precision_recall.html).
+🙋 Nu vă faceți griji dacă aceasta este prima dată când auziți de precision și recall - vom trece împreună prin câteva exemple explicite pentru a clarifica totul. Aceste metrici sunt de obicei întâlnite în sarcinile de clasificare, deci dacă doriți să înțelegeți cum sunt definite precizia și recallul în acest context, vă recomandăm să consultați [ghidurile `scikit-learn`] (https://scikit-learn.org/stable/auto_examples/model_selection/plot_precision_recall.html).
 
 </Tip>
 
-For ROUGE, recall measures how much of the reference summary is captured by the generated one. If we are just comparing words, recall can be calculated according to the following formula:
+Pentru ROUGE, recall măsoară cât de mult din rezumatul de referință este capturat de cel generat. Dacă comparăm doar cuvinte, recall poate fi calculată conform următoarei formule:
 
 $$ \mathrm{Recall} = \frac{\mathrm{Number\,of\,overlapping\, words}}{\mathrm{Total\, number\, of\, words\, in\, reference\, summary}} $$
 
-For our simple example above, this formula gives a perfect recall of 6/6 = 1; i.e., all the words in the reference summary have been produced by the model. This may sound great, but imagine if our generated summary had been "I really really loved reading the Hunger Games all night". This would also have perfect recall, but is arguably a worse summary since it is verbose. To deal with these scenarios we also compute the precision, which in the ROUGE context measures how much of the generated summary was relevant:
+Pentru exemplul nostru simplu de mai sus, această formulă oferă un recall perfect de 6/6 = 1; adică, toate cuvintele din rezumatul de referință au fost produse de model. Acest lucru poate părea grozav, dar imaginați-vă dacă rezumatul nostru generat ar fi fost "Mi-a plăcut foarte mult să citesc Jocurile Foamei toată noaptea". Aceasta ar avea, de asemenea, o reamintire perfectă, dar este, fără îndoială, un rezumat mai prost, deoarece are mai multe cuvinte. Pentru a face față acestor scenarii, calculăm și precizia, care, în contextul ROUGE, măsoară cât de mult din rezumatul generat a fost relevant:
+
 
 $$ \mathrm{Precision} = \frac{\mathrm{Number\,of\,overlapping\, words}}{\mathrm{Total\, number\, of\, words\, in\, generated\, summary}} $$
 
-Applying this to our verbose summary gives a precision of 6/10  = 0.6, which is considerably worse than the precision of 6/7 = 0.86 obtained by our shorter one. In practice, both precision and recall are usually computed, and then the F1-score (the harmonic mean of precision and recall) is reported. We can do this easily in 🤗 Datasets by first installing the `rouge_score` package:
+Aplicând acest lucru la rezumatul nostru cu mai multe cuvinte, se obține o precizie de 6/10 = 0,6, ceea ce este considerabil mai rău decât precizia de 6/7 = 0,86 obținută de rezumatul nostru mai scurt. În practică, se calculează de obicei atât precision, cât și recallul, iar apoi se raportează scorul F1 (media armonică a precision și recall). Putem face acest lucru cu ușurință în 🤗 Datasets instalând mai întâi biblioteca `rouge_score`:
 
 ```py
 !pip install rouge_score
 ```
 
-and then loading the ROUGE metric as follows:
+și apoi încărcând metrica ROUGE după cum urmează:
 
 ```python
 import evaluate
@@ -356,7 +358,7 @@ import evaluate
 rouge_score = evaluate.load("rouge")
 ```
 
-Then we can use the `rouge_score.compute()` function to calculate all the metrics at once:
+Apoi, putem utiliza funcția `rouge_score.compute()` pentru a calcula toate metricile odată:
 
 ```python
 scores = rouge_score.compute(
@@ -372,7 +374,7 @@ scores
  'rougeLsum': AggregateScore(low=Score(precision=0.86, recall=1.0, fmeasure=0.92), mid=Score(precision=0.86, recall=1.0, fmeasure=0.92), high=Score(precision=0.86, recall=1.0, fmeasure=0.92))}
 ```
 
-Whoa, there's a lot of information in that output -- what does it all mean? First, 🤗 Datasets actually computes confidence intervals for precision, recall, and F1-score; these are the `low`, `mid`, and `high` attributes you can see here. Moreover, 🤗 Datasets computes a variety of ROUGE scores which are based on different types of text granularity when comparing the generated and reference summaries. The `rouge1` variant is the overlap of unigrams -- this is just a fancy way of saying the overlap of words and is exactly the metric we've discussed above. To verify this, let's pull out the `mid` value of our scores:
+Whoa, există o mulțime de informații în aceast output - ce înseamnă toate acestea? În primul rând, 🤗 Datasets calculează de fapt confidence intervalurile pentru precision, recall și scorul F1; acestea sunt atributele `low`, `mid` și `high` pe care le puteți vedea aici. În plus, 🤗 Datasets calculează o varietate de scoruri ROUGE care se bazează pe diferite tipuri de granularitate a textului atunci când compară rezumatele generate și de referință. Varianta `rouge1` este suprapunerea unigramelor - acesta este doar un mod elegant de a spune suprapunerea cuvintelor și este exact metrica pe care am discutat-o mai sus. Pentru a verifica acest lucru, să extragem valoarea `mid` a scorurilor noastre:
 
 ```python
 scores["rouge1"].mid
@@ -382,25 +384,25 @@ scores["rouge1"].mid
 Score(precision=0.86, recall=1.0, fmeasure=0.92)
 ```
 
-Great, the precision and recall numbers match up! Now what about those other ROUGE scores? `rouge2` measures the overlap between bigrams (think the overlap of pairs of words), while `rougeL` and `rougeLsum` measure the longest matching sequences of words by looking for the longest common substrings in the generated and reference summaries. The "sum" in `rougeLsum` refers to the fact that this metric is computed over a whole summary, while `rougeL` is computed as the average over individual sentences.
+Grozav, numerele de precision și de recall se potrivesc! Acum ce se întâmplă cu celelalte scoruri ROUGE? `rouge2` măsoară suprapunerea dintre bigrame (suprapunerea perechilor de cuvinte), în timp ce `rougeL` și `rougeLsum` măsoară cele mai lungi secvențe de cuvinte care se potrivesc, căutând cele mai lungi substraturi comune în rezumatele generate și de referință. Termenul "sum" din `rougeLsum` se referă la faptul că această metrică este calculată pentru un rezumat întreg, în timp ce `rougeL` este calculată ca medie a propozițiilor individuale.
 
 <Tip>
 
-✏️ **Try it out!** Create your own example of a generated and reference summary and see if the resulting ROUGE scores agree with a manual calculation based on the formulas for precision and recall. For bonus points, split the text into bigrams and compare the precision and recall for the `rouge2` metric.
+✏️ **Încercați!** Creați propriul exemplu de rezumat generat și de referință și vedeți dacă scorurile ROUGE rezultate sunt în concordanță cu un calcul manual bazat pe formulele de precision și recall. Pentru puncte bonus, împărțiți textul în bigrame și comparați precizia și recallul pentru metrica `rouge2`.
 
 </Tip>
 
-We'll use these ROUGE scores to track the performance of our model, but before doing that let's do something every good NLP practitioner should do: create a strong, yet simple baseline!
+Vom folosi aceste scoruri ROUGE pentru a urmări performanța modelului nostru, dar înainte de a face acest lucru, să facem ceva ce orice bun practician NLP ar trebui să facă: să creăm un baseline puternic, dar simplu!
 
-### Creating a strong baseline[[creating-a-strong-baseline]]
+### Crearea unui baseline bun[[creating-a-strong-baseline]]
 
-A common baseline for text summarization is to simply take the first three sentences of an article, often called the _lead-3_ baseline. We could use full stops to track the sentence boundaries, but this will fail on acronyms like "U.S." or "U.N." -- so instead we'll use the `nltk` library, which includes a better algorithm to handle these cases. You can install the package using `pip` as follows:
+un baseline obișnuit pentru rezumarea textului este de a lua pur și simplu primele trei propoziții ale unui articol, adesea numit _lead-3_ baseline. Am putea folosi puncte de oprire pentru a urmări limitele propoziției, dar acest lucru va eșua în cazul acronimelor precum "U.S." sau "U.N." - așa că vom folosi în schimb biblioteca `nltk`, care include un algoritm mai bun pentru a gestiona aceste cazuri. Puteți instala pachetul folosind `pip` după cum urmează:
 
 ```python
 !pip install nltk
 ```
 
-and then download the punctuation rules:
+și apoi descărcați regulile de punctuație:
 
 ```python
 import nltk
@@ -408,7 +410,7 @@ import nltk
 nltk.download("punkt")
 ```
 
-Next, we import the sentence tokenizer from `nltk` and create a simple function to extract the first three sentences in a review. The convention in text summarization is to separate each summary with a newline, so let's also include this and test it on a training example:
+În continuare, importăm tokenizerul de propoziții din `nltk` și creăm o funcție simplă pentru a extrage primele trei propoziții dintr-o recenzie. Convenția în rezumarea textului este de a separa fiecare rezumat cu o linie nouă, deci să includem și aceasta și să o testăm pe un exemplu de antrenare:
 
 ```python
 from nltk.tokenize import sent_tokenize
@@ -427,7 +429,7 @@ print(three_sentence_summary(books_dataset["train"][1]["review_body"]))
 'She found Strangers.'
 ```
 
-This seems to work, so let's now implement a function that extracts these "summaries" from a dataset and computes the ROUGE scores for the baseline:
+Acest lucru pare să funcționeze, deci să implementăm acum o funcție care extrage aceste "rezumate" dintr-un dataset și calculează scorurile ROUGE pentru baseline:
 
 ```python
 def evaluate_baseline(dataset, metric):
@@ -435,7 +437,7 @@ def evaluate_baseline(dataset, metric):
     return metric.compute(predictions=summaries, references=dataset["review_title"])
 ```
 
-We can then use this function to compute the ROUGE scores over the validation set and prettify them a bit using Pandas:
+Putem folosi apoi această funcție pentru a calcula scorurile ROUGE pe setul de validare și pentru a le înfrumuseța puțin folosind Pandas:
 
 ```python
 import pandas as pd
@@ -450,13 +452,13 @@ rouge_dict
 {'rouge1': 16.74, 'rouge2': 8.83, 'rougeL': 15.6, 'rougeLsum': 15.96}
 ```
 
-We can see that the `rouge2` score is significantly lower than the rest; this likely reflects the fact that review titles are typically concise and so the lead-3 baseline is too verbose. Now that we have a good baseline to work from, let's turn our attention toward fine-tuning mT5!
+Putem vedea că scorul `rouge2` este semnificativ mai mic decât restul; acest lucru reflectă probabil faptul că titlurile recenziilor sunt de obicei concise și, prin urmare, baselineul lead-3 are prea multe cuvinte. Acum, că avem un baseline bun de lucru, să ne îndreptăm atenția către fine-tuningul mT5!
 
 {#if fw === 'pt'}
 
-## Fine-tuning mT5 with the `Trainer` API[[fine-tuning-mt5-with-the-trainer-api]]
+## Fine-tuningul mT5 cu API-ul `Trainer`[[fine-tuning-mt5-with-the-trainer-api]]
 
-Fine-tuning a model for summarization is very similar to the other tasks we've covered in this chapter. The first thing we need to do is load the pretrained model from the `mt5-small` checkpoint. Since summarization is a sequence-to-sequence task, we can load the model with the `AutoModelForSeq2SeqLM` class, which will automatically download and cache the weights:
+Fine-tuningul unui model pentru rezumare este foarte asemănător cu celelalte sarcini pe care le-am acoperit în acest capitol. Primul lucru pe care trebuie să îl facem este să încărcăm modelul preantrenat din checkpointul `mt5-small`. Deoarece sumarizarea este o sarcină de la secvență la secvență, putem încărca modelul cu clasa `AutoModelForSeq2SeqLM`, care va descărca automat și va stoca în cache weighturile:
 
 ```python
 from transformers import AutoModelForSeq2SeqLM
@@ -466,9 +468,9 @@ model = AutoModelForSeq2SeqLM.from_pretrained(model_checkpoint)
 
 {:else}
 
-## Fine-tuning mT5 with Keras[[fine-tuning-mt5-with-keras]]
+## Fine-tuningul mT5 cu Keras[[fine-tuning-mt5-with-keras]]
 
-Fine-tuning a model for summarization is very similar to the other tasks we've covered in this chapter. The first thing we need to do is load the pretrained model from the `mt5-small` checkpoint. Since summarization is a sequence-to-sequence task, we can load the model with the `TFAutoModelForSeq2SeqLM` class, which will automatically download and cache the weights:
+Fine-tuningul unui model pentru sumarizare este foarte asemănătoare cu celelalte sarcini pe care le-am acoperit în acest capitol. Primul lucru pe care trebuie să îl facem este să încărcăm modelul preantrenat din punctul de control `mt5-small`. Deoarece rezumarea este o sarcină de la secvență la secvență, putem încărca modelul cu clasa `TFAutoModelForSeq2SeqLM`, care va descărca și va stoca în cache weighturile:
 
 ```python
 from transformers import TFAutoModelForSeq2SeqLM
@@ -480,11 +482,11 @@ model = TFAutoModelForSeq2SeqLM.from_pretrained(model_checkpoint)
 
 <Tip>
 
-💡 If you're wondering why you don't see any warnings about fine-tuning the model on a downstream task, that's because for sequence-to-sequence tasks we keep all the weights of the network. Compare this to our text classification model in [Chapter 3](/course/chapter3), where the head of the pretrained model was replaced with a randomly initialized network.
+💡 Dacă vă întrebați de ce nu vedeți niciun avertisment cu privire la fine-tuningul modelului pe un downstream task, acest lucru se datorează faptului că pentru sarcinile secvență-la-secvență păstrăm toate weighturile rețelei. Comparați acest lucru cu modelul nostru de clasificare a textului din [Capitolul 3](/course/chapter3), unde headul modelului preantrenat a fost înlocuit cu o rețea inițializată aleatoriu.
 
 </Tip>
 
-The next thing we need to do is log in to the Hugging Face Hub. If you're running this code in a notebook, you can do so with the following utility function:
+Următorul lucru pe care trebuie să îl facem este să ne conectăm la Hugging Face Hub. Dacă executați acest cod într-un notebook, puteți face acest lucru cu următoarea funcție:
 
 ```python
 from huggingface_hub import notebook_login
@@ -492,7 +494,7 @@ from huggingface_hub import notebook_login
 notebook_login()
 ```
 
-which will display a widget where you can enter your credentials. Alternatively, you can run this command in your terminal and log in there:
+care va afișa un widget în care puteți introduce credențialele. Alternativ, puteți rula această comandă în terminal și să vă conectați acolo:
 
 ```
 huggingface-cli login
@@ -500,7 +502,7 @@ huggingface-cli login
 
 {#if fw === 'pt'}
 
-We'll need to generate summaries in order to compute ROUGE scores during training. Fortunately, 🤗 Transformers provides dedicated `Seq2SeqTrainingArguments` and `Seq2SeqTrainer` classes that can do this for us automatically! To see how this works, let's first define the hyperparameters and other arguments for our experiments:
+Va trebui să generăm rezumate pentru a calcula scorurile ROUGE în timpul antrenării. Din fericire, 🤗 Transformers oferă clase dedicate `Seq2SeqTrainingArguments` și `Seq2SeqTrainer` care pot face acest lucru pentru noi în mod automat! Pentru a vedea cum funcționează acest lucru, să definim mai întâi hiperparametrii și alte argumente pentru experimentele noastre:
 
 ```python
 from transformers import Seq2SeqTrainingArguments
@@ -526,11 +528,11 @@ args = Seq2SeqTrainingArguments(
 )
 ```
 
-Here, the `predict_with_generate` argument has been set to indicate that we should generate summaries during evaluation so that we can compute ROUGE scores for each epoch. As discussed in [Chapter 1](/course/chapter1), the decoder performs inference by predicting tokens one by one, and this is implemented by the model's `generate()` method. Setting `predict_with_generate=True` tells the `Seq2SeqTrainer` to use that method for evaluation. We've also adjusted some of the default hyperparameters, like the learning rate, number of epochs, and weight decay, and we've set the `save_total_limit` option to only save up to 3 checkpoints during training -- this is because even the "small" version of mT5 uses around a GB of hard drive space, and we can save a bit of room by limiting the number of copies we save.
+Aici, argumentul `predict_with_generate` a fost setat pentru a indica faptul că ar trebui să generăm rezumate în timpul evaluării, astfel încât să putem calcula scorurile ROUGE pentru fiecare epocă. După cum s-a discutat în [Capitolul 1](/course/chapter1), decodificatorul realizează inference-ul prin prezicerea tokenilor unul câte unul, iar acest lucru este implementat de metoda `generate()` a modelului. Setarea `predict_with_generate=True` îi spune lui `Seq2SeqTrainer` să utilizeze această metodă pentru evaluare. Am ajustat, de asemenea, unii dintre hiperparametrii impliciți, cum ar fi rata de învățare, numărul de epoci și scăderea weighturilor și am setat opțiunea `save_total_limit` pentru a salva numai până la 3 checkpointuri în timpul antrenamentului - acest lucru se datorează faptului că chiar și versiunea "mică" a mT5 utilizează aproximativ 1 GB de spațiu pe hard disk și putem economisi puțin spațiu prin limitarea numărului de copii salvate.
 
-The `push_to_hub=True` argument will allow us to push the model to the Hub after training; you'll find the repository under your user profile in the location defined by `output_dir`. Note that you can specify the name of the repository you want to push to with the `hub_model_id` argument (in particular, you will have to use this argument to push to an organization). For instance, when we pushed the model to the [`huggingface-course` organization](https://huggingface.co/huggingface-course), we added `hub_model_id="huggingface-course/mt5-finetuned-amazon-en-es"` to `Seq2SeqTrainingArguments`.
+Argumentul `push_to_hub=True` ne va permite să trimitem modelul în Hub după antrenare; veți găsi repositoriul în profilul vostru de utilizator, în locația definită de `output_dir`. Rețineți că puteți specifica numele repositoriului către care doriți să trimiteți modelul cu argumentul `hub_model_id` (în special, va trebui să utilizați acest argument pentru a trimite modelul către o organizație). De exemplu, atunci când am trimis modelul către organizația [`huggingface-course`](https://huggingface.co/huggingface-course), am adăugat `hub_model_id="huggingface-course/mt5-finetuned-amazon-en-es"` la `Seq2SeqTrainingArguments`.
 
-The next thing we need to do is provide the trainer with a `compute_metrics()` function so that we can evaluate our model during training. For summarization this is a bit more involved than simply calling `rouge_score.compute()` on the model's predictions, since we need to _decode_ the outputs and labels into text before we can compute the ROUGE scores. The following function does exactly that, and also makes use of the `sent_tokenize()` function from `nltk` to separate the summary sentences with newlines:
+Următorul lucru pe care trebuie să îl facem este să oferim trainerului o funcție `compute_metrics()`, astfel încât să ne putem evalua modelul în timpul antrenării. Pentru sumarizare, acest lucru este un pic mai complicat decât simpla apelare a funcției `rouge_score.compute()` pentru predicțiile modelului, deoarece trebuie să _decodăm_ rezultatele și labelurile din text înainte de a putea calcula scorurile ROUGE. Următoarea funcție face exact acest lucru și, de asemenea, utilizează funcția `sent_tokenize()` din `nltk` pentru a separa propozițiile rezumate cu linii noi:
 
 ```python
 import numpy as np
@@ -558,9 +560,9 @@ def compute_metrics(eval_pred):
 
 {/if}
 
-Next, we need to define a data collator for our sequence-to-sequence task. Since mT5 is an encoder-decoder Transformer model, one subtlety with preparing our batches is that during decoding we need to shift the labels to the right by one. This is required to ensure that the decoder only sees the previous ground truth labels and not the current or future ones, which would be easy for the model to memorize. This is similar to how masked self-attention is applied to the inputs in a task like [causal language modeling](/course/chapter7/6).
+În continuare, trebuie să definim un data collator pentru sarcina noastră secvență-la-secvență. Deoarece mT5 este un transformer model encoder-decoder, o subtilitate a pregătirii batch-urilor noastre este că, în timpul decodificării, trebuie să deplasăm labelurile la dreapta cu una. Acest lucru este necesar pentru a ne asigura că decodificatorul vede doar labelurile anterioare ale adevărului de bază și nu pe cele actuale sau viitoare, care ar fi ușor de memorat de către model. Acest lucru este similar cu modul în care masked self-attention este aplicată inputurilor într-o sarcină precum [causal language modeling](/course/chapter7/6).
 
-Luckily, 🤗 Transformers provides a `DataCollatorForSeq2Seq` collator that will dynamically pad the inputs and the labels for us. To instantiate this collator, we simply need to provide the `tokenizer` and `model`:
+Din fericire, 🤗 Transformers oferă un collator `DataCollatorForSeq2Seq` care va face padding dinamic inputurilor și labelurilor pentru noi. Pentru a inițializa acest collator, trebuie doar să furnizăm `tokenizer` și `model`:
 
 {#if fw === 'pt'}
 
@@ -580,7 +582,7 @@ data_collator = DataCollatorForSeq2Seq(tokenizer, model=model, return_tensors="t
 
 {/if}
 
-Let's see what this collator produces when fed a small batch of examples. First, we need to remove the columns with strings because the collator won't know how to pad these elements:
+Să vedem ce produce acest collator atunci când este alimentat cu un mic batch de exemple. În primul rând, trebuie să eliminăm coloanele cu șiruri de caractere, deoarece collatorul nu va ști cum să completeze aceste elemente:
 
 ```python
 tokenized_datasets = tokenized_datasets.remove_columns(
@@ -588,7 +590,7 @@ tokenized_datasets = tokenized_datasets.remove_columns(
 )
 ```
 
-Since the collator expects a list of `dict`s, where each `dict` represents a single example in the dataset, we also need to wrangle the data into the expected format before passing it to the data collator:
+Deoarece collatorul așteaptă o listă de `dict`, unde fiecare `dict` reprezintă un singur exemplu din dataset, trebuie să transformăm datele în formatul așteptat înainte de a le transmite data collatorului:
 
 ```python
 features = [tokenized_datasets["train"][i] for i in range(2)]
@@ -611,11 +613,11 @@ data_collator(features)
         [    0,   259, 27531, 13483,   259,  7505]])}
 ```
 
-The main thing to notice here is that the first example is longer than the second one, so the `input_ids` and `attention_mask` of the second example have been padded on the right with a `[PAD]` token (whose ID is `0`). Similarly, we can see that the `labels` have been padded with `-100`s, to make sure the padding tokens are ignored by the loss function. And finally, we can see a new `decoder_input_ids` which has shifted the labels to the right by inserting a `[PAD]` token in the first entry.
+Principalul lucru care trebuie observat aici este că primul exemplu este mai lung decât al doilea, astfel încât `input_ids` și `attention_mask` din al doilea exemplu au primit padding în dreapta cu un simbol `[PAD]` (al cărui ID este `0`). În mod similar, putem vedea că `labels` au primit padding cu `-100`, pentru a ne asigura că tokenii de padding sunt ignorați de funcția de pierdere. În sfârșit, putem vedea un nou `decoder_input_ids` care a deplasat labelurile spre dreapta prin inserarea unui simbol `[PAD]` în prima intrare.
 
 {#if fw === 'pt'}
 
-We finally have all the ingredients we need to train with! We now simply need to instantiate the trainer with the standard arguments:
+Avem în sfârșit toate ingredientele de care avem nevoie pentru a antrenare! Acum trebuie doar să inițializăm trainerul cu argumentele standard:
 
 ```python
 from transformers import Seq2SeqTrainer
@@ -631,13 +633,13 @@ trainer = Seq2SeqTrainer(
 )
 ```
 
-and launch our training run:
+și să lansăm cursa noastră de antrenare:
 
 ```python
 trainer.train()
 ```
 
-During training, you should see the training loss decrease and the ROUGE scores increase with each epoch. Once the training is complete, you can see the final ROUGE scores by running `Trainer.evaluate()`:
+În timpul antrenamentului, ar trebui să vedeți cum training loss scade și scorurile ROUGE cresc cu fiecare epocă. După ce antrenamentul este complet, puteți vedea scorurile ROUGE finale executând `Trainer.evaluate()`:
 
 ```python
 trainer.evaluate()
@@ -655,7 +657,7 @@ trainer.evaluate()
  'eval_steps_per_second': 4.914}
 ```
 
-From the scores we can see that our model has handily outperformed our lead-3 baseline -- nice! The final thing to do is push the model weights to the Hub, as follows:
+Din scorurile obținute, putem vedea că modelul nostru a depășit cu mult modelul nostru de bază lead-3 - frumos! Ultimul lucru de făcut este să introducem weighturile modelului în Hub, după cum urmează:
 
 ```
 trainer.push_to_hub(commit_message="Training complete", tags="summarization")
@@ -665,13 +667,13 @@ trainer.push_to_hub(commit_message="Training complete", tags="summarization")
 'https://huggingface.co/huggingface-course/mt5-finetuned-amazon-en-es/commit/aa0536b829b28e73e1e4b94b8a5aacec420d40e0'
 ```
 
-This will save the checkpoint and configuration files to `output_dir`, before uploading all the files to the Hub. By specifying the `tags` argument, we also ensure that the widget on the Hub will be one for a summarization pipeline instead of the default text generation one associated with the mT5 architecture (for more information about model tags, see the [🤗 Hub documentation](https://huggingface.co/docs/hub/main#how-is-a-models-type-of-inference-api-and-widget-determined)). The output from `trainer.push_to_hub()` is a URL to the Git commit hash, so you can easily see the changes that were made to the model repository!
+Acest lucru va salva checkpointul și fișierele de configurare în `output_dir`, înainte de a încărca toate fișierele în Hub. Specificând argumentul `tags`, ne asigurăm, de asemenea, că widgetul de pe Hub va fi unul pentru un pipeline de rezumare în locul celui implicit de generare de text asociat arhitecturii mT5 (pentru mai multe informații despre labelurile modelului, consultați [🤗Documentația Hub](https://huggingface.co/docs/hub/main#how-is-a-models-type-of-inference-api-and-widget-determined)). Rezultatul din `trainer.push_to_hub()` este o adresă URL către hash-ul Git commit, astfel încât să puteți vedea cu ușurință modificările care au fost făcute în repositoriul modelului!
 
-To wrap up this section, let's take a look at how we can also fine-tune mT5 using the low-level features provided by 🤗 Accelerate.
+Pentru a încheia această secțiune, să aruncăm o privire la modul în care putem, de asemenea, să facem fine-tune la mT5 folosind featururile de nivel scăzut oferite de 🤗 Accelerate.
 
 {:else}
 
-We're almost ready to train! We just need to convert our datasets to `tf.data.Dataset`s using the data collator we defined above, and then `compile()` and `fit()` the model. First, the datasets:
+Suntem aproape gata de antrenament! Trebuie doar să convertim dataseturile în `tf.data.Dataset`s folosind data collatorul pe care l-am definit mai sus, iar apoi aplicarea `compil()` și `fit()` modelul. Mai întâi, dataseturile:
 
 ```python
 tf_train_dataset = model.prepare_tf_dataset(
@@ -688,7 +690,7 @@ tf_eval_dataset = model.prepare_tf_dataset(
 )
 ```
 
-Now, we define our training hyperparameters and compile:
+Acum, ne definim hiperparametrii de antrenare și compilare:
 
 ```python
 from transformers import create_optimizer
@@ -714,7 +716,7 @@ model.compile(optimizer=optimizer)
 tf.keras.mixed_precision.set_global_policy("mixed_float16")
 ```
 
-And finally, we fit the model. We use a `PushToHubCallback` to save the model to the Hub after each epoch, which will allow us to use it for inference later:
+În cele din urmă, facem fit modelului modelului. Folosim un `PushToHubCallback` pentru a salva modelul în Hub după fiecare epocă, ceea ce ne va permite să îl folosim ulterior pentru inference:
 
 ```python
 from transformers.keras_callbacks import PushToHubCallback
@@ -728,7 +730,7 @@ model.fit(
 )
 ```
 
-We got some loss values during training, but really we'd like to see the ROUGE metrics we computed earlier. To get those metrics, we'll need to generate outputs from the model and convert them to strings. Let's build some lists of labels and predictions for the ROUGE metric to compare (note that if you get import errors for this section, you may need to`!pip install tqdm`). We're also going to use a trick that dramatically increases performance - compiling our generation code with [XLA](https://www.tensorflow.org/xla), TensorFlow's accelerated linear algebra compiler. XLA applies various optimizations to the model's computation graph, and results in significant improvements to speed and memory usage. As described in the Hugging Face [blog](https://huggingface.co/blog/tf-xla-generate), XLA works best when our input shapes don't vary too much. To handle this, we'll pad our inputs to multiples of 128, and make a new dataset with the padding collator, and then we'll apply the `@tf.function(jit_compile=True)` decorator to our generation function, which marks the whole function for compilation with XLA. 
+Am obținut unele valori ale pierderilor în timpul antrenării, dar am dori să vedem metricile ROUGE pe care le-am calculat mai devreme. Pentru a obține aceste metrici, va trebui să generăm outputuri din model și să le convertim în șiruri de caractere. Să construim câteva liste de labels și predicții pentru a compara metrica ROUGE (rețineți că, dacă obțineți erori de import pentru această secțiune, este posibil să fie necesar să faceți `!pip install tqdm`). De asemenea, vom utiliza un truc care crește dramatic performanța - compilarea codului nostru de generare cu [XLA](https://www.tensorflow.org/xla), compilatorul accelerat de algebră liniară al TensorFlow. XLA aplică diverse optimizări graficului de calcul al modelului și are ca rezultat îmbunătățiri semnificative ale vitezei și utilizării memoriei. După cum se descrie în [blogul Hugging Face](https://huggingface.co/blog/tf-xla-generate), XLA funcționează cel mai bine atunci când formele noastre de input nu variază prea mult. Pentru a face față acestui lucru, vom face padding inputurilor la multipli a 128 și vom crea un nou dataset cu padding collatorul, iar apoi vom aplica decoratorul `@tf.function(jit_compile=True)` funcției noastre de generare, care marchează întreaga funcție pentru compilare cu XLA.
 
 ```python
 from tqdm import tqdm
@@ -770,7 +772,7 @@ for batch, labels in tqdm(tf_generate_dataset):
     all_labels.extend(decoded_labels)
 ```
 
-Once we have our lists of label and prediction strings, computing the ROUGE score is easy:
+Odată ce avem listele noastre de labeluri și de șiruri de predicție, calcularea scorului ROUGE este ușoară:
 
 ```python
 result = rouge_score.compute(
@@ -789,25 +791,25 @@ result = {key: value.mid.fmeasure * 100 for key, value in result.items()}
 
 {#if fw === 'pt'}
 
-## Fine-tuning mT5 with 🤗 Accelerate[[fine-tuning-mt5-with-accelerate]]
+## Fine-tuningul mT5 cu 🤗 Accelerate[[fine-tuning-mt5-with-accelerate]]
 
-Fine-tuning our model with 🤗 Accelerate is very similar to the text classification example we encountered in [Chapter 3](/course/chapter3). The main differences will be the need to explicitly generate our summaries during training and define how we compute the ROUGE scores (recall that the `Seq2SeqTrainer` took care of the generation for us). Let's take a look how we can implement these two requirements within 🤗 Accelerate!
+Fine-tuningul nostru cu 🤗 Accelerate este foarte asemănător cu exemplul de clasificare a textului pe care l-am întâlnit în [Capitolul 3](/course/chapter3). Principalele diferențe vor fi necesitatea de a genera în mod explicit rezumatele noastre în timpul antrenării și de a defini modul în care calculăm scorurile ROUGE (reamintim că `Seq2SeqTrainer` a avut grijă de generare pentru noi). Să aruncăm o privire la modul în care putem implementa aceste două cerințe în cadrul 🤗 Accelerate!
 
-### Preparing everything for training[[preparing-everything-for-training]]
+### Pregătirea pentru antrenare[[preparing-everything-for-training]]
 
-The first thing we need to do is create a `DataLoader` for each of our splits. Since the PyTorch dataloaders expect batches of tensors, we need to set the format to `"torch"` in our datasets:
+Primul lucru pe care trebuie să-l facem este să creăm un `DataLoader` pentru fiecare dintre spliturile noastre. Deoarece dataloaders PyTorch așteaptă batchuri de tensori, trebuie să setăm formatul la `"torch"` în dataseturile noastre:
 
 ```python
 tokenized_datasets.set_format("torch")
 ```
 
-Now that we've got datasets consisting of just tensors, the next thing to do is instantiate the `DataCollatorForSeq2Seq` again. For this we need to provide a fresh version of the model, so let's load it again from our cache:
+Acum că avem dataseturi formate doar din tensori, următorul lucru este inițializarea `DataCollatorForSeq2Seq`. Pentru aceasta trebuie să furnizăm o versiune nouă a modelului, așa că hai să îl încărcăm din nou din cache:
 
 ```python
 model = AutoModelForSeq2SeqLM.from_pretrained(model_checkpoint)
 ```
 
-We can then instantiate the data collator and use this to define our dataloaders:
+Putem apoi să instanțiem data collatorul și să îl folosim pentru a ne defini dataloaders:
 
 ```python
 from torch.utils.data import DataLoader
@@ -824,7 +826,7 @@ eval_dataloader = DataLoader(
 )
 ```
 
-The next thing to do is define the optimizer we want to use. As in our other examples, we'll use `AdamW`, which works well for most problems:
+Următorul lucru este definirea optimizatorului pe care dorim să îl utilizăm. Ca și în celelalte exemple, vom folosi `AdamW`, care funcționează bine pentru majoritatea problemelor:
 
 ```python
 from torch.optim import AdamW
@@ -832,7 +834,7 @@ from torch.optim import AdamW
 optimizer = AdamW(model.parameters(), lr=2e-5)
 ```
 
-Finally, we feed our model, optimizer, and dataloaders to the `accelerator.prepare()` method:
+În cele din urmă, introducem modelul, optimizatorul și dataloaders în metoda `accelerator.prepare()`:
 
 ```python
 from accelerate import Accelerator
@@ -845,17 +847,17 @@ model, optimizer, train_dataloader, eval_dataloader = accelerator.prepare(
 
 <Tip>
 
-🚨 If you're training on a TPU, you'll need to move all the code above into a dedicated training function. See [Chapter 3](/course/chapter3) for more details.
+🚨 Dacă faceți antrenarea pe un TPU, va trebui să mutați tot codul de mai sus într-o funcție de antrenare aparte. Consultați [Capitolul 3](/course/chapter3) pentru mai multe detalii.
 
 </Tip>
 
-Now that we've prepared our objects, there are three remaining things to do:
+Acum că ne-am pregătit obiectele, mai avem trei lucruri de făcut:
 
-* Define the learning rate schedule.
-* Implement a function to post-process the summaries for evaluation.
-* Create a repository on the Hub that we can push our model to.
+* Definirea learning rate schedule.
+* Implementarea unei funcții de post-procesare a rezumatelor pentru evaluare.
+* Crearea unui repositoriu pe Hub în care să putem trimite modelul nostru.
 
-For the learning rate schedule, we'll use the standard linear one from previous sections:
+Pentru learning rate schedule, îl vom utiliza pe cel liniar standard din secțiunile anterioare:
 
 ```python
 from transformers import get_scheduler
@@ -872,7 +874,7 @@ lr_scheduler = get_scheduler(
 )
 ```
 
-For post-processing, we need a function that splits the generated summaries into sentences that are separated by newlines. This is the format the ROUGE metric expects, and we can achieve this with the following snippet of code:
+Pentru post-procesare, avem nevoie de o funcție care să împartă rezumatele generate în propoziții separate prin linii noi. Acesta este formatul pe care îl așteaptă metrica ROUGE, iar noi putem realiza acest lucru cu următorul fragment de cod:
 
 ```python
 def postprocess_text(preds, labels):
@@ -886,9 +888,9 @@ def postprocess_text(preds, labels):
     return preds, labels
 ```
 
-This should look familiar to you if you recall how we defined the `compute_metrics()` function of the `Seq2SeqTrainer`. 
+Acest lucru ar trebui să vă pară familiar dacă vă amintiți cum am definit funcția `compute_metrics()` a `Seq2SeqTrainer`.
 
-Finally, we need to create a model repository on the Hugging Face Hub. For this, we can use the appropriately titled 🤗 Hub library. We just need to define a name for our repository, and the library has a utility function to combine the repository ID with the user profile:
+În cele din urmă, trebuie să creăm un repositoriu de modele pe Hugging Face Hub. Pentru aceasta, putem utiliza biblioteca 🤗 Hub intitulată corespunzător . Trebuie doar să definim un nume pentru repositoriul nostru, iar biblioteca are o funcție utilitară pentru a combina ID-ul repositoriul cu profilul utilizatorului:
 
 ```python
 from huggingface_hub import get_full_repo_name
@@ -902,7 +904,7 @@ repo_name
 'lewtun/mt5-finetuned-amazon-en-es-accelerate'
 ```
 
-Now we can use this repository name to clone a local version to our results directory that will store the training artifacts:
+Acum putem folosi numele repositoriului pentru a clona o versiune locală în folderul nostru cu rezultate care va stoca artefactele de antrenare:
 
 ```python
 from huggingface_hub import Repository
@@ -911,18 +913,18 @@ output_dir = "results-mt5-finetuned-squad-accelerate"
 repo = Repository(output_dir, clone_from=repo_name)
 ```
 
-This will allow us to push the artifacts back to the Hub by calling the `repo.push_to_hub()` method during training! Let's now wrap up our analysis by writing out the training loop.
+Acest lucru ne va permite să trimitem artefactele înapoi la Hub prin apelarea metodei `repo.push_to_hub()` în timpul antrenării! Să încheiem acum analiza noastră prin scrierea buclei de antrenare.
 
-### Training loop[[training-loop]]
+### Bucla de antrenare[[training-loop]]
 
-The training loop for summarization is quite similar to the other 🤗 Accelerate examples that we've encountered and is roughly split into four main steps:
+Bucla de formare pentru sumarizare este destul de asemănătoare cu celelalte exemple 🤗 Accelerate pe care le-am întâlnit și este împărțită aproximativ în patru etape principale:
 
-1. Train the model by iterating over all the examples in `train_dataloader` for each epoch.
-2. Generate model summaries at the end of each epoch, by first generating the tokens and then decoding them (and the reference summaries) into text.
-3. Compute the ROUGE scores using the same techniques we saw earlier.
-4. Save the checkpoints and push everything to the Hub. Here we rely on the nifty `blocking=False` argument of the `Repository` object so that we can push the checkpoints per epoch _asynchronously_. This allows us to continue training without having to wait for the somewhat slow upload associated with a GB-sized model!
+1. Antrenarea modelului prin iterarea peste toate exemplele din `train_dataloader` pentru fiecare epocă.
+2. Generarea rezumatelor modelului la sfârșitul fiecărei epoci, mai întâi prin generarea token-urilor și apoi prin decodarea lor (și a rezumatelor de referință) în text.
+3. Calcularea scorurilor ROUGE folosind aceleași tehnici pe care le-am văzut mai devreme.
+4. Salvați checkpointurile și încărcați totul pe Hub. Aici ne bazăm pe argumentul `blocking=False` al obiectului `Repository` astfel încât să putem împinge checkointurile pentru fiecare epocă _asincron_. Acest lucru ne permite să continuăm antrenamentul fără a fi nevoiți să așteptăm încărcarea oarecum lentă asociată cu un model de dimensiunea unui GB!
 
-These steps can be seen in the following block of code:
+Acești pași pot fi observați în următorul bloc de cod:
 
 ```python
 from tqdm.auto import tqdm
@@ -1012,13 +1014,13 @@ Epoch 8: {'rouge1': 13.96, 'rouge2': 6.5998, 'rougeL': 13.9123, 'rougeLsum': 13.
 Epoch 9: {'rouge1': 14.1192, 'rouge2': 7.0059, 'rougeL': 14.1172, 'rougeLsum': 13.9509}
 ```
 
-And that's it! Once you run this, you'll have a model and results that are pretty similar to the ones we obtained with the `Trainer`.
+Și asta e tot! După ce executați acest lucru, veți avea un model și rezultate care sunt destul de asemănătoare cu cele obținute cu `Trainer`.
 
 {/if}
 
-## Using your fine-tuned model[[using-your-fine-tuned-model]]
+## Utilizarea modelului fine-tuned[[using-your-fine-tuned-model]]
 
-Once you've pushed the model to the Hub, you can play with it either via the inference widget or with a `pipeline` object, as follows:
+Odată ce ați încărcat modelul în Hub, vă puteți juca cu el prin widgetul de inference, fie cu un obiect `pipeline`, după cum urmează:
 
 ```python
 from transformers import pipeline
@@ -1027,7 +1029,7 @@ hub_model_id = "huggingface-course/mt5-small-finetuned-amazon-en-es"
 summarizer = pipeline("summarization", model=hub_model_id)
 ```
 
-We can feed some examples from the test set (which the model has not seen) to our pipeline to get a feel for the quality of the summaries. First let's implement a simple function to show the review, title, and generated summary together:
+Putem introduce câteva exemple din setul de testare (pe care modelul nu le-a văzut) în pipelineul noastru pentru a avea o idee despre calitatea rezumatelor. Mai întâi, să implementăm o funcție simplă pentru a afișa împreună recenzia, titlul și rezumatul generat:
 
 ```python
 def print_summary(idx):
@@ -1039,7 +1041,7 @@ def print_summary(idx):
     print(f"\n'>>> Summary: {summary}'")
 ```
 
-Let's take a look at one of the English examples we get:
+Să aruncăm o privire la unul dintre exemplele englezești pe care le primim:
 
 ```python
 print_summary(100)
@@ -1067,6 +1069,6 @@ print_summary(0)
 '>>> Summary: Muy facil de leer'
 ```
 
-The summary translates into "Very easy to read" in English, which we can see in this case was extracted directly from the review. Nevertheless, this shows the versatility of the mT5 model and has given you a taste of what it's like to deal with a multilingual corpus!
+Rezumatul se traduce prin "Very easy to read" în limba engleză, ceea ce putem vedea că în acest caz a fost extras direct din recenzie. Cu toate acestea, acest lucru arată versatilitatea modelului mT5 și v-a dat o idee despre cum este să aveți de-a face cu un corpus multilingv!
 
-Next, we'll turn our attention to a slightly more complex task: training a language model from scratch.
+În continuare, ne vom îndrepta atenția către o sarcină puțin mai complexă: antrenarea unui model lingvistic de la zero.
\ No newline at end of file
diff --git a/chapters/ro/chapter7/6.mdx b/chapters/ro/chapter7/6.mdx
index 44551f15d..c47f46030 100644
--- a/chapters/ro/chapter7/6.mdx
+++ b/chapters/ro/chapter7/6.mdx
@@ -1,6 +1,6 @@
 <FrameworkSwitchCourse {fw} />
 
-# Training a causal language model from scratch[[training-a-causal-language-model-from-scratch]]
+# Antrenarea unui model de limbaj cauzal de la zero[[training-a-causal-language-model-from-scratch]]
 
 {#if fw === 'pt'}
 
@@ -22,23 +22,23 @@
 
 {/if}
 
-Up until now, we've mostly been using pretrained models and fine-tuning them for new use cases by reusing the weights from pretraining. As we saw in [Chapter 1](/course/chapter1), this is commonly referred to as _transfer learning_, and it's a very successful strategy for applying Transformer models to most real-world use cases where labeled data is sparse. In this chapter, we'll take a different approach and train a completely new model from scratch. This is a good approach to take if you have a lot of data and it is very different from the pretraining data used for the available models. However, it also requires considerably more compute resources to pretrain a language model than just to fine-tune an existing one. Examples where it can make sense to train a new model include for datasets consisting of musical notes, molecular sequences such as DNA, or programming languages. The latter have recently gained traction thanks to tools such as TabNine and GitHub's Copilot, powered by OpenAI's Codex model, that can generate long sequences of code. This task of text generation is best addressed with auto-regressive or causal language models such as GPT-2.
+Până acum, am folosit în principal modele preantrenate și le-am făcut fine-tuning pentru noi cazuri de utilizare prin reutilizarea weighturilor din preantrenare. După cum am văzut în [Capitolul 1](/course/chapter1), acest lucru este denumit în mod obișnuit _învățare prin transfer_ și este o strategie foarte reușită pentru aplicarea modelelor Transformer la majoritatea cazurilor de utilizare din lumea reală în care datele etichetate sunt puține. În acest capitol, vom adopta o abordare diferită și vom antrena un model complet nou de la zero. Aceasta este o abordare bună dacă aveți multe date și este foarte diferită de datele de preantrenare utilizate pentru modelele disponibile. Cu toate acestea, preantrenarea unui model lingvistic necesită, de asemenea, mult mai multe resurse de calcul decât fine-tuningul unui model existent. Printre exemplele în care poate fi utilă antrenarea unui nou model se numără dataseturile formate din note muzicale, secvențe moleculare precum ADN sau limbaje de programare. Acestea din urmă au câștigat recent teren datorită unor instrumente precum TabNine și Copilot de la GitHub, alimentate de modelul Codex al OpenAI, care pot genera secvențe lungi de cod. Această sarcină de generare a textului este cel mai bine abordată cu modele de limbaj autoregresive sau cauzale, cum ar fi GPT-2.
 
-In this section we will build a scaled-down version of a code generation model: we'll focus on one-line completions instead of full functions or classes, using a subset of Python code. When working with data in Python you are in frequent contact with the Python data science stack, consisting of the `matplotlib`, `seaborn`, `pandas`, and `scikit-learn` libraries. When using those frameworks it's common to need to look up specific commands, so it would be nice if we could use a model to complete these calls for us.
+În această secțiune vom construi o versiune la scară redusă a unui model de generare a codului: ne vom concentra pe completări de o linie în loc de funcții sau clase complete, folosind un subset de cod Python. Atunci când lucrați cu date în Python, sunteți în contact frecvent Python data science stack, formată din bibliotecile `matplotlib`, `seaborn`, `pandas` și `scikit-learn`. Atunci când se utilizează aceste cadre, este frecvent să fie nevoie să se caute comenzi specifice, astfel încât ar fi bine dacă am putea utiliza un model care să efectueze aceste apeluri pentru noi.
 
 <Youtube id="Vpjb1lu0MDk"/>
 
-In [Chapter 6](/course/chapter6) we created an efficient tokenizer to process Python source code, but what we still need is a large-scale dataset to pretrain a model on. Here, we'll apply our tokenizer to a corpus of Python code derived from GitHub repositories. We will then use the `Trainer` API and 🤗 Accelerate to train the model. Let's get to it!
+În [Capitolul 6](/course/chapter6) am creat un tokenizer eficient pentru a procesa codul sursă Python, dar avem nevoie de un dataset la scară largă pe care să preantrenăm un model. Aici, vom aplica tokenizerul nostru la un corpus de cod Python derivat din repositoriile GitHub. Vom utiliza apoi API-ul `Trainer` și 🤗 Accelerate pentru a antrena modelul. Să trecem la treabă!
 
 <iframe src="https://course-demos-codeparrot-ds.hf.space" frameBorder="0" height="300" title="Gradio app" class="block dark:hidden container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
 
-This is actually showcasing the model that was trained and uploaded to the Hub using the code shown in this section. You can find it [here](https://huggingface.co/huggingface-course/codeparrot-ds?text=plt.imshow%28). Note that since there is some randomization happening in the text generation, you will probably get a slightly different result.
+Aceasta este de fapt o prezentare a modelului care a fost antrenat și încărcat în Hub folosind codul prezentat în această secțiune. Îl puteți găsi [aici](https://huggingface.co/huggingface-course/codeparrot-ds?text=plt.imshow%28). Rețineți că, deoarece are loc o anumită randomizare în generarea textului, veți obține probabil un rezultat ușor diferit.
  
-## Gathering the data[[gathering-the-data]]
+## Colectarea datelor[[gathering-the-data]]
 
-Python code is abundantly available from code repositories such as GitHub, which we can use to create a dataset by scraping for every Python repository. This was the approach taken in the [Transformers textbook](https://learning.oreilly.com/library/view/natural-language-processing/9781098136789/) to pretrain a large GPT-2 model. Using a GitHub dump of about 180 GB containing roughly 20 million Python files called `codeparrot`, the authors built a dataset that they then shared on the [Hugging Face Hub](https://huggingface.co/datasets/transformersbook/codeparrot).
+Codul Python este disponibil din abundență în repositorii de cod, cum ar fi GitHub, pe care le putem utiliza pentru a crea un dataset prin scraping pentru fiecare repositoriu Python. Aceasta a fost abordarea adoptată în [Transformers textbook](https://learning.oreilly.com/library/view/natural-language-processing/9781098136789/) pentru a preantrena un model GPT-2. Folosind o descărcare GitHub de aproximativ 180 GB care conține aproximativ 20 de milioane de fișiere Python numită `codeparrot`, autorii au construit un dataset pe care l-au oferit apoi pe [Hugging Face Hub](https://huggingface.co/datasets/transformersbook/codeparrot).
 
-However, training on the full corpus is time- and compute-consuming, and we only need the subset of the dataset concerned with the Python data science stack. So, let's start by filtering the `codeparrot` dataset for all files that include any of the libraries in this stack. Because of the dataset's size, we want to avoid downloading it; instead, we'll use the streaming feature to filter it on the fly. To help us filter the code samples using the libraries we mentioned earlier, we'll use the following function:
+Cu toate acestea, antrenarea pe întregul corpus consumă timp și puterea calculatorului, iar noi avem nevoie doar de subsetul datasetului referitor la Python data science stack. Așadar, să începem prin filtrarea datasetului `codeparrot` pentru toate fișierele care includ oricare dintre bibliotecile din aceast stack. Din cauza dimensiunii datasetului, dorim să evităm descărcarea acestuia; în schimb, vom utiliza funcția de streaming pentru a-l filtra din mers. Pentru a ne ajuta să filtrăm exemplele de cod care utilizează bibliotecile pe care le-am menționat mai devreme, vom utiliza următoarea funcție:
 
 ```py
 def any_keyword_in_string(string, keywords):
@@ -48,7 +48,7 @@ def any_keyword_in_string(string, keywords):
     return False
 ```
 
-Let's test it on two examples:
+Să-l testăm pe două exemple:
 
 ```py
 filters = ["pandas", "sklearn", "matplotlib", "seaborn"]
@@ -64,7 +64,7 @@ print(
 False True
 ```
 
-We can use this to create a function that will stream the dataset and filter the elements we want:
+Putem folosi acest lucru pentru a crea o funcție care va transmite în flux datasetul și va filtra elementele dorite:
 
 ```py
 from collections import defaultdict
@@ -84,7 +84,7 @@ def filter_streaming_dataset(dataset, filters):
     return Dataset.from_dict(filtered_dict)
 ```
 
-Then we can simply apply this function to the streaming dataset:
+Apoi, putem aplica pur și simplu această funcție pe datasetului din flux:
 
 ```py
 # This cell will take a very long time to execute, so you should skip it and go to
@@ -102,9 +102,9 @@ filtered_data = filter_streaming_dataset(data, filters)
 3.26% of data after filtering.
 ```
 
-This leaves us with about 3% of the original dataset, which is still quite sizable -- the resulting dataset is 6 GB and consists of 600,000 Python scripts!
+Acest lucru ne lasă cu aproximativ 3% din setul de date original, care este încă destul de mare - datasetul rezultat este de 6 GB și constă din 600.000 de scripturi Python!
 
-Filtering the full dataset can take 2-3h depending on your machine and bandwidth. If you don't want to go through this lengthy process yourself, we provide the filtered dataset on the Hub for you to download:
+Filtrarea datasetului complet poate dura 2-3 ore, în funcție de calculator și de bandwidth. Dacă nu doriți să parcurgeți singur acest proces îndelungat, vă punem la dispoziție datasetul filtrat pe Hub pentru a-l descărca:
 
 ```py
 from datasets import load_dataset, DatasetDict
@@ -137,11 +137,11 @@ DatasetDict({
 
 <Tip>
 
-Pretraining the language model will take a while. We suggest that you first run the training loop on a sample of the data by uncommenting the two partial lines above, and make sure that the training successfully completes and the models are stored. Nothing is more frustrating than a training run failing at the last step because you forgot to create a folder or because there's a typo at the end of the training loop!
+Preantrenarea modelului de limbaj va dura ceva timp. Vă sugerăm să rulați mai întâi bucla de antrenare pe un sample de date prin decomentarea celor două linii parțiale de mai sus și să vă asigurați că antrenarea se finalizează cu succes și că modelele sunt stocate. Nimic nu este mai frustrant decât o rulare de antrenare care eșuează la ultimul pas pentru că ați uitat să creați un folder sau pentru că există o greșeală de tipar la sfârșitul buclei de antrenare!
 
 </Tip>
 
-Let's look at an example from the dataset. We'll just show the first 200 characters of each field:
+Să ne uităm la un exemplu din dataset. Vom arăta doar primele 200 de caractere din fiecare câmp:
 
 ```py
 for key in raw_datasets["train"][0]:
@@ -167,22 +167,22 @@ from .murmurhash import murm
 LICENSE: bsd-3-clause'''
 ```
 
-We can see that the `content` field contains the code that we want our model to train on. Now that we have a dataset, we need to prepare the texts so they're in a format suitable for pretraining.
+Putem vedea căci câmpul `content` conține codul pe care dorim ca modelul nostru să se antreneze. Acum că avem un dataset, trebuie să pregătim textele astfel încât acestea să fie într-un format adecvat pentru preantrenare.
 
-## Preparing the dataset[[preparing-the-dataset]]
+## Pregătirea datasetului[[preparing-the-dataset]]
 
 <Youtube id="ma1TrR7gE7I"/>
 
-The first step will be to tokenize the data, so we can use it for training. Since our goal is to mainly autocomplete short function calls, we can keep the context size relatively small. This has the benefit that we can train the model much faster and it requires significantly less memory. If it is important for your application to have more context (for example, if you want the model to write unit tests based on a file with the function definition), make sure you increase that number, but also keep in mind that this comes with a greater GPU memory footprint. For now, let's fix the context size at 128 tokens, as opposed to the 1,024 or 2,048 used in GPT-2 or GPT-3, respectively.
+Primul pas va fi tokenizarea datelor, astfel încât să le putem utiliza pentru antrenare. Deoarece obiectivul nostru este de a autocompleta în principal apeluri scurte de funcții, putem păstra dimensiunea contextului relativ mică. Acest lucru are avantajul că putem antrena modelul mult mai rapid și că necesită semnificativ mai puțină memorie. Dacă este important pentru aplicația voastră să aveți mai mult context (de exemplu, dacă doriți ca modelul să scrie teste unitare pe baza unui fișier cu definiția funcției), asigurați-vă că măriți acest număr, dar rețineți, de asemenea, că acest lucru vine cu utilizare mai mare de memorie GPU. Pentru moment, să fixăm dimensiunea contextului la 128 de tokeni, spre deosebire de 1 024 sau 2 048 utilizate în GPT-2 sau respectiv GPT-3.
 
-Most documents contain many more than 128 tokens, so simply truncating the inputs to the maximum length would eliminate a large fraction of our dataset. Instead, we'll use the `return_overflowing_tokens` option to tokenize the whole input and split it into several chunks, as we did in [Chapter 6](/course/chapter6/4). We'll also use the `return_length` option to return the length of each created chunk automatically. Often the last chunk will be smaller than the context size, and we'll get rid of these pieces to avoid padding issues; we don't really need them as we have plenty of data anyway.
+Majoritatea documentelor conțin mult mai mult de 128 de cuvinte, astfel încât trunchierea simplă a inputurilor la lungimea maximă ar elimina o mare parte din datasetul nostru. În schimb, vom utiliza opțiunea `return_overflowing_tokens` pentru a tokeniza întreagul input și a o împărți în mai multe bucăți, așa cum am făcut în [Capitolul 6](/course/chapter6/4). De asemenea, vom utiliza opțiunea `return_length` pentru a returna automat lungimea fiecărui fragment creat. Adesea, ultimul fragment va fi mai mic decât dimensiunea contextului, iar noi vom scăpa de aceste bucăți pentru a evita problemele de padding; nu avem nevoie de ele, deoarece oricum avem o mulțime de date.
 
 <div class="flex justify-center">
-<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/chunking_texts.svg" alt="Chunking a large texts in several pieces."/>
-<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/chunking_texts-dark.svg" alt="Chunking a large texts in several pieces."/>
+<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/chunking_texts.svg" alt="Fragmentarea unui text mare în mai multe bucăți."/>
+<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/chunking_texts-dark.svg" alt="Fragmentarea unui text mare în mai multe bucăți."/>
 </div>
 
-Let's see exactly how this works by looking at the first two examples:
+Să vedem exact cum funcționează acest lucru analizând primele două exemple:
 
 ```py
 from transformers import AutoTokenizer
@@ -209,9 +209,9 @@ Input chunk lengths: [128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 128
 Chunk mapping: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]
 ```
 
-We can see that we get 34 segments in total from those two examples. Looking at the chunk lengths, we can see that the chunks at the ends of both documents have less than 128 tokens (117 and 41, respectively). These represent just a small fraction of the total chunks that we have, so we can safely throw them away. With the `overflow_to_sample_mapping` field, we can also reconstruct which chunks belonged to which input samples.
+Putem vedea că obținem 34 de segmente în total din aceste două exemple. Uitându-ne la lungimea segmentelor, putem vedea că segmentele de la sfârșitul ambelor documente au mai puțin de 128 de token-uri (117 și, respectiv, 41). Acestea reprezintă doar o mică parte din totalul segmentelor pe care le avem, așa că le putem șterge în siguranță. Cu ajutorul câmpului `overflow_to_sample_mapping`, putem, de asemenea, să reconstituim care segmente au aparținut căror probe de intrare.
 
-With this operation we're using a handy feature of the `Dataset.map()` function in 🤗 Datasets, which is that it does not require one-to-one maps; as we saw in [section 3](/course/chapter7/3), we can create batches with more or fewer elements than the input batch. This is useful when doing operations like data augmentation or data filtering that change the number of elements. In our case, when tokenizing each element into chunks of the specified context size, we create many samples from each document. We just need to make sure to delete the existing columns, since they have a conflicting size. If we wanted to keep them, we could repeat them appropriately and return them within the `Dataset.map()` call:
+Cu această operațiune folosim o caracteristică utilă a funcției `Dataset.map()` din 🤗 Datasets, și anume că nu necesită one-to-one maps; așa cum am văzut în [secțiunea 3](/course/chaptero7/3), putem crea batch-uri cu mai multe sau mai puține elemente decât batch-ul de intrare. Acest lucru este util atunci când efectuăm operațiuni precum augmentarea sau filtrarea datelor care modifică numărul de elemente. În cazul nostru, atunci când tokenizăm fiecare element în segmente de dimensiunea contextului specificat, creăm multe probe din fiecare document. Trebuie doar să ne asigurăm că ștergem coloanele existente, deoarece acestea au o dimensiune conflictuală. Dacă am dori să le păstrăm, am putea să le repetăm în mod corespunzător și să le returnăm în cadrul apelului `Dataset.map()`:
 
 ```py
 def tokenize(element):
@@ -248,20 +248,20 @@ DatasetDict({
 })
 ```
 
-We now have 16.7 million examples with 128 tokens each, which corresponds to about 2.1 billion tokens in total. For reference, OpenAI's GPT-3 and Codex models are trained on 300 and 100 billion tokens, respectively, where the Codex models are initialized from the GPT-3 checkpoints. Our goal in this section is not to compete with these models, which can generate long, coherent texts, but to create a scaled-down version providing a quick autocomplete function for data scientists.
+Avem acum 16,7 milioane de exemple cu 128 de tokenii fiecare, ceea ce corespunde unui total de aproximativ 2,1 miliarde de tokeni. Ca referință, modelele GPT-3 și Codex ale OpenAI sunt antrenate pe 300 și, respectiv, 100 de miliarde de tokeni, unde modelele Codex sunt inițializate din checkpointurile GPT-3. Scopul nostru în această secțiune nu este de a concura cu aceste modele, care pot genera texte lungi și coerente, ci de a crea o versiune la scară redusă care să ofere o funcție rapidă de autocompletare pentru data scientists.
 
-Now that we have the dataset ready, let's set up the model!
+Acum că avem datasetul gata, hai să configurăm modelul!
 
 <Tip>
 
-✏️ **Try it out!** Getting rid of all the chunks that are smaller than the context size wasn't a big issue here because we're using small context windows. As you increase the context size (or if you have a corpus of short documents), the fraction of chunks that are thrown away will also grow. A more efficient way to prepare the data is to join all the tokenized samples in a batch with an `eos_token_id` token in between, and then perform the chunking on the concatenated sequences. As an exercise, modify the `tokenize()` function to make use of that approach. Note that you'll want to set `truncation=False` and remove the other arguments from the tokenizer to get the full sequence of token IDs.
+✏️ **Încercați!** Eliminarea tuturor bucăților care sunt mai mici decât dimensiunea contextului nu a fost o problemă majoră aici, deoarece folosim ferestre de context mici. Pe măsură ce creșteți dimensiunea contextului (sau dacă aveți un corpus de documente scurte), fracțiunea de segmente care sunt aruncate va crește și ea. O modalitate mai eficientă de a pregăti datele este de a uni toate sampleurile tokenizate într-un batch cu un token `eos_token_id` între ele, iar apoi de a efectua chunkingul pe secvențele concatenate. Ca exercițiu, modificați funcția `tokenize()` pentru a utiliza această abordare. Rețineți că veți dori să setați `truncation=False` și să eliminați celelalte argumente din tokenizer pentru a obține secvența completă de token IDs.
 
 </Tip>
 
 
-## Initializing a new model[[initializing-a-new-model]]
+## Inițializarea unui nou model[[initializing-a-new-model]]
 
-Our first step is to freshly initialize a GPT-2 model. We'll use the same configuration for our model as for the small GPT-2 model, so we load the pretrained configuration, make sure that the tokenizer size matches the model vocabulary size and pass the `bos` and `eos` (beginning and end of sequence) token IDs:
+Primul nostru pas este să inițializăm un model GPT-2. Vom utiliza aceeași configurație pentru modelul nostru ca și pentru modelul GPT-2 mic, deci încărcăm configurația preantrenată, ne asigurăm că dimensiunea tokenizerlui corespunde cu dimensiunea vocabularului modelului și transmitem ID-urile tokenilor `bos` și `eos` (începutul și sfârșitul secvenței):
 
 {#if fw === 'pt'}
 
@@ -277,7 +277,7 @@ config = AutoConfig.from_pretrained(
 )
 ```
 
-With that configuration, we can load a new model. Note that this is the first time we don't use the `from_pretrained()` function, since we're actually initializing a model ourself:
+Cu această configurație, putem încărca un nou model. Rețineți că aceasta este prima dată când nu folosim funcția `from_pretrained()`, deoarece inițializăm noi înșine un model:
 
 ```py
 model = GPT2LMHeadModel(config)
@@ -303,7 +303,7 @@ config = AutoConfig.from_pretrained(
 )
 ```
 
-With that configuration, we can load a new model. Note that this is the first time we don't use the `from_pretrained()` function, since we're actually initializing a model ourself:
+Cu această configurație, putem încărca un nou model. Rețineți că aceasta este prima dată când nu folosim funcția `from_pretrained()`, deoarece inițializăm noi înșine un model:
 
 ```py
 model = TFGPT2LMHeadModel(config)
@@ -325,9 +325,9 @@ _________________________________________________________________
 
 {/if}
 
-Our model has 124M parameters that we'll have to tune. Before we can start training, we need to set up a data collator that will take care of creating the batches. We can use the `DataCollatorForLanguageModeling` collator, which is designed specifically for language modeling (as the name subtly suggests). Besides stacking and padding batches, it also takes care of creating the language model labels -- in causal language modeling the inputs serve as labels too (just shifted by one element), and this data collator creates them on the fly during training so we don't need to duplicate the `input_ids`.
+Modelul nostru are 124 milioane de parametri pe care va trebui să le facem tune. Înainte de a începe antrenarea, trebuie să configurăm un data collator care se va ocupa de crearea batch-urilor. Putem utiliza colatorul `DataCollatorForLanguageModeling`, care este conceput special pentru modelarea limbajului (după cum sugerează subtil numele). Pe lângă stacking și paddingul batchurilor, acesta se ocupă și de crearea labelurilor modelului lingvistic - în modelarea cauzală a limbajului, inputurile servesc și ca labels (doar că sunt decalate cu un element), iar acest data collator le creează din mers în timpul antrenării, astfel încât să nu fie nevoie să duplicăm `input_ids`.
 
-Note that `DataCollatorForLanguageModeling` supports both masked language modeling (MLM) and causal language modeling (CLM). By default it prepares data for MLM, but we can switch to CLM by setting the argument `mlm=False`:
+Rețineți că `DataCollatorForLanguageModeling` acceptă atât masked language masking (MLM), cât și causal language modeling(CLM). În mod implicit, acesta pregătește datele pentru MLM, dar putem trece la CLM prin setarea argumentului `mlm=False`:
 
 {#if fw === 'pt'}
 
@@ -349,7 +349,7 @@ data_collator = DataCollatorForLanguageModeling(tokenizer, mlm=False, return_ten
 
 {/if}
 
-Let's have a look at an example:
+Să aruncăm o privire la un exemplu:
 
 ```py
 out = data_collator([tokenized_datasets["train"][i] for i in range(5)])
@@ -375,11 +375,11 @@ labels shape: (5, 128)
 
 {/if}
 
-We can see that the examples have been stacked and all the tensors have the same shape.
+Putem vedea că exemplele sunt stacked și că toți tensorii au aceeași formă.
 
 {#if fw === 'tf'}
 
-Now we can use the `prepare_tf_dataset()` method to convert our datasets to TensorFlow datasets with the data collator we created above:
+Acum putem utiliza metoda `prepare_tf_dataset()` pentru a converti dataseturile noastre în dataseturi TensorFlow cu ajutorul data collatorului pe care l-am creat mai sus:
 
 ```python
 tf_train_dataset = model.prepare_tf_dataset(
@@ -400,12 +400,12 @@ tf_eval_dataset = model.prepare_tf_dataset(
 
 <Tip warning={true}>
 
-⚠️ Shifting the inputs and labels to align them happens inside the model, so the data collator just copies the inputs to create the labels.
+⚠️ Schimbarea inputurilor și a labelurilor pentru a le alinia are loc în interiorul modelului, astfel încât data collatorului doar copiază inputurile pentru a crea labeluri.
 
 </Tip>
 
 
-Now we have everything in place to actually train our model -- that wasn't so much work after all! Before we start training we should log in to Hugging Face. If you're working in a notebook, you can do so with the following utility function:
+Acum avem totul pregătit pentru a ne antrena modelul - până la urmă nu a fost atât de greu! Înainte de a începe antrenamentul, trebuie să ne conectăm la Hugging Face. Dacă lucrați într-un notebook, puteți face acest lucru cu următoarea funcție de utilitate:
 
 ```python
 from huggingface_hub import notebook_login
@@ -413,9 +413,9 @@ from huggingface_hub import notebook_login
 notebook_login()
 ```
 
-This will display a widget where you can enter your Hugging Face login credentials.
+Aceasta va afișa un widget în care puteți introduce datele voastre de autentificare Hugging Face.
 
-If you aren't working in a notebook, just type the following line in your terminal:
+Dacă nu lucrați într-un notebook, tastați următoarea linie în terminal:
 
 ```bash
 huggingface-cli login
@@ -423,7 +423,7 @@ huggingface-cli login
 
 {#if fw === 'pt'}
 
-All that's left to do is configure the training arguments and fire up the `Trainer`. We'll use a cosine learning rate schedule with some warmup and an effective batch size of 256 (`per_device_train_batch_size` * `gradient_accumulation_steps`). Gradient accumulation is used when a single batch does not fit into memory, and incrementally builds up the gradient through several forward/backward passes. We'll see this in action when we create the training loop with 🤗 Accelerate.
+Tot ce a mai rămas de făcut este să configurăm argumentele de antrenare și să pornim `Trainer`-ul. Vom utiliza un cosine learning rate schedule cu un warmup și o dimensiune efectivă a batch-ului de 256 (`per_device_train_batch_size` * `gradient_accumulation_steps`). Acumularea gradientului este utilizată atunci când un singur batch nu încape în memorie și construiește treptat gradientul prin mai multe treceri înainte/înapoi. Vom vedea acest lucru în acțiune atunci când vom crea bucla de antrenare cu 🤗 Accelerate.
 
 ```py
 from transformers import Trainer, TrainingArguments
@@ -456,13 +456,13 @@ trainer = Trainer(
 )
 ```
 
-Now we can just start the `Trainer` and wait for training to finish. Depending on whether you run it on the full or a subset of the training set this will take 20 or 2 hours, respectively, so grab a few coffees and a good book to read!
+Acum putem doar să pornim `Trainer`-ul și să așteptăm ca antrenamentul să se termine. În funcție de executarea antrenării pe întregul set de antrenarea sau pe un subset al acestuia, va dura 20 minute, sau respectiv 2 ore, așa că luați câteva cafeluțe și o carte bună de citit!
 
 ```py
 trainer.train()
 ```
 
-After training completes, we can push the model and tokenizer to the Hub:
+După finalizarea antrenării, putem trimite modelul și tokenizerul către Hub:
 
 ```py
 trainer.push_to_hub()
@@ -470,7 +470,7 @@ trainer.push_to_hub()
 
 {:else}
 
-All that's left to do is configure the training hyperparameters and call `compile()` and `fit()`. We'll use a learning rate schedule with some warmup to improve the stability of training:
+Tot ce rămâne de făcut este să configurați hiperparametrii de antrenament și să apelați `compile()` și `fit()`. Vom utiliza un program al learning rate cu un anumit warmup pentru a îmbunătăți stabilitatea antrenării:
 
 ```py
 from transformers import create_optimizer
@@ -489,7 +489,7 @@ model.compile(optimizer=optimizer)
 tf.keras.mixed_precision.set_global_policy("mixed_float16")
 ```
 
-Now we can just call `model.fit()` and wait for training to finish. Depending on whether you run it on the full or a subset of the training set this will take 20 or 2 hours, respectively, so grab a few coffees and a good book to read! After training completes we can push the model and tokenizer to the Hub:
+Acum putem apela `model.fit()` și să așteptăm ca antrenarea să se încheie. În funcție de executarea antrenării pe întregul set de antrenarea sau pe un subset al acestuia, va dura 20 minute, sau respectiv 2 ore, așa că luați câteva cafeluțe și o carte bună de citit!
 
 ```py
 from transformers.keras_callbacks import PushToHubCallback
@@ -503,7 +503,7 @@ model.fit(tf_train_dataset, validation_data=tf_eval_dataset, callbacks=[callback
 
 <Tip>
 
-✏️ **Try it out!** It only took us about 30 lines of code in addition to the `TrainingArguments` to get from raw texts to training GPT-2. Try it out with your own dataset and see if you can get good results! 
+✏️ **Try it out!** Ne-a luat doar aproximativ 30 de linii de cod în plus față de `TrainingArguments` pentru a ajunge de la texte brute la antrenarea GPT-2. Încercați antrenarea cu propriul dataset și vedeți dacă puteți obține rezultate bune!
 
 </Tip>
 
@@ -511,19 +511,19 @@ model.fit(tf_train_dataset, validation_data=tf_eval_dataset, callbacks=[callback
 
 {#if fw === 'pt'}
 
-💡 If you have access to a machine with multiple GPUs, try to run the code there. The `Trainer` automatically manages multiple machines, and this can speed up training tremendously.
+💡 Dacă aveți acces la un calculator cu mai multe GPU-uri, încercați să rulați codul acolo. `Trainer` gestionează automat mai multe calculatoare, iar acest lucru poate accelera foarte mult antrenamentul.
 
 {:else}
 
-💡 If you have access to a machine with multiple GPUs, you can try using a `MirroredStrategy` context to substantially speed up training. You'll need to create a `tf.distribute.MirroredStrategy` object, and make sure that any `to_tf_dataset()` or `prepare_tf_dataset()` methods as well as model creation and the call to `fit()` are all run in its `scope()` context. You can see documentation on this [here](https://www.tensorflow.org/guide/distributed_training#use_tfdistributestrategy_with_keras_modelfit).
+💡 Dacă aveți acces la un calculator cu mai multe GPU-uri, puteți încerca să utilizați un context `MirroredStrategy` pentru a accelera substanțial antrenarea. Va trebui să creați un obiect `tf.distribute.MirroredStrategy` și să vă asigurați că toate metodele `to_tf_dataset()` sau `prepare_tf_dataset()`, precum și crearea modelului și apelul la `fit()` sunt rulate în contextul său `scope()`. Puteți vedea documentația despre acest lucru [aici] (https://www.tensorflow.org/guide/distributed_training#use_tfdistributestrategy_with_keras_modelfit).
 
 {/if}
 
 </Tip>
 
-## Code generation with a pipeline[[code-generation-with-a-pipeline]]
+## Generarea codului cu un pipeline[[code-generation-with-a-pipeline]]
 
-Now is the moment of truth: let's see how well the trained model actually works! We can see in the logs that the loss went down steadily, but to put the model to the test let's take a look at how well it works on some prompts. To do that we'll wrap the model in a text generation `pipeline`, and we'll put it on the GPU for fast generations if there is one available:
+Acum este momentul adevărului: să vedem cât de bine funcționează de fapt modelul antrenat! Putem vedea în loguri că pierderea a scăzut în mod constant, dar pentru a testa modelul, hai să vedem cât de bine funcționează la câteva încerări. Pentru a face acest lucru, vom încorpora modelul într-un `pipeline` de generare a textului și îl vom pune pe un GPU pentru generații rapide, dacă există unul disponibil:
 
 {#if fw === 'pt'}
 
@@ -551,7 +551,7 @@ pipe = pipeline(
 
 {/if}
 
-Let's start with the simple task of creating a scatter plot:
+Să începem cu sarcina simplă de a crea un scatter plot:
 
 ```py
 txt = """\
@@ -559,23 +559,23 @@ txt = """\
 x = np.random.randn(100)
 y = np.random.randn(100)
 
-# create scatter plot with x, y
+# crearea unui scatter plot cu x, y
 """
 print(pipe(txt, num_return_sequences=1)[0]["generated_text"])
 ```
 
 ```python out
-# create some data
+# crearea unor date
 x = np.random.randn(100)
 y = np.random.randn(100)
 
-# create scatter plot with x, y
+# crearea scatter plot cu x, y
 plt.scatter(x, y)
 
-# create scatter
+# crearea scatter
 ```
 
-The result looks correct. Does it also work for a `pandas` operation? Let's see if we can create a `DataFrame` from two arrays:
+Rezultatul pare corect. Funcționează și pentru o operație `pandas`? Să vedem dacă putem crea un `DataFrame` din două array-uri:
 
 ```py
 txt = """\
@@ -583,7 +583,7 @@ txt = """\
 x = np.random.randn(100)
 y = np.random.randn(100)
 
-# create dataframe from x and y
+# creați dataframeul din x și y
 """
 print(pipe(txt, num_return_sequences=1)[0]["generated_text"])
 ```
@@ -593,20 +593,20 @@ print(pipe(txt, num_return_sequences=1)[0]["generated_text"])
 x = np.random.randn(100)
 y = np.random.randn(100)
 
-# create dataframe from x and y
+# crează un dataframe din x și y
 df = pd.DataFrame({'x': x, 'y': y})
 df.insert(0,'x', x)
 for
 ```
 
-Nice, that's the correct answer -- although it then inserts the column `x` again. Since the number of generated tokens is limited, the following `for` loop is cut off. Let's see if we can do something a bit more complex and have the model help us use the `groupby` operation: 
+Excelent, acesta este răspunsul corect - deși apoi introduce din nou coloana `x`. Deoarece numărul de tokeni generate este limitat, următoarea buclă `for` este întreruptă. Să vedem dacă putem face ceva un pic mai complex și dacă modelul ne ajută să folosim operația `groupby`:
 
 ```py
 txt = """\
 # dataframe with profession, income and name
 df = pd.DataFrame({'profession': x, 'income':y, 'name': z})
 
-# calculate the mean income per profession
+# calculați venitul mediu pe profesie
 """
 print(pipe(txt, num_return_sequences=1)[0]["generated_text"])
 ```
@@ -615,20 +615,20 @@ print(pipe(txt, num_return_sequences=1)[0]["generated_text"])
 # dataframe with profession, income and name
 df = pd.DataFrame({'profession': x, 'income':y, 'name': z})
 
-# calculate the mean income per profession
+# calculeză venitul mediu pe profesie
 profession = df.groupby(['profession']).mean()
 
-# compute the
+# calculează
 ```
 
-Not bad; that's the right way to do it. Finally, let's see if we can also use it for `scikit-learn` and set up a Random Forest model:
+Nu este rău; acesta este modul corect de a face acest lucru. În cele din urmă, să vedem dacă îl putem folosi și pentru `scikit-learn` și să configurăm un model Random Forest:
 
 ```py
 txt = """
 # import random forest regressor from scikit-learn
 from sklearn.ensemble import RandomForestRegressor
 
-# fit random forest model with 300 estimators on X, y:
+# ajustați modelul Random Forest cu 300 de estimatori pe X, y:
 """
 print(pipe(txt, num_return_sequences=1)[0]["generated_text"])
 ```
@@ -637,7 +637,7 @@ print(pipe(txt, num_return_sequences=1)[0]["generated_text"])
 # import random forest regressor from scikit-learn
 from sklearn.ensemble import RandomForestRegressor
 
-# fit random forest model with 300 estimators on X, y:
+# ajustați modelul Random Forest cu 300 de estimatori pe X, y:
 rf = RandomForestRegressor(n_estimators=300, random_state=random_state, max_depth=3)
 rf.fit(X, y)
 rf
@@ -645,17 +645,17 @@ rf
 
 {#if fw === 'tf'}
 
-Looking at these few examples, it seems that the model has learned some of the syntax of the Python data science stack. Of course, we would need to evaluate the model more thoroughly before deploying it in the real world, but this is still an impressive prototype.
+Privind la aceste câteva exemple, se pare că modelul a învățat o parte din sintaxa Python data science stack. Desigur, ar trebui să evaluăm modelul mai amănunțit înainte de a-l implementa în lumea reală, totuși acesta este un prototip impresionant.
 
 {:else}
 
-Looking at these few examples, it seems that the model has learned some of the syntax of the Python data science stack (of course, we would need to evaluate it more thoroughly before deploying the model in the real world). Sometimes it requires more customization of the model training to achieve the necessary performance for a given use case, however. For example, what if we would like to dynamically update the batch size or have a conditional training loop that skips bad examples on the fly? One option would be to subclass the `Trainer` and add the necessary changes, but sometimes it's simpler to write the training loop from scratch. That's where 🤗 Accelerate comes in.
+Privind aceste câteva exemple, se pare că modelul a învățat o parte din sintaxa Python data science stack(desigur, ar trebui să o evaluăm mai bine înainte de a implementa modelul în lumea reală). Cu toate acestea, uneori este nevoie de o mai mare personalizare a antrenării modelului pentru a obține performanța necesară pentru un anumit caz de utilizare. De exemplu, dacă am dori să actualizăm dinamic dimensiunea batch-ului sau să avem o buclă de antrenare condiționată care trece peste exemplele proaste din mers? O opțiune ar fi să facem subclass la `Trainer` și să adăugăm modificările necesare, dar uneori este mai simplu să scriem bucla de antrenare de la zero. Aici intervine 🤗 Accelerate.
 
 {/if}
 
 {#if fw === 'pt'}
 
-## Training with 🤗 Accelerate[[training-with-accelerate]]
+## Antrenarea cu 🤗 Accelerate[[training-with-accelerate]]
 
 We've seen how to train a model with the `Trainer`, which can allow for some customization. However, sometimes we want full control over the training loop, or we want to make some exotic changes. In this case 🤗 Accelerate is a great choice, and in this section we'll go through the steps to use it to train our model. To make things more interesting, we'll also add a twist to the training loop.
 
diff --git a/chapters/ro/chapter7/7.mdx b/chapters/ro/chapter7/7.mdx
index 34556be21..72358b6cc 100644
--- a/chapters/ro/chapter7/7.mdx
+++ b/chapters/ro/chapter7/7.mdx
@@ -22,7 +22,7 @@
 
 {/if}
 
-Time to look at question answering! This task comes in many flavors, but the one we'll focus on in this section is called *extractive* question answering. This involves posing questions about a document and identifying the answers as _spans of text_ in the document itself.
+Este timpul să analizăm răspunsul la întrebări! Această sarcină are mai multe variante, dar cea pe care ne vom concentra în această secțiune se numește răspuns *extractiv* la întrebări. Aceasta presupune formularea de întrebări cu privire la un document și identificarea răspunsurilor ca _spans de text_ în documentul în sine.
 
 <Youtube id="ajPx5LwJD-I"/>
 

From a759450ad330ccd6ffe7fa74bc2ba5fca0468a2b Mon Sep 17 00:00:00 2001
From: Angroys <120798951+Angroys@users.noreply.github.com>
Date: Thu, 23 Jan 2025 17:14:23 +0200
Subject: [PATCH 015/167] finished chapter 7

---
 chapters/ro/chapter7/6.mdx |  46 +++---
 chapters/ro/chapter7/7.mdx | 289 +++++++++++++++++++------------------
 chapters/ro/chapter7/8.mdx |  20 +--
 chapters/ro/chapter7/9.mdx | 230 ++++++++++++++---------------
 4 files changed, 294 insertions(+), 291 deletions(-)

diff --git a/chapters/ro/chapter7/6.mdx b/chapters/ro/chapter7/6.mdx
index c47f46030..decbcf3eb 100644
--- a/chapters/ro/chapter7/6.mdx
+++ b/chapters/ro/chapter7/6.mdx
@@ -657,11 +657,11 @@ Privind aceste câteva exemple, se pare că modelul a învățat o parte din sin
 
 ## Antrenarea cu 🤗 Accelerate[[training-with-accelerate]]
 
-We've seen how to train a model with the `Trainer`, which can allow for some customization. However, sometimes we want full control over the training loop, or we want to make some exotic changes. In this case 🤗 Accelerate is a great choice, and in this section we'll go through the steps to use it to train our model. To make things more interesting, we'll also add a twist to the training loop.
+Am văzut cum să antrenăm un model cu `Trainer`, care poate permite o anumită personalizare. Cu toate acestea, uneori dorim control deplin asupra buclei de antrenare sau dorim să facem unele schimbări exotice. În acest caz, 🤗 Accelerate este o alegere excelentă, iar în această secțiune vom parcurge pașii de utilizare a acestuia pentru a ne antrena modelul. Pentru a face lucrurile mai interesante, vom adăuga și un twist buclei de antrenare.
 
 <Youtube id="Hm8_PgVTFuc"/>
 
-Since we are mainly interested in sensible autocompletion for the the data science libraries, it makes sense to give more weight to training samples that make more use of these libraries. We can easily identify these examples through the use of keywords such as `plt`, `pd`, `sk`, `fit`, and `predict`, which are the most frequent import names for `matplotlib.pyplot`, `pandas`, and `sklearn` as well as the fit/predict pattern of the latter. If these are each represented as a single token, we can easily check if they occur in the input sequence. Tokens can have a whitespace prefix, so we'll also check for those versions in the tokenizer vocabulary. To verify that it works, we'll add one test token which should be split into multiple tokens:
+Deoarece suntem interesați în principal de o autocompletare sensibilă pentru bibliotecile din domeniul data science, este logic să acordăm mai multă importanță exemplelor de antrenare care utilizează mai mult aceste biblioteci. Putem identifica cu ușurință aceste exemple prin utilizarea unor cuvinte-cheie precum `plt`, `pd`, `sk`, `fit` și `predict`, care sunt cele mai frecvente nume de import pentru `matplotlib.pyplot`, `pandas` și `sklearn`, precum și modelul fit/predict al acestora din urmă. Dacă acestea sunt reprezentate fiecare ca un singur simbol, putem verifica cu ușurință dacă apar în secvența de input. Tokenii pot avea un prefix de spațiu, deci vom verifica și aceste versiuni în vocabularul tokenizerului. Pentru a verifica dacă funcționează, vom adăuga un token de test care ar trebui să fie împărțit în mai mulți tokeni:
 
 ```py
 keytoken_ids = []
@@ -689,7 +689,7 @@ for keyword in [
 'Keyword has not single token: testtest'
 ```
 
-Great, that seems to work nicely! We can now write a custom loss function that takes the input sequence, the logits, and the key tokens we just selected as inputs. First we need to align the logits and inputs: the input sequence shifted by one to the right forms the labels, since the next token is the label for the current token. We can achieve this by starting the labels from the second token of the input sequence, since the model does not make a prediction for the first token anyway. Then we cut off the last logit, as we don't have a label for the token that follows the full input sequence. With that we can compute the loss per sample and count the occurrences of all keywords in each sample. Finally, we calculate the weighted average over all samples using the occurrences as weights. Since we don't want to throw away all the samples that have no keywords, we add 1 to the weights:
+Grozav, se pare că funcționează bine! Acum putem scrie o funcție de pierdere personalizată care ia ca secvența de input, logurile și tokenii cheie pe care tocmai le-am selectat. În primul rând, trebuie să aliniem logurile și inputurile: secvența de intrare deplasată cu o unitate la dreapta formează labeluri, deoarece următorul tokenul este labelul pentru tokenul curent. Putem realiza acest lucru începând cu labelurile de la al doilea token al secvenței de intrare, deoarece modelul nu face o predicție pentru primul token în orice caz. Apoi tăiem ultimul logit, deoarece nu avem un label pentru tokenul care urmează secvenței complete de intrare. Astfel, putem calcula pierderea per sample și putem număra aparițiile tuturor cuvintelor-cheie în fiecare sample. În cele din urmă, calculăm media weighturilor pe fiecare sample folosind aparițiile ca weighturi. Deoarece nu dorim să eliminăm toate sampleurile care nu au cuvinte-cheie, adăugăm 1 la weighturi:
 
 ```py
 from torch.nn import CrossEntropyLoss
@@ -715,13 +715,13 @@ def keytoken_weighted_loss(inputs, logits, keytoken_ids, alpha=1.0):
     return weighted_loss
 ```
 
-Before we can start training with this awesome new loss function, we need to prepare a few things:
+Înainte de a începe antrenamentul cu această nouă funcție de pierdere minunată, trebuie să pregătim câteva lucruri:
 
-- We need dataloaders to load the data in batches.
-- We need to set up weight decay parameters.
-- From time to time we want to evaluate, so it makes sense to wrap the evaluation code in a function.
+- Avem nevoie de dataloaders pentru a încărca datele în batch-uri.
+- Trebuie să configurăm parametrii de scădere a weighturilor.
+- Din când în când, dorim să evaluăm, astfel încât este logic să includem codul de evaluare într-o funcție.
 
-Let's start with the dataloaders. We only need to set the dataset's format to `"torch"`, and then we can pass it to a PyTorch `DataLoader` with the appropriate batch size:
+Să începem cu dataloaders. Trebuie doar să setăm formatul datasetului la `"torch"`, iar apoi îl putem trece la un `DataLoader` PyTorch cu dimensiunea corespunzătoare a batch-lui:
 
 ```py
 from torch.utils.data.dataloader import DataLoader
@@ -731,7 +731,7 @@ train_dataloader = DataLoader(tokenized_datasets["train"], batch_size=32, shuffl
 eval_dataloader = DataLoader(tokenized_datasets["valid"], batch_size=32)
 ```
 
-Next, we group the parameters so that the optimizer knows which ones will get an additional weight decay. Usually, all bias and LayerNorm weights terms are exempt from this; here's how we can do this:
+În continuare, grupăm parametrii astfel încât optimizatorul să știe care dintre aceștia vor primi o scădere suplimentară a weighturilor. De obicei, toți termenii weighturilor bias și LayerNorm sunt scutiți de acest lucru; iată cum putem face acest lucru:
 
 ```py
 weight_decay = 0.1
@@ -750,7 +750,7 @@ def get_grouped_params(model, no_decay=["bias", "LayerNorm.weight"]):
     ]
 ```
 
-Since we want to evaluate the model regularly on the validation set during training, let's write a function for that as well. It just runs through the evaluation dataloader and gathers all the losses across processes:
+Deoarece dorim să evaluăm modelul în mod regulat pe setul de validare în timpul antrenării, trebuie să scriem o funcție și pentru acest lucru. Aceasta rulează pur și simplu prin dataloaderul de evaluare și adună toate pierderile în cadrul proceselor:
 
 ```py
 def evaluate():
@@ -769,13 +769,13 @@ def evaluate():
     return loss.item(), perplexity.item()
 ```
 
-With the `evaluate()` function we can report loss and [perplexity](/course/chapter7/3) at regular intervals. Next, we redefine our model to make sure we train from scratch again:
+Cu funcția `evaluate()` putem raporta pierderile și [perplexitatea](/course/chapter7/3) la intervale regulate. În continuare, redefinim modelul nostru pentru a ne asigura că antrenăm din nou de la zero:
 
 ```py
 model = GPT2LMHeadModel(config)
 ```
 
-We can then define our optimizer, using the function from before to split the parameters for weight decay:
+Apoi putem defini optimizatorul nostru, folosind funcția de mai devreme pentru a împărți parametrii pentru scăderea weighturilor:
 
 ```py
 from torch.optim import AdamW
@@ -783,7 +783,7 @@ from torch.optim import AdamW
 optimizer = AdamW(get_grouped_params(model), lr=5e-4)
 ```
 
-Now let's prepare the model, optimizer, and dataloaders so we can start training:
+Acum să pregătim modelul, optimizatorul și dataloaderurile, astfel încât să putem începe antrenamentul:
 
 ```py
 from accelerate import Accelerator
@@ -797,11 +797,11 @@ model, optimizer, train_dataloader, eval_dataloader = accelerator.prepare(
 
 <Tip>
 
-🚨 If you're training on a TPU, you'll need to move all the code starting at the cell above into a dedicated training function. See [Chapter 3](/course/chapter3) for more details.
+🚨 Dacă antrenați pe un TPU, va trebui să mutați tot codul începând cu celula de mai sus într-o funcție de antrenare dedicată. Consultați [Capitolul 3](/course/chapter3) pentru mai multe detalii.
 
 </Tip>
 
-Now that we have sent our `train_dataloader` to `accelerator.prepare()`, we can use its length to compute the number of training steps. Remember that we should always do this after preparing the dataloader, as that method will change its length. We use a classic linear schedule from the learning rate to 0:
+Acum că am trimis `train_dataloader` la `accelerator.prepare()`, putem utiliza lungimea acestuia pentru a calcula numărul de pași de antrenare. Rețineți că ar trebui să facem acest lucru întotdeauna după ce pregătim dataloaderurile, deoarece această metodă îi va modifica lungimea. Utilizăm un program liniar clasic de la rata de învățare la 0:
 
 ```py
 from transformers import get_scheduler
@@ -818,7 +818,7 @@ lr_scheduler = get_scheduler(
 )
 ```
 
-Lastly, to push our model to the Hub, we will need to create a `Repository` object in a working folder. First log in to the Hugging Face Hub, if you aren't logged in already. We'll determine the repository name from the model ID we want to give our model (feel free to replace the `repo_name` with your own choice; it just needs to contain your username, which is what the function `get_full_repo_name()` does):
+În cele din urmă, pentru a trimite modelul nostru către Hub, va trebui să creăm un obiect `Repository` într-un folder de lucru. În primul rând, conectați-vă la Hugging Face Hub, dacă nu sunteți deja conectat. Vom determina numele repositoriului pornind de la ID-ul modelului pe care dorim să îl atribuim modelului nostru (nu ezitați să înlocuiți `repo_name` cu propria alegere; acesta trebuie doar să conțină numele vostru de utilizator, ceea ce face funcția `get_full_repo_name()`):
 
 ```py
 from huggingface_hub import Repository, get_full_repo_name
@@ -832,16 +832,16 @@ repo_name
 'sgugger/codeparrot-ds-accelerate'
 ```
 
-Then we can clone that repository in a local folder. If it already exists, this local folder should be an existing clone of the repository we are working with:
+Apoi putem clona acel repositoriu într-un folder local. Dacă există deja, acest folder local ar trebui să fie o clonă existentă a repositoriul cu care lucrăm:
 
 ```py
 output_dir = "codeparrot-ds-accelerate"
 repo = Repository(output_dir, clone_from=repo_name)
 ```
 
-We can now upload anything we save in `output_dir` by calling the `repo.push_to_hub()` method. This will help us upload the intermediate models at the end of each epoch.
+Acum putem încărca orice salvăm în `output_dir` prin apelarea metodei `repo.push_to_hub()`. Acest lucru ne va ajuta să încărcăm modelele intermediare la sfârșitul fiecărei epoci.
 
-Before we train, let's run a quick test to see if the evaluation function works properly:
+Înainte de antrenament, să efectuăm un test rapid pentru a vedea dacă funcția de evaluare funcționează corect:
 
 ```py
 evaluate()
@@ -851,7 +851,7 @@ evaluate()
 (10.934126853942871, 56057.14453125)
 ```
 
-Those are very high values for loss and perplexity, but that's not surprising as we haven't trained the model yet. With that, we have everything prepared to write the core part of the training script: the training loop. In the training loop we iterate over the dataloader and pass the batches to the model. With the logits, we can then evaluate our custom loss function. We scale the loss by the number of gradient accumulation steps so as not to create larger losses when aggregating more steps. Before we optimize, we also clip the gradients for better convergence. Finally, every few steps we evaluate the model on the evaluation set with our new `evaluate()` function:
+Acestea sunt valori foarte ridicate pentru pierdere și perplexitate, dar acest lucru nu este surprinzător, deoarece nu am antrenat încă modelul. Astfel, avem totul pregătit pentru a scrie partea principală a scriptului de antrenare: bucla de antrenare. În bucla de antrenare, iterăm peste dataloader și transmitem batch-urile către model. Cu logurile, putem apoi evalua funcția noastră de pierdere personalizată. Redimensionăm pierderea în funcție de numărul de etape de acumulare a gradientului pentru a nu crea pierderi mai mari atunci când agregăm mai multe etape. Înainte de a optimiza, comprimăm, de asemenea, gradienții pentru o mai bună convergență. În cele din urmă, la fiecare câțiva pași, evaluăm modelul pe setul de evaluare cu noua noastră funcție `evaluate()`:
 
 ```py
 from tqdm.notebook import tqdm
@@ -897,17 +897,17 @@ for epoch in range(num_train_epochs):
                 )
 ```
 
-And that's it -- you now have your own custom training loop for causal language models such as GPT-2 that you can further customize to your needs. 
+Și asta e tot - acum aveți propria buclă de antrenare personalizată pentru modele de limbaj cauzal, cum ar fi GPT-2, pe care o puteți personaliza în continuare în funcție de nevoile voastre.
 
 <Tip>
 
-✏️ **Try it out!** Either create your own custom loss function tailored to your use case, or add another custom step into the training loop.
+✏️ **încercați!** Fie vă creați propria funcție de pierdere personalizată, adaptată la cazul vostru de utilizare, fie adăugați un alt pas personalizat în bucla de antrenare.
 
 </Tip>
 
 <Tip>
 
-✏️ **Try it out!** When running long training experiments it's a good idea to log important metrics using tools such as TensorBoard or Weights & Biases. Add proper logging to the training loop so you can always check how the training is going.
+✏️ **încercați!** Atunci când efectuați experimente de antrenare de lungă durată, este o idee bună să înregistrați parametrii importanți utilizând instrumente precum TensorBoard sau Weights & Biases. Adăugați o logare adecvată la bucla de antrenare, astfel încât să puteți verifica întotdeauna cum decurge antrenarea.
 
 </Tip>
 
diff --git a/chapters/ro/chapter7/7.mdx b/chapters/ro/chapter7/7.mdx
index 72358b6cc..87c0b1924 100644
--- a/chapters/ro/chapter7/7.mdx
+++ b/chapters/ro/chapter7/7.mdx
@@ -1,6 +1,6 @@
 <FrameworkSwitchCourse {fw} />
 
-# Question answering[[question-answering]]
+# Răspunderea la întrebări[[question-answering]]
 
 {#if fw === 'pt'}
 
@@ -22,29 +22,29 @@
 
 {/if}
 
-Este timpul să analizăm răspunsul la întrebări! Această sarcină are mai multe variante, dar cea pe care ne vom concentra în această secțiune se numește răspuns *extractiv* la întrebări. Aceasta presupune formularea de întrebări cu privire la un document și identificarea răspunsurilor ca _spans de text_ în documentul în sine.
+Este timpul să analizăm răspunsul la întrebări! Această sarcină are mai multe variante, dar cea pe care ne vom concentra în această secțiune se numește răspuns *extractiv* la întrebări. Aceasta presupune formularea de întrebări cu privire la un document și identificarea răspunsurilor ca _intervale de text_ în documentul în sine.
 
 <Youtube id="ajPx5LwJD-I"/>
 
-We will fine-tune a BERT model on the [SQuAD dataset](https://rajpurkar.github.io/SQuAD-explorer/), which consists of questions posed by crowdworkers on a set of Wikipedia articles. This will give us a model able to compute predictions like this one:
+Vom face fine-tuning unuimodel BERT pe [datasetul SQuAD] (https://rajpurkar.github.io/SQuAD-explorer/), care constă din întrebări adresate de mulțimea de lucrători pe un set de articole Wikipedia. Acest lucru ne va oferi un model capabil să calculeze predicții precum aceasta:
 
 <iframe src="https://course-demos-bert-finetuned-squad.hf.space" frameBorder="0" height="450" title="Gradio app" class="block dark:hidden container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
 
-This is actually showcasing the model that was trained and uploaded to the Hub using the code shown in this section. You can find it and double-check the predictions [here](https://huggingface.co/huggingface-course/bert-finetuned-squad?context=%F0%9F%A4%97+Transformers+is+backed+by+the+three+most+popular+deep+learning+libraries+%E2%80%94+Jax%2C+PyTorch+and+TensorFlow+%E2%80%94+with+a+seamless+integration+between+them.+It%27s+straightforward+to+train+your+models+with+one+before+loading+them+for+inference+with+the+other.&question=Which+deep+learning+libraries+back+%F0%9F%A4%97+Transformers%3F).
+Aceasta este de fapt o prezentare a modelului care a fost antrenat și încărcat în Hub folosind codul prezentat în această secțiune. Puteți să-l găsiți și să verificați predicțiile [aici](https://huggingface.co/huggingface-course/bert-finetuned-squad?context=%F0%9F%A4%97+Transformers+is+backed+by+the+three+most+popular+deep+learning+libraries+%E2%80%94+Jax%2C+PyTorch+and+TensorFlow+%E2%80%94+with+a+seamless+integration+between+them.+It%27s+straightforward+to+train+your+models+with+one+before+loading+them+for+inference+with+the+other.&question=Which+deep+learning+libraries+back+%F0%9F%A4%97+Transformers%3F).
 
 <Tip>
 
-💡 Encoder-only models like BERT tend to be great at extracting answers to factoid questions like "Who invented the Transformer architecture?" but fare poorly when given open-ended questions like "Why is the sky blue?" In these more challenging cases, encoder-decoder models like T5 and BART are typically used to synthesize the information in a way that's quite similar to [text summarization](/course/chapter7/5). If you're interested in this type of *generative* question answering, we recommend checking out our [demo](https://yjernite.github.io/lfqa.html) based on the [ELI5 dataset](https://huggingface.co/datasets/eli5).
+💡 Modelele bazate doar pe encoding, cum ar fi BERT, tind să fie foarte bune la extragerea răspunsurilor la întrebări de tip factoid, cum ar fi "Cine a inventat arhitectura Transformer?", dar nu se descurcă prea bine atunci când primesc întrebări deschise, cum ar fi "De ce este cerul albastru?" În aceste cazuri mai dificile, modelele encoder-decoder precum T5 și BART sunt utilizate de obicei pentru a sintetiza informațiile într-un mod destul de similar cu [rezumarea textului](/course/chapter7/5). Dacă sunteți interesat de acest tip de răspuns *generativ* la întrebări, vă recomandăm să consultați [demo-ul](https://yjernite.github.io/lfqa.html) nostru bazat pe [datasetul ELI5](https://huggingface.co/datasets/eli5).
 
 </Tip>
 
-## Preparing the data[[preparing-the-data]]
+## Pregătirea datelor[[preparing-the-data]]
 
-The dataset that is used the most as an academic benchmark for extractive question answering is [SQuAD](https://rajpurkar.github.io/SQuAD-explorer/), so that's the one we'll use here. There is also a harder [SQuAD v2](https://huggingface.co/datasets/squad_v2) benchmark, which includes questions that don't have an answer. As long as your own dataset contains a column for contexts, a column for questions, and a column for answers, you should be able to adapt the steps below.
+Datasetul care este cel mai utilizat ca referință academică pentru răspunderea extractivă la întrebări este [SQuAD](https://rajpurkar.github.io/SQuAD-explorer/), deci acesta este cel pe care îl vom utiliza aici. Există, de asemenea, un benchmark mai dificil [SQuAD v2](https://huggingface.co/datasets/squad_v2), care include întrebări care nu au un răspuns. Atât timp cât propriul dataset conține o coloană pentru contexte, o coloană pentru întrebări și o coloană pentru răspunsuri, ar trebui să puteți adapta pașii de mai jos.
 
-### The SQuAD dataset[[the-squad-dataset]]
+### Datasetul SQuD[[the-squad-dataset]]
 
-As usual, we can download and cache the dataset in just one step thanks to `load_dataset()`:
+Ca de obicei, putem descărca și stoca în cache datasetul într-un singur pas datorită funcției `load_dataset()`:
 
 ```py
 from datasets import load_dataset
@@ -52,7 +52,7 @@ from datasets import load_dataset
 raw_datasets = load_dataset("squad")
 ```
 
-We can then have a look at this object to learn more about the SQuAD dataset:
+Ne putem uita apoi la acest obiect pentru a afla mai multe despre datasetul SQuAD:
 
 ```py
 raw_datasets
@@ -71,7 +71,7 @@ DatasetDict({
 })
 ```
 
-It looks like we have everything we need with the `context`, `question`, and `answers` fields, so let's print those for the first element of our training set:
+Se pare că avem tot ce ne trebuie cu câmpurile `context`, `question` și `answers`, așa că să le afișăm pentru primul element al datasetului nostru de antrenare:
 
 ```py
 print("Context: ", raw_datasets["train"][0]["context"])
@@ -85,9 +85,9 @@ Question: 'To whom did the Virgin Mary allegedly appear in 1858 in Lourdes Franc
 Answer: {'text': ['Saint Bernadette Soubirous'], 'answer_start': [515]}
 ```
 
-The `context` and `question` fields are very straightforward to use. The `answers` field is a bit trickier as it comports a dictionary with two fields that are both lists. This is the format that will be expected by the `squad` metric during evaluation; if you are using your own data, you don't necessarily need to worry about putting the answers in the same format. The `text` field is rather obvious, and the `answer_start` field contains the starting character index of each answer in the context.
+Câmpurile `context` și `question` sunt foarte simplu de utilizat. Câmpul `answers` este un pic mai complicat, deoarece conține un dicționar cu două câmpuri care sunt ambele liste. Acesta este formatul care va fi așteptat de metrica `squad` în timpul evaluării; dacă utilizați propriile date, nu trebuie neapărat să vă faceți griji cu privire la plasarea răspunsurilor în același format. Câmpul `text` este destul de evident, iar câmpul `answer_start` conține indicele caracterului de început al fiecărui răspuns din context.
 
-During training, there is only one possible answer. We can double-check this by using the `Dataset.filter()` method:
+În timpul antrenamentului, există un singur răspuns posibil. Putem verifica acest lucru folosind metoda `Dataset.filter()`:
 
 ```py
 raw_datasets["train"].filter(lambda x: len(x["answers"]["text"]) != 1)
@@ -100,7 +100,7 @@ Dataset({
 })
 ```
 
-For evaluation, however, there are several possible answers for each sample, which may be the same or different:
+Cu toate acestea, pentru evaluare, există mai multe răspunsuri posibile pentru fiecare sample, care pot fi identice sau diferite:
 
 ```py
 print(raw_datasets["validation"][0]["answers"])
@@ -112,7 +112,7 @@ print(raw_datasets["validation"][2]["answers"])
 {'text': ['Santa Clara, California', "Levi's Stadium", "Levi's Stadium in the San Francisco Bay Area at Santa Clara, California."], 'answer_start': [403, 355, 355]}
 ```
 
-We won't dive into the evaluation script as it will all be wrapped up by a 🤗 Datasets metric for us, but the short version is that some of the questions have several possible answers, and this script will compare a predicted answer to all the acceptable answers and take the best score. If we take a look at the sample at index 2, for instance:
+Nu ne vom aprofunda în scriptul de evaluare, deoarece totul va fi încorporat de o metrică 🤗 Datasets pentru noi, dar versiunea scurtă este că unele dintre întrebări au mai multe răspunsuri posibile, iar acest script va compara un răspuns prezis cu toate răspunsurile acceptabile și va lua cel mai bun scor. Dacă ne uităm la sampleul de la indexul 2, de exemplu:
 
 ```py
 print(raw_datasets["validation"][2]["context"])
@@ -124,15 +124,15 @@ print(raw_datasets["validation"][2]["question"])
 'Where did Super Bowl 50 take place?'
 ```
 
-we can see that the answer can indeed be one of the three possibilities we saw before.
+putem vedea că răspunsul poate fi într-adevăr una dintre cele trei posibilități pe care le-am văzut anterior.
 
-### Processing the training data[[processing-the-training-data]]
+### Procesarea datelor de antrenare[[processing-the-training-data]]
 
 <Youtube id="qgaM0weJHpA"/>
 
-Let's start with preprocessing the training data. The hard part will be to generate labels for the question's answer, which will be the start and end positions of the tokens corresponding to the answer inside the context.
+Să începem cu preprocesarea datelor de antrenare. Partea dificilă va fi generarea labelurilor pentru răspunsul la întrebare, care vor fi pozițiile de început și de sfârșit ale tokenilor corespunzătoare răspunsului în context.
 
-But let's not get ahead of ourselves. First, we need to convert the text in the input into IDs the model can make sense of, using a tokenizer:
+Dar să nu ne grăbim. În primul rând, trebuie să convertim textul din datele de intrare în ID-uri pe care modelul să le poată înțelege, utilizând un tokenizer:
 
 ```py
 from transformers import AutoTokenizer
@@ -141,7 +141,7 @@ model_checkpoint = "bert-base-cased"
 tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
 ```
 
-As mentioned previously, we'll be fine-tuning a BERT model, but you can use any other model type as long as it has a fast tokenizer implemented. You can see all the architectures that come with a fast version in [this big table](https://huggingface.co/transformers/#supported-frameworks), and to check that the `tokenizer` object you're using is indeed backed by 🤗 Tokenizers you can look at its `is_fast` attribute:
+După cum am menționat anterior, vom face fine-tune unui model BERT, dar puteți utiliza orice alt tip de model, atâta timp cât are implementat un tokenizer rapid. Puteți vedea toate arhitecturile care vin cu o versiune rapidă în [acest tabel mare] (https://huggingface.co/transformers/#supported-frameworks), iar pentru a verifica dacă obiectul `tokenizer` pe care îl utilizați este într-adevăr susținut de 🤗 Tokenizers, vă puteți uita la atributul său `is_fast`:
 
 ```py
 tokenizer.is_fast
@@ -151,13 +151,13 @@ tokenizer.is_fast
 True
 ```
 
-We can pass to our tokenizer the question and the context together, and it will properly insert the special tokens to form a sentence like this:
+Putem transmite împreună întrebarea și contextul către tokenizerul nostru, iar acesta va introduce în mod corespunzător tokenii speciali pentru a forma o propoziție ca aceasta:
 
 ```
 [CLS] question [SEP] context [SEP]
 ```
 
-Let's double-check:
+Hai să verificăm de două ori:
 
 ```py
 context = raw_datasets["train"][0]["context"]
@@ -178,21 +178,21 @@ tokenizer.decode(inputs["input_ids"])
 'and the Gold Dome ), is a simple, modern stone statue of Mary. [SEP]'
 ```
 
-The labels will then be the index of the tokens starting and ending the answer, and the model will be tasked to predicted one start and end logit per token in the input, with the theoretical labels being as follow:
+Labelurile vor fi apoi indexul tokenilor care încep și termină răspunsul, iar modelul va fi însărcinat să prezică un logit de început și de sfârșit pentru fiecare token din intrare, labelurile teoretice fiind următoarele:
 
 <div class="flex justify-center">
-<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/qa_labels.svg" alt="One-hot encoded labels for question answering."/>
-<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/qa_labels-dark.svg" alt="One-hot encoded labels for question answering."/>
+<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/qa_labels.svg" alt="One-hot encoded label pentru răspunderea la întrebări."/>
+<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/qa_labels-dark.svg" alt=One-hot encoded label pentru răspunderea la întrebări."/>
 </div>
 
-In this case the context is not too long, but some of the examples in the dataset have very long contexts that will exceed the maximum length we set (which is 384 in this case). As we saw in [Chapter 6](/course/chapter6/4) when we explored the internals of the `question-answering` pipeline, we will deal with long contexts by creating several training features from one sample of our dataset, with a sliding window between them.
+În acest caz, contextul nu este prea lung, dar unele dintre exemplele din dataset au contexte foarte lungi care vor depăși lungimea maximă pe care am stabilit-o (care este de 384 în acest caz). După cum am văzut în [Capitolul 6](/course/chapter6/4) când am explorat elementele interne ale pipelineului `question-answering`, vom trata contextele lungi prin crearea mai multor caracteristici de antrenare dintr-un sample din datasetul nostru, cu un sliding window între ele.
 
-To see how this works using the current example, we can limit the length to 100 and use a sliding window of 50 tokens. As a reminder, we use:
+Pentru a vedea cum funcționează acest lucru folosind exemplul curent, putem limita lungimea la 100 și putem utiliza un sliding window de 50 de tokeni. Vă reamintim că folosim:
 
-- `max_length` to set the maximum length (here 100)
-- `truncation="only_second"` to truncate the context (which is in the second position) when the question with its context is too long
-- `stride` to set the number of overlapping tokens between two successive chunks (here 50)
-- `return_overflowing_tokens=True` to let the tokenizer know we want the overflowing tokens
+- `max_length` pentru a stabili lungimea maximă (aici 100)
+- `truncation="only_second"` pentru a trunchia contextul (care este în poziția a doua) atunci când întrebarea cu contextul său este prea lungă
+- `stride` pentru a seta numărul de tokeni care se suprapun între două bucăți succesive (aici 50)
+- `return_overflowing_tokens=True` pentru ca tokenizerul să știe că dorim tokenii care se suprapun
 
 ```py
 inputs = tokenizer(
@@ -215,9 +215,9 @@ for ids in inputs["input_ids"]:
 '[CLS] To whom did the Virgin Mary allegedly appear in 1858 in Lourdes France? [SEP]. It is a replica of the grotto at Lourdes, France where the Virgin Mary reputedly appeared to Saint Bernadette Soubirous in 1858. At the end of the main drive ( and in a direct line that connects through 3 statues and the Gold Dome ), is a simple, modern stone statue of Mary. [SEP]'
 ```
 
-As we can see, our example has been in split into four inputs, each of them containing the question and some part of the context. Note that the answer to the question ("Bernadette Soubirous") only appears in the third and last inputs, so by dealing with long contexts in this way we will create some training examples where the answer is not included in the context. For those examples, the labels will be `start_position = end_position = 0` (so we predict the `[CLS]` token). We will also set those labels in the unfortunate case where the answer has been truncated so that we only have the start (or end) of it. For the examples where the answer is fully in the context, the labels will be the index of the token where the answer starts and the index of the token where the answer ends.
+După cum se poate observa, exemplul nostru a fost împărțit în patru inputuri, fiecare dintre acestea conținând întrebarea și o parte din context. Rețineți că răspunsul la întrebare ("Bernadette Soubirous") apare doar în al treilea și ultimul input, astfel încât, prin tratarea contextelor lungi în acest mod, vom crea câteva exemple de antrenament în care răspunsul nu este inclus în context. Pentru aceste exemple, labelurile vor fi `start_position = end_position = 0` (deci vom prezice tokenul `[CLS]`). Vom seta aceste labeluri și în cazul nefericit în care răspunsul a fost trunchiat, astfel încât avem doar începutul (sau sfârșitul) acestuia. Pentru exemplele în care răspunsul este complet în context, labelurile vor fi indicele tokenului în care începe răspunsul și indicele tokenului în care se termină răspunsul.
 
-The dataset provides us with the start character of the answer in the context, and by adding the length of the answer, we can find the end character in the context. To map those to token indices, we will need to use the offset mappings we studied in [Chapter 6](/course/chapter6/4). We can have our tokenizer return these by passing along `return_offsets_mapping=True`:
+Datasetul ne oferă caracterul de început al răspunsului în context, iar prin adăugarea lungimii răspunsului, putem găsi caracterul de sfârșit în context. Pentru a le corela cu indicii tokenilor, va trebui să folosim offset mapping pe care le-am studiat în [Capitolul 6](/course/chapter6/4). Putem face ca tokenizatorul nostru să le returneze trecând `return_offsets_mapping=True`:
 
 ```py
 inputs = tokenizer(
@@ -236,7 +236,7 @@ inputs.keys()
 dict_keys(['input_ids', 'token_type_ids', 'attention_mask', 'offset_mapping', 'overflow_to_sample_mapping'])
 ```
 
-As we can see, we get back the usual input IDs, token type IDs, and attention mask, as well as the offset mapping we required and an extra key, `overflow_to_sample_mapping`. The corresponding value will be of use to us when we tokenize several texts at the same time (which we should do to benefit from the fact that our tokenizer is backed by Rust). Since one sample can give several features, it maps each feature to the example it originated from. Because here we only tokenized one example, we get a list of `0`s:
+După cum putem vedea, primim înapoi ID-urile obișnuite de intrare, ID-urile tipului de token și attention maskul, precum și offset mapping necesar și o cheie suplimentară, `overflow_to_sample_mapping`. Valoarea corespunzătoare ne va fi de folos atunci când vom tokeniza mai multe texte în același timp (ceea ce ar trebui să facem pentru a beneficia de faptul că tokenizerul nostru este susținut de Rust). Deoarece un sample poate oferi mai multe caracteristici, aceasta mapează fiecare caracteristică la exemplul din care provine. Deoarece aici am tokenizat un singur exemplu, obținem o listă de `0`:
 
 ```py
 inputs["overflow_to_sample_mapping"]
@@ -246,7 +246,7 @@ inputs["overflow_to_sample_mapping"]
 [0, 0, 0, 0]
 ```
 
-But if we tokenize more examples, this will become more useful:
+Dar dacă vom tokeniza mai multe exemple, acest lucru va deveni mai util:
 
 ```py
 inputs = tokenizer(
@@ -268,16 +268,16 @@ print(f"Here is where each comes from: {inputs['overflow_to_sample_mapping']}.")
 'Here is where each comes from: [0, 0, 0, 0, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3].'
 ```
 
-As we can see, the first three examples (at indices 2, 3, and 4 in the training set) each gave four features and the last example (at index 5 in the training set) gave 7 features.
+După cum se poate observa, primele trei exemple (la indicii 2, 3 și 4 din setul de antrenare) au dat fiecare câte patru caracteristici, iar ultimul exemplu (la indicele 5 din setul de antrenare) a dat 7 caracteristici.
 
-This information will be useful to map each feature we get to its corresponding label. As mentioned earlier, those labels are:
+Aceste informații vor fi utile pentru a corela fiecare caracteristică obținută cu labeul corespunzător. După cum am menționat anterior, aceste labelurile sunt:
 
-- `(0, 0)` if the answer is not in the corresponding span of the context
-- `(start_position, end_position)` if the answer is in the corresponding span of the context, with `start_position` being the index of the token (in the input IDs) at the start of the answer and `end_position` being the index of the token (in the input IDs) where the answer ends
+- `(0, 0)` dacă răspunsul nu se află în intervalul corespunzător al contextului
+- `(start_position, end_position)` dacă răspunsul se află în intervalul corespunzător al contextului, cu `start_position` fiind indicele tokenului (în ID-urile de intrare) la începutul răspunsului și `end_position` fiind indicele tokenului (în ID-urile de intrare) unde se termină răspunsul
 
-To determine which of these is the case and, if relevant, the positions of the tokens, we first find the indices that start and end the context in the input IDs. We could use the token type IDs to do this, but since those do not necessarily exist for all models (DistilBERT does not require them, for instance), we'll instead use the `sequence_ids()` method of the `BatchEncoding` our tokenizer returns. 
+Pentru a determina care dintre acestea este cazul și, dacă este relevant, pozițiile tokenilor, vom găsi mai întâi indicii care încep și termină contextul în ID-urile de intrare. Am putea folosi ID-urile tipului de token pentru a face acest lucru, dar deoarece acestea nu există neapărat pentru toate modelele (DistilBERT nu le solicită, de exemplu), vom folosi în schimb metoda `sequence_ids()` a `BatchEncoding` pe care tokenizerul nostru o returnează.
 
-Once we have those token indices, we look at the corresponding offsets, which are tuples of two integers representing the span of characters inside the original context. We can thus detect if the chunk of the context in this feature starts after the answer or ends before the answer begins (in which case the label is `(0, 0)`). If that's not the case, we loop to find the first and last token of the answer:
+Odată ce avem indicii tokenilor, ne uităm la offseturile corespunzătoare, care sunt tupeluri de două numere întregi reprezentând intervalul de caractere din contextul original. Astfel, putem detecta dacă bucățica de context din această caracteristică începe după răspuns sau se termină înainte de începerea răspunsului (caz în care eticheta este `(0, 0)`). Dacă nu este cazul, facem o buclă pentru a găsi primul și ultimul token al răspunsului:
 
 ```py
 answers = raw_datasets["train"][2:6]["answers"]
@@ -324,7 +324,7 @@ start_positions, end_positions
  [85, 53, 21, 0, 0, 70, 33, 0, 40, 0, 0, 0, 68, 35, 0, 0, 0, 0, 0])
 ```
 
-Let's take a look at a few results to verify that our approach is correct. For the first feature we find `(83, 85)` as labels, so let's compare the theoretical answer with the decoded span of tokens from 83 to 85 (inclusive):
+Să aruncăm o privire la câteva rezultate pentru a verifica dacă abordarea noastră este corectă. Pentru prima caracteristică găsim `(83, 85)` ca labeluri, așa că comparăm răspunsul teoretic cu intervalul decodat de tokeni de la 83 la 85 (inclusiv):
 
 ```py
 idx = 0
@@ -342,7 +342,7 @@ print(f"Theoretical answer: {answer}, labels give: {labeled_answer}")
 'Theoretical answer: the Main Building, labels give: the Main Building'
 ```
 
-So that's a match! Now let's check index 4, where we set the labels to `(0, 0)`, which means the answer is not in the context chunk of that feature:
+Deci, asta e o potrivire! Acum să verificăm indexul 4, unde am setat labelurile la `(0, 0)`, ceea ce înseamnă că răspunsul nu se află în chunkul de context al acelei caracteristici:
 
 ```py
 idx = 4
@@ -357,15 +357,15 @@ print(f"Theoretical answer: {answer}, decoded example: {decoded_example}")
 'Theoretical answer: a Marian place of prayer and reflection, decoded example: [CLS] What is the Grotto at Notre Dame? [SEP] Architecturally, the school has a Catholic character. Atop the Main Building\'s gold dome is a golden statue of the Virgin Mary. Immediately in front of the Main Building and facing it, is a copper statue of Christ with arms upraised with the legend " Venite Ad Me Omnes ". Next to the Main Building is the Basilica of the Sacred Heart. Immediately behind the basilica is the Grot [SEP]'
 ```
 
-Indeed, we don't see the answer inside the context.
+Într-adevăr, nu vedem răspunsul în interiorul contextului.
 
 <Tip>
 
-✏️ **Your turn!** When using the XLNet architecture, padding is applied on the left and the question and context are switched. Adapt all the code we just saw to the XLNet architecture (and add `padding=True`). Be aware that the `[CLS]` token may not be at the 0 position with padding applied.
+✏️ **E rândul tău!** Atunci când se utilizează arhitectura XLNet, paddingul este aplicat la stânga, iar întrebarea și contextul sunt schimbate. Adaptați tot codul pe care tocmai l-am văzut la arhitectura XLNet (și adăugați `padding=True`). Fiți conștienți de faptul că tokenul `[CLS]` ar putea să nu se afle la poziția 0 în cazul aplicării paddingului.
 
 </Tip>
 
-Now that we have seen step by step how to preprocess our training data, we can group it in a function we will apply on the whole training dataset. We'll pad every feature to the maximum length we set, as most of the contexts will be long (and the corresponding samples will be split into several features), so there is no real benefit to applying dynamic padding here:
+Acum că am văzut pas cu pas cum să preprocesăm datele de antrenare, le putem grupa într-o funcție pe care o vom aplica întregului dataset de antrenare. Vom umple fiecare caracteristică la lungimea maximă pe care am stabilit-o, deoarece majoritatea contextelor vor fi lungi (iar sampleurile corespunzătoare vor fi împărțite în mai multe caracteristici), astfel încât nu există niciun beneficiu real pentru aplicarea paddingului dinamic aici:
 
 ```py
 max_length = 384
@@ -428,9 +428,9 @@ def preprocess_training_examples(examples):
     return inputs
 ```
 
-Note that we defined two constants to determine the maximum length used as well as the length of the sliding window, and that we added a tiny bit of cleanup before tokenizing: some of the questions in the SQuAD dataset have extra spaces at the beginning and the end that don't add anything (and take up space when being tokenized if you use a model like RoBERTa), so we removed those extra spaces.
+Rețineți că am definit două constante pentru a determina lungimea maximă utilizată, precum și lungimea al sliding window, și că am adăugat o mică curățare înainte de tokenizare: unele dintre întrebările din datasetul SQuAD au spații suplimentare la început și la sfârșit care nu adaugă nimic (și ocupă spațiu atunci când sunt tokenizate dacă utilizați un model precum RoBERTa), așa că am eliminat aceste spații suplimentare.
 
-To apply this function to the whole training set, we use the `Dataset.map()` method with the `batched=True` flag. It's necessary here as we are changing the length of the dataset (since one example can give several training features):
+Pentru a aplica această funcție întregului set de antrenare, folosim metoda `Dataset.map()` cu flagul `batched=True`. Acesta este necesar aici, deoarece modificăm lungimea datasetului (deoarece un exemplu poate oferi mai multe caracteristici de antrenare):
 
 ```py
 train_dataset = raw_datasets["train"].map(
@@ -445,13 +445,14 @@ len(raw_datasets["train"]), len(train_dataset)
 (87599, 88729)
 ```
 
-As we can see, the preprocessing added roughly 1,000 features. Our training set is now ready to be used -- let's dig into the preprocessing of the validation set!
+După cum putem vedea, preprocesarea a adăugat aproximativ 1.000 de caracteristici. Setul nostru de antrenare este acum gata de utilizare - să trecem la preprocesarea setului de validare!
 
-### Processing the validation data[[processing-the-validation-data]]
+### Procesarea datelor de validare[[processing-the-validation-data]]
 
-Preprocessing the validation data will be slightly easier as we don't need to generate labels (unless we want to compute a validation loss, but that number won't really help us understand how good the model is). The real joy will be to interpret the predictions of the model into spans of the original context. For this, we will just need to store both the offset mappings and some way to match each created feature to the original example it comes from. Since there is an ID column in the original dataset, we'll use that ID.
+Preprocesarea datelor de validare va fi puțin mai ușoară, deoarece nu trebuie să generăm labeluri (cu excepția cazului în care dorim să calculăm o pierdere de validare, dar acest număr nu ne va ajuta să înțelegem cât de bun este modelul). Adevărata bucurie va fi să interpretăm predicțiile modelului în intervale ale contextului original. Pentru aceasta, va trebui doar să stocăm atât offset mappings, cât și o modalitate de a corela fiecare caracteristică creată cu exemplul original din care provine. Deoarece există o coloană ID în datasetul original, vom utiliza acel ID.
+
+Singurul lucru pe care îl vom adăuga aici este o mică curățare a offset mappings. Acestea vor conține offseturi pentru întrebare și context, dar odată ajunși în etapa de postprocesare nu vom avea nicio modalitate de a ști care parte a ID-urilor de intrare corespunde contextului și care parte este întrebarea (metoda `sequence_ids()` pe care am folosit-o este disponibilă doar pentru ieșirea tokenizerului). Prin urmare, vom seta offseturile corespunzătoare întrebării la `None`:
 
-The only thing we'll add here is a tiny bit of cleanup of the offset mappings. They will contain offsets for the question and the context, but once we're in the post-processing stage we won't have any way to know which part of the input IDs corresponded to the context and which part was the question (the `sequence_ids()` method we used is available for the output of the tokenizer only). So, we'll set the offsets corresponding to the question to `None`:
 
 ```py
 def preprocess_validation_examples(examples):
@@ -484,7 +485,7 @@ def preprocess_validation_examples(examples):
     return inputs
 ```
 
-We can apply this function on the whole validation dataset like before:
+Putem aplica această funcție pe întregul dataset de validare, ca și înainte:
 
 ```py
 validation_dataset = raw_datasets["validation"].map(
@@ -499,25 +500,25 @@ len(raw_datasets["validation"]), len(validation_dataset)
 (10570, 10822)
 ```
 
-In this case we've only added a couple of hundred samples, so it appears the contexts in the validation dataset are a bit shorter.
+În acest caz, am adăugat doar câteva sute de sampleuri, astfel încât se pare că contextele din datasetul de validare sunt un pic mai scurte.
 
-Now that we have preprocessed all the data, we can get to the training. 
+Acum că am preprocesat toate datele, putem trece la antrenare.
 
 {#if fw === 'pt'}
 
-## Fine-tuning the model with the `Trainer` API[[fine-tuning-the-model-with-the-trainer-api]]
+## Fine-tuningul modelului cu API-ul `Trainer`[[fine-tuning-the-model-with-the-trainer-api]]
 
-The training code for this example will look a lot like the code in the previous sections -- the hardest thing will be to write the `compute_metrics()` function. Since we padded all the samples to the maximum length we set, there is no data collator to define, so this metric computation is really the only thing we have to worry about. The difficult part will be to post-process the model predictions into spans of text in the original examples; once we have done that, the metric from the 🤗 Datasets library will do most of the work for us.
+Codul de antrenare pentru acest exemplu va semăna foarte mult cu codul din secțiunile anterioare - cel mai greu lucru va fi să scriem funcția `compute_metrics()`. Deoarece am făcut padding tuturor sampleurilor la lungimea maximă pe care am stabilit-o, nu trebuie definit niciun data collator, astfel încât acest calcul al metricii este singurul lucru de care trebuie să ne facem griji. Partea dificilă va fi să postprocesăm predicțiile modelului în intervale de text în exemplele originale; odată ce am făcut acest lucru, metrica din biblioteca 🤗 Datasets va face cea mai mare parte a muncii pentru noi.
 
 {:else}
 
-## Fine-tuning the model with Keras[[fine-tuning-the-model-with-keras]]
+## Fine-tuningul unui model cu Keras[[fine-tuning-the-model-with-keras]]
 
-The training code for this example will look a lot like the code in the previous sections, but computing the metrics will be uniquely challenging. Since we padded all the samples to the maximum length we set, there is no data collator to define, so this metric computation is really the only thing we have to worry about. The hard part will be to post-process the model predictions into spans of text in the original examples; once we have done that, the metric from the 🤗 Datasets library will do most of the work for us.
+Codul de antrenare pentru acest exemplu va semăna foarte mult cu codul din secțiunile anterioare, dar calcularea metricilor va fi o provocare unică. Din moment ce am făcut padding tuturor sampleurilor la lungimea maximă pe care am stabilit-o, nu există niciun data collator care să fie definit, astfel încât acest calcul al metricii este singurul lucru de care trebuie să ne facem griji. Partea dificilă va fi să postprocesăm predicțiile modelului în intervale de text în exemplele originale; odată ce am făcut acest lucru, metrica din biblioteca 🤗 Datasets va face cea mai mare parte a muncii pentru noi.
 
 {/if}
 
-### Post-processing[[post-processing]]
+### Post-procesare[[post-processing]]
 
 {#if fw === 'pt'}
 
@@ -529,16 +530,16 @@ The training code for this example will look a lot like the code in the previous
 
 {/if}
 
-The model will output logits for the start and end positions of the answer in the input IDs, as we saw during our exploration of the [`question-answering` pipeline](/course/chapter6/3b). The post-processing step will be similar to what we did there, so here's a quick reminder of the actions we took:
+Modelul va produce logits pentru pozițiile de început și de sfârșit ale răspunsului în ID-urile de intrare, așa cum am văzut în timpul explorării [`question-answering` pipeline](/course/chapter6/3b). Etapa de post-procesare va fi similară cu ceea ce am făcut acolo, așa că iată vă reamintim ce acțiuni am luat:
 
-- We masked the start and end logits corresponding to tokens outside of the context.
-- We then converted the start and end logits into probabilities using a softmax.
-- We attributed a score to each `(start_token, end_token)` pair by taking the product of the corresponding two probabilities.
-- We looked for the pair with the maximum score that yielded a valid answer (e.g., a `start_token` lower than `end_token`).
+- Am mascat logiturile de început și de sfârșit corespunzătoare tokenilor din afara contextului.
+- Am convertit apoi logiturile de început și de sfârșit în probabilități utilizând un softmax.
+- Am atribuit un scor fiecărei perechi `(start_token, end_token)` prin calcularea produsului celor două probabilități corespunzătoare.
+- Am căutat perechea cu scorul maxim care a dat un răspuns valid (de exemplu, `start_token` mai mic decât `end_token`).
 
-Here we will change this process slightly because we don't need to compute actual scores (just the predicted answer). This means we can skip the softmax step. To go faster, we also won't score all the possible `(start_token, end_token)` pairs, but only the ones corresponding to the highest `n_best` logits (with `n_best=20`). Since we will skip the softmax, those scores will be logit scores, and will be obtained by taking the sum of the start and end logits (instead of the product, because of the rule \\(\log(ab) = \log(a) + \log(b)\\)).
+Aici vom schimba ușor acest proces, deoarece nu trebuie să calculăm scorurile reale (doar răspunsul prezis). Aceasta înseamnă că putem sări peste etapa softmax. De asemenea, pentru a merge mai repede, nu vom puncta toate perechile posibile `(start_token, end_token)`, ci doar pe cele care corespund celor mai mari `n_best` logits (cu `n_best=20`). Deoarece vom trece peste softmax, aceste scoruri vor fi scoruri logit și vor fi obținute prin însumarea logiturilor de început și de sfârșit (în loc de produs, datorită regulii \\(\log(ab) = \log(a) + \log(b)\\\)).
 
-To demonstrate all of this, we will need some kind of predictions. Since we have not trained our model yet, we are going to use the default model for the QA pipeline to generate some predictions on a small part of the validation set. We can use the same processing function as before; because it relies on the global constant `tokenizer`, we just have to change that object to the tokenizer of the model we want to use temporarily:
+Pentru a demonstra toate acestea, vom avea nevoie de un fel de predicții. Deoarece nu ne-am antrenat încă modelul, vom utiliza modelul implicit pentru pipelineuri QA pentru a genera unele predicții pe o mică parte a setului de validare. Putem utiliza aceeași funcție de procesare ca înainte; deoarece se bazează pe constanta globală `tokenizer`, trebuie doar să schimbăm acest obiect cu tokenizerul modelului pe care dorim să îl utilizăm temporar:
 
 ```python
 small_eval_set = raw_datasets["validation"].select(range(100))
@@ -552,13 +553,13 @@ eval_set = small_eval_set.map(
 )
 ```
 
-Now that the preprocessing is done, we change the tokenizer back to the one we originally picked:
+Acum că preprocesarea este terminată, schimbăm tokenizerul înapoi la cel pe care l-am ales inițial:
 
 ```python
 tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
 ```
 
-We then remove the columns of our `eval_set` that are not expected by the model, build a batch with all of that small validation set, and pass it through the model. If a GPU is available, we use it to go faster:
+Apoi eliminăm coloanele din `eval_set` care nu sunt așteptate de model, construim un batch cu întregul set de validare și îl trecem prin model. Dacă este disponibil un GPU, îl folosim pentru a merge mai repede:
 
 {#if fw === 'pt'}
 
@@ -579,7 +580,7 @@ with torch.no_grad():
     outputs = trained_model(**batch)
 ```
 
-Since the `Trainer` will give us predictions as NumPy arrays, we grab the start and end logits and convert them to that format:
+Deoarece `Trainer` ne va oferi predicții sub formă de matrici NumPy, preluăm logiturile de început și de sfârșit și le convertim în acest format:
 
 ```python
 start_logits = outputs.start_logits.cpu().numpy()
@@ -601,7 +602,7 @@ trained_model = TFAutoModelForQuestionAnswering.from_pretrained(trained_checkpoi
 outputs = trained_model(**batch)
 ```
 
-For ease of experimentation, let's convert these outputs to NumPy arrays:
+Pentru ușurința experimentelor, să convertim aceste rezultate în array-uri NumPy:
 
 ```python
 start_logits = outputs.start_logits.numpy()
@@ -610,7 +611,7 @@ end_logits = outputs.end_logits.numpy()
 
 {/if}
 
-Now, we need to find the predicted answer for each example in our `small_eval_set`. One example may have been split into several features in `eval_set`, so the first step is to map each example in `small_eval_set` to the corresponding features in `eval_set`:
+Acum, trebuie să găsim răspunsul prezis pentru fiecare exemplu din `small_eval_set`. Este posibil ca un exemplu să fi fost împărțit în mai multe caracteristici în `eval_set`, astfel încât primul pas constă în maparea fiecărui exemplu din `small_eval_set` la caracteristicile corespunzătoare din `eval_set`:
 
 ```python
 import collections
@@ -620,13 +621,13 @@ for idx, feature in enumerate(eval_set):
     example_to_features[feature["example_id"]].append(idx)
 ```
 
-With this in hand, we can really get to work by looping through all the examples and, for each example, through all the associated features. As we said before, we'll look at the logit scores for the `n_best` start logits and end logits, excluding positions that give:
+Cu acest lucru în mână, ne putem apuca de treabă trecând prin toate exemplele și, pentru fiecare exemplu, prin toate caracteristicile asociate. Așa cum am spus mai devreme, ne vom uita la scorurile logit pentru `n_cele mai bune` logits de început și de sfârșit, excluzând pozițiile care dau:
 
-- An answer that wouldn't be inside the context
-- An answer with negative length
-- An answer that is too long (we limit the possibilities at `max_answer_length=30`)
+- Un răspuns care nu ar fi în interiorul contextului
+- Un răspuns cu lungime negativă
+- Un răspuns care este prea lung (limităm posibilitățile la `max_answer_length=30`)
 
-Once we have all the scored possible answers for one example, we just pick the one with the best logit score:
+Odată ce avem toate răspunsurile posibile scored pentru un exemplu, îl alegem pe cel cu cel mai bun scor logit:
 
 ```python
 import numpy as np
@@ -670,7 +671,7 @@ for example in small_eval_set:
     predicted_answers.append({"id": example_id, "prediction_text": best_answer["text"]})
 ```
 
-The final format of the predicted answers is the one that will be expected by the metric we will use. As usual, we can load it with the help of the 🤗 Evaluate library:
+Formatul final al răspunsurilor prezise este cel care va fi așteptat de metrica pe care o vom utiliza. Ca de obicei, o putem încărca cu ajutorul bibliotecii 🤗 Evaluate:
 
 ```python
 import evaluate
@@ -678,7 +679,7 @@ import evaluate
 metric = evaluate.load("squad")
 ```
 
-This metric expects the predicted answers in the format we saw above (a list of dictionaries with one key for the ID of the example and one key for the predicted text) and the theoretical answers in the format below (a list of dictionaries with one key for the ID of the example and one key for the possible answers):
+Această metrică așteaptă răspunsurile prezise în formatul pe care l-am văzut mai sus (o listă de dicționare cu o cheie pentru ID-ul exemplului și o cheie pentru textul prezis) și răspunsurile teoretice în formatul de mai jos (o listă de dicționare cu o cheie pentru ID-ul exemplului și o cheie pentru răspunsurile posibile):
 
 ```python
 theoretical_answers = [
@@ -686,7 +687,7 @@ theoretical_answers = [
 ]
 ```
 
-We can now check that we get sensible results by looking at the first element of both lists:
+Acum putem verifica dacă obținem rezultate rezonabile analizând primul element din ambele liste:
 
 ```python
 print(predicted_answers[0])
@@ -698,7 +699,7 @@ print(theoretical_answers[0])
 {'id': '56be4db0acb8001400a502ec', 'answers': {'text': ['Denver Broncos', 'Denver Broncos', 'Denver Broncos'], 'answer_start': [177, 177, 177]}}
 ```
 
-Not too bad! Now let's have a look at the score the metric gives us:
+Nu-i deloc rău! Acum putem arunca o privire la scorul pe care ni-l oferă metrica:
 
 ```python
 metric.compute(predictions=predicted_answers, references=theoretical_answers)
@@ -708,17 +709,17 @@ metric.compute(predictions=predicted_answers, references=theoretical_answers)
 {'exact_match': 83.0, 'f1': 88.25}
 ```
 
-Again, that's rather good considering that according to [its paper](https://arxiv.org/abs/1910.01108v2) DistilBERT fine-tuned on SQuAD obtains 79.1 and 86.9 for those scores on the whole dataset.
+Din nou, acest lucru este destul de bun, având în vedere că, în conformitate cu [documentul acestuia] (https://arxiv.org/abs/1910.01108v2), DistilBERT fine-tuned pe SQuAD obține 79,1 și 86,9 pentru aceste scoruri pe întregul dataset.
 
 {#if fw === 'pt'}
 
-Now let's put everything we just did in a `compute_metrics()` function that we will use in the `Trainer`. Normally, that `compute_metrics()` function only receives a tuple `eval_preds` with logits and labels. Here we will need a bit more, as we have to look in the dataset of features for the offset and in the dataset of examples for the original contexts, so we won't be able to use this function to get regular evaluation results during training. We will only use it at the end of training to check the results.
+Acum să punem tot ce am făcut într-o funcție `compute_metrics()` pe care o vom folosi în `Trainer`. În mod normal, această funcție `compute_metrics()` primește doar un tuple `eval_preds` cu logiți și labels. Aici vom avea nevoie de ceva mai mult, deoarece trebuie să căutăm în dataset de caracteristici pentru offset și în datasetul de exemple pentru contextele originale, astfel încât nu vom putea utiliza această funcție pentru a obține rezultate de evaluare regulate în timpul antrenării. O vom utiliza doar la sfârșitul antrenamentului pentru a verifica rezultatele.
 
-The `compute_metrics()` function groups the same steps as before; we just add a small check in case we don't come up with any valid answers (in which case we predict an empty string).
+Funcția `compute_metrics()` grupează aceiași pași ca înainte; adăugăm doar o mică verificare în cazul în care nu obținem niciun răspuns valid (caz în care prezicem un șir gol).
 
 {:else}
 
-Now let's put everything we just did in a `compute_metrics()` function that we will use after training our model. We will need to pass a bit more than just the output logits, as we have to look in the dataset of features for the offset and in the dataset of examples for the original contexts:
+Acum să punem tot ce tocmai am făcut într-o funcție `compute_metrics()` pe care o vom folosi după antrenarea modelului nostru. Va trebui să transmitem puțin mai mult decât output logits, deoarece trebuie să căutăm în datasetul de caracteristici pentru offset și în datasetul de exemple pentru contextele originale:
 
 {/if}
 
@@ -776,7 +777,7 @@ def compute_metrics(start_logits, end_logits, features, examples):
     return metric.compute(predictions=predicted_answers, references=theoretical_answers)
 ```
 
-We can check it works on our predictions:
+Putem verifica dacă funcționează pe baza predicțiilor noastre:
 
 ```python
 compute_metrics(start_logits, end_logits, eval_set, small_eval_set)
@@ -786,13 +787,13 @@ compute_metrics(start_logits, end_logits, eval_set, small_eval_set)
 {'exact_match': 83.0, 'f1': 88.25}
 ```
 
-Looking good! Now let's use this to fine-tune our model.
+Arată bine! Acum să folosim acest lucru pentru a face fine-tune modelului nostru.
 
-### Fine-tuning the model[[fine-tuning-the-model]]
+### Fine-tuningul modelului[[fine-tuning-the-model]]
 
 {#if fw === 'pt'}
 
-We are now ready to train our model. Let's create it first, using the `AutoModelForQuestionAnswering` class like before:
+Acum suntem gata să antrenăm modelul. Să-l creăm mai întâi, folosind clasa `AutoModelForQuestionAnswering` ca și înainte:
 
 ```python
 model = AutoModelForQuestionAnswering.from_pretrained(model_checkpoint)
@@ -800,7 +801,7 @@ model = AutoModelForQuestionAnswering.from_pretrained(model_checkpoint)
 
 {:else}
 
-We are now ready to train our model. Let's create it first, using the `TFAutoModelForQuestionAnswering` class like before:
+Acum suntem gata să antrenăm modelul. Să-l creăm mai întâi, folosind clasa `TFAutoModelForQuestionAnswering` ca mai înainte:
 
 ```python
 model = TFAutoModelForQuestionAnswering.from_pretrained(model_checkpoint)
@@ -808,9 +809,10 @@ model = TFAutoModelForQuestionAnswering.from_pretrained(model_checkpoint)
 
 {/if}
 
-As usual, we get a warning that some weights are not used (the ones from the pretraining head) and some others are initialized randomly (the ones for the question answering head). You should be used to this by now, but that means this model is not ready to be used just yet and needs fine-tuning -- good thing we're about to do that!
+Ca de obicei, primim un avertisment că unele weighturi nu sunt utilizate (cele din headul de preantrenare), iar altele sunt inițializate aleatoriu (cele pentru headul pentru răspuns la întrebări). Ar trebui să fiți obișnuiți cu acest lucru până acum, dar înseamnă că acest model nu este încă pregătit pentru a fi utilizat și trebuie să fie fine-tuned - bine că suntem pe cale să facem asta!
+
+Pentru a putea trimite modelul nostru către Hub, va trebui să ne conectăm la Hugging Face. Dacă executați acest cod într-un notebook, puteți face acest lucru cu următoarea funcție utilitară, care afișează un widget în care puteți introduce datele voastre de autentificare:
 
-To be able to push our model to the Hub, we'll need to log in to Hugging Face. If you're running this code in a notebook, you can do so with the following utility function, which displays a widget where you can enter your login credentials:
 
 ```python
 from huggingface_hub import notebook_login
@@ -818,7 +820,7 @@ from huggingface_hub import notebook_login
 notebook_login()
 ```
 
-If you aren't working in a notebook, just type the following line in your terminal:
+Dacă nu lucrați într-un notebook, tastați următoarea linie în terminal:
 
 ```bash
 huggingface-cli login
@@ -826,11 +828,11 @@ huggingface-cli login
 
 {#if fw === 'pt'}
 
-Once this is done, we can define our `TrainingArguments`. As we said when we defined our function to compute the metric, we won't be able to have a regular evaluation loop because of the signature of the `compute_metrics()` function. We could write our own subclass of `Trainer` to do this (an approach you can find in the [question answering example script](https://github.com/huggingface/transformers/blob/master/examples/pytorch/question-answering/trainer_qa.py)), but that's a bit too long for this section. Instead, we will only evaluate the model at the end of training here and show you how to do a regular evaluation in "A custom training loop" below.
+Odată făcut acest lucru, ne putem defini `TrainingArguments`. Așa cum am spus atunci când am definit funcția noastră pentru a calcula metrica, nu vom putea avea o buclă de evaluare obișnuită din cauza parametrilor funcției `compute_metrics()`. Am putea scrie propria noastră subclasă a `Trainer` pentru a face acest lucru (o abordare pe care o puteți găsi în [scriptul exemplu pentru răspunderea la întrebări](https://github.com/huggingface/transformers/blob/master/examples/pytorch/question-answering/trainer_qa.py)), dar este un pic prea lung pentru această secțiune. În schimb, aici vom evalua modelul doar la sfârșitul antrenării și vă vom arăta cum să efectuați o evaluare obișnuită în secțiunea "O buclă de antrenare personalizată" de mai jos.
 
-This is really where the `Trainer` API shows its limits and the 🤗 Accelerate library shines: customizing the class to a specific use case can be painful, but tweaking a fully exposed training loop is easy.
+Acesta este într-adevăr locul în care API-ul `Trainer` își arată limitele și biblioteca 🤗 Accelerate strălucește: personalizarea clasei pentru un caz de utilizare specific poate fi greu de implementat, dar modificarea unei bucle de antrenare complet expuse este ușoară.
 
-Let's take a look at our `TrainingArguments`:
+Să aruncăm o privire la `TrainingArguments`:
 
 ```python
 from transformers import TrainingArguments
@@ -847,11 +849,11 @@ args = TrainingArguments(
 )
 ```
 
-We've seen most of these before: we set some hyperparameters (like the learning rate, the number of epochs we train for, and some weight decay) and indicate that we want to save the model at the end of every epoch, skip evaluation, and upload our results to the Model Hub. We also enable mixed-precision training with `fp16=True`, as it can speed up the training nicely on a recent GPU.
+Am mai văzut cele mai multe dintre acestea: stabilim niște hiperparametrii (cum ar fi learning rate, numărul de epoci pentru antrenament și o anumită scădere a weighturilor) și indicăm că dorim să salvăm modelul la sfârșitul fiecărei epoci, să sărim peste evaluare și să încărcăm rezultatele noastre în Model Hub. De asemenea, activăm antrenarea cu precizie mixtă cu `fp16=True`, deoarece aceasta poate accelera foarte mult antrenarea pe un GPU recent.
 
 {:else}
 
-Now that's done, we can create our TF Datasets. We can use the simple default data collator this time:
+Acum, putem crea dataseturile TF. De data aceasta, putem utiliza data collatorul de bază:
 
 ```python
 from transformers import DefaultDataCollator
@@ -859,7 +861,7 @@ from transformers import DefaultDataCollator
 data_collator = DefaultDataCollator(return_tensors="tf")
 ```
 
-And now we create the datasets as usual.
+Și acum creăm dataseturile ca de obicei.
 
 ```python
 tf_train_dataset = model.prepare_tf_dataset(
@@ -876,16 +878,16 @@ tf_eval_dataset = model.prepare_tf_dataset(
 )
 ```
 
-Next, we set up our training hyperparameters and compile our model:
+În continuare, stabilim hiperparametrii de antrenament și compilăm modelul nostru:
 
 ```python
 from transformers import create_optimizer
 from transformers.keras_callbacks import PushToHubCallback
 import tensorflow as tf
 
-# The number of training steps is the number of samples in the dataset, divided by the batch size then multiplied
-# by the total number of epochs. Note that the tf_train_dataset here is a batched tf.data.Dataset,
-# not the original Hugging Face Dataset, so its len() is already num_samples // batch_size.
+# Numărul etapelor de antrenare este numărul de sampleuri din dataset, împărțit la dimensiunea batch-ului, apoi înmulțit
+# cu numărul total de epoci. Rețineți că datasetul tf_train_dataset de aici este un batched tf.data.Dataset,
+# nu datasetul original Hugging Face, deci len() este deja num_samples // batch_size.
 num_train_epochs = 3
 num_train_steps = len(tf_train_dataset) * num_train_epochs
 optimizer, schedule = create_optimizer(
@@ -896,25 +898,26 @@ optimizer, schedule = create_optimizer(
 )
 model.compile(optimizer=optimizer)
 
-# Train in mixed-precision float16
+# Antrenarea în mixed-precision float16
 tf.keras.mixed_precision.set_global_policy("mixed_float16")
 ```
 
-Finally, we're ready to train with `model.fit()`. We use a `PushToHubCallback` to upload the model to the Hub after each epoch.
+În cele din urmă, suntem gata să ne antrenăm cu `model.fit()`. Folosim un `PushToHubCallback` pentru a încărca modelul în Hub după fiecare epocă.
 
 {/if}
 
-By default, the repository used will be in your namespace and named after the output directory you set, so in our case it will be in `"sgugger/bert-finetuned-squad"`. We can override this by passing a `hub_model_id`; for instance, to push the model to the `huggingface_course` organization we used `hub_model_id="huggingface_course/bert-finetuned-squad"` (which is the model we linked to at the beginning of this section).
+În mod implicit, repositoriul utilizat va fi în namespaceul vostru și numit după foldrul de ieșire pe care l-ați stabilit, deci în cazul nostru va fi în `"sgugger/bert-finetuned-squad"`. Putem trece peste acest lucru prin trecerea unui `hub_model_id`; de exemplu, pentru a încărca modelul în organizația `huggingface_course`, am folosit `hub_model_id="huggingface_course/bert-finetuned-squad"` (care este modelul la care am făcut legătura la începutul acestei secțiuni).
+
 
 {#if fw === 'pt'}
 
 <Tip>
 
-💡 If the output directory you are using exists, it needs to be a local clone of the repository you want to push to (so set a new name if you get an error when defining your `Trainer`).
+💡 Dacă folderul de ieșire pe care îl utilizați există, acesta trebuie să fie o clonă locală a repositoriul în care doriți să faceți push (deci setați un nume nou dacă primiți o eroare la definirea `Trainer`).
 
 </Tip>
 
-Finally, we just pass everything to the `Trainer` class and launch the training:
+În cele din urmă, trecem totul în clasa `Trainer` și lansăm antrenarea:
 
 ```python
 from transformers import Trainer
@@ -936,17 +939,17 @@ from transformers.keras_callbacks import PushToHubCallback
 
 callback = PushToHubCallback(output_dir="bert-finetuned-squad", tokenizer=tokenizer)
 
-# We're going to do validation afterwards, so no validation mid-training
+# Vom face validarea după aceea, deci nu vom face o validare în timpul antrenării
 model.fit(tf_train_dataset, callbacks=[callback], epochs=num_train_epochs)
 ```
 
 {/if}
 
-Note that while the training happens, each time the model is saved (here, every epoch) it is uploaded to the Hub in the background. This way, you will be able to to resume your training on another machine if necessary. The whole training takes a while (a little over an hour on a Titan RTX), so you can grab a coffee or reread some of the parts of the course that you've found more challenging while it proceeds. Also note that as soon as the first epoch is finished, you will see some weights uploaded to the Hub and you can start playing with your model on its page.
+Rețineți că, în timpul antrenamentului, de fiecare dată când modelul este salvat (aici, la fiecare epocă), acesta este încărcat în Hub pe fundal. În acest fel, veți putea să reluați antrenarea pe un alt device, dacă este necesar. Întreaga pregătire durează ceva timp (puțin peste o oră pe un Titan RTX), așa că puteți să vă luați o cafea sau să recitiți unele dintre părțile cursului care vi s-au părut mai dificile în timp ce se desfășoară. De asemenea, rețineți că, de îndată ce se termină prima epocă, veți vedea câteva weighturu încărcate în Hub și puteți începe să vă jucați cu modelul vostru pe pagina acestuia.
 
 {#if fw === 'pt'}
 
-Once the training is complete, we can finally evaluate our model (and pray we didn't spend all that compute time on nothing). The `predict()` method of the `Trainer` will return a tuple where the first elements will be the predictions of the model (here a pair with the start and end logits). We send this to our `compute_metrics()` function:
+Odată ce antrenamentul este complet, putem în cele din urmă să evaluăm modelul (și să ne rugăm să nu fi petrecut tot timpul de calcul degeaba). Metoda `predict()` a `Trainer` va returna un tuple în care primele elemente vor fi predicțiile modelului (aici o pereche cu logiturile de început și de sfârșit). Trimitem acest rezultat funcției noastre `compute_metrics()`:
 
 ```python
 predictions, _, _ = trainer.predict(validation_dataset)
@@ -956,7 +959,7 @@ compute_metrics(start_logits, end_logits, validation_dataset, raw_datasets["vali
 
 {:else}
 
-Once the training is complete, we can finally evaluate our model (and pray we didn't spend all that compute time on nothing). The `predict()` method of our `model` will take care of getting predictions, and since we did all the hard work of defining a `compute_metrics()` function earlier, we can get our results in a single line:
+Odată ce antrenamentul este complet, putem în sfârșit să ne evaluăm modelul (și să ne rugăm să nu fi cheltuit tot timpul de calcul degeaba). Metoda `predict()` a modelului nostru `model` se va ocupa de obținerea predicțiilor și, deoarece am făcut toată munca grea de definire a unei funcții `compute_metrics()` mai devreme, putem obține rezultatele noastre într-o singură linie:
 
 ```python
 predictions = model.predict(tf_eval_dataset)
@@ -974,45 +977,45 @@ compute_metrics(
 {'exact_match': 81.18259224219489, 'f1': 88.67381321905516}
 ```
 
-Great! As a comparison, the baseline scores reported in the BERT article for this model are 80.8 and 88.5, so we're right where we should be.
+Super! Ca o comparație, scorurile de bază raportate în articolul BERT pentru acest model sunt 80,8 și 88,5, deci suntem exact unde ar trebui să fim.
 
 {#if fw === 'pt'}
 
-Finally, we use the `push_to_hub()` method to make sure we upload the latest version of the model:
+În final, folosim metoda `push_to_hub()` pentru a ne asigura că încărcăm cea mai recentă versiune a modelului:
 
 ```py
 trainer.push_to_hub(commit_message="Training complete")
 ```
 
-This returns the URL of the commit it just did, if you want to inspect it:
+Aceasta returnează URL-ul commit-ului pe care tocmai l-a făcut, dacă doriți să îl inspectați:
 
 ```python out
 'https://huggingface.co/sgugger/bert-finetuned-squad/commit/9dcee1fbc25946a6ed4bb32efb1bd71d5fa90b68'
 ```
 
-The `Trainer` also drafts a model card with all the evaluation results and uploads it.
+De asemenea, `Trainer` redactează un model card cu toate rezultatele evaluării și o încarcă.
 
 {/if}
 
-At this stage, you can use the inference widget on the Model Hub to test the model and share it with your friends, family, and favorite pets. You have successfully fine-tuned a model on a question answering task -- congratulations!
+În această etapă, puteți utiliza widgetul de inferență de pe Model Hub pentru a testa modelul și pentru a-l oferi prietenilor, familia și animalele de companie preferate. Ați făcut fine-tune cu succes unui model pentru o sarcină de răspundere a unei întrebari - felicitări!
 
 <Tip>
 
-✏️ **Your turn!** Try another model architecture to see if it performs better on this task!
+✏️ **E rândul tău!** Încearcă un alt model de arhitectură pentru a vedea dacă are performanțe mai bune la această sarcină!
 
 </Tip>
 
 {#if fw === 'pt'}
 
-If you want to dive a bit more deeply into the training loop, we will now show you how to do the same thing using 🤗  Accelerate.
+Dacă doriți să pătrundeți puțin mai adânc în bucla de antrenare, vă vom arăta acum cum să faceți același lucru folosind 🤗 Accelerate.
 
-## A custom training loop[[a-custom-training-loop]]
+## O buclă de antrenare personalizată[[a-custom-training-loop]]
 
-Let's now have a look at the full training loop, so you can easily customize the parts you need. It will look a lot like the training loop in [Chapter 3](/course/chapter3/4), with the exception of the evaluation loop. We will be able to evaluate the model regularly since we're not constrained by the `Trainer` class anymore.
+Să aruncăm acum o privire la bucla de antrenare completă, astfel încât să puteți personaliza cu ușurință părțile de care aveți nevoie. Aceasta va semăna foarte mult cu bucla de antrenare din [Capitolul 3](/course/chapter3/4), cu excepția buclei de evaluare. Vom putea evalua modelul în mod regulat, deoarece nu mai suntem constrânși de clasa `Trainer`.
 
-### Preparing everything for training[[preparing-everything-for-training]]
+### Pregătirea pentru antrenament[[preparing-everything-for-training]]
 
-First we need to build the `DataLoader`s from our datasets. We set the format of those datasets to `"torch"`, and remove the columns in the validation set that are not used by the model. Then, we can use the `default_data_collator` provided by Transformers as a `collate_fn` and shuffle the training set, but not the validation set:
+Mai întâi trebuie să construim `DataLoader`s din dataseturile noastre. Am setat formatul acestor dataseturi la `"torch"` și am eliminat coloanele din setul de validare care nu sunt utilizate de model. Apoi, putem utiliza `default_data_collator` furnizat de Transformers ca un `collate_fn` și să amestecăm setul de antrenare, dar nu și setul de validare:
 
 ```py
 from torch.utils.data import DataLoader
@@ -1033,13 +1036,13 @@ eval_dataloader = DataLoader(
 )
 ```
 
-Next we reinstantiate our model, to make sure we're not continuing the fine-tuning from before but starting from the BERT pretrained model again:
+În continuare, reinițializăm modelul, pentru a ne asigura că nu continuăm fine-tuningul de dinainte, ci pornim din nou de la modelul preantrenat BERT:
 
 ```py
 model = AutoModelForQuestionAnswering.from_pretrained(model_checkpoint)
 ```
 
-Then we will need an optimizer. As usual we use the classic `AdamW`, which is like Adam, but with a fix in the way weight decay is applied:
+Atunci vom avea nevoie de un optimizator. Ca de obicei, folosim clasicul `AdamW`, care este ca Adam, dar cu o corecție în modul în care se aplică scăderea weighturilor:
 
 ```py
 from torch.optim import AdamW
@@ -1047,7 +1050,7 @@ from torch.optim import AdamW
 optimizer = AdamW(model.parameters(), lr=2e-5)
 ```
 
-Once we have all those objects, we can send them to the `accelerator.prepare()` method. Remember that if you want to train on TPUs in a Colab notebook, you will need to move all of this code into a training function, and that shouldn't execute any cell that instantiates an `Accelerator`. We can force mixed-precision training by passing `fp16=True` to the `Accelerator` (or, if you are executing the code as a script, just make sure to fill in the 🤗 Accelerate `config` appropriately).
+Odată ce avem toate aceste obiecte, le putem trimite metodei `accelerator.prepare()`. Amintiți-vă că, dacă doriți să vă antrenați pe un TPU într-un notebook Colab, va trebui să mutați tot acest cod într-o funcție de antrenament, care nu ar trebui să execute nicio celulă care inițializează un `Accelerator`. Putem forța antrenarea cu precizie mixtă trecând `fp16=True` la `Accelerator` (sau, dacă executați codul ca un script, asigurați-vă că completați `config` în 🤗 Accelerate în mod corespunzător).
 
 ```py
 from accelerate import Accelerator
@@ -1058,7 +1061,7 @@ model, optimizer, train_dataloader, eval_dataloader = accelerator.prepare(
 )
 ```
 
-As you should know from the previous sections, we can only use the `train_dataloader` length to compute the number of training steps after it has gone through the `accelerator.prepare()` method. We use the same linear schedule as in the previous sections:
+După cum ar trebui să știți din secțiunile anterioare, putem utiliza lungimea `train_dataloader` pentru a calcula numărul de pași de antrenare numai după ce a trecut prin metoda `accelerator.prepare()`. Utilizăm același program liniar ca în secțiunile anterioare:
 
 ```py
 from transformers import get_scheduler
@@ -1075,7 +1078,7 @@ lr_scheduler = get_scheduler(
 )
 ```
 
-To push our model to the Hub, we will need to create a `Repository` object in a working folder. First log in to the Hugging Face Hub, if you're not logged in already. We'll determine the repository name from the model ID we want to give our model (feel free to replace the `repo_name` with your own choice; it just needs to contain your username, which is what the function `get_full_repo_name()` does):
+Pentru a trimite modelul nostru către Hub, va trebui să creăm un obiect `Repository` într-un folder de lucru. În primul rând, conectați-vă la Hugging Face Hub, dacă nu sunteți deja conectat. Vom determina numele repositoriul pornind de la ID-ul modelului pe care dorim să îl atribuim modelului nostru (nu ezitați să înlocuiți `repo_name` cu propria alegere; acesta trebuie doar să conțină numele vostru de utilizator, ceea ce face funcția `get_full_repo_name()`):
 
 ```py
 from huggingface_hub import Repository, get_full_repo_name
@@ -1089,24 +1092,24 @@ repo_name
 'sgugger/bert-finetuned-squad-accelerate'
 ```
 
-Then we can clone that repository in a local folder. If it already exists, this local folder should be a clone of the repository we are working with:
+Apoi putem clona acel repositoriu într-un folder local. Dacă există deja, acest folder local ar trebui să fie o clonă a repositoriului cu care lucrăm:
 
 ```py
 output_dir = "bert-finetuned-squad-accelerate"
 repo = Repository(output_dir, clone_from=repo_name)
 ```
 
-We can now upload anything we save in `output_dir` by calling the `repo.push_to_hub()` method. This will help us upload the intermediate models at the end of each epoch.
+Acum putem încărca orice salvăm în `output_dir` prin apelarea metodei `repo.push_to_hub()`. Acest lucru ne va ajuta să încărcăm modelele intermediare la sfârșitul fiecărei epoci.
 
-## Training loop[[training-loop]]
+## Bucla de antrenare[[training-loop]]
 
-We are now ready to write the full training loop. After defining a progress bar to follow how training goes, the loop has three parts:
+Acum suntem pregătiți să scriem bucla de antrenare completă. După definirea unei bare de progres pentru a urmări modul în care decurge antrenamentul, bucla are trei părți:
 
-- The training in itself, which is the classic iteration over the `train_dataloader`, forward pass through the model, then backward pass and optimizer step.
-- The evaluation, in which we gather all the values for `start_logits` and `end_logits` before converting them to NumPy arrays. Once the evaluation loop is finished, we concatenate all the results. Note that we need to truncate because the `Accelerator` may have added a few samples at the end to ensure we have the same number of examples in each process.
-- Saving and uploading, where we first save the model and the tokenizer, then call `repo.push_to_hub()`. As we did before, we use the argument `blocking=False` to tell the 🤗 Hub library to push in an asynchronous process. This way, training continues normally and this (long) instruction is executed in the background.
+- Pregătirea în sine, care este iterația clasică peste `train_dataloader`, trecerea înainte prin model, apoi trecerea înapoi și pasul optimizatorului.
+- Evaluarea, în care adunăm toate valorile pentru `start_logits` și `end_logits` înainte de a le converti în matrici NumPy. Odată ce bucla de evaluare este terminată, concatenăm toate rezultatele. Rețineți că trebuie să truncăm deoarece `Accelerator` ar fi putut adăuga câteva exemple la sfârșit pentru a ne asigura că avem același număr de exemple în fiecare proces.
+- Salvarea și încărcarea, unde mai întâi salvăm modelul și tokenizatorul, apoi apelăm `repo.push_to_hub()`. Ca și înainte, folosim argumentul `blocking=False` pentru a spune bibliotecii 🤗 Hub să efectueze push-ul într-un proces asincron. În acest fel, antrenamentul continuă normal, iar această instrucțiune (lungă) este executată pe fundal.
 
-Here's the complete code for the training loop:
+Iată codul complet pentru bucla de antrenare:
 
 ```py
 from tqdm.auto import tqdm
@@ -1160,7 +1163,7 @@ for epoch in range(num_train_epochs):
         )
 ```
 
-In case this is the first time you're seeing a model saved with 🤗 Accelerate, let's take a moment to inspect the three lines of code that go with it:
+În cazul în care este prima dată când vedeți un model salvat cu 🤗 Accelerate, să ne oprim puțin pentru a inspecta cele trei linii de cod care îl însoțesc:
 
 ```py
 accelerator.wait_for_everyone()
@@ -1168,20 +1171,20 @@ unwrapped_model = accelerator.unwrap_model(model)
 unwrapped_model.save_pretrained(output_dir, save_function=accelerator.save)
 ```
 
-The first line is self-explanatory: it tells all the processes to wait until everyone is at that stage before continuing. This is to make sure we have the same model in every process before saving. Then we grab the `unwrapped_model`, which is the base model we defined. The `accelerator.prepare()` method changes the model to work in distributed training, so it won't have the `save_pretrained()` method anymore; the `accelerator.unwrap_model()` method undoes that step. Lastly, we call `save_pretrained()` but tell that method to use `accelerator.save()` instead of `torch.save()`. 
+Prima linie se explică de la sine: aceasta spune tuturor proceselor să aștepte până când toată lumea se află în etapa respectivă înainte de a continua. Acest lucru are rolul de a ne asigura că avem același model în fiecare proces înainte de salvare. Apoi luăm `unwrapped_model`, care este modelul de bază pe care l-am definit. Metoda `accelerator.prepare()` modifică modelul pentru a funcționa în antrenarea distribuită, deci nu va mai avea metoda `save_pretrained()`; metoda `accelerator.unwrap_model()` anulează acest pas. În cele din urmă, apelăm metoda `save_pretrained()`, dar îi spunem să folosească metoda `accelerator.save()` în loc de `torch.save()`.
 
-Once this is done, you should have a model that produces results pretty similar to the one trained with the `Trainer`. You can check the model we trained using this code at [*huggingface-course/bert-finetuned-squad-accelerate*](https://huggingface.co/huggingface-course/bert-finetuned-squad-accelerate). And if you want to test out any tweaks to the training loop, you can directly implement them by editing the code shown above!
+Odată făcut acest lucru, ar trebui să aveți un model care produce rezultate destul de asemănătoare cu cel antrenat cu `Trainer`. Puteți verifica modelul pe care l-am antrenat folosind acest cod pe [*huggingface-course/bert-finetuned-squad-accelerate*] (https://huggingface.co/huggingface-course/bert-finetuned-squad-accelerate). Și dacă doriți să testați orice modificări ale buclei de antrenare, le puteți implementa direct prin editarea codului prezentat mai sus!
 
 {/if}
 
-## Using the fine-tuned model[[using-the-fine-tuned-model]]
+## Utilizarea modelului fine-tuned[[using-the-fine-tuned-model]]
 
-We've already shown you how you can use the model we fine-tuned on the Model Hub with the inference widget. To use it locally in a `pipeline`, you just have to specify the model identifier:
+V-am arătat deja cum puteți utiliza modelul căruia i-am făcut fine-tune pe Model Hub cu widgetul de inferență. Pentru a-l utiliza local într-un `pipeline`, trebuie doar să specificați identificatorul modelului:
 
 ```py
 from transformers import pipeline
 
-# Replace this with your own checkpoint
+# Înlocuiți acest checkpoint cu propriul checkpoint
 model_checkpoint = "huggingface-course/bert-finetuned-squad"
 question_answerer = pipeline("question-answering", model=model_checkpoint)
 
@@ -1200,4 +1203,4 @@ question_answerer(question=question, context=context)
  'answer': 'Jax, PyTorch and TensorFlow'}
 ```
 
-Great! Our model is working as well as the default one for this pipeline!
+Grozav! Modelul nostru funcționează la fel de bine ca cel implicit pentru aceast pipeline!
diff --git a/chapters/ro/chapter7/8.mdx b/chapters/ro/chapter7/8.mdx
index 78693b25b..71652433d 100644
--- a/chapters/ro/chapter7/8.mdx
+++ b/chapters/ro/chapter7/8.mdx
@@ -1,22 +1,22 @@
-# Mastering NLP[[mastering-nlp]]
+# Înțelegerea NLP[[mastering-nlp]]
 
 <CourseFloatingBanner
     chapter={7}
     classNames="absolute z-10 right-0 top-0"
 />
 
-If you've made it this far in the course, congratulations -- you now have all the knowledge and tools you need to tackle (almost) any NLP task with 🤗 Transformers and the Hugging Face ecosystem!
+Dacă ați ajuns până aici în curs, felicitări - acum aveți toate cunoștințele și instrumentele necesare pentru a aborda (aproape) orice sarcină NLP cu 🤗 Transformers și ecosistemul Hugging Face!
 
-We have seen a lot of different data collators, so we made this little video to help you find which one to use for each task:
+Am văzut o mulțime de data collators, așa că am făcut acest mic videoclip pentru a vă ajuta să găsiți cel pe care să îl utilizați pentru fiecare sarcină:
 
 <Youtube id="-RPeakdlHYo"/>
 
-After completing this lightning tour through the core NLP tasks, you should:
+După finalizarea acestui tur fulger prin sarcinile de bază ale NLP, ar trebui să:
 
-* Know which architectures (encoder, decoder, or encoder-decoder) are best suited for each task
-* Understand the difference between pretraining and fine-tuning a language model
-* Know how to train Transformer models using either the `Trainer` API and distributed training features of 🤗 Accelerate or TensorFlow and Keras, depending on which track you've been following
-* Understand the meaning and limitations of metrics like ROUGE and BLEU for text generation tasks
-* Know how to interact with your fine-tuned models, both on the Hub and using the `pipeline` from 🤗 Transformers
+* Știți care arhitecturi (codificator, decodificator sau codificator-decodificator) sunt cele mai potrivite pentru fiecare sarcină
+* Înțelegeți diferența dintre preantrenare și fine-tuningul a unui model lingvistic
+* Știți cum să antrenați modele Transformer utilizând API-ul `Trainer` și caracteristicile de antrenare distribuită ale 🤗 Accelerate sau TensorFlow și Keras, în funcție de calea pe care ați urmat-o
+* Înțelegeți semnificația și limitele metricilor precum ROUGE și BLEU pentru sarcinile de generare a textului
+* Știți cum să interacționați cu modelele dvs. ajustate, atât pe Hub, cât și utilizând `pipeline` din 🤗 Transformers
 
-Despite all this knowledge, there will come a time when you'll either encounter a difficult bug in your code or have a question about how to solve a particular NLP problem. Fortunately, the Hugging Face community is here to help you! In the final chapter of this part of the course, we'll explore how you can debug your Transformer models and ask for help effectively.
\ No newline at end of file
+În ciuda tuturor acestor cunoștințe, va veni un moment în care fie veți întâlni un bug dificil în codul vostru fie veți avea o întrebare despre cum să rezolvați o anumită problemă NLP. Din fericire, comunitatea Hugging Face este aici pentru a vă ajuta! În ultimul capitol al acestei părți a cursului, vom explora modul în care vă puteți face debugging modelelor Transformer și solicita ajutor în mod eficient.
\ No newline at end of file
diff --git a/chapters/ro/chapter7/9.mdx b/chapters/ro/chapter7/9.mdx
index cb517efbf..38e4ee0a0 100644
--- a/chapters/ro/chapter7/9.mdx
+++ b/chapters/ro/chapter7/9.mdx
@@ -2,179 +2,179 @@
 
 <!-- DISABLE-FRONTMATTER-SECTIONS -->
 
-# End-of-chapter quiz[[end-of-chapter-quiz]]
+# Quiz de sfârșit de capitol[[end-of-chapter-quiz]]
 
 <CourseFloatingBanner
     chapter={7}
     classNames="absolute z-10 right-0 top-0"
 />
 
-Let's test what you learned in this chapter!
+Să testăm ce ați învățat în acest capitol!
 
-### 1. Which of the following tasks can be framed as a token classification problem?
+### 1. Care dintre următoarele sarcini pot fi încadrate ca o problemă de clasificare a tokenilor?
 
 <Question
 	choices={[
 		{
-			text: "Find the grammatical components in a sentence.",
-			explain: "Correct! We can then label each word as a noun, verb, etc.",
+			text: "Găsirea componentelor gramaticale ale unei propoziții.",
+			explain: "Corect! Apoi putem eticheta fiecare cuvânt ca substantiv, verb etc.",
 			correct: true
 		},
 		{
-			text: "Find whether a sentence is grammatically correct or not.",
-			explain: "No, this is a sequence classification problem."
+			text: "Verificarea dacă o propoziție este corectă gramatical sau nu.",
+			explain: "Nu, aceasta este o problemă de clasificare a secvențelor."
 		},
 		{
-			text: "Find the persons mentioned in a sentence.",
-			explain: "Correct! We can label each word as person or not person.",
+			text: "Găsirea persoanelor menționate într-o propoziție.",
+			explain: "Corect! Putem eticheta fiecare cuvânt ca persoană sau nu ca o persoană.",
             correct: true
 		},
         {
-			text: "Find the chunk of words in a sentence that answers a question.",
-			explain: "No, that would be a question answering problem."
+			text: "Găsirea grupul de cuvinte dintr-o propoziție care răspunde la o întrebare.",
+			explain: "Nu, aceasta ar fi o problemă de răspundere a unei întrebări."
 		}
 	]}
 />
 
-### 2. What part of the preprocessing for token classification differs from the other preprocessing pipelines?
+### 2. Ce parte a preprocesării pentru clasificarea tokenilor diferă de celelalte pipelineuri de preprocesare?
 
 <Question
 	choices={[
 		{
-			text: "There is no need to do anything; the texts are already tokenized.",
-			explain: "The texts are indeed given as separate words, but we still need to apply the subword tokenization model."
+			text: "Nu este nevoie să faceți nimic; textele sunt deja tokenizate.",
+			explain: "Textele sunt într-adevăr date ca cuvinte separate, dar tot trebuie să aplicăm modelul de tokenizare a sub-cuvintelor."
 		},
 		{
-			text: "The texts are given as words, so we only need to apply subword tokenization.",
-			explain: "Correct! This is different from the usual preprocessing, where we need to apply the full tokenization pipeline. Can you think of another difference?",
+			text: "Textele sunt date sub formă de cuvinte, astfel încât trebuie să aplicăm doar tokenizarea sub-cuvintelor.",
+			explain: "Corect! Acest lucru este diferit de preprocesarea obișnuită, în care trebuie să aplicăm întregul proces de tokenizare. Vă puteți gândi la o altă diferență?",
 			correct: true
 		},
 		{
-			text: "We use <code>-100</code> to label the special tokens.",
-			explain: "That's not specific to token classification -- we always use <code>-100</code> as the label for tokens we want to ignore in the loss."
+			text: "Folosim <code>-100</code> pentru a eticheta tokenii speciali.",
+			explain: "Acest lucru nu este specific clasificării tokenilor - folosim întotdeauna <code>-100</code> ca label pentru tokenii pe care dorim să îi ignorăm în pierdere."
 		},
 		{
-			text: "We need to make sure to truncate or pad the labels to the same size as the inputs, when applying truncation/padding.",
-			explain: "Indeed! That's not the only difference, though.",
+			text: "Trebuie să ne asigurăm că labelurile sunt trunchiate sau padded la aceeași dimensiune ca și inputurile, atunci când aplicăm trunchierea/paddingul.",
+			explain: "Într-adevăr! Totuși, aceasta nu este singura diferență.",
 			correct: true
 		}
 	]}
 />
 
-### 3. What problem arises when we tokenize the words in a token classification problem and want to label the tokens?
+### 3. Ce problemă apare atunci când tokenizăm cuvintele într-o problemă de clasificare a tokenilor și dorim să etichetăm tokenii?
 
 <Question
 	choices={[
 		{
-			text: "The tokenizer adds special tokens and we have no labels for them.",
-			explain: "We label these <code>-100</code> so they are ignored in the loss."
+			text: "Tokenizatorul adaugă tokeni speciali și nu avem labeluri pentru ele.",
+			explain: "Le etichetăm pe acestea cu <code>-100</code>, astfel încât acestea să fie ignorate în pierdere."
 		},
 		{
-			text: "Each word can produce several tokens, so we end up with more tokens than we have labels.",
-			explain: "That is the main problem, and we need to align the original labels with the tokens.",
+			text: "Fiecare cuvânt poate produce mai mulți tokeni, astfel încât ajungem să avem mai multe tokeni decât labeluri.",
+			explain: "Aceasta este problema principală, iar noi trebuie să aliniem labelurile originale cu tokenii.",
 			correct: true
 		},
 		{
-			text: "The added tokens have no labels, so there is no problem.",
-			explain: "That's incorrect; we need as many labels as we have tokens or our models will error out."
+			text: "Tokenii adăugați nu au etichete, deci nu există nicio problemă.",
+			explain: "Incorect; avem nevoie de atâtea etichete câțo tokeni avem, altfel modelele noastre vor da erori."
 		}
 	]}
 />
 
-### 4. What does "domain adaptation" mean?
+### 4. Ce înseamnă "domain adaptation"??
 
 <Question
 	choices={[
 		{
-			text: "It's when we run a model on a dataset and get the predictions for each sample in that dataset.",
-			explain: "No, this is just running inference."
+			text: "Este atunci când rulăm un model pe un dataset și obținem predicțiile pentru fiecare sample din acel dataset.",
+			explain: "Nu, aceasta este doar o inferență."
 		},
 		{
-			text: "It's when we train a model on a dataset.",
-			explain: "No, this is training a model; there is no adaptation here."
+			text: "Este atunci când antrenăm un model pe un dataset.",
+			explain: "Nu, acesta este antrenarea unui model; nu există nicio adaptare aici."
 		},
 		{
-			text: "It's when we fine-tune a pretrained model on a new dataset, and it gives predictions that are more adapted to that dataset",
-			explain: "Correct! The model adapted its knowledge to the new dataset.",
+			text: "Este atunci când facem fine-tune unui model preantrenat pe un nou dataset, iar acesta oferă predicții care sunt mai bine adaptate la datasetul respectiv",
+			explain: "Corect! Modelul și-a adaptat cunoștințele la noul dataset.",
             correct: true
 		},
         {
-			text: "It's when we add misclassified samples to a dataset to make our model more robust.",
-			explain: "That's certainly something you should do if you retrain your model regularly, but it's not domain adaptation."
+			text: "Este atunci când adăugăm sampleuri neclasificate la un dataset pentru a face modelul nostru mai robust.",
+			explain: "Cu siguranță este ceva ce ar trebui să faceți dacă vă reantrenați modelul în mod regulat, dar nu este o adaptare la domeniu."
 		}
 	]}
 />
 
-### 5. What are the labels in a masked language modeling problem?
+### 5. Ce sunt labelurile într-o problemă de modelare a limbajului mascat?
 
 <Question
 	choices={[
 		{
-			text: "Some of the tokens in the input sentence are randomly masked and the labels are the original input tokens.",
-			explain: "That's it!",
+			text: "Unii dintre tokenii din propoziția de intrare sunt mascate aleatoriu, iar labelurile sunt tokenii de input originali.",
+			explain: "Corect!",
             correct: true
 		},
 		{
-			text: "Some of the tokens in the input sentence are randomly masked and the labels are the original input tokens, shifted to the left.",
-			explain: "No, shifting the labels to the left corresponds to predicting the next word, which is causal language modeling."
+			text: "Unii dintre tokenii din propoziția de intrare sunt mascate aleatoriu, iar labelurile sunt tokenii de input originali, deplasate spre stânga.",
+			explain: "Nu, deplasarea labelurilor spre stânga corespunde prezicerii următorului cuvânt, ceea ce este modelarea cauzală a limbajului."
 		},
 		{
-			text: "Some of the tokens in the input sentence are randomly masked, and the label is whether the sentence is positive or negative.",
-			explain: "That's a sequence classification problem with some data augmentation, not masked language modeling."
+			text: "Unele dintre tokenii din propoziția de intrare sunt mascate aleatoriu, iar labelul este dacă propoziția este pozitivă sau negativă.",
+			explain: "Aceasta este o problemă de clasificare a secvențelor cu o anumită creștere a datelor, nu de modelare a limbajului mascat."
 		},
         {
-			text: "Some of the tokens in the two input sentences are randomly masked, and the label is whether the two sentences are similar or not.",
-			explain: "That's a sequence classification problem with some data augmentation, not masked language modeling."
+			text: "Unii dintre tokenii din cele două propoziții de intrare sunt mascate aleatoriu, iar labelul este dacă cele două propoziții sunt similare sau nu.",
+			explain: "Aceasta este o problemă de clasificare a secvențelor cu o anumită creștere a datelor, nu de modelare a limbajului mascat."
 		}
 	]}
 />
 
-### 6. Which of these tasks can be seen as a sequence-to-sequence problem?
+### 6. Care dintre aceste sarcini poate fi văzută ca o problemă de sequence-to-sequence?
 
 <Question
 	choices={[
 		{
-			text: "Writing short reviews of long documents",
-			explain: "Yes, that's a summarization problem. Try another answer!",
+			text: "Scrierea de recenzii scurte ale documentelor lungi",
+			explain: "Da, aceasta este o problemă de sumarizare. Încercați un alt răspuns!",
             correct: true
 		},
 		{
-			text: "Answering questions about a document",
-			explain: "This can be framed as a sequence-to-sequence problem. It's not the only right answer, though.",
+			text: "Răspunderea întrebărilor despre un document",
+			explain: "Acest lucru poate fi încadrat ca o problemă de sequence-to-sequence. Totuși, acesta nu este singurul răspuns corect.",
             correct: true
 		},
 		{
-			text: "Translating a text in Chinese into English",
-			explain: "That's definitely a sequence-to-sequence problem. Can you spot another one?",
+			text: "Traducerea unui text din chineză în engleză",
+			explain: "Aceasta este cu siguranță o problemă de sequence-to-sequence. Mai puteți găsi alta?",
             correct: true
 		},
         {
-			text: "Fixing the messages sent by my nephew/friend so they're in proper English",
-			explain: "That's a kind of translation problem, so definitely a sequence-to-sequence task. This isn't the only right answer, though!",
+			text: "Corectarea mesajelor trimise de nepotul/prietenul meu pentru ca acestea să fie în limba engleză, scrise gramatical",
+			explain: "Aceasta este un fel de problemă de traducere, deci cu siguranță o sarcină de la sequence-to-sequence. Totuși, acesta nu este singurul răspuns corect!",
 			correct: true
 		}
 	]}
 />
 
-### 7. What is the proper way to preprocess the data for a sequence-to-sequence problem?
+### 7. Care este modalitatea corectă de preprocesare a datelor pentru o problemă de sequence-to-sequence?
 
 <Question
 	choices={[
 		{
-			text: "The inputs and targets have to be sent together to the tokenizer with <code>inputs=...</code> and <code>targets=...</code>.",
-			explain: "This might be an API we add in the future, but that's not possible right now."
+			text: "Inputurile și targeturile trebuie trimise împreună la tokenizer cu <code>inputs=...</code> și <code>targets=...</code>.",
+			explain: "Acesta ar putea fi un API pe care îl vom adăuga în viitor, dar nu este disponibil acum."
 		},
 		{
-			text: "The inputs and the targets both have to be preprocessed, in two separate calls to the tokenizer.",
-			explain: "That is true, but incomplete. There is something you need to do to make sure the tokenizer processes both properly."
+			text: "Inputurile și targturile trebuie preprocesate, în două apeluri separate către tokenizer.",
+			explain: "Acest lucru este adevărat, dar incomplet. Trebuie să faceți ceva pentru a vă asigura că tokenizerul le procesează pe ambele în mod corespunzător."
 		},
 		{
-			text: "As usual, we just have to tokenize the inputs.",
-			explain: "Not in a sequence classification problem; the targets are also texts we need to convert into numbers!"
+			text: "Ca de obicei, trebuie doar să tokenizăm inputurile.",
+			explain: "Nu într-o problemă de clasificare a secvențelor; targeturile sunt de asemenea texte pe care trebuie să le convertim în numere!"
 		},
         {
-			text: "The inputs have to be sent to the tokenizer, and the targets too, but under a special context manager.",
-			explain: "That's correct, the tokenizer needs to be put into target mode by that context manager.",
+			text: "Inputurile trebuie să fie trimise către tokenizer, la fel și targeturile, dar în cadrul unui manager de context special.",
+			explain: "Corect, tokenizerul trebuie să fie pus în target mode de către acel context manager.",
 			correct: true
 		}
 	]}
@@ -182,148 +182,148 @@ Let's test what you learned in this chapter!
 
 {#if fw === 'pt'}
 
-### 8. Why is there a specific subclass of `Trainer` for sequence-to-sequence problems?
+### 8. De ce există o subclasă specifică a `Trainer` pentru problemele sequence-to-sequence?
 
 <Question
 	choices={[
 		{
-			text: "Because sequence-to-sequence problems use a custom loss, to ignore the labels set to <code>-100</code>",
-			explain: "That's not a custom loss at all, but the way the loss is always computed."
+			text: "Deoarece problemele de sequence-to-sequence utilizează o pierdere personalizată, pentru a ignora labelurile setate la <code>-100</code>",
+			explain: "Aceasta nu este deloc o pierdere personalizată, ci modul în care pierderea este întotdeauna calculată."
 		},
 		{
-			text: "Because sequence-to-sequence problems require a special evaluation loop",
-			explain: "That's correct. Sequence-to-sequence models' predictions are often run using the <code>generate()</code> method.",
+			text: "Deoarece problemele de sequence-to-sequence la secvență necesită o buclă de evaluare specială",
+			explain: "Acest lucru este corect. Predicțiile modelelor sequence-to-sequence sunt de obicei rulate cu metoda <code>generate()</code>.",
 			correct: true
 		},
 		{
-			text: "Because the targets are texts in sequence-to-sequence problems",
-			explain: "The <code>Trainer</code> doesn't really care about that since they have been preprocessed before."
+			text: "Deoarece targeturile sunt texte în probleme sequence-to-sequence",
+			explain: "<code>Trainer</code>-ului nu prea îi pasă de asta, deoarece acestea au fost preprocesate înainte."
 		},
         {
-			text: "Because we use two models in sequence-to-sequence problems",
-			explain: "We do use two models in a way, an encoder and a decoder, but they are grouped together in one model."
+			text: "Deoarece folosim două modele în problemele sequence-to-sequence",
+			explain: "Într-un fel, folosim două modele, un codificator și un decodificator, dar acestea sunt grupate într-un singur model."
 		}
 	]}
 />
 
 {:else}
 
-### 9. Why is it often unnecessary to specify a loss when calling `compile()` on a Transformer model?
+### 9. De ce este adesea inutil să se specifice o pierdere atunci când se apelează `compile()` pe un model Transformer?
 
 <Question
 	choices={[
 		{
-			text: "Because Transformer models are trained with unsupervised learning",
-			explain: "Not quite -- even unsupervised learning needs a loss function!"
+			text: "Deoarece modelele Transformer sunt antrenate cu unsupervised learning",
+			explain: "Nu chiar - chiar și unsupervised learning are nevoie de o funcție de pierdere!"
 		},
 		{
-			text: "Because the model's internal loss output is used by default",
-			explain: "That's correct!",
+			text: "Deoarece, în mod prestabilit, se utilizează valoarea pierderilor interne ale modelului",
+			explain: "Corect!",
 			correct: true
 		},
 		{
-			text: "Because we compute metrics after training instead",
-			explain: "We do often do that, but it doesn't explain where we get the loss value we optimize in training."
+			text: "Deoarece calculăm metricele după antrenare",
+			explain: "Facem adesea acest lucru, dar nu explică de unde obținem valoarea pierderii pe care o optimizăm în formare."
 		},
         {
-			text: "Because loss is specified in `model.fit()` instead",
-			explain: "No, the loss function is always fixed once you run `model.compile()`, and can't be changed in `model.fit()`."
+			text: "Deoarece pierderea este specificată în `model.fit()`",
+			explain: "Nu, funcția de pierdere este întotdeauna fixată odată ce rulați `model.compile()`, și nu poate fi modificată în `model.fit()`."
 		}
 	]}
 />
 
 {/if}
 
-### 10. When should you pretrain a new model?
+### 10. Când ar trebui să preantrenați un model nou?
 
 <Question
 	choices={[
 		{
-			text: "When there is no pretrained model available for your specific language",
-			explain: "That's correct.",
+			text: "Atunci când nu există un model preantrenat disponibil pentru limba dorită.",
+			explain: "Corect.",
 			correct: true
 		},
 		{
-			text: "When you have lots of data available, even if there is a pretrained model that could work on it",
-			explain: "In this case, you should probably use the pretrained model and fine-tune it on your data, to avoid huge compute costs."
+			text: "Atunci când aveți o mulțime de date disponibile, chiar dacă există un model preantrenat care ar putea funcționa pe ele",
+			explain: "În acest caz, ar trebui, probabil, să utilizați modelul preantrenat și să îi faceți fine-tune pe datele voastre, pentru a evita costurile uriașe de calcul."
 		},
 		{
-			text: "When you have concerns about the bias of the pretrained model you are using",
-			explain: "That is true, but you have to make very sure the data you will use for training is really better.",
+			text: "Atunci când aveți îndoieli cu privire la biasul modelului preantrenat pe care îl utilizați",
+			explain: "Este adevărat, dar trebuie să vă asigurați că datele pe care le veți utiliza pentru antrenare sunt cu adevărat mai bune.",
 			correct: true
 		},
         {
-			text: "When the pretrained models available are just not good enough",
-			explain: "Are you sure you've properly debugged your training, then?"
+			text: "Atunci când modelele preantrenate disponibile nu sunt suficient de bune",
+			explain: "Sunteți sigur că ați făcut debbuging în mod corespunzător antrenării?"
 		}
 	]}
 />
 
-### 11. Why is it easy to pretrain a language model on lots and lots of texts?
+### 11. De ce este ușor să preantrenăm un model lingvistic pe o mulțime de texte?
 
 <Question
 	choices={[
 		{
-			text: "Because there are plenty of texts available on the internet",
-			explain: "Although true, that doesn't really answer the question. Try again!"
+			text: "Deoarece există o mulțime de texte disponibile pe internet",
+			explain: "Deși este adevărat, acest lucru nu răspunde cu adevărat la întrebare. Încercați din nou!"
 		},
 		{
-			text: "Because the pretraining objective does not require humans to label the data",
-			explain: "That's correct, language modeling is a self-supervised problem.",
+			text: "Deoarece obiectivul de preantrenare nu necesită ca oamenii să eticheteze datele",
+			explain: "Acest lucru este corect, modelarea limbajului este o problemă autosupravegheată.",
 			correct: true
 		},
 		{
-			text: "Because the 🤗 Transformers library only requires a few lines of code to start the training",
-			explain: "Although true, that doesn't really answer the question asked. Try another answer!"
+			text: "Deoarece biblioteca 🤗 Transformers necesită doar câteva linii de cod pentru a începe antrenarea",
+			explain: "Deși adevărat, acest lucru nu răspunde cu adevărat la întrebarea pusă. Încercați un alt răspuns!"
 		}
 	]}
 />
 
-### 12. What are the main challenges when preprocessing data for a question answering task?
+### 12. Care sunt principalele provocări la preprocesarea datelor pentru o sarcină de răspundere a întrebărilor?
 
 <Question
 	choices={[
 		{
-			text: "You need to tokenize the inputs.",
-			explain: "That's correct, but is it really a main challenge?"
+			text: "Trebuie să tokenizați inputurile.",
+			explain: "Este corect, dar este cu adevărat o provocare principală?"
 		},
 		{
-			text: "You need to deal with very long contexts, which give several training features that may or may not have the answer in them.",
-			explain: "This is definitely one of the challenges.",
+			text: "Trebuie să aveți de-a face cu contexte foarte lungi, care oferă mai multe caracteristici de antrenare care pot sau nu să conțină răspunsul.",
+			explain: "Aceasta este cu siguranță una dintre provocări.",
 			correct: true
 		},
 		{
-			text: "You need to tokenize the answers to the question as well as the inputs.",
-			explain: "No, unless you are framing your question answering problem as a sequence-to-sequence task."
+			text: "Trebuie să tokenizați răspunsurile la întrebări, precum și inputurile.",
+			explain: "Nu, cu excepția cazului în care vă încadrați problema de răspundere a întrebărilor ca o sarcină de sequence-to-sequence."
 		},
        {
-			text: "From the answer span in the text, you have to find the start and end token in the tokenized input.",
-			explain: "That's one of the hard parts, yes!",
+			text: "Din intervalul răspunsului din text, trebuie să găsiți tokenul de început și de sfârșit în inputul tokenizat.",
+			explain: "Aceasta este una dintre părțile dificile!",
 			correct: true
 		}
 	]}
 />
 
-### 13. How is post-processing usually done in question answering?
+### 13. Cum se face de obicei post-procesarea în răspunderea la întrebări?
 
 <Question
 	choices={[
 		{
-			text: "The model gives you the start and end positions of the answer, and you just have to decode the corresponding span of tokens.",
-			explain: "That could be one way to do it, but it's a bit too simplistic."
+			text: "Modelul vă oferă pozițiile de început și de sfârșit ale răspunsului, iar voi trebuie doar să decodificați intervalul corespunzător de tokeni.",
+			explain: "Acesta ar putea fi un mod de a face acest lucru, dar este un pic prea simplist."
 		},
 		{
-			text: "The model gives you the start and end positions of the answer for each feature created by one example, and you just have to decode the corresponding span of tokens in the one that has the best score.",
-			explain: "That's close to the post-processing we studied, but it's not entirely right."
+			text: "Modelul vă oferă pozițiile de început și de sfârșit ale răspunsului pentru fiecare caracteristică creată de un exemplu, iar voi trebuie doar să decodificați intervalul corespunzător de tokeni în cel care are cel mai bun scor.",
+			explain: "Acest lucru este apropiat de post-procesarea pe care am studiat-o, dar nu este complet corect."
 		},
 		{
-			text: "The model gives you the start and end positions of the answer for each feature created by one example, and you just have to match them to the span in the context for the one that has the best score.",
-			explain: "That's it in a nutshell!",
+			text: "Modelul vă oferă pozițiile de început și de sfârșit ale răspunsului pentru fiecare caracteristică creată de un exemplu, iar voi trebuie doar să le potriviți cu intervalul din context pentru cel care are cel mai bun scor.",
+			explain: "Asta e corect!",
 			correct: true
 		},
         {
-			text: "The model generates an answer, and you just have to decode it.",
-			explain: "No, unless you are framing your question answering problem as a sequence-to-sequence task."
+			text: "Modelul generează un răspuns, iar tu trebuie doar să îl decodifici.",
+			explain: "Nu, cu excepția cazului în care vă încadrați problema de răspundere a întrebării ca o sarcină de sequence-to-sequence."
 		}
 	]}
 />

From 2f88fefe159943fa150592928cdc79081d76c4a8 Mon Sep 17 00:00:00 2001
From: Stojoc Vladimir <61602995+tokyo-s@users.noreply.github.com>
Date: Fri, 14 Feb 2025 00:31:49 +0200
Subject: [PATCH 016/167] Update chapters/rum/chapter1/1.mdx

Co-authored-by: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
---
 chapters/rum/chapter1/1.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter1/1.mdx b/chapters/rum/chapter1/1.mdx
index c4d8a71a3..aa4710e84 100644
--- a/chapters/rum/chapter1/1.mdx
+++ b/chapters/rum/chapter1/1.mdx
@@ -30,7 +30,7 @@ Aceasta este o scurtă prezentare a cursului:
 ## Bun venit la 🤗 curs![[bun-venit-la-curs]]
 
 <Youtube id="00GKzGyWFEs" />
-Acest curs vă va învăța despre procesarea limbajelor naturale (NLP) folosind biblioteci din [Hugging Face](https://huggingface.co/) ecosystem — [🤗 Transformers](https://github.com/huggingface/transformers), [🤗 Datasets](https://github.com/huggingface/datasets), [🤗 Tokenizers](https://github.com/huggingface/tokenizers), and [🤗 Accelerate](https://github.com/huggingface/accelerate) — precum și [Hugging Face Hub](https://huggingface.co/models).Este complet gratuit și nu conține reclame.
+Acest curs vă va învăța despre procesarea limbajelor naturale (NLP) folosind biblioteci din ecosistemul [Hugging Face](https://huggingface.co/) — [🤗 Transformers](https://github.com/huggingface/transformers), [🤗 Datasets](https://github.com/huggingface/datasets), [🤗 Tokenizers](https://github.com/huggingface/tokenizers), and [🤗 Accelerate](https://github.com/huggingface/accelerate) — precum și [Hugging Face Hub](https://huggingface.co/models).Este complet gratuit și nu conține reclame.
 
 ## La ce să te aștepți?[[la-ce-sa-te-aștepți]]
 

From ef422a2e7756bb181976d3a7694389262d3ba007 Mon Sep 17 00:00:00 2001
From: Stojoc Vladimir <61602995+tokyo-s@users.noreply.github.com>
Date: Fri, 14 Feb 2025 00:32:11 +0200
Subject: [PATCH 017/167] Update chapters/rum/chapter1/1.mdx

Co-authored-by: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
---
 chapters/rum/chapter1/1.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter1/1.mdx b/chapters/rum/chapter1/1.mdx
index aa4710e84..a9bed79c7 100644
--- a/chapters/rum/chapter1/1.mdx
+++ b/chapters/rum/chapter1/1.mdx
@@ -51,7 +51,7 @@ Acest curs:
 * Este mai bine să fie urmat după un curs introductiv de deep learning, cum ar fi [fast.ai's](https://www.fast.ai/) [Practical Deep Learning for Coders](https://course.fast.ai/) sau unul dintre programele dezvoltate de [DeepLearning.AI](https://www.deeplearning.ai/).
 * Nu se așteaptă la cunoștințe anterioare despre [PyTorch](https://pytorch.org/) sau [TensorFlow](https://www.tensorflow.org/), deși o familiaritate cu oricare dintre acestea va fi de ajutor.
 
-După ce ați completat acest curs, vă recomandăm să accesați [Natural Language Processing Specialization] (https://www.coursera.org/specializations/natural-language-processing?utm_source=deeplearning-ai&utm_medium=institutions&utm_campaign=20211011-nlp-2-hugging_face-page-nlp-refresh) de la DeepLearning.AI, care acoperă o gamă largă de modele NLP clasice, cum ar fi naive Bayes și LSTMs, despre care este bine să știți!
+După ce ați completat acest curs, vă recomandăm să accesați [Natural Language Processing Specialization](https://www.coursera.org/specializations/natural-language-processing?utm_source=deeplearning-ai&utm_medium=institutions&utm_campaign=20211011-nlp-2-hugging_face-page-nlp-refresh) de la DeepLearning.AI, care acoperă o gamă largă de modele NLP clasice, cum ar fi naive Bayes și LSTMs, despre care este bine să știți!
 
 ## Cine suntem noi?[[cine-suntem-noi]]
 

From ca55266d048a0d969ea67ff765d297de712187f1 Mon Sep 17 00:00:00 2001
From: Stojoc Vladimir <61602995+tokyo-s@users.noreply.github.com>
Date: Fri, 14 Feb 2025 00:32:24 +0200
Subject: [PATCH 018/167] Update chapters/rum/chapter1/1.mdx

Co-authored-by: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
---
 chapters/rum/chapter1/1.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter1/1.mdx b/chapters/rum/chapter1/1.mdx
index a9bed79c7..507d080fe 100644
--- a/chapters/rum/chapter1/1.mdx
+++ b/chapters/rum/chapter1/1.mdx
@@ -86,7 +86,7 @@ Deocamdată nu avem nicio certificare pentru acest curs. Cu toate acestea, lucr
 Fiecare capitol din acest curs este conceput pentru a fi parcurs într-o săptămână, cu aproximativ 6-8 ore de lucru pe săptămână. Cu toate acestea, vă puteți lua cât timp aveți nevoie pentru a finaliza cursul.
 
 - **Unde pot să pun o întrebare dacă am una?**
-Dacă aveți o întrebare despre orice secțiune a cursului, faceți clic pe bannerul „*Pune o întrebare*” din partea de sus a paginii pentru a fi redirecționat automat către secțiunea corectă a [[Hugging Face forums](https://discuss.huggingface.co/):
+Dacă aveți o întrebare despre orice secțiune a cursului, faceți clic pe bannerul „*Pune o întrebare*” din partea de sus a paginii pentru a fi redirecționat automat către secțiunea corectă a [Hugging Face forums](https://discuss.huggingface.co/):
 
 <img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/forum-button.png" alt="Link to the Hugging Face forums" width="75%">
 

From 01e4fedf5413494fd3646b575ec36000f1e27a41 Mon Sep 17 00:00:00 2001
From: Stojoc Vladimir <61602995+tokyo-s@users.noreply.github.com>
Date: Fri, 14 Feb 2025 00:33:59 +0200
Subject: [PATCH 019/167] Update chapters/rum/chapter1/1.mdx

Co-authored-by: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
---
 chapters/rum/chapter1/1.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter1/1.mdx b/chapters/rum/chapter1/1.mdx
index 507d080fe..1f2802551 100644
--- a/chapters/rum/chapter1/1.mdx
+++ b/chapters/rum/chapter1/1.mdx
@@ -57,7 +57,7 @@ După ce ați completat acest curs, vă recomandăm să accesați [Natural Langu
 
 Despre autori:
 
-[**Abubakar Abid**](https://huggingface.co/abidlabs) și-a susținut doctoratul la Stanford în domeniul învățării automate (Machine Learning) aplicate. În timpul doctoratului său, a fondat [Gradio](https://github.com/gradio-app/gradio), o bibliotecă Python open-source care a fost utilizată pentru a construi peste 600.000 de demo-uri de Machine Learning. Gradio a fost achiziționată de Hugging Face, unde Abubakar activează acum ca lider al echipei de Machine Learning.
+[**Abubakar Abid**](https://huggingface.co/abidlabs) și-a susținut doctoratul la Stanford în Applied Machine Learning. În timpul doctoratului său, a fondat [Gradio](https://github.com/gradio-app/gradio), o bibliotecă Python open-source care a fost utilizată pentru a construi peste 600.000 de demo-uri de Machine Learning. Gradio a fost achiziționată de Hugging Face, unde Abubakar activează acum ca lider al echipei de Machine Learning.
 
 [**Matthew Carrigan**](https://huggingface.co/Rocketknight1) este inginer de Machine Learning la Hugging Face. Locuiește în Dublin, Irlanda și a lucrat anterior ca inginer ML la Parse.ly și înainte de asta ca cercetător postdoctoral la Trinity College Dublin. El nu crede că vom ajunge la AGI prin scalarea arhitecturilor existente, dar are mari speranțe în ceea ce privește nemurirea roboților.
 

From 0dc0bd7beca6bdd3cde1017aa3859a367614c3da Mon Sep 17 00:00:00 2001
From: Stojoc Vladimir <61602995+tokyo-s@users.noreply.github.com>
Date: Fri, 14 Feb 2025 00:36:02 +0200
Subject: [PATCH 020/167] Update chapters/rum/chapter1/4.mdx

Co-authored-by: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
---
 chapters/rum/chapter1/4.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter1/4.mdx b/chapters/rum/chapter1/4.mdx
index 6fb2bdcdb..77ca51dea 100644
--- a/chapters/rum/chapter1/4.mdx
+++ b/chapters/rum/chapter1/4.mdx
@@ -103,7 +103,7 @@ Această preinstruire se face de obicei pe cantități foarte mari de date. Prin
 * Deoarece modelul preinstruit a fost deja instruit pe o mulțime de date, reglarea fină necesită mult mai puține date pentru a obține rezultate decente.
 * Din același motiv, timpul și resursele necesare pentru a obține rezultate bune sunt mult mai reduse.
 
-De exemplu, se poate valorifica un model preformat antrenat pe limba engleză și apoi ajustat pe un corpus arXiv, rezultând un model bazat pe știință/cercetare. Reglarea fină va necesita doar o cantitate limitată de date: cunoștințele dobândite de modelul pre-format sunt „transferate”, de unde și termenul de *învățare prin transfer*.
+De exemplu, se poate valorifica un model preformat antrenat pe limba engleză și apoi ajustat pe un corpus arXiv, rezultând un model bazat pe știință/cercetare. Reglarea fină va necesita doar o cantitate limitată de date: cunoștințele dobândite de modelul pre-format sunt „transferate”, de unde și termenul de *transfer learning*.
 
 <div class="flex justify-center">
 <img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/finetuning.svg" alt="The fine-tuning of a language model is cheaper than pretraining in both time and money.">

From bdba83a7b27afa2181c37bdc099525fd1f1fa891 Mon Sep 17 00:00:00 2001
From: Stojoc Vladimir <61602995+tokyo-s@users.noreply.github.com>
Date: Fri, 14 Feb 2025 00:36:25 +0200
Subject: [PATCH 021/167] Update chapters/rum/chapter1/10.mdx

Co-authored-by: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
---
 chapters/rum/chapter1/10.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter1/10.mdx b/chapters/rum/chapter1/10.mdx
index 3936539e5..cae6edb46 100644
--- a/chapters/rum/chapter1/10.mdx
+++ b/chapters/rum/chapter1/10.mdx
@@ -118,7 +118,7 @@ result = classifier("This is a course about the Transformers library")
 	]}
 />
 
-### 5. Ce înseamnă „învățarea prin transfer”?
+### 5. Ce înseamnă „transfer learning”?
 
 <Question
 	choices={[

From 1da6a3a4a171a14f833a41b1be0ae83b1ad65c7d Mon Sep 17 00:00:00 2001
From: Stojoc Vladimir <61602995+tokyo-s@users.noreply.github.com>
Date: Fri, 14 Feb 2025 00:37:05 +0200
Subject: [PATCH 022/167] Update chapters/rum/chapter1/9.mdx

Co-authored-by: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
---
 chapters/rum/chapter1/9.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter1/9.mdx b/chapters/rum/chapter1/9.mdx
index 4d0cd5a4a..3c322abb1 100644
--- a/chapters/rum/chapter1/9.mdx
+++ b/chapters/rum/chapter1/9.mdx
@@ -7,7 +7,7 @@
 
 În acest capitol, ați văzut cum să abordați diferite sarcini NLP utilizând funcția de nivel înalt `pipeline()` din 🤗 Transformers. De asemenea, ați văzut cum să căutați și să utilizați modele în Hub, precum și cum să utilizați API-ul de inferență pentru a testa modelele direct în browser.
 
-Am discutat despre modul în care funcționează modelele Transformer la un nivel general și am vorbit despre importanța învățării prin transfer și a reglării fine. Un aspect cheie este faptul că puteți utiliza întreaga arhitectură sau doar codificatorul sau decodificatorul, în funcție de tipul de sarcină pe care doriți să o rezolvați. Următorul tabel rezumă acest aspect:
+Am discutat despre modul în care funcționează modelele Transformer la un nivel general și am vorbit despre importanța la transfer learning și fine-tuning. Un aspect cheie este faptul că puteți utiliza întreaga arhitectură sau doar encoder-ul sau decoder-ul, în funcție de tipul de sarcină pe care doriți să o rezolvați. Următorul tabel rezumă acest aspect:
 
 | Model           | Exemple                                    | Task-uri                                                                           |
 |-----------------|--------------------------------------------|----------------------------------------------------------------------------------|

From c352f836b7653d21df781389ae628b713f32cf5c Mon Sep 17 00:00:00 2001
From: Stojoc Vladimir <61602995+tokyo-s@users.noreply.github.com>
Date: Fri, 14 Feb 2025 00:37:35 +0200
Subject: [PATCH 023/167] Update chapters/rum/chapter1/5.mdx

Co-authored-by: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
---
 chapters/rum/chapter1/5.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter1/5.mdx b/chapters/rum/chapter1/5.mdx
index 6a32cff0b..3ff7eb82b 100644
--- a/chapters/rum/chapter1/5.mdx
+++ b/chapters/rum/chapter1/5.mdx
@@ -7,7 +7,7 @@
 
 <Youtube id="MUqNwgPjJvQ" />
 
-Modelele Encoder utilizează doar encoderul unui model Transformer. La fiecare etapă, layer-urile de atenție pot accesa toate cuvintele din propoziția inițială. Aceste modele sunt adesea caracterizate ca având o atenție „bidirecțională” și sunt adesea numite *modele de autocodificare*.
+Modelele Encoder utilizează doar encoderul unui model Transformer. La fiecare etapă, layer-urile de atenție pot accesa toate cuvintele din propoziția inițială. Aceste modele sunt adesea caracterizate ca având o atenție „bidirecțională” și sunt adesea numite *modele auto-encoding*.
 
 Preinstruirea acestor modele se bazează, de obicei, pe alterarea unei propoziții date (de exemplu, prin mascarea unor cuvinte aleatorii) și pe sarcina modelului de a găsi sau reconstrui propoziția inițială.
 

From 809e569bf359544fb85edb45b16073abc9674051 Mon Sep 17 00:00:00 2001
From: Stojoc Vladimir <61602995+tokyo-s@users.noreply.github.com>
Date: Fri, 14 Feb 2025 00:37:53 +0200
Subject: [PATCH 024/167] Update chapters/rum/chapter1/4.mdx

Co-authored-by: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
---
 chapters/rum/chapter1/4.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter1/4.mdx b/chapters/rum/chapter1/4.mdx
index 77ca51dea..cc86b6527 100644
--- a/chapters/rum/chapter1/4.mdx
+++ b/chapters/rum/chapter1/4.mdx
@@ -100,7 +100,7 @@ Această preinstruire se face de obicei pe cantități foarte mari de date. Prin
 *Reglarea-fină*, pe de altă parte, este instruirea efectuată **după** ce un model a fost preinstruit. Pentru a efectua reglarea fină, obțineți mai întâi un model lingvistic preinstruit, apoi efectuați o instruire suplimentară cu un set de date specific sarcinii dumneavoastră. Stați - de ce să nu instruiți de la început modelul pentru cazul dvs. final de utilizare (**scratch**)? Există câteva motive:
 
 * Modelul preinstruit a fost deja instruit pe un set de date care are unele similitudini cu setul de date pentru reglarea fină. Procesul de reglare fină este astfel capabil să profite de cunoștințele dobândite de modelul inițial în timpul preantrenării (de exemplu, în cazul problemelor de NLP, modelul preantrenat va avea un anumit tip de înțelegere statistică a limbajului pe care îl utilizați pentru sarcina dumneavoastră). 
-* Deoarece modelul preinstruit a fost deja instruit pe o mulțime de date, reglarea fină necesită mult mai puține date pentru a obține rezultate decente.
+* Deoarece modelul preinstruit a fost deja instruit pe o mulțime de date, fine-tuning-ul necesită mult mai puține date pentru a obține rezultate decente.
 * Din același motiv, timpul și resursele necesare pentru a obține rezultate bune sunt mult mai reduse.
 
 De exemplu, se poate valorifica un model preformat antrenat pe limba engleză și apoi ajustat pe un corpus arXiv, rezultând un model bazat pe știință/cercetare. Reglarea fină va necesita doar o cantitate limitată de date: cunoștințele dobândite de modelul pre-format sunt „transferate”, de unde și termenul de *transfer learning*.

From 1f7bc6b44a9a9d611f034197d13984241f7f808d Mon Sep 17 00:00:00 2001
From: Stojoc Vladimir <61602995+tokyo-s@users.noreply.github.com>
Date: Fri, 14 Feb 2025 00:39:53 +0200
Subject: [PATCH 025/167] Update chapters/rum/chapter1/1.mdx

Co-authored-by: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
---
 chapters/rum/chapter1/1.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter1/1.mdx b/chapters/rum/chapter1/1.mdx
index 1f2802551..c3862328d 100644
--- a/chapters/rum/chapter1/1.mdx
+++ b/chapters/rum/chapter1/1.mdx
@@ -125,7 +125,7 @@ Sunteți gata să începeți? În acest capitol, veți învăța:
 
 * Cum să utilizați funcția `pipeline()` pentru a rezolva sarcini NLP precum generarea și clasificarea textului
 * Despre arhitectura Transformer
-* Cum să faceți distincția între arhitecturile și cazurile de utilizare ale codificatorului, decodificatorului și codificatorului-decodificator.
+* Cum să faceți distincția între arhitecturile și cazurile de utilizare ale encoderului, decoderului și encoder-decoder.
 - Capitolele 9-12 trec dincolo de NLP și explorează modul în care modelele Transformer pot fi utilizate pentru a aborda sarcini din domeniul procesării semnalelor vorbirii și al viziunii computerizate. Pe parcurs, veți învăța cum să construiți și să partajați demo-uri ale modelelor dumneavoastră și cum să le optimizați pentru mediul de producție. Până la sfârșitul acestei părți, veți fi gata să aplicați 🤗 Transformers la (aproape) orice problemă de machine learning!
 
 Acest curs:

From 48e24cc98a5f61730c547e4f589225bdbcfbbe18 Mon Sep 17 00:00:00 2001
From: Stojoc Vladimir <61602995+tokyo-s@users.noreply.github.com>
Date: Fri, 14 Feb 2025 00:40:57 +0200
Subject: [PATCH 026/167] Update chapters/rum/chapter1/2.mdx

Co-authored-by: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
---
 chapters/rum/chapter1/2.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter1/2.mdx b/chapters/rum/chapter1/2.mdx
index 2fb20b831..ff69890fc 100644
--- a/chapters/rum/chapter1/2.mdx
+++ b/chapters/rum/chapter1/2.mdx
@@ -15,7 +15,7 @@ NLP este un domeniu al lingvisticii și al învățării automate axat pe înțe
 
 - **Clasificarea propozițiilor întregi**: Determinarea caracterului unei recenzii, detectarea dacă un e-mail este spam, determinarea dacă o propoziție este corectă gramatical sau dacă două propoziții sunt legate logic sau nu
 - **Clasificarea fiecărui cuvânt dintr-o propoziție**: Identificarea componentelor gramaticale ale unei propoziții (substantiv, verb, adjectiv) sau a entităților nominalizate (persoană, locație, organizație)
-- **Generarea conținutului de text**: Completarea unui text generat automat, completarea spațiilor goale dintr-un text cu cuvinte ascunse
+- **Generarea conținutului de text**: Completarea unui text generat automat, completarea spațiilor goale dintr-un text cu cuvinte mascate
 - **Extragerea unui răspuns dintr-un text**:Având o întrebare și un context, se extrage răspunsul la întrebare pe baza informațiilor furnizate în context
 - **Generarea unei propoziții noi dintr-un text de intrare**: Traducerea unui text într-o altă limbă, rezumarea textului
 

From 6918c5a2977c40e67033d5ab3c3e746662d4624b Mon Sep 17 00:00:00 2001
From: Stojoc Vladimir <61602995+tokyo-s@users.noreply.github.com>
Date: Fri, 14 Feb 2025 00:41:47 +0200
Subject: [PATCH 027/167] Update chapters/rum/chapter1/2.mdx

Co-authored-by: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
---
 chapters/rum/chapter1/2.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter1/2.mdx b/chapters/rum/chapter1/2.mdx
index ff69890fc..b1d60e548 100644
--- a/chapters/rum/chapter1/2.mdx
+++ b/chapters/rum/chapter1/2.mdx
@@ -16,7 +16,7 @@ NLP este un domeniu al lingvisticii și al învățării automate axat pe înțe
 - **Clasificarea propozițiilor întregi**: Determinarea caracterului unei recenzii, detectarea dacă un e-mail este spam, determinarea dacă o propoziție este corectă gramatical sau dacă două propoziții sunt legate logic sau nu
 - **Clasificarea fiecărui cuvânt dintr-o propoziție**: Identificarea componentelor gramaticale ale unei propoziții (substantiv, verb, adjectiv) sau a entităților nominalizate (persoană, locație, organizație)
 - **Generarea conținutului de text**: Completarea unui text generat automat, completarea spațiilor goale dintr-un text cu cuvinte mascate
-- **Extragerea unui răspuns dintr-un text**:Având o întrebare și un context, se extrage răspunsul la întrebare pe baza informațiilor furnizate în context
+- **Extragerea unui răspuns dintr-un text**: Având o întrebare și un context, se extrage răspunsul la întrebare pe baza informațiilor furnizate în context
 - **Generarea unei propoziții noi dintr-un text de intrare**: Traducerea unui text într-o altă limbă, rezumarea textului
 
 NLP nu se limitează însă la textul scris. NLP, de asemenea, abordează provocări complexe în domeniul recunoașterii vorbirii și al viziunii computerizate, cum ar fi generarea unei transcrieri a unui fragment audio sau a unei descrieri a unei imagini.

From bd0fdd166d25a648061a080b9480b2e0358c0344 Mon Sep 17 00:00:00 2001
From: Stojoc Vladimir <61602995+tokyo-s@users.noreply.github.com>
Date: Fri, 14 Feb 2025 00:42:03 +0200
Subject: [PATCH 028/167] Update chapters/rum/chapter1/2.mdx

Co-authored-by: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
---
 chapters/rum/chapter1/2.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter1/2.mdx b/chapters/rum/chapter1/2.mdx
index b1d60e548..7c099f28f 100644
--- a/chapters/rum/chapter1/2.mdx
+++ b/chapters/rum/chapter1/2.mdx
@@ -19,7 +19,7 @@ NLP este un domeniu al lingvisticii și al învățării automate axat pe înțe
 - **Extragerea unui răspuns dintr-un text**: Având o întrebare și un context, se extrage răspunsul la întrebare pe baza informațiilor furnizate în context
 - **Generarea unei propoziții noi dintr-un text de intrare**: Traducerea unui text într-o altă limbă, rezumarea textului
 
-NLP nu se limitează însă la textul scris. NLP, de asemenea, abordează provocări complexe în domeniul recunoașterii vorbirii și al viziunii computerizate, cum ar fi generarea unei transcrieri a unui fragment audio sau a unei descrieri a unei imagini.
+NLP nu se limitează însă la textul scris. De asemenea, NLP abordează provocări complexe în domeniul recunoașterii vorbirii și al viziunii computerizate, cum ar fi generarea unei transcrieri a unui fragment audio sau a unei descrieri a unei imagini.
 
 ## De ce este o provocare?[[de-ce-este-o-provocare]]
 

From 8a98c77e6619b555c35688fef6c23f0dba0f01d1 Mon Sep 17 00:00:00 2001
From: Stojoc Vladimir <61602995+tokyo-s@users.noreply.github.com>
Date: Fri, 14 Feb 2025 00:43:16 +0200
Subject: [PATCH 029/167] Update chapters/rum/chapter1/2.mdx

Co-authored-by: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
---
 chapters/rum/chapter1/2.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter1/2.mdx b/chapters/rum/chapter1/2.mdx
index 7c099f28f..ce45b9035 100644
--- a/chapters/rum/chapter1/2.mdx
+++ b/chapters/rum/chapter1/2.mdx
@@ -23,4 +23,4 @@ NLP nu se limitează însă la textul scris. De asemenea, NLP abordează provoc
 
 ## De ce este o provocare?[[de-ce-este-o-provocare]]
 
-Computerele nu procesează informațiile în același mod ca oamenii. De exemplu, atunci când citim propoziția „Mi-e foame”, îi putem înțelege cu ușurință semnificația. În mod similar, având în vedere două propoziții precum „mi-e foame” și „sunt trist”, suntem capabili să determinăm cu ușurință cât de asemănătoare sunt acestea. Pentru modelele de învățare automată (ML), astfel de sarcini sunt mai dificile. Textul trebuie prelucrat într-un mod care să permită modelului să învețe din el. Și deoarece limbajul este complex, trebuie să ne gândim cu atenție la modul în care trebuie efectuată această procesare. Au fost efectuate numeroase cercetări cu privire la modul de reprezentare a textului și vom analiza câteva metode în capitolul următor.
+Computerele nu procesează informațiile în același mod ca oamenii. De exemplu, atunci când citim propoziția „Mi-e foame”, îi putem înțelege cu ușurință semnificația. În mod similar, având în vedere două propoziții precum „Mi-e foame” și „Sunt trist”, suntem capabili să determinăm cu ușurință cât de asemănătoare sunt acestea. Pentru modelele de învățare automată (ML), astfel de sarcini sunt mai dificile. Textul trebuie prelucrat într-un mod care să permită modelului să învețe din el. Și deoarece limbajul este complex, trebuie să ne gândim cu atenție la modul în care trebuie efectuată această procesare. Au fost efectuate numeroase cercetări cu privire la modul de reprezentare a textului și vom analiza câteva metode în capitolul următor.

From 1675b506d31d5f65609561b7e8cc92d232b18e10 Mon Sep 17 00:00:00 2001
From: Stojoc Vladimir <61602995+tokyo-s@users.noreply.github.com>
Date: Fri, 14 Feb 2025 00:45:39 +0200
Subject: [PATCH 030/167] Update chapters/rum/chapter1/1.mdx

Co-authored-by: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
---
 chapters/rum/chapter1/1.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter1/1.mdx b/chapters/rum/chapter1/1.mdx
index c3862328d..04441ad21 100644
--- a/chapters/rum/chapter1/1.mdx
+++ b/chapters/rum/chapter1/1.mdx
@@ -43,7 +43,7 @@ Aceasta este o scurtă prezentare a cursului:
 
 - Capitolele 1-4 oferă o introducere în conceptele fundamentale ale bibliotecii 🤗 Transformers. Până la sfârșitul acestei părți a cursului, veți fi familiarizați cu modul în care funcționează modelele Transformer și veți ști cum să utilizați un model din [Hugging Face Hub](https://huggingface.co/models), să îl ajustați pe un set de date și să vă partajați rezultatele pe Hub!
 - Capitolele 5-8 predau elementele de bază ale Datasets 🤗 și ale Tokenizerelor 🤗 înainte de a vă scufunda în sarcinile NLP. Până la sfârșitul acestei părți, veți fi capabil să abordați singur cele mai frecvente probleme NLP.
-- Capitolele 9-12 trec dincolo de NLP și explorează modul în care modelele Transformer pot fi utilizate pentru a aborda sarcini din domeniul procesării semnalelor vorbirii și al viziunii computerizate. Pe parcurs, veți învăța cum să construiți și să partajați demo-uri ale modelelor dumneavoastră și cum să le optimizați pentru mediul de producție. Până la sfârșitul acestei părți, veți fi gata să aplicați 🤗 Transformers la (aproape) orice problemă de machine learning!
+- Capitolele 9-12 trec dincolo de NLP și explorează modul în care modelele Transformer pot fi utilizate pentru a aborda sarcini din domeniul procesării semnalelor vorbirii și computer vision. Pe parcurs, veți învăța cum să construiți și să partajați demo-uri ale modelelor dumneavoastră și cum să le optimizați pentru mediul de producție. Până la sfârșitul acestei părți, veți fi gata să aplicați 🤗 Transformers la (aproape) orice problemă de machine learning!
 
 Acest curs:
 

From 49aaf330d669b5832a93eb20dcde3b640ed4a265 Mon Sep 17 00:00:00 2001
From: Stojoc Vladimir <61602995+tokyo-s@users.noreply.github.com>
Date: Fri, 14 Feb 2025 00:55:12 +0200
Subject: [PATCH 031/167] Update 1.mdx

---
 chapters/rum/chapter1/1.mdx | 105 ------------------------------------
 1 file changed, 105 deletions(-)

diff --git a/chapters/rum/chapter1/1.mdx b/chapters/rum/chapter1/1.mdx
index 04441ad21..ca44593f9 100644
--- a/chapters/rum/chapter1/1.mdx
+++ b/chapters/rum/chapter1/1.mdx
@@ -19,28 +19,6 @@ Aceasta este o scurtă prezentare a cursului:
 <img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/summary-dark.svg" alt="Brief overview of the chapters of the course.">
 </div>
 
-- Capitolele 1-4 oferă o introducere în conceptele fundamentale ale bibliotecii 🤗 Transformers. Până la sfârșitul acestei părți a cursului, veți fi familiarizați cu modul în care funcționează modelele Transformer și veți ști cum să utilizați un model din [Hugging Face Hub](https://huggingface.co/models), să îl ajustați pe un set de date și să vă partajați rezultatele pe Hub!
-- # Introducere[[introduction]]
-
-<CourseFloatingBanner
-    chapter={1}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-## Bun venit la 🤗 curs![[bun-venit-la-curs]]
-
-<Youtube id="00GKzGyWFEs" />
-Acest curs vă va învăța despre procesarea limbajelor naturale (NLP) folosind biblioteci din ecosistemul [Hugging Face](https://huggingface.co/) — [🤗 Transformers](https://github.com/huggingface/transformers), [🤗 Datasets](https://github.com/huggingface/datasets), [🤗 Tokenizers](https://github.com/huggingface/tokenizers), and [🤗 Accelerate](https://github.com/huggingface/accelerate) — precum și [Hugging Face Hub](https://huggingface.co/models).Este complet gratuit și nu conține reclame.
-
-## La ce să te aștepți?[[la-ce-sa-te-aștepți]]
-
-Aceasta este o scurtă prezentare a cursului:
-
-<div class="flex justify-center">
-<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/summary.svg" alt="Brief overview of the chapters of the course.">
-<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/summary-dark.svg" alt="Brief overview of the chapters of the course.">
-</div>
-
 - Capitolele 1-4 oferă o introducere în conceptele fundamentale ale bibliotecii 🤗 Transformers. Până la sfârșitul acestei părți a cursului, veți fi familiarizați cu modul în care funcționează modelele Transformer și veți ști cum să utilizați un model din [Hugging Face Hub](https://huggingface.co/models), să îl ajustați pe un set de date și să vă partajați rezultatele pe Hub!
 - Capitolele 5-8 predau elementele de bază ale Datasets 🤗 și ale Tokenizerelor 🤗 înainte de a vă scufunda în sarcinile NLP. Până la sfârșitul acestei părți, veți fi capabil să abordați singur cele mai frecvente probleme NLP.
 - Capitolele 9-12 trec dincolo de NLP și explorează modul în care modelele Transformer pot fi utilizate pentru a aborda sarcini din domeniul procesării semnalelor vorbirii și computer vision. Pe parcurs, veți învăța cum să construiți și să partajați demo-uri ale modelelor dumneavoastră și cum să le optimizați pentru mediul de producție. Până la sfârșitul acestei părți, veți fi gata să aplicați 🤗 Transformers la (aproape) orice problemă de machine learning!
@@ -126,86 +104,3 @@ Sunteți gata să începeți? În acest capitol, veți învăța:
 * Cum să utilizați funcția `pipeline()` pentru a rezolva sarcini NLP precum generarea și clasificarea textului
 * Despre arhitectura Transformer
 * Cum să faceți distincția între arhitecturile și cazurile de utilizare ale encoderului, decoderului și encoder-decoder.
-- Capitolele 9-12 trec dincolo de NLP și explorează modul în care modelele Transformer pot fi utilizate pentru a aborda sarcini din domeniul procesării semnalelor vorbirii și al viziunii computerizate. Pe parcurs, veți învăța cum să construiți și să partajați demo-uri ale modelelor dumneavoastră și cum să le optimizați pentru mediul de producție. Până la sfârșitul acestei părți, veți fi gata să aplicați 🤗 Transformers la (aproape) orice problemă de machine learning!
-
-Acest curs:
-
-* Necesită o bună cunoaștere a limbajului Python.
-* Este mai bine să fie urmat după un curs introductiv de deep learning, cum ar fi [fast.ai's](https://www.fast.ai/) [Practical Deep Learning for Coders](https://course.fast.ai/) sau unul dintre programele dezvoltate de [DeepLearning.AI](https://www.deeplearning.ai/).
-* Nu se așteaptă la cunoștințe anterioare despre [PyTorch](https://pytorch.org/) sau [TensorFlow](https://www.tensorflow.org/), deși o familiaritate cu oricare dintre acestea va fi de ajutor.
-
-După ce ați completat acest curs, vă recomandăm să accesați [Natural Language Processing Specialization] (https://www.coursera.org/specializations/natural-language-processing?utm_source=deeplearning-ai&utm_medium=institutions&utm_campaign=20211011-nlp-2-hugging_face-page-nlp-refresh) de la DeepLearning.AI, care acoperă o gamă largă de modele NLP clasice, cum ar fi naive Bayes și LSTMs, despre care este bine să știți!
-
-## Cine suntem noi?[[cine-suntem-noi]]
-
-Despre autori:
-
-[**Abubakar Abid**](https://huggingface.co/abidlabs) și-a susținut doctoratul la Stanford în domeniul învățării automate (Machine Learning) aplicate. În timpul doctoratului său, a fondat [Gradio](https://github.com/gradio-app/gradio), o bibliotecă Python open-source care a fost utilizată pentru a construi peste 600.000 de demo-uri de Machine Learning. Gradio a fost achiziționată de Hugging Face, unde Abubakar activează acum ca lider al echipei de Machine Learning.
-
-[**Matthew Carrigan**](https://huggingface.co/Rocketknight1) este inginer de Machine Learning la Hugging Face. Locuiește în Dublin, Irlanda și a lucrat anterior ca inginer ML la Parse.ly și înainte de asta ca cercetător postdoctoral la Trinity College Dublin. El nu crede că vom ajunge la AGI prin scalarea arhitecturilor existente, dar are mari speranțe în ceea ce privește nemurirea roboților.
-
-[**Lysandre Debut**](https://huggingface.co/lysandre) este inginer de Machine Learning la Hugging Face și a lucrat la biblioteca 🤗 Transformers încă din primele etape de dezvoltare. Scopul său este de a face NLP accesibil pentru toată lumea prin dezvoltarea de instrumente cu un API foarte simplu.
-
-[**Sylvain Gugger**](https://huggingface.co/sgugger) este inginer de cercetare în Machine Learning la Hugging Face și unul dintre principalii întreținători ai bibliotecii 🤗 Transformers. Anterior a fost cercetător științific la fast.ai și a fost coautor la _[Deep Learning for Coders with fastai and PyTorch](https://learning.oreilly.com/library/view/deep-learning-for/9781492045519/)_ cu Jeremy Howard. Obiectivul principal al cercetării sale este de a face învățarea profundă mai accesibilă, prin proiectarea și îmbunătățirea tehnicilor care permit modelelor să se antreneze rapid pe resurse limitate.
-
-[**Dawood Khan**](https://huggingface.co/dawoodkhan82) este inginer de Machine Learning la Hugging Face. Este originar din New York și a absolvit Universitatea din New York, unde a studiat Informatica. După ce a lucrat ca inginer iOS timp de câțiva ani, Dawood a demisionat pentru a înființa Gradio împreună cu colegii săi co-fondatori. Gradio a fost în cele din urmă achiziționat de Hugging Face.
-
-[**Merve Noyan**](https://huggingface.co/merve) este un susținător al dezvoltatorilor la Hugging Face, lucrând la dezvoltarea de instrumente și la crearea de conținut în jurul acestora pentru a facilita învățarea automată pentru toată lumea. 
-
-[**Lucile Saulnier**](https://huggingface.co/SaulLu) este inginer de Machine Learning la Hugging Face, dezvoltând și susținând utilizarea de instrumente open source. De asemenea, este implicată activ în multe proiecte de cercetare în domeniul procesării limbajului natural, cum ar fi formarea colaborativă și BigScience.
-
-[**Lewis Tunstall**](https://huggingface.co/lewtun) este inginer de Machine Learning la Hugging Face, concentrându-se pe dezvoltarea de instrumente open-source și pe asigurarea accesibilității acestora pentru întreaga comunitate. De asemenea, este coautor al cărții O'Reilly [Natural Language Processing with Transformers] (https://www.oreilly.com/library/view/natural-language-processing/9781098136789/).
-
-[**Leandro von Werra**](https://huggingface.co/lvwerra) este inginer de Machine Learning în cadrul echipei open-source de la Hugging Face și, de asemenea, coautor al cărții O'Reilly [Natural Language Processing with Transformers] (https://www.oreilly.com/library/view/natural-language-processing/9781098136789/). El are mai mulți ani de experiență în industrie, aducând proiecte NLP în stadiul de producție, lucrând pe întreaga stivă de învățare automată.
-
-## FAQ[[faq]]
-
-Iată câteva răspunsuri la întrebări frecvente:
-
-- **Acest curs permite obținerea unei certificări?**
-Deocamdată nu avem nicio certificare pentru acest curs. Cu toate acestea, lucrăm la un program de certificare pentru ecosistemul Hugging Face - rămâneți pe fază!
-
-- **Cât timp ar trebui să dedic acestui curs?**
-Fiecare capitol din acest curs este conceput pentru a fi parcurs într-o săptămână, cu aproximativ 6-8 ore de lucru pe săptămână. Cu toate acestea, vă puteți lua cât timp aveți nevoie pentru a finaliza cursul.
-
-- **Unde pot să pun o întrebare dacă am una?**
-Dacă aveți o întrebare despre orice secțiune a cursului, faceți clic pe bannerul „*Pune o întrebare*” din partea de sus a paginii pentru a fi redirecționat automat către secțiunea corectă a [[Hugging Face forums](https://discuss.huggingface.co/):
-
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/forum-button.png" alt="Link to the Hugging Face forums" width="75%">
-
-Rețineți că o listă de [idei de proiecte](https://discuss.huggingface.co/c/course/course-event/25) este de asemenea disponibilă pe forumuri dacă doriți să practicați mai mult după ce ați terminat cursul.
-
-- **De unde pot obține codul pentru curs?**
-Pentru fiecare secțiune, faceți clic pe bannerul din partea de sus a paginii pentru a rula codul în Google Colab sau Amazon SageMaker Studio Lab:
-
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/notebook-buttons.png" alt="Link to the Hugging Face course notebooks" width="75%">
-
-Caietele Jupyter care conțin tot codul din curs sunt găzduite în repo-ul [`huggingface/notebooks`](https://github.com/huggingface/notebooks). Dacă doriți să le generați local, consultați instrucțiunile din repo-ul [`course`](https://github.com/huggingface/course#-jupyter-notebooks) de pe GitHub.
-
-
-- **Cum pot contribui la curs?**
-Există multe modalități de a contribui la curs! Dacă găsiți o greșeală de tipar sau o eroare, vă rugăm să creați o cerere în repo-ul [`course`](https://github.com/huggingface/course). Dacă doriți să ajutați la traducerea cursului în limba dumneavoastră maternă, consultați instrucțiunile [aici](https://github.com/huggingface/course#translating-the-course-into-your-language).
-
-- **Care au fost alegerile făcute pentru fiecare traducere?**
-Fiecare traducere are un glosar și un fișier `TRANSLATING.txt` care detaliază alegerile care au fost făcute pentru jargonul de Machine Learning etc. Puteți găsi un exemplu în limba germană [aici](https://github.com/huggingface/course/blob/main/chapters/de/TRANSLATING.txt).
-
-
-- **Pot reutiliza acest curs?**
-Desigur! Cursul este distribuit sub licența [Apache 2 license](https://www.apache.org/licenses/LICENSE-2.0.html) cu caracter permisiv. Aceasta înseamnă că trebuie să acordați creditul corespunzător, să furnizați un link către licență și să indicați dacă au fost făcute modificări. Puteți face acest lucru în orice mod rezonabil, dar nu în niciun fel care să sugereze că licențiatorul vă aprobă pe dumneavoastră sau utilizarea dumneavoastră. Dacă doriți să citați cursul, vă rugăm să utilizați următorul BibTeX:
-
-```
-@misc{huggingfacecourse,
-  author = {Hugging Face},
-  title = {The Hugging Face Course, 2022},
-  howpublished = "\url{https://huggingface.co/course}",
-  year = {2022},
-  note = "[Online; accessed <today>]"
-}
-```
-
-## Let's Go
-Sunteți gata să începeți? În acest capitol, veți învăța:
-
-* Cum să utilizați funcția `pipeline()` pentru a rezolva sarcini NLP precum generarea și clasificarea textului
-* Despre arhitectura Transformer
-* Cum să faceți distincția între arhitecturile și cazurile de utilizare ale codificatorului, decodificatorului și codificatorului-decodificatort

From 148eaa0f9a708a83719834666b6d95754b2d65a4 Mon Sep 17 00:00:00 2001
From: Stojoc Vladimir <61602995+tokyo-s@users.noreply.github.com>
Date: Fri, 14 Feb 2025 00:58:19 +0200
Subject: [PATCH 032/167] Update chapters/rum/chapter1/3.mdx

Co-authored-by: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
---
 chapters/rum/chapter1/3.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter1/3.mdx b/chapters/rum/chapter1/3.mdx
index 91803fb0a..a0c6d6443 100644
--- a/chapters/rum/chapter1/3.mdx
+++ b/chapters/rum/chapter1/3.mdx
@@ -67,7 +67,7 @@ Atunci când transmiteți un text către un pipeline, sunt necesari trei pași:
 3. Predicțiile modelului sunt postprocesate, astfel încât să le puteți înțelege.
 
 
-Unele dintre [pipeline-urile disponibile] în prezent (https://huggingface.co/transformers/main_classes/pipelines) sunt:
+Unele dintre [pipeline-urile disponibile](https://huggingface.co/transformers/main_classes/pipelines) în prezent sunt:
 
 - `feature-extraction` (obține reprezentarea vectorială a unui text)
 - `fill-mask`

From ece16e2288e3a858f79dcdc6629373f92cf597d1 Mon Sep 17 00:00:00 2001
From: Stojoc Vladimir <61602995+tokyo-s@users.noreply.github.com>
Date: Fri, 14 Feb 2025 00:58:35 +0200
Subject: [PATCH 033/167] Update chapters/rum/chapter1/5.mdx

Co-authored-by: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
---
 chapters/rum/chapter1/5.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter1/5.mdx b/chapters/rum/chapter1/5.mdx
index 3ff7eb82b..54cb4924a 100644
--- a/chapters/rum/chapter1/5.mdx
+++ b/chapters/rum/chapter1/5.mdx
@@ -9,7 +9,7 @@
 
 Modelele Encoder utilizează doar encoderul unui model Transformer. La fiecare etapă, layer-urile de atenție pot accesa toate cuvintele din propoziția inițială. Aceste modele sunt adesea caracterizate ca având o atenție „bidirecțională” și sunt adesea numite *modele auto-encoding*.
 
-Preinstruirea acestor modele se bazează, de obicei, pe alterarea unei propoziții date (de exemplu, prin mascarea unor cuvinte aleatorii) și pe sarcina modelului de a găsi sau reconstrui propoziția inițială.
+Preantrenarea acestor modele se bazează, de obicei, pe alterarea unei propoziții date (de exemplu, prin mascarea unor cuvinte aleatorii) și pe sarcina modelului de a găsi sau reconstrui propoziția inițială.
 
 Modelele Encoder sunt cele mai potrivite pentru sarcinile care necesită înțelegerea întregii propoziții, cum ar fi clasificarea propozițiilor, recunoașterea entităților numite (și, mai general, clasificarea cuvintelor) și Extractive QA.
 

From f499c57de15c256b6a5cb1d34180ab4b9ae8e424 Mon Sep 17 00:00:00 2001
From: Stojoc Vladimir <61602995+tokyo-s@users.noreply.github.com>
Date: Fri, 14 Feb 2025 00:59:11 +0200
Subject: [PATCH 034/167] Update chapters/rum/chapter1/3.mdx

Co-authored-by: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
---
 chapters/rum/chapter1/3.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter1/3.mdx b/chapters/rum/chapter1/3.mdx
index a0c6d6443..ecea653bf 100644
--- a/chapters/rum/chapter1/3.mdx
+++ b/chapters/rum/chapter1/3.mdx
@@ -71,7 +71,7 @@ Unele dintre [pipeline-urile disponibile](https://huggingface.co/transformers/ma
 
 - `feature-extraction` (obține reprezentarea vectorială a unui text)
 - `fill-mask`
-- `ner` (recunoașterea NE (named entity))
+- `ner` (named entity recognition/recunoașterea entităților numite)
 - `question-answering`
 - `sentiment-analysis`
 - `summarization`

From 1ae2121ef4fa11150bac588d968518497174d3cf Mon Sep 17 00:00:00 2001
From: Stojoc Vladimir <61602995+tokyo-s@users.noreply.github.com>
Date: Fri, 14 Feb 2025 00:59:26 +0200
Subject: [PATCH 035/167] Update chapters/rum/chapter1/6.mdx

Co-authored-by: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
---
 chapters/rum/chapter1/6.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter1/6.mdx b/chapters/rum/chapter1/6.mdx
index 9e284d5ea..de8c7867c 100644
--- a/chapters/rum/chapter1/6.mdx
+++ b/chapters/rum/chapter1/6.mdx
@@ -7,7 +7,7 @@
 
 <Youtube id="d_ixlCubqQw" />
 
-Modelele Decoder utilizează doar decodificatorul unui model Transformer. În fiecare etapă, pentru un cuvânt dat, layerele de atenție pot accesa doar cuvintele poziționate înaintea acestuia în propoziție. Aceste modele sunt adesea numite *modele autoregresive*.
+Modelele Decoder utilizează doar decoder-ul unui model Transformer. În fiecare etapă, pentru un cuvânt dat, layerele de atenție pot accesa doar cuvintele poziționate înaintea acestuia în propoziție. Aceste modele sunt adesea numite *modele autoregresive*.
 
 Preinstruirea modelelor de decodare se axează de obicei pe prezicerea următorului cuvânt din propoziție.
 

From 3959273a2817c5289c11e8f7ad995d8b61f59f5c Mon Sep 17 00:00:00 2001
From: Stojoc Vladimir <61602995+tokyo-s@users.noreply.github.com>
Date: Fri, 14 Feb 2025 00:59:37 +0200
Subject: [PATCH 036/167] Update chapters/rum/chapter1/6.mdx

Co-authored-by: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
---
 chapters/rum/chapter1/6.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter1/6.mdx b/chapters/rum/chapter1/6.mdx
index de8c7867c..7553ac282 100644
--- a/chapters/rum/chapter1/6.mdx
+++ b/chapters/rum/chapter1/6.mdx
@@ -9,7 +9,7 @@
 
 Modelele Decoder utilizează doar decoder-ul unui model Transformer. În fiecare etapă, pentru un cuvânt dat, layerele de atenție pot accesa doar cuvintele poziționate înaintea acestuia în propoziție. Aceste modele sunt adesea numite *modele autoregresive*.
 
-Preinstruirea modelelor de decodare se axează de obicei pe prezicerea următorului cuvânt din propoziție.
+Preantrenarea modelelor de decodare se axează de obicei pe prezicerea următorului cuvânt din propoziție.
 
 Aceste modele sunt cele mai potrivite pentru sarcinile care implică generarea de text.
 

From ad98331121fde07c5b19c30fd07764edd0bcad8a Mon Sep 17 00:00:00 2001
From: Stojoc Vladimir <61602995+tokyo-s@users.noreply.github.com>
Date: Fri, 14 Feb 2025 01:00:10 +0200
Subject: [PATCH 037/167] Update chapters/rum/chapter1/7.mdx

Co-authored-by: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
---
 chapters/rum/chapter1/7.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter1/7.mdx b/chapters/rum/chapter1/7.mdx
index 8a93e0fd8..85e3aaadd 100644
--- a/chapters/rum/chapter1/7.mdx
+++ b/chapters/rum/chapter1/7.mdx
@@ -7,7 +7,7 @@
 
 <Youtube id="0_4KEb08xrE" />
 
-Modelele Encoder-Decoder (denumite și *modele sequence-to-sequence*) utilizează ambele părți ale arhitecturii Transformer. În fiecare etapă, layerele de atenție ale codificatorului pot accesa toate cuvintele din propoziția inițială, în timp ce layerele de atenție ale decodificatorului pot accesa doar cuvintele poziționate înaintea unui anumit cuvânt din intrare.
+Modelele Encoder-Decoder (denumite și *modele sequence-to-sequence*) utilizează ambele părți ale arhitecturii Transformer. În fiecare etapă, layerele de atenție ale encoder-ului pot accesa toate cuvintele din propoziția inițială, în timp ce layerele de atenție ale decoder-ului pot accesa doar cuvintele poziționate înaintea unui anumit cuvânt din intrare.
 
 Preinstruirea acestor modele se poate face folosind obiectivele modelelor de codificare sau de decodificare, dar de obicei implică ceva un pic mai complex. De exemplu, [T5](https://huggingface.co/t5-base) este preinstruit prin înlocuirea unor intervale aleatorii de text (care pot conține mai multe cuvinte) cu un singur cuvânt special mascat, iar obiectivul este apoi de a prezice textul pe care îl înlocuiește acest cuvânt mascat.
 

From 40c29dcb3d46ea31574ddfffd179fd58b7c7b310 Mon Sep 17 00:00:00 2001
From: Stojoc Vladimir <61602995+tokyo-s@users.noreply.github.com>
Date: Fri, 14 Feb 2025 01:00:53 +0200
Subject: [PATCH 038/167] Update chapters/rum/chapter1/7.mdx

Co-authored-by: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
---
 chapters/rum/chapter1/7.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter1/7.mdx b/chapters/rum/chapter1/7.mdx
index 85e3aaadd..abb948c7b 100644
--- a/chapters/rum/chapter1/7.mdx
+++ b/chapters/rum/chapter1/7.mdx
@@ -9,7 +9,7 @@
 
 Modelele Encoder-Decoder (denumite și *modele sequence-to-sequence*) utilizează ambele părți ale arhitecturii Transformer. În fiecare etapă, layerele de atenție ale encoder-ului pot accesa toate cuvintele din propoziția inițială, în timp ce layerele de atenție ale decoder-ului pot accesa doar cuvintele poziționate înaintea unui anumit cuvânt din intrare.
 
-Preinstruirea acestor modele se poate face folosind obiectivele modelelor de codificare sau de decodificare, dar de obicei implică ceva un pic mai complex. De exemplu, [T5](https://huggingface.co/t5-base) este preinstruit prin înlocuirea unor intervale aleatorii de text (care pot conține mai multe cuvinte) cu un singur cuvânt special mascat, iar obiectivul este apoi de a prezice textul pe care îl înlocuiește acest cuvânt mascat.
+Preantrenarea acestor modele se poate face folosind obiectivele modelelor de codificare sau de decodificare, dar de obicei implică ceva un pic mai complex. De exemplu, [T5](https://huggingface.co/t5-base) este prenatrenat prin înlocuirea unor intervale aleatorii de text (care pot conține mai multe cuvinte) cu un singur cuvânt special mascat, iar obiectivul este apoi de a prezice textul pe care îl înlocuiește acest cuvânt mascat.
 
 Modelele Sequence-to-sequence sunt cele mai potrivite pentru sarcinile care se învârt în jurul generării de noi propoziții în funcție de o intrare dată, cum ar fi rezumarea, traducerea sau răspunsul generativ la întrebări.
 

From f0f8409c4f21ae77ddf144d657a8142e2166f4a0 Mon Sep 17 00:00:00 2001
From: Stojoc Vladimir <61602995+tokyo-s@users.noreply.github.com>
Date: Fri, 14 Feb 2025 01:01:06 +0200
Subject: [PATCH 039/167] Update chapters/rum/chapter1/8.mdx

Co-authored-by: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
---
 chapters/rum/chapter1/8.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter1/8.mdx b/chapters/rum/chapter1/8.mdx
index 5f6049d2a..ffd5ae473 100644
--- a/chapters/rum/chapter1/8.mdx
+++ b/chapters/rum/chapter1/8.mdx
@@ -7,7 +7,7 @@
     {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter1/section8.ipynb"},
 ]} />
 
-În cazul în care intenționați să utilizați un model preinstruit sau o versiune ajustată în producție, vă rugăm să fiți conștienți de faptul că, deși aceste modele sunt instrumente puternice, ele au anumite limitări. Cea mai importantă dintre acestea este că, pentru a permite preinstruirea pe cantități mari de date, cercetătorii deseori extrag tot conținutul pe care îl pot găsi, luând atât ce este mai bun, cât și ce este mai rău din ceea ce este disponibil pe internet. 
+În cazul în care intenționați să utilizați un model preantrenat sau o versiune ajustată în producție, vă rugăm să fiți conștienți de faptul că, deși aceste modele sunt instrumente puternice, ele au anumite limitări. Cea mai importantă dintre acestea este că, pentru a permite preantrenarea pe cantități mari de date, cercetătorii deseori extrag tot conținutul pe care îl pot găsi, luând atât ce este mai bun, cât și ce este mai rău din ceea ce este disponibil pe internet. 
 
 Pentru a oferi o ilustrare rapidă, să ne întoarcem la exemplul unui pipeline `fill-mask` cu modelul BERT:
 ```python

From 19d73ec052661d20f3ff95653062cc7ca69034bb Mon Sep 17 00:00:00 2001
From: Stojoc Vladimir <61602995+tokyo-s@users.noreply.github.com>
Date: Fri, 14 Feb 2025 01:02:08 +0200
Subject: [PATCH 040/167] Update chapters/rum/chapter1/3.mdx

Co-authored-by: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
---
 chapters/rum/chapter1/3.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter1/3.mdx b/chapters/rum/chapter1/3.mdx
index ecea653bf..291fd6f1a 100644
--- a/chapters/rum/chapter1/3.mdx
+++ b/chapters/rum/chapter1/3.mdx
@@ -81,7 +81,7 @@ Unele dintre [pipeline-urile disponibile](https://huggingface.co/transformers/ma
 
 Să aruncăm o privire la câteva dintre ele!
 
-## Zero-shot classification[zero-shot-classification]]
+## Zero-shot classification[[zero-shot-classification]]
 
 Vom începe prin a aborda o sarcină mai dificilă în care trebuie să clasificăm texte care nu au fost etichetate. Acesta este un scenariu comun în proiectele din lumea reală, deoarece adnotarea textului este de obicei costisitoare în timp și necesită expertiză în domeniu. Pentru acest caz de utilizare, pipeline-ul `zero-shot-classification` este foarte puternică: vă permite să specificați ce etichete să utilizați pentru clasificare, astfel încât să nu trebuie să vă bazați pe etichetele modelului preinstruit. Ați văzut deja cum modelul poate clasifica o propoziție ca fiind pozitivă sau negativă folosind aceste două etichete - dar poate, de asemenea, clasifica textul folosind orice alt set de etichete doriți.
 

From 025dec56c0e72c7fddf109a506fe603599780a06 Mon Sep 17 00:00:00 2001
From: Stojoc Vladimir <61602995+tokyo-s@users.noreply.github.com>
Date: Fri, 14 Feb 2025 01:02:30 +0200
Subject: [PATCH 041/167] Update chapters/rum/chapter1/3.mdx

Co-authored-by: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
---
 chapters/rum/chapter1/3.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter1/3.mdx b/chapters/rum/chapter1/3.mdx
index 291fd6f1a..1ae20b87a 100644
--- a/chapters/rum/chapter1/3.mdx
+++ b/chapters/rum/chapter1/3.mdx
@@ -209,7 +209,7 @@ Argumentul `top_k` controlează câte posibilități doriți să fie afișate. R
 
 </Tip>
 
-## Recunoașterea NE (named entity)[[recunoașterea-NE]]
+## Named entity recognition[[named-entity-recognition]]
 
 Recunoașterea (NE) este o sarcină în care modelul trebuie să găsească care părți din textul de intrare corespund unor entități precum persoane, locații sau organizații. Să ne uităm la un exemplu:
 

From 5c566662a2c47609205d83cc568d5c855e116b2e Mon Sep 17 00:00:00 2001
From: Stojoc Vladimir <61602995+tokyo-s@users.noreply.github.com>
Date: Fri, 14 Feb 2025 01:02:55 +0200
Subject: [PATCH 042/167] Update chapters/rum/chapter1/3.mdx

Co-authored-by: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
---
 chapters/rum/chapter1/3.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter1/3.mdx b/chapters/rum/chapter1/3.mdx
index 1ae20b87a..9414f5365 100644
--- a/chapters/rum/chapter1/3.mdx
+++ b/chapters/rum/chapter1/3.mdx
@@ -319,7 +319,7 @@ translator("Ce cours est produit par Hugging Face.")
 Ca și în cazul generării și rezumării textului, puteți specifica `max_length` sau `min_length` pentru rezultat.
 <Tip>
 
-✏️ **Incercați!** Căutați modele de traducere în alte limbi și încercați să traduceți propoziția anterioară în câteva limbi diferite.
+✏️ **Încercați!** Căutați modele de traducere în alte limbi și încercați să traduceți propoziția anterioară în câteva limbi diferite.
 
 </Tip>
 

From 7b349a2b753be243788f4df18388fc6fb83edeff Mon Sep 17 00:00:00 2001
From: Stojoc Vladimir <61602995+tokyo-s@users.noreply.github.com>
Date: Fri, 14 Feb 2025 01:03:21 +0200
Subject: [PATCH 043/167] Update chapters/rum/chapter1/3.mdx

Co-authored-by: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
---
 chapters/rum/chapter1/3.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter1/3.mdx b/chapters/rum/chapter1/3.mdx
index 9414f5365..4ef4f11bb 100644
--- a/chapters/rum/chapter1/3.mdx
+++ b/chapters/rum/chapter1/3.mdx
@@ -211,7 +211,7 @@ Argumentul `top_k` controlează câte posibilități doriți să fie afișate. R
 
 ## Named entity recognition[[named-entity-recognition]]
 
-Recunoașterea (NE) este o sarcină în care modelul trebuie să găsească care părți din textul de intrare corespund unor entități precum persoane, locații sau organizații. Să ne uităm la un exemplu:
+Named Entity Recognition (NER) este o sarcină în care modelul trebuie să găsească care părți din textul de intrare corespund unor entități precum persoane, locații sau organizații. Să ne uităm la un exemplu:
 
 ```python
 from transformers import pipeline

From 7aecdd7cd4f36bd8de83166d4bc2449cd4f47004 Mon Sep 17 00:00:00 2001
From: Stojoc Vladimir <61602995+tokyo-s@users.noreply.github.com>
Date: Fri, 14 Feb 2025 01:04:19 +0200
Subject: [PATCH 044/167] Update chapters/rum/chapter1/4.mdx

Co-authored-by: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
---
 chapters/rum/chapter1/4.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter1/4.mdx b/chapters/rum/chapter1/4.mdx
index cc86b6527..65c400dbc 100644
--- a/chapters/rum/chapter1/4.mdx
+++ b/chapters/rum/chapter1/4.mdx
@@ -7,7 +7,7 @@
 
 În această secțiune, vom analiza arhitectura modelelor Transformer.
 
-## Un pic despre istorie modelelor Transformer[[un-pic-despre-istoria-modelelor-transformer]]
+## Un pic despre istoria modelelor Transformer[[un-pic-despre-istoria-modelelor-transformer]]
 
 Iată câteva puncte de referință în (scurta) istorie a modelelor Transformer:
 

From eb079bd9236e73d693de7e488c2fd7db14364a3c Mon Sep 17 00:00:00 2001
From: Stojoc Vladimir <61602995+tokyo-s@users.noreply.github.com>
Date: Fri, 14 Feb 2025 01:04:40 +0200
Subject: [PATCH 045/167] Update chapters/rum/chapter1/4.mdx

Co-authored-by: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
---
 chapters/rum/chapter1/4.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter1/4.mdx b/chapters/rum/chapter1/4.mdx
index 65c400dbc..3abc10a8e 100644
--- a/chapters/rum/chapter1/4.mdx
+++ b/chapters/rum/chapter1/4.mdx
@@ -16,7 +16,7 @@ Iată câteva puncte de referință în (scurta) istorie a modelelor Transformer
 <img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/transformers_chrono-dark.svg" alt="A brief chronology of Transformers models.">
 </div>
 
-[Arhitectura Transformer] (https://arxiv.org/abs/1706.03762) a fost introdusă în iunie 2017. Accentul cercetării inițiale a fost pus pe sarcinile de traducere. Aceasta a fost urmată de introducerea mai multor modele influente, inclusiv:
+[Arhitectura Transformer](https://arxiv.org/abs/1706.03762) a fost introdusă în iunie 2017. Accentul cercetării inițiale a fost pus pe sarcinile de traducere. Aceasta a fost urmată de introducerea mai multor modele influente, inclusiv:
 
 - **Iunie 2018**: [GPT](https://cdn.openai.com/research-covers/language-unsupervised/language_understanding_paper.pdf), primul model Transformer preinstruit, utilizat pentru reglarea precisă a diferitelor sarcini NLP și a obținut rezultate de top
 

From 1f3f04700c6e5be38b8e5b3cbdd5aa7ed0d4c30b Mon Sep 17 00:00:00 2001
From: Stojoc Vladimir <61602995+tokyo-s@users.noreply.github.com>
Date: Fri, 14 Feb 2025 01:04:57 +0200
Subject: [PATCH 046/167] Update chapters/rum/chapter1/4.mdx

Co-authored-by: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
---
 chapters/rum/chapter1/4.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter1/4.mdx b/chapters/rum/chapter1/4.mdx
index 3abc10a8e..15838117e 100644
--- a/chapters/rum/chapter1/4.mdx
+++ b/chapters/rum/chapter1/4.mdx
@@ -18,7 +18,7 @@ Iată câteva puncte de referință în (scurta) istorie a modelelor Transformer
 
 [Arhitectura Transformer](https://arxiv.org/abs/1706.03762) a fost introdusă în iunie 2017. Accentul cercetării inițiale a fost pus pe sarcinile de traducere. Aceasta a fost urmată de introducerea mai multor modele influente, inclusiv:
 
-- **Iunie 2018**: [GPT](https://cdn.openai.com/research-covers/language-unsupervised/language_understanding_paper.pdf), primul model Transformer preinstruit, utilizat pentru reglarea precisă a diferitelor sarcini NLP și a obținut rezultate de top
+- **Iunie 2018**: [GPT](https://cdn.openai.com/research-covers/language-unsupervised/language_understanding_paper.pdf), primul model Transformer preinstruit, utilizat pentru fine-tuning a diferitelor sarcini NLP și a obținut rezultate de top
 
 - **Octombrie 2018**: [BERT](https://arxiv.org/abs/1810.04805), un alt model mare preinstruit, conceput pentru a produce rezumate mai bune ale propozițiilor (mai multe despre el în capitolul următor!)
 

From 006f0898248053187d5c0ad34911ffbaa7d7fb86 Mon Sep 17 00:00:00 2001
From: Stojoc Vladimir <61602995+tokyo-s@users.noreply.github.com>
Date: Fri, 14 Feb 2025 01:05:22 +0200
Subject: [PATCH 047/167] Update chapters/rum/chapter1/4.mdx

Co-authored-by: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
---
 chapters/rum/chapter1/4.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter1/4.mdx b/chapters/rum/chapter1/4.mdx
index 15838117e..84025f758 100644
--- a/chapters/rum/chapter1/4.mdx
+++ b/chapters/rum/chapter1/4.mdx
@@ -20,7 +20,7 @@ Iată câteva puncte de referință în (scurta) istorie a modelelor Transformer
 
 - **Iunie 2018**: [GPT](https://cdn.openai.com/research-covers/language-unsupervised/language_understanding_paper.pdf), primul model Transformer preinstruit, utilizat pentru fine-tuning a diferitelor sarcini NLP și a obținut rezultate de top
 
-- **Octombrie 2018**: [BERT](https://arxiv.org/abs/1810.04805), un alt model mare preinstruit, conceput pentru a produce rezumate mai bune ale propozițiilor (mai multe despre el în capitolul următor!)
+- **Octombrie 2018**: [BERT](https://arxiv.org/abs/1810.04805), un alt model mare preantrenat, conceput pentru a produce rezumate mai bune ale propozițiilor (mai multe despre el în capitolul următor!)
 
 - **Februarie 2019**: [GPT-2](https://cdn.openai.com/better-language-models/language_models_are_unsupervised_multitask_learners.pdf), o versiune îmbunătățită (și mai mare) a GPT care nu a fost lansată public imediat din motive etice
 

From 8b604d57efd886a765e3b676eff25a2b2c9dd06a Mon Sep 17 00:00:00 2001
From: Stojoc Vladimir <61602995+tokyo-s@users.noreply.github.com>
Date: Fri, 14 Feb 2025 01:05:44 +0200
Subject: [PATCH 048/167] Update chapters/rum/chapter1/4.mdx

Co-authored-by: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
---
 chapters/rum/chapter1/4.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter1/4.mdx b/chapters/rum/chapter1/4.mdx
index 84025f758..62f5de870 100644
--- a/chapters/rum/chapter1/4.mdx
+++ b/chapters/rum/chapter1/4.mdx
@@ -24,7 +24,7 @@ Iată câteva puncte de referință în (scurta) istorie a modelelor Transformer
 
 - **Februarie 2019**: [GPT-2](https://cdn.openai.com/better-language-models/language_models_are_unsupervised_multitask_learners.pdf), o versiune îmbunătățită (și mai mare) a GPT care nu a fost lansată public imediat din motive etice
 
-- **Octombrie 2019**: [DistilBERT](https://arxiv.org/abs/1910.01108), o versiune rafinată a BERT care este cu 60% mai rapidă, cu 40% mai ușoară în memorie și care păstrează încă 97% din performanța BERT
+- **Octombrie 2019**: [DistilBERT](https://arxiv.org/abs/1910.01108), o versiune distilată a BERT care este cu 60% mai rapidă, cu 40% mai ușoară în memorie și care păstrează încă 97% din performanța BERT
 
 - **Octombrie 2019**: [BART](https://arxiv.org/abs/1910.13461) și [T5](https://arxiv.org/abs/1910.10683), două modele mari preinstruite folosind aceeași arhitectură ca modelul original Transformer (primul care face acest lucru)
 

From e59070c7a8f41152ef868d1b8645e67c1f602d7d Mon Sep 17 00:00:00 2001
From: Stojoc Vladimir <61602995+tokyo-s@users.noreply.github.com>
Date: Fri, 14 Feb 2025 01:05:58 +0200
Subject: [PATCH 049/167] Update chapters/rum/chapter1/4.mdx

Co-authored-by: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
---
 chapters/rum/chapter1/4.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter1/4.mdx b/chapters/rum/chapter1/4.mdx
index 62f5de870..9b62b96ef 100644
--- a/chapters/rum/chapter1/4.mdx
+++ b/chapters/rum/chapter1/4.mdx
@@ -26,7 +26,7 @@ Iată câteva puncte de referință în (scurta) istorie a modelelor Transformer
 
 - **Octombrie 2019**: [DistilBERT](https://arxiv.org/abs/1910.01108), o versiune distilată a BERT care este cu 60% mai rapidă, cu 40% mai ușoară în memorie și care păstrează încă 97% din performanța BERT
 
-- **Octombrie 2019**: [BART](https://arxiv.org/abs/1910.13461) și [T5](https://arxiv.org/abs/1910.10683), două modele mari preinstruite folosind aceeași arhitectură ca modelul original Transformer (primul care face acest lucru)
+- **Octombrie 2019**: [BART](https://arxiv.org/abs/1910.13461) și [T5](https://arxiv.org/abs/1910.10683), două modele mari preantrenate folosind aceeași arhitectură ca modelul original Transformer (primul care face acest lucru)
 
 - **Mai 2020**, [GPT-3](https://arxiv.org/abs/2005.14165), o versiune și mai mare a GPT-2, care este capabilă să se descurce bine într-o varietate de sarcini, fără a fi nevoie de o reglare fină (numită _zero-shot learning_)
 

From f3f09ca89765c3b4a219d29a82ab523d4f4d8cc3 Mon Sep 17 00:00:00 2001
From: Stojoc Vladimir <61602995+tokyo-s@users.noreply.github.com>
Date: Fri, 14 Feb 2025 01:06:16 +0200
Subject: [PATCH 050/167] Update chapters/rum/chapter1/4.mdx

Co-authored-by: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
---
 chapters/rum/chapter1/4.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter1/4.mdx b/chapters/rum/chapter1/4.mdx
index 9b62b96ef..6999682a8 100644
--- a/chapters/rum/chapter1/4.mdx
+++ b/chapters/rum/chapter1/4.mdx
@@ -33,7 +33,7 @@ Iată câteva puncte de referință în (scurta) istorie a modelelor Transformer
 Această listă este departe de a fi completă și este menită doar să evidențieze câteva dintre diferitele tipuri de modele Transformer. În linii mari, acestea pot fi grupate în trei categorii:
 
 - Tip GPT (numite și modele de Transformer autoregresive)
-- Tip BERT (numite și modele de Transfomer _auto-encoding_) 
+- Tip BERT (numite și modele de Transformer _auto-encoding_) 
 - Tip BART/T5 (denumite și modele de Transformer _sequence-to-sequence_)
 
 Vom analiza aceste familii în detaliu mai târziu.

From 28015c2ad36933432567e72c4b95a99ea5f9d416 Mon Sep 17 00:00:00 2001
From: Stojoc Vladimir <61602995+tokyo-s@users.noreply.github.com>
Date: Fri, 14 Feb 2025 01:06:31 +0200
Subject: [PATCH 051/167] Update chapters/rum/chapter1/4.mdx

Co-authored-by: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
---
 chapters/rum/chapter1/4.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter1/4.mdx b/chapters/rum/chapter1/4.mdx
index 6999682a8..a0d9a1865 100644
--- a/chapters/rum/chapter1/4.mdx
+++ b/chapters/rum/chapter1/4.mdx
@@ -38,7 +38,7 @@ Această listă este departe de a fi completă și este menită doar să eviden
 
 Vom analiza aceste familii în detaliu mai târziu.
 
-##Transformers sunt modele de limbaj[transformers-sunt-modele-de-limbaj]]
+## Transformers sunt modele de limbaj[transformers-sunt-modele-de-limbaj]]
 
 Toate modelele Transformer menționate mai sus (GPT, BERT, BART, T5 etc.) au fost antrenate ca *modele lingvistice*. Aceasta înseamnă că au fost antrenate pe volume mari de text brut într-un mod autosupravegheat. Învățarea autosupravegheată este un tip de formare în care obiectivul este calculat automat din datele de intrare ale modelului. Aceasta înseamnă că nu este nevoie de oameni pentru a eticheta datele!
 

From 74b43265c3e7acb54884befaf4a069bf99d84ddf Mon Sep 17 00:00:00 2001
From: tokyo-s <vladimir.stojoc@gmail.com>
Date: Sun, 16 Feb 2025 20:52:21 +0200
Subject: [PATCH 052/167] added some fixes

---
 chapters/rum/TRANSLATING.txt | 1 +
 chapters/rum/chapter1/1.mdx  | 9 +++++----
 chapters/rum/chapter1/2.mdx  | 2 +-
 chapters/rum/chapter1/4.mdx  | 6 +++---
 4 files changed, 10 insertions(+), 8 deletions(-)
 create mode 100644 chapters/rum/TRANSLATING.txt

diff --git a/chapters/rum/TRANSLATING.txt b/chapters/rum/TRANSLATING.txt
new file mode 100644
index 000000000..23bcd65f8
--- /dev/null
+++ b/chapters/rum/TRANSLATING.txt
@@ -0,0 +1 @@
+ Named Entity Recognition (NER) - recunoașterea entităților nominale
\ No newline at end of file
diff --git a/chapters/rum/chapter1/1.mdx b/chapters/rum/chapter1/1.mdx
index ca44593f9..a6f280a9b 100644
--- a/chapters/rum/chapter1/1.mdx
+++ b/chapters/rum/chapter1/1.mdx
@@ -8,7 +8,8 @@
 ## Bun venit la 🤗 curs![[bun-venit-la-curs]]
 
 <Youtube id="00GKzGyWFEs" />
-Acest curs vă va învăța despre procesarea limbajelor naturale (NLP) folosind biblioteci din [Hugging Face](https://huggingface.co/) ecosystem — [🤗 Transformers](https://github.com/huggingface/transformers), [🤗 Datasets](https://github.com/huggingface/datasets), [🤗 Tokenizers](https://github.com/huggingface/tokenizers), and [🤗 Accelerate](https://github.com/huggingface/accelerate) — precum și [Hugging Face Hub](https://huggingface.co/models).Este complet gratuit și nu conține reclame.
+
+Acest curs vă va învăța despre procesarea limbajelor naturale (NLP) folosind biblioteci din ecosistemul [Hugging Face](https://huggingface.co/) — [🤗 Transformers](https://github.com/huggingface/transformers), [🤗 Datasets](https://github.com/huggingface/datasets), [🤗 Tokenizers](https://github.com/huggingface/tokenizers), și [🤗 Accelerate](https://github.com/huggingface/accelerate) — precum și [Hugging Face Hub](https://huggingface.co/models). Cursul este complet gratuit și nu conține reclame.
 
 ## La ce să te aștepți?[[la-ce-sa-te-aștepți]]
 
@@ -49,9 +50,9 @@ Despre autori:
 
 [**Lucile Saulnier**](https://huggingface.co/SaulLu) este inginer de Machine Learning la Hugging Face, dezvoltând și susținând utilizarea de instrumente open source. De asemenea, este implicată activ în multe proiecte de cercetare în domeniul procesării limbajului natural, cum ar fi formarea colaborativă și BigScience.
 
-[**Lewis Tunstall**](https://huggingface.co/lewtun) este inginer de Machine Learning la Hugging Face, concentrându-se pe dezvoltarea de instrumente open-source și pe asigurarea accesibilității acestora pentru întreaga comunitate. De asemenea, este coautor al cărții O'Reilly [Natural Language Processing with Transformers] (https://www.oreilly.com/library/view/natural-language-processing/9781098136789/).
+[**Lewis Tunstall**](https://huggingface.co/lewtun) este inginer de Machine Learning la Hugging Face, concentrându-se pe dezvoltarea de instrumente open-source și pe asigurarea accesibilității acestora pentru întreaga comunitate. De asemenea, este coautor al cărții O'Reilly [Natural Language Processing with Transformers](https://www.oreilly.com/library/view/natural-language-processing/9781098136789/).
 
-[**Leandro von Werra**](https://huggingface.co/lvwerra) este inginer de Machine Learning în cadrul echipei open-source de la Hugging Face și, de asemenea, coautor al cărții O'Reilly [Natural Language Processing with Transformers] (https://www.oreilly.com/library/view/natural-language-processing/9781098136789/). El are mai mulți ani de experiență în industrie, aducând proiecte NLP în stadiul de producție, lucrând pe întreaga stivă de învățare automată.
+[**Leandro von Werra**](https://huggingface.co/lvwerra) este inginer de Machine Learning în cadrul echipei open-source de la Hugging Face și, de asemenea, coautor al cărții O'Reilly [Natural Language Processing with Transformers](https://www.oreilly.com/library/view/natural-language-processing/9781098136789/). El are mai mulți ani de experiență în industrie, aducând proiecte NLP în stadiul de producție, lucrând pe întreaga stivă de învățare automată.
 
 ## FAQ[[faq]]
 
@@ -75,7 +76,7 @@ Pentru fiecare secțiune, faceți clic pe bannerul din partea de sus a paginii p
 
 <img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/notebook-buttons.png" alt="Link to the Hugging Face course notebooks" width="75%">
 
-Caietele Jupyter care conțin tot codul din curs sunt găzduite în repo-ul [`huggingface/notebooks`](https://github.com/huggingface/notebooks). Dacă doriți să le generați local, consultați instrucțiunile din repo-ul [`course`](https://github.com/huggingface/course#-jupyter-notebooks) de pe GitHub.
+Notebook-urile Jupyter care conțin tot codul din curs sunt găzduite în repo-ul [`huggingface/notebooks`](https://github.com/huggingface/notebooks). Dacă doriți să le generați local, consultați instrucțiunile din repo-ul [`course`](https://github.com/huggingface/course#-jupyter-notebooks) de pe GitHub.
 
 
 - **Cum pot contribui la curs?**
diff --git a/chapters/rum/chapter1/2.mdx b/chapters/rum/chapter1/2.mdx
index ce45b9035..b5b1c4d9b 100644
--- a/chapters/rum/chapter1/2.mdx
+++ b/chapters/rum/chapter1/2.mdx
@@ -15,7 +15,7 @@ NLP este un domeniu al lingvisticii și al învățării automate axat pe înțe
 
 - **Clasificarea propozițiilor întregi**: Determinarea caracterului unei recenzii, detectarea dacă un e-mail este spam, determinarea dacă o propoziție este corectă gramatical sau dacă două propoziții sunt legate logic sau nu
 - **Clasificarea fiecărui cuvânt dintr-o propoziție**: Identificarea componentelor gramaticale ale unei propoziții (substantiv, verb, adjectiv) sau a entităților nominalizate (persoană, locație, organizație)
-- **Generarea conținutului de text**: Completarea unui text generat automat, completarea spațiilor goale dintr-un text cu cuvinte mascate
+- **Generarea conținutului de text**: Completarea unui prompt cu text generat automat, completarea spațiilor goale dintr-un text cu cuvinte mascate
 - **Extragerea unui răspuns dintr-un text**: Având o întrebare și un context, se extrage răspunsul la întrebare pe baza informațiilor furnizate în context
 - **Generarea unei propoziții noi dintr-un text de intrare**: Traducerea unui text într-o altă limbă, rezumarea textului
 
diff --git a/chapters/rum/chapter1/4.mdx b/chapters/rum/chapter1/4.mdx
index a0d9a1865..3ae506b4e 100644
--- a/chapters/rum/chapter1/4.mdx
+++ b/chapters/rum/chapter1/4.mdx
@@ -40,9 +40,9 @@ Vom analiza aceste familii în detaliu mai târziu.
 
 ## Transformers sunt modele de limbaj[transformers-sunt-modele-de-limbaj]]
 
-Toate modelele Transformer menționate mai sus (GPT, BERT, BART, T5 etc.) au fost antrenate ca *modele lingvistice*. Aceasta înseamnă că au fost antrenate pe volume mari de text brut într-un mod autosupravegheat. Învățarea autosupravegheată este un tip de formare în care obiectivul este calculat automat din datele de intrare ale modelului. Aceasta înseamnă că nu este nevoie de oameni pentru a eticheta datele!
+Toate modelele Transformer menționate mai sus (GPT, BERT, BART, T5 etc.) au fost antrenate ca *modele lingvistice*. Aceasta înseamnă că au fost antrenate pe volume mari de text brut într-un mod autosupravegheat. Învățarea autosupravegheată este un tip de antrenare în care obiectivul este calculat automat din datele de intrare ale modelului. Aceasta înseamnă că nu este nevoie de oameni pentru a eticheta datele!
 
-Acest tip de model dezvoltă o înțelegere statistică a limbii pe care a fost antrenat, dar nu este foarte util pentru sarcini practice specifice. Din acest motiv, modelul general preinstruit trece apoi printr-un proces numit *transfer learning*. În timpul acestui proces, modelul este ajustat într-un mod supravegheat - adică folosind etichete notate de oameni - pentru o anumită sarcină.
+Acest tip de model dezvoltă o înțelegere statistică a limbii pe care a fost antrenat, dar nu este foarte util pentru sarcini practice specifice. Din acest motiv, modelul general preantrenat trece apoi printr-un proces numit *transfer learning*. În timpul acestui proces, modelul este ajustat într-un mod supravegheat - adică folosind etichete notate de oameni - pentru o anumită sarcină.
 
 Un exemplu de sarcină este prezicerea următorului cuvânt dintr-o propoziție după citirea a *n* cuvinte anterioare. Aceasta se numește *modelare cauzală a limbajului* deoarece rezultatul depinde de intrările trecute și prezente, dar nu și de cele viitoare.
 
@@ -60,7 +60,7 @@ Un alt exemplu este *modelarea limbajului mascat*, în care modelul prezice un c
 
 ## Modelele Transformer sunt mari[[modelele-transformer-sunt-mari]]
 
-Cu excepția câtorva cazuri excepționale (cum ar fi DistilBERT), strategia generală pentru a obține performanțe mai bune constă în creșterea dimensiunilor modelelor, precum și a cantității de date pe care acestea sunt preinstruite.
+Cu excepția câtorva cazuri excepționale (cum ar fi DistilBERT), strategia generală pentru a obține performanțe mai bune constă în creșterea dimensiunilor modelelor, precum și a cantității de date pe care acestea sunt preantrenate.
 
 <div class="flex justify-center">
 <img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/model_parameters.png" alt="Number of parameters of recent Transformers models" width="90%">

From 01c7f51e8ccd4a278df44aa6fde4b3f268720ff3 Mon Sep 17 00:00:00 2001
From: Ajey95 <983617reddy@gmail.com>
Date: Sat, 1 Mar 2025 17:43:44 +0530
Subject: [PATCH 053/167] updated telugu chapter0

---
 chapters/te/_toctree.yml   |   5 ++
 chapters/te/chapter0/1.mdx | 115 +++++++++++++++++++++++++++++++++++++
 2 files changed, 120 insertions(+)
 create mode 100644 chapters/te/_toctree.yml
 create mode 100644 chapters/te/chapter0/1.mdx

diff --git a/chapters/te/_toctree.yml b/chapters/te/_toctree.yml
new file mode 100644
index 000000000..4357673bf
--- /dev/null
+++ b/chapters/te/_toctree.yml
@@ -0,0 +1,5 @@
+- title: 0. అమరిక
+  sections:
+  - local: chapter0/1
+    title: పరిచయం
+
diff --git a/chapters/te/chapter0/1.mdx b/chapters/te/chapter0/1.mdx
new file mode 100644
index 000000000..e1c283983
--- /dev/null
+++ b/chapters/te/chapter0/1.mdx
@@ -0,0 +1,115 @@
+
+
+### పరిచయం [[introduction]]  
+
+హగ్గింగ్ ఫేస్  కోర్సుకు స్వాగతం! ఈ అధ్యాయం మీ వర్కింగ్ ఎన్విరాన్‌మెంట్‌ను సెట్ చేయడంలో సహాయపడుతుంది. మీరు కోర్సును ఇప్పుడే ప్రారంభిస్తుంటే, ముందుగా [అధ్యాయం 1](/course/chapter1) చూడాలని సూచిస్తున్నాం, తర్వాత మీ ఎన్విరాన్‌మెంట్‌ను సెట్ చేసుకుని కోడ్‌ను ప్రయత్నించండి.  
+
+ఈ కోర్సులో ఉపయోగించే లైబ్రరీలు Python ప్యాకేజీలుగా అందుబాటులో ఉన్నాయి. అందువల్ల Python ఎన్విరాన్‌మెంట్ సెట్ చేసుకోవడం మరియు అవసరమైన లైబ్రరీలను ఇన్‌స్టాల్ చేసుకోవడం ఎలా అనేది ఇక్కడ చూడబోతున్నాం.  
+
+మీరు **Google Colab నోట్‌బుక్** లేదా **Python వర్చువల్ ఎన్విరాన్‌మెంట్** ద్వారా సెటప్ చేసుకోవచ్చు. కొత్తవారికి Colab నోట్‌బుక్ ఉపయోగించడం సులభం, అందుకే మేము దానిని సిఫార్సు చేస్తున్నాం.  
+
+**Windows వినియోగదారులకు గమనిక:** ఈ కోర్సులో Windows సెటప్‌ను వివరించం. కాబట్టి మీరు Windows ఉపయోగిస్తుంటే, Colab నోట్‌బుక్‌ను ఉపయోగించడం ఉత్తమ ఎంపిక అవుతుంది. **Linux లేదా macOS** వాడుతున్నవారు ఇక్కడ చెప్పిన రెండు పద్ధతులలో ఏదైనా ఎంచుకోవచ్చు.  
+
+ఈ కోర్సును పూర్తిగా అనుభవించాలంటే **Hugging Face అకౌంట్** అవసరం. కాబట్టి ఇప్పుడే ఓ ఖాతా తెరిచేయండి: [అకౌంట్ క్రియేట్ చేయండి](https://huggingface.co/join).  
+
+---
+
+### Google Colab నోట్‌బుక్ ఉపయోగించడం [[using-a-google-colab-notebook]]  
+
+Google Colab నోట్‌బుక్ ఉపయోగించడం చాలా సులభం – వెబ్ బ్రౌజర్‌లో ఓపెన్ చేసి నేరుగా కోడింగ్ ప్రారంభించేయొచ్చు!  
+
+మీరు **Colab గురించి కొత్తగా నేర్చుకుంటున్నట్లయితే**, ఈ [పరిచయం](https://colab.research.google.com/notebooks/intro.ipynb) చదవండి. Colab ద్వారా మీరు **GPU లేదా TPU** వంటి వేగవంతమైన హార్డ్వేర్‌ను ఉపయోగించుకోవచ్చు.  
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter0/new_colab.png" alt="An empty colab notebook" width="80%"/>
+</div>
+కొత్త నోట్‌బుక్ క్రియేట్ చేసి, ఈ క్రింది ఆదేశాలతో లైబ్రరీలను ఇన్‌స్టాల్ చేయండి:  
+
+```
+!pip install transformers
+```
+
+సరైనగా ఇన్‌స్టాల్ అయిందో లేదో పరీక్షించేందుకు:  
+
+```
+import transformers
+```
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter0/install.gif" alt="A gif showing the result of the two commands above: installation and import" width="80%"/>
+</div>
+ఇది ప్రాథమిక వెర్షన్ మాత్రమే. మేము అన్ని ఫీచర్లు ఉపయోగించేందుకు **డెవలప్‌మెంట్ వెర్షన్** ఇన్‌స్టాల్ చేయాలని సూచిస్తున్నాం:  
+
+```
+!pip install transformers[sentencepiece]
+```
+
+ఇప్పుడు మీరు కోర్సును కొనసాగించడానికి సిద్ధంగా ఉన్నారు! 🤗  
+
+---
+
+### Python వర్చువల్ ఎన్విరాన్‌మెంట్ ఉపయోగించడం [[using-a-python-virtual-environment]]  
+
+మీరు Python వర్చువల్ ఎన్విరాన్‌మెంట్ ఉపయోగించాలనుకుంటే, ముందుగా Python మీ సిస్టమ్‌లో ఇన్‌స్టాల్ అయిందా లేదో **python --version** నడిపి పరీక్షించండి.  
+
+
+
+---
+
+టెర్మినల్‌లో `python --version` వంటి పైనథాన్ కమాండ్‌ని అమలు చేస్తున్నప్పుడు, మీ వ్యవస్థలో "ప్రధాన" పైనథాన్‌గా పనిచేస్తున్న ప్రోగ్రామ్‌ని మీరు పరిగణించాలి. ఈ ప్రధాన సంస్థాపనను ఎలాంటి ప్యాకేజీల నుండి ఖాళీగా ఉంచి, ప్రతి అప్లికేషన్‌కు ప్రత్యేకమైన వాతావరణాలను (environments) సృష్టించడం మేము సిఫారసు చేస్తాము. ఇలా చేయడం వల్ల, ప్రతి అప్లికేషన్‌కు అవసరమైన డిపెండెన్సీలు మరియు ప్యాకేజీలు స్వతంత్రంగా ఉంటాయి, మరియు ఇతర అప్లికేషన్లతో సంభవించగల గందరగోళాలను నివారించవచ్చు.
+
+పైనథాన్‌లో దీన్ని **వర్చువల్ ఎన్వైరన్‌మెంట్‌** (*virtual environments*) అనే విధానంతో చేస్తారు. ఇవి ప్రత్యేకమైన డైరెక్టరీలుగా ఉంటాయి, ఇవి ఒక నిర్దిష్ట పైనథాన్ వెర్షన్‌తో పాటు ఆ అప్లికేషన్‌కు అవసరమైన అన్ని ప్యాకేజీలను కలిగి ఉంటాయి. ఇలాంటి వర్చువల్ ఎన్వైరన్‌మెంట్‌ని సృష్టించడానికి అనేక సాధనాలు (tools) అందుబాటులో ఉన్నాయి, కానీ మేము దీనికి అధికారికమైన పైనథాన్ ప్యాకేజీ అయిన [`venv`](https://docs.python.org/3/library/venv.html#module-venv) ను ఉపయోగిస్తాము.
+
+మొదట, మీ అప్లికేషన్ కోసం ఒక కొత్త ఫోల్డర్ సృష్టించాలి. ఉదాహరణకు, మీ హోం డైరెక్టరీలో *transformers-course* అనే ఫోల్డర్‌ను క్రింద చూపిన విధంగా సృష్టించవచ్చు:
+
+```
+mkdir ~/transformers-course
+cd ~/transformers-course
+```
+
+ఈ డైరెక్టరీలో ఉన్నప్పుడు, క్రింది కమాండ్ ఉపయోగించి వర్చువల్ ఎన్వైరన్‌మెంట్‌ను సృష్టించండి:
+
+```
+python -m venv .env
+```
+
+ఇప్పుడు, మీ ఫోల్డర్‌లో `.env` అనే డైరెక్టరీ కనిపించాలి:
+
+```
+ls -a
+```
+
+```out
+.      ..    .env
+```
+
+మీరు వర్చువల్ ఎన్వైరన్‌మెంట్‌లోకి ప్రవేశించడానికి లేదా బయటకు వెళ్లడానికి క్రింది కమాండ్లను ఉపయోగించవచ్చు:
+
+```
+# వర్చువల్ ఎన్వైరన్‌మెంట్‌ను సక్రియం చేయడానికి
+source .env/bin/activate
+
+# వర్చువల్ ఎన్వైరన్‌మెంట్‌ను డిసేబుల్ చేయడానికి
+deactivate
+```
+
+మీరు వర్చువల్ ఎన్వైరన్‌మెంట్ సక్రియం అయినదని నిర్ధారించుకోవడానికి, `which python` అనే కమాండ్‌ని అమలు చేయండి. ఇది మీ వర్చువల్ ఎన్వైరన్‌మెంట్‌లోని పైనథాన్‌కు పాయింట్ చేస్తే, మీరు విజయవంతంగా దానిని సక్రియం చేసినట్టే!
+
+```
+which python
+```
+
+```out
+/home/<user>/transformers-course/.env/bin/python
+```
+
+### డిపెండెన్సీలను ఇన్‌స్టాల్ చేయడం
+
+గూగుల్ కోలాబ్ ఉపయోగించే పాఠంలో చెప్పిన విధంగానే, ఇప్పుడు మీరు అవసరమైన ప్యాకేజీలను ఇన్‌స్టాల్ చేయాలి. `pip` ప్యాకేజ్ మేనేజర్ ఉపయోగించి, 🤗 Transformers యొక్క డెవలప్‌మెంట్ వెర్షన్‌ను ఇన్‌స్టాల్ చేయవచ్చు:
+
+```
+pip install "transformers[sentencepiece]"
+```
+
+---
+
+తెలుగు అభిమానం కలిగిన డేటా సైన్స్ & AI విద్యార్థుల కోసం ఈ కోర్సు మరింత సహాయపడుతుందని మేము ఆశిస్తున్నాం. **మన భాషలో నేర్చుకుని, ప్రపంచ స్థాయిలో వెలుగొందండి!** ✨
\ No newline at end of file

From b9f37930a583ee45a3bbcdeb65f8c6f82d515a20 Mon Sep 17 00:00:00 2001
From: Ajey95 <144113600+Ajey95@users.noreply.github.com>
Date: Mon, 3 Mar 2025 22:36:02 +0530
Subject: [PATCH 054/167] Update chapters/te/chapter0/1.mdx

hi

Co-authored-by: Steven Liu <59462357+stevhliu@users.noreply.github.com>
---
 chapters/te/chapter0/1.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/te/chapter0/1.mdx b/chapters/te/chapter0/1.mdx
index e1c283983..55983cb63 100644
--- a/chapters/te/chapter0/1.mdx
+++ b/chapters/te/chapter0/1.mdx
@@ -14,7 +14,7 @@
 
 ---
 
-### Google Colab నోట్‌బుక్ ఉపయోగించడం [[using-a-google-colab-notebook]]  
+## Google Colab నోట్‌బుక్ ఉపయోగించడం [[using-a-google-colab-notebook]]  
 
 Google Colab నోట్‌బుక్ ఉపయోగించడం చాలా సులభం – వెబ్ బ్రౌజర్‌లో ఓపెన్ చేసి నేరుగా కోడింగ్ ప్రారంభించేయొచ్చు!  
 

From 1c158fb7e6a48e0294cd25f5cd52b96d7150fd62 Mon Sep 17 00:00:00 2001
From: Ajey95 <144113600+Ajey95@users.noreply.github.com>
Date: Mon, 3 Mar 2025 22:51:02 +0530
Subject: [PATCH 055/167] Update 1.mdx

I did all the updates and suggestions told by @stevhliu
---
 chapters/te/chapter0/1.mdx | 19 +++++++++----------
 1 file changed, 9 insertions(+), 10 deletions(-)

diff --git a/chapters/te/chapter0/1.mdx b/chapters/te/chapter0/1.mdx
index 55983cb63..04accec38 100644
--- a/chapters/te/chapter0/1.mdx
+++ b/chapters/te/chapter0/1.mdx
@@ -1,6 +1,6 @@
 
 
-### పరిచయం [[introduction]]  
+# పరిచయం [[introduction]]  
 
 హగ్గింగ్ ఫేస్  కోర్సుకు స్వాగతం! ఈ అధ్యాయం మీ వర్కింగ్ ఎన్విరాన్‌మెంట్‌ను సెట్ చేయడంలో సహాయపడుతుంది. మీరు కోర్సును ఇప్పుడే ప్రారంభిస్తుంటే, ముందుగా [అధ్యాయం 1](/course/chapter1) చూడాలని సూచిస్తున్నాం, తర్వాత మీ ఎన్విరాన్‌మెంట్‌ను సెట్ చేసుకుని కోడ్‌ను ప్రయత్నించండి.  
 
@@ -12,7 +12,6 @@
 
 ఈ కోర్సును పూర్తిగా అనుభవించాలంటే **Hugging Face అకౌంట్** అవసరం. కాబట్టి ఇప్పుడే ఓ ఖాతా తెరిచేయండి: [అకౌంట్ క్రియేట్ చేయండి](https://huggingface.co/join).  
 
----
 
 ## Google Colab నోట్‌బుక్ ఉపయోగించడం [[using-a-google-colab-notebook]]  
 
@@ -37,7 +36,7 @@ import transformers
 <div class="flex justify-center">
 <img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter0/install.gif" alt="A gif showing the result of the two commands above: installation and import" width="80%"/>
 </div>
-ఇది ప్రాథమిక వెర్షన్ మాత్రమే. మేము అన్ని ఫీచర్లు ఉపయోగించేందుకు **డెవలప్‌మెంట్ వెర్షన్** ఇన్‌స్టాల్ చేయాలని సూచిస్తున్నాం:  
+ఇది ప్రాథమిక వెర్షన్ మాత్రమే. మేము అన్ని ఫీచర్లు ఉపయోగించేందుకు డెవలప్‌మెంట్ వెర్షన్ ఇన్‌స్టాల్ చేయాలని సూచిస్తున్నాం:  
 
 ```
 !pip install transformers[sentencepiece]
@@ -45,19 +44,19 @@ import transformers
 
 ఇప్పుడు మీరు కోర్సును కొనసాగించడానికి సిద్ధంగా ఉన్నారు! 🤗  
 
----
+ 
 
-### Python వర్చువల్ ఎన్విరాన్‌మెంట్ ఉపయోగించడం [[using-a-python-virtual-environment]]  
+## Python వర్చువల్ ఎన్విరాన్‌మెంట్ ఉపయోగించడం [[using-a-python-virtual-environment]]  
 
-మీరు Python వర్చువల్ ఎన్విరాన్‌మెంట్ ఉపయోగించాలనుకుంటే, ముందుగా Python మీ సిస్టమ్‌లో ఇన్‌స్టాల్ అయిందా లేదో **python --version** నడిపి పరీక్షించండి.  
+మీరు Python వర్చువల్ ఎన్విరాన్‌మెంట్ ఉపయోగించాలనుకుంటే, ముందుగా Python మీ సిస్టమ్‌లో ఇన్‌స్టాల్ అయిందా లేదో `python --version` నడిపి పరీక్షించండి.  
 
 
 
----
+ 
 
 టెర్మినల్‌లో `python --version` వంటి పైనథాన్ కమాండ్‌ని అమలు చేస్తున్నప్పుడు, మీ వ్యవస్థలో "ప్రధాన" పైనథాన్‌గా పనిచేస్తున్న ప్రోగ్రామ్‌ని మీరు పరిగణించాలి. ఈ ప్రధాన సంస్థాపనను ఎలాంటి ప్యాకేజీల నుండి ఖాళీగా ఉంచి, ప్రతి అప్లికేషన్‌కు ప్రత్యేకమైన వాతావరణాలను (environments) సృష్టించడం మేము సిఫారసు చేస్తాము. ఇలా చేయడం వల్ల, ప్రతి అప్లికేషన్‌కు అవసరమైన డిపెండెన్సీలు మరియు ప్యాకేజీలు స్వతంత్రంగా ఉంటాయి, మరియు ఇతర అప్లికేషన్లతో సంభవించగల గందరగోళాలను నివారించవచ్చు.
 
-పైనథాన్‌లో దీన్ని **వర్చువల్ ఎన్వైరన్‌మెంట్‌** (*virtual environments*) అనే విధానంతో చేస్తారు. ఇవి ప్రత్యేకమైన డైరెక్టరీలుగా ఉంటాయి, ఇవి ఒక నిర్దిష్ట పైనథాన్ వెర్షన్‌తో పాటు ఆ అప్లికేషన్‌కు అవసరమైన అన్ని ప్యాకేజీలను కలిగి ఉంటాయి. ఇలాంటి వర్చువల్ ఎన్వైరన్‌మెంట్‌ని సృష్టించడానికి అనేక సాధనాలు (tools) అందుబాటులో ఉన్నాయి, కానీ మేము దీనికి అధికారికమైన పైనథాన్ ప్యాకేజీ అయిన [`venv`](https://docs.python.org/3/library/venv.html#module-venv) ను ఉపయోగిస్తాము.
+పైనథాన్‌లో దీన్ని **వర్చువల్ ఎన్వైరన్‌మెంట్‌** [*virtual environments*](https://docs.python.org/3/tutorial/venv.html) అనే విధానంతో చేస్తారు. ఇవి ప్రత్యేకమైన డైరెక్టరీలుగా ఉంటాయి, ఇవి ఒక నిర్దిష్ట పైనథాన్ వెర్షన్‌తో పాటు ఆ అప్లికేషన్‌కు అవసరమైన అన్ని ప్యాకేజీలను కలిగి ఉంటాయి. ఇలాంటి వర్చువల్ ఎన్వైరన్‌మెంట్‌ని సృష్టించడానికి అనేక సాధనాలు (tools) అందుబాటులో ఉన్నాయి, కానీ మేము దీనికి అధికారికమైన పైనథాన్ ప్యాకేజీ అయిన [`venv`](https://docs.python.org/3/library/venv.html#module-venv) ను ఉపయోగిస్తాము.
 
 మొదట, మీ అప్లికేషన్ కోసం ఒక కొత్త ఫోల్డర్ సృష్టించాలి. ఉదాహరణకు, మీ హోం డైరెక్టరీలో *transformers-course* అనే ఫోల్డర్‌ను క్రింద చూపిన విధంగా సృష్టించవచ్చు:
 
@@ -110,6 +109,6 @@ which python
 pip install "transformers[sentencepiece]"
 ```
 
----
+ 
 
-తెలుగు అభిమానం కలిగిన డేటా సైన్స్ & AI విద్యార్థుల కోసం ఈ కోర్సు మరింత సహాయపడుతుందని మేము ఆశిస్తున్నాం. **మన భాషలో నేర్చుకుని, ప్రపంచ స్థాయిలో వెలుగొందండి!** ✨
\ No newline at end of file
+తెలుగు అభిమానం కలిగిన డేటా సైన్స్ & AI విద్యార్థుల కోసం ఈ కోర్సు మరింత సహాయపడుతుందని మేము ఆశిస్తున్నాం. **మన భాషలో నేర్చుకుని, ప్రపంచ స్థాయిలో వెలుగొందండి!** ✨

From 6c6653cfdce29a97fabf3537f09551a25034cc3e Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Wed, 2 Apr 2025 21:44:36 +0300
Subject: [PATCH 056/167] update requested changes in the review

---
 chapters/rum/chapter2/1.mdx |  4 ++--
 chapters/rum/chapter2/2.mdx |  6 +++---
 chapters/rum/chapter2/3.mdx | 12 ++++++------
 chapters/rum/chapter2/4.mdx |  6 +++---
 chapters/rum/chapter2/6.mdx |  2 +-
 5 files changed, 15 insertions(+), 15 deletions(-)

diff --git a/chapters/rum/chapter2/1.mdx b/chapters/rum/chapter2/1.mdx
index 86957e266..6210f6d12 100644
--- a/chapters/rum/chapter2/1.mdx
+++ b/chapters/rum/chapter2/1.mdx
@@ -7,11 +7,11 @@
 
 După cum ați văzut în [Capitolul 1](/course/chapter1), modelele Transformer sunt de obicei foarte voluminoase. Fiind alcătuite din milioane până la zeci de *miliarde* de parametri, instruirea și implementarea acestor modele este o sarcină complicată. În plus, cu noi modele lansate aproape zilnic și fiecare având propria sa implementare, testarea tuturor acestora nu este o sarcină ușoară.
 
-Biblioteca 🤗 Transformers a fost creată pentru a rezolva această problemă. Scopul său este de a oferi un singur API prin care orice model Transformer poate fi încărcat, instruit și salvat. Principalele caracteristici ale bibliotecii sunt:
+Biblioteca 🤗 Transformers a fost creată pentru a rezolva această problemă. Scopul său este de a oferi un singur API prin care orice model Transformer poate fi încărcat, antrenat și salvat. Principalele caracteristici ale bibliotecii sunt:
 
 - **Simplitate în utilizare**: Descărcarea, încărcarea și utilizarea unui model NLP de ultimă generație pentru inferență pot fi realizate în doar două linii de cod.
 - **Flexibilitate**: În esența lor, toate modelele sunt simple clase PyTorch `nn.Module` sau TensorFlow `tf.keras.Model` și pot fi manipulate ca orice alte modele în framework-urile lor respective de învățare automată (ML).
-- **Simplitate**: Aproape că nu se fac abstractizări în întreaga bibliotecă. „All in one file” este un concept de bază: trecerea înainte a unui model este definită în întregime într-un singur fișier, astfel încât codul în sine să fie ușor de înțeles și de modificat.
+- **Simplitate**: Aproape că nu se fac abstractizări în întreaga bibliotecă. "All in one file" este un concept de bază: trecerea înainte a unui model este definită în întregime într-un singur fișier, astfel încât codul în sine să fie ușor de înțeles și de modificat.
 
 Această ultimă caracteristică face 🤗 Transformers destul de diferită de alte biblioteci ML. Modelele nu sunt construite pe module 
 care sunt partajate între fișiere; în schimb, fiecare model are propriile sale straturi. În plus, pe lângă faptul că modelele sunt mai ușor de abordat și de înțeles, acest lucru vă permite să experimentați cu ușurință pe un model fără a le afecta pe celelalte.
diff --git a/chapters/rum/chapter2/2.mdx b/chapters/rum/chapter2/2.mdx
index 9dc0501bc..b8556c3cd 100644
--- a/chapters/rum/chapter2/2.mdx
+++ b/chapters/rum/chapter2/2.mdx
@@ -72,7 +72,7 @@ La fel ca alte rețele neuronale, modelele Transformer nu pot procesa direct tex
 - Maparea fiecărui token într-un număr întreg
 - Adăugarea de intrări suplimentare care pot fi utile pentru model
 
-Toată această preprocesare trebuie efectuată exact în același mod ca atunci când modelul a fost preinstruit, așa că mai întâi trebuie să descărcăm aceste informații din [Model Hub] (https://huggingface.co/models). Pentru a face acest lucru, folosim clasa `AutoTokenizer` și metoda sa `from_pretrained()`. Folosind numele checkpoint-ului modelului nostru, aceasta va prelua automat datele asociate cu tokenizer-ul modelului și le va stoca în cache (astfel încât acestea să fie descărcate doar prima dată când executați codul de mai jos).
+Toată această preprocesare trebuie efectuată exact în același mod ca atunci când modelul a fost preantrenat, așa că mai întâi trebuie să descărcăm aceste informații din [Model Hub] (https://huggingface.co/models). Pentru a face acest lucru, folosim clasa `AutoTokenizer` și metoda sa `from_pretrained()`. Folosind numele checkpoint-ului modelului nostru, aceasta va prelua automat datele asociate cu tokenizer-ul modelului și le va stoca în cache (astfel încât acestea să fie descărcate doar prima dată când executați codul de mai jos).
 
 Deoarece punctul de control implicit al pipeline-ului `sentiment-analysis` este `distilbert-base-uncased-finetuned-sst-2-english` (puteți vedea fișa modelului [aici](https://huggingface.co/distilbert-base-uncased-finetuned-sst-2-english)), executăm următoarele:
 
@@ -154,7 +154,7 @@ Rezultatul în sine este un dicționar care conține două chei, `input_ids` și
 ## Parcurgerea modelului[[parcurgerea-modelului]]
 
 {#if fw === 'pt'}
-Putem descărca modelul nostru preinstruit în același mod în care am făcut-o cu tokenizatorul nostru. 🤗 Transformers oferă o clasă `AutoModel` care are și o metodă `from_pretrained()`:
+Putem descărca modelul nostru preantrenat în același mod în care am făcut-o cu tokenizatorul nostru. 🤗 Transformers oferă o clasă `AutoModel` care are și o metodă `from_pretrained()`:
 
 ```python
 from transformers import AutoModel
@@ -164,7 +164,7 @@ model = AutoModel.from_pretrained(checkpoint)
 ```
 {:else}
  
-Putem descărca modelul nostru preinstruit în același mod în care am făcut-o cu tokenizatorul nostru. 🤗 Transformers oferă o clasă `TFAutoModel` care are și o metodă `from_pretrained`:
+Putem descărca modelul nostru preantrenat în același mod în care am făcut-o cu tokenizatorul nostru. 🤗 Transformers oferă o clasă `TFAutoModel` care are și o metodă `from_pretrained`:
 
 ```python
 from transformers import TFAutoModel
diff --git a/chapters/rum/chapter2/3.mdx b/chapters/rum/chapter2/3.mdx
index e0f0758df..62656cea8 100644
--- a/chapters/rum/chapter2/3.mdx
+++ b/chapters/rum/chapter2/3.mdx
@@ -117,7 +117,7 @@ model = TFBertModel(config)
 
 Modelul poate fi utilizat în această stare, dar va produce rezultate neclare; mai întâi trebuie să fie antrenat. Am putea antrena modelul de la zero pentru sarcina în cauză, dar, după cum ați văzut în [Capitolul 1](/course/chapter1), acest lucru ar necesita mult timp și o mulțime de date și ar avea un impact semnificativ asupra mediului. Pentru a evita efortul inutil, este esențial să puteți partaja și reutiliza modelele care au fost deja formate.
 
-Încărcarea unui model Transformer care este deja instruit este simplă - putem face acest lucru utilizând metoda `from_pr
+Încărcarea unui model Transformer care este deja instruit este simplă - putem face acest lucru utilizând metoda `from_pretrained()`, care este analogă metodei `from_pretrained()` în PyTorch:
 
 {#if fw === 'pt'}
 ```py
@@ -126,7 +126,7 @@ from transformers import BertModel
 model = BertModel.from_pretrained("bert-base-cased")
 ```
 
-După cum ați văzut mai devreme, am putea înlocui `BertModel` cu clasa `AutoModel` echivalentă. Vom face acest lucru în continuare, deoarece acest lucru produce un cod compatibil cu checkpoint-urile; dacă codul dumneavoastră funcționează pentru un checkpoint, ar trebui să funcționeze fără probleme pentru altul. Acest lucru este valabil chiar dacă arhitectura este diferită, atât timp cât checkpoint-ul a fost instruit pentru o sarcină similară (de exemplu, o sarcină de analiză a sentimentelor).
+După cum ați văzut mai devreme, am putea înlocui `BertModel` cu clasa `AutoModel` echivalentă. Vom face acest lucru în continuare, deoarece acest lucru produce un cod independent de checkpoint-uri; dacă codul dumneavoastră funcționează pentru un checkpoint, ar trebui să funcționeze fără probleme pentru altul. Acest lucru este valabil chiar dacă arhitectura este diferită, atât timp cât checkpoint-ul a fost instruit pentru o sarcină similară (de exemplu, o sarcină de analiză a sentimentelor).
 
 {:else}
 ```py
@@ -135,17 +135,17 @@ from transformers import TFBertModel
 model = TFBertModel.from_pretrained("bert-base-cased")
 ```
 
-După cum ați văzut mai devreme, am putea înlocui `BertModel` cu clasa `AutoModel` echivalentă. Vom face acest lucru în continuare, deoarece acest lucru produce un cod compatibil cu checkpoint-urile; dacă codul dumneavoastră funcționează pentru un checkpoint, ar trebui să funcționeze fără probleme pentru altul. Acest lucru este valabil chiar dacă arhitectura este diferită, atât timp cât checkpoint-ul a fost instruit pentru o sarcină similară (de exemplu, o sarcină de analiză a sentimentelor).
+După cum ați văzut mai devreme, am putea înlocui `BertModel` cu clasa `AutoModel` echivalentă. Vom face acest lucru în continuare, deoarece acest lucru produce un cod independent de checkpoint-uri; dacă codul dumneavoastră funcționează pentru un checkpoint, ar trebui să funcționeze fără probleme pentru altul. Acest lucru este valabil chiar dacă arhitectura este diferită, atât timp cât checkpoint-ul a fost instruit pentru o sarcină similară (de exemplu, o sarcină de analiză a sentimentelor).
 
 {/if}
 
-În exemplul de cod de mai sus nu am utilizat `BertConfig` și, în loc de acesta, am încărcat un model preinstruit prin intermediul identificatorului `bert-base-cased`. Acesta este un checkpoint al modelului care a fost antrenat chiar de autorii BERT; puteți găsi mai multe detalii despre acesta în [model card](https://huggingface.co/bert-base-cased).
+În exemplul de cod de mai sus nu am utilizat `BertConfig` și, în loc de acesta, am încărcat un model preantrenat prin intermediul identificatorului `bert-base-cased`. Acesta este un checkpoint al modelului care a fost antrenat chiar de autorii BERT; puteți găsi mai multe detalii despre acesta în [model card](https://huggingface.co/bert-base-cased).
 
-Acest model este acum inițializat cu toate weight-urile din checkpoint. Acesta poate fi utilizat direct pentru inferență pe sarcinile pe care a fost antrenat și poate fi, de asemenea, ajustat pe o sarcină nouă. Prin antrenarea cu weight-uri instruite în prealabil, putem obține rapid rezultate bune.
+Acest model este acum inițializat cu toate weight-urile din checkpoint. Acesta poate fi utilizat direct pentru inferență pe sarcinile pe care a fost antrenat și poate fi, de asemenea, ajustat pe o sarcină nouă. Prin antrenarea cu weight-uri preantrenate în prealabil, putem obține rapid rezultate bune.
 
 Greutățile au fost descărcate și stocate în cache (astfel încât apelurile viitoare la metoda `from_pretrained()` nu le vor descărca din nou) în folderul cache, care are ca valoare implicită *~/.cache/huggingface/transformers*. Puteți personaliza folderul cache prin setarea variabilei de mediu `HF_HOME`.
 
-Identificatorul utilizat pentru încărcarea modelului poate fi identificatorul oricărui model de pe Model Hub, atâta timp cât acesta este compatibil cu arhitectura OARET. Lista completă a  checkpoint-urilor OARET disponibile poate fi găsită [aici](https://huggingface.co/models?filter=bert).
+Identificatorul utilizat pentru încărcarea modelului poate fi identificatorul oricărui model de pe Model Hub, atâta timp cât acesta este compatibil cu arhitectura BERT. Lista completă a checkpoint-urilor BERT disponibile poate fi găsită [aici](https://huggingface.co/models?filter=bert).
 
 
 ### Metode de păstrare[[metode-de-păstrare]]
diff --git a/chapters/rum/chapter2/4.mdx b/chapters/rum/chapter2/4.mdx
index c38234e14..6f3ecfb0e 100644
--- a/chapters/rum/chapter2/4.mdx
+++ b/chapters/rum/chapter2/4.mdx
@@ -65,11 +65,11 @@ print(tokenized_text)
 ['Jim', 'Henson', 'was', 'a', 'puppeteer']
 ```
 
-Există, de asemenea, variații ale tokenizerelor de cuvinte care au reguli suplimentare pentru punctuație. Cu acest tip de tokenizator, putem ajunge la „vocabulare” destul de mari, unde un vocabular este definit de numărul total de token-uri independente pe care le avem în corpus.
+Există, de asemenea, variații ale tokenizerelor de cuvinte care au reguli suplimentare pentru punctuație. Cu acest tip de tokenizator, putem ajunge la "vocabulare" destul de mari, unde un vocabular este definit de numărul total de token-uri independente pe care le avem în corpus.
 
 Fiecărui cuvânt i se atribuie un ID, începând de la 0 și mergând până la dimensiunea vocabularului. Modelul utilizează aceste ID-uri pentru a identifica fiecare cuvânt.
 
-Dacă dorim să acoperim complet o limbă cu un tokenizer bazat pe cuvinte, va trebui să avem un identificator pentru fiecare cuvânt din limbă, ceea ce va genera o cantitate uriașă de token-uri. De exemplu, există peste 500 000 de cuvinte în limba engleză, astfel încât, pentru a construi o hartă de la fiecare cuvânt la un ID de intrare, ar trebui să ținem evidența unui număr atât de mare de ID-uri. În plus, cuvinte precum „dog” sunt reprezentate diferit de cuvinte precum „dogs”, iar modelul nu va avea inițial nicio modalitate de a ști că „dog” și „dogs” sunt similare: va identifica cele două cuvinte ca neavând legătură. Același lucru este valabil și pentru alte cuvinte similare, precum „run” și „running”, pe care modelul nu le va vedea inițial ca fiind similare.
+Dacă dorim să acoperim complet o limbă cu un tokenizer bazat pe cuvinte, va trebui să avem un identificator pentru fiecare cuvânt din limbă, ceea ce va genera o cantitate uriașă de token-uri. De exemplu, există peste 500 000 de cuvinte în limba engleză, astfel încât, pentru a construi o hartă de la fiecare cuvânt la un ID de intrare, ar trebui să ținem evidența unui număr atât de mare de ID-uri. În plus, cuvinte precum "dog" sunt reprezentate diferit de cuvinte precum "dogs", iar modelul nu va avea inițial nicio modalitate de a ști că "dog" și "dogs" sunt similare: va identifica cele două cuvinte ca neavând legătură. Același lucru este valabil și pentru alte cuvinte similare, precum "run" și "running", pe care modelul nu le va vedea inițial ca fiind similare.
 
 În cele din urmă, avem nevoie de un token personalizat pentru a reprezenta cuvintele care nu se află în vocabularul nostru. Acesta este cunoscut sub numele de token "necunoscut", adesea reprezentat ca "[UNK]" sau "&lt;unk&gt;". În general, este un indiciu rău dacă vedeți că tokenizatorul produce o mulțime de astfel de token-uri, deoarece nu a fost capabil să recupereze reprezentarea sensibilă a unui cuvânt și veți pierde informații pe parcurs. Scopul elaborării vocabularului este de a face în așa fel încât tokenizatorul să tokenizeze cât mai puține cuvinte posibil în tokenul necunoscut.
 
@@ -179,7 +179,7 @@ Vom vorbi mai mult despre `token_type_ids` în [Capitolul 3](/course/chapter3) 
 
 <Youtube id="Yffk5aydLzg"/>
 
-Al doilea pas este să convertim aceste token-uri în numere, astfel încât să putem construi un tensor din ele și să le introducem în model. Pentru a face acest lucru, tokenizatorul are un *vocabular*, care este partea pe care o descărcăm atunci când îl instanțiem cu metoda `from_pretrained()`. Din nou, trebuie să folosim același vocabular utilizat atunci când modelul a fost preinstruit.
+Al doilea pas este să convertim aceste token-uri în numere, astfel încât să putem construi un tensor din ele și să le introducem în model. Pentru a face acest lucru, tokenizatorul are un *vocabular*, care este partea pe care o descărcăm atunci când îl instanțiem cu metoda `from_pretrained()`. Din nou, trebuie să folosim același vocabular utilizat atunci când modelul a fost preantrenat.
 
 Pentru a înțelege mai bine cele două etape, le vom explora separat. Rețineți că vom utiliza unele metode care efectuează părți ale pipeline-ului de tokenizare separat pentru a vă arăta rezultatele intermediare ale acestor etape, dar, în practică, ar trebui să apelați tokenizatorul direct pe intrările dvs. (așa cum se arată în secțiunea 2).
 
diff --git a/chapters/rum/chapter2/6.mdx b/chapters/rum/chapter2/6.mdx
index 5cff921c5..c26d40929 100644
--- a/chapters/rum/chapter2/6.mdx
+++ b/chapters/rum/chapter2/6.mdx
@@ -129,7 +129,7 @@ print(tokenizer.decode(ids))
 "i've been waiting for a huggingface course my whole life."
 ```
 
-Tokenizatorul a adăugat cuvântul special `[CLS]` la început și cuvântul special `[SEP]` la sfârșit. Acest lucru se datorează faptului că modelul a fost preinstruit cu aceste cuvinte, deci pentru a obține aceleași rezultate pentru inferență trebuie să le adăugăm și pe acestea. Rețineți că unele modele nu adaugă cuvinte speciale sau adaugă cuvinte diferite; de asemenea, modelele pot adăuga aceste cuvinte speciale doar la început sau doar la sfârșit. În orice caz, tokenizatorul știe care sunt cele așteptate și se va ocupa de acest lucru pentru dumneavoastră.
+Tokenizatorul a adăugat cuvântul special `[CLS]` la început și cuvântul special `[SEP]` la sfârșit. Acest lucru se datorează faptului că modelul a fost preantrenat cu aceste cuvinte, deci pentru a obține aceleași rezultate pentru inferență trebuie să le adăugăm și pe acestea. Rețineți că unele modele nu adaugă cuvinte speciale sau adaugă cuvinte diferite; de asemenea, modelele pot adăuga aceste cuvinte speciale doar la început sau doar la sfârșit. În orice caz, tokenizatorul știe care sunt cele așteptate și se va ocupa de acest lucru pentru dumneavoastră.
 
 ## Încheiere: De la tokenizer la model[[încheiere-de-la-tokenizator-la-model]]
 

From 7c939b729df0f58231a835e202ba9736de1a3632 Mon Sep 17 00:00:00 2001
From: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
Date: Wed, 2 Apr 2025 21:49:19 +0300
Subject: [PATCH 057/167] Update chapters/rum/chapter2/4.mdx

---
 chapters/rum/chapter2/4.mdx | 2 ++
 1 file changed, 2 insertions(+)

diff --git a/chapters/rum/chapter2/4.mdx b/chapters/rum/chapter2/4.mdx
index 6f3ecfb0e..4dd931482 100644
--- a/chapters/rum/chapter2/4.mdx
+++ b/chapters/rum/chapter2/4.mdx
@@ -179,6 +179,8 @@ Vom vorbi mai mult despre `token_type_ids` în [Capitolul 3](/course/chapter3) 
 
 <Youtube id="Yffk5aydLzg"/>
 
+Traducerea textului în numere este cunoscută sub numele de codificare. Codificarea se face într-un proces în două etape: tokenizarea, urmată de conversia în ID-uri de intrare.
+
 Al doilea pas este să convertim aceste token-uri în numere, astfel încât să putem construi un tensor din ele și să le introducem în model. Pentru a face acest lucru, tokenizatorul are un *vocabular*, care este partea pe care o descărcăm atunci când îl instanțiem cu metoda `from_pretrained()`. Din nou, trebuie să folosim același vocabular utilizat atunci când modelul a fost preantrenat.
 
 Pentru a înțelege mai bine cele două etape, le vom explora separat. Rețineți că vom utiliza unele metode care efectuează părți ale pipeline-ului de tokenizare separat pentru a vă arăta rezultatele intermediare ale acestor etape, dar, în practică, ar trebui să apelați tokenizatorul direct pe intrările dvs. (așa cum se arată în secțiunea 2).

From 8d59e9edd06f78e39d2224230b2c6bb6acb716e6 Mon Sep 17 00:00:00 2001
From: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
Date: Wed, 2 Apr 2025 21:58:02 +0300
Subject: [PATCH 058/167] Update chapters/rum/chapter2/1.mdx

---
 chapters/rum/chapter2/1.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter2/1.mdx b/chapters/rum/chapter2/1.mdx
index 6210f6d12..86e4cdc6a 100644
--- a/chapters/rum/chapter2/1.mdx
+++ b/chapters/rum/chapter2/1.mdx
@@ -18,7 +18,7 @@ care sunt partajate între fișiere; în schimb, fiecare model are propriile sal
 
 Acest capitol va începe cu un exemplu end-to-end în care folosim împreună un model și un tokenizer pentru a replica funcția `pipeline()` introdusă în [Capitolul 1](/course/chapter1). În continuare, vom discuta despre API-ul modelului: vom analiza clasele de model și de configurare și vă vom arăta cum să încărcați un model și cum acesta procesează intrările numerice pentru a genera predicții. 
 
-Apoi vom analiza API-ul tokenizer, care este cealaltă componentă principală a funcției `pipeline()`. Tokenizerii se ocupă de prima și ultima etapă de procesare, gestionând conversia de la text la intrări numerice pentru rețeaua neuronală și conversia înapoi la text atunci când este necesar. În cele din urmă, vă vom arăta cum să vă ocupați de trimiterea mai multor propoziții printr-un model în cadrul unui lot pregătit, apoi vom încheia totul cu o examinare mai atentă a funcției  `tokenizer()`.
+Apoi vom analiza API-ul tokenizer, care este cealaltă componentă principală a funcției `pipeline()`. Tokenizerii se ocupă de prima și ultima etapă de procesare, gestionând conversia de la text la intrări numerice pentru rețeaua neuronală și conversia înapoi la text atunci când este necesar. În cele din urmă, vă vom arăta cum să vă ocupați de trimiterea mai multor propoziții printr-un model în cadrul unui batch pregătit, apoi vom încheia totul cu o examinare mai atentă a funcției  `tokenizer()`.
 
 
 <Tip>

From 1f79aa6b68c7cf5af5fcc506fa18a2fb89625dfe Mon Sep 17 00:00:00 2001
From: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
Date: Wed, 2 Apr 2025 21:59:24 +0300
Subject: [PATCH 059/167] Update chapters/rum/chapter2/3.mdx

---
 chapters/rum/chapter2/3.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter2/3.mdx b/chapters/rum/chapter2/3.mdx
index 62656cea8..58244a3b1 100644
--- a/chapters/rum/chapter2/3.mdx
+++ b/chapters/rum/chapter2/3.mdx
@@ -115,7 +115,7 @@ model = TFBertModel(config)
 ```
 {/if}
 
-Modelul poate fi utilizat în această stare, dar va produce rezultate neclare; mai întâi trebuie să fie antrenat. Am putea antrena modelul de la zero pentru sarcina în cauză, dar, după cum ați văzut în [Capitolul 1](/course/chapter1), acest lucru ar necesita mult timp și o mulțime de date și ar avea un impact semnificativ asupra mediului. Pentru a evita efortul inutil, este esențial să puteți partaja și reutiliza modelele care au fost deja formate.
+Modelul poate fi utilizat în această stare, dar va produce rezultate neclare; mai întâi trebuie să fie antrenat. Am putea antrena modelul de la zero pentru sarcina în cauză, dar, după cum ați văzut în [Capitolul 1](/course/chapter1), acest lucru ar necesita mult timp și o mulțime de date și ar avea un impact semnificativ asupra mediului. Pentru a evita efortul inutil, este esențial să puteți partaja și reutiliza modelele care au fost deja antrenate.
 
 Încărcarea unui model Transformer care este deja instruit este simplă - putem face acest lucru utilizând metoda `from_pretrained()`, care este analogă metodei `from_pretrained()` în PyTorch:
 

From d449502df199542612b9db88e66ee7d2990631ba Mon Sep 17 00:00:00 2001
From: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
Date: Wed, 2 Apr 2025 22:00:11 +0300
Subject: [PATCH 060/167] Apply suggestions from code review

---
 chapters/rum/chapter2/2.mdx | 16 ++++++++--------
 1 file changed, 8 insertions(+), 8 deletions(-)

diff --git a/chapters/rum/chapter2/2.mdx b/chapters/rum/chapter2/2.mdx
index b8556c3cd..3589c8a58 100644
--- a/chapters/rum/chapter2/2.mdx
+++ b/chapters/rum/chapter2/2.mdx
@@ -64,11 +64,11 @@ După cum am văzut în [Capitolul 1](/course/chapter1), acest pipeline grupeaz
 
 Să trecem rapid prin fiecare dintre acestea.
 
-## Preprocesarea cu un tokenizator[[preprocesarea-cu-un-tokenizerator]]
+## Preprocesarea cu un tokenizator[[preprocesarea-cu-un-tokenizator]]
 
 La fel ca alte rețele neuronale, modelele Transformer nu pot procesa direct text brut, astfel încât primul pas al pipeline-ului nostru este de a converti intrările de text în numere pe care modelul le poate înțelege. Pentru a face acest lucru, folosim un *tokenizer*, care va fi responsabil pentru:
 
-- Împărțirea datelor de intrare în cuvinte, părți de cuvinte sau simboluri (cum ar fi punctuația) care se numesc *tokens*
+- Împărțirea datelor de intrare în cuvinte, subcuvinte sau simboluri (cum ar fi punctuația) care se numesc *tokens*
 - Maparea fiecărui token într-un număr întreg
 - Adăugarea de intrări suplimentare care pot fi utile pentru model
 
@@ -85,7 +85,7 @@ tokenizer = AutoTokenizer.from_pretrained(checkpoint)
 
 Odată ce avem tokenizatorul, putem să îi transmitem direct propozițiile noastre și vom primi înapoi un dicționar care este gata să fie introdus în modelul nostru! Singurul lucru rămas de făcut este să convertim lista de ID-uri de intrare în tensori.
 
-Puteți utiliza 🤗 Transformers fără a trebui să vă faceți griji cu privire la cadrul ML utilizat ca backend; ar putea fi PyTorch sau TensorFlow, sau Flax pentru unele modele. Cu toate acestea, modelele Transformer acceptă numai *tensori * ca intrare. Dacă este prima dată când auziți despre tensori, vă puteți gândi la ei ca la matrici NumPy. Un array NumPy poate fi un scalar (0D), un vector (1D), o matrice (2D) sau poate avea mai multe dimensiuni. Este de fapt un tensor; tensorii altor cadre ML se comportă similar și sunt de obicei la fel de simplu de instanțiat ca și array-urile NumPy.
+Puteți utiliza 🤗 Transformers fără a trebui să vă faceți griji cu privire la cadrul ML utilizat ca backend; ar putea fi PyTorch sau TensorFlow, sau Flax pentru unele modele. Cu toate acestea, modelele Transformer acceptă numai *tensori * ca intrare. Dacă este prima dată când auziți despre tensori, vă puteți gândi la ei ca la array-uri NumPy. Un array NumPy poate fi un scalar (0D), un vector (1D), o matrice (2D) sau poate avea mai multe dimensiuni. Este de fapt un tensor; tensorii altor cadre ML se comportă similar și sunt de obicei la fel de simplu de instanțiat ca și array-urile NumPy.
 
 Pentru a specifica tipul de tensori pe care dorim să îi primim înapoi (PyTorch, TensorFlow sau NumPy simplu), folosim argumentul `return_tensors`:
 
@@ -111,7 +111,7 @@ print(inputs)
 {/if}
 
  
-Nu vă faceți încă griji cu privire la padding și trunchiere; le vom explica mai târziu. Principalele lucruri de reținut aici sunt că puteți trece o propoziție sau o listă de propoziții, precum și specificarea tipului de tensori pe care doriți să îi primiți înapoi (dacă nu este trecut niciun tip, veți primi o listă de liste ca rezultat)
+Nu vă faceți încă griji cu privire la padding și trunchiere; le vom explica mai târziu. Principalele lucruri de reținut aici sunt că puteți trece o propoziție sau o listă de propoziții, precum și specificarea tipului de tensori pe care doriți să îi primiți înapoi (dacă nu este trecut niciun tip, veți primi o listă de liste ca rezultat).
 {#if fw === 'pt'}
 
 Iată cum arată rezultatele ca tensori PyTorch:
@@ -177,18 +177,18 @@ model = TFAutoModel.from_pretrained(checkpoint)
  
 În acest fragment de cod, am descărcat același checkpoint pe care l-am folosit anterior în pipeline-ul nostru (de fapt, ar fi trebuit să fie deja în cache) și am instanțiat un model cu acesta.
 
-Această arhitectură conține doar modulul Transformer de bază: având în vedere anumite intrări, acesta produce ceea ce vom numi *stări ascunse*, cunoscute și ca *caracteristici*. Pentru fiecare intrare a modelului, vom extrage un vector înalt-dimensional care reprezintă **înțelegerea contextuală a intrării respective de către modelul Transformer**.
+Această arhitectură conține doar modulul Transformer de bază: având în vedere anumite intrări, acesta produce ceea ce vom numi *stări ascunse*, cunoscute și ca *caracteristici*. Pentru fiecare intrare a modelului, vom extrage un vector multidimensional care reprezintă **înțelegerea contextuală a intrării respective de către modelul Transformer**.
 
 Dacă acest lucru nu are sens, nu vă faceți griji. Vom explica totul mai târziu.
 
-Deși aceste stări ascunse pot fi utile pe cont propriu, ele sunt de obicei intrări pentru o altă parte a modelului, cunoscută sub numele de *head*. În [Capitolul 1](/curs/capitol1), diferitele sarcini ar fi putut fi efectuate cu aceeași arhitectură, dar fiecăreia dintre aceste sarcini îi va fi asociat un head diferit.
+Deși aceste stări ascunse pot fi utile pe cont propriu, ele sunt de obicei intrări pentru o altă parte a modelului, cunoscută sub numele de *head*. În [Capitolul 1](/course/chapter1), diferitele sarcini ar fi putut fi efectuate cu aceeași arhitectură, dar fiecăreia dintre aceste sarcini îi va fi asociat un head diferit.
 
 ### Un vector multidimensional?[[un-vector-multidimensional]]
 
  
 Vectorul emis de modulul Transformator este de obicei de dimensiuni mari. Acesta are în general trei dimensiuni:
 
-- **Dimensiunea lotului**: Numărul de secvențe prelucrate simultan (2 în exemplul nostru).
+- **Dimensiunea batch-ului**: Numărul de secvențe prelucrate simultan (2 în exemplul nostru).
 - **Lungimea secvenței**: Lungimea reprezentării numerice a secvenței (16 în exemplul nostru).
 - **Dimensiunea ascunsă**: Dimensiunea vectorială a fiecărei intrări a modelului.
 
@@ -219,7 +219,7 @@ print(outputs.last_hidden_state.shape)
  
 Rețineți că ieșirile modelelor 🤗 Transformers se comportă ca `namedtuple`s sau dicționare. Puteți accesa elementele prin atribute (așa cum am făcut noi) sau prin cheie (`outputs[„last_hidden_state”]`), sau chiar prin index dacă știți exact unde se află lucrul pe care îl căutați (`outputs[0]`).
 
-### Modele de head-uri: Înțelegerea numerelor[modele-de-head-uri-înțelegerea-numerelor]]
+### Modele de head-uri: Înțelegerea numerelor[[modele-de-head-uri-înțelegerea-numerelor]]
 
 Head-urile modelelor iau ca intrare vectorul multidimensional al stărilor ascunse și le proiectează pe o altă dimensiune. Acestea sunt de obicei compuse din unul sau câteva straturi liniare:
 

From 62e781dd41659dd50fe5f9f6ef105e763ee45845 Mon Sep 17 00:00:00 2001
From: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
Date: Wed, 2 Apr 2025 22:01:16 +0300
Subject: [PATCH 061/167] Apply suggestions from code review to file 6

---
 chapters/rum/chapter2/6.mdx | 6 +++---
 1 file changed, 3 insertions(+), 3 deletions(-)

diff --git a/chapters/rum/chapter2/6.mdx b/chapters/rum/chapter2/6.mdx
index c26d40929..a2746481b 100644
--- a/chapters/rum/chapter2/6.mdx
+++ b/chapters/rum/chapter2/6.mdx
@@ -39,7 +39,7 @@ model_inputs = tokenizer(sequence)
 
 Aici, variabila `model_inputs` conține tot ceea ce este necesar pentru ca un model să funcționeze bine. Pentru DistilBERT, aceasta include ID-urile de intrare, precum și masca de atenție. Alte modele care acceptă intrări suplimentare le vor avea, de asemenea, la ieșire prin obiectul `tokenizer`.
 
-După cum vom vedea în câteva exemple de mai jos, această metodă este foarte eficientă. În primul rând, poate tokeniza o singură secvență:
+După cum vom vedea în câteva exemple de mai jos, această metodă este foarte puternică. În primul rând, poate tokeniza o singură secvență:
 
 ```py
 sequence = "I've been waiting for a HuggingFace course my whole life."
@@ -55,7 +55,7 @@ sequences = ["I've been waiting for a HuggingFace course my whole life.", "So ha
 model_inputs = tokenizer(sequences)
 ```
 
-Acesta poate umple în funcție de mai multe obiective:
+Poate aplica padding în funcție de mai multe obiective:
 
 ```py
 # Va umple secvențele până la lungimea maximă a secvenței
@@ -82,7 +82,7 @@ model_inputs = tokenizer(sequences, truncation=True)
 model_inputs = tokenizer(sequences, max_length=8, truncation=True)
 ```
 
-Obiectul `tokenizer` poate gestiona conversia în tensori specifici framework-ului, care pot fi apoi trimiși direct la model. De exemplu, în următorul exemplu de cod, solicităm tokenizatorului să returneze tensori din diferite cadre - `„pt”` returnează tensori PyTorch, `„tf”` returnează tensori TensorFlow, iar `„np”` returnează matrici NumPy:
+Obiectul `tokenizer` poate gestiona conversia în tensori specifici framework-ului, care pot fi apoi trimiși direct la model. De exemplu, în următorul exemplu de cod, solicităm tokenizatorului să returneze tensori din diferite framework-uri - `„pt”` returnează tensori PyTorch, `„tf”` returnează tensori TensorFlow, iar `„np”` returnează matrici NumPy:
 
 ```py
 sequences = ["I've been waiting for a HuggingFace course my whole life.", "So have I!"]

From 00eb2b54ca94bd0c8831b38759537931d79b152c Mon Sep 17 00:00:00 2001
From: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
Date: Wed, 2 Apr 2025 22:01:40 +0300
Subject: [PATCH 062/167] Apply suggestions from code review

---
 chapters/rum/chapter2/5.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter2/5.mdx b/chapters/rum/chapter2/5.mdx
index 1d71f6188..a8e9cdc07 100644
--- a/chapters/rum/chapter2/5.mdx
+++ b/chapters/rum/chapter2/5.mdx
@@ -319,7 +319,7 @@ Observăm cum ultima valoare a celei de-a doua secvențe este un ID de umplere,
 
 <Tip>
 
-✏️ ** Încercați!** Aplicați manual tokenizarea pe cele două propoziții utilizate în secțiunea 2 ("I've been waiting for a HuggingFace course my whole life." și "I hate this so much!"). Treceți-le prin model și verificați dacă obțineți aceeași logiți ca în secțiunea 2. Acum grupați-le împreună folosind token-ul de umplere, apoi creați masca de atenție corespunzătoare. Verificați dacă obțineți aceleași rezultate atunci când parcurgeți modelul!
+✏️ **Încercați!** Aplicați manual tokenizarea pe cele două propoziții utilizate în secțiunea 2 ("I've been waiting for a HuggingFace course my whole life." și "I hate this so much!"). Treceți-le prin model și verificați dacă obțineți aceeași logiți ca în secțiunea 2. Acum grupați-le împreună folosind token-ul de umplere, apoi creați masca de atenție corespunzătoare. Verificați dacă obțineți aceleași rezultate atunci când parcurgeți modelul!
 
 </Tip>
 

From f68ccccfb5d223fb9f521318a8fb39e8d50dbf88 Mon Sep 17 00:00:00 2001
From: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
Date: Wed, 2 Apr 2025 22:04:25 +0300
Subject: [PATCH 063/167] Apply suggestions from code review

---
 chapters/rum/chapter2/5.mdx | 12 ++++++------
 1 file changed, 6 insertions(+), 6 deletions(-)

diff --git a/chapters/rum/chapter2/5.mdx b/chapters/rum/chapter2/5.mdx
index a8e9cdc07..e91fb82dd 100644
--- a/chapters/rum/chapter2/5.mdx
+++ b/chapters/rum/chapter2/5.mdx
@@ -187,9 +187,9 @@ Acesta este un lot de două secvențe identice!
 
 </Tip>
 
-Gruparea în loturi permite modelului să funcționeze atunci când îi furnizați mai multe secvențe. Utilizarea mai multor secvențe este la fel de simplă ca și crearea unui lot cu o singură secvență. Există însă o a doua problemă. Atunci când încercați să combinați două (sau mai multe) propoziții, acestea pot avea lungimi diferite. Dacă ați mai lucrat vreodată cu tensori, știți că aceștia trebuie să aibă o formă dreptunghiulară, deci nu veți putea converti direct lista de ID-uri de intrare într-un tensor. Pentru a rezolva această problemă, de obicei *umplem* datele de intrare.
+Gruparea în loturi permite modelului să funcționeze atunci când îi furnizați mai multe secvențe. Utilizarea mai multor secvențe este la fel de simplă ca și crearea unui batch cu o singură secvență. Există însă o a doua problemă. Atunci când încercați să combinați două (sau mai multe) propoziții, acestea pot avea lungimi diferite. Dacă ați mai lucrat vreodată cu tensori, știți că aceștia trebuie să aibă o formă dreptunghiulară, deci nu veți putea converti direct lista de ID-uri de intrare într-un tensor. Pentru a rezolva această problemă, de obicei *umplem* datele de intrare.
 
-## Umplerea datelor de intrare[[umplerea-datelor-de-intrare]]
+## Padding-ul datelor de intrare[[padding-ul-datelor-de-intrare]]
 
 Următoarea serie de liste nu poate fi convertită într-un tensor:
 
@@ -211,7 +211,7 @@ batched_ids = [
 ]
 ```
 
-ID-ul token-ului de umplere poate fi găsit în `tokenizer.pad_token_id`. Să-l folosim și să trimitem cele două propoziții prin model în mod separat și grupate împreună:
+ID-ul token-ului de padding poate fi găsit în `tokenizer.pad_token_id`. Să-l folosim și să trimitem cele două propoziții prin model în mod separat și grupate împreună:
 
 {#if fw === 'pt'}
 ```py no-format
@@ -262,7 +262,7 @@ tf.Tensor(
 
 Este ceva în neregulă cu logit-urile din predicțiile noastre grupate: al doilea rând ar trebui să fie identic cu logit-urile pentru a doua propoziție, dar avem valori complet diferite!
 
-Acest lucru se datorează faptului că principala caracteristică a modelelor Transformer sunt straturile de atenție care *contextualizează* fiecare token. Acestea vor lua în considerare token-urile de umplutură, deoarece se ocupă de toate token-urile unei secvențe. Pentru a obține același rezultat atunci când trecem propoziții individuale de diferite lungimi prin model sau atunci când trecem un lot cu aceleași propoziții și același umplutură aplicată, trebuie să spunem acelor straturi de atenție să ignore token-urile de umplutură. Acest lucru se realizează prin utilizarea unei măști de atenție (attention mask).
+Acest lucru se datorează faptului că principala caracteristică a modelelor Transformer sunt straturile de atenție care *contextualizează* fiecare token. Acestea vor lua în considerare token-urile de umplutură, deoarece se ocupă de toate token-urile unei secvențe. Pentru a obține același rezultat atunci când trecem propoziții individuale de diferite lungimi prin model sau atunci când trecem un batch cu aceleași propoziții și același umplutură aplicată, trebuie să spunem acelor straturi de atenție să ignore token-urile de umplutură. Acest lucru se realizează prin utilizarea unei măști de atenție (attention mask).
 
 ## Attention masks(măști de atenție)[[attention-masks]]
 
@@ -313,9 +313,9 @@ tf.Tensor(
 ```
 {/if}
 
-Acum obținem aceeași logits pentru a doua propoziție din lot.
+Acum obținem aceeași logits pentru a doua propoziție din batch.
 
-Observăm cum ultima valoare a celei de-a doua secvențe este un ID de umplere, care este o valoare 0 în masca de atenție.
+Observăm cum ultima valoare a celei de-a doua secvențe este un ID de padding, care este o valoare 0 în masca de atenție.
 
 <Tip>
 

From 2ccc0ddc88f3c56c9d31565807cd2b02199d0145 Mon Sep 17 00:00:00 2001
From: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
Date: Wed, 2 Apr 2025 22:05:23 +0300
Subject: [PATCH 064/167] Apply suggestions from code review

---
 chapters/rum/chapter2/5.mdx | 6 +++---
 1 file changed, 3 insertions(+), 3 deletions(-)

diff --git a/chapters/rum/chapter2/5.mdx b/chapters/rum/chapter2/5.mdx
index e91fb82dd..b88110e3b 100644
--- a/chapters/rum/chapter2/5.mdx
+++ b/chapters/rum/chapter2/5.mdx
@@ -173,17 +173,17 @@ Logits: tf.Tensor([[-2.7276208  2.8789377]], shape=(1, 2), dtype=float32)
 ```
 {/if}
 
-Gruparea în loturi este acțiunea de a trimite mai multe propoziții prin model, toate odată. Dacă aveți o singură propoziție, puteți crea un lot cu o singură secvență: 
+Gruparea în loturi este acțiunea de a trimite mai multe propoziții prin model, toate odată. Dacă aveți o singură propoziție, puteți crea un batch cu o singură secvență: 
 
 ```
 batched_ids = [ids, ids]
 ```
 
-Acesta este un lot de două secvențe identice!
+Acesta este un batch de două secvențe identice!
 
 <Tip>
 
-✏️ ** Încercați!** Convertiți această listă `batched_ids` într-un tensor și treceți-o prin modelul dumneavoastră. Verificați dacă obțineți aceleași logits ca înainte (dar de două ori)!
+✏️ **Încercați!** Convertiți această listă `batched_ids` într-un tensor și treceți-o prin modelul dumneavoastră. Verificați dacă obțineți aceleași logits ca înainte (dar de două ori)!
 
 </Tip>
 

From 67bb65dded89d1aef2dfc8d86505b410ed4985b2 Mon Sep 17 00:00:00 2001
From: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
Date: Wed, 2 Apr 2025 22:06:21 +0300
Subject: [PATCH 065/167] Apply suggestions from code review

---
 chapters/rum/chapter2/5.mdx | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/chapters/rum/chapter2/5.mdx b/chapters/rum/chapter2/5.mdx
index b88110e3b..ed5fd638d 100644
--- a/chapters/rum/chapter2/5.mdx
+++ b/chapters/rum/chapter2/5.mdx
@@ -38,7 +38,7 @@
 Să vedem ce tipuri de probleme prezintă aceste întrebări și cum le putem rezolva folosind API-ul 🤗 Transformers.
 
 
-## Modelele așteaptă un lot de intrări[[modelele-așteaptă-un-lot-de-intrări]]
+## Modelele așteaptă un batch de intrări[[modelele-așteaptă-un-batch-de-intrări]]
 
 În exercițiul anterior ați văzut cum secvențele sunt transformate în liste de numere. Să convertim această listă de numere într-un tensor și să o transmitem modelului:
 
@@ -77,7 +77,7 @@ sequence = "I've been waiting for a HuggingFace course my whole life."
 tokens = tokenizer.tokenize(sequence)
 ids = tokenizer.convert_tokens_to_ids(tokens)
 input_ids = tf.constant(ids)
-# This line will fail.
+# Aceasă linie va eșua.
 model(input_ids)
 ```
 

From 7f3ec14d3ef09bb8ffe7f6588f7f28b115e24cf6 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Wed, 2 Apr 2025 22:09:21 +0300
Subject: [PATCH 066/167] fix changes on the same line from file 5 in code
 review

---
 chapters/rum/chapter2/5.mdx | 6 +++---
 1 file changed, 3 insertions(+), 3 deletions(-)

diff --git a/chapters/rum/chapter2/5.mdx b/chapters/rum/chapter2/5.mdx
index ed5fd638d..14d9551f6 100644
--- a/chapters/rum/chapter2/5.mdx
+++ b/chapters/rum/chapter2/5.mdx
@@ -173,7 +173,7 @@ Logits: tf.Tensor([[-2.7276208  2.8789377]], shape=(1, 2), dtype=float32)
 ```
 {/if}
 
-Gruparea în loturi este acțiunea de a trimite mai multe propoziții prin model, toate odată. Dacă aveți o singură propoziție, puteți crea un batch cu o singură secvență: 
+Batching-ul este acțiunea de a trimite mai multe propoziții prin model, toate odată. Dacă aveți o singură propoziție, puteți crea un lot cu o singură secvență: 
 
 ```
 batched_ids = [ids, ids]
@@ -187,7 +187,7 @@ Acesta este un batch de două secvențe identice!
 
 </Tip>
 
-Gruparea în loturi permite modelului să funcționeze atunci când îi furnizați mai multe secvențe. Utilizarea mai multor secvențe este la fel de simplă ca și crearea unui batch cu o singură secvență. Există însă o a doua problemă. Atunci când încercați să combinați două (sau mai multe) propoziții, acestea pot avea lungimi diferite. Dacă ați mai lucrat vreodată cu tensori, știți că aceștia trebuie să aibă o formă dreptunghiulară, deci nu veți putea converti direct lista de ID-uri de intrare într-un tensor. Pentru a rezolva această problemă, de obicei *umplem* datele de intrare.
+Batching-ul permite modelului să funcționeze atunci când îi furnizați mai multe secvențe. Utilizarea mai multor secvențe este la fel de simplă ca și crearea unui lot cu o singură secvență. Există însă o a doua problemă. Atunci când încercați să combinați două (sau mai multe) propoziții, acestea pot avea lungimi diferite. Dacă ați mai lucrat vreodată cu tensori, știți că aceștia trebuie să aibă o formă dreptunghiulară, deci nu veți putea converti direct lista de ID-uri de intrare într-un tensor. Pentru a rezolva această problemă, de obicei *umplem* datele de intrare.
 
 ## Padding-ul datelor de intrare[[padding-ul-datelor-de-intrare]]
 
@@ -319,7 +319,7 @@ Observăm cum ultima valoare a celei de-a doua secvențe este un ID de padding,
 
 <Tip>
 
-✏️ **Încercați!** Aplicați manual tokenizarea pe cele două propoziții utilizate în secțiunea 2 ("I've been waiting for a HuggingFace course my whole life." și "I hate this so much!"). Treceți-le prin model și verificați dacă obțineți aceeași logiți ca în secțiunea 2. Acum grupați-le împreună folosind token-ul de umplere, apoi creați masca de atenție corespunzătoare. Verificați dacă obțineți aceleași rezultate atunci când parcurgeți modelul!
+✏️ **Încercați!** Aplicați manual tokenizarea pe cele două propoziții utilizate în secțiunea 2 ("I've been waiting for a HuggingFace course my whole life." și "I hate this so much!"). Treceți-le prin model și verificați dacă obțineți aceeași logiți ca în secțiunea 2. Acum grupați-le împreună folosind token-ul de padding, apoi creați masca de atenție corespunzătoare. Verificați dacă obțineți aceleași rezultate atunci când parcurgeți modelul!
 
 </Tip>
 

From 4c959e8be6e1cc1f81773f64669880d5fd83707c Mon Sep 17 00:00:00 2001
From: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
Date: Wed, 2 Apr 2025 22:10:53 +0300
Subject: [PATCH 067/167] Apply suggestions from code review

---
 chapters/rum/chapter2/4.mdx | 18 ++++++++++--------
 1 file changed, 10 insertions(+), 8 deletions(-)

diff --git a/chapters/rum/chapter2/4.mdx b/chapters/rum/chapter2/4.mdx
index 4dd931482..c1b115f9b 100644
--- a/chapters/rum/chapter2/4.mdx
+++ b/chapters/rum/chapter2/4.mdx
@@ -25,7 +25,7 @@
 <Youtube id="VFp38yj8h3A"/>
 
 
-Tokenizoarele sunt una dintre componentele de bază ale pipeline-ului NLP. Acestea au un singur scop: să transforme textul în date care pot fi prelucrate de model. Modelele pot procesa doar numere, astfel încât tokenizerii trebuie să convertească intrările noastre de text în date numerice. În această secțiune, vom explora exact ce se întâmplă în pipeline-ul de tokenizare. 
+Tokenizerii sunt unele dintre componentele de bază ale pipeline-ului NLP. Acestea au un singur scop: să transforme textul în date care pot fi prelucrate de model. Modelele pot procesa doar numere, astfel încât tokenizerii trebuie să convertească intrările noastre de text în date numerice. În această secțiune, vom explora exact ce se întâmplă în pipeline-ul de tokenizare. 
 
 În sarcinile NLP, datele care sunt în general prelucrate sunt text brut. Iată un exemplu de astfel de text:
 
@@ -104,7 +104,7 @@ Pentru a obține ce este mai bun din ambele lumi, putem utiliza o a treia tehnic
 
 <Youtube id="zHvTiHr506c"/>
 
-Algoritmii "Subword Tokenization " se bazează pe principiul conform căruia cuvintele utilizate frecvent nu ar trebui să fie împărțite în cuvinte secundare mai mici, dar cuvintele rare ar trebui să fie descompuse în cuvinte secundare semnificative.
+Algoritmii "Subword Tokenization " se bazează pe principiul conform căruia cuvintele utilizate frecvent nu ar trebui să fie împărțite în subcuvinte mai mici, dar cuvintele rare ar trebui să fie descompuse în subcuvinte semnificative.
 
 De exemplu, " annoyingly " ar putea fi considerat un cuvânt rar și ar putea fi descompus în " annoying " și " ly ". Este probabil ca ambele să apară mai frecvent ca subcuvinte de sine stătătoare, în timp ce, în același timp, sensul cuvântului " annoyingly " este păstrat de sensul compus al cuvintelor " annoying " și " ly ".
 
@@ -115,9 +115,9 @@ Iată un exemplu care arată modul în care un algoritm de subword tokenization
   <img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/bpe_subword-dark.svg" alt="A subword tokenization algorithm."/>
 </div>
 
-Aceste părți de cuvinte oferă în cele din urmă o mulțime de semnificații semantice: în exemplul de mai sus, "tokenization" a fost împărțit în "token" și "ization", două cuvinte care au o semnificație semantică, fiind în același timp eficiente din punct de vedere al spațiului (sunt necesare doar două cuvinte pentru a reprezenta un cuvânt lung). Acest lucru ne permite să avem o acoperire relativ bună cu vocabulare de dimensiuni mici și aproape fără token-uri necunoscute.
+Aceste părți de cuvinte oferă în cele din urmă o mulțime de semnificații semantice: în exemplul de mai sus, "tokenization" a fost împărțit în "token" și "ization", doi tokenuri care au o semnificație semantică, fiind în același timp eficiente din punct de vedere al spațiului (sunt necesare doar două cuvinte pentru a reprezenta un cuvânt lung). Acest lucru ne permite să avem o acoperire relativ bună cu vocabulare de dimensiuni mici și aproape fără token-uri necunoscute.
 
-Această abordare este utilă în special în limbile aglutinative, cum ar fi turca, în care se pot forma cuvinte complexe (aproape) arbitrar de lungi prin combinarea părților de cuvinte.
+Această abordare este utilă în special în limbile aglutinative, cum ar fi turca, în care se pot forma cuvinte complexe (aproape) arbitrar de lungi prin combinarea subcuvintelor.
 
 ### Și nu numai![[și-nu-numai]]
 
@@ -127,13 +127,13 @@ Nu este surprinzător faptul că există mult mai multe tehnici. Iată câteva:
 - WordPiece, utilizată în BERT
 - SentencePiece sau Unigram, utilizate în mai multe modele multilingve
 
-Acum ar trebui să cunoașteți destul de bine cum funcționează tokenizerele pentru a începe să utilizați API-
+Acum ar trebui să cunoașteți destul de bine cum funcționează tokenizerele pentru a începe să utilizați API-ul.
 
 ## Încărcarea și salvarea[[încărcarea-și-salvarea]]
 
 Încărcarea și salvarea tokenizerelor este la fel de simplă ca în cazul modelelor. De fapt, se bazează pe aceleași două metode: `from_pretrained()` și `save_pretrained()`. Aceste metode vor încărca sau salva algoritmul utilizat de tokenizator (un pic ca *arhitectura* modelului), precum și vocabularul său (un pic ca *weight-urile* modelului).
 
-Încărcarea tokenizatorului BERT antrenat cu același punct de control ca BERT se face în același mod ca și încărcarea modelului, cu excepția faptului că folosim clasa `BertTokenizer`:
+Încărcarea tokenizatorului BERT antrenat cu același checkpoint ca BERT se face în același mod ca și încărcarea modelului, cu excepția faptului că folosim clasa `BertTokenizer`:
 
 ```py
 from transformers import BertTokenizer
@@ -181,6 +181,8 @@ Vom vorbi mai mult despre `token_type_ids` în [Capitolul 3](/course/chapter3) 
 
 Traducerea textului în numere este cunoscută sub numele de codificare. Codificarea se face într-un proces în două etape: tokenizarea, urmată de conversia în ID-uri de intrare.
 
+Traducerea textului în numere este cunoscută sub numele de codificare. Codificarea se face într-un proces în două etape: tokenizarea, urmată de conversia în ID-uri de intrare.
+
 Al doilea pas este să convertim aceste token-uri în numere, astfel încât să putem construi un tensor din ele și să le introducem în model. Pentru a face acest lucru, tokenizatorul are un *vocabular*, care este partea pe care o descărcăm atunci când îl instanțiem cu metoda `from_pretrained()`. Din nou, trebuie să folosim același vocabular utilizat atunci când modelul a fost preantrenat.
 
 Pentru a înțelege mai bine cele două etape, le vom explora separat. Rețineți că vom utiliza unele metode care efectuează părți ale pipeline-ului de tokenizare separat pentru a vă arăta rezultatele intermediare ale acestor etape, dar, în practică, ar trebui să apelați tokenizatorul direct pe intrările dvs. (așa cum se arată în secțiunea 2).
@@ -206,7 +208,7 @@ Rezultatul acestei metode este o listă de șiruri de caractere, sau token-uri:
 ['Using', 'a', 'transform', '##er', 'network', 'is', 'simple']
 ```
 
-Acest tokenizator este un tokenizator de părți de cuvinte: împarte cuvintele până când obține token-uri care pot fi reprezentate de vocabularul său. Acesta este cazul aici cu `transformer`, care este împărțit în două token-uri: `transform` și `##er`
+Acest tokenizator este un tokenizator de subcuvinte: împarte cuvintele până când obține token-uri care pot fi reprezentate de vocabularul său. Acesta este cazul aici cu `transformer`, care este împărțit în două token-uri: `transform` și `##er`
 
 ### De la token-uri la ID-uri de intrare[[de-la-token-uri-la-id-uri-de-intrare]]
 
@@ -226,7 +228,7 @@ Aceste rezultate, odată convertite în tensorul framework-ului corespunzător,
 
 <Tip>
 
-✏️ ** Încercați!** Replicați ultimii doi pași (tokenizarea și conversia în ID-uri de intrare) pe propozițiile de intrare pe care le-am folosit în secțiunea 2 ("I've been waiting for a HuggingFace course my whole life." și "I hate this so much!"). Verificați dacă obțineți aceleași ID-uri de intrare pe care le-am obținut mai devreme! 
+✏️ **Încercați!** Replicați ultimii doi pași (tokenizarea și conversia în ID-uri de intrare) pe propozițiile de intrare pe care le-am folosit în secțiunea 2 ("I've been waiting for a HuggingFace course my whole life." și "I hate this so much!"). Verificați dacă obțineți aceleași ID-uri de intrare pe care le-am obținut mai devreme! 
 
 </Tip>
 

From a5ce68395f7f220bdfc3c395400a7a18b2d3f710 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Wed, 2 Apr 2025 22:11:39 +0300
Subject: [PATCH 068/167] fix last reivew comment for file 4

---
 chapters/rum/chapter2/4.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter2/4.mdx b/chapters/rum/chapter2/4.mdx
index 4dd931482..e27d839e6 100644
--- a/chapters/rum/chapter2/4.mdx
+++ b/chapters/rum/chapter2/4.mdx
@@ -115,7 +115,7 @@ Iată un exemplu care arată modul în care un algoritm de subword tokenization
   <img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/bpe_subword-dark.svg" alt="A subword tokenization algorithm."/>
 </div>
 
-Aceste părți de cuvinte oferă în cele din urmă o mulțime de semnificații semantice: în exemplul de mai sus, "tokenization" a fost împărțit în "token" și "ization", două cuvinte care au o semnificație semantică, fiind în același timp eficiente din punct de vedere al spațiului (sunt necesare doar două cuvinte pentru a reprezenta un cuvânt lung). Acest lucru ne permite să avem o acoperire relativ bună cu vocabulare de dimensiuni mici și aproape fără token-uri necunoscute.
+Aceste subcuvinte oferă în cele din urmă o mulțime de semnificații semantice: în exemplul de mai sus, "tokenization" a fost împărțit în "token" și "ization", două cuvinte care au o semnificație semantică, fiind în același timp eficiente din punct de vedere al spațiului (sunt necesare doar două cuvinte pentru a reprezenta un cuvânt lung). Acest lucru ne permite să avem o acoperire relativ bună cu vocabulare de dimensiuni mici și aproape fără token-uri necunoscute.
 
 Această abordare este utilă în special în limbile aglutinative, cum ar fi turca, în care se pot forma cuvinte complexe (aproape) arbitrar de lungi prin combinarea părților de cuvinte.
 

From 8adc40c3c03ecd60a65a1718fce808b94a14af80 Mon Sep 17 00:00:00 2001
From: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
Date: Wed, 2 Apr 2025 22:14:15 +0300
Subject: [PATCH 069/167] Apply suggestions from code review for file 3

---
 chapters/rum/chapter2/3.mdx | 6 +++---
 1 file changed, 3 insertions(+), 3 deletions(-)

diff --git a/chapters/rum/chapter2/3.mdx b/chapters/rum/chapter2/3.mdx
index 58244a3b1..59dcc330f 100644
--- a/chapters/rum/chapter2/3.mdx
+++ b/chapters/rum/chapter2/3.mdx
@@ -148,7 +148,7 @@ Greutățile au fost descărcate și stocate în cache (astfel încât apelurile
 Identificatorul utilizat pentru încărcarea modelului poate fi identificatorul oricărui model de pe Model Hub, atâta timp cât acesta este compatibil cu arhitectura BERT. Lista completă a checkpoint-urilor BERT disponibile poate fi găsită [aici](https://huggingface.co/models?filter=bert).
 
 
-### Metode de păstrare[[metode-de-păstrare]]
+### Metode de salvare[[metode-de-salvare]]
 
 Salvarea unui model este la fel de ușoară ca încărcarea unuia - folosim metoda `save_pretrained()`, care este analogă metodei `from_pretrained()`:
 
@@ -207,7 +207,7 @@ encoded_sequences = [
 ]
 ```
 
-Aceasta este o listă de secvențe codificate: o listă de liste. Tensorii acceptă numai forme dreptunghiulare (gândiți-vă la matrici). Această " listă " are deja o formă dreptunghiulară, astfel încât convertirea sa într-un tensor este ușoară:
+Aceasta este o listă de secvențe codificate: o listă de liste. Tensorii acceptă numai forme dreptunghiulare (gândiți-vă la matrici). Acest "array" are deja o formă dreptunghiulară, astfel încât convertirea sa într-un tensor este ușoară:
 
 {#if fw === 'pt'}
 ```py
@@ -223,7 +223,7 @@ model_inputs = tf.constant(encoded_sequences)
 ```
 {/if}
 
-### Utilizarea tensorilor ca intrări în model[[utilizarea-tensorilor-ca-intrări-în-to-model]]
+### Utilizarea tensorilor ca intrări în model[[utilizarea-tensorilor-ca-intrări-în-model]]
 
 Utilizarea tensorilor cu ajutorul modelului este extrem de simplă - trebuie doar să apelăm modelul cu intrările:
 

From a780f2279a28ca97904f0ff5b0f1338f12580ba0 Mon Sep 17 00:00:00 2001
From: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
Date: Wed, 2 Apr 2025 22:15:51 +0300
Subject: [PATCH 070/167] Apply suggestions from code review

---
 chapters/rum/chapter2/2.mdx | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/chapters/rum/chapter2/2.mdx b/chapters/rum/chapter2/2.mdx
index 3589c8a58..67fc2cd3c 100644
--- a/chapters/rum/chapter2/2.mdx
+++ b/chapters/rum/chapter2/2.mdx
@@ -351,8 +351,8 @@ model.config.id2label
 ```
 Acum putem concluziona că modelul a prezis următoarele:
  
-- Prima propoziție: NEGATIV: 0,0402, POZITIV: 0,9598
-- A doua propoziție: NEGATIVĂ: 0,9995, POZITIVĂ: 0,0005
+- Prima propoziție: NEGATIV: 0.0402, POZITIV: 0.9598
+- A doua propoziție: NEGATIVĂ: 0.9995, POZITIVĂ: 0.0005
 
 Am reprodus cu succes cele trei etape ale pipeline-ului: preprocesarea cu tokenizere, trecerea intrărilor prin model și postprocesarea! Acum haideți să analizăm în profunzime fiecare dintre aceste etape.
 

From 28b643bc4dc6c861b59d72cbc7996030fde7f646 Mon Sep 17 00:00:00 2001
From: Eduard Balamatiuc <66115008+eduard-balamatiuc@users.noreply.github.com>
Date: Wed, 2 Apr 2025 22:16:11 +0300
Subject: [PATCH 071/167] Update chapters/rum/chapter2/2.mdx

---
 chapters/rum/chapter2/2.mdx | 3 +--
 1 file changed, 1 insertion(+), 2 deletions(-)

diff --git a/chapters/rum/chapter2/2.mdx b/chapters/rum/chapter2/2.mdx
index 67fc2cd3c..1f6fa260e 100644
--- a/chapters/rum/chapter2/2.mdx
+++ b/chapters/rum/chapter2/2.mdx
@@ -358,7 +358,6 @@ Am reprodus cu succes cele trei etape ale pipeline-ului: preprocesarea cu tokeni
 
 <Tip>
 
-✏️  
-** Încercați!** Alegeți două (sau mai multe) texte proprii și treceți-le prin conducta `sentiment-analysis`. Apoi repetați pașii pe care i-ați văzut aici și verificați dacă obțineți aceleași rezultate!
+✏️  ** Încercați!** Alegeți două (sau mai multe) texte proprii și treceți-le prin conducta `sentiment-analysis`. Apoi repetați pașii pe care i-ați văzut aici și verificați dacă obțineți aceleași rezultate!
 
 </Tip>

From 6d93150f8a4433a537bced18296f5ffbe9cf9f3c Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Wed, 2 Apr 2025 22:16:52 +0300
Subject: [PATCH 072/167] remove whitespace

---
 chapters/rum/chapter2/2.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter2/2.mdx b/chapters/rum/chapter2/2.mdx
index 1f6fa260e..605af9c1e 100644
--- a/chapters/rum/chapter2/2.mdx
+++ b/chapters/rum/chapter2/2.mdx
@@ -358,6 +358,6 @@ Am reprodus cu succes cele trei etape ale pipeline-ului: preprocesarea cu tokeni
 
 <Tip>
 
-✏️  ** Încercați!** Alegeți două (sau mai multe) texte proprii și treceți-le prin conducta `sentiment-analysis`. Apoi repetați pașii pe care i-ați văzut aici și verificați dacă obțineți aceleași rezultate!
+✏️  **Încercați!** Alegeți două (sau mai multe) texte proprii și treceți-le prin conducta `sentiment-analysis`. Apoi repetați pașii pe care i-ați văzut aici și verificați dacă obțineți aceleași rezultate!
 
 </Tip>

From 95b10b5188d7ae38ac517fdaaf40394471fcbcb6 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Mon, 7 Apr 2025 19:59:55 +0300
Subject: [PATCH 073/167] =?UTF-8?q?fix:=20replace=20"a=20v=C4=83=20=C3=AEn?=
 =?UTF-8?q?v=C4=83=C8=9Ba"=20sequence?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 chapters/rum/chapter1/1.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter1/1.mdx b/chapters/rum/chapter1/1.mdx
index a6f280a9b..a836a6cf1 100644
--- a/chapters/rum/chapter1/1.mdx
+++ b/chapters/rum/chapter1/1.mdx
@@ -9,7 +9,7 @@
 
 <Youtube id="00GKzGyWFEs" />
 
-Acest curs vă va învăța despre procesarea limbajelor naturale (NLP) folosind biblioteci din ecosistemul [Hugging Face](https://huggingface.co/) — [🤗 Transformers](https://github.com/huggingface/transformers), [🤗 Datasets](https://github.com/huggingface/datasets), [🤗 Tokenizers](https://github.com/huggingface/tokenizers), și [🤗 Accelerate](https://github.com/huggingface/accelerate) — precum și [Hugging Face Hub](https://huggingface.co/models). Cursul este complet gratuit și nu conține reclame.
+Acest curs are scopul de a vă învăța despre procesarea limbajelor naturale (NLP) folosind biblioteci din ecosistemul [Hugging Face](https://huggingface.co/) — [🤗 Transformers](https://github.com/huggingface/transformers), [🤗 Datasets](https://github.com/huggingface/datasets), [🤗 Tokenizers](https://github.com/huggingface/tokenizers), și [🤗 Accelerate](https://github.com/huggingface/accelerate) — precum și [Hugging Face Hub](https://huggingface.co/models). Cursul este complet gratuit și nu conține reclame.
 
 ## La ce să te aștepți?[[la-ce-sa-te-aștepți]]
 

From 6d2649322c19db1b57cd78dc58567bd225a9e7d2 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Mon, 7 Apr 2025 20:05:49 +0300
Subject: [PATCH 074/167] fix: add missing section on understanding NLP and
 LLMs

---
 chapters/rum/chapter1/1.mdx | 10 ++++++++++
 1 file changed, 10 insertions(+)

diff --git a/chapters/rum/chapter1/1.mdx b/chapters/rum/chapter1/1.mdx
index a836a6cf1..9edb0e0e5 100644
--- a/chapters/rum/chapter1/1.mdx
+++ b/chapters/rum/chapter1/1.mdx
@@ -11,6 +11,16 @@
 
 Acest curs are scopul de a vă învăța despre procesarea limbajelor naturale (NLP) folosind biblioteci din ecosistemul [Hugging Face](https://huggingface.co/) — [🤗 Transformers](https://github.com/huggingface/transformers), [🤗 Datasets](https://github.com/huggingface/datasets), [🤗 Tokenizers](https://github.com/huggingface/tokenizers), și [🤗 Accelerate](https://github.com/huggingface/accelerate) — precum și [Hugging Face Hub](https://huggingface.co/models). Cursul este complet gratuit și nu conține reclame.
 
+## Înțelegerea NLP și a LLM-urilor[[înțelegerea-nlp-și-a-llm-urilor]]
+
+Deși acest curs a fost inițial axat pe NLP (Procesarea Limbajului Natural), el a evoluat pentru a pune accentul pe Large Language Models (LLM-uri), care reprezintă cele mai recente progrese din domeniu.
+
+**Care este diferența?**
+- **NLP (Procesarea Limbajului Natural)** este domeniul mai larg care se concentrează pe permiterea computerelor să înțeleagă, interpreteze și să genereze limbajul uman. NLP include multe tehnici și sarcini, cum ar fi analiza sentimentelor, recunoașterea entităților numite și traducerea automată.
+- **LLM-uri (Modele Mari de Limbaj)** sunt un subset puternic al modelelor NLP, caracterizate prin dimensiuni masive, volume mari de date de antrenament și abilitatea de a îndeplini o gamă largă de sarcini lingvistice cu un antrenament specific minim. Modele precum seriile Llama, GPT sau Claude sunt exemple de LLM-uri care au revoluționat ceea ce este posibil în domeniul NLP.
+
+Pe parcursul acestui curs, vei învăța atât concepte tradiționale din NLP, cât și tehnici de ultimă generație legate de LLM-uri, deoarece înțelegerea fundamentelor NLP este esențială pentru a lucra eficient cu LLM-uri.
+
 ## La ce să te aștepți?[[la-ce-sa-te-aștepți]]
 
 Aceasta este o scurtă prezentare a cursului:

From ccff4ec5561e938f50f0b8cb4e14a51ca39efbf5 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Mon, 7 Apr 2025 20:08:45 +0300
Subject: [PATCH 075/167] fix: add Ben Burtenshaw (missing author)

---
 chapters/rum/chapter1/1.mdx | 2 ++
 1 file changed, 2 insertions(+)

diff --git a/chapters/rum/chapter1/1.mdx b/chapters/rum/chapter1/1.mdx
index 9edb0e0e5..073c87890 100644
--- a/chapters/rum/chapter1/1.mdx
+++ b/chapters/rum/chapter1/1.mdx
@@ -48,6 +48,8 @@ Despre autori:
 
 [**Abubakar Abid**](https://huggingface.co/abidlabs) și-a susținut doctoratul la Stanford în Applied Machine Learning. În timpul doctoratului său, a fondat [Gradio](https://github.com/gradio-app/gradio), o bibliotecă Python open-source care a fost utilizată pentru a construi peste 600.000 de demo-uri de Machine Learning. Gradio a fost achiziționată de Hugging Face, unde Abubakar activează acum ca lider al echipei de Machine Learning.
 
+[**Ben Burtenshaw**](https://huggingface.co/burtenshaw) este Machine Learning Engineer la Hugging Face. A obținut doctoratul în Procesarea Limbajului Natural la Universitatea din Antwerp, unde a aplicat modele Transformer pentru a genera povești pentru copii cu scopul de a îmbunătăți abilitățile de literație. De atunci, s-a concentrat pe materiale educaționale și instrumente pentru comunitatea largă.
+
 [**Matthew Carrigan**](https://huggingface.co/Rocketknight1) este inginer de Machine Learning la Hugging Face. Locuiește în Dublin, Irlanda și a lucrat anterior ca inginer ML la Parse.ly și înainte de asta ca cercetător postdoctoral la Trinity College Dublin. El nu crede că vom ajunge la AGI prin scalarea arhitecturilor existente, dar are mari speranțe în ceea ce privește nemurirea roboților.
 
 [**Lysandre Debut**](https://huggingface.co/lysandre) este inginer de Machine Learning la Hugging Face și a lucrat la biblioteca 🤗 Transformers încă din primele etape de dezvoltare. Scopul său este de a face NLP accesibil pentru toată lumea prin dezvoltarea de instrumente cu un API foarte simplu.

From 07d6bec2891c9a535f09bf8f4d0ff7a74eed26c6 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Mon, 7 Apr 2025 20:18:16 +0300
Subject: [PATCH 076/167] fix: applied all suggestions for file 1 chapter 1

---
 chapters/rum/chapter1/1.mdx | 24 ++++++++++++------------
 1 file changed, 12 insertions(+), 12 deletions(-)

diff --git a/chapters/rum/chapter1/1.mdx b/chapters/rum/chapter1/1.mdx
index 073c87890..4b10882e7 100644
--- a/chapters/rum/chapter1/1.mdx
+++ b/chapters/rum/chapter1/1.mdx
@@ -30,14 +30,14 @@ Aceasta este o scurtă prezentare a cursului:
 <img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/summary-dark.svg" alt="Brief overview of the chapters of the course.">
 </div>
 
-- Capitolele 1-4 oferă o introducere în conceptele fundamentale ale bibliotecii 🤗 Transformers. Până la sfârșitul acestei părți a cursului, veți fi familiarizați cu modul în care funcționează modelele Transformer și veți ști cum să utilizați un model din [Hugging Face Hub](https://huggingface.co/models), să îl ajustați pe un set de date și să vă partajați rezultatele pe Hub!
-- Capitolele 5-8 predau elementele de bază ale Datasets 🤗 și ale Tokenizerelor 🤗 înainte de a vă scufunda în sarcinile NLP. Până la sfârșitul acestei părți, veți fi capabil să abordați singur cele mai frecvente probleme NLP.
-- Capitolele 9-12 trec dincolo de NLP și explorează modul în care modelele Transformer pot fi utilizate pentru a aborda sarcini din domeniul procesării semnalelor vorbirii și computer vision. Pe parcurs, veți învăța cum să construiți și să partajați demo-uri ale modelelor dumneavoastră și cum să le optimizați pentru mediul de producție. Până la sfârșitul acestei părți, veți fi gata să aplicați 🤗 Transformers la (aproape) orice problemă de machine learning!
+- Capitolele 1-4 oferă o introducere în conceptele fundamentale ale bibliotecii 🤗 Transformers. Până la finalul acestei părți a cursului, veți fi familiarizați cu modul în care funcționează modelele Transformer și veți ști cum să utilizați un model din [Hugging Face Hub](https://huggingface.co/models), să îl ajustați pe un set de date și să vă partajați rezultatele pe Hub!
+- Capitolele 5-8 predau elementele de bază ale Datasets 🤗 și ale Tokenizatoarelor 🤗 înainte de a vă scufunda în sarcinile NLP. Până la sfârșitul acestei părți, veți fi capabil să abordați singur cele mai frecvente probleme NLP.
+- Capitolele 9-12 trec dincolo de NLP și explorează modul în care modelele Transformer pot fi utilizate pentru a aborda sarcini din domeniul procesării semnalelor vorbirii și computer vision. Pe parcurs, veți învăța cum să construiți și să partajați demo-uri ale modelelor dumneavoastră și cum să le optimizați pentru mediul de producție. Până la finalul acestei părți, veți fi gata să aplicați 🤗 Transformers la (aproape) orice problemă de machine learning!
 
 Acest curs:
 
 * Necesită o bună cunoaștere a limbajului Python.
-* Este mai bine să fie urmat după un curs introductiv de deep learning, cum ar fi [fast.ai's](https://www.fast.ai/) [Practical Deep Learning for Coders](https://course.fast.ai/) sau unul dintre programele dezvoltate de [DeepLearning.AI](https://www.deeplearning.ai/).
+* Este recomandat să fie parcurs după un curs introductiv de deep learning, cum ar fi [fast.ai's](https://www.fast.ai/) [Practical Deep Learning for Coders](https://course.fast.ai/) sau unul dintre cursurile oferite de [DeepLearning.AI](https://www.deeplearning.ai/).
 * Nu se așteaptă la cunoștințe anterioare despre [PyTorch](https://pytorch.org/) sau [TensorFlow](https://www.tensorflow.org/), deși o familiaritate cu oricare dintre acestea va fi de ajutor.
 
 După ce ați completat acest curs, vă recomandăm să accesați [Natural Language Processing Specialization](https://www.coursera.org/specializations/natural-language-processing?utm_source=deeplearning-ai&utm_medium=institutions&utm_campaign=20211011-nlp-2-hugging_face-page-nlp-refresh) de la DeepLearning.AI, care acoperă o gamă largă de modele NLP clasice, cum ar fi naive Bayes și LSTMs, despre care este bine să știți!
@@ -46,17 +46,17 @@ După ce ați completat acest curs, vă recomandăm să accesați [Natural Langu
 
 Despre autori:
 
-[**Abubakar Abid**](https://huggingface.co/abidlabs) și-a susținut doctoratul la Stanford în Applied Machine Learning. În timpul doctoratului său, a fondat [Gradio](https://github.com/gradio-app/gradio), o bibliotecă Python open-source care a fost utilizată pentru a construi peste 600.000 de demo-uri de Machine Learning. Gradio a fost achiziționată de Hugging Face, unde Abubakar activează acum ca lider al echipei de Machine Learning.
+[**Abubakar Abid**](https://huggingface.co/abidlabs) și-a susținut doctoratul la Stanford, în domeniul Applied Machine Learning. În timpul doctoratului său, a fondat [Gradio](https://github.com/gradio-app/gradio), o bibliotecă Python open-source care a fost utilizată pentru a construi peste 600.000 de demo-uri de Machine Learning. Gradio a fost achiziționată de Hugging Face, unde Abubakar activează acum ca lider al echipei de Machine Learning.
 
 [**Ben Burtenshaw**](https://huggingface.co/burtenshaw) este Machine Learning Engineer la Hugging Face. A obținut doctoratul în Procesarea Limbajului Natural la Universitatea din Antwerp, unde a aplicat modele Transformer pentru a genera povești pentru copii cu scopul de a îmbunătăți abilitățile de literație. De atunci, s-a concentrat pe materiale educaționale și instrumente pentru comunitatea largă.
 
-[**Matthew Carrigan**](https://huggingface.co/Rocketknight1) este inginer de Machine Learning la Hugging Face. Locuiește în Dublin, Irlanda și a lucrat anterior ca inginer ML la Parse.ly și înainte de asta ca cercetător postdoctoral la Trinity College Dublin. El nu crede că vom ajunge la AGI prin scalarea arhitecturilor existente, dar are mari speranțe în ceea ce privește nemurirea roboților.
+[**Matthew Carrigan**](https://huggingface.co/Rocketknight1) este inginer de Machine Learning la Hugging Face. Locuiește în Dublin, Irlanda și anterior a fost inginer ML la Parse.ly și înainte de asta cercetător postdoctoral la Trinity College Dublin. El consideră că atingerea AGI nu se va realiza prin scalarea arhitecturilor existente, dar este optimist în legătură cu viitorul roboților.
 
 [**Lysandre Debut**](https://huggingface.co/lysandre) este inginer de Machine Learning la Hugging Face și a lucrat la biblioteca 🤗 Transformers încă din primele etape de dezvoltare. Scopul său este de a face NLP accesibil pentru toată lumea prin dezvoltarea de instrumente cu un API foarte simplu.
 
 [**Sylvain Gugger**](https://huggingface.co/sgugger) este inginer de cercetare în Machine Learning la Hugging Face și unul dintre principalii întreținători ai bibliotecii 🤗 Transformers. Anterior a fost cercetător științific la fast.ai și a fost coautor la _[Deep Learning for Coders with fastai and PyTorch](https://learning.oreilly.com/library/view/deep-learning-for/9781492045519/)_ cu Jeremy Howard. Obiectivul principal al cercetării sale este de a face învățarea profundă mai accesibilă, prin proiectarea și îmbunătățirea tehnicilor care permit modelelor să se antreneze rapid pe resurse limitate.
 
-[**Dawood Khan**](https://huggingface.co/dawoodkhan82) este inginer de Machine Learning la Hugging Face. Este originar din New York și a absolvit Universitatea din New York, unde a studiat Informatica. După ce a lucrat ca inginer iOS timp de câțiva ani, Dawood a demisionat pentru a înființa Gradio împreună cu colegii săi co-fondatori. Gradio a fost în cele din urmă achiziționat de Hugging Face.
+[**Dawood Khan**](https://huggingface.co/dawoodkhan82) este inginer de Machine Learning la Hugging Face. Este originar din New York și a absolvit Universitatea din New York, unde a studiat Informatica. După ce a lucrat ca inginer iOS timp de câțiva ani, Dawood a renunțat la poziția sa pentru a înființa Gradio împreună cu colegii săi co-fondatori. Gradio a fost în cele din urmă achiziționat de Hugging Face.
 
 [**Merve Noyan**](https://huggingface.co/merve) este un susținător al dezvoltatorilor la Hugging Face, lucrând la dezvoltarea de instrumente și la crearea de conținut în jurul acestora pentru a facilita învățarea automată pentru toată lumea. 
 
@@ -71,13 +71,13 @@ Despre autori:
 Iată câteva răspunsuri la întrebări frecvente:
 
 - **Acest curs permite obținerea unei certificări?**
-Deocamdată nu avem nicio certificare pentru acest curs. Cu toate acestea, lucrăm la un program de certificare pentru ecosistemul Hugging Face - rămâneți pe fază!
+Momentan nu avem nicio certificare pentru acest curs. Cu toate acestea, lucrăm la un program de certificare pentru ecosistemul Hugging Face - rămâneți pe fază!
 
 - **Cât timp ar trebui să dedic acestui curs?**
-Fiecare capitol din acest curs este conceput pentru a fi parcurs într-o săptămână, cu aproximativ 6-8 ore de lucru pe săptămână. Cu toate acestea, vă puteți lua cât timp aveți nevoie pentru a finaliza cursul.
+Fiecare capitol al acestui curs este gândit să fie parcurs într-o săptămână, necesitând aproximativ 6–8 ore de lucru. Totuși, puteți avansa în ritmul propriu și finaliza cursul în timpul care vi se potrivește cel mai bine.
 
 - **Unde pot să pun o întrebare dacă am una?**
-Dacă aveți o întrebare despre orice secțiune a cursului, faceți clic pe bannerul „*Pune o întrebare*” din partea de sus a paginii pentru a fi redirecționat automat către secțiunea corectă a [Hugging Face forums](https://discuss.huggingface.co/):
+Dacă aveți o întrebare legată de orice secțiune a cursului, faceți clic pe bannerul „Pune o întrebare” din partea de sus a paginii pentru a fi redirecționat automat către secțiunea corespunzătoare din [forumurile Hugging Face](https://discuss.huggingface.co/):
 
 <img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/forum-button.png" alt="Link to the Hugging Face forums" width="75%">
 
@@ -99,7 +99,7 @@ Fiecare traducere are un glosar și un fișier `TRANSLATING.txt` care detaliază
 
 
 - **Pot reutiliza acest curs?**
-Desigur! Cursul este distribuit sub licența [Apache 2 license](https://www.apache.org/licenses/LICENSE-2.0.html) cu caracter permisiv. Aceasta înseamnă că trebuie să acordați creditul corespunzător, să furnizați un link către licență și să indicați dacă au fost făcute modificări. Puteți face acest lucru în orice mod rezonabil, dar nu în niciun fel care să sugereze că licențiatorul vă aprobă pe dumneavoastră sau utilizarea dumneavoastră. Dacă doriți să citați cursul, vă rugăm să utilizați următorul BibTeX:
+Desigur! Cursul este distribuit sub licența [Apache 2 license](https://www.apache.org/licenses/LICENSE-2.0.html), o licență permisivă. Aceasta permite reutilizarea materialului cu condiția să acordați credit autorilor, să includeți un link către licență și să menționați eventualele modificări efectuate. Acest lucru poate fi realizat în orice mod rezonabil, atâta timp cât nu implicați în mod fals că licențiatorul susține în mod explicit persoana sau utilizarea dvs. Dacă doriți să citați acest curs, vă rugăm să folosiți următorul formatBibTeX:
 
 ```
 @misc{huggingfacecourse,
@@ -111,7 +111,7 @@ Desigur! Cursul este distribuit sub licența [Apache 2 license](https://www.apac
 }
 ```
 
-## Let's Go
+## Să începem!
 Sunteți gata să începeți? În acest capitol, veți învăța:
 
 * Cum să utilizați funcția `pipeline()` pentru a rezolva sarcini NLP precum generarea și clasificarea textului

From 15003a5cedbe7557121fd185acf576f451f7fc84 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Wed, 9 Apr 2025 23:46:19 +0300
Subject: [PATCH 077/167] fix: remove random translating file

---
 chapters/rum/TRANSLATING.txt | 1 -
 1 file changed, 1 deletion(-)
 delete mode 100644 chapters/rum/TRANSLATING.txt

diff --git a/chapters/rum/TRANSLATING.txt b/chapters/rum/TRANSLATING.txt
deleted file mode 100644
index 23bcd65f8..000000000
--- a/chapters/rum/TRANSLATING.txt
+++ /dev/null
@@ -1 +0,0 @@
- Named Entity Recognition (NER) - recunoașterea entităților nominale
\ No newline at end of file

From 30f83a1f49d355f539c1becb53d9ba59e7abf9a4 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Thu, 10 Apr 2025 00:45:44 +0300
Subject: [PATCH 078/167] fix: adapt formulations in first part of chapter one
 rum version

---
 chapters/rum/chapter1/1.mdx | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/chapters/rum/chapter1/1.mdx b/chapters/rum/chapter1/1.mdx
index 4b10882e7..5d439a10a 100644
--- a/chapters/rum/chapter1/1.mdx
+++ b/chapters/rum/chapter1/1.mdx
@@ -81,14 +81,14 @@ Dacă aveți o întrebare legată de orice secțiune a cursului, faceți clic pe
 
 <img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/forum-button.png" alt="Link to the Hugging Face forums" width="75%">
 
-Rețineți că o listă de [idei de proiecte](https://discuss.huggingface.co/c/course/course-event/25) este de asemenea disponibilă pe forumuri dacă doriți să practicați mai mult după ce ați terminat cursul.
+De asemenea, o listă de [idei de proiecte](https://discuss.huggingface.co/c/course/course-event/25) este disponibilă pe forumuri, în cazul în care doriți să exersați mai mult după ce ați terminat cursul.
 
 - **De unde pot obține codul pentru curs?**
 Pentru fiecare secțiune, faceți clic pe bannerul din partea de sus a paginii pentru a rula codul în Google Colab sau Amazon SageMaker Studio Lab:
 
 <img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/notebook-buttons.png" alt="Link to the Hugging Face course notebooks" width="75%">
 
-Notebook-urile Jupyter care conțin tot codul din curs sunt găzduite în repo-ul [`huggingface/notebooks`](https://github.com/huggingface/notebooks). Dacă doriți să le generați local, consultați instrucțiunile din repo-ul [`course`](https://github.com/huggingface/course#-jupyter-notebooks) de pe GitHub.
+Notebook-urile Jupyter care conțin întregul cod al cursului sunt găzduite în repo-ul [`huggingface/notebooks`](https://github.com/huggingface/notebooks). Dacă doriți să le generați local, consultați instrucțiunile din repo-ul [`course`](https://github.com/huggingface/course#-jupyter-notebooks) de pe GitHub.
 
 
 - **Cum pot contribui la curs?**

From 232a90cd308f28ca9010c0e2db6db72c26c21548 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Thu, 10 Apr 2025 00:54:10 +0300
Subject: [PATCH 079/167] fix: solve all threads from file 2 chapter 1

---
 chapters/rum/chapter1/2.mdx | 16 ++++++++++++++--
 1 file changed, 14 insertions(+), 2 deletions(-)

diff --git a/chapters/rum/chapter1/2.mdx b/chapters/rum/chapter1/2.mdx
index b5b1c4d9b..77bd5861b 100644
--- a/chapters/rum/chapter1/2.mdx
+++ b/chapters/rum/chapter1/2.mdx
@@ -11,7 +11,7 @@
 
 NLP este un domeniu al lingvisticii și al învățării automate axat pe înțelegerea a tot ceea ce este legat de limbajul uman. Scopul sarcinilor NLP nu este doar înțelegerea individuală a cuvintelor, ci și capacitatea de a înțelege contextul acelor cuvinte.
 
-În continuare este prezentată o listă a sarcinilor obișnuite de NLP, cu câteva exemple pentru fiecare:
+În continuare urmează o listă a sarcinilor obișnuite de NLP, cu câteva exemple pentru fiecare:
 
 - **Clasificarea propozițiilor întregi**: Determinarea caracterului unei recenzii, detectarea dacă un e-mail este spam, determinarea dacă o propoziție este corectă gramatical sau dacă două propoziții sunt legate logic sau nu
 - **Clasificarea fiecărui cuvânt dintr-o propoziție**: Identificarea componentelor gramaticale ale unei propoziții (substantiv, verb, adjectiv) sau a entităților nominalizate (persoană, locație, organizație)
@@ -21,6 +21,18 @@ NLP este un domeniu al lingvisticii și al învățării automate axat pe înțe
 
 NLP nu se limitează însă la textul scris. De asemenea, NLP abordează provocări complexe în domeniul recunoașterii vorbirii și al viziunii computerizate, cum ar fi generarea unei transcrieri a unui fragment audio sau a unei descrieri a unei imagini.
 
+## Ascensiunea a Large Language Models (LLM-uri)[[rise-of-llms]]
+
+În ultimii ani, domeniul NLP a fost revoluționat de Large Language Models (LLM-uri). Aceste modele, care includ arhitecturi precum GPT (Generative Pre-trained Transformer) și [Llama](https://huggingface.co/meta-llama), au transformat ceea ce este posibil în procesarea limbajului.
+
+LLM-urile se caracterizează prin:
+- **Mărime**: Conțin milioane, miliarde sau chiar sute de miliarde de parametri
+- **Capacități generale**: Pot realiza multiple sarcini fără antrenament specific pentru fiecare sarcină
+- **Învățare în context**: Pot învăța din exemplele oferite în prompt
+- **Abilități emergente**: Pe măsură ce aceste modele cresc în dimensiune, demonstrează capacități care nu au fost programate sau anticipate în mod explicit
+
+Apariția LLM-urilor a schimbat paradigma de la construirea unor modele specializate pentru sarcini NLP specifice la utilizarea unui singur model mare care poate fi direcționat prin prompturi sau ajustat pentru a aborda o gamă largă de sarcini lingvistice. Acest lucru a făcut procesarea sofisticată a limbajului mai accesibilă, dar a introdus și noi provocări în domenii precum eficiența, etica și implementarea.
+
 ## De ce este o provocare?[[de-ce-este-o-provocare]]
 
-Computerele nu procesează informațiile în același mod ca oamenii. De exemplu, atunci când citim propoziția „Mi-e foame”, îi putem înțelege cu ușurință semnificația. În mod similar, având în vedere două propoziții precum „Mi-e foame” și „Sunt trist”, suntem capabili să determinăm cu ușurință cât de asemănătoare sunt acestea. Pentru modelele de învățare automată (ML), astfel de sarcini sunt mai dificile. Textul trebuie prelucrat într-un mod care să permită modelului să învețe din el. Și deoarece limbajul este complex, trebuie să ne gândim cu atenție la modul în care trebuie efectuată această procesare. Au fost efectuate numeroase cercetări cu privire la modul de reprezentare a textului și vom analiza câteva metode în capitolul următor.
+Computerele nu procesează informațiile în același mod ca oamenii. De exemplu, atunci când citim propoziția „Mi-e foame”, îi putem înțelege cu ușurință semnificația. În mod similar, având în vedere două propoziții precum „Mi-e foame” și „Sunt trist”, suntem capabili să determinăm cu ușurință cât de asemănătoare sunt acestea. Pentru modelele de învățare automată (ML), astfel de sarcini sunt mai dificile. Textul trebuie prelucrat într-un mod care să permită modelului să învețe din conținutul său. Și deoarece limbajul este complex, trebuie să ne gândim cu atenție la modul optim de a realiza această procesare. Au fost efectuate numeroase cercetări cu privire la modul de reprezentare a textului și vom analiza câteva metode în capitolul următor.

From e11d171d277a0bdb3cfafcf203f5e508ea499e32 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Thu, 10 Apr 2025 01:01:18 +0300
Subject: [PATCH 080/167] fix: implement all grammar suggestion for file 3
 chapter 1

---
 chapters/rum/chapter1/3.mdx | 16 ++++++++--------
 1 file changed, 8 insertions(+), 8 deletions(-)

diff --git a/chapters/rum/chapter1/3.mdx b/chapters/rum/chapter1/3.mdx
index 4ef4f11bb..8132f4eb8 100644
--- a/chapters/rum/chapter1/3.mdx
+++ b/chapters/rum/chapter1/3.mdx
@@ -7,7 +7,7 @@
     {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter1/section3.ipynb"},
 ]} />
 
-În această parte, vom vedea ce pot face modelele Transformer și vom folosi primul nostru instrument din biblioteca 🤗 Transformers: funcția `pipeline()`.
+În această parte, vom explora ce pot face modelele Transformer și vom folosi primul nostru instrument din biblioteca 🤗 Transformers: funcția `pipeline()`.
 
 <Tip>
 👀 Vedeți butonul <em>Open in Colab</em> din dreapta sus? Faceți clic pe el pentru a deschide un notebook Google Colab cu toate exemplele de cod din această secțiune. Acest buton va fi prezent în orice secțiune care conține exemple de cod. 
@@ -58,7 +58,7 @@ classifier(
  {'label': 'NEGATIVE', 'score': 0.9994558095932007}]
 ```
 
-În mod implicit, aceast pipeline selectează un anumit model preinstruit care a fost ajustat pentru a analiza emoțiile dintr-un text în limba engleză. Modelul este descărcat și pus în cache atunci când creați obiectul `classifier`. Dacă rulați din nou comanda, modelul din memoria cache va fi utilizat în locul acestuia și nu este nevoie să descărcați din nou modelul.
+În mod implicit, acest pipeline selectează un anumit model preinstruit care a fost ajustat pentru a analiza emoțiile dintr-un text în limba engleză. Modelul este descărcat și pus în cache atunci când creați obiectul `classifier`. Dacă rulați din nou comanda, modelul din memoria cache va fi utilizat în locul acestuia și nu este nevoie să descărcați din nou modelul.
 
 Atunci când transmiteți un text către un pipeline, sunt necesari trei pași:
 
@@ -83,7 +83,7 @@ Să aruncăm o privire la câteva dintre ele!
 
 ## Zero-shot classification[[zero-shot-classification]]
 
-Vom începe prin a aborda o sarcină mai dificilă în care trebuie să clasificăm texte care nu au fost etichetate. Acesta este un scenariu comun în proiectele din lumea reală, deoarece adnotarea textului este de obicei costisitoare în timp și necesită expertiză în domeniu. Pentru acest caz de utilizare, pipeline-ul `zero-shot-classification` este foarte puternică: vă permite să specificați ce etichete să utilizați pentru clasificare, astfel încât să nu trebuie să vă bazați pe etichetele modelului preinstruit. Ați văzut deja cum modelul poate clasifica o propoziție ca fiind pozitivă sau negativă folosind aceste două etichete - dar poate, de asemenea, clasifica textul folosind orice alt set de etichete doriți.
+Vom începe prin a aborda o sarcină mai dificilă în care trebuie să clasificăm texte care nu au fost etichetate. Acesta este un scenariu comun în proiectele din lumea reală, deoarece adnotarea textului este de obicei costisitoare în timp și necesită expertiză în domeniu. Pentru acest caz de utilizare, pipeline-ul `zero-shot-classification` este foarte puternic: vă permite să specificați ce etichete să utilizați pentru clasificare, astfel încât să nu fie nevoie să vă bazați pe etichetele modelului preinstruit. Ați văzut deja cum modelul poate clasifica o propoziție ca fiind pozitivă sau negativă folosind aceste două etichete - dar poate, de asemenea, clasifica textul folosind orice alt set de etichete doriți.
 
 ```python
 from transformers import pipeline
@@ -101,7 +101,7 @@ classifier(
  'scores': [0.8445963859558105, 0.111976258456707, 0.043427448719739914]}
 ```
 
-Aceast pipeline se numește _zero-shot_ deoarece nu trebuie să reglați modelul pe datele dvs. pentru a o utiliza. Aceasta poate returna direct scoruri de probabilitate pentru orice listă de etichete doriți!
+Acest pipeline se numește _zero-shot_ deoarece nu trebuie să reglați modelul pe datele dvs. pentru a o utiliza. Aceasta poate returna direct scoruri de probabilitate pentru orice listă de etichete doriți!
 
 <Tip>
 
@@ -142,7 +142,7 @@ Puteți controla câte secvențe diferite sunt generate cu argumentul `num_retur
 
 Exemplele anterioare au utilizat modelul implicit pentru sarcina în cauză, dar puteți alege, de asemenea, un anumit model din Hub pentru a-l utiliza într-un pipeline pentru o sarcină specifică - de exemplu, generarea de text. Accesați [Model Hub](https://huggingface.co/models) și faceți clic pe eticheta corespunzătoare din stânga pentru a afișa numai modelele acceptate pentru sarcina respectivă. Ar trebui să ajungeți la o pagină precum [aceasta](https://huggingface.co/models?pipeline_tag=text-generation).
 
-Să încercăm modelul [`distilgpt2`](https://huggingface.co/distilgpt2)! Iată cum să îl încărcați în același pipeline ca înainte:
+Să încercăm modelul [`distilgpt2`](https://huggingface.co/distilgpt2)! Iată cum să îl puteți încărca în același pipeline ca înainte:
 
 ```python
 from transformers import pipeline
@@ -163,19 +163,19 @@ generator(
                     'time and real'}]
 ```
 
-Puteți să vă îmbunătățiți căutarea unui model făcând clic pe tag-urile de limbaj și să alegeți un model care va genera text în altă limbă. Model Hub conține chiar și puncte de control pentru modele multilingve care acceptă mai multe limbi.
+Puteți să vă îmbunătățiți căutarea unui model făcând clic pe etichetele de limbaj și să alegând un model care să genereze text într-o altă limbă. Model Hub conține chiar și puncte de control pentru modele multilingve care acceptă mai multe limbi.
 
 După ce selectați un model făcând clic pe el, veți vedea că există un widget care vă permite să îl încercați direct online. În acest fel, puteți testa rapid capacitățile modelului înainte de a-l descărca.
 
 <Tip>
 
-✏️ ** Încercați!** Utilizați filtrele pentru a găsi un model de generare a textului pentru o altă limbă. Nu ezitați să vă jucați cu widget-ul și să îl utilizați într-un pipeline!
+✏️ ** Încercați!** Utilizați filtrele pentru a găsi un model de generare a textului pentru o altă limbă. Nu ezitați să explorați widget-ul și să îl utilizați într-un pipeline!
 
 </Tip>
 
 ### API-ul de inferență[[api-ul-de-inferență]]
 
-Toate modelele pot fi testate direct prin browser utilizând API-ul de inferență, care este disponibil pe site-ul Hugging Face [website] (https://huggingface.co/). Vă puteți juca cu modelul direct pe această pagină introducând text personalizat și urmărind cum modelul procesează datele de intrare.
+Toate modelele pot fi testate direct prin browser utilizând API-ul de inferență, care este disponibil pe site-ul Hugging Face [website] (https://huggingface.co/). Puteți interacționa cu modelul direct pe această pagină introducând text personalizat și urmărind cum procesează datele de intrare.
 
 API-ul de inferență care alimentează widget-ul este, de asemenea, disponibil ca produs plătit, ceea ce este util dacă aveți nevoie de el pentru fluxurile dvs. de lucru. Consultați [pagina de prețuri](https://huggingface.co/pricing) pentru mai multe detalii.
 

From fe5d7ff493ceabfad3ad2e51cd6e45c286a43a0a Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Thu, 10 Apr 2025 01:10:46 +0300
Subject: [PATCH 081/167] fix: implement all file 4 chpater 1 rum translation
 suggestions

---
 chapters/rum/chapter1/4.mdx | 10 +++++-----
 1 file changed, 5 insertions(+), 5 deletions(-)

diff --git a/chapters/rum/chapter1/4.mdx b/chapters/rum/chapter1/4.mdx
index 3ae506b4e..865bfaf2c 100644
--- a/chapters/rum/chapter1/4.mdx
+++ b/chapters/rum/chapter1/4.mdx
@@ -16,9 +16,9 @@ Iată câteva puncte de referință în (scurta) istorie a modelelor Transformer
 <img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/transformers_chrono-dark.svg" alt="A brief chronology of Transformers models.">
 </div>
 
-[Arhitectura Transformer](https://arxiv.org/abs/1706.03762) a fost introdusă în iunie 2017. Accentul cercetării inițiale a fost pus pe sarcinile de traducere. Aceasta a fost urmată de introducerea mai multor modele influente, inclusiv:
+[Arhitectura Transformer](https://arxiv.org/abs/1706.03762) a fost introdusă în iunie 2017. Cercetarea inițială s-a concentrat pe sarcinile de traducere. Ulterior, au fost introduse mai multe modele influente, inclusiv:
 
-- **Iunie 2018**: [GPT](https://cdn.openai.com/research-covers/language-unsupervised/language_understanding_paper.pdf), primul model Transformer preinstruit, utilizat pentru fine-tuning a diferitelor sarcini NLP și a obținut rezultate de top
+- **Iunie 2018**: [GPT](https://cdn.openai.com/research-covers/language-unsupervised/language_understanding_paper.pdf), primul model Transformer preinstruit, utilizat pentru fine-tuning-ul diferitor sarcini NLP și a obținut rezultate de top
 
 - **Octombrie 2018**: [BERT](https://arxiv.org/abs/1810.04805), un alt model mare preantrenat, conceput pentru a produce rezumate mai bune ale propozițiilor (mai multe despre el în capitolul următor!)
 
@@ -103,14 +103,14 @@ Această preinstruire se face de obicei pe cantități foarte mari de date. Prin
 * Deoarece modelul preinstruit a fost deja instruit pe o mulțime de date, fine-tuning-ul necesită mult mai puține date pentru a obține rezultate decente.
 * Din același motiv, timpul și resursele necesare pentru a obține rezultate bune sunt mult mai reduse.
 
-De exemplu, se poate valorifica un model preformat antrenat pe limba engleză și apoi ajustat pe un corpus arXiv, rezultând un model bazat pe știință/cercetare. Reglarea fină va necesita doar o cantitate limitată de date: cunoștințele dobândite de modelul pre-format sunt „transferate”, de unde și termenul de *transfer learning*.
+De exemplu, se poate folosi un model preantrenat pe limba engleză și ajustat ulterior pe un corpus arXiv, obținându-se astfel un model adaptat domeniului științific/cercetare. Fine-tuning-ul necesita doar o cantitate limitată de date: cunoștințele dobândite de modelul preantrenat sunt „transferate”, de unde și termenul de *transfer learning*.
 
 <div class="flex justify-center">
 <img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/finetuning.svg" alt="The fine-tuning of a language model is cheaper than pretraining in both time and money.">
 <img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/finetuning-dark.svg" alt="The fine-tuning of a language model is cheaper than pretraining in both time and money.">
 </div>
 
-Prin urmare, reglarea fină a unui model are costuri mai mici de timp, date, financiare și de mediu. De asemenea, este mai rapid și mai ușor să iterați pe diferite scheme de reglaj fin, deoarece formarea este mai puțin constrângătoare decât o preformare completă.
+Prin urmare, reglarea fină a unui model are costuri mai reduse în ceea ce privește timpul, datele, resursele financiare și impactul asupra mediului. De asemenea, este mai rapid și mai ușor să experimentați pe diferite scheme de fine-tuning, deoarece antrenarea este mai puțin constrângătoare decât o preantrenare completă.
 
 Acest proces va obține, de asemenea, rezultate mai bune decât formarea de la zero (cu excepția cazului în care dispuneți de o mulțime de date), motiv pentru care ar trebui să încercați întotdeauna să valorificați un model preformat - unul cât mai apropiat posibil de sarcina pe care o aveți la îndemână - și să îl reglați fin.
 
@@ -152,7 +152,7 @@ Acum, că aveți o idee despre ce sunt attention layers, să analizăm mai înde
 
 ## Arhitectura originală[[arhitectura-originală]
 
-Arhitectura Transformer a fost concepută inițial pentru traducere. În timpul formării, codificatorul primește intrări (propoziții) într-o anumită limbă, în timp ce decodificatorul primește aceleași propoziții în limba țintă dorită. În codificator, attention layets pot utiliza toate cuvintele dintr-o propoziție (deoarece, după cum tocmai am văzut, traducerea unui anumit cuvânt poate depinde de ceea ce se află înainte și după el în propoziție). Cu toate acestea, decodificatorul funcționează secvențial și poate acorda atenție numai cuvintelor din propoziție pe care le-a tradus deja (deci, numai cuvintelor anterioare cuvântului generat în prezent). De exemplu, atunci când am prezis primele trei cuvinte din ținta tradusă, le dăm decodificatorului, care utilizează apoi toate intrările codificatorului pentru a încerca să prezică al patrulea cuvânt.
+Arhitectura Transformer a fost concepută inițial pentru traducere. În timpul formării, codificatorul primește intrări (propoziții) într-o anumită limbă, în timp ce decodificatorul primește aceleași propoziții în limba țintă dorită. În codificator, attention layers pot utiliza toate cuvintele dintr-o propoziție (deoarece, după cum tocmai am văzut, traducerea unui anumit cuvânt poate depinde de ceea ce se află înainte și după el în propoziție). Cu toate acestea, decodificatorul funcționează secvențial și poate acorda atenție numai cuvintelor din propoziție pe care le-a tradus deja (deci, numai cuvintelor anterioare cuvântului generat în prezent). De exemplu, atunci când am prezis primele trei cuvinte din ținta tradusă, le dăm decodificatorului, care utilizează apoi toate intrările codificatorului pentru a încerca să prezică al patrulea cuvânt.
 
 Pentru a accelera lucrurile în timpul formării (atunci când modelul are acces la propozițiile țintă), decodorul primește întreaga țintă, dar nu i se permite să utilizeze cuvintele viitoare (dacă ar avea acces la cuvântul din poziția 2 atunci când încearcă să prezică cuvântul din poziția 2, problema nu ar fi foarte dificilă!) De exemplu, atunci când încearcă să prezică al patrulea cuvânt, stratul de atenție va avea acces doar la cuvintele de la pozițiile 1 și 3.
 

From c61b55a4a4c5c86bae94e5917354ec762eac7658 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Thu, 10 Apr 2025 01:13:06 +0300
Subject: [PATCH 082/167] fix: add all file 8 chpater 8 rum translation
 suggestions

---
 chapters/rum/chapter1/8.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter1/8.mdx b/chapters/rum/chapter1/8.mdx
index ffd5ae473..c7f5b1f65 100644
--- a/chapters/rum/chapter1/8.mdx
+++ b/chapters/rum/chapter1/8.mdx
@@ -28,4 +28,4 @@ print([r["token_str"] for r in result])
 
 Atunci când i se cere să completeze cuvântul care lipsește din aceste două propoziții, modelul dă un singur răspuns fără gen (chelner/ chelneriță). Celelalte sunt ocupații asociate de obicei cu un anumit gen - și da, „prostituată” a ajuns în primele 5 posibilități pe care modelul le asociază cu „femeie” și „muncă”. Acest lucru se întâmplă chiar dacă BERT este unul dintre puținele modele Transformer care nu este construit prin extragerea de date de pe întregul internet, ci mai degrabă folosind date aparent neutre (este antrenat pe seturile de date [English Wikipedia](https://huggingface.co/datasets/wikipedia) și [BookCorpus](https://huggingface.co/datasets/bookcorpus)). 
 
-Prin urmare, atunci când utilizați aceste instrumente, trebuie să aveți în minte faptul că modelul original pe care îl utilizați ar putea genera foarte ușor conținut sexist, rasist sau homofob. Reglarea fină a modelului pe baza datelor dumneavoastră nu va face ca această prejudecată intrinsecă să dispară.
\ No newline at end of file
+Prin urmare, atunci când utilizați aceste instrumente, este important să conștientizați că modelul original pe care îl utilizați ar putea genera cu ușurință conținut sexist, rasist sau homofob. Reglarea fină a modelului pe baza datelor dumneavoastră nu va elimina această prejudecată intrinsecă.
\ No newline at end of file

From 98f2e13664d7338fece1b4ad60ef5503af5bb675 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Thu, 10 Apr 2025 01:16:16 +0300
Subject: [PATCH 083/167] fix: add changes from file 9 chapter 1 translation
 rum version

---
 chapters/rum/chapter1/9.mdx | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/chapters/rum/chapter1/9.mdx b/chapters/rum/chapter1/9.mdx
index 3c322abb1..25719ec70 100644
--- a/chapters/rum/chapter1/9.mdx
+++ b/chapters/rum/chapter1/9.mdx
@@ -5,9 +5,9 @@
     classNames="absolute z-10 right-0 top-0"
 />
 
-În acest capitol, ați văzut cum să abordați diferite sarcini NLP utilizând funcția de nivel înalt `pipeline()` din 🤗 Transformers. De asemenea, ați văzut cum să căutați și să utilizați modele în Hub, precum și cum să utilizați API-ul de inferență pentru a testa modelele direct în browser.
+În acest capitol, ați învățat cum să abordați diferite sarcini NLP utilizând funcția `pipeline()` de nivel înalt din 🤗 Transformers. De asemenea, ați descoperit cum să căutați și să utilizați modele în Hub, precum și cum să testați acestee modelee direct în browser folosind API-ul de inferență.
 
-Am discutat despre modul în care funcționează modelele Transformer la un nivel general și am vorbit despre importanța la transfer learning și fine-tuning. Un aspect cheie este faptul că puteți utiliza întreaga arhitectură sau doar encoder-ul sau decoder-ul, în funcție de tipul de sarcină pe care doriți să o rezolvați. Următorul tabel rezumă acest aspect:
+Am discutat despre modul în care funcționează modelele Transformer dintr-o perspectivă generală și despre importanța transfer learning-ului și fine-tuning-ului. Un aspect cheie este faptul că puteți utiliza întreaga arhitectură sau doar encoder-ul sau decoder-ul, în funcție de tipul de sarcină pe care doriți să o rezolvați. Următorul tabel rezumă acest aspect:
 
 | Model           | Exemple                                    | Task-uri                                                                           |
 |-----------------|--------------------------------------------|----------------------------------------------------------------------------------|

From 10459c86bbe97a721f610760253f98f83eaa2687 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Thu, 10 Apr 2025 01:19:45 +0300
Subject: [PATCH 084/167] fix: add quiz translation

---
 chapters/rum/chapter1/10.mdx | 130 +++++++++++++++++------------------
 1 file changed, 65 insertions(+), 65 deletions(-)

diff --git a/chapters/rum/chapter1/10.mdx b/chapters/rum/chapter1/10.mdx
index cae6edb46..4a5ff081f 100644
--- a/chapters/rum/chapter1/10.mdx
+++ b/chapters/rum/chapter1/10.mdx
@@ -18,17 +18,17 @@ Mai întâi, însă, să testăm ceea ce ați învățat în acest capitol!
 <Question
 	choices={[
 		{
-			text: "Summarization",
-			explain: "Look again on the <a href=\"https://huggingface.co/roberta-large-mnli\">roberta-large-mnli page</a>."
+			text: "Sumarizare",
+			explain: "Uitați-vă din nou pe pagina <a href=\"https://huggingface.co/roberta-large-mnli\">roberta-large-mnli</a>."
 		},
 		{
-			text: "Text classification",
-			explain: "More precisely, it classifies if two sentences are logically linked across three labels (contradiction, neutral, entailment) — a task also called <em>natural language inference</em>.",
+			text: "Clasificare de text",
+			explain: "Mai precis, clasifică dacă două propoziții sunt legate logic folosind trei etichete (contradicție, neutru, implicație) — o sarcină numită și <em>inferență în limbaj natural</em>.",
 			correct: true
 		},
 		{
-			text: "Text generation",
-			explain: "Look again on the <a href=\"https://huggingface.co/roberta-large-mnli\">roberta-large-mnli page</a>."
+			text: "Generare de text",
+			explain: "Uitați-vă din nou pe pagina <a href=\"https://huggingface.co/roberta-large-mnli\">roberta-large-mnli</a>."
 		}
 	]}
 />
@@ -45,16 +45,16 @@ ner("My name is Sylvain and I work at Hugging Face in Brooklyn.")
 <Question
 	choices={[
 		{
-			text: "It will return classification scores for this sentence, with labels \"positive\" or \"negative\".",
-			explain: "This is incorrect — this would be a <code>sentiment-analysis</code> pipeline."
+			text: "Va returna scoruri de clasificare pentru această propoziție, cu etichetele \"pozitiv\" sau \"negativ\".",
+			explain: "Aceasta este incorect — acesta ar fi un pipeline de <code>sentiment-analysis</code>."
 		},
 		{
-			text: "It will return a generated text completing this sentence.",
-			explain: "This is incorrect — it would be a <code>text-generation</code> pipeline.",
+			text: "Va returna un text generat care completează această propoziție.",
+			explain: "Aceasta este incorect — ar fi un pipeline de <code>text-generation</code>.",
 		},
 		{
-			text: "It will return the words representing persons, organizations or locations.",
-			explain: "Furthermore, with <code>grouped_entities=True</code>, it will group together the words belonging to the same entity, like \"Hugging Face\".",
+			text: "Va returna cuvintele care reprezintă persoane, organizații sau locații.",
+			explain: "În plus, cu <code>grouped_entities=True</code>, va grupa împreună cuvintele care aparțin aceleiași entități, precum \"Hugging Face\".",
 			correct: true
 		}
 	]}
@@ -73,16 +73,16 @@ result = filler("...")
 	choices={[
 		{
 			text: "This &#60;mask> has been waiting for you.",
-			explain: "This is incorrect. Check out the <code>bert-base-cased</code> model card and try to spot your mistake."
+			explain: "Aceasta este incorect. Verificați cardul modelului <code>bert-base-cased</code> și încercați să identificați greșeala."
 		},
 		{
 			text: "This [MASK] has been waiting for you.",
-			explain: "Correct! This model's mask token is [MASK].",
+			explain: "Corect! Token-ul de mască al acestui model este [MASK].",
 			correct: true
 		},
 		{
 			text: "This man has been waiting for you.",
-			explain: "This is incorrect. This pipeline fills in masked words, so it needs a mask token somewhere."
+			explain: "Aceasta este incorect. Acest pipeline completează cuvinte mascate, deci are nevoie de un token de mască undeva."
 		}
 	]}
 />
@@ -99,41 +99,41 @@ result = classifier("This is a course about the Transformers library")
 <Question
 	choices={[
 		{
-			text: "This pipeline requires that labels be given to classify this text.",
-			explain: "Right — the correct code needs to include <code>candidate_labels=[...]</code>.",
+			text: "Acest pipeline necesită să fie furnizate etichete pentru a clasifica acest text.",
+			explain: "Corect — codul corect trebuie să includă <code>candidate_labels=[...]</code>.",
 			correct: true
 		},
 		{
-			text: "This pipeline requires several sentences, not just one.",
-			explain: "This is incorrect, though when properly used, this pipeline can take a list of sentences to process (like all other pipelines)."
+			text: "Acest pipeline necesită mai multe propoziții, nu doar una.",
+			explain: "Aceasta este incorect, deși atunci când este utilizat corespunzător, acest pipeline poate primi o listă de propoziții de procesat (ca toate celelalte pipeline-uri)."
 		},
 		{
-			text: "The 🤗 Transformers library is broken, as usual.",
-			explain: "We won't dignify this answer with a comment!"
+			text: "Biblioteca 🤗 Transformers este defectă, ca de obicei.",
+			explain: "Nu vom onora acest răspuns cu un comentariu!"
 		},
 		{
-			text: "This pipeline requires longer inputs; this one is too short.",
-			explain: "This is incorrect. Note that a very long text will be truncated when processed by this pipeline."
+			text: "Acest pipeline necesită intrări mai lungi; aceasta este prea scurtă.",
+			explain: "Aceasta este incorect. Rețineți că un text foarte lung va fi trunchiat atunci când este procesat de acest pipeline."
 		}
 	]}
 />
 
-### 5. Ce înseamnă „transfer learning”?
+### 5. Ce înseamnă „transfer learning"?
 
 <Question
 	choices={[
 		{
-			text: "Transferring the knowledge of a pretrained model to a new model by training it on the same dataset.",
-			explain: "No, that would be two versions of the same model."
+			text: "Transferul cunoștințelor unui model preantrenat către un model nou prin antrenarea acestuia pe același set de date.",
+			explain: "Nu, aceasta ar însemna două versiuni ale aceluiași model."
 		},
 		{
-			text: "Transferring the knowledge of a pretrained model to a new model by initializing the second model with the first model's weights.",
-			explain: "Correct: when the second model is trained on a new task, it *transfers* the knowledge of the first model.",
+			text: "Transferul cunoștințelor unui model preantrenat către un model nou prin inițializarea celui de-al doilea model cu ponderile primului model.",
+			explain: "Corect: când al doilea model este antrenat pe o nouă sarcină, acesta *transferă* cunoștințele primului model.",
 			correct: true
 		},
 		{
-			text: "Transferring the knowledge of a pretrained model to a new model by building the second model with the same architecture as the first model.",
-			explain: "The architecture is just the way the model is built; there is no knowledge shared or transferred in this case."
+			text: "Transferul cunoștințelor unui model preantrenat către un model nou prin construirea celui de-al doilea model cu aceeași arhitectură ca primul model.",
+			explain: "Arhitectura este doar modul în care este construit modelul; nu există cunoștințe împărtășite sau transferate în acest caz."
 		}
 	]}
 />
@@ -143,32 +143,32 @@ result = classifier("This is a course about the Transformers library")
 <Question
 	choices={[
 		{
-			text: "True",
-			explain: "The pretraining is usually <em>self-supervised</em>, which means the labels are created automatically from the inputs (like predicting the next word or filling in some masked words).",
+			text: "Adevărat",
+			explain: "Preantrenarea este de obicei <em>auto-supervizată</em>, ceea ce înseamnă că etichetele sunt create automat din intrări (cum ar fi prezicerea următorului cuvânt sau completarea unor cuvinte mascate).",
 			correct: true
 		},
 		{
-			text: "False",
-			explain: "Incorrect."
+			text: "Fals",
+			explain: "Incorect."
 		}
 	]}
 />
 
-### 7. Selectați propoziția care descrie cel mai bine termenii „model”, „arhitectură” și „ greutăți”.
+### 7. Selectați propoziția care descrie cel mai bine termenii „model", „arhitectură" și „greutăți".
 
 <Question
 	choices={[
 		{
-			text: "If a model is a building, its architecture is the blueprint and the weights are the people living inside.",
-			explain: "Following this metaphor, the weights would be the bricks and other materials used to construct the building."
+			text: "Dacă un model este o clădire, arhitectura sa este planul și greutățile sunt oamenii care locuiesc în interior.",
+			explain: "Urmând această metaforă, greutățile ar fi cărămizile și alte materiale utilizate pentru construirea clădirii."
 		},
 		{
-			text: "An architecture is a map to build a model and its weights are the cities represented on the map.",
-			explain: "The problem with this metaphor is that a map usually represents one existing reality (there is only one city in France named Paris). For a given architecture, multiple weights are possible."
+			text: "O arhitectură este o hartă pentru a construi un model, iar greutățile sale sunt orașele reprezentate pe hartă.",
+			explain: "Problema cu această metaforă este că o hartă reprezintă de obicei o realitate existentă (există doar un singur oraș în Franța numit Paris). Pentru o arhitectură dată, sunt posibile multiple greutăți."
 		},
 		{
-			text: "An architecture is a succession of mathematical functions to build a model and its weights are those functions parameters.",
-			explain: "The same set of mathematical functions (architecture) can be used to build different models by using different parameters (weights).",
+			text: "O arhitectură este o succesiune de funcții matematice pentru a construi un model, iar greutățile sale sunt parametrii acelor funcții.",
+			explain: "Același set de funcții matematice (arhitectură) poate fi utilizat pentru a construi modele diferite prin utilizarea unor parametri diferiți (greutăți).",
 			correct: true
 		}
 	]}
@@ -180,17 +180,17 @@ result = classifier("This is a course about the Transformers library")
 <Question
 	choices={[
 		{
-			text: "An encoder model",
-			explain: "An encoder model generates a representation of the whole sentence that is better suited for tasks like classification."
+			text: "Un model encoder",
+			explain: "Un model encoder generează o reprezentare a întregii propoziții care este mai potrivită pentru sarcini precum clasificarea."
 		},
 		{
-			text: "A decoder model",
-			explain: "Decoder models are perfectly suited for text generation from a prompt.",
+			text: "Un model decoder",
+			explain: "Modelele decoder sunt perfect potrivite pentru generarea de text din prompt-uri.",
 			correct: true
 		},
 		{
-			text: "A sequence-to-sequence model",
-			explain: "Sequence-to-sequence models are better suited for tasks where you want to generate sentences in relation to the input sentences, not a given prompt."
+			text: "Un model sequence-to-sequence",
+			explain: "Modelele sequence-to-sequence sunt mai potrivite pentru sarcini în care doriți să generați propoziții în relație cu propozițiile de intrare, nu cu un prompt dat."
 		}
 	]}
 />
@@ -200,16 +200,16 @@ result = classifier("This is a course about the Transformers library")
 <Question
 	choices={[
 		{
-			text: "An encoder model",
-			explain: "An encoder model generates a representation of the whole sentence that is better suited for tasks like classification."
+			text: "Un model encoder",
+			explain: "Un model encoder generează o reprezentare a întregii propoziții care este mai potrivită pentru sarcini precum clasificarea."
 		},
 		{
-			text: "A decoder model",
-			explain: "Decoder models are good for generating output text (like summaries), but they don't have the ability to exploit a context like the whole text to summarize."
+			text: "Un model decoder",
+			explain: "Modelele decoder sunt bune pentru generarea de text de ieșire (cum ar fi rezumatele), dar nu au capacitatea de a exploata un context precum întregul text de rezumat."
 		},
 		{
-			text: "A sequence-to-sequence model",
-			explain: "Sequence-to-sequence models are perfectly suited for a summarization task.",
+			text: "Un model sequence-to-sequence",
+			explain: "Modelele sequence-to-sequence sunt perfect potrivite pentru o sarcină de sumarizare.",
 			correct: true
 		}
 	]}
@@ -220,17 +220,17 @@ result = classifier("This is a course about the Transformers library")
 <Question
 	choices={[
 		{
-			text: "An encoder model",
-			explain: "An encoder model generates a representation of the whole sentence which is perfectly suited for a task like classification.",
+			text: "Un model encoder",
+			explain: "Un model encoder generează o reprezentare a întregii propoziții care este perfect potrivită pentru o sarcină precum clasificarea.",
 			correct: true
 		},
 		{
-			text: "A decoder model",
-			explain: "Decoder models are good for generating output texts, not extracting a label out of a sentence."
+			text: "Un model decoder",
+			explain: "Modelele decoder sunt bune pentru generarea de texte de ieșire, nu pentru extragerea unei etichete dintr-o propoziție."
 		},
 		{
-			text: "A sequence-to-sequence model",
-			explain: "Sequence-to-sequence models are better suited for tasks where you want to generate text based on an input sentence, not a label.",
+			text: "Un model sequence-to-sequence",
+			explain: "Modelele sequence-to-sequence sunt mai potrivite pentru sarcini în care doriți să generați text bazat pe o propoziție de intrare, nu o etichetă.",
 		}
 	]}
 />
@@ -240,18 +240,18 @@ result = classifier("This is a course about the Transformers library")
 <Question
 	choices={[
 		{
-			text: "The model is a fine-tuned version of a pretrained model and it picked up its bias from it.",
-			explain: "When applying Transfer Learning, the bias in the pretrained model used persists in the fine-tuned model.",
+			text: "Modelul este o versiune fine-tuned a unui model preantrenat și a preluat prejudecata de la acesta.",
+			explain: "Când aplicați Transfer Learning, prejudecata din modelul preantrenat utilizat persistă în modelul fine-tuned.",
 			correct: true
 		},
 		{
-			text: "The data the model was trained on is biased.",
-			explain: "This is the most obvious source of bias, but not the only one.",
+			text: "Datele pe care a fost antrenat modelul sunt părtinitoare.",
+			explain: "Aceasta este cea mai evidentă sursă de prejudecată, dar nu singura.",
 			correct: true
 		},
 		{
-			text: "The metric the model was optimizing for is biased.",
-			explain: "A less obvious source of bias is the way the model is trained. Your model will blindly optimize for whatever metric you chose, without any second thoughts.",
+			text: "Metrica pe care modelul o optimiza este părtinitoare.",
+			explain: "O sursă mai puțin evidentă de prejudecată este modul în care modelul este antrenat. Modelul dvs. va optimiza orb pentru orice metrică ați ales, fără alte considerații.",
 			correct: true
 		}
 	]}

From 8cee453260c7791589603b4efd2b6d1312bbfc6c Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Thu, 10 Apr 2025 01:22:26 +0300
Subject: [PATCH 085/167] fix: commit content script formatted content

---
 chapters/rum/chapter1/3.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter1/3.mdx b/chapters/rum/chapter1/3.mdx
index 8132f4eb8..f5d890f1e 100644
--- a/chapters/rum/chapter1/3.mdx
+++ b/chapters/rum/chapter1/3.mdx
@@ -266,7 +266,7 @@ from transformers import pipeline
 
 summarizer = pipeline("summarization")
 summarizer(
-      """
+    """
     America has changed dramatically during recent years. Not only has the number of 
     graduates in traditional engineering disciplines such as mechanical, civil, 
     electrical, chemical, and aeronautical engineering declined, but in most of 

From e341a08ecd4eafabe92d001c51d34df5ce8e5dfc Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Thu, 10 Apr 2025 01:31:25 +0300
Subject: [PATCH 086/167] fix: update the toctree yml

---
 chapters/rum/_toctree.yml | 24 ++++++++++++++++++++++++
 1 file changed, 24 insertions(+)

diff --git a/chapters/rum/_toctree.yml b/chapters/rum/_toctree.yml
index bb40acb8b..25730606c 100644
--- a/chapters/rum/_toctree.yml
+++ b/chapters/rum/_toctree.yml
@@ -2,3 +2,27 @@
   sections:
   - local: chapter0/1
     title: Introducere
+
+- title: 1. Modele Transformer
+  sections:
+  - local: chapter1/1
+    title: Introducere
+  - local: chapter1/2
+    title: Procesarea limbajului natural și modelele de limbaj mari
+  - local: chapter1/3
+    title: Transformers, ce pot face?
+  - local: chapter1/4
+    title: Cum funcționează Transformers?
+  - local: chapter1/5
+    title: Modele Encoder
+  - local: chapter1/6
+    title: Modele Decoder
+  - local: chapter1/7
+    title: Modele secvență-la-secvență
+  - local: chapter1/8
+    title: Prejudecăți și limitări
+  - local: chapter1/9
+    title: Rezumat
+  - local: chapter1/10
+    title: Quiz de final de capitol
+    quiz: 1

From 901847b92c7d82590b56fd51aeed5b0eafa39c17 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Thu, 10 Apr 2025 01:47:43 +0300
Subject: [PATCH 087/167] feat: add work in progress on README

---
 README.md | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/README.md b/README.md
index e8b6311fb..0ff979041 100644
--- a/README.md
+++ b/README.md
@@ -26,7 +26,7 @@ This repo contains the content that's used to create the **[Hugging Face course]
 | [Vietnamese](https://huggingface.co/course/vi/chapter1/1)               | [`chapters/vi`](https://github.com/huggingface/course/tree/main/chapters/vi)       | [@honghanhh](https://github.com/honghanhh)                                                                                                                                                                                                                                                                                                               |
 | [Chinese (simplified)](https://huggingface.co/course/zh-CN/chapter1/1)  | [`chapters/zh-CN`](https://github.com/huggingface/course/tree/main/chapters/zh-CN) | [@zhlhyx](https://github.com/zhlhyx), [petrichor1122](https://github.com/petrichor1122), [@1375626371](https://github.com/1375626371)                                                                                                                                                                                                                    |
 | [Chinese (traditional)](https://huggingface.co/course/zh-TW/chapter1/1) (WIP) | [`chapters/zh-TW`](https://github.com/huggingface/course/tree/main/chapters/zh-TW) | [@davidpeng86](https://github.com/davidpeng86)                                                                                                                                                                                                                                                                                                           |
-
+| [Romanian](https://huggingface.co/course/rum/chapter1/1) (WIP) | [`chapters/rum`](https://github.com/huggingface/course/tree/main/chapters/rum) | [@Sigmoid](https://github.com/SigmoidAI), [@eduard-balamatiuc](https://github.com/eduard-balamatiuc), [@FriptuLudmila](https://github.com/FriptuLudmila), [@tokyo-s](https://github.com/tokyo-s), [@hbkdesign](https://github.com/hbkdesign)                                                                                                                                                                                                                                                                                                             |
 
 ### Translating the course into your language
 

From fdbc85f0443e60c31168143e4b73bf03ea2a5cf0 Mon Sep 17 00:00:00 2001
From: burtenshaw <ben.burtenshaw@gmail.com>
Date: Mon, 5 May 2025 09:45:22 +0200
Subject: [PATCH 088/167] remove tensforflow from existing material

---
 chapters/en/chapter2/1.mdx |   2 +-
 chapters/en/chapter2/2.mdx | 122 +---------------
 chapters/en/chapter2/3.mdx | 285 +++++++++++++++++++++----------------
 chapters/en/chapter2/4.mdx |  19 ---
 chapters/en/chapter2/5.mdx | 132 -----------------
 chapters/en/chapter2/6.mdx |  33 +----
 chapters/en/chapter2/8.mdx |  58 --------
 7 files changed, 170 insertions(+), 481 deletions(-)

diff --git a/chapters/en/chapter2/1.mdx b/chapters/en/chapter2/1.mdx
index 16347ca94..70e290a9d 100644
--- a/chapters/en/chapter2/1.mdx
+++ b/chapters/en/chapter2/1.mdx
@@ -10,7 +10,7 @@ As you saw in [Chapter 1](/course/chapter1), Transformer models are usually very
 The 🤗 Transformers library was created to solve this problem. Its goal is to provide a single API through which any Transformer model can be loaded, trained, and saved. The library's main features are:
 
 - **Ease of use**: Downloading, loading, and using a state-of-the-art NLP model for inference can be done in just two lines of code.
-- **Flexibility**: At their core, all models are simple PyTorch `nn.Module` or TensorFlow `tf.keras.Model` classes and can be handled like any other models in their respective machine learning (ML) frameworks.
+- **Flexibility**: At their core, all models are simple PyTorch `nn.Module` classes and can be handled like any other models in their respective machine learning (ML) frameworks.
 - **Simplicity**: Hardly any abstractions are made across the library. The "All in one file" is a core concept: a model's forward pass is entirely defined in a single file, so that the code itself is understandable and hackable.
 
 This last feature makes 🤗 Transformers quite different from other ML libraries. The models are not built on modules 
diff --git a/chapters/en/chapter2/2.mdx b/chapters/en/chapter2/2.mdx
index 2a35669d7..205e07e51 100644
--- a/chapters/en/chapter2/2.mdx
+++ b/chapters/en/chapter2/2.mdx
@@ -2,8 +2,6 @@
 
 # Behind the pipeline[[behind-the-pipeline]]
 
-{#if fw === 'pt'}
-
 <CourseFloatingBanner chapter={2}
   classNames="absolute z-10 right-0 top-0"
   notebooks={[
@@ -11,26 +9,7 @@
     {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section2_pt.ipynb"},
 ]} />
 
-{:else}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section2_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section2_tf.ipynb"},
-]} />
-
-{/if}
-
-<Tip>
-This is the first section where the content is slightly different depending on whether you use PyTorch or TensorFlow. Toggle the switch on top of the title to select the platform you prefer!
-</Tip>
-
-{#if fw === 'pt'}
 <Youtube id="1pedAIvTWXk"/>
-{:else}
-<Youtube id="wVN12smEvqg"/>
-{/if}
 
 Let's start with a complete example, taking a look at what happened behind the scenes when we executed the following code in [Chapter 1](/course/chapter1):
 
@@ -83,11 +62,10 @@ tokenizer = AutoTokenizer.from_pretrained(checkpoint)
 
 Once we have the tokenizer, we can directly pass our sentences to it and we'll get back a dictionary that's ready to feed to our model! The only thing left to do is to convert the list of input IDs to tensors.
 
-You can use 🤗 Transformers without having to worry about which ML framework is used as a backend; it might be PyTorch or TensorFlow, or Flax for some models. However, Transformer models only accept *tensors* as input. If this is your first time hearing about tensors, you can think of them as NumPy arrays instead. A NumPy array can be a scalar (0D), a vector (1D), a matrix (2D), or have more dimensions. It's effectively a tensor; other ML frameworks' tensors behave similarly, and are usually as simple to instantiate as NumPy arrays.
+You can use 🤗 Transformers without having to worry about which ML framework is used as a backend; it might be PyTorch or Flax for some models. However, Transformer models only accept *tensors* as input. If this is your first time hearing about tensors, you can think of them as NumPy arrays instead. A NumPy array can be a scalar (0D), a vector (1D), a matrix (2D), or have more dimensions. It's effectively a tensor; other ML frameworks' tensors behave similarly, and are usually as simple to instantiate as NumPy arrays.
 
-To specify the type of tensors we want to get back (PyTorch, TensorFlow, or plain NumPy), we use the `return_tensors` argument:
+To specify the type of tensors we want to get back (PyTorch or plain NumPy), we use the `return_tensors` argument:
 
-{#if fw === 'pt'}
 ```python
 raw_inputs = [
     "I've been waiting for a HuggingFace course my whole life.",
@@ -96,21 +74,9 @@ raw_inputs = [
 inputs = tokenizer(raw_inputs, padding=True, truncation=True, return_tensors="pt")
 print(inputs)
 ```
-{:else}
-```python
-raw_inputs = [
-    "I've been waiting for a HuggingFace course my whole life.",
-    "I hate this so much!",
-]
-inputs = tokenizer(raw_inputs, padding=True, truncation=True, return_tensors="tf")
-print(inputs)
-```
-{/if}
 
 Don't worry about padding and truncation just yet; we'll explain those later. The main things to remember here are that you can pass one sentence or a list of sentences, as well as specifying the type of tensors you want to get back (if no type is passed, you will get a list of lists as a result).
 
-{#if fw === 'pt'}
-
 Here's what the results look like as PyTorch tensors:
 
 ```python out
@@ -125,31 +91,11 @@ Here's what the results look like as PyTorch tensors:
     ])
 }
 ```
-{:else}
-
-Here's what the results look like as TensorFlow tensors:
-
-```python out
-{
-    'input_ids': <tf.Tensor: shape=(2, 16), dtype=int32, numpy=
-        array([
-            [  101,  1045,  1005,  2310,  2042,  3403,  2005,  1037, 17662, 12172,  2607,  2026,  2878,  2166,  1012,   102],
-            [  101,  1045,  5223,  2023,  2061,  2172,   999,   102,     0,     0,     0,     0,     0,     0,     0,     0]
-        ], dtype=int32)>, 
-    'attention_mask': <tf.Tensor: shape=(2, 16), dtype=int32, numpy=
-        array([
-            [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
-            [1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0]
-        ], dtype=int32)>
-}
-```
-{/if}
 
 The output itself is a dictionary containing two keys, `input_ids` and `attention_mask`. `input_ids` contains two rows of integers (one for each sentence) that are the unique identifiers of the tokens in each sentence. We'll explain what the `attention_mask` is later in this chapter. 
 
 ## Going through the model[[going-through-the-model]]
 
-{#if fw === 'pt'}
 We can download our pretrained model the same way we did with our tokenizer. 🤗 Transformers provides an `AutoModel` class which also has a `from_pretrained()` method:
 
 ```python
@@ -158,16 +104,6 @@ from transformers import AutoModel
 checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
 model = AutoModel.from_pretrained(checkpoint)
 ```
-{:else}
-We can download our pretrained model the same way we did with our tokenizer. 🤗 Transformers provides an `TFAutoModel` class which also has a `from_pretrained` method:
-
-```python
-from transformers import TFAutoModel
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-model = TFAutoModel.from_pretrained(checkpoint)
-```
-{/if}
 
 In this code snippet, we have downloaded the same checkpoint we used in our pipeline before (it should actually have been cached already) and instantiated a model with it.
 
@@ -189,7 +125,6 @@ It is said to be "high dimensional" because of the last value. The hidden size c
 
 We can see this if we feed the inputs we preprocessed to our model:
 
-{#if fw === 'pt'}
 ```python
 outputs = model(**inputs)
 print(outputs.last_hidden_state.shape)
@@ -198,16 +133,6 @@ print(outputs.last_hidden_state.shape)
 ```python out
 torch.Size([2, 16, 768])
 ```
-{:else}
-```py
-outputs = model(inputs)
-print(outputs.last_hidden_state.shape)
-```
-
-```python out
-(2, 16, 768)
-```
-{/if}
 
 Note that the outputs of 🤗 Transformers models behave like `namedtuple`s or dictionaries. You can access the elements by attributes (like we did) or by key (`outputs["last_hidden_state"]`), or even by index if you know exactly where the thing you are looking for is (`outputs[0]`).
 
@@ -235,7 +160,6 @@ There are many different architectures available in 🤗 Transformers, with each
 - `*ForTokenClassification`
 - and others 🤗
 
-{#if fw === 'pt'}
 For our example, we will need a model with a sequence classification head (to be able to classify the sentences as positive or negative). So, we won't actually use the `AutoModel` class, but `AutoModelForSequenceClassification`:
 
 ```python
@@ -245,17 +169,6 @@ checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
 model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
 outputs = model(**inputs)
 ```
-{:else}
-For our example, we will need a model with a sequence classification head (to be able to classify the sentences as positive or negative). So, we won't actually use the `TFAutoModel` class, but `TFAutoModelForSequenceClassification`:
-
-```python
-from transformers import TFAutoModelForSequenceClassification
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint)
-outputs = model(inputs)
-```
-{/if}
 
 Now if we look at the shape of our outputs, the dimensionality will be much lower: the model head takes as input the high-dimensional vectors we saw before, and outputs vectors containing two values (one per label):
 
@@ -263,15 +176,9 @@ Now if we look at the shape of our outputs, the dimensionality will be much lowe
 print(outputs.logits.shape)
 ```
 
-{#if fw === 'pt'}
 ```python out
 torch.Size([2, 2])
 ```
-{:else}
-```python out
-(2, 2)
-```
-{/if}
 
 Since we have just two sentences and two labels, the result we get from our model is of shape 2 x 2.
 
@@ -283,49 +190,24 @@ The values we get as output from our model don't necessarily make sense by thems
 print(outputs.logits)
 ```
 
-{#if fw === 'pt'}
 ```python out
 tensor([[-1.5607,  1.6123],
         [ 4.1692, -3.3464]], grad_fn=<AddmmBackward>)
 ```
-{:else}
-```python out
-<tf.Tensor: shape=(2, 2), dtype=float32, numpy=
-    array([[-1.5606991,  1.6122842],
-           [ 4.169231 , -3.3464472]], dtype=float32)>
-```
-{/if}
 
 Our model predicted `[-1.5607, 1.6123]` for the first sentence and `[ 4.1692, -3.3464]` for the second one. Those are not probabilities but *logits*, the raw, unnormalized scores outputted by the last layer of the model. To be converted to probabilities, they need to go through a [SoftMax](https://en.wikipedia.org/wiki/Softmax_function) layer (all 🤗 Transformers models output the logits, as the loss function for training will generally fuse the last activation function, such as SoftMax, with the actual loss function, such as cross entropy):
 
-{#if fw === 'pt'}
 ```py
 import torch
 
 predictions = torch.nn.functional.softmax(outputs.logits, dim=-1)
 print(predictions)
 ```
-{:else}
-```py
-import tensorflow as tf
-
-predictions = tf.math.softmax(outputs.logits, axis=-1)
-print(predictions)
-```
-{/if}
 
-{#if fw === 'pt'}
 ```python out
 tensor([[4.0195e-02, 9.5980e-01],
         [9.9946e-01, 5.4418e-04]], grad_fn=<SoftmaxBackward>)
 ```
-{:else}
-```python out
-tf.Tensor(
-[[4.01951671e-02 9.59804833e-01]
- [9.9945587e-01 5.4418424e-04]], shape=(2, 2), dtype=float32)
-```
-{/if}
 
 Now we can see that the model predicted `[0.0402, 0.9598]` for the first sentence and `[0.9995,  0.0005]` for the second one. These are recognizable probability scores.
 
diff --git a/chapters/en/chapter2/3.mdx b/chapters/en/chapter2/3.mdx
index acc653704..67fca8215 100644
--- a/chapters/en/chapter2/3.mdx
+++ b/chapters/en/chapter2/3.mdx
@@ -1,8 +1,6 @@
 <FrameworkSwitchCourse {fw} />
 
-# Models[[models]]
-
-{#if fw === 'pt'}
+# Models[[the-models]]
 
 <CourseFloatingBanner chapter={2}
   classNames="absolute z-10 right-0 top-0"
@@ -11,210 +9,259 @@
     {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section3_pt.ipynb"},
 ]} />
 
-{:else}
+<Youtube id="AhChOFRegn4"/>
 
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section3_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section3_tf.ipynb"},
-]} />
+In this section, we'll take a closer look at creating and using models. We'll use the `AutoModel` class, which is handy when you want to instantiate any model from a checkpoint.
 
-{/if}
+## Creating a Transformer[[creating-a-transformer]]
 
-{#if fw === 'pt'}
-<Youtube id="AhChOFRegn4"/>
-{:else}
-<Youtube id="d3JVgghSOew"/>
-{/if}
+Let's begin by examining what happens when we instantiate an `AutoModel`:
 
-{#if fw === 'pt'}
-In this section we'll take a closer look at creating and using a model. We'll use the `AutoModel` class, which is handy when you want to instantiate any model from a checkpoint.
+```py
+from transformers import AutoModel
 
-The `AutoModel` class and all of its relatives are actually simple wrappers over the wide variety of models available in the library. It's a clever wrapper as it can automatically guess the appropriate model architecture for your checkpoint, and then instantiates a model with this architecture.
+model = AutoModel.from_pretrained("bert-base-cased")
+```
 
-{:else}
-In this section we'll take a closer look at creating and using a model. We'll use the `TFAutoModel` class, which is handy when you want to instantiate any model from a checkpoint.
+Similar to the tokenizer, the `from_pretrained()` method will download and cache the model data from the Hugging Face Hub. As mentioned previously, the checkpoint name corresponds to a specific model architecture and weights, in this case a BERT model with a basic architecture (12 layers, 768 hidden size, 12 attention heads) and cased inputs (meaning that the uppercase/lowercase distinction is important). There are many checkpoints available on the Hub — you can explore them [here](https://huggingface.co/models).
 
-The `TFAutoModel` class and all of its relatives are actually simple wrappers over the wide variety of models available in the library. It's a clever wrapper as it can automatically guess the appropriate model architecture for your checkpoint, and then instantiates a model with this architecture.
+The `AutoModel` class and its associates are actually simple wrappers designed to fetch the appropriate model architecture for a given checkpoint. It's an "auto" class meaning it will guess the appropriate model architecture for you and instantiate the correct model class. However, if you know the type of model you want to use, you can use the class that defines its architecture directly:
 
-{/if}
+```py
+from transformers import BertModel
 
-However, if you know the type of model you want to use, you can use the class that defines its architecture directly. Let's take a look at how this works with a BERT model.
+model = BertModel.from_pretrained("bert-base-cased")
+```
 
-## Creating a Transformer[[creating-a-transformer]]
+## Loading and saving[[loading-and-saving]]
 
-The first thing we'll need to do to initialize a BERT model is load a configuration object:
+Saving a model is as simple as saving a tokenizer. In fact, the models actually have the same `save_pretrained()` method, which saves the model's weights and architecture configuration:
 
-{#if fw === 'pt'}
 ```py
-from transformers import BertConfig, BertModel
+model.save_pretrained("directory_on_my_computer")
+```
 
-# Building the config
-config = BertConfig()
+This will save two files to your disk:
 
-# Building the model from the config
-model = BertModel(config)
 ```
-{:else}
+ls directory_on_my_computer
+
+config.json pytorch_model.bin
+```
+
+If you look inside the *config.json* file, you'll see all the necessary attributes needed to build the model architecture. This file also contains some metadata, such as where the checkpoint originated and what 🤗 Transformers version you were using when you last saved the checkpoint.
+
+The *pytorch_model.bin* file is known as the state dictionary; it contains all your model's weights. The two files work together: the configuration file is needed to know about the model architecture, while the model weights are the parameters of the model.
+
+To reuse a saved model, use the `from_pretrained()` method again:
+
 ```py
-from transformers import BertConfig, TFBertModel
+from transformers import AutoModel
+
+model = AutoModel.from_pretrained("directory_on_my_computer")
+```
+
+A wonderful feature of the 🤗 Transformers library is the ability to easily share models and tokenizers with the community. To do this, make sure you have an account on [Hugging Face](https://huggingface.co). If you're using a notebook, you can easily log in with this:
 
-# Building the config
-config = BertConfig()
+```python
+from huggingface_hub import notebook_login
 
-# Building the model from the config
-model = TFBertModel(config)
+notebook_login()
 ```
-{/if}
 
-The configuration contains many attributes that are used to build the model:
+Otherwise, at your terminal run:
+
+```bash
+huggingface-cli login
+```
+
+Then you can push the model to the Hub with the `push_to_hub()` method:
 
 ```py
-print(config)
+model.push_to_hub("my-awesome-model")
 ```
 
-```python out
-BertConfig {
-  [...]
-  "hidden_size": 768,
-  "intermediate_size": 3072,
-  "max_position_embeddings": 512,
-  "num_attention_heads": 12,
-  "num_hidden_layers": 12,
-  [...]
-}
+This will upload the model files to the Hub, in a repository under your namespace named *my-awesome-model*. Then, anyone can load your model with the `from_pretrained()` method!
+
+```py
+from transformers import AutoModel
+
+model = AutoModel.from_pretrained("your-username/my-awesome-model")
 ```
 
-While you haven't seen what all of these attributes do yet, you should recognize some of them: the `hidden_size` attribute defines the size of the `hidden_states` vector, and `num_hidden_layers` defines the number of layers the Transformer model has.
+You can do a lot more with the Hub API:
+- Push a model from a local repository
+- Update specific files without re-uploading everything
+- Add model cards to document the model's abilities, limitations, known biases, etc.
 
-### Different loading methods[[different-loading-methods]]
+See [the documentation](https://huggingface.co/docs/huggingface_hub/how-to-upstream) for a complete tutorial on this, or check out the advanced [Chapter 4](/course/chapter4/share).
 
-Creating a model from the default configuration initializes it with random values:
+## Encoding text[[encoding-text]]
+
+Transformer models handle text by turning the inputs into numbers. Here we will look at exactly what happens when your text is processed by the tokenizer. We've already seen in [Chapter 1](/course/chapter1) that tokenizers split the text into tokens and then convert these tokens into numbers. We can see this conversion through a simple tokenizer:
 
-{#if fw === 'pt'}
 ```py
-from transformers import BertConfig, BertModel
+from transformers import AutoTokenizer
 
-config = BertConfig()
-model = BertModel(config)
+tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
 
-# Model is randomly initialized!
+encoded_input = tokenizer("Hello, I'm a single sentence!")
+print(encoded_input)
 ```
-{:else}
-```py
-from transformers import BertConfig, TFBertModel
 
-config = BertConfig()
-model = TFBertModel(config)
+```python out
+{'input_ids': [101, 8667, 117, 1000, 1045, 1005, 1049, 2235, 17662, 12172, 1012, 102], 
+ 'token_type_ids': [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0], 
+ 'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]}
+```
+
+We get a dictionary with the following fields:
+- input_ids: numerical representations of your tokens
+- token_type_ids: these tell the model which part of the input is sentence A and which is sentence B (discussed more in the next section)
+- attention_mask: this indicates which tokens should be attended to and which should not (discussed more in a bit)
+
+We can decode the input IDs to get back the original text:
+
+```py
+tokenizer.decode(encoded_input["input_ids"])
+```
 
-# Model is randomly initialized!
+```python out
+"[CLS] Hello, I'm a single sentence! [SEP]"
 ```
-{/if}
 
-The model can be used in this state, but it will output gibberish; it needs to be trained first. We could train the model from scratch on the task at hand, but as you saw in [Chapter 1](/course/chapter1), this would require a long time and a lot of data, and it would have a non-negligible environmental impact. To avoid unnecessary and duplicated effort, it's imperative to be able to share and reuse models that have already been trained.
+You'll notice that the tokenizer has added special tokens — `[CLS]` and `[SEP]` — required by the model. Not all models need special tokens; they're utilized when a model was pretrained with them, in which case the tokenizer needs to add them as that model expects these tokens.
 
-Loading a Transformer model that is already trained is simple — we can do this using the `from_pretrained()` method:
+You can encode multiple sentences at once, either by batching them together (we'll discuss this soon) or by passing a list:
 
-{#if fw === 'pt'}
 ```py
-from transformers import BertModel
+encoded_input = tokenizer("How are you?", "I'm fine, thank you!")
+print(encoded_input)
+```
 
-model = BertModel.from_pretrained("bert-base-cased")
+```python out
+{'input_ids': [[101, 1731, 1132, 1128, 136, 102], [101, 1045, 1005, 1049, 2503, 117, 5763, 1128, 136, 102]], 
+ 'token_type_ids': [[0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 0, 0, 0]], 
+ 'attention_mask': [[1, 1, 1, 1, 1, 1], [1, 1, 1, 1, 1, 1, 1, 1, 1, 1]]}
 ```
 
-As you saw earlier, we could replace `BertModel` with the equivalent `AutoModel` class. We'll do this from now on as this produces checkpoint-agnostic code; if your code works for one checkpoint, it should work seamlessly with another. This applies even if the architecture is different, as long as the checkpoint was trained for a similar task (for example, a sentiment analysis task).
+Note that when passing multiple sentences, the tokenizer returns a list for each sentence for each dictionary value. We can also ask the tokenizer to return tensors directly from PyTorch:
 
-{:else}
 ```py
-from transformers import TFBertModel
+encoded_input = tokenizer("How are you?", "I'm fine, thank you!", return_tensors="pt")
+print(encoded_input)
+```
 
-model = TFBertModel.from_pretrained("bert-base-cased")
+```python out
+{'input_ids': tensor([[  101,  1731,  1132,  1128,   136,   102],
+         [  101,  1045,  1005,  1049,  2503,   117,  5763,  1128,   136,   102]]), 
+ 'token_type_ids': tensor([[0, 0, 0, 0, 0, 0],
+         [0, 0, 0, 0, 0, 0, 0, 0, 0, 0]]), 
+ 'attention_mask': tensor([[1, 1, 1, 1, 1, 1],
+         [1, 1, 1, 1, 1, 1, 1, 1, 1, 1]])}
 ```
 
-As you saw earlier, we could replace `TFBertModel` with the equivalent `TFAutoModel` class. We'll do this from now on as this produces checkpoint-agnostic code; if your code works for one checkpoint, it should work seamlessly with another. This applies even if the architecture is different, as long as the checkpoint was trained for a similar task (for example, a sentiment analysis task).
+But there's a problem: the two lists don't have the same length! Arrays and tensors need to be rectangular, so we can't simply convert these lists to a PyTorch tensor (or NumPy array). The tokenizer provides an option for that: padding.
 
-{/if}
+### Padding inputs[[padding-inputs]]
 
-In the code sample above we didn't use `BertConfig`, and instead loaded a pretrained model via the `bert-base-cased` identifier. This is a model checkpoint that was trained by the authors of BERT themselves; you can find more details about it in its [model card](https://huggingface.co/bert-base-cased).
+If we ask the tokenizer to pad the inputs, it will make all sentences the same length by adding a special padding token to the sentences that are shorter than the longest one:
 
-This model is now initialized with all the weights of the checkpoint. It can be used directly for inference on the tasks it was trained on, and it can also be fine-tuned on a new task. By training with pretrained weights rather than from scratch, we can quickly achieve good results.
+```py
+encoded_input = tokenizer(["How are you?", "I'm fine, thank you!"], padding=True, return_tensors="pt")
+print(encoded_input)
+```
 
-The weights have been downloaded and cached (so future calls to the `from_pretrained()` method won't re-download them) in the cache folder, which defaults to *~/.cache/huggingface/transformers*. You can customize your cache folder by setting the `HF_HOME` environment variable.
+```python out
+{'input_ids': tensor([[  101,  1731,  1132,  1128,   136,   102,     0,     0,     0,     0],
+         [  101,  1045,  1005,  1049,  2503,   117,  5763,  1128,   136,   102]]), 
+ 'token_type_ids': tensor([[0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
+         [0, 0, 0, 0, 0, 0, 0, 0, 0, 0]]), 
+ 'attention_mask': tensor([[1, 1, 1, 1, 1, 1, 0, 0, 0, 0],
+         [1, 1, 1, 1, 1, 1, 1, 1, 1, 1]])}
+```
 
-The identifier used to load the model can be the identifier of any model on the Model Hub, as long as it is compatible with the BERT architecture. The entire list of available BERT checkpoints can be found [here](https://huggingface.co/models?filter=bert).
+Now we have rectangular tensors! Note that the padding tokens have been encoded into input IDs with ID 0, and they have an attention mask value of 0 as well. This is because those padding tokens shouldn't be analyzed by the model: they're not part of the actual sentence.
 
-### Saving methods[[saving-methods]]
+### Truncating inputs[[truncating-inputs]]
 
-Saving a model is as easy as loading one — we use the `save_pretrained()` method, which is analogous to the `from_pretrained()` method:
+The tensors might get too big to be processed by the model. For instance, BERT was only pretrained with sequences up to 512 tokens, so it cannot process longer sequences. If you have sequences longer than the model can handle, you'll need to truncate them with the `truncation` parameter:
 
 ```py
-model.save_pretrained("directory_on_my_computer")
+encoded_input = tokenizer("This is a very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very long sentence.", truncation=True)
+print(encoded_input["input_ids"])
 ```
 
-This saves two files to your disk:
-
-{#if fw === 'pt'}
+```python out
+[101, 1188, 1110, 170, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1505, 1179, 5650, 119, 102]
 ```
-ls directory_on_my_computer
 
-config.json pytorch_model.bin
-```
-{:else}
-```
-ls directory_on_my_computer
+By combining the padding and truncation arguments, you can make sure your tensors have the exact size you need:
 
-config.json tf_model.h5
+```py
+encoded_input = tokenizer(
+    ["How are you?", "I'm fine, thank you!"],
+    padding=True,
+    truncation=True,
+    max_length=5,
+    return_tensors="pt",
+)
+print(encoded_input)
 ```
-{/if}
 
-If you take a look at the *config.json* file, you'll recognize the attributes necessary to build the model architecture. This file also contains some metadata, such as where the checkpoint originated and what 🤗 Transformers version you were using when you last saved the checkpoint.
+```python out
+{'input_ids': tensor([[  101,  1731,  1132,  1128,   102],
+         [  101,  1045,  1005,  1049,   102]]), 
+ 'token_type_ids': tensor([[0, 0, 0, 0, 0],
+         [0, 0, 0, 0, 0]]), 
+ 'attention_mask': tensor([[1, 1, 1, 1, 1],
+         [1, 1, 1, 1, 1]])}
+```
 
-{#if fw === 'pt'}
-The *pytorch_model.bin* file is known as the *state dictionary*; it contains all your model's weights. The two files go hand in hand; the configuration is necessary to know your model's architecture, while the model weights are your model's parameters.
+### Adding special tokens
 
-{:else}
-The *tf_model.h5* file is known as the *state dictionary*; it contains all your model's weights. The two files go hand in hand; the configuration is necessary to know your model's architecture, while the model weights are your model's parameters.
+Special tokens (or at least the concept of them) is particularly important to BERT and derived models. These tokens are added to better represent the sentence boundaries, such as the beginning of a sentence (`[CLS]`) or separator between sentences (`[SEP]`). Let's look at a simple example:
 
-{/if}
+```py
+encoded_input = tokenizer("How are you?")
+print(encoded_input["input_ids"])
+tokenizer.decode(encoded_input["input_ids"])
+```
 
-## Using a Transformer model for inference[[using-a-transformer-model-for-inference]]
+```python out
+[101, 1731, 1132, 1128, 136, 102]
+'[CLS] How are you? [SEP]'
+```
 
-Now that you know how to load and save a model, let's try using it to make some predictions. Transformer models can only process numbers — numbers that the tokenizer generates. But before we discuss tokenizers, let's explore what inputs the model accepts.
+These special tokens are automatically added by the tokenizer. Not all models need special tokens; they are primarily used when a model was pretrained with them, in which case the tokenizer will add them since the model expects them.
 
-Tokenizers can take care of casting the inputs to the appropriate framework's tensors, but to help you understand what's going on, we'll take a quick look at what must be done before sending the inputs to the model.
+### Why is all of this necessary?
 
-Let's say we have a couple of sequences:
+Here's a concrete example. Consider these encoded sequences:
 
 ```py
-sequences = ["Hello!", "Cool.", "Nice!"]
+sequences = [
+    "I've been waiting for a HuggingFace course my whole life.",
+    "I hate this so much!",
+]
 ```
 
-The tokenizer converts these to vocabulary indices which are typically called *input IDs*. Each sequence is now a list of numbers! The resulting output is:
+Once tokenized, we have:
 
-```py no-format
+```python
 encoded_sequences = [
-    [101, 7592, 999, 102],
-    [101, 4658, 1012, 102],
-    [101, 3835, 999, 102],
+    [101, 1045, 1005, 2310, 2042, 3403, 2005, 1037, 17662, 12172, 2607, 2026, 2878, 2166, 1012, 102],
+    [101, 1045, 5223, 2023, 2061, 2172, 999, 102],
 ]
 ```
 
 This is a list of encoded sequences: a list of lists. Tensors only accept rectangular shapes (think matrices). This "array" is already of rectangular shape, so converting it to a tensor is easy:
 
-{#if fw === 'pt'}
 ```py
 import torch
 
 model_inputs = torch.tensor(encoded_sequences)
 ```
-{:else}
-```py
-import tensorflow as tf
-
-model_inputs = tf.constant(encoded_sequences)
-```
-{/if}
 
 ### Using the tensors as inputs to the model[[using-the-tensors-as-inputs-to-the-model]]
 
diff --git a/chapters/en/chapter2/4.mdx b/chapters/en/chapter2/4.mdx
index 30167ddbd..d07264690 100644
--- a/chapters/en/chapter2/4.mdx
+++ b/chapters/en/chapter2/4.mdx
@@ -2,8 +2,6 @@
 
 # Tokenizers[[tokenizers]]
 
-{#if fw === 'pt'}
-
 <CourseFloatingBanner chapter={2}
   classNames="absolute z-10 right-0 top-0"
   notebooks={[
@@ -11,17 +9,6 @@
     {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section4_pt.ipynb"},
 ]} />
 
-{:else}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section4_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section4_tf.ipynb"},
-]} />
-
-{/if}
-
 <Youtube id="VFp38yj8h3A"/>
 
 Tokenizers are one of the core components of the NLP pipeline. They serve one purpose: to translate text into data that can be processed by the model. Models can only process numbers, so tokenizers need to convert our text inputs to numerical data. In this section, we'll explore exactly what happens in the tokenization pipeline. 
@@ -131,14 +118,8 @@ from transformers import BertTokenizer
 tokenizer = BertTokenizer.from_pretrained("bert-base-cased")
 ```
 
-{#if fw === 'pt'}
 Similar to `AutoModel`, the `AutoTokenizer` class will grab the proper tokenizer class in the library based on the checkpoint name, and can be used directly with any checkpoint:
 
-{:else}
-Similar to `TFAutoModel`, the `AutoTokenizer` class will grab the proper tokenizer class in the library based on the checkpoint name, and can be used directly with any checkpoint:
-
-{/if}
-
 ```py
 from transformers import AutoTokenizer
 
diff --git a/chapters/en/chapter2/5.mdx b/chapters/en/chapter2/5.mdx
index 33060505b..299a15c5f 100644
--- a/chapters/en/chapter2/5.mdx
+++ b/chapters/en/chapter2/5.mdx
@@ -2,8 +2,6 @@
 
 # Handling multiple sequences[[handling-multiple-sequences]]
 
-{#if fw === 'pt'}
-
 <CourseFloatingBanner chapter={2}
   classNames="absolute z-10 right-0 top-0"
   notebooks={[
@@ -11,22 +9,7 @@
     {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section5_pt.ipynb"},
 ]} />
 
-{:else}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section5_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section5_tf.ipynb"},
-]} />
-
-{/if}
-
-{#if fw === 'pt'}
 <Youtube id="M6adb1j2jPI"/>
-{:else}
-<Youtube id="ROxrFOEbsQE"/>
-{/if}
 
 In the previous section, we explored the simplest of use cases: doing inference on a single sequence of a small length. However, some questions emerge already:
 
@@ -41,7 +24,6 @@ Let's see what kinds of problems these questions pose, and how we can solve them
 
 In the previous exercise you saw how sequences get translated into lists of numbers. Let's convert this list of numbers to a tensor and send it to the model:
 
-{#if fw === 'pt'}
 ```py
 import torch
 from transformers import AutoTokenizer, AutoModelForSequenceClassification
@@ -62,34 +44,11 @@ model(input_ids)
 ```python out
 IndexError: Dimension out of range (expected to be in range of [-1, 0], but got 1)
 ```
-{:else}
-```py
-import tensorflow as tf
-from transformers import AutoTokenizer, TFAutoModelForSequenceClassification
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint)
-
-sequence = "I've been waiting for a HuggingFace course my whole life."
-
-tokens = tokenizer.tokenize(sequence)
-ids = tokenizer.convert_tokens_to_ids(tokens)
-input_ids = tf.constant(ids)
-# This line will fail.
-model(input_ids)
-```
-
-```py out
-InvalidArgumentError: Input to reshape is a tensor with 14 values, but the requested shape has 196 [Op:Reshape]
-```
-{/if}
 
 Oh no! Why did this fail? We followed the steps from the pipeline in section 2.
 
 The problem is that we sent a single sequence to the model, whereas 🤗 Transformers models expect multiple sentences by default. Here we tried to do everything the tokenizer did behind the scenes when we applied it to a `sequence`. But if you look closely, you'll see that the tokenizer didn't just convert the list of input IDs into a tensor, it added a dimension on top of it:
 
-{#if fw === 'pt'}
 ```py
 tokenized_inputs = tokenizer(sequence, return_tensors="pt")
 print(tokenized_inputs["input_ids"])
@@ -99,22 +58,9 @@ print(tokenized_inputs["input_ids"])
 tensor([[  101,  1045,  1005,  2310,  2042,  3403,  2005,  1037, 17662, 12172,
           2607,  2026,  2878,  2166,  1012,   102]])
 ```
-{:else}
-```py
-tokenized_inputs = tokenizer(sequence, return_tensors="tf")
-print(tokenized_inputs["input_ids"])
-```
-
-```py out
-<tf.Tensor: shape=(1, 16), dtype=int32, numpy=
-array([[  101,  1045,  1005,  2310,  2042,  3403,  2005,  1037, 17662,
-        12172,  2607,  2026,  2878,  2166,  1012,   102]], dtype=int32)>
-```
-{/if}
 
 Let's try again and add a new dimension:
 
-{#if fw === 'pt'}
 ```py
 import torch
 from transformers import AutoTokenizer, AutoModelForSequenceClassification
@@ -134,43 +80,13 @@ print("Input IDs:", input_ids)
 output = model(input_ids)
 print("Logits:", output.logits)
 ```
-{:else}
-```py
-import tensorflow as tf
-from transformers import AutoTokenizer, TFAutoModelForSequenceClassification
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint)
-
-sequence = "I've been waiting for a HuggingFace course my whole life."
-
-tokens = tokenizer.tokenize(sequence)
-ids = tokenizer.convert_tokens_to_ids(tokens)
-
-input_ids = tf.constant([ids])
-print("Input IDs:", input_ids)
-
-output = model(input_ids)
-print("Logits:", output.logits)
-```
-{/if}
 
 We print the input IDs as well as the resulting logits — here's the output:
 
-{#if fw === 'pt'}
 ```python out
 Input IDs: [[ 1045,  1005,  2310,  2042,  3403,  2005,  1037, 17662, 12172,  2607, 2026,  2878,  2166,  1012]]
 Logits: [[-2.7276,  2.8789]]
 ```
-{:else}
-```py out
-Input IDs: tf.Tensor(
-[[ 1045  1005  2310  2042  3403  2005  1037 17662 12172  2607  2026  2878
-   2166  1012]], shape=(1, 14), dtype=int32)
-Logits: tf.Tensor([[-2.7276208  2.8789377]], shape=(1, 2), dtype=float32)
-```
-{/if}
 
 *Batching* is the act of sending multiple sentences through the model, all at once. If you only have one sentence, you can just build a batch with a single sequence: 
 
@@ -212,7 +128,6 @@ batched_ids = [
 
 The padding token ID can be found in `tokenizer.pad_token_id`. Let's use it and send our two sentences through the model individually and batched together:
 
-{#if fw === 'pt'}
 ```py no-format
 model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
 
@@ -234,30 +149,6 @@ tensor([[ 0.5803, -0.4125]], grad_fn=<AddmmBackward>)
 tensor([[ 1.5694, -1.3895],
         [ 1.3373, -1.2163]], grad_fn=<AddmmBackward>)
 ```
-{:else}
-```py no-format
-model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint)
-
-sequence1_ids = [[200, 200, 200]]
-sequence2_ids = [[200, 200]]
-batched_ids = [
-    [200, 200, 200],
-    [200, 200, tokenizer.pad_token_id],
-]
-
-print(model(tf.constant(sequence1_ids)).logits)
-print(model(tf.constant(sequence2_ids)).logits)
-print(model(tf.constant(batched_ids)).logits)
-```
-
-```py out
-tf.Tensor([[ 1.5693678 -1.3894581]], shape=(1, 2), dtype=float32)
-tf.Tensor([[ 0.5803005  -0.41252428]], shape=(1, 2), dtype=float32)
-tf.Tensor(
-[[ 1.5693681 -1.3894582]
- [ 1.3373486 -1.2163193]], shape=(2, 2), dtype=float32)
-```
-{/if}
 
 There's something wrong with the logits in our batched predictions: the second row should be the same as the logits for the second sentence, but we've got completely different values!
 
@@ -269,7 +160,6 @@ This is because the key feature of Transformer models is attention layers that *
 
 Let's complete the previous example with an attention mask:
 
-{#if fw === 'pt'}
 ```py no-format
 batched_ids = [
     [200, 200, 200],
@@ -289,28 +179,6 @@ print(outputs.logits)
 tensor([[ 1.5694, -1.3895],
         [ 0.5803, -0.4125]], grad_fn=<AddmmBackward>)
 ```
-{:else}
-```py no-format
-batched_ids = [
-    [200, 200, 200],
-    [200, 200, tokenizer.pad_token_id],
-]
-
-attention_mask = [
-    [1, 1, 1],
-    [1, 1, 0],
-]
-
-outputs = model(tf.constant(batched_ids), attention_mask=tf.constant(attention_mask))
-print(outputs.logits)
-```
-
-```py out
-tf.Tensor(
-[[ 1.5693681  -1.3894582 ]
- [ 0.5803021  -0.41252586]], shape=(2, 2), dtype=float32)
-```
-{/if}
 
 Now we get the same logits for the second sentence in the batch.
 
diff --git a/chapters/en/chapter2/6.mdx b/chapters/en/chapter2/6.mdx
index d26118501..3a0dac876 100644
--- a/chapters/en/chapter2/6.mdx
+++ b/chapters/en/chapter2/6.mdx
@@ -2,8 +2,6 @@
 
 # Putting it all together[[putting-it-all-together]]
 
-{#if fw === 'pt'}
-
 <CourseFloatingBanner chapter={2}
   classNames="absolute z-10 right-0 top-0"
   notebooks={[
@@ -11,17 +9,6 @@
     {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section6_pt.ipynb"},
 ]} />
 
-{:else}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section6_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section6_tf.ipynb"},
-]} />
-
-{/if}
-
 In the last few sections, we've been trying our best to do most of the work by hand. We've explored how tokenizers work and looked at tokenization, conversion to input IDs, padding, truncation, and attention masks.
 
 However, as we saw in section 2, the 🤗 Transformers API can handle all of this for us with a high-level function that we'll dive into here. When you call your `tokenizer` directly on the sentence, you get back inputs that are ready to pass through your model:
@@ -82,7 +69,7 @@ model_inputs = tokenizer(sequences, truncation=True)
 model_inputs = tokenizer(sequences, max_length=8, truncation=True)
 ```
 
-The `tokenizer` object can handle the conversion to specific framework tensors, which can then be directly sent to the model. For example, in the following code sample we are prompting the tokenizer to return tensors from the different frameworks — `"pt"` returns PyTorch tensors, `"tf"` returns TensorFlow tensors, and `"np"` returns NumPy arrays:
+The `tokenizer` object can handle the conversion to specific framework tensors, which can then be directly sent to the model. For example, in the following code sample we are prompting the tokenizer to return tensors from the different frameworks — `"pt"` returns PyTorch tensors and `"np"` returns NumPy arrays:
 
 ```py
 sequences = ["I've been waiting for a HuggingFace course my whole life.", "So have I!"]
@@ -90,9 +77,6 @@ sequences = ["I've been waiting for a HuggingFace course my whole life.", "So ha
 # Returns PyTorch tensors
 model_inputs = tokenizer(sequences, padding=True, return_tensors="pt")
 
-# Returns TensorFlow tensors
-model_inputs = tokenizer(sequences, padding=True, return_tensors="tf")
-
 # Returns NumPy arrays
 model_inputs = tokenizer(sequences, padding=True, return_tensors="np")
 ```
@@ -135,7 +119,6 @@ The tokenizer added the special word `[CLS]` at the beginning and the special wo
 
 Now that we've seen all the individual steps the `tokenizer` object uses when applied on texts, let's see one final time how it can handle multiple sequences (padding!), very long sequences (truncation!), and multiple types of tensors with its main API:
 
-{#if fw === 'pt'}
 ```py
 import torch
 from transformers import AutoTokenizer, AutoModelForSequenceClassification
@@ -148,17 +131,3 @@ sequences = ["I've been waiting for a HuggingFace course my whole life.", "So ha
 tokens = tokenizer(sequences, padding=True, truncation=True, return_tensors="pt")
 output = model(**tokens)
 ```
-{:else}
-```py
-import tensorflow as tf
-from transformers import AutoTokenizer, TFAutoModelForSequenceClassification
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint)
-sequences = ["I've been waiting for a HuggingFace course my whole life.", "So have I!"]
-
-tokens = tokenizer(sequences, padding=True, truncation=True, return_tensors="tf")
-output = model(**tokens)
-```
-{/if}
diff --git a/chapters/en/chapter2/8.mdx b/chapters/en/chapter2/8.mdx
index c41f27936..1e51522a2 100644
--- a/chapters/en/chapter2/8.mdx
+++ b/chapters/en/chapter2/8.mdx
@@ -103,7 +103,6 @@
 	]}
 />
 
-{#if fw === 'pt'}
 ### 5. What is an AutoModel?
 
 <Question
@@ -124,29 +123,6 @@
 	]}
 />
 
-{:else}
-### 5. What is an TFAutoModel?
-
-<Question
-	choices={[
-		{
-			text: "A model that automatically trains on your data",
-			explain: "Incorrect. Are you mistaking this with our <a href='https://huggingface.co/autotrain'>AutoTrain</a> product?"
-		},
-		{
-			text: "An object that returns the correct architecture based on the checkpoint",
-			explain: "Exactly: the <code>TFAutoModel</code> only needs to know the checkpoint from which to initialize to return the correct architecture.",
-			correct: true
-		},
-		{
-			text: "A model that automatically detects the language used for its inputs to load the correct weights",
-			explain: "Incorrect; while some checkpoints and models are capable of handling multiple languages, there are no built-in tools for automatic checkpoint selection according to language. You should head over to the <a href='https://huggingface.co/models'>Model Hub</a> to find the best checkpoint for your task!"
-		} 
-	]}
-/>
-
-{/if}
-
 ### 6. What are the techniques to be aware of when batching sequences of different lengths together?
 
 <Question
@@ -245,7 +221,6 @@ result = tokenizer.tokenize("Hello!")
 	]}
 />
 
-{#if fw === 'pt'}
 ### 10. Is there something wrong with the following code?
 
 ```py
@@ -275,36 +250,3 @@ result = model(**encoded)
 		}
 	]}
 />
-
-{:else}
-### 10. Is there something wrong with the following code?
-
-```py
-from transformers import AutoTokenizer, TFAutoModel
-
-tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
-model = TFAutoModel.from_pretrained("gpt2")
-
-encoded = tokenizer("Hey!", return_tensors="pt")
-result = model(**encoded)
-```
-
-<Question
-	choices={[
-		{
-			text: "No, it seems correct.",
-			explain: "Unfortunately, coupling a model with a tokenizer that was trained with a different checkpoint is rarely a good idea. The model was not trained to make sense out of this tokenizer's output, so the model output (if it can even run!) will not make any sense."
-		},
-		{
-			text: "The tokenizer and model should always be from the same checkpoint.",
-			explain: "Right!",
-            correct: true
-		},
-		{
-			text: "It's good practice to pad and truncate with the tokenizer as every input is a batch.",
-			explain: "It's true that every model input needs to be a batch. However, truncating or padding this sequence wouldn't necessarily make sense as there is only one of it, and those are techniques to batch together a list of sentences."
-		}
-	]}
-/>
-
-{/if}

From 174321d7455629384d33b44397ee4180be3bb7b6 Mon Sep 17 00:00:00 2001
From: burtenshaw <ben.burtenshaw@gmail.com>
Date: Mon, 5 May 2025 09:45:33 +0200
Subject: [PATCH 089/167] add page on TGI and vLLM

---
 chapters/en/chapter2/9.mdx | 359 +++++++++++++++++++++++++++++++++++++
 1 file changed, 359 insertions(+)
 create mode 100644 chapters/en/chapter2/9.mdx

diff --git a/chapters/en/chapter2/9.mdx b/chapters/en/chapter2/9.mdx
new file mode 100644
index 000000000..95d6b4faa
--- /dev/null
+++ b/chapters/en/chapter2/9.mdx
@@ -0,0 +1,359 @@
+# Optimized Inference Deployment
+
+In this section, we'll explore advanced frameworks for optimizing LLM deployments: Text Generation Inference (TGI) and vLLM. These application are primarily used in production environments to serve LLMs to users. So this section is more focused on how to deploy these frameworks in production rather than how to use them for inference on a single machine.
+
+We'll cover how these tools maximize inference efficiency and simplify production deployments of Large Language Models.
+
+## Framework Selection Guide
+
+TGI and vLLM serve similar purposes but have distinct characteristics that make them better suited for different use cases. Let's look at the key differences between the two. We'll focus on two key areas: performance and integration.
+
+### Memory Management and Performance
+
+**TGI** is designed to be stable and predictable in production, using fixed sequence lengths to keep memory usage consistent. TGI manages memory using Flash Attention 2 and continuous batching techniques. This means it can process attention calculations very efficiently and keep the GPU busy by constantly feeding it work. The system can move parts of the model between CPU and GPU when needed, which helps handle larger models. 
+
+<img src="https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/tgi/flash-attn.png" alt="Flash Attention" />
+
+<Tip title="How Flash Attention Works">
+Flash Attention is a technique that optimizes the attention mechanism in transformer models by addressing memory bandwidth bottlenecks. As discussed earlier in [section 12.3](2.mdx), the attention mechanism has quadratic complexity and memory usage, making it inefficient for long sequences.
+
+The key innovation is in how it manages memory transfers between High Bandwidth Memory (HBM) and faster SRAM cache. Traditional attention repeatedly transfers data between HBM and SRAM, creating bottlenecks by leaving the GPU idle. Flash Attention loads data once into SRAM and performs all calculations there, minimizing expensive memory transfers. 
+
+While the benefits are most significant during training, Flash Attention's reduced VRAM usage and improved efficiency make it valuable for inference as well, enabling faster and more scalable LLM serving.
+</Tip>
+
+**vLLM** takes a different approach by using PagedAttention. Just like how a computer manages its memory in pages, vLLM splits the model's memory into smaller blocks. This clever system means it can handle different-sized requests more flexibly and doesn't waste memory space. It's particularly good at sharing memory between different requests and reduces memory fragmentation, which makes the whole system more efficient.
+
+<Tip title="How Paged Attention Works">
+Paged Attention is a technique that addresses another critical bottleneck in LLM inference: KV cache memory management. As discussed in [section 12.3](2.mdx), during text generation, the model stores attention keys and values (KV cache) for each generated token to reduce redundant computations. The KV cache can become enormous, especially with long sequences or multiple concurrent requests.
+
+vLLM's key innovation lies in how it manages this cache:
+
+1. **Memory Paging**: Instead of treating the KV cache as one large block, it's divided into fixed-size "pages" (similar to virtual memory in operating systems).
+2. **Non-contiguous Storage**: Pages don't need to be stored contiguously in GPU memory, allowing for more flexible memory allocation.
+3. **Page Table Management**: A page table tracks which pages belong to which sequence, enabling efficient lookup and access.
+4. **Memory Sharing**: For operations like parallel sampling, pages storing the KV cache for the prompt can be shared across multiple sequences.
+
+The PagedAttention approach can lead to up to 24x higher throughput compared to traditional methods, making it a game-changer for production LLM deployments. If you want to go really deep into how PagedAttention works, you can read the [the guide from the vLLM documentation](https://docs.vllm.ai/en/latest/design/kernel/paged_attention.html).
+</Tip>
+
+We can summarize the memory differences in the following table:
+
+| Feature | TGI | vLLM |
+|---------|-----|------|
+| Memory Efficiency | Good (Flash Attention) | Excellent (PagedAttention) |
+| Memory Management | HBM-SRAM optimization, single-load computation | Page-based KV cache, non-contiguous allocation |
+| Memory Bottleneck Addressed | Attention computation bandwidth | KV cache management |
+| Key Innovation | Minimizes HBM-SRAM transfers | Virtual memory-style paging for KV cache |
+| Memory Sharing | Limited | Efficient (shared KV cache pages) |
+| Throughput | High | Very High (up to 24x traditional) |
+| Memory Fragmentation | Standard | Reduced by up to 47% |
+| Sequence Length Handling | Fixed | Dynamic |
+| Best Use Case | Stable, predictable workloads | Variable length, concurrent requests |
+
+### Deployment and Integration
+
+Let's move on to the deployment and integration differences between the two frameworks.
+
+**TGI** excels in enterprise-level deployment with its production-ready features. It comes with built-in Kubernetes support and includes everything you need for running in production, like monitoring through Prometheus and Grafana, automatic scaling, and comprehensive safety features. The system also includes enterprise-grade logging and various protective measures like content filtering and rate limiting to keep your deployment secure and stable.
+
+**vLLM** takes a more flexible, developer-friendly approach to deployment. It's built with Python at its core and can easily replace OpenAI's API in your existing applications. The framework focuses on delivering raw performance and can be customized to fit your specific needs. It works particularly well with Ray for managing clusters, making it a great choice when you need high performance and adaptability.
+
+Here are the key deployment differences:
+
+| Feature | TGI | vLLM |
+|---------|-----|------|
+| Deployment Options | Docker, Cloud, K8s | Python Package, Docker |
+| Primary Integration | HuggingFace Ecosystem | OpenAI API Compatible |
+| Monitoring | Built-in Prometheus/Grafana | Custom Metrics |
+| Safety Features | Comprehensive | Basic |
+| Scaling Strategies | Tensor Parallel | Tensor + Pipeline Parallel |
+
+## Getting Started
+
+Let's explore how to use these frameworks for deploying LLMs, starting with installation and basic setup.
+
+### Installation and Basic Setup
+
+{#if framework === 'tgi'}
+
+TGI is easy to install and use, with deep integration into the Hugging Face ecosystem.
+
+First, launch the TGI server using Docker:
+
+```sh
+docker run --gpus all \
+    --shm-size 1g \
+    -p 8080:80 \
+    -v ~/.cache/huggingface:/data \
+    ghcr.io/huggingface/text-generation-inference:latest \
+    --model-id HuggingFaceTB/SmolLM2-360M-Instruct
+```
+
+Then interact with it using the OpenAI client:
+
+```python
+from openai import OpenAI
+
+# Initialize client pointing to TGI endpoint
+client = OpenAI(
+    base_url="http://localhost:8080/v1",  # Make sure to include /v1
+    api_key="not-needed",  # TGI doesn't require an API key by default
+)
+
+# Chat completion
+response = client.chat.completions.create(
+    model="HuggingFaceTB/SmolLM2-360M-Instruct",
+    messages=[
+        {"role": "system", "content": "You are a helpful assistant."},
+        {"role": "user", "content": "Tell me a story"},
+    ],
+    max_tokens=100,
+    temperature=0.7,
+    top_p=0.95,
+)
+print(response.choices[0].message.content)
+```
+{:else}
+
+vLLM is easy to install and use, with both OpenAI API compatibility and a native Python interface.
+
+First, launch the vLLM OpenAI-compatible server:
+
+```sh
+python -m vllm.entrypoints.openai.api_server \
+    --model HuggingFaceTB/SmolLM2-360M-Instruct \
+    --host 0.0.0.0 \
+    --port 8000
+```
+
+Then interact with it using the OpenAI client:
+
+```python
+from openai import OpenAI
+
+# Initialize client pointing to vLLM endpoint
+client = OpenAI(
+    base_url="http://localhost:8000/v1",
+    api_key="not-needed",  # vLLM doesn't require an API key by default
+)
+
+# Chat completion
+response = client.chat.completions.create(
+    model="HuggingFaceTB/SmolLM2-360M-Instruct",
+    messages=[
+        {"role": "system", "content": "You are a helpful assistant."},
+        {"role": "user", "content": "Tell me a story"},
+    ],
+    max_tokens=100,
+    temperature=0.7,
+    top_p=0.95,
+)
+print(response.choices[0].message.content)
+```
+{/if}
+
+### Basic Text Generation
+
+Let's look at examples of text generation with both frameworks:
+
+{#if framework === 'tgi'}
+
+First, deploy TGI with advanced parameters:
+```sh
+docker run --gpus all \
+    --shm-size 1g \
+    -p 8080:80 \
+    -v ~/.cache/huggingface:/data \
+    ghcr.io/huggingface/text-generation-inference:latest \
+    --model-id HuggingFaceTB/SmolLM2-360M-Instruct \
+    --max-total-tokens 4096 \
+    --max-input-length 3072 \
+    --max-batch-total-tokens 8192 \
+    --waiting-served-ratio 1.2
+```
+
+Then use the OpenAI client for generation:
+```python
+from openai import OpenAI
+
+client = OpenAI(base_url="http://localhost:8080/v1", api_key="not-needed")
+
+# Advanced parameters example
+response = client.chat.completions.create(
+    model="HuggingFaceTB/SmolLM2-360M-Instruct",
+    messages=[
+        {"role": "system", "content": "You are a creative storyteller."},
+        {"role": "user", "content": "Write a creative story"},
+    ],
+    temperature=0.8,  # Higher for more creativity
+)
+print(response.choices[0].message.content)
+```
+{:else}
+
+For advanced usage, vLLM provides a native Python interface with fine-grained control:
+
+```python
+from vllm import LLM, SamplingParams
+
+# Initialize the model with advanced parameters
+llm = LLM(
+    model="HuggingFaceTB/SmolLM2-360M-Instruct",
+    gpu_memory_utilization=0.85,
+    max_num_batched_tokens=8192,
+    max_num_seqs=256,
+    block_size=16,
+)
+
+# Configure sampling parameters
+sampling_params = SamplingParams(
+    temperature=0.8,  # Higher for more creativity
+    top_p=0.95,  # Consider top 95% probability mass
+    max_tokens=100,  # Maximum length
+    presence_penalty=1.1,  # Reduce repetition
+    frequency_penalty=1.1,  # Reduce repetition
+    stop=["\n\n", "###"],  # Stop sequences
+)
+
+# Generate text
+prompt = "Write a creative story"
+outputs = llm.generate(prompt, sampling_params)
+print(outputs[0].outputs[0].text)
+
+# For chat-style interactions
+chat_prompt = [
+    {"role": "system", "content": "You are a creative storyteller."},
+    {"role": "user", "content": "Write a creative story"},
+]
+formatted_prompt = llm.get_chat_template()(chat_prompt)  # Uses model's chat template
+outputs = llm.generate(formatted_prompt, sampling_params)
+print(outputs[0].outputs[0].text)
+```
+{/if}
+
+## Advanced Generation Control
+
+### Token Selection and Sampling
+
+The process of generating text involves selecting the next token at each step. This selection process can be controlled through various parameters:
+
+1. **Raw Logits**: The initial output probabilities for each token
+2. **Temperature**: Controls randomness in selection (higher = more creative)
+3. **Top-p (Nucleus) Sampling**: Filters to top tokens making up X% of probability mass
+4. **Top-k Filtering**: Limits selection to k most likely tokens
+
+Here's how to configure these parameters:
+
+{#if framework === 'tgi'}
+```python
+client.generate(
+    "Write a creative story",
+    temperature=0.8,  # Higher for more creativity
+    top_p=0.95,  # Consider top 95% probability mass
+    top_k=50,  # Consider top 50 tokens
+    max_new_tokens=100,  # Maximum length
+    repetition_penalty=1.1,  # Reduce repetition
+)
+```
+{:else}
+```python
+params = SamplingParams(
+    temperature=0.8,  # Higher for more creativity
+    top_p=0.95,  # Consider top 95% probability mass
+    top_k=50,  # Consider top 50 tokens
+    max_tokens=100,  # Maximum length
+    presence_penalty=0.1,  # Reduce repetition
+)
+llm.generate("Write a creative story", sampling_params=params)
+```
+{/if}
+
+### Controlling Repetition
+
+Both frameworks provide ways to prevent repetitive text generation:
+
+{#if framework === 'tgi'}
+```python
+client.generate(
+    "Write a varied text",
+    repetition_penalty=1.1,  # Penalize repeated tokens
+    no_repeat_ngram_size=3,  # Prevent 3-gram repetition
+)
+```
+{:else}
+```python
+params = SamplingParams(
+    presence_penalty=0.1,  # Penalize token presence
+    frequency_penalty=0.1,  # Penalize token frequency
+)
+```
+{/if}
+
+### Length Control and Stop Sequences
+
+You can control generation length and specify when to stop:
+
+{#if framework === 'tgi'}
+```python
+client.generate(
+    "Generate a short paragraph",
+    max_new_tokens=100,
+    min_new_tokens=10,
+    stop_sequences=["\n\n", "###"],
+)
+```
+{:else}
+```python
+params = SamplingParams(
+    max_tokens=100,
+    min_tokens=10,
+    stop=["###", "\n\n"],
+    ignore_eos=False,
+    skip_special_tokens=True,
+)
+```
+{/if}
+
+## Memory Management
+
+Both frameworks implement advanced memory management techniques for efficient inference.
+
+{#if framework === 'tgi'}
+TGI uses Flash Attention 2 and continuous batching:
+
+```sh
+# Docker deployment with memory optimization
+docker run --gpus all -p 8080:80 \
+    --shm-size 1g \
+    ghcr.io/huggingface/text-generation-inference:latest \
+    --model-id HuggingFaceTB/SmolLM2-1.7B-Instruct \
+    --max-batch-total-tokens 8192 \
+    --max-input-length 4096
+```
+{:else}
+vLLM uses PagedAttention for optimal memory management:
+
+```python
+from vllm.engine.arg_utils import AsyncEngineArgs
+
+engine_args = AsyncEngineArgs(
+    model="HuggingFaceTB/SmolLM2-1.7B-Instruct",
+    gpu_memory_utilization=0.85,
+    max_num_batched_tokens=8192,
+    block_size=16,
+)
+
+llm = LLM(engine_args=engine_args)
+```
+{/if}
+
+## Resources
+
+- [Text Generation Inference Documentation](https://huggingface.co/docs/text-generation-inference)
+- [TGI GitHub Repository](https://github.com/huggingface/text-generation-inference)
+- [vLLM Documentation](https://vllm.readthedocs.io/)
+- [vLLM GitHub Repository](https://github.com/vllm-project/vllm)
+- [PagedAttention Paper](https://arxiv.org/abs/2309.06180)
+- [HuggingFace Blog: TGI in Production](https://huggingface.co/blog/tgi-serving)
+- [vLLM Performance Benchmarks](https://vllm.readthedocs.io/en/latest/performance.html)
\ No newline at end of file

From 8f41717baf018674c6cefb58ce31fe0a0624c145 Mon Sep 17 00:00:00 2001
From: burtenshaw <ben.burtenshaw@gmail.com>
Date: Mon, 5 May 2025 12:55:50 +0200
Subject: [PATCH 090/167] add llama cpp to frameworks page

---
 chapters/en/chapter2/9.mdx | 488 ++++++++++++++++++++++++++++++++++---
 1 file changed, 459 insertions(+), 29 deletions(-)

diff --git a/chapters/en/chapter2/9.mdx b/chapters/en/chapter2/9.mdx
index 95d6b4faa..5e87f59b4 100644
--- a/chapters/en/chapter2/9.mdx
+++ b/chapters/en/chapter2/9.mdx
@@ -1,12 +1,12 @@
 # Optimized Inference Deployment
 
-In this section, we'll explore advanced frameworks for optimizing LLM deployments: Text Generation Inference (TGI) and vLLM. These application are primarily used in production environments to serve LLMs to users. So this section is more focused on how to deploy these frameworks in production rather than how to use them for inference on a single machine.
+In this section, we'll explore advanced frameworks for optimizing LLM deployments: Text Generation Inference (TGI), vLLM, and llama.cpp. These applications are primarily used in production environments to serve LLMs to users. This section focuses on how to deploy these frameworks in production rather than how to use them for inference on a single machine.
 
 We'll cover how these tools maximize inference efficiency and simplify production deployments of Large Language Models.
 
 ## Framework Selection Guide
 
-TGI and vLLM serve similar purposes but have distinct characteristics that make them better suited for different use cases. Let's look at the key differences between the two. We'll focus on two key areas: performance and integration.
+TGI, vLLM, and llama.cpp serve similar purposes but have distinct characteristics that make them better suited for different use cases. Let's look at the key differences between them, focusing on performance and integration.
 
 ### Memory Management and Performance
 
@@ -37,37 +37,33 @@ vLLM's key innovation lies in how it manages this cache:
 The PagedAttention approach can lead to up to 24x higher throughput compared to traditional methods, making it a game-changer for production LLM deployments. If you want to go really deep into how PagedAttention works, you can read the [the guide from the vLLM documentation](https://docs.vllm.ai/en/latest/design/kernel/paged_attention.html).
 </Tip>
 
-We can summarize the memory differences in the following table:
+**llama.cpp** is a highly optimized C/C++ implementation originally designed for running LLaMA models on consumer hardware. It focuses on CPU efficiency with optional GPU acceleration and is ideal for resource-constrained environments. llama.cpp uses quantization techniques to reduce model size and memory requirements while maintaining good performance. It implements optimized kernels for various CPU architectures and supports basic KV cache management for efficient token generation.
+
+<Tip title="How llama.cpp Quantization Works">
+Quantization in llama.cpp reduces the precision of model weights from 32-bit or 16-bit floating point to lower precision formats like 8-bit integers (INT8), 4-bit, or even lower. This significantly reduces memory usage and improves inference speed with minimal quality loss.
+
+Key quantization features in llama.cpp include:
+1. **Multiple Quantization Levels**: Supports 8-bit, 4-bit, 3-bit, and even 2-bit quantization
+2. **GGML/GGUF Format**: Uses custom tensor formats optimized for quantized inference
+3. **Mixed Precision**: Can apply different quantization levels to different parts of the model
+4. **Hardware-Specific Optimizations**: Includes optimized code paths for various CPU architectures (AVX2, AVX-512, NEON)
+
+This approach enables running billion-parameter models on consumer hardware with limited memory, making it perfect for local deployments and edge devices.
+</Tip>
+
 
-| Feature | TGI | vLLM |
-|---------|-----|------|
-| Memory Efficiency | Good (Flash Attention) | Excellent (PagedAttention) |
-| Memory Management | HBM-SRAM optimization, single-load computation | Page-based KV cache, non-contiguous allocation |
-| Memory Bottleneck Addressed | Attention computation bandwidth | KV cache management |
-| Key Innovation | Minimizes HBM-SRAM transfers | Virtual memory-style paging for KV cache |
-| Memory Sharing | Limited | Efficient (shared KV cache pages) |
-| Throughput | High | Very High (up to 24x traditional) |
-| Memory Fragmentation | Standard | Reduced by up to 47% |
-| Sequence Length Handling | Fixed | Dynamic |
-| Best Use Case | Stable, predictable workloads | Variable length, concurrent requests |
 
 ### Deployment and Integration
 
-Let's move on to the deployment and integration differences between the two frameworks.
+Let's move on to the deployment and integration differences between the frameworks.
 
 **TGI** excels in enterprise-level deployment with its production-ready features. It comes with built-in Kubernetes support and includes everything you need for running in production, like monitoring through Prometheus and Grafana, automatic scaling, and comprehensive safety features. The system also includes enterprise-grade logging and various protective measures like content filtering and rate limiting to keep your deployment secure and stable.
 
 **vLLM** takes a more flexible, developer-friendly approach to deployment. It's built with Python at its core and can easily replace OpenAI's API in your existing applications. The framework focuses on delivering raw performance and can be customized to fit your specific needs. It works particularly well with Ray for managing clusters, making it a great choice when you need high performance and adaptability.
 
-Here are the key deployment differences:
+**llama.cpp** prioritizes simplicity and portability. Its server implementation is lightweight and can run on a wide range of hardware, from powerful servers to consumer laptops and even some high-end mobile devices. With minimal dependencies and a simple C/C++ core, it's easy to deploy in environments where installing Python frameworks would be challenging. The server provides an OpenAI-compatible API while maintaining a much smaller resource footprint than other solutions.
+
 
-| Feature | TGI | vLLM |
-|---------|-----|------|
-| Deployment Options | Docker, Cloud, K8s | Python Package, Docker |
-| Primary Integration | HuggingFace Ecosystem | OpenAI API Compatible |
-| Monitoring | Built-in Prometheus/Grafana | Custom Metrics |
-| Safety Features | Comprehensive | Basic |
-| Scaling Strategies | Tensor Parallel | Tensor + Pipeline Parallel |
 
 ## Getting Started
 
@@ -90,7 +86,41 @@ docker run --gpus all \
     --model-id HuggingFaceTB/SmolLM2-360M-Instruct
 ```
 
-Then interact with it using the OpenAI client:
+Then interact with it using Hugging Face's InferenceClient:
+
+```python
+from huggingface_hub import InferenceClient
+
+# Initialize client pointing to TGI endpoint
+client = InferenceClient(
+    model="http://localhost:8080",  # URL to the TGI server
+)
+
+# Text generation
+response = client.text_generation(
+    "Tell me a story",
+    max_new_tokens=100,
+    temperature=0.7,
+    top_p=0.95,
+    details=True,
+    stop_sequences=[],
+)
+print(response.generated_text)
+
+# For chat format
+response = client.chat_completion(
+    messages=[
+        {"role": "system", "content": "You are a helpful assistant."},
+        {"role": "user", "content": "Tell me a story"},
+    ],
+    max_tokens=100,
+    temperature=0.7,
+    top_p=0.95,
+)
+print(response.choices[0].message.content)
+```
+
+Alternatively, you can use the OpenAI client:
 
 ```python
 from openai import OpenAI
@@ -114,6 +144,94 @@ response = client.chat.completions.create(
 )
 print(response.choices[0].message.content)
 ```
+{:else if framework === 'llama.cpp'}
+
+llama.cpp is easy to install and use, requiring minimal dependencies and supporting both CPU and GPU inference.
+
+First, install and build llama.cpp:
+
+```sh
+# Clone the repository
+git clone https://github.com/ggerganov/llama.cpp
+cd llama.cpp
+
+# Build the project
+make
+
+# Download the SmolLM2-1.7B-Instruct-GGUF model
+curl -L -O https://huggingface.co/HuggingFaceTB/SmolLM2-1.7B-Instruct-GGUF/resolve/main/smollm2-1.7b-instruct.Q4_K_M.gguf
+```
+
+Then, launch the server (with OpenAI API compatibility):
+
+```sh
+# Start the server
+./server \
+    -m smollm2-1.7b-instruct.Q4_K_M.gguf \
+    --host 0.0.0.0 \
+    --port 8080 \
+    -c 4096 \
+    --n-gpu-layers 0  # Set to a higher number to use GPU
+```
+
+Interact with the server using Hugging Face's InferenceClient:
+
+```python
+from huggingface_hub import InferenceClient
+
+# Initialize client pointing to llama.cpp server
+client = InferenceClient(
+    model="http://localhost:8080/v1",  # URL to the llama.cpp server
+    token="sk-no-key-required"  # llama.cpp server requires this placeholder
+)
+
+# Text generation
+response = client.text_generation(
+    "Tell me a story",
+    max_new_tokens=100,
+    temperature=0.7,
+    top_p=0.95,
+    details=True,
+)
+print(response.generated_text)
+
+# For chat format
+response = client.chat_completion(
+    messages=[
+        {"role": "system", "content": "You are a helpful assistant."},
+        {"role": "user", "content": "Tell me a story"},
+    ],
+    max_tokens=100,
+    temperature=0.7,
+    top_p=0.95,
+)
+print(response.choices[0].message.content)
+```
+
+Alternatively, you can use the OpenAI client:
+
+```python
+from openai import OpenAI
+
+# Initialize client pointing to llama.cpp server
+client = OpenAI(
+    base_url="http://localhost:8080/v1",
+    api_key="sk-no-key-required"  # llama.cpp server requires this placeholder
+)
+
+# Chat completion
+response = client.chat.completions.create(
+    model="smollm2-1.7b-instruct",  # Model identifier can be anything as server only loads one model
+    messages=[
+        {"role": "system", "content": "You are a helpful assistant."},
+        {"role": "user", "content": "Tell me a story"},
+    ],
+    max_tokens=100,
+    temperature=0.7,
+    top_p=0.95,
+)
+print(response.choices[0].message.content)
+```
 {:else}
 
 vLLM is easy to install and use, with both OpenAI API compatibility and a native Python interface.
@@ -127,7 +245,40 @@ python -m vllm.entrypoints.openai.api_server \
     --port 8000
 ```
 
-Then interact with it using the OpenAI client:
+Then interact with it using Hugging Face's InferenceClient:
+
+```python
+from huggingface_hub import InferenceClient
+
+# Initialize client pointing to vLLM endpoint
+client = InferenceClient(
+    model="http://localhost:8000/v1",  # URL to the vLLM server
+)
+
+# Text generation
+response = client.text_generation(
+    "Tell me a story",
+    max_new_tokens=100,
+    temperature=0.7,
+    top_p=0.95,
+    details=True,
+)
+print(response.generated_text)
+
+# For chat format
+response = client.chat_completion(
+    messages=[
+        {"role": "system", "content": "You are a helpful assistant."},
+        {"role": "user", "content": "Tell me a story"},
+    ],
+    max_tokens=100,
+    temperature=0.7,
+    top_p=0.95,
+)
+print(response.choices[0].message.content)
+```
+
+Alternatively, you can use the OpenAI client:
 
 ```python
 from openai import OpenAI
@@ -155,7 +306,7 @@ print(response.choices[0].message.content)
 
 ### Basic Text Generation
 
-Let's look at examples of text generation with both frameworks:
+Let's look at examples of text generation with the frameworks:
 
 {#if framework === 'tgi'}
 
@@ -173,7 +324,38 @@ docker run --gpus all \
     --waiting-served-ratio 1.2
 ```
 
-Then use the OpenAI client for generation:
+Use the InferenceClient for flexible text generation:
+```python
+from huggingface_hub import InferenceClient
+
+client = InferenceClient(model="http://localhost:8080")
+
+# Advanced parameters example
+response = client.chat_completion(
+    messages=[
+        {"role": "system", "content": "You are a creative storyteller."},
+        {"role": "user", "content": "Write a creative story"},
+    ],
+    temperature=0.8,
+    max_tokens=200,
+    top_p=0.95,
+)
+print(response.choices[0].message.content)
+
+# Raw text generation 
+response = client.text_generation(
+    "Write a creative story about space exploration",
+    max_new_tokens=200,
+    temperature=0.8,
+    top_p=0.95,
+    repetition_penalty=1.1,
+    do_sample=True,
+    details=True,
+)
+print(response.generated_text)
+```
+
+Or use the OpenAI client:
 ```python
 from openai import OpenAI
 
@@ -190,9 +372,172 @@ response = client.chat.completions.create(
 )
 print(response.choices[0].message.content)
 ```
+{:else if framework === 'llama.cpp'}
+
+For llama.cpp, you can set advanced parameters when launching the server:
+
+```sh
+./server \
+    -m smollm2-1.7b-instruct.Q4_K_M.gguf \
+    --host 0.0.0.0 \
+    --port 8080 \
+    -c 4096 \            # Context size
+    --threads 8 \        # CPU threads to use
+    --batch-size 512 \   # Batch size for prompt evaluation
+    --n-gpu-layers 0     # GPU layers (0 = CPU only)
+```
+
+Use the InferenceClient:
+
+```python
+from huggingface_hub import InferenceClient
+
+client = InferenceClient(
+    model="http://localhost:8080/v1",
+    token="sk-no-key-required"
+)
+
+# Advanced parameters example
+response = client.chat_completion(
+    messages=[
+        {"role": "system", "content": "You are a creative storyteller."},
+        {"role": "user", "content": "Write a creative story"},
+    ],
+    temperature=0.8,
+    max_tokens=200,
+    top_p=0.95,
+)
+print(response.choices[0].message.content)
+
+# For direct text generation
+response = client.text_generation(
+    "Write a creative story about space exploration",
+    max_new_tokens=200,
+    temperature=0.8,
+    top_p=0.95,
+    repetition_penalty=1.1,
+    details=True,
+)
+print(response.generated_text)
+```
+
+Or use the OpenAI client for generation with control over the sampling parameters:
+
+```python
+from openai import OpenAI
+
+client = OpenAI(base_url="http://localhost:8080/v1", api_key="sk-no-key-required")
+
+# Advanced parameters example
+response = client.chat.completions.create(
+    model="smollm2-1.7b-instruct",
+    messages=[
+        {"role": "system", "content": "You are a creative storyteller."},
+        {"role": "user", "content": "Write a creative story"},
+    ],
+    temperature=0.8,          # Higher for more creativity
+    top_p=0.95,               # Nucleus sampling probability
+    frequency_penalty=0.5,    # Reduce repetition of frequent tokens
+    presence_penalty=0.5,     # Reduce repetition by penalizing tokens already present
+    max_tokens=200,           # Maximum generation length
+)
+print(response.choices[0].message.content)
+```
+
+You can also use llama.cpp's native library for even more control:
+
+```python
+# Using llama-cpp-python package for direct model access
+from llama_cpp import Llama
+
+# Load the model
+llm = Llama(
+    model_path="smollm2-1.7b-instruct.Q4_K_M.gguf",
+    n_ctx=4096,            # Context window size
+    n_threads=8,           # CPU threads
+    n_gpu_layers=0         # GPU layers (0 = CPU only)
+)
+
+# Format prompt according to the model's expected format
+prompt = """<|im_start|>system
+You are a creative storyteller.
+<|im_end|>
+<|im_start|>user
+Write a creative story
+<|im_end|>
+<|im_start|>assistant
+"""
+
+# Generate response with precise parameter control
+output = llm(
+    prompt,
+    max_tokens=200,
+    temperature=0.8,
+    top_p=0.95,
+    frequency_penalty=0.5,
+    presence_penalty=0.5,
+    stop=["<|im_end|>"]
+)
+
+print(output["choices"][0]["text"])
+```
 {:else}
 
-For advanced usage, vLLM provides a native Python interface with fine-grained control:
+For advanced usage with vLLM, you can use the InferenceClient:
+
+```python
+from huggingface_hub import InferenceClient
+
+client = InferenceClient(model="http://localhost:8000/v1")
+
+# Advanced parameters example
+response = client.chat_completion(
+    messages=[
+        {"role": "system", "content": "You are a creative storyteller."},
+        {"role": "user", "content": "Write a creative story"},
+    ],
+    temperature=0.8,
+    max_tokens=200,
+    top_p=0.95,
+)
+print(response.choices[0].message.content)
+
+# For direct text generation
+response = client.text_generation(
+    "Write a creative story about space exploration",
+    max_new_tokens=200,
+    temperature=0.8,
+    top_p=0.95,
+    details=True,
+)
+print(response.generated_text)
+```
+
+You can also use the OpenAI client:
+
+```python
+from openai import OpenAI
+
+client = OpenAI(
+    base_url="http://localhost:8000/v1",
+    api_key="not-needed"
+)
+
+# Advanced parameters example
+response = client.chat.completions.create(
+    model="HuggingFaceTB/SmolLM2-360M-Instruct",
+    messages=[
+        {"role": "system", "content": "You are a creative storyteller."},
+        {"role": "user", "content": "Write a creative story"},
+    ],
+    temperature=0.8,
+    top_p=0.95,
+    max_tokens=200,
+)
+print(response.choices[0].message.content)
+```
+
+vLLM also provides a native Python interface with fine-grained control:
 
 ```python
 from vllm import LLM, SamplingParams
@@ -256,6 +601,29 @@ client.generate(
     repetition_penalty=1.1,  # Reduce repetition
 )
 ```
+{:else if framework === 'llama.cpp'}
+```python
+# Via OpenAI API compatibility
+response = client.completions.create(
+    model="smollm2-1.7b-instruct",  # Model name (can be any string for llama.cpp server)
+    prompt="Write a creative story",
+    temperature=0.8,        # Higher for more creativity
+    top_p=0.95,             # Consider top 95% probability mass 
+    frequency_penalty=1.1,  # Reduce repetition
+    presence_penalty=0.1,   # Reduce repetition
+    max_tokens=100,         # Maximum length
+)
+
+# Via llama-cpp-python direct access
+output = llm(
+    "Write a creative story",
+    temperature=0.8,
+    top_p=0.95,
+    top_k=50,
+    max_tokens=100,
+    repeat_penalty=1.1
+)
+```
 {:else}
 ```python
 params = SamplingParams(
@@ -281,6 +649,24 @@ client.generate(
     no_repeat_ngram_size=3,  # Prevent 3-gram repetition
 )
 ```
+{:else if framework === 'llama.cpp'}
+```python
+# Via OpenAI API
+response = client.completions.create(
+    model="smollm2-1.7b-instruct",
+    prompt="Write a varied text",
+    frequency_penalty=1.1,   # Penalize frequent tokens
+    presence_penalty=0.8,    # Penalize tokens already present
+)
+
+# Via direct library
+output = llm(
+    "Write a varied text",
+    repeat_penalty=1.1,      # Penalize repeated tokens
+    frequency_penalty=0.5,   # Additional frequency penalty
+    presence_penalty=0.5     # Additional presence penalty
+)
+```
 {:else}
 ```python
 params = SamplingParams(
@@ -303,6 +689,23 @@ client.generate(
     stop_sequences=["\n\n", "###"],
 )
 ```
+{:else if framework === 'llama.cpp'}
+```python
+# Via OpenAI API
+response = client.completions.create(
+    model="smollm2-1.7b-instruct",
+    prompt="Generate a short paragraph",
+    max_tokens=100,
+    stop=["\n\n", "###"]
+)
+
+# Via direct library
+output = llm(
+    "Generate a short paragraph",
+    max_tokens=100,
+    stop=["\n\n", "###"]
+)
+```
 {:else}
 ```python
 params = SamplingParams(
@@ -331,6 +734,30 @@ docker run --gpus all -p 8080:80 \
     --max-batch-total-tokens 8192 \
     --max-input-length 4096
 ```
+{:else if framework === 'llama.cpp'}
+llama.cpp uses quantization and optimized memory layout:
+
+```sh
+# Server with memory optimizations
+./server \
+    -m smollm2-1.7b-instruct.Q4_K_M.gguf \
+    --host 0.0.0.0 \
+    --port 8080 \
+    -c 2048 \               # Context size
+    --threads 4 \           # CPU threads
+    --n-gpu-layers 32 \     # Use more GPU layers for larger models
+    --mlock \               # Lock memory to prevent swapping
+    --cont-batching         # Enable continuous batching
+```
+
+For models too large for your GPU, you can use CPU offloading:
+
+```sh
+./server \
+    -m smollm2-1.7b-instruct.Q4_K_M.gguf \
+    --n-gpu-layers 20 \     # Keep first 20 layers on GPU
+    --threads 8             # Use more CPU threads for CPU layers
+```
 {:else}
 vLLM uses PagedAttention for optimal memory management:
 
@@ -356,4 +783,7 @@ llm = LLM(engine_args=engine_args)
 - [vLLM GitHub Repository](https://github.com/vllm-project/vllm)
 - [PagedAttention Paper](https://arxiv.org/abs/2309.06180)
 - [HuggingFace Blog: TGI in Production](https://huggingface.co/blog/tgi-serving)
-- [vLLM Performance Benchmarks](https://vllm.readthedocs.io/en/latest/performance.html)
\ No newline at end of file
+- [vLLM Performance Benchmarks](https://vllm.readthedocs.io/en/latest/performance.html)
+- [llama.cpp GitHub Repository](https://github.com/ggerganov/llama.cpp)
+- [llama.cpp Server Documentation](https://github.com/ggerganov/llama.cpp/blob/master/examples/server/README.md)
+- [llama-cpp-python Repository](https://github.com/abetlen/llama-cpp-python)
\ No newline at end of file

From 82cbe3832351622908cb790e93fe0069b1c2278f Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Wed, 7 May 2025 15:56:44 +0300
Subject: [PATCH 091/167] fix: solve makestyle

---
 chapters/rum/chapter2/6.mdx | 4 ++--
 doc-builder                 | 1 +
 2 files changed, 3 insertions(+), 2 deletions(-)
 create mode 160000 doc-builder

diff --git a/chapters/rum/chapter2/6.mdx b/chapters/rum/chapter2/6.mdx
index a2746481b..fac7b8327 100644
--- a/chapters/rum/chapter2/6.mdx
+++ b/chapters/rum/chapter2/6.mdx
@@ -90,10 +90,10 @@ sequences = ["I've been waiting for a HuggingFace course my whole life.", "So ha
 # Returnează tensori PyTorch
 model_inputs = tokenizer(sequences, padding=True, return_tensors="pt")
 
-# Returnează tensori TensorFlow 
+# Returnează tensori TensorFlow
 model_inputs = tokenizer(sequences, padding=True, return_tensors="tf")
 
-# Returnează array-uri NumPy 
+# Returnează array-uri NumPy
 model_inputs = tokenizer(sequences, padding=True, return_tensors="np")
 ```
 
diff --git a/doc-builder b/doc-builder
new file mode 160000
index 000000000..c92e72cc9
--- /dev/null
+++ b/doc-builder
@@ -0,0 +1 @@
+Subproject commit c92e72cc953d0e595ca5ed37144d01cd4ecfa48b

From e87304dce1c606e121075605fc375834ebbaf45d Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Wed, 7 May 2025 16:05:03 +0300
Subject: [PATCH 092/167] feat: add toctree file

---
 chapters/rum/_toctree.yml | 20 ++++++++++++++++++++
 1 file changed, 20 insertions(+)

diff --git a/chapters/rum/_toctree.yml b/chapters/rum/_toctree.yml
index bb40acb8b..5a149e6f9 100644
--- a/chapters/rum/_toctree.yml
+++ b/chapters/rum/_toctree.yml
@@ -2,3 +2,23 @@
   sections:
   - local: chapter0/1
     title: Introducere
+
+- title: 2. Using 🤗 Transformers
+  sections:
+  - local: chapter2/1
+    title: Introducere
+  - local: chapter2/2
+    title: În spatele pipeline-ului
+  - local: chapter2/3
+    title: Modele
+  - local: chapter2/4
+    title: Tokenizatoare
+  - local: chapter2/5
+    title: Gestionarea secvențelor multiple
+  - local: chapter2/6
+    title: Să punem totul cap la cap
+  - local: chapter2/7
+    title: Utilizarea de bază este completă!
+  - local: chapter2/8
+    title: Quiz la final de capitol
+    quiz: 2
\ No newline at end of file

From 7a7073fe366a5deaa0d73e659b9347f6631b188b Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Wed, 7 May 2025 16:05:29 +0300
Subject: [PATCH 093/167] fix: change the tokenizers wording

---
 chapters/rum/chapter2/2.mdx |  2 +-
 chapters/rum/chapter2/4.mdx | 10 +++++-----
 chapters/rum/chapter2/6.mdx |  2 +-
 3 files changed, 7 insertions(+), 7 deletions(-)

diff --git a/chapters/rum/chapter2/2.mdx b/chapters/rum/chapter2/2.mdx
index 605af9c1e..5649d0b45 100644
--- a/chapters/rum/chapter2/2.mdx
+++ b/chapters/rum/chapter2/2.mdx
@@ -354,7 +354,7 @@ Acum putem concluziona că modelul a prezis următoarele:
 - Prima propoziție: NEGATIV: 0.0402, POZITIV: 0.9598
 - A doua propoziție: NEGATIVĂ: 0.9995, POZITIVĂ: 0.0005
 
-Am reprodus cu succes cele trei etape ale pipeline-ului: preprocesarea cu tokenizere, trecerea intrărilor prin model și postprocesarea! Acum haideți să analizăm în profunzime fiecare dintre aceste etape.
+Am reprodus cu succes cele trei etape ale pipeline-ului: preprocesarea cu tokenizatoare, trecerea intrărilor prin model și postprocesarea! Acum haideți să analizăm în profunzime fiecare dintre aceste etape.
 
 <Tip>
 
diff --git a/chapters/rum/chapter2/4.mdx b/chapters/rum/chapter2/4.mdx
index eb09d7f3d..e861dff98 100644
--- a/chapters/rum/chapter2/4.mdx
+++ b/chapters/rum/chapter2/4.mdx
@@ -1,6 +1,6 @@
 <FrameworkSwitchCourse {fw} />
 
-# Tokenizere[[tokenizere]]
+# Tokenizatoare[[tokenizatoare]]
 
 {#if fw === 'pt'}
 
@@ -65,7 +65,7 @@ print(tokenized_text)
 ['Jim', 'Henson', 'was', 'a', 'puppeteer']
 ```
 
-Există, de asemenea, variații ale tokenizerelor de cuvinte care au reguli suplimentare pentru punctuație. Cu acest tip de tokenizator, putem ajunge la "vocabulare" destul de mari, unde un vocabular este definit de numărul total de token-uri independente pe care le avem în corpus.
+Există, de asemenea, variații ale tokenizatoarelor de cuvinte care au reguli suplimentare pentru punctuație. Cu acest tip de tokenizator, putem ajunge la "vocabulare" destul de mari, unde un vocabular este definit de numărul total de token-uri independente pe care le avem în corpus.
 
 Fiecărui cuvânt i se atribuie un ID, începând de la 0 și mergând până la dimensiunea vocabularului. Modelul utilizează aceste ID-uri pentru a identifica fiecare cuvânt.
 
@@ -80,7 +80,7 @@ O modalitate de a reduce numărul de token-uri necunoscute este de a merge un ni
 <Youtube id="ssLq_EK2jLE"/>
 
 
-Tokenizerele character-based împart textul în caractere, și nu în cuvinte. Acest lucru are două beneficii principale:
+Tokenizatoarele character-based împart textul în caractere, și nu în cuvinte. Acest lucru are două beneficii principale:
 
 - Dimensiunea vocabularului este mult mai mică.
 - Există mult mai puține token-uri în afara vocabularului (necunoscute), deoarece fiecare cuvânt poate fi construit din caractere.
@@ -127,11 +127,11 @@ Nu este surprinzător faptul că există mult mai multe tehnici. Iată câteva:
 - WordPiece, utilizată în BERT
 - SentencePiece sau Unigram, utilizate în mai multe modele multilingve
 
-Acum ar trebui să cunoașteți destul de bine cum funcționează tokenizerele pentru a începe să utilizați API-ul.
+Acum ar trebui să cunoașteți destul de bine cum funcționează tokenizatoarele pentru a începe să utilizați API-ul.
 
 ## Încărcarea și salvarea[[încărcarea-și-salvarea]]
 
-Încărcarea și salvarea tokenizerelor este la fel de simplă ca în cazul modelelor. De fapt, se bazează pe aceleași două metode: `from_pretrained()` și `save_pretrained()`. Aceste metode vor încărca sau salva algoritmul utilizat de tokenizator (un pic ca *arhitectura* modelului), precum și vocabularul său (un pic ca *weight-urile* modelului).
+Încărcarea și salvarea tokenizatoarelor este la fel de simplă ca în cazul modelelor. De fapt, se bazează pe aceleași două metode: `from_pretrained()` și `save_pretrained()`. Aceste metode vor încărca sau salva algoritmul utilizat de tokenizator (un pic ca *arhitectura* modelului), precum și vocabularul său (un pic ca *weight-urile* modelului).
 
 Încărcarea tokenizatorului BERT antrenat cu același checkpoint ca BERT se face în același mod ca și încărcarea modelului, cu excepția faptului că folosim clasa `BertTokenizer`:
 
diff --git a/chapters/rum/chapter2/6.mdx b/chapters/rum/chapter2/6.mdx
index fac7b8327..a827701b9 100644
--- a/chapters/rum/chapter2/6.mdx
+++ b/chapters/rum/chapter2/6.mdx
@@ -22,7 +22,7 @@
 
 {/if}
 
-În ultimele secțiuni, ne-am străduit să facem cea mai mare parte a muncii manual. Am explorat modul în care funcționează tokenizerele și am analizat tokenizarea, conversia în ID-uri de intrare, padding, trunchiere și măști de atenție.
+În ultimele secțiuni, ne-am străduit să facem cea mai mare parte a muncii manual. Am explorat modul în care funcționează tokenizatoarele și am analizat tokenizarea, conversia în ID-uri de intrare, padding, trunchiere și măști de atenție.
 
 Cu toate acestea, după cum am văzut în secțiunea 2, API-ul 🤗 Transformers poate gestiona toate acestea pentru noi cu o funcție de nivel înalt în care ne vom adânci aici. Atunci când apelați `tokenizer` direct pe propoziție, primiți înapoi intrări care sunt gata să treacă prin modelul dvs:
 

From 0fbde1697fc83ec87587b29fad373fcca2f57faa Mon Sep 17 00:00:00 2001
From: burtenshaw <ben.burtenshaw@gmail.com>
Date: Mon, 12 May 2025 10:54:32 +0200
Subject: [PATCH 094/167] rename and format code

---
 chapters/en/chapter2/3.mdx |   28 +-
 chapters/en/chapter2/8.mdx | 1031 ++++++++++++++++++++++++++---------
 chapters/en/chapter2/9.mdx | 1041 +++++++++---------------------------
 3 files changed, 1056 insertions(+), 1044 deletions(-)

diff --git a/chapters/en/chapter2/3.mdx b/chapters/en/chapter2/3.mdx
index 67fca8215..0c93ab243 100644
--- a/chapters/en/chapter2/3.mdx
+++ b/chapters/en/chapter2/3.mdx
@@ -168,7 +168,9 @@ But there's a problem: the two lists don't have the same length! Arrays and tens
 If we ask the tokenizer to pad the inputs, it will make all sentences the same length by adding a special padding token to the sentences that are shorter than the longest one:
 
 ```py
-encoded_input = tokenizer(["How are you?", "I'm fine, thank you!"], padding=True, return_tensors="pt")
+encoded_input = tokenizer(
+    ["How are you?", "I'm fine, thank you!"], padding=True, return_tensors="pt"
+)
 print(encoded_input)
 ```
 
@@ -188,7 +190,10 @@ Now we have rectangular tensors! Note that the padding tokens have been encoded
 The tensors might get too big to be processed by the model. For instance, BERT was only pretrained with sequences up to 512 tokens, so it cannot process longer sequences. If you have sequences longer than the model can handle, you'll need to truncate them with the `truncation` parameter:
 
 ```py
-encoded_input = tokenizer("This is a very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very long sentence.", truncation=True)
+encoded_input = tokenizer(
+    "This is a very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very very long sentence.",
+    truncation=True,
+)
 print(encoded_input["input_ids"])
 ```
 
@@ -250,7 +255,24 @@ Once tokenized, we have:
 
 ```python
 encoded_sequences = [
-    [101, 1045, 1005, 2310, 2042, 3403, 2005, 1037, 17662, 12172, 2607, 2026, 2878, 2166, 1012, 102],
+    [
+        101,
+        1045,
+        1005,
+        2310,
+        2042,
+        3403,
+        2005,
+        1037,
+        17662,
+        12172,
+        2607,
+        2026,
+        2878,
+        2166,
+        1012,
+        102,
+    ],
     [101, 1045, 5223, 2023, 2061, 2172, 999, 102],
 ]
 ```
diff --git a/chapters/en/chapter2/8.mdx b/chapters/en/chapter2/8.mdx
index 1e51522a2..1482fa92b 100644
--- a/chapters/en/chapter2/8.mdx
+++ b/chapters/en/chapter2/8.mdx
@@ -1,252 +1,779 @@
-<FrameworkSwitchCourse {fw} />
-
-<!-- DISABLE-FRONTMATTER-SECTIONS -->
-
-# End-of-chapter quiz[[end-of-chapter-quiz]]
-
-<CourseFloatingBanner
-    chapter={2}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-### 1. What is the order of the language modeling pipeline?
-
-<Question
-	choices={[
-		{
-			text: "First, the model, which handles text and returns raw predictions. The tokenizer then makes sense of these predictions and converts them back to text when needed.",
-			explain: "The model cannot understand text! The tokenizer must first tokenize the text and convert it to IDs so that it is understandable by the model."
-		},
-		{
-			text: "First, the tokenizer, which handles text and returns IDs. The model handles these IDs and outputs a prediction, which can be some text.",
-			explain: "The model's prediction cannot be text straight away. The tokenizer has to be used in order to convert the prediction back to text!"
-		},
-		{
-			text: "The tokenizer handles text and returns IDs. The model handles these IDs and outputs a prediction. The tokenizer can then be used once again to convert these predictions back to some text.",
-			explain: "Correct! The tokenizer can be used for both tokenizing and de-tokenizing.",
-            correct: true
-		}
-	]}
-/>
-
-### 2. How many dimensions does the tensor output by the base Transformer model have, and what are they?
-
-<Question
-	choices={[
-		{
-			text: "2: The sequence length and the batch size",
-			explain: "False! The tensor output by the model has a third dimension: hidden size."
-		},
-		{
-			text: "2: The sequence length and the hidden size",
-			explain: "False! All Transformer models handle batches, even with a single sequence; that would be a batch size of 1!"
-		},
-		{
-			text: "3: The sequence length, the batch size, and the hidden size",
-			explain: "Correct!",
-            correct: true
-		}
-	]}
-/>
-
-### 3. Which of the following is an example of subword tokenization?
-
-<Question
-	choices={[
-		{
-			text: "WordPiece",
-			explain: "Yes, that's one example of subword tokenization!",
-            correct: true
-		},
-		{
-			text: "Character-based tokenization",
-			explain: "Character-based tokenization is not a type of subword tokenization."
-		},
-		{
-			text: "Splitting on whitespace and punctuation",
-			explain: "That's a word-based tokenization scheme!"
-		},
-		{
-			text: "BPE",
-			explain: "Yes, that's one example of subword tokenization!",
-            correct: true
-        },
-		{
-			text: "Unigram",
-			explain: "Yes, that's one example of subword tokenization!",
-            correct: true
-        },
-		{
-			text: "None of the above",
-			explain: "Incorrect!"
-        }
-	]}
-/>
-
-### 4. What is a model head?
-
-<Question
-	choices={[
-		{
-			text: "A component of the base Transformer network that redirects tensors to their correct layers",
-			explain: "Incorrect! There's no such component."
-		},
-		{
-			text: "Also known as the self-attention mechanism, it adapts the representation of a token according to the other tokens of the sequence",
-			explain: "Incorrect! The self-attention layer does contain attention \"heads,\" but these are not adaptation heads."
-		},
-		{
-			text: "An additional component, usually made up of one or a few layers, to convert the transformer predictions to a task-specific output",
-			explain: "That's right. Adaptation heads, also known simply as heads, come up in different forms: language modeling heads, question answering heads, sequence classification heads... ",
-			correct: true
-		} 
-	]}
-/>
-
-### 5. What is an AutoModel?
-
-<Question
-	choices={[
-		{
-			text: "A model that automatically trains on your data",
-			explain: "Incorrect. Are you mistaking this with our <a href='https://huggingface.co/autotrain'>AutoTrain</a> product?"
-		},
-		{
-			text: "An object that returns the correct architecture based on the checkpoint",
-			explain: "Exactly: the <code>AutoModel</code> only needs to know the checkpoint from which to initialize to return the correct architecture.",
-			correct: true
-		},
-		{
-			text: "A model that automatically detects the language used for its inputs to load the correct weights",
-			explain: "Incorrect; while some checkpoints and models are capable of handling multiple languages, there are no built-in tools for automatic checkpoint selection according to language. You should head over to the <a href='https://huggingface.co/models'>Model Hub</a> to find the best checkpoint for your task!"
-		} 
-	]}
-/>
-
-### 6. What are the techniques to be aware of when batching sequences of different lengths together?
-
-<Question
-	choices={[
-		{
-			text: "Truncating",
-			explain: "Yes, truncation is a correct way of evening out sequences so that they fit in a rectangular shape. Is it the only one, though?",
-			correct: true
-		},
-		{
-			text: "Returning tensors",
-			explain: "While the other techniques allow you to return rectangular tensors, returning tensors isn't helpful when batching sequences together."
-		},
-		{
-			text: "Padding",
-			explain: "Yes, padding is a correct way of evening out sequences so that they fit in a rectangular shape. Is it the only one, though?",
-			correct: true
-		}, 
-		{
-			text: "Attention masking",
-			explain: "Absolutely! Attention masks are of prime importance when handling sequences of different lengths. That's not the only technique to be aware of, however.",
-			correct: true
-		} 
-	]}
-/>
-
-### 7. What is the point of applying a SoftMax function to the logits output by a sequence classification model?
-
-<Question
-	choices={[
-		{
-			text: "It softens the logits so that they're more reliable.",
-			explain: "No, the SoftMax function does not affect the reliability of results."
-		},
-		{
-			text: "It applies a lower and upper bound so that they're understandable.",
-			explain: "Correct! The resulting values are bound between 0 and 1. That's not the only reason we use a SoftMax function, though.",
-            correct: true
-		},
-		{
-			text: "The total sum of the output is then 1, resulting in a possible probabilistic interpretation.",
-			explain: "Correct! That's not the only reason we use a SoftMax function, though.",
-            correct: true
-		}
-	]}
-/>
-
-### 8. What method is most of the tokenizer API centered around?
-
-<Question
-	choices={[
-		{
-			text: "<code>encode</code>, as it can encode text into IDs and IDs into predictions",
-			explain: "Wrong! While the <code>encode</code> method does exist on tokenizers, it does not exist on models."
-		},
-		{
-			text: "Calling the tokenizer object directly.",
-			explain: "Exactly! The <code>__call__</code> method of the tokenizer is a very powerful method which can handle pretty much anything. It is also the method used to retrieve predictions from a model.",
-			correct: true
-		},
-		{
-			text: "<code>pad</code>",
-			explain: "Wrong! Padding is very useful, but it's just one part of the tokenizer API."
-		},
-		{
-			text: "<code>tokenize</code>",
-			explain: "The <code>tokenize</code> method is arguably one of the most useful methods, but it isn't the core of the tokenizer API."
-		}
-	]}
-/>
-
-### 9. What does the `result` variable contain in this code sample?
-
-```py
-from transformers import AutoTokenizer
-
-tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
-result = tokenizer.tokenize("Hello!")
-```
-
-<Question
-	choices={[
-		{
-			text: "A list of strings, each string being a token",
-			explain: "Absolutely! Convert this to IDs, and send them to a model!",
-            correct: true
-		},
-		{
-			text: "A list of IDs",
-			explain: "Incorrect; that's what the <code>__call__</code> or <code>convert_tokens_to_ids</code> method is for!"
-		},
-		{
-			text: "A string containing all of the tokens",
-			explain: "This would be suboptimal, as the goal is to split the string into multiple tokens."
-		}
-	]}
-/>
-
-### 10. Is there something wrong with the following code?
-
-```py
-from transformers import AutoTokenizer, AutoModel
-
-tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
-model = AutoModel.from_pretrained("gpt2")
-
-encoded = tokenizer("Hey!", return_tensors="pt")
-result = model(**encoded)
-```
-
-<Question
-	choices={[
-		{
-			text: "No, it seems correct.",
-			explain: "Unfortunately, coupling a model with a tokenizer that was trained with a different checkpoint is rarely a good idea. The model was not trained to make sense out of this tokenizer's output, so the model output (if it can even run!) will not make any sense."
-		},
-		{
-			text: "The tokenizer and model should always be from the same checkpoint.",
-			explain: "Right!",
-            correct: true
-		},
-		{
-			text: "It's good practice to pad and truncate with the tokenizer as every input is a batch.",
-			explain: "It's true that every model input needs to be a batch. However, truncating or padding this sequence wouldn't necessarily make sense as there is only one of it, and those are techniques to batch together a list of sentences."
-		}
-	]}
-/>
+# Optimized Inference Deployment
+
+In this section, we'll explore advanced frameworks for optimizing LLM deployments: Text Generation Inference (TGI), vLLM, and llama.cpp. These applications are primarily used in production environments to serve LLMs to users. This section focuses on how to deploy these frameworks in production rather than how to use them for inference on a single machine.
+
+We'll cover how these tools maximize inference efficiency and simplify production deployments of Large Language Models.
+
+## Framework Selection Guide
+
+TGI, vLLM, and llama.cpp serve similar purposes but have distinct characteristics that make them better suited for different use cases. Let's look at the key differences between them, focusing on performance and integration.
+
+### Memory Management and Performance
+
+**TGI** is designed to be stable and predictable in production, using fixed sequence lengths to keep memory usage consistent. TGI manages memory using Flash Attention 2 and continuous batching techniques. This means it can process attention calculations very efficiently and keep the GPU busy by constantly feeding it work. The system can move parts of the model between CPU and GPU when needed, which helps handle larger models. 
+
+<img src="https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/tgi/flash-attn.png" alt="Flash Attention" />
+
+<Tip title="How Flash Attention Works">
+Flash Attention is a technique that optimizes the attention mechanism in transformer models by addressing memory bandwidth bottlenecks. As discussed earlier in [section 12.3](2.mdx), the attention mechanism has quadratic complexity and memory usage, making it inefficient for long sequences.
+
+The key innovation is in how it manages memory transfers between High Bandwidth Memory (HBM) and faster SRAM cache. Traditional attention repeatedly transfers data between HBM and SRAM, creating bottlenecks by leaving the GPU idle. Flash Attention loads data once into SRAM and performs all calculations there, minimizing expensive memory transfers. 
+
+While the benefits are most significant during training, Flash Attention's reduced VRAM usage and improved efficiency make it valuable for inference as well, enabling faster and more scalable LLM serving.
+</Tip>
+
+**vLLM** takes a different approach by using PagedAttention. Just like how a computer manages its memory in pages, vLLM splits the model's memory into smaller blocks. This clever system means it can handle different-sized requests more flexibly and doesn't waste memory space. It's particularly good at sharing memory between different requests and reduces memory fragmentation, which makes the whole system more efficient.
+
+<Tip title="How Paged Attention Works">
+Paged Attention is a technique that addresses another critical bottleneck in LLM inference: KV cache memory management. As discussed in [section 12.3](2.mdx), during text generation, the model stores attention keys and values (KV cache) for each generated token to reduce redundant computations. The KV cache can become enormous, especially with long sequences or multiple concurrent requests.
+
+vLLM's key innovation lies in how it manages this cache:
+
+1. **Memory Paging**: Instead of treating the KV cache as one large block, it's divided into fixed-size "pages" (similar to virtual memory in operating systems).
+2. **Non-contiguous Storage**: Pages don't need to be stored contiguously in GPU memory, allowing for more flexible memory allocation.
+3. **Page Table Management**: A page table tracks which pages belong to which sequence, enabling efficient lookup and access.
+4. **Memory Sharing**: For operations like parallel sampling, pages storing the KV cache for the prompt can be shared across multiple sequences.
+
+The PagedAttention approach can lead to up to 24x higher throughput compared to traditional methods, making it a game-changer for production LLM deployments. If you want to go really deep into how PagedAttention works, you can read the [the guide from the vLLM documentation](https://docs.vllm.ai/en/latest/design/kernel/paged_attention.html).
+</Tip>
+
+**llama.cpp** is a highly optimized C/C++ implementation originally designed for running LLaMA models on consumer hardware. It focuses on CPU efficiency with optional GPU acceleration and is ideal for resource-constrained environments. llama.cpp uses quantization techniques to reduce model size and memory requirements while maintaining good performance. It implements optimized kernels for various CPU architectures and supports basic KV cache management for efficient token generation.
+
+<Tip title="How llama.cpp Quantization Works">
+Quantization in llama.cpp reduces the precision of model weights from 32-bit or 16-bit floating point to lower precision formats like 8-bit integers (INT8), 4-bit, or even lower. This significantly reduces memory usage and improves inference speed with minimal quality loss.
+
+Key quantization features in llama.cpp include:
+1. **Multiple Quantization Levels**: Supports 8-bit, 4-bit, 3-bit, and even 2-bit quantization
+2. **GGML/GGUF Format**: Uses custom tensor formats optimized for quantized inference
+3. **Mixed Precision**: Can apply different quantization levels to different parts of the model
+4. **Hardware-Specific Optimizations**: Includes optimized code paths for various CPU architectures (AVX2, AVX-512, NEON)
+
+This approach enables running billion-parameter models on consumer hardware with limited memory, making it perfect for local deployments and edge devices.
+</Tip>
+
+
+
+### Deployment and Integration
+
+Let's move on to the deployment and integration differences between the frameworks.
+
+**TGI** excels in enterprise-level deployment with its production-ready features. It comes with built-in Kubernetes support and includes everything you need for running in production, like monitoring through Prometheus and Grafana, automatic scaling, and comprehensive safety features. The system also includes enterprise-grade logging and various protective measures like content filtering and rate limiting to keep your deployment secure and stable.
+
+**vLLM** takes a more flexible, developer-friendly approach to deployment. It's built with Python at its core and can easily replace OpenAI's API in your existing applications. The framework focuses on delivering raw performance and can be customized to fit your specific needs. It works particularly well with Ray for managing clusters, making it a great choice when you need high performance and adaptability.
+
+**llama.cpp** prioritizes simplicity and portability. Its server implementation is lightweight and can run on a wide range of hardware, from powerful servers to consumer laptops and even some high-end mobile devices. With minimal dependencies and a simple C/C++ core, it's easy to deploy in environments where installing Python frameworks would be challenging. The server provides an OpenAI-compatible API while maintaining a much smaller resource footprint than other solutions.
+
+
+
+## Getting Started
+
+Let's explore how to use these frameworks for deploying LLMs, starting with installation and basic setup.
+
+### Installation and Basic Setup
+
+{#if framework === 'tgi'}
+
+TGI is easy to install and use, with deep integration into the Hugging Face ecosystem.
+
+First, launch the TGI server using Docker:
+
+```sh
+docker run --gpus all \
+    --shm-size 1g \
+    -p 8080:80 \
+    -v ~/.cache/huggingface:/data \
+    ghcr.io/huggingface/text-generation-inference:latest \
+    --model-id HuggingFaceTB/SmolLM2-360M-Instruct
+```
+
+Then interact with it using Hugging Face's InferenceClient:
+
+```python
+from huggingface_hub import InferenceClient
+
+# Initialize client pointing to TGI endpoint
+client = InferenceClient(
+    model="http://localhost:8080",  # URL to the TGI server
+)
+
+# Text generation
+response = client.text_generation(
+    "Tell me a story",
+    max_new_tokens=100,
+    temperature=0.7,
+    top_p=0.95,
+    details=True,
+    stop_sequences=[],
+)
+print(response.generated_text)
+
+# For chat format
+response = client.chat_completion(
+    messages=[
+        {"role": "system", "content": "You are a helpful assistant."},
+        {"role": "user", "content": "Tell me a story"},
+    ],
+    max_tokens=100,
+    temperature=0.7,
+    top_p=0.95,
+)
+print(response.choices[0].message.content)
+```
+
+Alternatively, you can use the OpenAI client:
+
+```python
+from openai import OpenAI
+
+# Initialize client pointing to TGI endpoint
+client = OpenAI(
+    base_url="http://localhost:8080/v1",  # Make sure to include /v1
+    api_key="not-needed",  # TGI doesn't require an API key by default
+)
+
+# Chat completion
+response = client.chat.completions.create(
+    model="HuggingFaceTB/SmolLM2-360M-Instruct",
+    messages=[
+        {"role": "system", "content": "You are a helpful assistant."},
+        {"role": "user", "content": "Tell me a story"},
+    ],
+    max_tokens=100,
+    temperature=0.7,
+    top_p=0.95,
+)
+print(response.choices[0].message.content)
+```
+{:else if framework === 'llama.cpp'}
+
+llama.cpp is easy to install and use, requiring minimal dependencies and supporting both CPU and GPU inference.
+
+First, install and build llama.cpp:
+
+```sh
+# Clone the repository
+git clone https://github.com/ggerganov/llama.cpp
+cd llama.cpp
+
+# Build the project
+make
+
+# Download the SmolLM2-1.7B-Instruct-GGUF model
+curl -L -O https://huggingface.co/HuggingFaceTB/SmolLM2-1.7B-Instruct-GGUF/resolve/main/smollm2-1.7b-instruct.Q4_K_M.gguf
+```
+
+Then, launch the server (with OpenAI API compatibility):
+
+```sh
+# Start the server
+./server \
+    -m smollm2-1.7b-instruct.Q4_K_M.gguf \
+    --host 0.0.0.0 \
+    --port 8080 \
+    -c 4096 \
+    --n-gpu-layers 0  # Set to a higher number to use GPU
+```
+
+Interact with the server using Hugging Face's InferenceClient:
+
+```python
+from huggingface_hub import InferenceClient
+
+# Initialize client pointing to llama.cpp server
+client = InferenceClient(
+    model="http://localhost:8080/v1",  # URL to the llama.cpp server
+    token="sk-no-key-required",  # llama.cpp server requires this placeholder
+)
+
+# Text generation
+response = client.text_generation(
+    "Tell me a story",
+    max_new_tokens=100,
+    temperature=0.7,
+    top_p=0.95,
+    details=True,
+)
+print(response.generated_text)
+
+# For chat format
+response = client.chat_completion(
+    messages=[
+        {"role": "system", "content": "You are a helpful assistant."},
+        {"role": "user", "content": "Tell me a story"},
+    ],
+    max_tokens=100,
+    temperature=0.7,
+    top_p=0.95,
+)
+print(response.choices[0].message.content)
+```
+
+Alternatively, you can use the OpenAI client:
+
+```python
+from openai import OpenAI
+
+# Initialize client pointing to llama.cpp server
+client = OpenAI(
+    base_url="http://localhost:8080/v1",
+    api_key="sk-no-key-required",  # llama.cpp server requires this placeholder
+)
+
+# Chat completion
+response = client.chat.completions.create(
+    model="smollm2-1.7b-instruct",  # Model identifier can be anything as server only loads one model
+    messages=[
+        {"role": "system", "content": "You are a helpful assistant."},
+        {"role": "user", "content": "Tell me a story"},
+    ],
+    max_tokens=100,
+    temperature=0.7,
+    top_p=0.95,
+)
+print(response.choices[0].message.content)
+```
+{:else}
+
+vLLM is easy to install and use, with both OpenAI API compatibility and a native Python interface.
+
+First, launch the vLLM OpenAI-compatible server:
+
+```sh
+python -m vllm.entrypoints.openai.api_server \
+    --model HuggingFaceTB/SmolLM2-360M-Instruct \
+    --host 0.0.0.0 \
+    --port 8000
+```
+
+Then interact with it using Hugging Face's InferenceClient:
+
+```python
+from huggingface_hub import InferenceClient
+
+# Initialize client pointing to vLLM endpoint
+client = InferenceClient(
+    model="http://localhost:8000/v1",  # URL to the vLLM server
+)
+
+# Text generation
+response = client.text_generation(
+    "Tell me a story",
+    max_new_tokens=100,
+    temperature=0.7,
+    top_p=0.95,
+    details=True,
+)
+print(response.generated_text)
+
+# For chat format
+response = client.chat_completion(
+    messages=[
+        {"role": "system", "content": "You are a helpful assistant."},
+        {"role": "user", "content": "Tell me a story"},
+    ],
+    max_tokens=100,
+    temperature=0.7,
+    top_p=0.95,
+)
+print(response.choices[0].message.content)
+```
+
+Alternatively, you can use the OpenAI client:
+
+```python
+from openai import OpenAI
+
+# Initialize client pointing to vLLM endpoint
+client = OpenAI(
+    base_url="http://localhost:8000/v1",
+    api_key="not-needed",  # vLLM doesn't require an API key by default
+)
+
+# Chat completion
+response = client.chat.completions.create(
+    model="HuggingFaceTB/SmolLM2-360M-Instruct",
+    messages=[
+        {"role": "system", "content": "You are a helpful assistant."},
+        {"role": "user", "content": "Tell me a story"},
+    ],
+    max_tokens=100,
+    temperature=0.7,
+    top_p=0.95,
+)
+print(response.choices[0].message.content)
+```
+{/if}
+
+### Basic Text Generation
+
+Let's look at examples of text generation with the frameworks:
+
+{#if framework === 'tgi'}
+
+First, deploy TGI with advanced parameters:
+```sh
+docker run --gpus all \
+    --shm-size 1g \
+    -p 8080:80 \
+    -v ~/.cache/huggingface:/data \
+    ghcr.io/huggingface/text-generation-inference:latest \
+    --model-id HuggingFaceTB/SmolLM2-360M-Instruct \
+    --max-total-tokens 4096 \
+    --max-input-length 3072 \
+    --max-batch-total-tokens 8192 \
+    --waiting-served-ratio 1.2
+```
+
+Use the InferenceClient for flexible text generation:
+```python
+from huggingface_hub import InferenceClient
+
+client = InferenceClient(model="http://localhost:8080")
+
+# Advanced parameters example
+response = client.chat_completion(
+    messages=[
+        {"role": "system", "content": "You are a creative storyteller."},
+        {"role": "user", "content": "Write a creative story"},
+    ],
+    temperature=0.8,
+    max_tokens=200,
+    top_p=0.95,
+)
+print(response.choices[0].message.content)
+
+# Raw text generation
+response = client.text_generation(
+    "Write a creative story about space exploration",
+    max_new_tokens=200,
+    temperature=0.8,
+    top_p=0.95,
+    repetition_penalty=1.1,
+    do_sample=True,
+    details=True,
+)
+print(response.generated_text)
+```
+
+Or use the OpenAI client:
+```python
+from openai import OpenAI
+
+client = OpenAI(base_url="http://localhost:8080/v1", api_key="not-needed")
+
+# Advanced parameters example
+response = client.chat.completions.create(
+    model="HuggingFaceTB/SmolLM2-360M-Instruct",
+    messages=[
+        {"role": "system", "content": "You are a creative storyteller."},
+        {"role": "user", "content": "Write a creative story"},
+    ],
+    temperature=0.8,  # Higher for more creativity
+)
+print(response.choices[0].message.content)
+```
+{:else if framework === 'llama.cpp'}
+
+For llama.cpp, you can set advanced parameters when launching the server:
+
+```sh
+./server \
+    -m smollm2-1.7b-instruct.Q4_K_M.gguf \
+    --host 0.0.0.0 \
+    --port 8080 \
+    -c 4096 \            # Context size
+    --threads 8 \        # CPU threads to use
+    --batch-size 512 \   # Batch size for prompt evaluation
+    --n-gpu-layers 0     # GPU layers (0 = CPU only)
+```
+
+Use the InferenceClient:
+
+```python
+from huggingface_hub import InferenceClient
+
+client = InferenceClient(model="http://localhost:8080/v1", token="sk-no-key-required")
+
+# Advanced parameters example
+response = client.chat_completion(
+    messages=[
+        {"role": "system", "content": "You are a creative storyteller."},
+        {"role": "user", "content": "Write a creative story"},
+    ],
+    temperature=0.8,
+    max_tokens=200,
+    top_p=0.95,
+)
+print(response.choices[0].message.content)
+
+# For direct text generation
+response = client.text_generation(
+    "Write a creative story about space exploration",
+    max_new_tokens=200,
+    temperature=0.8,
+    top_p=0.95,
+    repetition_penalty=1.1,
+    details=True,
+)
+print(response.generated_text)
+```
+
+Or use the OpenAI client for generation with control over the sampling parameters:
+
+```python
+from openai import OpenAI
+
+client = OpenAI(base_url="http://localhost:8080/v1", api_key="sk-no-key-required")
+
+# Advanced parameters example
+response = client.chat.completions.create(
+    model="smollm2-1.7b-instruct",
+    messages=[
+        {"role": "system", "content": "You are a creative storyteller."},
+        {"role": "user", "content": "Write a creative story"},
+    ],
+    temperature=0.8,  # Higher for more creativity
+    top_p=0.95,  # Nucleus sampling probability
+    frequency_penalty=0.5,  # Reduce repetition of frequent tokens
+    presence_penalty=0.5,  # Reduce repetition by penalizing tokens already present
+    max_tokens=200,  # Maximum generation length
+)
+print(response.choices[0].message.content)
+```
+
+You can also use llama.cpp's native library for even more control:
+
+```python
+# Using llama-cpp-python package for direct model access
+from llama_cpp import Llama
+
+# Load the model
+llm = Llama(
+    model_path="smollm2-1.7b-instruct.Q4_K_M.gguf",
+    n_ctx=4096,  # Context window size
+    n_threads=8,  # CPU threads
+    n_gpu_layers=0,  # GPU layers (0 = CPU only)
+)
+
+# Format prompt according to the model's expected format
+prompt = """<|im_start|>system
+You are a creative storyteller.
+<|im_end|>
+<|im_start|>user
+Write a creative story
+<|im_end|>
+<|im_start|>assistant
+"""
+
+# Generate response with precise parameter control
+output = llm(
+    prompt,
+    max_tokens=200,
+    temperature=0.8,
+    top_p=0.95,
+    frequency_penalty=0.5,
+    presence_penalty=0.5,
+    stop=["<|im_end|>"],
+)
+
+print(output["choices"][0]["text"])
+```
+{:else}
+
+For advanced usage with vLLM, you can use the InferenceClient:
+
+```python
+from huggingface_hub import InferenceClient
+
+client = InferenceClient(model="http://localhost:8000/v1")
+
+# Advanced parameters example
+response = client.chat_completion(
+    messages=[
+        {"role": "system", "content": "You are a creative storyteller."},
+        {"role": "user", "content": "Write a creative story"},
+    ],
+    temperature=0.8,
+    max_tokens=200,
+    top_p=0.95,
+)
+print(response.choices[0].message.content)
+
+# For direct text generation
+response = client.text_generation(
+    "Write a creative story about space exploration",
+    max_new_tokens=200,
+    temperature=0.8,
+    top_p=0.95,
+    details=True,
+)
+print(response.generated_text)
+```
+
+You can also use the OpenAI client:
+
+```python
+from openai import OpenAI
+
+client = OpenAI(base_url="http://localhost:8000/v1", api_key="not-needed")
+
+# Advanced parameters example
+response = client.chat.completions.create(
+    model="HuggingFaceTB/SmolLM2-360M-Instruct",
+    messages=[
+        {"role": "system", "content": "You are a creative storyteller."},
+        {"role": "user", "content": "Write a creative story"},
+    ],
+    temperature=0.8,
+    top_p=0.95,
+    max_tokens=200,
+)
+print(response.choices[0].message.content)
+```
+
+vLLM also provides a native Python interface with fine-grained control:
+
+```python
+from vllm import LLM, SamplingParams
+
+# Initialize the model with advanced parameters
+llm = LLM(
+    model="HuggingFaceTB/SmolLM2-360M-Instruct",
+    gpu_memory_utilization=0.85,
+    max_num_batched_tokens=8192,
+    max_num_seqs=256,
+    block_size=16,
+)
+
+# Configure sampling parameters
+sampling_params = SamplingParams(
+    temperature=0.8,  # Higher for more creativity
+    top_p=0.95,  # Consider top 95% probability mass
+    max_tokens=100,  # Maximum length
+    presence_penalty=1.1,  # Reduce repetition
+    frequency_penalty=1.1,  # Reduce repetition
+    stop=["\n\n", "###"],  # Stop sequences
+)
+
+# Generate text
+prompt = "Write a creative story"
+outputs = llm.generate(prompt, sampling_params)
+print(outputs[0].outputs[0].text)
+
+# For chat-style interactions
+chat_prompt = [
+    {"role": "system", "content": "You are a creative storyteller."},
+    {"role": "user", "content": "Write a creative story"},
+]
+formatted_prompt = llm.get_chat_template()(chat_prompt)  # Uses model's chat template
+outputs = llm.generate(formatted_prompt, sampling_params)
+print(outputs[0].outputs[0].text)
+```
+{/if}
+
+## Advanced Generation Control
+
+### Token Selection and Sampling
+
+The process of generating text involves selecting the next token at each step. This selection process can be controlled through various parameters:
+
+1. **Raw Logits**: The initial output probabilities for each token
+2. **Temperature**: Controls randomness in selection (higher = more creative)
+3. **Top-p (Nucleus) Sampling**: Filters to top tokens making up X% of probability mass
+4. **Top-k Filtering**: Limits selection to k most likely tokens
+
+Here's how to configure these parameters:
+
+{#if framework === 'tgi'}
+```python
+client.generate(
+    "Write a creative story",
+    temperature=0.8,  # Higher for more creativity
+    top_p=0.95,  # Consider top 95% probability mass
+    top_k=50,  # Consider top 50 tokens
+    max_new_tokens=100,  # Maximum length
+    repetition_penalty=1.1,  # Reduce repetition
+)
+```
+{:else if framework === 'llama.cpp'}
+```python
+# Via OpenAI API compatibility
+response = client.completions.create(
+    model="smollm2-1.7b-instruct",  # Model name (can be any string for llama.cpp server)
+    prompt="Write a creative story",
+    temperature=0.8,  # Higher for more creativity
+    top_p=0.95,  # Consider top 95% probability mass
+    frequency_penalty=1.1,  # Reduce repetition
+    presence_penalty=0.1,  # Reduce repetition
+    max_tokens=100,  # Maximum length
+)
+
+# Via llama-cpp-python direct access
+output = llm(
+    "Write a creative story",
+    temperature=0.8,
+    top_p=0.95,
+    top_k=50,
+    max_tokens=100,
+    repeat_penalty=1.1,
+)
+```
+{:else}
+```python
+params = SamplingParams(
+    temperature=0.8,  # Higher for more creativity
+    top_p=0.95,  # Consider top 95% probability mass
+    top_k=50,  # Consider top 50 tokens
+    max_tokens=100,  # Maximum length
+    presence_penalty=0.1,  # Reduce repetition
+)
+llm.generate("Write a creative story", sampling_params=params)
+```
+{/if}
+
+### Controlling Repetition
+
+Both frameworks provide ways to prevent repetitive text generation:
+
+{#if framework === 'tgi'}
+```python
+client.generate(
+    "Write a varied text",
+    repetition_penalty=1.1,  # Penalize repeated tokens
+    no_repeat_ngram_size=3,  # Prevent 3-gram repetition
+)
+```
+{:else if framework === 'llama.cpp'}
+```python
+# Via OpenAI API
+response = client.completions.create(
+    model="smollm2-1.7b-instruct",
+    prompt="Write a varied text",
+    frequency_penalty=1.1,  # Penalize frequent tokens
+    presence_penalty=0.8,  # Penalize tokens already present
+)
+
+# Via direct library
+output = llm(
+    "Write a varied text",
+    repeat_penalty=1.1,  # Penalize repeated tokens
+    frequency_penalty=0.5,  # Additional frequency penalty
+    presence_penalty=0.5,  # Additional presence penalty
+)
+```
+{:else}
+```python
+params = SamplingParams(
+    presence_penalty=0.1,  # Penalize token presence
+    frequency_penalty=0.1,  # Penalize token frequency
+)
+```
+{/if}
+
+### Length Control and Stop Sequences
+
+You can control generation length and specify when to stop:
+
+{#if framework === 'tgi'}
+```python
+client.generate(
+    "Generate a short paragraph",
+    max_new_tokens=100,
+    min_new_tokens=10,
+    stop_sequences=["\n\n", "###"],
+)
+```
+{:else if framework === 'llama.cpp'}
+```python
+# Via OpenAI API
+response = client.completions.create(
+    model="smollm2-1.7b-instruct",
+    prompt="Generate a short paragraph",
+    max_tokens=100,
+    stop=["\n\n", "###"],
+)
+
+# Via direct library
+output = llm("Generate a short paragraph", max_tokens=100, stop=["\n\n", "###"])
+```
+{:else}
+```python
+params = SamplingParams(
+    max_tokens=100,
+    min_tokens=10,
+    stop=["###", "\n\n"],
+    ignore_eos=False,
+    skip_special_tokens=True,
+)
+```
+{/if}
+
+## Memory Management
+
+Both frameworks implement advanced memory management techniques for efficient inference.
+
+{#if framework === 'tgi'}
+TGI uses Flash Attention 2 and continuous batching:
+
+```sh
+# Docker deployment with memory optimization
+docker run --gpus all -p 8080:80 \
+    --shm-size 1g \
+    ghcr.io/huggingface/text-generation-inference:latest \
+    --model-id HuggingFaceTB/SmolLM2-1.7B-Instruct \
+    --max-batch-total-tokens 8192 \
+    --max-input-length 4096
+```
+{:else if framework === 'llama.cpp'}
+llama.cpp uses quantization and optimized memory layout:
+
+```sh
+# Server with memory optimizations
+./server \
+    -m smollm2-1.7b-instruct.Q4_K_M.gguf \
+    --host 0.0.0.0 \
+    --port 8080 \
+    -c 2048 \               # Context size
+    --threads 4 \           # CPU threads
+    --n-gpu-layers 32 \     # Use more GPU layers for larger models
+    --mlock \               # Lock memory to prevent swapping
+    --cont-batching         # Enable continuous batching
+```
+
+For models too large for your GPU, you can use CPU offloading:
+
+```sh
+./server \
+    -m smollm2-1.7b-instruct.Q4_K_M.gguf \
+    --n-gpu-layers 20 \     # Keep first 20 layers on GPU
+    --threads 8             # Use more CPU threads for CPU layers
+```
+{:else}
+vLLM uses PagedAttention for optimal memory management:
+
+```python
+from vllm.engine.arg_utils import AsyncEngineArgs
+
+engine_args = AsyncEngineArgs(
+    model="HuggingFaceTB/SmolLM2-1.7B-Instruct",
+    gpu_memory_utilization=0.85,
+    max_num_batched_tokens=8192,
+    block_size=16,
+)
+
+llm = LLM(engine_args=engine_args)
+```
+{/if}
+
+## Resources
+
+- [Text Generation Inference Documentation](https://huggingface.co/docs/text-generation-inference)
+- [TGI GitHub Repository](https://github.com/huggingface/text-generation-inference)
+- [vLLM Documentation](https://vllm.readthedocs.io/)
+- [vLLM GitHub Repository](https://github.com/vllm-project/vllm)
+- [PagedAttention Paper](https://arxiv.org/abs/2309.06180)
+- [HuggingFace Blog: TGI in Production](https://huggingface.co/blog/tgi-serving)
+- [vLLM Performance Benchmarks](https://vllm.readthedocs.io/en/latest/performance.html)
+- [llama.cpp GitHub Repository](https://github.com/ggerganov/llama.cpp)
+- [llama.cpp Server Documentation](https://github.com/ggerganov/llama.cpp/blob/master/examples/server/README.md)
+- [llama-cpp-python Repository](https://github.com/abetlen/llama-cpp-python)
\ No newline at end of file
diff --git a/chapters/en/chapter2/9.mdx b/chapters/en/chapter2/9.mdx
index 5e87f59b4..1e51522a2 100644
--- a/chapters/en/chapter2/9.mdx
+++ b/chapters/en/chapter2/9.mdx
@@ -1,789 +1,252 @@
-# Optimized Inference Deployment
-
-In this section, we'll explore advanced frameworks for optimizing LLM deployments: Text Generation Inference (TGI), vLLM, and llama.cpp. These applications are primarily used in production environments to serve LLMs to users. This section focuses on how to deploy these frameworks in production rather than how to use them for inference on a single machine.
-
-We'll cover how these tools maximize inference efficiency and simplify production deployments of Large Language Models.
-
-## Framework Selection Guide
-
-TGI, vLLM, and llama.cpp serve similar purposes but have distinct characteristics that make them better suited for different use cases. Let's look at the key differences between them, focusing on performance and integration.
-
-### Memory Management and Performance
-
-**TGI** is designed to be stable and predictable in production, using fixed sequence lengths to keep memory usage consistent. TGI manages memory using Flash Attention 2 and continuous batching techniques. This means it can process attention calculations very efficiently and keep the GPU busy by constantly feeding it work. The system can move parts of the model between CPU and GPU when needed, which helps handle larger models. 
-
-<img src="https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/tgi/flash-attn.png" alt="Flash Attention" />
-
-<Tip title="How Flash Attention Works">
-Flash Attention is a technique that optimizes the attention mechanism in transformer models by addressing memory bandwidth bottlenecks. As discussed earlier in [section 12.3](2.mdx), the attention mechanism has quadratic complexity and memory usage, making it inefficient for long sequences.
-
-The key innovation is in how it manages memory transfers between High Bandwidth Memory (HBM) and faster SRAM cache. Traditional attention repeatedly transfers data between HBM and SRAM, creating bottlenecks by leaving the GPU idle. Flash Attention loads data once into SRAM and performs all calculations there, minimizing expensive memory transfers. 
-
-While the benefits are most significant during training, Flash Attention's reduced VRAM usage and improved efficiency make it valuable for inference as well, enabling faster and more scalable LLM serving.
-</Tip>
-
-**vLLM** takes a different approach by using PagedAttention. Just like how a computer manages its memory in pages, vLLM splits the model's memory into smaller blocks. This clever system means it can handle different-sized requests more flexibly and doesn't waste memory space. It's particularly good at sharing memory between different requests and reduces memory fragmentation, which makes the whole system more efficient.
-
-<Tip title="How Paged Attention Works">
-Paged Attention is a technique that addresses another critical bottleneck in LLM inference: KV cache memory management. As discussed in [section 12.3](2.mdx), during text generation, the model stores attention keys and values (KV cache) for each generated token to reduce redundant computations. The KV cache can become enormous, especially with long sequences or multiple concurrent requests.
-
-vLLM's key innovation lies in how it manages this cache:
-
-1. **Memory Paging**: Instead of treating the KV cache as one large block, it's divided into fixed-size "pages" (similar to virtual memory in operating systems).
-2. **Non-contiguous Storage**: Pages don't need to be stored contiguously in GPU memory, allowing for more flexible memory allocation.
-3. **Page Table Management**: A page table tracks which pages belong to which sequence, enabling efficient lookup and access.
-4. **Memory Sharing**: For operations like parallel sampling, pages storing the KV cache for the prompt can be shared across multiple sequences.
-
-The PagedAttention approach can lead to up to 24x higher throughput compared to traditional methods, making it a game-changer for production LLM deployments. If you want to go really deep into how PagedAttention works, you can read the [the guide from the vLLM documentation](https://docs.vllm.ai/en/latest/design/kernel/paged_attention.html).
-</Tip>
-
-**llama.cpp** is a highly optimized C/C++ implementation originally designed for running LLaMA models on consumer hardware. It focuses on CPU efficiency with optional GPU acceleration and is ideal for resource-constrained environments. llama.cpp uses quantization techniques to reduce model size and memory requirements while maintaining good performance. It implements optimized kernels for various CPU architectures and supports basic KV cache management for efficient token generation.
-
-<Tip title="How llama.cpp Quantization Works">
-Quantization in llama.cpp reduces the precision of model weights from 32-bit or 16-bit floating point to lower precision formats like 8-bit integers (INT8), 4-bit, or even lower. This significantly reduces memory usage and improves inference speed with minimal quality loss.
-
-Key quantization features in llama.cpp include:
-1. **Multiple Quantization Levels**: Supports 8-bit, 4-bit, 3-bit, and even 2-bit quantization
-2. **GGML/GGUF Format**: Uses custom tensor formats optimized for quantized inference
-3. **Mixed Precision**: Can apply different quantization levels to different parts of the model
-4. **Hardware-Specific Optimizations**: Includes optimized code paths for various CPU architectures (AVX2, AVX-512, NEON)
-
-This approach enables running billion-parameter models on consumer hardware with limited memory, making it perfect for local deployments and edge devices.
-</Tip>
-
-
-
-### Deployment and Integration
-
-Let's move on to the deployment and integration differences between the frameworks.
-
-**TGI** excels in enterprise-level deployment with its production-ready features. It comes with built-in Kubernetes support and includes everything you need for running in production, like monitoring through Prometheus and Grafana, automatic scaling, and comprehensive safety features. The system also includes enterprise-grade logging and various protective measures like content filtering and rate limiting to keep your deployment secure and stable.
-
-**vLLM** takes a more flexible, developer-friendly approach to deployment. It's built with Python at its core and can easily replace OpenAI's API in your existing applications. The framework focuses on delivering raw performance and can be customized to fit your specific needs. It works particularly well with Ray for managing clusters, making it a great choice when you need high performance and adaptability.
-
-**llama.cpp** prioritizes simplicity and portability. Its server implementation is lightweight and can run on a wide range of hardware, from powerful servers to consumer laptops and even some high-end mobile devices. With minimal dependencies and a simple C/C++ core, it's easy to deploy in environments where installing Python frameworks would be challenging. The server provides an OpenAI-compatible API while maintaining a much smaller resource footprint than other solutions.
-
-
-
-## Getting Started
-
-Let's explore how to use these frameworks for deploying LLMs, starting with installation and basic setup.
-
-### Installation and Basic Setup
-
-{#if framework === 'tgi'}
-
-TGI is easy to install and use, with deep integration into the Hugging Face ecosystem.
-
-First, launch the TGI server using Docker:
-
-```sh
-docker run --gpus all \
-    --shm-size 1g \
-    -p 8080:80 \
-    -v ~/.cache/huggingface:/data \
-    ghcr.io/huggingface/text-generation-inference:latest \
-    --model-id HuggingFaceTB/SmolLM2-360M-Instruct
-```
-
-Then interact with it using Hugging Face's InferenceClient:
-
-```python
-from huggingface_hub import InferenceClient
-
-# Initialize client pointing to TGI endpoint
-client = InferenceClient(
-    model="http://localhost:8080",  # URL to the TGI server
-)
-
-# Text generation
-response = client.text_generation(
-    "Tell me a story",
-    max_new_tokens=100,
-    temperature=0.7,
-    top_p=0.95,
-    details=True,
-    stop_sequences=[],
-)
-print(response.generated_text)
-
-# For chat format
-response = client.chat_completion(
-    messages=[
-        {"role": "system", "content": "You are a helpful assistant."},
-        {"role": "user", "content": "Tell me a story"},
-    ],
-    max_tokens=100,
-    temperature=0.7,
-    top_p=0.95,
-)
-print(response.choices[0].message.content)
-```
-
-Alternatively, you can use the OpenAI client:
-
-```python
-from openai import OpenAI
-
-# Initialize client pointing to TGI endpoint
-client = OpenAI(
-    base_url="http://localhost:8080/v1",  # Make sure to include /v1
-    api_key="not-needed",  # TGI doesn't require an API key by default
-)
-
-# Chat completion
-response = client.chat.completions.create(
-    model="HuggingFaceTB/SmolLM2-360M-Instruct",
-    messages=[
-        {"role": "system", "content": "You are a helpful assistant."},
-        {"role": "user", "content": "Tell me a story"},
-    ],
-    max_tokens=100,
-    temperature=0.7,
-    top_p=0.95,
-)
-print(response.choices[0].message.content)
-```
-{:else if framework === 'llama.cpp'}
-
-llama.cpp is easy to install and use, requiring minimal dependencies and supporting both CPU and GPU inference.
-
-First, install and build llama.cpp:
-
-```sh
-# Clone the repository
-git clone https://github.com/ggerganov/llama.cpp
-cd llama.cpp
-
-# Build the project
-make
-
-# Download the SmolLM2-1.7B-Instruct-GGUF model
-curl -L -O https://huggingface.co/HuggingFaceTB/SmolLM2-1.7B-Instruct-GGUF/resolve/main/smollm2-1.7b-instruct.Q4_K_M.gguf
-```
-
-Then, launch the server (with OpenAI API compatibility):
-
-```sh
-# Start the server
-./server \
-    -m smollm2-1.7b-instruct.Q4_K_M.gguf \
-    --host 0.0.0.0 \
-    --port 8080 \
-    -c 4096 \
-    --n-gpu-layers 0  # Set to a higher number to use GPU
-```
-
-Interact with the server using Hugging Face's InferenceClient:
-
-```python
-from huggingface_hub import InferenceClient
-
-# Initialize client pointing to llama.cpp server
-client = InferenceClient(
-    model="http://localhost:8080/v1",  # URL to the llama.cpp server
-    token="sk-no-key-required"  # llama.cpp server requires this placeholder
-)
-
-# Text generation
-response = client.text_generation(
-    "Tell me a story",
-    max_new_tokens=100,
-    temperature=0.7,
-    top_p=0.95,
-    details=True,
-)
-print(response.generated_text)
-
-# For chat format
-response = client.chat_completion(
-    messages=[
-        {"role": "system", "content": "You are a helpful assistant."},
-        {"role": "user", "content": "Tell me a story"},
-    ],
-    max_tokens=100,
-    temperature=0.7,
-    top_p=0.95,
-)
-print(response.choices[0].message.content)
-```
-
-Alternatively, you can use the OpenAI client:
-
-```python
-from openai import OpenAI
-
-# Initialize client pointing to llama.cpp server
-client = OpenAI(
-    base_url="http://localhost:8080/v1",
-    api_key="sk-no-key-required"  # llama.cpp server requires this placeholder
-)
-
-# Chat completion
-response = client.chat.completions.create(
-    model="smollm2-1.7b-instruct",  # Model identifier can be anything as server only loads one model
-    messages=[
-        {"role": "system", "content": "You are a helpful assistant."},
-        {"role": "user", "content": "Tell me a story"},
-    ],
-    max_tokens=100,
-    temperature=0.7,
-    top_p=0.95,
-)
-print(response.choices[0].message.content)
-```
-{:else}
-
-vLLM is easy to install and use, with both OpenAI API compatibility and a native Python interface.
-
-First, launch the vLLM OpenAI-compatible server:
-
-```sh
-python -m vllm.entrypoints.openai.api_server \
-    --model HuggingFaceTB/SmolLM2-360M-Instruct \
-    --host 0.0.0.0 \
-    --port 8000
-```
-
-Then interact with it using Hugging Face's InferenceClient:
-
-```python
-from huggingface_hub import InferenceClient
-
-# Initialize client pointing to vLLM endpoint
-client = InferenceClient(
-    model="http://localhost:8000/v1",  # URL to the vLLM server
-)
-
-# Text generation
-response = client.text_generation(
-    "Tell me a story",
-    max_new_tokens=100,
-    temperature=0.7,
-    top_p=0.95,
-    details=True,
-)
-print(response.generated_text)
-
-# For chat format
-response = client.chat_completion(
-    messages=[
-        {"role": "system", "content": "You are a helpful assistant."},
-        {"role": "user", "content": "Tell me a story"},
-    ],
-    max_tokens=100,
-    temperature=0.7,
-    top_p=0.95,
-)
-print(response.choices[0].message.content)
-```
-
-Alternatively, you can use the OpenAI client:
-
-```python
-from openai import OpenAI
-
-# Initialize client pointing to vLLM endpoint
-client = OpenAI(
-    base_url="http://localhost:8000/v1",
-    api_key="not-needed",  # vLLM doesn't require an API key by default
-)
-
-# Chat completion
-response = client.chat.completions.create(
-    model="HuggingFaceTB/SmolLM2-360M-Instruct",
-    messages=[
-        {"role": "system", "content": "You are a helpful assistant."},
-        {"role": "user", "content": "Tell me a story"},
-    ],
-    max_tokens=100,
-    temperature=0.7,
-    top_p=0.95,
-)
-print(response.choices[0].message.content)
-```
-{/if}
-
-### Basic Text Generation
-
-Let's look at examples of text generation with the frameworks:
-
-{#if framework === 'tgi'}
-
-First, deploy TGI with advanced parameters:
-```sh
-docker run --gpus all \
-    --shm-size 1g \
-    -p 8080:80 \
-    -v ~/.cache/huggingface:/data \
-    ghcr.io/huggingface/text-generation-inference:latest \
-    --model-id HuggingFaceTB/SmolLM2-360M-Instruct \
-    --max-total-tokens 4096 \
-    --max-input-length 3072 \
-    --max-batch-total-tokens 8192 \
-    --waiting-served-ratio 1.2
-```
-
-Use the InferenceClient for flexible text generation:
-```python
-from huggingface_hub import InferenceClient
-
-client = InferenceClient(model="http://localhost:8080")
-
-# Advanced parameters example
-response = client.chat_completion(
-    messages=[
-        {"role": "system", "content": "You are a creative storyteller."},
-        {"role": "user", "content": "Write a creative story"},
-    ],
-    temperature=0.8,
-    max_tokens=200,
-    top_p=0.95,
-)
-print(response.choices[0].message.content)
-
-# Raw text generation 
-response = client.text_generation(
-    "Write a creative story about space exploration",
-    max_new_tokens=200,
-    temperature=0.8,
-    top_p=0.95,
-    repetition_penalty=1.1,
-    do_sample=True,
-    details=True,
-)
-print(response.generated_text)
-```
-
-Or use the OpenAI client:
-```python
-from openai import OpenAI
-
-client = OpenAI(base_url="http://localhost:8080/v1", api_key="not-needed")
-
-# Advanced parameters example
-response = client.chat.completions.create(
-    model="HuggingFaceTB/SmolLM2-360M-Instruct",
-    messages=[
-        {"role": "system", "content": "You are a creative storyteller."},
-        {"role": "user", "content": "Write a creative story"},
-    ],
-    temperature=0.8,  # Higher for more creativity
-)
-print(response.choices[0].message.content)
-```
-{:else if framework === 'llama.cpp'}
-
-For llama.cpp, you can set advanced parameters when launching the server:
-
-```sh
-./server \
-    -m smollm2-1.7b-instruct.Q4_K_M.gguf \
-    --host 0.0.0.0 \
-    --port 8080 \
-    -c 4096 \            # Context size
-    --threads 8 \        # CPU threads to use
-    --batch-size 512 \   # Batch size for prompt evaluation
-    --n-gpu-layers 0     # GPU layers (0 = CPU only)
-```
-
-Use the InferenceClient:
-
-```python
-from huggingface_hub import InferenceClient
-
-client = InferenceClient(
-    model="http://localhost:8080/v1",
-    token="sk-no-key-required"
-)
-
-# Advanced parameters example
-response = client.chat_completion(
-    messages=[
-        {"role": "system", "content": "You are a creative storyteller."},
-        {"role": "user", "content": "Write a creative story"},
-    ],
-    temperature=0.8,
-    max_tokens=200,
-    top_p=0.95,
-)
-print(response.choices[0].message.content)
-
-# For direct text generation
-response = client.text_generation(
-    "Write a creative story about space exploration",
-    max_new_tokens=200,
-    temperature=0.8,
-    top_p=0.95,
-    repetition_penalty=1.1,
-    details=True,
-)
-print(response.generated_text)
-```
-
-Or use the OpenAI client for generation with control over the sampling parameters:
-
-```python
-from openai import OpenAI
-
-client = OpenAI(base_url="http://localhost:8080/v1", api_key="sk-no-key-required")
-
-# Advanced parameters example
-response = client.chat.completions.create(
-    model="smollm2-1.7b-instruct",
-    messages=[
-        {"role": "system", "content": "You are a creative storyteller."},
-        {"role": "user", "content": "Write a creative story"},
-    ],
-    temperature=0.8,          # Higher for more creativity
-    top_p=0.95,               # Nucleus sampling probability
-    frequency_penalty=0.5,    # Reduce repetition of frequent tokens
-    presence_penalty=0.5,     # Reduce repetition by penalizing tokens already present
-    max_tokens=200,           # Maximum generation length
-)
-print(response.choices[0].message.content)
-```
-
-You can also use llama.cpp's native library for even more control:
-
-```python
-# Using llama-cpp-python package for direct model access
-from llama_cpp import Llama
-
-# Load the model
-llm = Llama(
-    model_path="smollm2-1.7b-instruct.Q4_K_M.gguf",
-    n_ctx=4096,            # Context window size
-    n_threads=8,           # CPU threads
-    n_gpu_layers=0         # GPU layers (0 = CPU only)
-)
-
-# Format prompt according to the model's expected format
-prompt = """<|im_start|>system
-You are a creative storyteller.
-<|im_end|>
-<|im_start|>user
-Write a creative story
-<|im_end|>
-<|im_start|>assistant
-"""
-
-# Generate response with precise parameter control
-output = llm(
-    prompt,
-    max_tokens=200,
-    temperature=0.8,
-    top_p=0.95,
-    frequency_penalty=0.5,
-    presence_penalty=0.5,
-    stop=["<|im_end|>"]
-)
-
-print(output["choices"][0]["text"])
-```
-{:else}
-
-For advanced usage with vLLM, you can use the InferenceClient:
-
-```python
-from huggingface_hub import InferenceClient
-
-client = InferenceClient(model="http://localhost:8000/v1")
-
-# Advanced parameters example
-response = client.chat_completion(
-    messages=[
-        {"role": "system", "content": "You are a creative storyteller."},
-        {"role": "user", "content": "Write a creative story"},
-    ],
-    temperature=0.8,
-    max_tokens=200,
-    top_p=0.95,
-)
-print(response.choices[0].message.content)
-
-# For direct text generation
-response = client.text_generation(
-    "Write a creative story about space exploration",
-    max_new_tokens=200,
-    temperature=0.8,
-    top_p=0.95,
-    details=True,
-)
-print(response.generated_text)
-```
-
-You can also use the OpenAI client:
-
-```python
-from openai import OpenAI
-
-client = OpenAI(
-    base_url="http://localhost:8000/v1",
-    api_key="not-needed"
-)
-
-# Advanced parameters example
-response = client.chat.completions.create(
-    model="HuggingFaceTB/SmolLM2-360M-Instruct",
-    messages=[
-        {"role": "system", "content": "You are a creative storyteller."},
-        {"role": "user", "content": "Write a creative story"},
-    ],
-    temperature=0.8,
-    top_p=0.95,
-    max_tokens=200,
-)
-print(response.choices[0].message.content)
-```
-
-vLLM also provides a native Python interface with fine-grained control:
-
-```python
-from vllm import LLM, SamplingParams
-
-# Initialize the model with advanced parameters
-llm = LLM(
-    model="HuggingFaceTB/SmolLM2-360M-Instruct",
-    gpu_memory_utilization=0.85,
-    max_num_batched_tokens=8192,
-    max_num_seqs=256,
-    block_size=16,
-)
-
-# Configure sampling parameters
-sampling_params = SamplingParams(
-    temperature=0.8,  # Higher for more creativity
-    top_p=0.95,  # Consider top 95% probability mass
-    max_tokens=100,  # Maximum length
-    presence_penalty=1.1,  # Reduce repetition
-    frequency_penalty=1.1,  # Reduce repetition
-    stop=["\n\n", "###"],  # Stop sequences
-)
-
-# Generate text
-prompt = "Write a creative story"
-outputs = llm.generate(prompt, sampling_params)
-print(outputs[0].outputs[0].text)
-
-# For chat-style interactions
-chat_prompt = [
-    {"role": "system", "content": "You are a creative storyteller."},
-    {"role": "user", "content": "Write a creative story"},
-]
-formatted_prompt = llm.get_chat_template()(chat_prompt)  # Uses model's chat template
-outputs = llm.generate(formatted_prompt, sampling_params)
-print(outputs[0].outputs[0].text)
-```
-{/if}
-
-## Advanced Generation Control
-
-### Token Selection and Sampling
-
-The process of generating text involves selecting the next token at each step. This selection process can be controlled through various parameters:
-
-1. **Raw Logits**: The initial output probabilities for each token
-2. **Temperature**: Controls randomness in selection (higher = more creative)
-3. **Top-p (Nucleus) Sampling**: Filters to top tokens making up X% of probability mass
-4. **Top-k Filtering**: Limits selection to k most likely tokens
-
-Here's how to configure these parameters:
-
-{#if framework === 'tgi'}
-```python
-client.generate(
-    "Write a creative story",
-    temperature=0.8,  # Higher for more creativity
-    top_p=0.95,  # Consider top 95% probability mass
-    top_k=50,  # Consider top 50 tokens
-    max_new_tokens=100,  # Maximum length
-    repetition_penalty=1.1,  # Reduce repetition
-)
-```
-{:else if framework === 'llama.cpp'}
-```python
-# Via OpenAI API compatibility
-response = client.completions.create(
-    model="smollm2-1.7b-instruct",  # Model name (can be any string for llama.cpp server)
-    prompt="Write a creative story",
-    temperature=0.8,        # Higher for more creativity
-    top_p=0.95,             # Consider top 95% probability mass 
-    frequency_penalty=1.1,  # Reduce repetition
-    presence_penalty=0.1,   # Reduce repetition
-    max_tokens=100,         # Maximum length
-)
-
-# Via llama-cpp-python direct access
-output = llm(
-    "Write a creative story",
-    temperature=0.8,
-    top_p=0.95,
-    top_k=50,
-    max_tokens=100,
-    repeat_penalty=1.1
-)
-```
-{:else}
-```python
-params = SamplingParams(
-    temperature=0.8,  # Higher for more creativity
-    top_p=0.95,  # Consider top 95% probability mass
-    top_k=50,  # Consider top 50 tokens
-    max_tokens=100,  # Maximum length
-    presence_penalty=0.1,  # Reduce repetition
-)
-llm.generate("Write a creative story", sampling_params=params)
-```
-{/if}
-
-### Controlling Repetition
-
-Both frameworks provide ways to prevent repetitive text generation:
-
-{#if framework === 'tgi'}
-```python
-client.generate(
-    "Write a varied text",
-    repetition_penalty=1.1,  # Penalize repeated tokens
-    no_repeat_ngram_size=3,  # Prevent 3-gram repetition
-)
-```
-{:else if framework === 'llama.cpp'}
-```python
-# Via OpenAI API
-response = client.completions.create(
-    model="smollm2-1.7b-instruct",
-    prompt="Write a varied text",
-    frequency_penalty=1.1,   # Penalize frequent tokens
-    presence_penalty=0.8,    # Penalize tokens already present
-)
-
-# Via direct library
-output = llm(
-    "Write a varied text",
-    repeat_penalty=1.1,      # Penalize repeated tokens
-    frequency_penalty=0.5,   # Additional frequency penalty
-    presence_penalty=0.5     # Additional presence penalty
-)
-```
-{:else}
-```python
-params = SamplingParams(
-    presence_penalty=0.1,  # Penalize token presence
-    frequency_penalty=0.1,  # Penalize token frequency
-)
-```
-{/if}
-
-### Length Control and Stop Sequences
-
-You can control generation length and specify when to stop:
-
-{#if framework === 'tgi'}
-```python
-client.generate(
-    "Generate a short paragraph",
-    max_new_tokens=100,
-    min_new_tokens=10,
-    stop_sequences=["\n\n", "###"],
-)
-```
-{:else if framework === 'llama.cpp'}
-```python
-# Via OpenAI API
-response = client.completions.create(
-    model="smollm2-1.7b-instruct",
-    prompt="Generate a short paragraph",
-    max_tokens=100,
-    stop=["\n\n", "###"]
-)
-
-# Via direct library
-output = llm(
-    "Generate a short paragraph",
-    max_tokens=100,
-    stop=["\n\n", "###"]
-)
-```
-{:else}
-```python
-params = SamplingParams(
-    max_tokens=100,
-    min_tokens=10,
-    stop=["###", "\n\n"],
-    ignore_eos=False,
-    skip_special_tokens=True,
-)
-```
-{/if}
-
-## Memory Management
-
-Both frameworks implement advanced memory management techniques for efficient inference.
-
-{#if framework === 'tgi'}
-TGI uses Flash Attention 2 and continuous batching:
-
-```sh
-# Docker deployment with memory optimization
-docker run --gpus all -p 8080:80 \
-    --shm-size 1g \
-    ghcr.io/huggingface/text-generation-inference:latest \
-    --model-id HuggingFaceTB/SmolLM2-1.7B-Instruct \
-    --max-batch-total-tokens 8192 \
-    --max-input-length 4096
-```
-{:else if framework === 'llama.cpp'}
-llama.cpp uses quantization and optimized memory layout:
-
-```sh
-# Server with memory optimizations
-./server \
-    -m smollm2-1.7b-instruct.Q4_K_M.gguf \
-    --host 0.0.0.0 \
-    --port 8080 \
-    -c 2048 \               # Context size
-    --threads 4 \           # CPU threads
-    --n-gpu-layers 32 \     # Use more GPU layers for larger models
-    --mlock \               # Lock memory to prevent swapping
-    --cont-batching         # Enable continuous batching
-```
-
-For models too large for your GPU, you can use CPU offloading:
-
-```sh
-./server \
-    -m smollm2-1.7b-instruct.Q4_K_M.gguf \
-    --n-gpu-layers 20 \     # Keep first 20 layers on GPU
-    --threads 8             # Use more CPU threads for CPU layers
-```
-{:else}
-vLLM uses PagedAttention for optimal memory management:
-
-```python
-from vllm.engine.arg_utils import AsyncEngineArgs
-
-engine_args = AsyncEngineArgs(
-    model="HuggingFaceTB/SmolLM2-1.7B-Instruct",
-    gpu_memory_utilization=0.85,
-    max_num_batched_tokens=8192,
-    block_size=16,
-)
-
-llm = LLM(engine_args=engine_args)
-```
-{/if}
-
-## Resources
-
-- [Text Generation Inference Documentation](https://huggingface.co/docs/text-generation-inference)
-- [TGI GitHub Repository](https://github.com/huggingface/text-generation-inference)
-- [vLLM Documentation](https://vllm.readthedocs.io/)
-- [vLLM GitHub Repository](https://github.com/vllm-project/vllm)
-- [PagedAttention Paper](https://arxiv.org/abs/2309.06180)
-- [HuggingFace Blog: TGI in Production](https://huggingface.co/blog/tgi-serving)
-- [vLLM Performance Benchmarks](https://vllm.readthedocs.io/en/latest/performance.html)
-- [llama.cpp GitHub Repository](https://github.com/ggerganov/llama.cpp)
-- [llama.cpp Server Documentation](https://github.com/ggerganov/llama.cpp/blob/master/examples/server/README.md)
-- [llama-cpp-python Repository](https://github.com/abetlen/llama-cpp-python)
\ No newline at end of file
+<FrameworkSwitchCourse {fw} />
+
+<!-- DISABLE-FRONTMATTER-SECTIONS -->
+
+# End-of-chapter quiz[[end-of-chapter-quiz]]
+
+<CourseFloatingBanner
+    chapter={2}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+### 1. What is the order of the language modeling pipeline?
+
+<Question
+	choices={[
+		{
+			text: "First, the model, which handles text and returns raw predictions. The tokenizer then makes sense of these predictions and converts them back to text when needed.",
+			explain: "The model cannot understand text! The tokenizer must first tokenize the text and convert it to IDs so that it is understandable by the model."
+		},
+		{
+			text: "First, the tokenizer, which handles text and returns IDs. The model handles these IDs and outputs a prediction, which can be some text.",
+			explain: "The model's prediction cannot be text straight away. The tokenizer has to be used in order to convert the prediction back to text!"
+		},
+		{
+			text: "The tokenizer handles text and returns IDs. The model handles these IDs and outputs a prediction. The tokenizer can then be used once again to convert these predictions back to some text.",
+			explain: "Correct! The tokenizer can be used for both tokenizing and de-tokenizing.",
+            correct: true
+		}
+	]}
+/>
+
+### 2. How many dimensions does the tensor output by the base Transformer model have, and what are they?
+
+<Question
+	choices={[
+		{
+			text: "2: The sequence length and the batch size",
+			explain: "False! The tensor output by the model has a third dimension: hidden size."
+		},
+		{
+			text: "2: The sequence length and the hidden size",
+			explain: "False! All Transformer models handle batches, even with a single sequence; that would be a batch size of 1!"
+		},
+		{
+			text: "3: The sequence length, the batch size, and the hidden size",
+			explain: "Correct!",
+            correct: true
+		}
+	]}
+/>
+
+### 3. Which of the following is an example of subword tokenization?
+
+<Question
+	choices={[
+		{
+			text: "WordPiece",
+			explain: "Yes, that's one example of subword tokenization!",
+            correct: true
+		},
+		{
+			text: "Character-based tokenization",
+			explain: "Character-based tokenization is not a type of subword tokenization."
+		},
+		{
+			text: "Splitting on whitespace and punctuation",
+			explain: "That's a word-based tokenization scheme!"
+		},
+		{
+			text: "BPE",
+			explain: "Yes, that's one example of subword tokenization!",
+            correct: true
+        },
+		{
+			text: "Unigram",
+			explain: "Yes, that's one example of subword tokenization!",
+            correct: true
+        },
+		{
+			text: "None of the above",
+			explain: "Incorrect!"
+        }
+	]}
+/>
+
+### 4. What is a model head?
+
+<Question
+	choices={[
+		{
+			text: "A component of the base Transformer network that redirects tensors to their correct layers",
+			explain: "Incorrect! There's no such component."
+		},
+		{
+			text: "Also known as the self-attention mechanism, it adapts the representation of a token according to the other tokens of the sequence",
+			explain: "Incorrect! The self-attention layer does contain attention \"heads,\" but these are not adaptation heads."
+		},
+		{
+			text: "An additional component, usually made up of one or a few layers, to convert the transformer predictions to a task-specific output",
+			explain: "That's right. Adaptation heads, also known simply as heads, come up in different forms: language modeling heads, question answering heads, sequence classification heads... ",
+			correct: true
+		} 
+	]}
+/>
+
+### 5. What is an AutoModel?
+
+<Question
+	choices={[
+		{
+			text: "A model that automatically trains on your data",
+			explain: "Incorrect. Are you mistaking this with our <a href='https://huggingface.co/autotrain'>AutoTrain</a> product?"
+		},
+		{
+			text: "An object that returns the correct architecture based on the checkpoint",
+			explain: "Exactly: the <code>AutoModel</code> only needs to know the checkpoint from which to initialize to return the correct architecture.",
+			correct: true
+		},
+		{
+			text: "A model that automatically detects the language used for its inputs to load the correct weights",
+			explain: "Incorrect; while some checkpoints and models are capable of handling multiple languages, there are no built-in tools for automatic checkpoint selection according to language. You should head over to the <a href='https://huggingface.co/models'>Model Hub</a> to find the best checkpoint for your task!"
+		} 
+	]}
+/>
+
+### 6. What are the techniques to be aware of when batching sequences of different lengths together?
+
+<Question
+	choices={[
+		{
+			text: "Truncating",
+			explain: "Yes, truncation is a correct way of evening out sequences so that they fit in a rectangular shape. Is it the only one, though?",
+			correct: true
+		},
+		{
+			text: "Returning tensors",
+			explain: "While the other techniques allow you to return rectangular tensors, returning tensors isn't helpful when batching sequences together."
+		},
+		{
+			text: "Padding",
+			explain: "Yes, padding is a correct way of evening out sequences so that they fit in a rectangular shape. Is it the only one, though?",
+			correct: true
+		}, 
+		{
+			text: "Attention masking",
+			explain: "Absolutely! Attention masks are of prime importance when handling sequences of different lengths. That's not the only technique to be aware of, however.",
+			correct: true
+		} 
+	]}
+/>
+
+### 7. What is the point of applying a SoftMax function to the logits output by a sequence classification model?
+
+<Question
+	choices={[
+		{
+			text: "It softens the logits so that they're more reliable.",
+			explain: "No, the SoftMax function does not affect the reliability of results."
+		},
+		{
+			text: "It applies a lower and upper bound so that they're understandable.",
+			explain: "Correct! The resulting values are bound between 0 and 1. That's not the only reason we use a SoftMax function, though.",
+            correct: true
+		},
+		{
+			text: "The total sum of the output is then 1, resulting in a possible probabilistic interpretation.",
+			explain: "Correct! That's not the only reason we use a SoftMax function, though.",
+            correct: true
+		}
+	]}
+/>
+
+### 8. What method is most of the tokenizer API centered around?
+
+<Question
+	choices={[
+		{
+			text: "<code>encode</code>, as it can encode text into IDs and IDs into predictions",
+			explain: "Wrong! While the <code>encode</code> method does exist on tokenizers, it does not exist on models."
+		},
+		{
+			text: "Calling the tokenizer object directly.",
+			explain: "Exactly! The <code>__call__</code> method of the tokenizer is a very powerful method which can handle pretty much anything. It is also the method used to retrieve predictions from a model.",
+			correct: true
+		},
+		{
+			text: "<code>pad</code>",
+			explain: "Wrong! Padding is very useful, but it's just one part of the tokenizer API."
+		},
+		{
+			text: "<code>tokenize</code>",
+			explain: "The <code>tokenize</code> method is arguably one of the most useful methods, but it isn't the core of the tokenizer API."
+		}
+	]}
+/>
+
+### 9. What does the `result` variable contain in this code sample?
+
+```py
+from transformers import AutoTokenizer
+
+tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
+result = tokenizer.tokenize("Hello!")
+```
+
+<Question
+	choices={[
+		{
+			text: "A list of strings, each string being a token",
+			explain: "Absolutely! Convert this to IDs, and send them to a model!",
+            correct: true
+		},
+		{
+			text: "A list of IDs",
+			explain: "Incorrect; that's what the <code>__call__</code> or <code>convert_tokens_to_ids</code> method is for!"
+		},
+		{
+			text: "A string containing all of the tokens",
+			explain: "This would be suboptimal, as the goal is to split the string into multiple tokens."
+		}
+	]}
+/>
+
+### 10. Is there something wrong with the following code?
+
+```py
+from transformers import AutoTokenizer, AutoModel
+
+tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
+model = AutoModel.from_pretrained("gpt2")
+
+encoded = tokenizer("Hey!", return_tensors="pt")
+result = model(**encoded)
+```
+
+<Question
+	choices={[
+		{
+			text: "No, it seems correct.",
+			explain: "Unfortunately, coupling a model with a tokenizer that was trained with a different checkpoint is rarely a good idea. The model was not trained to make sense out of this tokenizer's output, so the model output (if it can even run!) will not make any sense."
+		},
+		{
+			text: "The tokenizer and model should always be from the same checkpoint.",
+			explain: "Right!",
+            correct: true
+		},
+		{
+			text: "It's good practice to pad and truncate with the tokenizer as every input is a batch.",
+			explain: "It's true that every model input needs to be a batch. However, truncating or padding this sequence wouldn't necessarily make sense as there is only one of it, and those are techniques to batch together a list of sentences."
+		}
+	]}
+/>

From 4bae9384e5fbd91452375a160a8641b72b6a5400 Mon Sep 17 00:00:00 2001
From: burtenshaw <ben.burtenshaw@gmail.com>
Date: Mon, 12 May 2025 10:54:39 +0200
Subject: [PATCH 095/167] update toc

---
 chapters/en/_toctree.yml | 2 ++
 1 file changed, 2 insertions(+)

diff --git a/chapters/en/_toctree.yml b/chapters/en/_toctree.yml
index 7f8d105ca..b31d964bd 100644
--- a/chapters/en/_toctree.yml
+++ b/chapters/en/_toctree.yml
@@ -46,6 +46,8 @@
   - local: chapter2/7
     title: Basic usage completed!
   - local: chapter2/8
+    title: Inference with transformers and beyond
+  - local: chapter2/9
     title: End-of-chapter quiz
     quiz: 2
 

From 1b100cbe68bb4b0457bd27cfb0a7ba455962a8ca Mon Sep 17 00:00:00 2001
From: Victor Geislinger <9027783+MrGeislinger@users.noreply.github.com>
Date: Mon, 12 May 2025 11:47:35 -0700
Subject: [PATCH 096/167] Fix typo: Unigram section link

Fixes #1736
---
 chapters/en/chapter6/4.mdx | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/chapters/en/chapter6/4.mdx b/chapters/en/chapter6/4.mdx
index a53611a60..8c7999588 100644
--- a/chapters/en/chapter6/4.mdx
+++ b/chapters/en/chapter6/4.mdx
@@ -104,7 +104,7 @@ Now that we've seen a little of how some different tokenizers process text, we c
 
 ## SentencePiece[[sentencepiece]]
 
-[SentencePiece](https://github.com/google/sentencepiece) is a tokenization algorithm for the preprocessing of text that you can use with any of the models we will see in the next three sections. It considers the text as a sequence of Unicode characters, and replaces spaces with a special character, `▁`. Used in conjunction with the Unigram algorithm (see [section 7](/course/chapter7/7)), it doesn't even require a pre-tokenization step, which is very useful for languages where the space character is not used (like Chinese or Japanese).
+[SentencePiece](https://github.com/google/sentencepiece) is a tokenization algorithm for the preprocessing of text that you can use with any of the models we will see in the next three sections. It considers the text as a sequence of Unicode characters, and replaces spaces with a special character, `▁`. Used in conjunction with the Unigram algorithm (see [section 7](/course/chapter6/7)), it doesn't even require a pre-tokenization step, which is very useful for languages where the space character is not used (like Chinese or Japanese).
 
 The other main feature of SentencePiece is *reversible tokenization*: since there is no special treatment of spaces, decoding the tokens is done simply by concatenating them and replacing the `_`s with spaces -- this results in the normalized text. As we saw earlier, the BERT tokenizer removes repeating spaces, so its tokenization is not reversible.
 
@@ -120,4 +120,4 @@ Training step | Merges the tokens corresponding to the most common pair | Merges
 Learns | Merge rules and a vocabulary | Just a vocabulary | A vocabulary with a score for each token
 Encoding | Splits a word into characters and applies the merges learned during training | Finds the longest subword starting from the beginning that is in the vocabulary, then does the same for the rest of the word | Finds the most likely split into tokens, using the scores learned during training
 
-Now let's dive into BPE!
\ No newline at end of file
+Now let's dive into BPE!

From 74aca906ce41b68b6621f124bdd5dc0fc4e1661c Mon Sep 17 00:00:00 2001
From: burtenshaw <ben.burtenshaw@gmail.com>
Date: Wed, 14 May 2025 15:57:44 +0200
Subject: [PATCH 097/167] fix links and hfoptions usage

---
 chapters/en/chapter2/8.mdx | 96 +++++++++++++++++++++++++++-----------
 1 file changed, 69 insertions(+), 27 deletions(-)

diff --git a/chapters/en/chapter2/8.mdx b/chapters/en/chapter2/8.mdx
index 1482fa92b..bc619a018 100644
--- a/chapters/en/chapter2/8.mdx
+++ b/chapters/en/chapter2/8.mdx
@@ -71,7 +71,9 @@ Let's explore how to use these frameworks for deploying LLMs, starting with inst
 
 ### Installation and Basic Setup
 
-{#if framework === 'tgi'}
+<hfoptions id="inference-frameworks" >
+
+<hfoption value="tgi" label="TGI">
 
 TGI is easy to install and use, with deep integration into the Hugging Face ecosystem.
 
@@ -144,7 +146,8 @@ response = client.chat.completions.create(
 )
 print(response.choices[0].message.content)
 ```
-{:else if framework === 'llama.cpp'}
+</hfoption>
+<hfoption value="llama.cpp" label="llama.cpp">
 
 llama.cpp is easy to install and use, requiring minimal dependencies and supporting both CPU and GPU inference.
 
@@ -232,7 +235,8 @@ response = client.chat.completions.create(
 )
 print(response.choices[0].message.content)
 ```
-{:else}
+</hfoption>
+<hfoption value="vllm" label="vLLM">
 
 vLLM is easy to install and use, with both OpenAI API compatibility and a native Python interface.
 
@@ -302,13 +306,17 @@ response = client.chat.completions.create(
 )
 print(response.choices[0].message.content)
 ```
-{/if}
+</hfoption>
+
+</hfoptions>
 
 ### Basic Text Generation
 
 Let's look at examples of text generation with the frameworks:
 
-{#if framework === 'tgi'}
+<hfoptions id="inference-frameworks" >
+
+<hfoption value="tgi" label="TGI">
 
 First, deploy TGI with advanced parameters:
 ```sh
@@ -372,7 +380,8 @@ response = client.chat.completions.create(
 )
 print(response.choices[0].message.content)
 ```
-{:else if framework === 'llama.cpp'}
+</hfoption>
+<hfoption value="llama.cpp" label="llama.cpp">
 
 For llama.cpp, you can set advanced parameters when launching the server:
 
@@ -478,7 +487,8 @@ output = llm(
 
 print(output["choices"][0]["text"])
 ```
-{:else}
+</hfoption>
+<hfoption value="vllm" label="vLLM">
 
 For advanced usage with vLLM, you can use the InferenceClient:
 
@@ -569,7 +579,9 @@ formatted_prompt = llm.get_chat_template()(chat_prompt)  # Uses model's chat tem
 outputs = llm.generate(formatted_prompt, sampling_params)
 print(outputs[0].outputs[0].text)
 ```
-{/if}
+</hfoption>
+
+</hfoptions>
 
 ## Advanced Generation Control
 
@@ -584,7 +596,10 @@ The process of generating text involves selecting the next token at each step. T
 
 Here's how to configure these parameters:
 
-{#if framework === 'tgi'}
+<hfoptions id="inference-frameworks" >
+
+<hfoption value="tgi" label="TGI">
+
 ```python
 client.generate(
     "Write a creative story",
@@ -595,7 +610,9 @@ client.generate(
     repetition_penalty=1.1,  # Reduce repetition
 )
 ```
-{:else if framework === 'llama.cpp'}
+</hfoption>
+<hfoption value="llama.cpp" label="llama.cpp">
+
 ```python
 # Via OpenAI API compatibility
 response = client.completions.create(
@@ -618,7 +635,9 @@ output = llm(
     repeat_penalty=1.1,
 )
 ```
-{:else}
+</hfoption>
+<hfoption value="vllm" label="vLLM">
+
 ```python
 params = SamplingParams(
     temperature=0.8,  # Higher for more creativity
@@ -629,13 +648,17 @@ params = SamplingParams(
 )
 llm.generate("Write a creative story", sampling_params=params)
 ```
-{/if}
+</hfoption>
+
+</hfoptions>
 
 ### Controlling Repetition
 
 Both frameworks provide ways to prevent repetitive text generation:
 
-{#if framework === 'tgi'}
+<hfoptions id="inference-frameworks" >
+
+<hfoption value="tgi" label="TGI">
 ```python
 client.generate(
     "Write a varied text",
@@ -643,7 +666,9 @@ client.generate(
     no_repeat_ngram_size=3,  # Prevent 3-gram repetition
 )
 ```
-{:else if framework === 'llama.cpp'}
+</hfoption>
+<hfoption value="llama.cpp" label="llama.cpp">
+
 ```python
 # Via OpenAI API
 response = client.completions.create(
@@ -661,20 +686,26 @@ output = llm(
     presence_penalty=0.5,  # Additional presence penalty
 )
 ```
-{:else}
+</hfoption>
+<hfoption value="vllm" label="vLLM">
+
 ```python
 params = SamplingParams(
     presence_penalty=0.1,  # Penalize token presence
     frequency_penalty=0.1,  # Penalize token frequency
 )
 ```
-{/if}
+</hfoption>
+
+</hfoptions>
 
 ### Length Control and Stop Sequences
 
 You can control generation length and specify when to stop:
 
-{#if framework === 'tgi'}
+<hfoptions id="inference-frameworks" >
+
+<hfoption value="tgi" label="TGI">
 ```python
 client.generate(
     "Generate a short paragraph",
@@ -683,7 +714,9 @@ client.generate(
     stop_sequences=["\n\n", "###"],
 )
 ```
-{:else if framework === 'llama.cpp'}
+</hfoption>
+<hfoption value="llama.cpp" label="llama.cpp">
+
 ```python
 # Via OpenAI API
 response = client.completions.create(
@@ -696,7 +729,9 @@ response = client.completions.create(
 # Via direct library
 output = llm("Generate a short paragraph", max_tokens=100, stop=["\n\n", "###"])
 ```
-{:else}
+</hfoption>
+<hfoption value="vllm" label="vLLM">
+
 ```python
 params = SamplingParams(
     max_tokens=100,
@@ -706,13 +741,17 @@ params = SamplingParams(
     skip_special_tokens=True,
 )
 ```
-{/if}
+</hfoption>
+
+</hfoptions>
 
 ## Memory Management
 
 Both frameworks implement advanced memory management techniques for efficient inference.
 
-{#if framework === 'tgi'}
+<hfoptions id="inference-frameworks" >
+
+<hfoption value="tgi" label="TGI">
 TGI uses Flash Attention 2 and continuous batching:
 
 ```sh
@@ -724,7 +763,9 @@ docker run --gpus all -p 8080:80 \
     --max-batch-total-tokens 8192 \
     --max-input-length 4096
 ```
-{:else if framework === 'llama.cpp'}
+</hfoption>
+<hfoption value="llama.cpp" label="llama.cpp">
+
 llama.cpp uses quantization and optimized memory layout:
 
 ```sh
@@ -748,7 +789,9 @@ For models too large for your GPU, you can use CPU offloading:
     --n-gpu-layers 20 \     # Keep first 20 layers on GPU
     --threads 8             # Use more CPU threads for CPU layers
 ```
-{:else}
+</hfoption>
+<hfoption value="vllm" label="vLLM">
+
 vLLM uses PagedAttention for optimal memory management:
 
 ```python
@@ -763,7 +806,9 @@ engine_args = AsyncEngineArgs(
 
 llm = LLM(engine_args=engine_args)
 ```
-{/if}
+</hfoption>
+
+</hfoptions>
 
 ## Resources
 
@@ -772,8 +817,5 @@ llm = LLM(engine_args=engine_args)
 - [vLLM Documentation](https://vllm.readthedocs.io/)
 - [vLLM GitHub Repository](https://github.com/vllm-project/vllm)
 - [PagedAttention Paper](https://arxiv.org/abs/2309.06180)
-- [HuggingFace Blog: TGI in Production](https://huggingface.co/blog/tgi-serving)
-- [vLLM Performance Benchmarks](https://vllm.readthedocs.io/en/latest/performance.html)
 - [llama.cpp GitHub Repository](https://github.com/ggerganov/llama.cpp)
-- [llama.cpp Server Documentation](https://github.com/ggerganov/llama.cpp/blob/master/examples/server/README.md)
 - [llama-cpp-python Repository](https://github.com/abetlen/llama-cpp-python)
\ No newline at end of file

From 00761aa3833feb0efc3c51e297865bddc81cfd06 Mon Sep 17 00:00:00 2001
From: burtenshaw <ben.burtenshaw@gmail.com>
Date: Wed, 14 May 2025 16:04:47 +0200
Subject: [PATCH 098/167] Update chapters/en/chapter2/3.mdx

Co-authored-by: Sergio Paniego Blanco <sergiopaniegoblanco@gmail.com>
---
 chapters/en/chapter2/3.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/en/chapter2/3.mdx b/chapters/en/chapter2/3.mdx
index 0c93ab243..91d3ddd00 100644
--- a/chapters/en/chapter2/3.mdx
+++ b/chapters/en/chapter2/3.mdx
@@ -94,7 +94,7 @@ You can do a lot more with the Hub API:
 - Update specific files without re-uploading everything
 - Add model cards to document the model's abilities, limitations, known biases, etc.
 
-See [the documentation](https://huggingface.co/docs/huggingface_hub/how-to-upstream) for a complete tutorial on this, or check out the advanced [Chapter 4](/course/chapter4/share).
+See [the documentation](https://huggingface.co/docs/huggingface_hub/how-to-upstream) for a complete tutorial on this, or check out the advanced [Chapter 4](/course/chapter4).
 
 ## Encoding text[[encoding-text]]
 

From 933135a4ab854c71f6e0a95636a6da277a4bb04d Mon Sep 17 00:00:00 2001
From: burtenshaw <ben.burtenshaw@gmail.com>
Date: Wed, 14 May 2025 16:16:09 +0200
Subject: [PATCH 099/167] Apply suggestions from code review

Co-authored-by: Sergio Paniego Blanco <sergiopaniegoblanco@gmail.com>
---
 chapters/en/_toctree.yml   |  2 +-
 chapters/en/chapter2/9.mdx | 16 ++++++++--------
 2 files changed, 9 insertions(+), 9 deletions(-)

diff --git a/chapters/en/_toctree.yml b/chapters/en/_toctree.yml
index b31d964bd..b300b245f 100644
--- a/chapters/en/_toctree.yml
+++ b/chapters/en/_toctree.yml
@@ -46,7 +46,7 @@
   - local: chapter2/7
     title: Basic usage completed!
   - local: chapter2/8
-    title: Inference with transformers and beyond
+    title: Optimized Inference Deployment
   - local: chapter2/9
     title: End-of-chapter quiz
     quiz: 2
diff --git a/chapters/en/chapter2/9.mdx b/chapters/en/chapter2/9.mdx
index 1e51522a2..1a375422a 100644
--- a/chapters/en/chapter2/9.mdx
+++ b/chapters/en/chapter2/9.mdx
@@ -23,7 +23,7 @@
 		},
 		{
 			text: "The tokenizer handles text and returns IDs. The model handles these IDs and outputs a prediction. The tokenizer can then be used once again to convert these predictions back to some text.",
-			explain: "Correct! The tokenizer can be used for both tokenizing and de-tokenizing.",
+			explain: "The tokenizer can be used for both tokenizing and de-tokenizing.",
             correct: true
 		}
 	]}
@@ -43,7 +43,7 @@
 		},
 		{
 			text: "3: The sequence length, the batch size, and the hidden size",
-			explain: "Correct!",
+			explain: "Nicely done!",
             correct: true
 		}
 	]}
@@ -78,7 +78,7 @@
         },
 		{
 			text: "None of the above",
-			explain: "Incorrect!"
+			explain: "Wrong!"
         }
 	]}
 />
@@ -89,11 +89,11 @@
 	choices={[
 		{
 			text: "A component of the base Transformer network that redirects tensors to their correct layers",
-			explain: "Incorrect! There's no such component."
+			explain: "There's no such component."
 		},
 		{
 			text: "Also known as the self-attention mechanism, it adapts the representation of a token according to the other tokens of the sequence",
-			explain: "Incorrect! The self-attention layer does contain attention \"heads,\" but these are not adaptation heads."
+			explain: "The self-attention layer does contain attention \"heads,\" but these are not adaptation heads."
 		},
 		{
 			text: "An additional component, usually made up of one or a few layers, to convert the transformer predictions to a task-specific output",
@@ -109,7 +109,7 @@
 	choices={[
 		{
 			text: "A model that automatically trains on your data",
-			explain: "Incorrect. Are you mistaking this with our <a href='https://huggingface.co/autotrain'>AutoTrain</a> product?"
+			explain: "Are you mistaking this with our <a href='https://huggingface.co/autotrain'>AutoTrain</a> product?"
 		},
 		{
 			text: "An object that returns the correct architecture based on the checkpoint",
@@ -118,7 +118,7 @@
 		},
 		{
 			text: "A model that automatically detects the language used for its inputs to load the correct weights",
-			explain: "Incorrect; while some checkpoints and models are capable of handling multiple languages, there are no built-in tools for automatic checkpoint selection according to language. You should head over to the <a href='https://huggingface.co/models'>Model Hub</a> to find the best checkpoint for your task!"
+			explain: "While some checkpoints and models are capable of handling multiple languages, there are no built-in tools for automatic checkpoint selection according to language. You should head over to the <a href='https://huggingface.co/models'>Model Hub</a> to find the best checkpoint for your task!"
 		} 
 	]}
 />
@@ -159,7 +159,7 @@
 		},
 		{
 			text: "It applies a lower and upper bound so that they're understandable.",
-			explain: "Correct! The resulting values are bound between 0 and 1. That's not the only reason we use a SoftMax function, though.",
+			explain: "The resulting values are bound between 0 and 1. That's not the only reason we use a SoftMax function, though.",
             correct: true
 		},
 		{

From 381e666e614e6be6883ab2c35534dc4a425a1dad Mon Sep 17 00:00:00 2001
From: Ajey95 <144113600+Ajey95@users.noreply.github.com>
Date: Mon, 19 May 2025 22:44:16 +0530
Subject: [PATCH 100/167] Update build_documentation.yml

---
 .github/workflows/build_documentation.yml | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/.github/workflows/build_documentation.yml b/.github/workflows/build_documentation.yml
index 982795752..ddd416799 100644
--- a/.github/workflows/build_documentation.yml
+++ b/.github/workflows/build_documentation.yml
@@ -14,6 +14,6 @@ jobs:
       package: course
       path_to_docs: course/chapters/
       additional_args: --not_python_module
-      languages: ar bn de en es fa fr gj he hi id it ja ko ne pl pt ru rum th tr vi zh-CN zh-TW
+      languages: ar bn de en es fa fr gj he hi id it ja ko ne pl pt ru rum te th tr vi zh-CN zh-TW
     secrets:
       hf_token: ${{ secrets.HF_DOC_BUILD_PUSH }}

From 3f3147b1da8968e5a72d8a21e94dc081dc3c4c7f Mon Sep 17 00:00:00 2001
From: Ajey95 <144113600+Ajey95@users.noreply.github.com>
Date: Mon, 19 May 2025 22:44:42 +0530
Subject: [PATCH 101/167] Update build_pr_documentation.yml

---
 .github/workflows/build_pr_documentation.yml | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/.github/workflows/build_pr_documentation.yml b/.github/workflows/build_pr_documentation.yml
index 53541f297..43664e711 100644
--- a/.github/workflows/build_pr_documentation.yml
+++ b/.github/workflows/build_pr_documentation.yml
@@ -16,4 +16,4 @@ jobs:
       package: course
       path_to_docs: course/chapters/
       additional_args: --not_python_module
-      languages: ar bn de en es fa fr gj he hi id it ja ko ne pl pt ru rum th tr vi zh-CN zh-TW
+      languages: ar bn de en es fa fr gj he hi id it ja ko ne pl pt ru rum te th tr vi zh-CN zh-TW

From c3d1dca4c00b9e43e6d7811e9f18ce33ead685c1 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Tue, 20 May 2025 10:11:34 +0300
Subject: [PATCH 102/167] fix: remove doc-builder

---
 doc-builder | 1 -
 1 file changed, 1 deletion(-)
 delete mode 160000 doc-builder

diff --git a/doc-builder b/doc-builder
deleted file mode 160000
index c92e72cc9..000000000
--- a/doc-builder
+++ /dev/null
@@ -1 +0,0 @@
-Subproject commit c92e72cc953d0e595ca5ed37144d01cd4ecfa48b

From 864714231af1f0bbb25399d2d7695b1637fa5338 Mon Sep 17 00:00:00 2001
From: Ajey95 <144113600+Ajey95@users.noreply.github.com>
Date: Wed, 21 May 2025 17:20:45 +0530
Subject: [PATCH 103/167] Update README.md

Hey @stevhliu ! I'm Ajey. Contributing for translation of  the chapters in Telugu language. I updated readme.md by adding my name for Telugu.

If you don't mind can you add my translation in the course.
So others of my language can read them online.
Thank you .
---
 README.md | 1 +
 1 file changed, 1 insertion(+)

diff --git a/README.md b/README.md
index 0ff979041..07dadca56 100644
--- a/README.md
+++ b/README.md
@@ -21,6 +21,7 @@ This repo contains the content that's used to create the **[Hugging Face course]
 | [Korean](https://huggingface.co/course/ko/chapter1/1) (WIP)                   | [`chapters/ko`](https://github.com/huggingface/course/tree/main/chapters/ko)       | [@Doohae](https://github.com/Doohae), [@wonhyeongseo](https://github.com/wonhyeongseo), [@dlfrnaos19](https://github.com/dlfrnaos19), [@nsbg](https://github.com/nsbg)                                                                                                                                                                                                                                                                                                                     |
 | [Portuguese](https://huggingface.co/course/pt/chapter1/1) (WIP)               | [`chapters/pt`](https://github.com/huggingface/course/tree/main/chapters/pt)       | [@johnnv1](https://github.com/johnnv1), [@victorescosta](https://github.com/victorescosta), [@LincolnVS](https://github.com/LincolnVS)                                                                                                                                                                                                                   |
 | [Russian](https://huggingface.co/course/ru/chapter1/1) (WIP)                  | [`chapters/ru`](https://github.com/huggingface/course/tree/main/chapters/ru)       | [@pdumin](https://github.com/pdumin), [@svv73](https://github.com/svv73), [@blademoon](https://github.com/blademoon)                                                                                                                                                                                                                                                                                 |
+| [Telugu]( https://huggingface.co/course/te/chapter0/1 ) (WIP)                                                             | [`chapters/te`](https://github.com/huggingface/course/tree/main/chapters/te)       | [@Ajey95](https://github.com/Ajey95)                                    
 | [Thai](https://huggingface.co/course/th/chapter1/1) (WIP)                     | [`chapters/th`](https://github.com/huggingface/course/tree/main/chapters/th)       | [@peeraponw](https://github.com/peeraponw), [@a-krirk](https://github.com/a-krirk), [@jomariya23156](https://github.com/jomariya23156), [@ckingkan](https://github.com/ckingkan)                                                                                                                                                                         |
 | [Turkish](https://huggingface.co/course/tr/chapter1/1) (WIP)                  | [`chapters/tr`](https://github.com/huggingface/course/tree/main/chapters/tr)       | [@tanersekmen](https://github.com/tanersekmen), [@mertbozkir](https://github.com/mertbozkir), [@ftarlaci](https://github.com/ftarlaci), [@akkasayaz](https://github.com/akkasayaz)                                                                                                                                                                       |
 | [Vietnamese](https://huggingface.co/course/vi/chapter1/1)               | [`chapters/vi`](https://github.com/huggingface/course/tree/main/chapters/vi)       | [@honghanhh](https://github.com/honghanhh)                                                                                                                                                                                                                                                                                                               |

From 0b4e2c4cb16e541febe6e26a0295fbdaece7491c Mon Sep 17 00:00:00 2001
From: burtenshaw <ben.burtenshaw@gmail.com>
Date: Fri, 23 May 2025 09:01:15 +0200
Subject: [PATCH 104/167] Update chapters/en/chapter2/8.mdx

Co-authored-by: Sergio Paniego Blanco <sergiopaniegoblanco@gmail.com>
---
 chapters/en/chapter2/8.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/en/chapter2/8.mdx b/chapters/en/chapter2/8.mdx
index bc619a018..266e95c82 100644
--- a/chapters/en/chapter2/8.mdx
+++ b/chapters/en/chapter2/8.mdx
@@ -15,7 +15,7 @@ TGI, vLLM, and llama.cpp serve similar purposes but have distinct characteristic
 <img src="https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/tgi/flash-attn.png" alt="Flash Attention" />
 
 <Tip title="How Flash Attention Works">
-Flash Attention is a technique that optimizes the attention mechanism in transformer models by addressing memory bandwidth bottlenecks. As discussed earlier in [section 12.3](2.mdx), the attention mechanism has quadratic complexity and memory usage, making it inefficient for long sequences.
+Flash Attention is a technique that optimizes the attention mechanism in transformer models by addressing memory bandwidth bottlenecks. As discussed earlier in [Chapter 1.8](/course/chapter1/8), the attention mechanism has quadratic complexity and memory usage, making it inefficient for long sequences.
 
 The key innovation is in how it manages memory transfers between High Bandwidth Memory (HBM) and faster SRAM cache. Traditional attention repeatedly transfers data between HBM and SRAM, creating bottlenecks by leaving the GPU idle. Flash Attention loads data once into SRAM and performs all calculations there, minimizing expensive memory transfers. 
 

From 5deaf167f96aa419a792597b00d9303fb503b993 Mon Sep 17 00:00:00 2001
From: burtenshaw <ben.burtenshaw@gmail.com>
Date: Fri, 23 May 2025 09:01:23 +0200
Subject: [PATCH 105/167] Update chapters/en/chapter2/8.mdx

Co-authored-by: Sergio Paniego Blanco <sergiopaniegoblanco@gmail.com>
---
 chapters/en/chapter2/8.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/en/chapter2/8.mdx b/chapters/en/chapter2/8.mdx
index 266e95c82..47cc1fa7f 100644
--- a/chapters/en/chapter2/8.mdx
+++ b/chapters/en/chapter2/8.mdx
@@ -24,7 +24,7 @@ While the benefits are most significant during training, Flash Attention's reduc
 
 **vLLM** takes a different approach by using PagedAttention. Just like how a computer manages its memory in pages, vLLM splits the model's memory into smaller blocks. This clever system means it can handle different-sized requests more flexibly and doesn't waste memory space. It's particularly good at sharing memory between different requests and reduces memory fragmentation, which makes the whole system more efficient.
 
-<Tip title="How Paged Attention Works">
+<Tip title="How PagedAttention Works">
 Paged Attention is a technique that addresses another critical bottleneck in LLM inference: KV cache memory management. As discussed in [section 12.3](2.mdx), during text generation, the model stores attention keys and values (KV cache) for each generated token to reduce redundant computations. The KV cache can become enormous, especially with long sequences or multiple concurrent requests.
 
 vLLM's key innovation lies in how it manages this cache:

From d69d6d0991e2ec9f618fd00e98f9c0616cfd9822 Mon Sep 17 00:00:00 2001
From: burtenshaw <ben.burtenshaw@gmail.com>
Date: Fri, 23 May 2025 09:01:38 +0200
Subject: [PATCH 106/167] Update chapters/en/chapter2/8.mdx

Co-authored-by: Sergio Paniego Blanco <sergiopaniegoblanco@gmail.com>
---
 chapters/en/chapter2/8.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/en/chapter2/8.mdx b/chapters/en/chapter2/8.mdx
index 47cc1fa7f..f2f7ab431 100644
--- a/chapters/en/chapter2/8.mdx
+++ b/chapters/en/chapter2/8.mdx
@@ -25,7 +25,7 @@ While the benefits are most significant during training, Flash Attention's reduc
 **vLLM** takes a different approach by using PagedAttention. Just like how a computer manages its memory in pages, vLLM splits the model's memory into smaller blocks. This clever system means it can handle different-sized requests more flexibly and doesn't waste memory space. It's particularly good at sharing memory between different requests and reduces memory fragmentation, which makes the whole system more efficient.
 
 <Tip title="How PagedAttention Works">
-Paged Attention is a technique that addresses another critical bottleneck in LLM inference: KV cache memory management. As discussed in [section 12.3](2.mdx), during text generation, the model stores attention keys and values (KV cache) for each generated token to reduce redundant computations. The KV cache can become enormous, especially with long sequences or multiple concurrent requests.
+PagedAttention is a technique that addresses another critical bottleneck in LLM inference: KV cache memory management. As discussed in [Chapter 1.8](/course/chapter1/8), during text generation, the model stores attention keys and values (KV cache) for each generated token to reduce redundant computations. The KV cache can become enormous, especially with long sequences or multiple concurrent requests.
 
 vLLM's key innovation lies in how it manages this cache:
 

From 1bd8547e14cb9436be75265143e47ba7d2cd3157 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Mon, 26 May 2025 18:36:14 +0300
Subject: [PATCH 107/167] fix: add toctree content

---
 chapters/rum/_toctree.yml | 60 +++++++++++++++++++++++++++++++++++++++
 1 file changed, 60 insertions(+)

diff --git a/chapters/rum/_toctree.yml b/chapters/rum/_toctree.yml
index bb40acb8b..da431247c 100644
--- a/chapters/rum/_toctree.yml
+++ b/chapters/rum/_toctree.yml
@@ -2,3 +2,63 @@
   sections:
   - local: chapter0/1
     title: Introducere
+- title: 1. Modele Transformer
+  sections:
+  - local: chapter1/1
+    title: Introducere
+  - local: chapter1/2
+    title: Procesarea limbajului natural și modelele de limbaj mari
+  - local: chapter1/3
+    title: Transformers, ce pot face?
+  - local: chapter1/4
+    title: Cum funcționează Transformers?
+  - local: chapter1/5
+    title: Modele Encoder
+  - local: chapter1/6
+    title: Modele Decoder
+  - local: chapter1/7
+    title: Modele secvență-la-secvență
+  - local: chapter1/8
+    title: Prejudecăți și limitări
+  - local: chapter1/9
+    title: Rezumat
+  - local: chapter1/10
+    title: Quiz de final de capitol
+    quiz: 1
+
+- title: 2. Using 🤗 Transformers
+  sections:
+  - local: chapter2/1
+    title: Introducere
+  - local: chapter2/2
+    title: În spatele pipeline-ului
+  - local: chapter2/3
+    title: Modele
+  - local: chapter2/4
+    title: Tokenizatoare
+  - local: chapter2/5
+    title: Gestionarea secvențelor multiple
+  - local: chapter2/6
+    title: Să punem totul cap la cap
+  - local: chapter2/7
+    title: Utilizarea de bază este completă!
+  - local: chapter2/8
+    title: Quiz la final de capitol
+    quiz: 2
+
+- title: 3. Fine-tuning unui model preantrenat
+  sections:
+  - local: chapter3/1
+    title: Introducere
+  - local: chapter3/2
+    title: Procesarea datelor
+  - local: chapter3/3
+    title: Fine-tuningul unui model cu Trainer API sau Keras
+    local_fw: { pt: chapter3/3, tf: chapter3/3_tf }
+  - local: chapter3/4
+    title: Un antrenament complet
+  - local: chapter3/5
+    title: Fine-tuning, verificare!
+  - local: chapter3/6
+    title: Quiz la final de capitol
+    quiz: 3
\ No newline at end of file

From 9026c66948904ea214f0e54b22c082c684bf9785 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Tue, 27 May 2025 11:04:20 +0300
Subject: [PATCH 108/167] fix: update toctree to only include the current
 chapter

---
 chapters/rum/_toctree.yml | 43 ---------------------------------------
 1 file changed, 43 deletions(-)

diff --git a/chapters/rum/_toctree.yml b/chapters/rum/_toctree.yml
index da431247c..ae923929b 100644
--- a/chapters/rum/_toctree.yml
+++ b/chapters/rum/_toctree.yml
@@ -2,49 +2,6 @@
   sections:
   - local: chapter0/1
     title: Introducere
-- title: 1. Modele Transformer
-  sections:
-  - local: chapter1/1
-    title: Introducere
-  - local: chapter1/2
-    title: Procesarea limbajului natural și modelele de limbaj mari
-  - local: chapter1/3
-    title: Transformers, ce pot face?
-  - local: chapter1/4
-    title: Cum funcționează Transformers?
-  - local: chapter1/5
-    title: Modele Encoder
-  - local: chapter1/6
-    title: Modele Decoder
-  - local: chapter1/7
-    title: Modele secvență-la-secvență
-  - local: chapter1/8
-    title: Prejudecăți și limitări
-  - local: chapter1/9
-    title: Rezumat
-  - local: chapter1/10
-    title: Quiz de final de capitol
-    quiz: 1
-
-- title: 2. Using 🤗 Transformers
-  sections:
-  - local: chapter2/1
-    title: Introducere
-  - local: chapter2/2
-    title: În spatele pipeline-ului
-  - local: chapter2/3
-    title: Modele
-  - local: chapter2/4
-    title: Tokenizatoare
-  - local: chapter2/5
-    title: Gestionarea secvențelor multiple
-  - local: chapter2/6
-    title: Să punem totul cap la cap
-  - local: chapter2/7
-    title: Utilizarea de bază este completă!
-  - local: chapter2/8
-    title: Quiz la final de capitol
-    quiz: 2
 
 - title: 3. Fine-tuning unui model preantrenat
   sections:

From e61e11e7b4cd8a4f42e8bbda360ddc021db7614c Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Tue, 27 May 2025 11:26:26 +0300
Subject: [PATCH 109/167] fix: remove unnecessary files

---
 .codegpt/head | 1 -
 .gitignore    | 3 ---
 2 files changed, 4 deletions(-)
 delete mode 100644 .codegpt/head

diff --git a/.codegpt/head b/.codegpt/head
deleted file mode 100644
index 61e0708bd..000000000
--- a/.codegpt/head
+++ /dev/null
@@ -1 +0,0 @@
-d92002a2-d67d-44e7-9370-14bf913c3669
\ No newline at end of file
diff --git a/.gitignore b/.gitignore
index fa8e74203..9f8d58807 100644
--- a/.gitignore
+++ b/.gitignore
@@ -81,6 +81,3 @@ nbs/
 # Byte-compiled
 __pycache__/
 .cache/
-
-
-.codegpt
\ No newline at end of file

From 2550453dd843eee3b99c5a7a48c2017fe8f746be Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Tue, 27 May 2025 11:27:11 +0300
Subject: [PATCH 110/167] fix: remove unecessary files from wrong folder

---
 chapters/ro/_toctree.yml      |  28 --
 chapters/ro/chapter0/1.mdx    | 110 ------
 chapters/ro/chapter2/1.mdx    |  28 --
 chapters/ro/chapter2/2.mdx    | 364 -------------------
 chapters/ro/chapter2/3.mdx    | 235 -------------
 chapters/ro/chapter2/4.mdx    | 246 -------------
 chapters/ro/chapter2/5.mdx    | 338 ------------------
 chapters/ro/chapter2/6.mdx    | 164 ---------
 chapters/ro/chapter2/7.mdx    |  19 -
 chapters/ro/chapter2/8.mdx    | 310 ----------------
 chapters/ro/chapter3/1.mdx    |  25 --
 chapters/ro/chapter3/2.mdx    | 393 ---------------------
 chapters/ro/chapter3/3.mdx    | 174 ---------
 chapters/ro/chapter3/3_tf.mdx | 206 -----------
 chapters/ro/chapter3/4.mdx    | 361 -------------------
 chapters/ro/chapter3/5.mdx    |  26 --
 chapters/ro/chapter3/6.mdx    | 301 ----------------
 chapters/ro/chapter4/1.mdx    |  22 --
 chapters/ro/chapter4/2.mdx    |  98 ------
 chapters/ro/chapter4/3.mdx    | 641 ----------------------------------
 chapters/ro/chapter4/4.mdx    |  88 -----
 chapters/ro/chapter4/5.mdx    |  12 -
 chapters/ro/chapter4/6.mdx    | 233 ------------
 23 files changed, 4422 deletions(-)
 delete mode 100644 chapters/ro/_toctree.yml
 delete mode 100644 chapters/ro/chapter0/1.mdx
 delete mode 100644 chapters/ro/chapter2/1.mdx
 delete mode 100644 chapters/ro/chapter2/2.mdx
 delete mode 100644 chapters/ro/chapter2/3.mdx
 delete mode 100644 chapters/ro/chapter2/4.mdx
 delete mode 100644 chapters/ro/chapter2/5.mdx
 delete mode 100644 chapters/ro/chapter2/6.mdx
 delete mode 100644 chapters/ro/chapter2/7.mdx
 delete mode 100644 chapters/ro/chapter2/8.mdx
 delete mode 100644 chapters/ro/chapter3/1.mdx
 delete mode 100644 chapters/ro/chapter3/2.mdx
 delete mode 100644 chapters/ro/chapter3/3.mdx
 delete mode 100644 chapters/ro/chapter3/3_tf.mdx
 delete mode 100644 chapters/ro/chapter3/4.mdx
 delete mode 100644 chapters/ro/chapter3/5.mdx
 delete mode 100644 chapters/ro/chapter3/6.mdx
 delete mode 100644 chapters/ro/chapter4/1.mdx
 delete mode 100644 chapters/ro/chapter4/2.mdx
 delete mode 100644 chapters/ro/chapter4/3.mdx
 delete mode 100644 chapters/ro/chapter4/4.mdx
 delete mode 100644 chapters/ro/chapter4/5.mdx
 delete mode 100644 chapters/ro/chapter4/6.mdx

diff --git a/chapters/ro/_toctree.yml b/chapters/ro/_toctree.yml
deleted file mode 100644
index 25730606c..000000000
--- a/chapters/ro/_toctree.yml
+++ /dev/null
@@ -1,28 +0,0 @@
-- title: 0. Configurare
-  sections:
-  - local: chapter0/1
-    title: Introducere
-
-- title: 1. Modele Transformer
-  sections:
-  - local: chapter1/1
-    title: Introducere
-  - local: chapter1/2
-    title: Procesarea limbajului natural și modelele de limbaj mari
-  - local: chapter1/3
-    title: Transformers, ce pot face?
-  - local: chapter1/4
-    title: Cum funcționează Transformers?
-  - local: chapter1/5
-    title: Modele Encoder
-  - local: chapter1/6
-    title: Modele Decoder
-  - local: chapter1/7
-    title: Modele secvență-la-secvență
-  - local: chapter1/8
-    title: Prejudecăți și limitări
-  - local: chapter1/9
-    title: Rezumat
-  - local: chapter1/10
-    title: Quiz de final de capitol
-    quiz: 1
diff --git a/chapters/ro/chapter0/1.mdx b/chapters/ro/chapter0/1.mdx
deleted file mode 100644
index c7c072707..000000000
--- a/chapters/ro/chapter0/1.mdx
+++ /dev/null
@@ -1,110 +0,0 @@
-# Introducere[[introducere]]
-
-Bun venit la cursul Hugging Face! Această introducere te va ghida în configurarea environment-ului de lucru. Dacă abia începi cursul, îți recomandăm să arunci o privire mai întâi asupra [Capitolului 1](/course/chapter1), apoi să te întorci și să îți configurezi environment-ul pentru a putea încerca singur codul.
-
-Toate bibliotecile pe care le vom folosi în acest curs sunt disponibile ca Python packages, așa că aici îți vom arăta cum să configurezi Python environment-ul și să instalezi librăriile specifice de care ai nevoie.
-
-Vom acoperi două moduri de a-ți configura environment-ul, folosind un notebook Colab sau un Python environment. Simte-te liber să alegi pe cel care ți se potrivește cel mai bine. Pentru începători, recomandăm să începi folosind un notebook Colab.
-
-Reține că nu vom acoperi sistemul Windows. Dacă folosești Windows, îți recomandăm să urmezi pașii folosind un notebook Colab. Dacă folosești o distribuție Linux sau macOS, poți folosi oricare dintre abordările descrise aici.
-
-Majoritatea cursului se bazează pe faptul că ai un cont Hugging Face. Îți recomandăm să creezi unul acum: [crează un cont](https://huggingface.co/join).
-
-## Folosirea unui notebook Google Colab[[folosind-un-notebook-google-colab]]
-
-Folosirea unui notebook Colab este cea mai simplă configurare posibilă; deschide un notebook în browserul tău și începe imediat să scrii cod!
-
-Dacă nu ești familiarizat cu Colab, îți recomandăm să începi urmând [introducerea](https://colab.research.google.com/notebooks/intro.ipynb). Colab îți permite să folosești hardware accelerat, cum ar fi GPU-uri sau TPU-uri, și este gratuit pentru sarcini mai mici.
-
-Odată ce ești confortabil să te descurci în Colab, creează un nou notebook și începe cu configurarea:
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter0/new_colab.png" alt="Un notebook Colab gol" width="80%"/>
-</div>
-
-Următorul pas este să instalezi librăriile pe care le vom folosi în acest curs. Vom folosi `pip` pentru instalare, care este managerul de packages pentru Python. În notebook-uri, poți rula comenzi de sistem începând comanda cu caracterul `!`, așa că poți instala librăria 🤗 Transformers astfel:
-
-```
-!pip install transformers
-```
-
-Te poți asigura că pachetul a fost instalat corect importându-l în cadrul mediului tău Python:
-
-```
-import transformers
-```
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter0/install.gif" alt="O animație care arată rezultatul celor două comenzi de mai sus: instalare și importarea" width="80%"/>
-</div>
-
-Aceasta instalează o versiune foarte ușoară a 🤗 Transformers. În special, nu sunt instalate framework-uri specifice de machine learning (cum ar fi PyTorch sau TensorFlow). Deoarece vom folosi multe caracteristici diferite ale librăriei, îți recomandăm să instalezi versiunea pentru development, care vine cu toate dependențele necesare pentru cam orice caz de utilizare imaginabil:
-
-```
-!pip install transformers[sentencepiece]
-```
-
-Aceasta va dura puțin timp, dar apoi vei fi gata de drum pentru restul cursului!
-
-## Folosirea unui virtual environment Python[[folosirea-unui-virtual-environment-python]]
-
-Dacă preferi să folosești un mediu virtual Python, primul pas este să instalezi Python pe sistemul tău. Îți recomandăm să urmezi [această ghidare](https://realpython.com/installing-python/) pentru a începe.
-
-Odată ce ai Python instalat, ar trebui să poți rula comenzi Python în terminalul tău. Poți începe rulând următoarea comandă pentru a te asigura că este instalat corect înainte de a trece la pașii următori: `python --version`. Aceasta ar trebui să afișeze versiunea Python disponibilă acum pe sistemul tău.
-
-Când rulezi o comandă Python în terminalul tău, cum ar fi `python --version`, ar trebui să te gândești la programul care rulează comanda ta ca la Python-ul "principal" de pe sistemul tău. Îți recomandăm să păstrezi această instalare principală liberă de orice pachete și să o folosești pentru a crea environment-uri separate pentru fiecare aplicație pe care lucrezi — în acest fel, fiecare aplicație poate avea propriile sale dependențe și pachete, și nu va trebui să te preocupi de problemele de compatibilitate potențiale cu alte aplicații.
-
-În Python, acest lucru se face prin [*virtual environments*](https://docs.python.org/3/tutorial/venv.html), care sunt directory trees autonomi ce conțin fiecare o instalare Python cu o anumită versiune Python împreună cu toate pachetele de care are nevoie aplicația. Crearea unui astfel de mediu virtual poate fi realizată cu mai multe instrumente diferite, dar vom folosi pachetul oficial Python pentru acest scop, denumit [`venv`](https://docs.python.org/3/library/venv.html#module-venv).
-
-În primul rând, creează folder în care dorești ca aplicația ta să locuiască — de exemplu, ai putea dori să faci un nou folder numit *transformers-course* în rădăcina folderului tău personal:
-
-```
-mkdir ~/transformers-course
-cd ~/transformers-course
-```
-
-Din interiorul acestui folder, creează un virtual environment folosind modulul Python `venv`:
-
-```
-python -m venv .env
-```
-
-Acum ar trebui să ai un folder numit *.env* în folderul tău altfel gol:
-
-```
-ls -a
-```
-
-```out
-.      ..    .env
-```
-
-Poți să intri și să ieși din environment folosind comenzile `activate` și `deactivate`:
-
-```
-# Activează mediul virtual
-source .env/bin/activate
-
-# Dezactivează virtual environment-ul
-deactivate
-```
-
-Te poți asigura că environment-ul este activat rulând comanda `which python`: dacă aceasta indică către virtual environment, atunci l-ai activat cu succes!
-
-```
-which python
-```
-
-```out
-/home/<user>/transformers-course/.env/bin/python
-```
-
-### Instalarea dependențelor[[instalarea-dependențelor]]
-
-La fel ca în secțiunea anterioară despre utilizarea instanțelor Google Colab, acum va trebui să instalezi pachetele necesare pentru a continua. Din nou, poți instala versiunea pentru development a 🤗 Transformers folosind managerul de pachete `pip`:
-
-```
-pip install "transformers[sentencepiece]"
-```
-
-Acum ești gata să începi!
\ No newline at end of file
diff --git a/chapters/ro/chapter2/1.mdx b/chapters/ro/chapter2/1.mdx
deleted file mode 100644
index 75093a9f9..000000000
--- a/chapters/ro/chapter2/1.mdx
+++ /dev/null
@@ -1,28 +0,0 @@
-# Introducere[[introducere]]
-
-<CourseFloatingBanner
-    chapter={2}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-După cum ați văzut în [Capitolul 1](/course/chapter1), modelele Transformer sunt de obicei foarte voluminoase. Fiind alcătuite din milioane până la zeci de *miliarde* de parametri, instruirea și implementarea acestor modele este o sarcină complicată. În plus, cu noi modele lansate aproape zilnic și fiecare având propria sa implementare, testarea tuturor acestora nu este o sarcină ușoară.
-
-Biblioteca 🤗 Transformers a fost creată pentru a rezolva această problemă. Scopul său este de a oferi un singur API prin care orice model Transformer poate fi încărcat, instruit și salvat. Principalele caracteristici ale bibliotecii sunt:
-
-- ** Simplitate în utilizare**: Descărcarea, încărcarea și utilizarea unui model NLP de ultimă generație pentru inferență pot fi realizate în doar două linii de cod.
-- **Flexibilitate**: În esența lor, toate modelele sunt simple clase PyTorch `nn.Module` sau TensorFlow `tf.keras.Model` și pot fi manipulate ca orice alte modele în framework-urile lor respective de învățare automată (ML).
-- **Simplitate**: Aproape că nu se fac abstractizări în întreaga bibliotecă. „All in one file” este un concept de bază: trecerea înainte a unui model este definită în întregime într-un singur fișier, astfel încât codul în sine să fie ușor de înțeles și hackable.
-
-Această ultimă caracteristică face 🤗 Transformers destul de diferit de alte biblioteci ML. Modelele nu sunt construite pe module 
-care sunt partajate între fișiere; în schimb, fiecare model are propriile sale straturi. În plus, pe lângă faptul că modelele sunt mai ușor de abordat și de înțeles, acest lucru vă permite să experimentați cu ușurință pe un model fără a le afecta pe celelalte.
-
-Acest capitol va începe cu un exemplu end-to-end în care folosim împreună un model și un tokenizer pentru a replica funcția `pipeline()` introdusă în [Capitolul 1](/course/chapter1). În continuare, vom discuta despre API-ul modelului: vom analiza clasele de model și de configurare și vă vom arăta cum să încărcați un model și cum acesta procesează intrările numerice pentru a genera predicții. 
-
-Apoi vom analiza API-ul tokenizer, care este cealaltă componentă principală a funcției `pipeline()`. Tokenizerii se ocupă de prima și ultima etapă de procesare, gestionând conversia de la text la intrări numerice pentru rețeaua neuronală și conversia înapoi la text atunci când este necesar. În cele din urmă, vă vom arăta cum să vă ocupați de trimiterea mai multor propoziții printr-un model în cadrul unui lot pregătit, apoi vom încheia totul cu o examinare mai atentă a funcției  `tokenizer()`.
-
-
-<Tip>
-⚠️  
-Pentru a beneficia de toate funcțiile disponibile cu Model Hub și 🤗 Transformers, vă recomandăm <a href="https://huggingface.co/join">să vă creați un cont</a>.
-
-</Tip>
\ No newline at end of file
diff --git a/chapters/ro/chapter2/2.mdx b/chapters/ro/chapter2/2.mdx
deleted file mode 100644
index b0f1c4855..000000000
--- a/chapters/ro/chapter2/2.mdx
+++ /dev/null
@@ -1,364 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# În spatele pipeline-ului[[în-spatele-pipeline-ului]]
-
-{#if fw === 'pt'}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section2_pt.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section2_pt.ipynb"},
-]} />
-
-{:else}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section2_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section2_tf.ipynb"},
-]} />
-
-{/if}
-
-<Tip>
- 
-Aceasta este prima secțiune în care conținutul este ușor diferit în funcție de utilizarea PyTorch sau TensorFlow. Schimbați comutatorul din partea de sus a titlului pentru a selecta platforma pe care o preferați!
-</Tip>
-
-{#if fw === 'pt'}
-<Youtube id="1pedAIvTWXk"/>
-{:else}
-<Youtube id="wVN12smEvqg"/>
-{/if}
-
-Să începem cu un exemplu complet, aruncând o privire la ceea ce s-a întâmplat în spate atunci când am executat următorul cod în [Capitolul 1](/curs/capitol1):
-
-
-```python
-from transformers import pipeline
-
-classifier = pipeline("sentiment-analysis")
-classifier(
-    [
-        "I've been waiting for a HuggingFace course my whole life.",
-        "I hate this so much!",
-    ]
-)
-```
-
-și am obținut:
-
-```python out
-[{'label': 'POSITIVE', 'score': 0.9598047137260437},
- {'label': 'NEGATIVE', 'score': 0.9994558095932007}]
-```
-
-După cum am văzut în [Capitolul 1](/course/chapter1), acest pipeline grupează trei etape: preprocesarea, trecerea intrărilor prin model și postprocesarea:
-
-<div class="flex justify-center">
-<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/full_nlp_pipeline.svg" alt="The full NLP pipeline: tokenization of text, conversion to IDs, and inference through the Transformer model and the model head."/>
-<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/full_nlp_pipeline-dark.svg" alt="The full NLP pipeline: tokenization of text, conversion to IDs, and inference through the Transformer model and the model head."/>
-</div>
-
-Să trecem rapid prin fiecare dintre acestea.
-
-## Preprocesarea cu un tokenizator[[preprocesarea-cu-un-tokenizerator]]
-
-La fel ca alte rețele neuronale, modelele Transformer nu pot procesa direct text brut, astfel încât primul pas al pipeline-ului nostru este de a converti intrările de text în numere pe care modelul le poate înțelege. Pentru a face acest lucru, folosim un *tokenizer*, care va fi responsabil pentru:
-
-- Împărțirea datelor de intrare în cuvinte, părți de cuvinte sau simboluri (cum ar fi punctuația) care se numesc *tokens*
-- Maparea fiecărui token într-un număr întreg
-- Adăugarea de intrări suplimentare care pot fi utile pentru model
-
-Toată această preprocesare trebuie efectuată exact în același mod ca atunci când modelul a fost preinstruit, așa că mai întâi trebuie să descărcăm aceste informații din [Model Hub] (https://huggingface.co/models). Pentru a face acest lucru, folosim clasa `AutoTokenizer` și metoda sa `from_pretrained()`. Folosind numele checkpoint-ului modelului nostru, aceasta va prelua automat datele asociate cu tokenizer-ul modelului și le va stoca în cache (astfel încât acestea să fie descărcate doar prima dată când executați codul de mai jos).
-
-Deoarece punctul de control implicit al pipeline-ului `sentiment-analysis` este `distilbert-base-uncased-finetuned-sst-2-english` (puteți vedea fișa modelului [aici](https://huggingface.co/distilbert-base-uncased-finetuned-sst-2-english)), executăm următoarele:
-
-```python
-from transformers import AutoTokenizer
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-```
-
-Odată ce avem tokenizatorul, putem să îi transmitem direct propozițiile noastre și vom primi înapoi un dicționar care este gata să fie introdus în modelul nostru! Singurul lucru rămas de făcut este să convertim lista de ID-uri de intrare în tensori.
-
-Puteți utiliza 🤗 Transformers fără a trebui să vă faceți griji cu privire la cadrul ML utilizat ca backend; ar putea fi PyTorch sau TensorFlow, sau Flax pentru unele modele. Cu toate acestea, modelele Transformer acceptă numai *tensori * ca intrare. Dacă este prima dată când auziți despre tensori, vă puteți gândi la ei ca la matrici NumPy. Un array NumPy poate fi un scalar (0D), un vector (1D), o matrice (2D) sau poate avea mai multe dimensiuni. Este de fapt un tensor; tensorii altor cadre ML se comportă similar și sunt de obicei la fel de simplu de instanțiat ca și array-urile NumPy.
-
-Pentru a specifica tipul de tensori pe care dorim să îi primim înapoi (PyTorch, TensorFlow sau NumPy simplu), folosim argumentul `return_tensors`:
-
-
-{#if fw === 'pt'}
-```python
-raw_inputs = [
-    "I've been waiting for a HuggingFace course my whole life.",
-    "I hate this so much!",
-]
-inputs = tokenizer(raw_inputs, padding=True, truncation=True, return_tensors="pt")
-print(inputs)
-```
-{:else}
-```python
-raw_inputs = [
-    "I've been waiting for a HuggingFace course my whole life.",
-    "I hate this so much!",
-]
-inputs = tokenizer(raw_inputs, padding=True, truncation=True, return_tensors="tf")
-print(inputs)
-```
-{/if}
-
- 
-Nu vă faceți încă griji cu privire la padding și trunchiere; le vom explica mai târziu. Principalele lucruri de reținut aici sunt că puteți trece o propoziție sau o listă de propoziții, precum și specificarea tipului de tensori pe care doriți să îi primiți înapoi (dacă nu este trecut niciun tip, veți primi o listă de liste ca rezultat)
-{#if fw === 'pt'}
-
-Iată cum arată rezultatele ca tensori PyTorch:
-
-```python out
-{
-    'input_ids': tensor([
-        [  101,  1045,  1005,  2310,  2042,  3403,  2005,  1037, 17662, 12172, 2607,  2026,  2878,  2166,  1012,   102],
-        [  101,  1045,  5223,  2023,  2061,  2172,   999,   102,     0,     0,     0,     0,     0,     0,     0,     0]
-    ]), 
-    'attention_mask': tensor([
-        [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
-        [1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0]
-    ])
-}
-```
-{:else}
-
-Iată cum arată rezultatele ca tensori TensorFlow:
-
-```python out
-{
-    'input_ids': <tf.Tensor: shape=(2, 16), dtype=int32, numpy=
-        array([
-            [  101,  1045,  1005,  2310,  2042,  3403,  2005,  1037, 17662, 12172,  2607,  2026,  2878,  2166,  1012,   102],
-            [  101,  1045,  5223,  2023,  2061,  2172,   999,   102,     0,     0,     0,     0,     0,     0,     0,     0]
-        ], dtype=int32)>, 
-    'attention_mask': <tf.Tensor: shape=(2, 16), dtype=int32, numpy=
-        array([
-            [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
-            [1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0]
-        ], dtype=int32)>
-}
-```
-{/if}
-
- 
-Rezultatul în sine este un dicționar care conține două chei, `input_ids` și `attention_mask`. `input_ids` conține două rânduri de numere întregi (unul pentru fiecare propoziție) care sunt identificatorii unici ai simbolurilor din fiecare propoziție. Vom explica ce este `attention_mask` mai târziu în acest capitol. 
-
-## Parcurgerea modelului[[parcurgerea-modelului]]
-
-{#if fw === 'pt'}
-Putem descărca modelul nostru preinstruit în același mod în care am făcut-o cu tokenizatorul nostru. 🤗 Transformers oferă o clasă `AutoModel` care are și o metodă `from_pretrained()`:
-
-```python
-from transformers import AutoModel
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-model = AutoModel.from_pretrained(checkpoint)
-```
-{:else}
- 
-Putem descărca modelul nostru preinstruit în același mod în care am făcut-o cu tokenizatorul nostru. 🤗 Transformers oferă o clasă `TFAutoModel` care are și o metodă `from_pretrained`:
-
-```python
-from transformers import TFAutoModel
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-model = TFAutoModel.from_pretrained(checkpoint)
-```
-{/if}
-
- 
-În acest fragment de cod, am descărcat același checkpoint pe care l-am folosit anterior în pipeline-ul nostru (de fapt, ar fi trebuit să fie deja în cache) și am instanțiat un model cu acesta.
-
-Această arhitectură conține doar modulul Transformer de bază: având în vedere anumite intrări, acesta produce ceea ce vom numi *stări ascunse*, cunoscute și ca *caracteristici*. Pentru fiecare intrare a modelului, vom extrage un vector înalt-dimensional care reprezintă **înțelegerea contextuală a intrării respective de către modelul Transformer**.
-
-Dacă acest lucru nu are sens, nu vă faceți griji. Vom explica totul mai târziu.
-
-Deși aceste stări ascunse pot fi utile pe cont propriu, ele sunt de obicei intrări pentru o altă parte a modelului, cunoscută sub numele de *head*. În [Capitolul 1](/curs/capitol1), diferitele sarcini ar fi putut fi efectuate cu aceeași arhitectură, dar fiecăreia dintre aceste sarcini îi va fi asociat un head diferit.
-
-### Un vector multidimensional?[[un-vector-multidimensional]]
-
- 
-Vectorul emis de modulul Transformator este de obicei de dimensiuni mari. Acesta are în general trei dimensiuni:
-
-- **Dimensiunea lotului**: Numărul de secvențe prelucrate simultan (2 în exemplul nostru).
-- **Lungimea secvenței**: Lungimea reprezentării numerice a secvenței (16 în exemplul nostru).
-- **Dimensiunea ascunsă**: Dimensiunea vectorială a fiecărei intrări a modelului.
-
-Se spune că este multidimensional din cauza ultimei valori. Dimensiunea ascunsă poate fi foarte mare (768 este comună pentru modelele mai mici, iar în modelele mai mari aceasta poate ajunge la 3072 sau mai mult).
-
-Putem vedea acest lucru dacă introducem în modelul nostru intrările pe care le-am preprocesat:
-
-{#if fw === 'pt'}
-```python
-outputs = model(**inputs)
-print(outputs.last_hidden_state.shape)
-```
-
-```python out
-torch.Size([2, 16, 768])
-```
-{:else}
-```py
-outputs = model(inputs)
-print(outputs.last_hidden_state.shape)
-```
-
-```python out
-(2, 16, 768)
-```
-{/if}
-
- 
-Rețineți că ieșirile modelelor 🤗 Transformers se comportă ca `namedtuple`s sau dicționare. Puteți accesa elementele prin atribute (așa cum am făcut noi) sau prin cheie (`outputs[„last_hidden_state”]`), sau chiar prin index dacă știți exact unde se află lucrul pe care îl căutați (`outputs[0]`).
-
-### Modele de head-uri: Înțelegerea numerelor[modele-de-head-uri-înțelegerea-numerelor]]
-
-Head-urile modelelor iau ca intrare vectorul multidimensional al stărilor ascunse și le proiectează pe o altă dimensiune. Acestea sunt de obicei compuse din unul sau câteva straturi liniare:
-
-<div class="flex justify-center">
-<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/transformer_and_head.svg" alt="A Transformer network alongside its head."/>
-<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/transformer_and_head-dark.svg" alt="A Transformer network alongside its head."/>
-</div>
-
- 
-Rezultatul modelului Transformer este trimis direct la head-ul modelului pentru a fi prelucrat.
-
-În această diagramă, modelul este reprezentat de stratul său de încorporare și de straturile următoare. Stratul de încorporare convertește fiecare ID de intrare din intrarea tokenizată într-un vector care reprezintă tokenul asociat. Straturile ulterioare manipulează acești vectori folosind mecanismul de atenție pentru a produce reprezentarea finală a propozițiilor.
-
-Există multe arhitecturi diferite disponibile în 🤗 Transformers, fiecare fiind concepută în jurul abordării unei sarcini specifice. Iată o listă neexhaustivă:
-
-- `*Model` (extragerea stărilor ascunse)
-- `*ForCausalLM`
-- `*ForMaskedLM`
-- `*ForMultipleChoice`
-- `*ForQuestionAnswering`
-- `*ForSequenceClassification`
-- `*ForTokenClassification`
-- și altele 🤗
-
-{#if fw === 'pt'}
- Pentru exemplul nostru, vom avea nevoie de un model cu un head de clasificare a secvențelor (pentru a putea clasifica propozițiile ca fiind pozitive sau negative). Așadar, nu vom utiliza clasa `AutoModel`, ci `AutoModelForSequenceClassification`:
-
-```python
-from transformers import AutoModelForSequenceClassification
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
-outputs = model(**inputs)
-```
-{:else}
- Pentru exemplul nostru, vom avea nevoie de un model cu un head de clasificare a secvențelor (pentru a putea clasifica propozițiile ca fiind pozitive sau negative). Așadar, nu vom utiliza clasa `TFAutoModel`, ci `TFAutoModelForSequenceClassification`:
-
-```python
-from transformers import TFAutoModelForSequenceClassification
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint)
-outputs = model(inputs)
-```
-{/if}
- 
-Acum, dacă ne uităm la forma ieșirilor noastre, dimensiunea va fi mult mai mică: head-ul modelului ia ca intrare vectorii multidimensionali pe care i-am văzut înainte și scoate vectori care conțin două valori (una pentru fiecare etichetă):
-
-```python
-print(outputs.logits.shape)
-```
-
-{#if fw === 'pt'}
-```python out
-torch.Size([2, 2])
-```
-{:else}
-```python out
-(2, 2)
-```
-{/if}
-
- 
-Deoarece avem doar două propoziții și două etichete, rezultatul pe care îl obținem din modelul nostru este de forma 2 x 2.
-
-## Postprocesarea rezultatului[[postprocesarea-rezultatului]]
-
-Valorile pe care le obținem ca rezultat al modelului nostru nu au neapărat sens în sine. Să aruncăm o privire:
-
-```python
-print(outputs.logits)
-```
-
-{#if fw === 'pt'}
-```python out
-tensor([[-1.5607,  1.6123],
-        [ 4.1692, -3.3464]], grad_fn=<AddmmBackward>)
-```
-{:else}
-```python out
-<tf.Tensor: shape=(2, 2), dtype=float32, numpy=
-    array([[-1.5606991,  1.6122842],
-           [ 4.169231 , -3.3464472]], dtype=float32)>
-```
-{/if}
-
-Modelul nostru a prezis `[-1.5607, 1.6123]` pentru prima propoziție și `[ 4.1692, -3.3464]` pentru cea de-a doua. Acestea nu sunt probabilități, ci *logits*, scorurile brute, nenormalizate, emise de ultimul strat al modelului. Pentru a fi convertite în probabilități, acestea trebuie să treacă printr-un strat [SoftMax](https://en.wikipedia.org/wiki/Softmax_function) (toate modelele 🤗 Transformers produc logits, deoarece funcția de pierdere pentru formare va fuziona în general ultima funcție de activare, cum ar fi SoftMax, cu funcția de pierdere reală, cum ar fi entropia încrucișată):
-
-{#if fw === 'pt'}
-```py
-import torch
-
-predictions = torch.nn.functional.softmax(outputs.logits, dim=-1)
-print(predictions)
-```
-{:else}
-```py
-import tensorflow as tf
-
-predictions = tf.math.softmax(outputs.logits, axis=-1)
-print(predictions)
-```
-{/if}
-
-{#if fw === 'pt'}
-```python out
-tensor([[4.0195e-02, 9.5980e-01],
-        [9.9946e-01, 5.4418e-04]], grad_fn=<SoftmaxBackward>)
-```
-{:else}
-```python out
-tf.Tensor(
-[[4.01951671e-02 9.59804833e-01]
- [9.9945587e-01 5.4418424e-04]], shape=(2, 2), dtype=float32)
-```
-{/if}
-
- 
-Acum putem vedea că modelul a prezis `[0.0402, 0.9598]` pentru prima propoziție și `[0.9995, 0.0005]` pentru cea de-a doua. Acestea sunt scoruri de probabilitate care pot fi recunoscute.
-
-Pentru a obține etichetele corespunzătoare fiecărei poziții, putem inspecta atributul `id2label` din configurația modelului (mai multe despre acest lucru în secțiunea următoare):
-
-```python
-model.config.id2label
-```
-
-```python out
-{0: 'NEGATIVE', 1: 'POSITIVE'}
-```
-Acum putem concluziona că modelul a prezis următoarele:
- 
-- Prima propoziție: NEGATIV: 0,0402, POZITIV: 0,9598
-- A doua propoziție: NEGATIVĂ: 0,9995, POZITIVĂ: 0,0005
-
-Am reprodus cu succes cele trei etape ale pipeline-ului: preprocesarea cu tokenizere, trecerea intrărilor prin model și postprocesarea! Acum haideți să analizăm în profunzime fiecare dintre aceste etape.
-
-<Tip>
-
-✏️  
-** Încercați!** Alegeți două (sau mai multe) texte proprii și treceți-le prin conducta `sentiment-analysis`. Apoi repetați pașii pe care i-ați văzut aici și verificați dacă obțineți aceleași rezultate!
-
-</Tip>
diff --git a/chapters/ro/chapter2/3.mdx b/chapters/ro/chapter2/3.mdx
deleted file mode 100644
index e0f0758df..000000000
--- a/chapters/ro/chapter2/3.mdx
+++ /dev/null
@@ -1,235 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Modele[[modele]]
-
-{#if fw === 'pt'}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section3_pt.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section3_pt.ipynb"},
-]} />
-
-{:else}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section3_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section3_tf.ipynb"},
-]} />
-
-{/if}
-
-{#if fw === 'pt'}
-<Youtube id="AhChOFRegn4"/>
-{:else}
-<Youtube id="d3JVgghSOew"/>
-{/if}
-
-{#if fw === 'pt'}
- 
-În această secțiune vom analiza mai detaliat crearea și utilizarea unui model. Vom folosi clasa `AutoModel`, care este utilă atunci când doriți să instanțiați orice model dintr-un checkpoint.
-
-Clasa `AutoModel` și toate celelalte clase înrudite sunt, de fapt, simple wrappere ale gamei largi de modele disponibile în bibliotecă. Este un wrapper inteligent, deoarece poate ghici automat arhitectura modelului corespunzător pentru checkpoint-ul dumneavoastră și apoi instanțiază un model cu această arhitectură.
-
-{:else}
- 
-În această secțiune vom analiza mai detaliat crearea și utilizarea unui model. Vom utiliza clasa `TFAutoModel`, care este utilă atunci când doriți să instanțați un model dintr-un checkpoint.
-
-Clasa `TFAutoModel` și toate clasele înrudite cu aceasta sunt de fapt simple wrappere ale gamei largi de modele disponibile în bibliotecă. Este un wrapper inteligent, deoarece poate ghici automat arhitectura modelului corespunzător pentru checkpoint-ul dumneavoastră și apoi instanțiază un model cu această arhitectură.
-
-{/if}
-
-Cu toate acestea, dacă știți ce tip de model doriți să utilizați, puteți folosi direct clasa care definește arhitectura acestuia. Să aruncăm o privire la modul în care funcționează acest lucru cu un model BERT.
-
-## Crearea unui Transformer[[crearea-unui-transformer]]
-
-Primul lucru pe care va trebui să îl facem pentru a inițializa un model BERT este să încărcăm un obiect de configurare:
-
-{#if fw === 'pt'}
-```py
-from transformers import BertConfig, BertModel
-
-# Construirea configurației
-config = BertConfig()
-
-# Construirea modelului pornind de la configurație
-model = BertModel(config)
-```
-{:else}
-```py
-from transformers import BertConfig, TFBertModel
-
-# Construirea configurației
-config = BertConfig()
-
-#  Construirea modelului pornind de la configurație
-model = TFBertModel(config)
-```
-{/if}
-
-Configurația conține multe atribute care sunt utilizate pentru a construi modelul:
-
-```py
-print(config)
-```
-
-```python out
-BertConfig {
-  [...]
-  "hidden_size": 768,
-  "intermediate_size": 3072,
-  "max_position_embeddings": 512,
-  "num_attention_heads": 12,
-  "num_hidden_layers": 12,
-  [...]
-}
-```
-
-Deși nu ați văzut încă ce fac toate aceste atribute, ar trebui să recunoașteți unele dintre ele: atributul `hidden_size` definește dimensiunea vectorului `hidden_states`, iar `num_hidden_layers` definește numărul de straturi pe care le are modelul Transformer.
-
-### Diferite metode de încărcare[[diferite-metode-de-încărcare]]
-
-Crearea unui model din configurația implicită îl inițializează cu valori aleatorii:
-
-
-{#if fw === 'pt'}
-```py
-from transformers import BertConfig, BertModel
-
-config = BertConfig()
-model = BertModel(config)
-
-# Modelul este inițializat aleatoriu!
-```
-{:else}
-```py
-from transformers import BertConfig, TFBertModel
-
-config = BertConfig()
-model = TFBertModel(config)
-
-# Modelul este inițializat aleatoriu!
-```
-{/if}
-
-Modelul poate fi utilizat în această stare, dar va produce rezultate neclare; mai întâi trebuie să fie antrenat. Am putea antrena modelul de la zero pentru sarcina în cauză, dar, după cum ați văzut în [Capitolul 1](/course/chapter1), acest lucru ar necesita mult timp și o mulțime de date și ar avea un impact semnificativ asupra mediului. Pentru a evita efortul inutil, este esențial să puteți partaja și reutiliza modelele care au fost deja formate.
-
-Încărcarea unui model Transformer care este deja instruit este simplă - putem face acest lucru utilizând metoda `from_pr
-
-{#if fw === 'pt'}
-```py
-from transformers import BertModel
-
-model = BertModel.from_pretrained("bert-base-cased")
-```
-
-După cum ați văzut mai devreme, am putea înlocui `BertModel` cu clasa `AutoModel` echivalentă. Vom face acest lucru în continuare, deoarece acest lucru produce un cod compatibil cu checkpoint-urile; dacă codul dumneavoastră funcționează pentru un checkpoint, ar trebui să funcționeze fără probleme pentru altul. Acest lucru este valabil chiar dacă arhitectura este diferită, atât timp cât checkpoint-ul a fost instruit pentru o sarcină similară (de exemplu, o sarcină de analiză a sentimentelor).
-
-{:else}
-```py
-from transformers import TFBertModel
-
-model = TFBertModel.from_pretrained("bert-base-cased")
-```
-
-După cum ați văzut mai devreme, am putea înlocui `BertModel` cu clasa `AutoModel` echivalentă. Vom face acest lucru în continuare, deoarece acest lucru produce un cod compatibil cu checkpoint-urile; dacă codul dumneavoastră funcționează pentru un checkpoint, ar trebui să funcționeze fără probleme pentru altul. Acest lucru este valabil chiar dacă arhitectura este diferită, atât timp cât checkpoint-ul a fost instruit pentru o sarcină similară (de exemplu, o sarcină de analiză a sentimentelor).
-
-{/if}
-
-În exemplul de cod de mai sus nu am utilizat `BertConfig` și, în loc de acesta, am încărcat un model preinstruit prin intermediul identificatorului `bert-base-cased`. Acesta este un checkpoint al modelului care a fost antrenat chiar de autorii BERT; puteți găsi mai multe detalii despre acesta în [model card](https://huggingface.co/bert-base-cased).
-
-Acest model este acum inițializat cu toate weight-urile din checkpoint. Acesta poate fi utilizat direct pentru inferență pe sarcinile pe care a fost antrenat și poate fi, de asemenea, ajustat pe o sarcină nouă. Prin antrenarea cu weight-uri instruite în prealabil, putem obține rapid rezultate bune.
-
-Greutățile au fost descărcate și stocate în cache (astfel încât apelurile viitoare la metoda `from_pretrained()` nu le vor descărca din nou) în folderul cache, care are ca valoare implicită *~/.cache/huggingface/transformers*. Puteți personaliza folderul cache prin setarea variabilei de mediu `HF_HOME`.
-
-Identificatorul utilizat pentru încărcarea modelului poate fi identificatorul oricărui model de pe Model Hub, atâta timp cât acesta este compatibil cu arhitectura OARET. Lista completă a  checkpoint-urilor OARET disponibile poate fi găsită [aici](https://huggingface.co/models?filter=bert).
-
-
-### Metode de păstrare[[metode-de-păstrare]]
-
-Salvarea unui model este la fel de ușoară ca încărcarea unuia - folosim metoda `save_pretrained()`, care este analogă metodei `from_pretrained()`:
-
-```py
-model.save_pretrained("directory_on_my_computer")
-```
-
-Se salvează două fișiere pe disc:
-
-{#if fw === 'pt'}
-```
-ls directory_on_my_computer
-
-config.json pytorch_model.bin
-```
-{:else}
-```
-ls directory_on_my_computer
-
-config.json tf_model.h5
-```
-{/if}
-
-Dacă aruncați o privire la fișierul *config.json*, veți recunoaște atributele necesare pentru construirea arhitecturii modelului. Acest fișier conține, de asemenea, unele metadate, cum ar fi locul de origine al checkpoint-ului și ce versiune 🤗 Transformers ați folosit când ați salvat ultima dată checkpoint-ul.
-
-{#if fw === 'pt'}
- 
-Fișierul *pytorch_model.bin* este cunoscut sub numele de *state dictionary*; acesta conține toate weight-urile modelului dumneavoastră. Cele două fișiere merg mână în mână; configurația este necesară pentru a cunoaște arhitectura modelului, în timp ce weight-urile modelului sunt parametrii modelului.
-
-{:else}
- 
-Fișierul *tf_model.h5* este cunoscut sub numele de *state dictionary*; acesta conține toate weight-urile modelului dumneavoastră. Cele două fișiere merg mână în mână; configurația este necesară pentru a cunoaște arhitectura modelului, în timp ce weight-urile modelului sunt parametrii modelului.
-
-{/if}
-
-## Utilizarea unui model Transformer pentru inferență[[utilizarea-unui-model-transformer-pentru-inferență]]
-
-
-Acum că știți cum să încărcați și să salvați un model, să încercăm să îl folosim pentru a face câteva predicții. Modelele Transformer pot procesa doar numere - numere pe care le generează tokenizatorul. Dar înainte de a discuta despre tokenizeri, să explorăm ce intrări acceptă modelul.
-
-Tokenizerii se pot ocupa de transformarea intrărilor în tensori ai framework-ului corespunzător, dar pentru a vă ajuta să înțelegeți ce se întâmplă, vom arunca o privire rapidă la ceea ce trebuie făcut înainte de trimiterea intrărilor către model.
-
-Să spunem că avem câteva secvențe:
-
-```py
-sequences = ["Hello!", "Cool.", "Nice!"]
-```
-
-Tokenizatorul le convertește în indici de vocabular care sunt denumiți în mod obișnuit *input IDs*. Fiecare secvență este acum o listă de numere! Rezultatul este:
-
-```py no-format
-encoded_sequences = [
-    [101, 7592, 999, 102],
-    [101, 4658, 1012, 102],
-    [101, 3835, 999, 102],
-]
-```
-
-Aceasta este o listă de secvențe codificate: o listă de liste. Tensorii acceptă numai forme dreptunghiulare (gândiți-vă la matrici). Această " listă " are deja o formă dreptunghiulară, astfel încât convertirea sa într-un tensor este ușoară:
-
-{#if fw === 'pt'}
-```py
-import torch
-
-model_inputs = torch.tensor(encoded_sequences)
-```
-{:else}
-```py
-import tensorflow as tf
-
-model_inputs = tf.constant(encoded_sequences)
-```
-{/if}
-
-### Utilizarea tensorilor ca intrări în model[[utilizarea-tensorilor-ca-intrări-în-to-model]]
-
-Utilizarea tensorilor cu ajutorul modelului este extrem de simplă - trebuie doar să apelăm modelul cu intrările:
-
-```py
-output = model(model_inputs)
-```
-
-Deși modelul acceptă o mulțime de argumente diferite, doar ID-urile de intrare sunt necesare. Vom explica mai târziu ce fac celelalte argumente și când sunt necesare, 
-dar mai întâi trebuie să aruncăm o privire mai atentă la tokenizerii care construiesc intrările pe care un model Transformer le poate înțelege.
\ No newline at end of file
diff --git a/chapters/ro/chapter2/4.mdx b/chapters/ro/chapter2/4.mdx
deleted file mode 100644
index c38234e14..000000000
--- a/chapters/ro/chapter2/4.mdx
+++ /dev/null
@@ -1,246 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Tokenizere[[tokenizere]]
-
-{#if fw === 'pt'}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section4_pt.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section4_pt.ipynb"},
-]} />
-
-{:else}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section4_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section4_tf.ipynb"},
-]} />
-
-{/if}
-
-<Youtube id="VFp38yj8h3A"/>
-
-
-Tokenizoarele sunt una dintre componentele de bază ale pipeline-ului NLP. Acestea au un singur scop: să transforme textul în date care pot fi prelucrate de model. Modelele pot procesa doar numere, astfel încât tokenizerii trebuie să convertească intrările noastre de text în date numerice. În această secțiune, vom explora exact ce se întâmplă în pipeline-ul de tokenizare. 
-
-În sarcinile NLP, datele care sunt în general prelucrate sunt text brut. Iată un exemplu de astfel de text:
-
-```
-Jim Henson was a puppeteer
-
-```
-
-Cu toate acestea, modelele pot procesa doar numere, deci trebuie să găsim o modalitate de a converti textul brut în numere. Asta fac tokenizerii și există o mulțime de modalități de a face acest lucru. Scopul este de a găsi cea mai relevantă reprezentare - adică cea care are cel mai mare sens pentru model - și, dacă este posibil, cea mai mică reprezentare.
-
-Să aruncăm o privire la câteva exemple de algoritmi de tokenizare și să încercăm să răspundem la unele dintre întrebările pe care le puteți avea despre tokenizare.
-
-
-
-## Word-based[[word-based]]
-
-<Youtube id="nhJxYji1aho"/>
-
- 
-Primul tip de tokenizator care îmi vine în minte este _word-based_. În general, este foarte ușor de configurat și de utilizat, cu doar câteva reguli, și adesea produce rezultate satisfăcătoare. De exemplu, în imaginea de mai jos, obiectivul este de a împărți textul brut în cuvinte și de a găsi o reprezentare numerică pentru fiecare dintre ele:
-
-<div class="flex justify-center">
-  <img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/word_based_tokenization.svg" alt="An example of word-based tokenization."/>
-  <img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/word_based_tokenization-dark.svg" alt="An example of word-based tokenization."/>
-</div>
-
- 
-Există diferite moduri de a împărți textul. De exemplu, am putea folosi spațiu pentru a tokeniza textul în cuvinte prin aplicarea funcției `split()` din Python:
-
- 
-```py
-tokenized_text = "Jim Henson was a puppeteer".split()
-print(tokenized_text)
-```
-
-```python out
-['Jim', 'Henson', 'was', 'a', 'puppeteer']
-```
-
-Există, de asemenea, variații ale tokenizerelor de cuvinte care au reguli suplimentare pentru punctuație. Cu acest tip de tokenizator, putem ajunge la „vocabulare” destul de mari, unde un vocabular este definit de numărul total de token-uri independente pe care le avem în corpus.
-
-Fiecărui cuvânt i se atribuie un ID, începând de la 0 și mergând până la dimensiunea vocabularului. Modelul utilizează aceste ID-uri pentru a identifica fiecare cuvânt.
-
-Dacă dorim să acoperim complet o limbă cu un tokenizer bazat pe cuvinte, va trebui să avem un identificator pentru fiecare cuvânt din limbă, ceea ce va genera o cantitate uriașă de token-uri. De exemplu, există peste 500 000 de cuvinte în limba engleză, astfel încât, pentru a construi o hartă de la fiecare cuvânt la un ID de intrare, ar trebui să ținem evidența unui număr atât de mare de ID-uri. În plus, cuvinte precum „dog” sunt reprezentate diferit de cuvinte precum „dogs”, iar modelul nu va avea inițial nicio modalitate de a ști că „dog” și „dogs” sunt similare: va identifica cele două cuvinte ca neavând legătură. Același lucru este valabil și pentru alte cuvinte similare, precum „run” și „running”, pe care modelul nu le va vedea inițial ca fiind similare.
-
-În cele din urmă, avem nevoie de un token personalizat pentru a reprezenta cuvintele care nu se află în vocabularul nostru. Acesta este cunoscut sub numele de token "necunoscut", adesea reprezentat ca "[UNK]" sau "&lt;unk&gt;". În general, este un indiciu rău dacă vedeți că tokenizatorul produce o mulțime de astfel de token-uri, deoarece nu a fost capabil să recupereze reprezentarea sensibilă a unui cuvânt și veți pierde informații pe parcurs. Scopul elaborării vocabularului este de a face în așa fel încât tokenizatorul să tokenizeze cât mai puține cuvinte posibil în tokenul necunoscut.
-
-O modalitate de a reduce numărul de token-uri necunoscute este de a merge un nivel mai adânc, folosind un tokenizer _character-based_.
-
-## Character-based[[character-based]]
-
-<Youtube id="ssLq_EK2jLE"/>
-
-
-Tokenizerele character-based împart textul în caractere, și nu în cuvinte. Acest lucru are două beneficii principale:
-
-- Dimensiunea vocabularului este mult mai mică.
-- Există mult mai puține token-uri în afara vocabularului (necunoscute), deoarece fiecare cuvânt poate fi construit din caractere.
-
-Dar și aici apar unele probleme legate de spații și punctuație:
-
-
-<div class="flex justify-center">
-  <img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/character_based_tokenization.svg" alt="An example of character-based tokenization."/>
-  <img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/character_based_tokenization-dark.svg" alt="An example of character-based tokenization."/>
-</div>
-
- 
-Nici această abordare nu este perfectă. Deoarece reprezentarea se bazează acum pe caractere și nu pe cuvinte, s-ar putea spune că, din punct de vedere intuitiv, este mai puțin relevantă: fiecare caracter nu înseamnă mult în sine, în timp ce în cazul cuvintelor situația este diferită. Totuși, acest lucru variază din nou în funcție de limbă; în chineză, de exemplu, fiecare caracter conține mai multe informații decât un caracter într-o limbă latină.
-
-Un alt lucru care trebuie luat în considerare este faptul că ne vom trezi cu o cantitate foarte mare de token-uri care vor fi prelucrate de modelul nostru: în timp ce un cuvânt ar fi un singur token cu un tokenizator bazat pe cuvinte, acesta se poate transforma cu ușurință în 10 sau mai multe token-uri atunci când este convertit în caractere.
-
-Pentru a obține ce este mai bun din ambele lumi, putem utiliza o a treia tehnică care combină cele două abordări: *subword tokenization*.
-
-## Subword tokenization[[subword-tokenization]]
-
-<Youtube id="zHvTiHr506c"/>
-
-Algoritmii "Subword Tokenization " se bazează pe principiul conform căruia cuvintele utilizate frecvent nu ar trebui să fie împărțite în cuvinte secundare mai mici, dar cuvintele rare ar trebui să fie descompuse în cuvinte secundare semnificative.
-
-De exemplu, " annoyingly " ar putea fi considerat un cuvânt rar și ar putea fi descompus în " annoying " și " ly ". Este probabil ca ambele să apară mai frecvent ca subcuvinte de sine stătătoare, în timp ce, în același timp, sensul cuvântului " annoyingly " este păstrat de sensul compus al cuvintelor " annoying " și " ly ".
-
-Iată un exemplu care arată modul în care un algoritm de subword tokenization ar tokeniza secvența "Let's do tokenization!":
-
-<div class="flex justify-center">
-  <img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/bpe_subword.svg" alt="A subword tokenization algorithm."/>
-  <img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/bpe_subword-dark.svg" alt="A subword tokenization algorithm."/>
-</div>
-
-Aceste părți de cuvinte oferă în cele din urmă o mulțime de semnificații semantice: în exemplul de mai sus, "tokenization" a fost împărțit în "token" și "ization", două cuvinte care au o semnificație semantică, fiind în același timp eficiente din punct de vedere al spațiului (sunt necesare doar două cuvinte pentru a reprezenta un cuvânt lung). Acest lucru ne permite să avem o acoperire relativ bună cu vocabulare de dimensiuni mici și aproape fără token-uri necunoscute.
-
-Această abordare este utilă în special în limbile aglutinative, cum ar fi turca, în care se pot forma cuvinte complexe (aproape) arbitrar de lungi prin combinarea părților de cuvinte.
-
-### Și nu numai![[și-nu-numai]]
-
-Nu este surprinzător faptul că există mult mai multe tehnici. Iată câteva:
-
-- BPE la nivel de byte, utilizată în GPT-2
-- WordPiece, utilizată în BERT
-- SentencePiece sau Unigram, utilizate în mai multe modele multilingve
-
-Acum ar trebui să cunoașteți destul de bine cum funcționează tokenizerele pentru a începe să utilizați API-
-
-## Încărcarea și salvarea[[încărcarea-și-salvarea]]
-
-Încărcarea și salvarea tokenizerelor este la fel de simplă ca în cazul modelelor. De fapt, se bazează pe aceleași două metode: `from_pretrained()` și `save_pretrained()`. Aceste metode vor încărca sau salva algoritmul utilizat de tokenizator (un pic ca *arhitectura* modelului), precum și vocabularul său (un pic ca *weight-urile* modelului).
-
-Încărcarea tokenizatorului BERT antrenat cu același punct de control ca BERT se face în același mod ca și încărcarea modelului, cu excepția faptului că folosim clasa `BertTokenizer`:
-
-```py
-from transformers import BertTokenizer
-
-tokenizer = BertTokenizer.from_pretrained("bert-base-cased")
-```
-
-{#if fw === 'pt'}
-Similar cu `AutoModel`, clasa `AutoTokenizer` va prelua clasa tokenizer corespunzătoare din bibliotecă pe baza numelui checkpoint-ului și poate fi utilizată direct cu orice checkpoint:
-
-{:else}
-Similar cu `TFAutoModel`, clasa `AutoTokenizer` va prelua clasa tokenizer corespunzătoare din bibliotecă pe baza numelui checkpoint-ului și poate fi utilizată direct cu orice checkpoint:
-
-{/if}
-
-```py
-from transformers import AutoTokenizer
-
-tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
-```
-
-Acum putem utiliza tokenizatorul așa cum am arătat în secțiunea anterioară:
-
-```python
-tokenizer("Using a Transformer network is simple")
-```
-
-```python out
-{'input_ids': [101, 7993, 170, 11303, 1200, 2443, 1110, 3014, 102],
- 'token_type_ids': [0, 0, 0, 0, 0, 0, 0, 0, 0],
- 'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1, 1]}
-```
-
-Salvarea unui tokenizer este identică cu salvarea unui model:
-
-```py
-tokenizer.save_pretrained("directory_on_my_computer")
-```
-
-Vom vorbi mai mult despre `token_type_ids` în [Capitolul 3](/course/chapter3) și vom explica cheia `attention_mask` puțin mai târziu. Mai întâi, să vedem cum sunt generate `input_ids`. Pentru a face acest lucru, va trebui să ne uităm la metodele intermediare ale tokenizatorului.
-
-## Codificarea[[codificarea]]
-
-<Youtube id="Yffk5aydLzg"/>
-
-Al doilea pas este să convertim aceste token-uri în numere, astfel încât să putem construi un tensor din ele și să le introducem în model. Pentru a face acest lucru, tokenizatorul are un *vocabular*, care este partea pe care o descărcăm atunci când îl instanțiem cu metoda `from_pretrained()`. Din nou, trebuie să folosim același vocabular utilizat atunci când modelul a fost preinstruit.
-
-Pentru a înțelege mai bine cele două etape, le vom explora separat. Rețineți că vom utiliza unele metode care efectuează părți ale pipeline-ului de tokenizare separat pentru a vă arăta rezultatele intermediare ale acestor etape, dar, în practică, ar trebui să apelați tokenizatorul direct pe intrările dvs. (așa cum se arată în secțiunea 2).
-
-### Tokenizarea[[tokenizarea]]
-
-Procesul de tokenizare este realizat prin metoda `tokenize()`:
-
-```py
-from transformers import AutoTokenizer
-
-tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
-
-sequence = "Using a Transformer network is simple"
-tokens = tokenizer.tokenize(sequence)
-
-print(tokens)
-```
-
-Rezultatul acestei metode este o listă de șiruri de caractere, sau token-uri:
-
-```python out
-['Using', 'a', 'transform', '##er', 'network', 'is', 'simple']
-```
-
-Acest tokenizator este un tokenizator de părți de cuvinte: împarte cuvintele până când obține token-uri care pot fi reprezentate de vocabularul său. Acesta este cazul aici cu `transformer`, care este împărțit în două token-uri: `transform` și `##er`
-
-### De la token-uri la ID-uri de intrare[[de-la-token-uri-la-id-uri-de-intrare]]
-
-Conversia în ID-uri de intrare este gestionată de metoda de tokenizare `convert_tokens_to_ids()`:
-
-```py
-ids = tokenizer.convert_tokens_to_ids(tokens)
-
-print(ids)
-```
-
-```python out
-[7993, 170, 11303, 1200, 2443, 1110, 3014]
-```
-
-Aceste rezultate, odată convertite în tensorul framework-ului corespunzător, pot fi apoi utilizate ca intrări într-un model, așa cum am văzut mai devreme în acest capitol.
-
-<Tip>
-
-✏️ ** Încercați!** Replicați ultimii doi pași (tokenizarea și conversia în ID-uri de intrare) pe propozițiile de intrare pe care le-am folosit în secțiunea 2 ("I've been waiting for a HuggingFace course my whole life." și "I hate this so much!"). Verificați dacă obțineți aceleași ID-uri de intrare pe care le-am obținut mai devreme! 
-
-</Tip>
-
-## Decodificare[[decodificare]]
-
-*Decodificarea* este inversă: din indicii vocabularului, dorim să obținem un șir de caractere. Acest lucru poate fi realizat cu metoda `decode()` după cum urmează:
-
-```py
-decoded_string = tokenizer.decode([7993, 170, 11303, 1200, 2443, 1110, 3014])
-print(decoded_string)
-```
-
-```python out
-'Using a Transformer network is simple'
-```
-
-Rețineți că metoda `decode` nu numai că convertește indicii înapoi în token-uri, dar și grupează token-urile care fac parte din aceleași cuvinte pentru a produce o propoziție inteligibilă. Acest comportament va fi extrem de util atunci când vom utiliza modele care prezic text nou (fie text generat de un prompt, fie pentru probleme sequence-to-sequence, precum traducerea sau rezumarea).
-
-Până acum ar trebui să înțelegeți operațiunile atomice pe care le poate gestiona un tokenizator: tokenizarea, conversia în ID-uri și conversia ID-urilor înapoi într-un șir. Cu toate acestea, am atins doar vârful icebergului. În secțiunea următoare, vom aborda limitele metodei noastre și vom vedea cum să le depășim.
diff --git a/chapters/ro/chapter2/5.mdx b/chapters/ro/chapter2/5.mdx
deleted file mode 100644
index 1d71f6188..000000000
--- a/chapters/ro/chapter2/5.mdx
+++ /dev/null
@@ -1,338 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Gestionarea secvențelor multiple[[gestionarea-secvențelor-multiple]]
-
-{#if fw === 'pt'}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section5_pt.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section5_pt.ipynb"},
-]} />
-
-{:else}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section5_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section5_tf.ipynb"},
-]} />
-
-{/if}
-
-{#if fw === 'pt'}
-<Youtube id="M6adb1j2jPI"/>
-{:else}
-<Youtube id="ROxrFOEbsQE"/>
-{/if}
-
-În secțiunea anterioară, am explorat cel mai simplu caz de utilizare: realizarea de inferențe pe o singură secvență de lungime mică. Cu toate acestea, apar deja unele întrebări:
-
-- Cum gestionăm secvențe multiple?
-- Cum gestionăm secvențe multiple *de lungimi diferite*?
-- Indicii vocabularului sunt singurele intrări care permit unui model să funcționeze bine?
-- Există o secvență prea lungă?
-
-Să vedem ce tipuri de probleme prezintă aceste întrebări și cum le putem rezolva folosind API-ul 🤗 Transformers.
-
-
-## Modelele așteaptă un lot de intrări[[modelele-așteaptă-un-lot-de-intrări]]
-
-În exercițiul anterior ați văzut cum secvențele sunt transformate în liste de numere. Să convertim această listă de numere într-un tensor și să o transmitem modelului:
-
-{#if fw === 'pt'}
-```py
-import torch
-from transformers import AutoTokenizer, AutoModelForSequenceClassification
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
-
-sequence = "I've been waiting for a HuggingFace course my whole life."
-
-tokens = tokenizer.tokenize(sequence)
-ids = tokenizer.convert_tokens_to_ids(tokens)
-input_ids = torch.tensor(ids)
-# Această linie va eșua.
-model(input_ids)
-```
-
-```python out
-IndexError: Dimension out of range (expected to be in range of [-1, 0], but got 1)
-```
-{:else}
-```py
-import tensorflow as tf
-from transformers import AutoTokenizer, TFAutoModelForSequenceClassification
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint)
-
-sequence = "I've been waiting for a HuggingFace course my whole life."
-
-tokens = tokenizer.tokenize(sequence)
-ids = tokenizer.convert_tokens_to_ids(tokens)
-input_ids = tf.constant(ids)
-# This line will fail.
-model(input_ids)
-```
-
-```py out
-InvalidArgumentError: Input to reshape is a tensor with 14 values, but the requested shape has 196 [Op:Reshape]
-```
-{/if}
-
-Oh, nu! De ce a eșuat? Am urmat pașii din pipeline-ul din secțiunea 2.
-
-Problema este că am trimis o singură secvență către model, în timp ce modelele 🤗 Transformers așteaptă în mod implicit mai multe propoziții. Aici am încercat să facem tot ce a făcut tokenizatorul în fundal atunci când l-am aplicat unei `secvențe`. Dar, dacă vă uitați cu atenție, veți vedea că tokenizatorul nu a convertit doar lista de ID-uri de intrare într-un tensor, ci a adăugat și o dimensiune peste aceasta:
-
-{#if fw === 'pt'}
-```py
-tokenized_inputs = tokenizer(sequence, return_tensors="pt")
-print(tokenized_inputs["input_ids"])
-```
-
-```python out
-tensor([[  101,  1045,  1005,  2310,  2042,  3403,  2005,  1037, 17662, 12172,
-          2607,  2026,  2878,  2166,  1012,   102]])
-```
-{:else}
-```py
-tokenized_inputs = tokenizer(sequence, return_tensors="tf")
-print(tokenized_inputs["input_ids"])
-```
-
-```py out
-<tf.Tensor: shape=(1, 16), dtype=int32, numpy=
-array([[  101,  1045,  1005,  2310,  2042,  3403,  2005,  1037, 17662,
-        12172,  2607,  2026,  2878,  2166,  1012,   102]], dtype=int32)>
-```
-{/if}
-
-Să încercăm din nou și să adăugăm o nouă dimensiune:
-
-{#if fw === 'pt'}
-```py
-import torch
-from transformers import AutoTokenizer, AutoModelForSequenceClassification
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
-
-sequence = "I've been waiting for a HuggingFace course my whole life."
-
-tokens = tokenizer.tokenize(sequence)
-ids = tokenizer.convert_tokens_to_ids(tokens)
-
-input_ids = torch.tensor([ids])
-print("Input IDs:", input_ids)
-
-output = model(input_ids)
-print("Logits:", output.logits)
-```
-{:else}
-```py
-import tensorflow as tf
-from transformers import AutoTokenizer, TFAutoModelForSequenceClassification
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint)
-
-sequence = "I've been waiting for a HuggingFace course my whole life."
-
-tokens = tokenizer.tokenize(sequence)
-ids = tokenizer.convert_tokens_to_ids(tokens)
-
-input_ids = tf.constant([ids])
-print("Input IDs:", input_ids)
-
-output = model(input_ids)
-print("Logits:", output.logits)
-```
-{/if}
-
-Imprimăm ID-urile de intrare, precum și logit-urile rezultate - iată rezultatul:
-
-{#if fw === 'pt'}
-```python out
-Input IDs: [[ 1045,  1005,  2310,  2042,  3403,  2005,  1037, 17662, 12172,  2607, 2026,  2878,  2166,  1012]]
-Logits: [[-2.7276,  2.8789]]
-```
-{:else}
-```py out
-Input IDs: tf.Tensor(
-[[ 1045  1005  2310  2042  3403  2005  1037 17662 12172  2607  2026  2878
-   2166  1012]], shape=(1, 14), dtype=int32)
-Logits: tf.Tensor([[-2.7276208  2.8789377]], shape=(1, 2), dtype=float32)
-```
-{/if}
-
-Gruparea în loturi este acțiunea de a trimite mai multe propoziții prin model, toate odată. Dacă aveți o singură propoziție, puteți crea un lot cu o singură secvență: 
-
-```
-batched_ids = [ids, ids]
-```
-
-Acesta este un lot de două secvențe identice!
-
-<Tip>
-
-✏️ ** Încercați!** Convertiți această listă `batched_ids` într-un tensor și treceți-o prin modelul dumneavoastră. Verificați dacă obțineți aceleași logits ca înainte (dar de două ori)!
-
-</Tip>
-
-Gruparea în loturi permite modelului să funcționeze atunci când îi furnizați mai multe secvențe. Utilizarea mai multor secvențe este la fel de simplă ca și crearea unui lot cu o singură secvență. Există însă o a doua problemă. Atunci când încercați să combinați două (sau mai multe) propoziții, acestea pot avea lungimi diferite. Dacă ați mai lucrat vreodată cu tensori, știți că aceștia trebuie să aibă o formă dreptunghiulară, deci nu veți putea converti direct lista de ID-uri de intrare într-un tensor. Pentru a rezolva această problemă, de obicei *umplem* datele de intrare.
-
-## Umplerea datelor de intrare[[umplerea-datelor-de-intrare]]
-
-Următoarea serie de liste nu poate fi convertită într-un tensor:
-
-```py no-format
-batched_ids = [
-    [200, 200, 200],
-    [200, 200]
-]
-```
-
-Pentru a ocoli acest lucru, vom folosi *padding-ul* pentru ca tensorii noștri să aibă o formă dreptunghiulară. Padding-ul (umplerea datelor) asigură că toate propozițiile noastre au aceeași lungime prin adăugarea unui cuvânt special numit *padding token* la propozițiile cu mai puține valori. De exemplu, dacă aveți 10 propoziții cu 10 cuvinte și 1 propoziție cu 20 de cuvinte, padding-ul va asigura că toate propozițiile au 20 de cuvinte. În exemplul nostru, tensorul rezultat arată astfel:
-
-```py no-format
-padding_id = 100
-
-batched_ids = [
-    [200, 200, 200],
-    [200, 200, padding_id],
-]
-```
-
-ID-ul token-ului de umplere poate fi găsit în `tokenizer.pad_token_id`. Să-l folosim și să trimitem cele două propoziții prin model în mod separat și grupate împreună:
-
-{#if fw === 'pt'}
-```py no-format
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
-
-sequence1_ids = [[200, 200, 200]]
-sequence2_ids = [[200, 200]]
-batched_ids = [
-    [200, 200, 200],
-    [200, 200, tokenizer.pad_token_id],
-]
-
-print(model(torch.tensor(sequence1_ids)).logits)
-print(model(torch.tensor(sequence2_ids)).logits)
-print(model(torch.tensor(batched_ids)).logits)
-```
-
-```python out
-tensor([[ 1.5694, -1.3895]], grad_fn=<AddmmBackward>)
-tensor([[ 0.5803, -0.4125]], grad_fn=<AddmmBackward>)
-tensor([[ 1.5694, -1.3895],
-        [ 1.3373, -1.2163]], grad_fn=<AddmmBackward>)
-```
-{:else}
-```py no-format
-model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint)
-
-sequence1_ids = [[200, 200, 200]]
-sequence2_ids = [[200, 200]]
-batched_ids = [
-    [200, 200, 200],
-    [200, 200, tokenizer.pad_token_id],
-]
-
-print(model(tf.constant(sequence1_ids)).logits)
-print(model(tf.constant(sequence2_ids)).logits)
-print(model(tf.constant(batched_ids)).logits)
-```
-
-```py out
-tf.Tensor([[ 1.5693678 -1.3894581]], shape=(1, 2), dtype=float32)
-tf.Tensor([[ 0.5803005  -0.41252428]], shape=(1, 2), dtype=float32)
-tf.Tensor(
-[[ 1.5693681 -1.3894582]
- [ 1.3373486 -1.2163193]], shape=(2, 2), dtype=float32)
-```
-{/if}
-
-Este ceva în neregulă cu logit-urile din predicțiile noastre grupate: al doilea rând ar trebui să fie identic cu logit-urile pentru a doua propoziție, dar avem valori complet diferite!
-
-Acest lucru se datorează faptului că principala caracteristică a modelelor Transformer sunt straturile de atenție care *contextualizează* fiecare token. Acestea vor lua în considerare token-urile de umplutură, deoarece se ocupă de toate token-urile unei secvențe. Pentru a obține același rezultat atunci când trecem propoziții individuale de diferite lungimi prin model sau atunci când trecem un lot cu aceleași propoziții și același umplutură aplicată, trebuie să spunem acelor straturi de atenție să ignore token-urile de umplutură. Acest lucru se realizează prin utilizarea unei măști de atenție (attention mask).
-
-## Attention masks(măști de atenție)[[attention-masks]]
-
-*Măștile de atenție* sunt tensori cu exact aceeași formă ca tensorul ID-urilor de intrare, completate cu 0 și 1: valorile 1 indică faptul că ar trebui să se acorde atenție token-urilor corespunzătoare, iar valorile 0 indică faptul că nu ar trebui să se acorde atenție token-urilor corespunzătoare (adică acestea ar trebui ignorate de straturile de atenție ale modelului).
-
-Să completăm exemplul anterior cu o mască de atenție:
-
-{#if fw === 'pt'}
-```py no-format
-batched_ids = [
-    [200, 200, 200],
-    [200, 200, tokenizer.pad_token_id],
-]
-
-attention_mask = [
-    [1, 1, 1],
-    [1, 1, 0],
-]
-
-outputs = model(torch.tensor(batched_ids), attention_mask=torch.tensor(attention_mask))
-print(outputs.logits)
-```
-
-```python out
-tensor([[ 1.5694, -1.3895],
-        [ 0.5803, -0.4125]], grad_fn=<AddmmBackward>)
-```
-{:else}
-```py no-format
-batched_ids = [
-    [200, 200, 200],
-    [200, 200, tokenizer.pad_token_id],
-]
-
-attention_mask = [
-    [1, 1, 1],
-    [1, 1, 0],
-]
-
-outputs = model(tf.constant(batched_ids), attention_mask=tf.constant(attention_mask))
-print(outputs.logits)
-```
-
-```py out
-tf.Tensor(
-[[ 1.5693681  -1.3894582 ]
- [ 0.5803021  -0.41252586]], shape=(2, 2), dtype=float32)
-```
-{/if}
-
-Acum obținem aceeași logits pentru a doua propoziție din lot.
-
-Observăm cum ultima valoare a celei de-a doua secvențe este un ID de umplere, care este o valoare 0 în masca de atenție.
-
-<Tip>
-
-✏️ ** Încercați!** Aplicați manual tokenizarea pe cele două propoziții utilizate în secțiunea 2 ("I've been waiting for a HuggingFace course my whole life." și "I hate this so much!"). Treceți-le prin model și verificați dacă obțineți aceeași logiți ca în secțiunea 2. Acum grupați-le împreună folosind token-ul de umplere, apoi creați masca de atenție corespunzătoare. Verificați dacă obțineți aceleași rezultate atunci când parcurgeți modelul!
-
-</Tip>
-
-## Secvențe mai lungi[[secvențe-mai-lungi]]
-
-Cu modelele Transformer, există o limită a lungimii secvențelor pe care le putem transmite modelelor. Majoritatea modelelor gestionează secvențe de până la 512 sau 1024 de token-uri și se vor bloca atunci când li se cere să proceseze secvențe mai lungi. Există două soluții la această problemă:
-
-- Utilizați un model cu o lungime de secvență acceptată mai mare.
-- Trunchiați secvențele.
-
-Modelele au diferite lungimi de secvență acceptate, iar unele sunt specializate în tratarea secvențelor foarte lungi. [Longformer](https://huggingface.co/docs/transformers/model_doc/longformer) este un exemplu, iar altul este [LED](https://huggingface.co/docs/transformers/model_doc/led). Dacă lucrați la o sarcină care necesită secvențe foarte lungi, vă recomandăm să aruncați o privire la aceste modele.
-
-În caz contrar, vă recomandăm să vă trunchiați secvențele prin specificarea parametrului `max_sequence_length`:
-```py
-sequence = sequence[:max_sequence_length]
-```
diff --git a/chapters/ro/chapter2/6.mdx b/chapters/ro/chapter2/6.mdx
deleted file mode 100644
index a95a92d56..000000000
--- a/chapters/ro/chapter2/6.mdx
+++ /dev/null
@@ -1,164 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Să punem totul cap la cap[[să-punem-totul-cap-la-cap]]
-
-{#if fw === 'pt'}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section6_pt.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section6_pt.ipynb"},
-]} />
-
-{:else}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section6_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section6_tf.ipynb"},
-]} />
-
-{/if}
-
-În ultimele secțiuni, ne-am străduit să facem cea mai mare parte a muncii manual. Am explorat modul în care funcționează tokenizerele și am analizat tokenizarea, conversia în ID-uri de intrare, padding, trunchiere și măști de atenție.
-
-Cu toate acestea, după cum am văzut în secțiunea 2, API-ul 🤗 Transformers poate gestiona toate acestea pentru noi cu o funcție de nivel înalt în care ne vom adânci aici. Atunci când apelați `tokenizer` direct pe propoziție, primiți înapoi intrări care sunt gata să treacă prin modelul dvs:
-
-```py
-from transformers import AutoTokenizer
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-
-sequence = "I've been waiting for a HuggingFace course my whole life."
-
-model_inputs = tokenizer(sequence)
-```
-
-Aici, variabila `model_inputs` conține tot ceea ce este necesar pentru ca un model să funcționeze bine. Pentru DistilBERT, aceasta include ID-urile de intrare, precum și masca de atenție. Alte modele care acceptă intrări suplimentare le vor avea, de asemenea, la ieșire prin obiectul `tokenizer`.
-
-După cum vom vedea în câteva exemple de mai jos, această metodă este foarte eficientă. În primul rând, poate tokeniza o singură secvență:
-
-```py
-sequence = "I've been waiting for a HuggingFace course my whole life."
-
-model_inputs = tokenizer(sequence)
-```
-
-De asemenea, gestionează mai multe secvențe simultan, fără nicio modificare a API-ului:
-
-```py
-sequences = ["I've been waiting for a HuggingFace course my whole life.", "So have I!"]
-
-model_inputs = tokenizer(sequences)
-```
-
-Acesta poate umple în funcție de mai multe obiective:
-
-```py
-# Va umple secvențele până la lungimea maximă a secvenței
-model_inputs = tokenizer(sequences, padding="longest")
-
-# Va umple secvențele până la lungimea maximă a modelului
-# (512 pentru BERT sau DistilBERT)
-model_inputs = tokenizer(sequences, padding="max_length")
-
-# Va umple secvențele până la lungimea maximă specificată
-model_inputs = tokenizer(sequences, padding="max_length", max_length=8)
-```
-
-De asemenea, poate trunchia secvențele:
-
-```py
-sequences = ["I've been waiting for a HuggingFace course my whole life.", "So have I!"]
-
-# Va trunchia secvențele care sunt mai lungi decât lungimea maximă a modelului
-# (512 pentru BERT sau DistilBERT)
-model_inputs = tokenizer(sequences, truncation=True)
-
-# Va trunchia secvențele care sunt mai lungi decât lungimea maximă specificată
-model_inputs = tokenizer(sequences, max_length=8, truncation=True)
-```
-
-Obiectul `tokenizer` poate gestiona conversia în tensori specifici framework-ului, care pot fi apoi trimiși direct la model. De exemplu, în următorul exemplu de cod, solicităm tokenizatorului să returneze tensori din diferite cadre - `„pt”` returnează tensori PyTorch, `„tf”` returnează tensori TensorFlow, iar `„np”` returnează matrici NumPy:
-
-```py
-sequences = ["I've been waiting for a HuggingFace course my whole life.", "So have I!"]
-
-# Returnează tensori PyTorch
-model_inputs = tokenizer(sequences, padding=True, return_tensors="pt")
-
-# Returnează tensori TensorFlow 
-model_inputs = tokenizer(sequences, padding=True, return_tensors="tf")
-
-# Returnează array-uri NumPy 
-model_inputs = tokenizer(sequences, padding=True, return_tensors="np")
-```
-
-## Token-uri speciale[[token-uri-speciale]]
-
-Dacă aruncăm o privire la ID-urile de intrare returnate de tokenizer, vom vedea că sunt puțin diferite de cele pe care le-am avut mai devreme:
-
-```py
-sequence = "I've been waiting for a HuggingFace course my whole life."
-
-model_inputs = tokenizer(sequence)
-print(model_inputs["input_ids"])
-
-tokens = tokenizer.tokenize(sequence)
-ids = tokenizer.convert_tokens_to_ids(tokens)
-print(ids)
-```
-
-```python out
-[101, 1045, 1005, 2310, 2042, 3403, 2005, 1037, 17662, 12172, 2607, 2026, 2878, 2166, 1012, 102]
-[1045, 1005, 2310, 2042, 3403, 2005, 1037, 17662, 12172, 2607, 2026, 2878, 2166, 1012]
-```
-
-Un token ID a fost adăugat la început, iar unul la sfârșit. Să decodificăm cele două secvențe de ID-uri de mai sus pentru a vedea despre ce este vorba:
-
-```py
-print(tokenizer.decode(model_inputs["input_ids"]))
-print(tokenizer.decode(ids))
-```
-
-```python out
-"[CLS] i've been waiting for a huggingface course my whole life. [SEP]"
-"i've been waiting for a huggingface course my whole life."
-```
-
-Tokenizatorul a adăugat cuvântul special `[CLS]` la început și cuvântul special `[SEP]` la sfârșit. Acest lucru se datorează faptului că modelul a fost preinstruit cu aceste cuvinte, deci pentru a obține aceleași rezultate pentru inferență trebuie să le adăugăm și pe acestea. Rețineți că unele modele nu adaugă cuvinte speciale sau adaugă cuvinte diferite; de asemenea, modelele pot adăuga aceste cuvinte speciale doar la început sau doar la sfârșit. În orice caz, tokenizatorul știe care sunt cele așteptate și se va ocupa de acest lucru pentru dumneavoastră.
-
-## Încheiere: De la tokenizer la model[[încheiere-de-la-tokenizator--model]]
-
-Acum că am văzut toți pașii individuali pe care îi utilizează obiectul `tokenizer` atunci când este aplicat pe texte, să vedem o ultimă dată cum poate gestiona secvențe multiple (padding!), secvențe foarte lungi (trunchiere!) și mai multe tipuri de tensori cu API-ul său principal:
-
-{#if fw === 'pt'}
-```py
-import torch
-from transformers import AutoTokenizer, AutoModelForSequenceClassification
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
-sequences = ["I've been waiting for a HuggingFace course my whole life.", "So have I!"]
-
-tokens = tokenizer(sequences, padding=True, truncation=True, return_tensors="pt")
-output = model(**tokens)
-```
-{:else}
-```py
-import tensorflow as tf
-from transformers import AutoTokenizer, TFAutoModelForSequenceClassification
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint)
-sequences = ["I've been waiting for a HuggingFace course my whole life.", "So have I!"]
-
-tokens = tokenizer(sequences, padding=True, truncation=True, return_tensors="tf")
-output = model(**tokens)
-```
-{/if}
diff --git a/chapters/ro/chapter2/7.mdx b/chapters/ro/chapter2/7.mdx
deleted file mode 100644
index 2e6f1175c..000000000
--- a/chapters/ro/chapter2/7.mdx
+++ /dev/null
@@ -1,19 +0,0 @@
-# Utilizarea de bază este completă![[utilizarea-de-bază-este-completă]]
-
-<CourseFloatingBanner
-    chapter={2}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
- 
-Ați făcut o treabă excelentă dacă ați urmat cursul până aici! Pentru a sintetiza, în acest capitol ați:
-
-- Ați învățat elementele de bază ale unui model Transformer.
-- Ați învățat ce formează un pipeline de tokenizare.
-- Ați văzut cum să utilizați un model Transformer în practică.
-- Ați învățat cum să folosiți un tokenizer pentru a converti textul în tensori care sunt inteligibili pentru model.
-- Am configurat împreună un tokenizer și un model pentru a ajunge de la text la predicții.
-- Am învățat limitările ID-urilor de intrare și am învățat despre attention masks(măști de atenție).
-- V-ați antrenat cu ajutorul metodelor versatile și configurabile ale tokenizatorului.
-
-De acum înainte, ar trebui să puteți naviga liber prin documentele 🤗 Transformers: vocabularul va suna familiar și ați văzut deja metodele pe care le veți utiliza în majoritatea timpului.
\ No newline at end of file
diff --git a/chapters/ro/chapter2/8.mdx b/chapters/ro/chapter2/8.mdx
deleted file mode 100644
index c41f27936..000000000
--- a/chapters/ro/chapter2/8.mdx
+++ /dev/null
@@ -1,310 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-<!-- DISABLE-FRONTMATTER-SECTIONS -->
-
-# End-of-chapter quiz[[end-of-chapter-quiz]]
-
-<CourseFloatingBanner
-    chapter={2}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-### 1. What is the order of the language modeling pipeline?
-
-<Question
-	choices={[
-		{
-			text: "First, the model, which handles text and returns raw predictions. The tokenizer then makes sense of these predictions and converts them back to text when needed.",
-			explain: "The model cannot understand text! The tokenizer must first tokenize the text and convert it to IDs so that it is understandable by the model."
-		},
-		{
-			text: "First, the tokenizer, which handles text and returns IDs. The model handles these IDs and outputs a prediction, which can be some text.",
-			explain: "The model's prediction cannot be text straight away. The tokenizer has to be used in order to convert the prediction back to text!"
-		},
-		{
-			text: "The tokenizer handles text and returns IDs. The model handles these IDs and outputs a prediction. The tokenizer can then be used once again to convert these predictions back to some text.",
-			explain: "Correct! The tokenizer can be used for both tokenizing and de-tokenizing.",
-            correct: true
-		}
-	]}
-/>
-
-### 2. How many dimensions does the tensor output by the base Transformer model have, and what are they?
-
-<Question
-	choices={[
-		{
-			text: "2: The sequence length and the batch size",
-			explain: "False! The tensor output by the model has a third dimension: hidden size."
-		},
-		{
-			text: "2: The sequence length and the hidden size",
-			explain: "False! All Transformer models handle batches, even with a single sequence; that would be a batch size of 1!"
-		},
-		{
-			text: "3: The sequence length, the batch size, and the hidden size",
-			explain: "Correct!",
-            correct: true
-		}
-	]}
-/>
-
-### 3. Which of the following is an example of subword tokenization?
-
-<Question
-	choices={[
-		{
-			text: "WordPiece",
-			explain: "Yes, that's one example of subword tokenization!",
-            correct: true
-		},
-		{
-			text: "Character-based tokenization",
-			explain: "Character-based tokenization is not a type of subword tokenization."
-		},
-		{
-			text: "Splitting on whitespace and punctuation",
-			explain: "That's a word-based tokenization scheme!"
-		},
-		{
-			text: "BPE",
-			explain: "Yes, that's one example of subword tokenization!",
-            correct: true
-        },
-		{
-			text: "Unigram",
-			explain: "Yes, that's one example of subword tokenization!",
-            correct: true
-        },
-		{
-			text: "None of the above",
-			explain: "Incorrect!"
-        }
-	]}
-/>
-
-### 4. What is a model head?
-
-<Question
-	choices={[
-		{
-			text: "A component of the base Transformer network that redirects tensors to their correct layers",
-			explain: "Incorrect! There's no such component."
-		},
-		{
-			text: "Also known as the self-attention mechanism, it adapts the representation of a token according to the other tokens of the sequence",
-			explain: "Incorrect! The self-attention layer does contain attention \"heads,\" but these are not adaptation heads."
-		},
-		{
-			text: "An additional component, usually made up of one or a few layers, to convert the transformer predictions to a task-specific output",
-			explain: "That's right. Adaptation heads, also known simply as heads, come up in different forms: language modeling heads, question answering heads, sequence classification heads... ",
-			correct: true
-		} 
-	]}
-/>
-
-{#if fw === 'pt'}
-### 5. What is an AutoModel?
-
-<Question
-	choices={[
-		{
-			text: "A model that automatically trains on your data",
-			explain: "Incorrect. Are you mistaking this with our <a href='https://huggingface.co/autotrain'>AutoTrain</a> product?"
-		},
-		{
-			text: "An object that returns the correct architecture based on the checkpoint",
-			explain: "Exactly: the <code>AutoModel</code> only needs to know the checkpoint from which to initialize to return the correct architecture.",
-			correct: true
-		},
-		{
-			text: "A model that automatically detects the language used for its inputs to load the correct weights",
-			explain: "Incorrect; while some checkpoints and models are capable of handling multiple languages, there are no built-in tools for automatic checkpoint selection according to language. You should head over to the <a href='https://huggingface.co/models'>Model Hub</a> to find the best checkpoint for your task!"
-		} 
-	]}
-/>
-
-{:else}
-### 5. What is an TFAutoModel?
-
-<Question
-	choices={[
-		{
-			text: "A model that automatically trains on your data",
-			explain: "Incorrect. Are you mistaking this with our <a href='https://huggingface.co/autotrain'>AutoTrain</a> product?"
-		},
-		{
-			text: "An object that returns the correct architecture based on the checkpoint",
-			explain: "Exactly: the <code>TFAutoModel</code> only needs to know the checkpoint from which to initialize to return the correct architecture.",
-			correct: true
-		},
-		{
-			text: "A model that automatically detects the language used for its inputs to load the correct weights",
-			explain: "Incorrect; while some checkpoints and models are capable of handling multiple languages, there are no built-in tools for automatic checkpoint selection according to language. You should head over to the <a href='https://huggingface.co/models'>Model Hub</a> to find the best checkpoint for your task!"
-		} 
-	]}
-/>
-
-{/if}
-
-### 6. What are the techniques to be aware of when batching sequences of different lengths together?
-
-<Question
-	choices={[
-		{
-			text: "Truncating",
-			explain: "Yes, truncation is a correct way of evening out sequences so that they fit in a rectangular shape. Is it the only one, though?",
-			correct: true
-		},
-		{
-			text: "Returning tensors",
-			explain: "While the other techniques allow you to return rectangular tensors, returning tensors isn't helpful when batching sequences together."
-		},
-		{
-			text: "Padding",
-			explain: "Yes, padding is a correct way of evening out sequences so that they fit in a rectangular shape. Is it the only one, though?",
-			correct: true
-		}, 
-		{
-			text: "Attention masking",
-			explain: "Absolutely! Attention masks are of prime importance when handling sequences of different lengths. That's not the only technique to be aware of, however.",
-			correct: true
-		} 
-	]}
-/>
-
-### 7. What is the point of applying a SoftMax function to the logits output by a sequence classification model?
-
-<Question
-	choices={[
-		{
-			text: "It softens the logits so that they're more reliable.",
-			explain: "No, the SoftMax function does not affect the reliability of results."
-		},
-		{
-			text: "It applies a lower and upper bound so that they're understandable.",
-			explain: "Correct! The resulting values are bound between 0 and 1. That's not the only reason we use a SoftMax function, though.",
-            correct: true
-		},
-		{
-			text: "The total sum of the output is then 1, resulting in a possible probabilistic interpretation.",
-			explain: "Correct! That's not the only reason we use a SoftMax function, though.",
-            correct: true
-		}
-	]}
-/>
-
-### 8. What method is most of the tokenizer API centered around?
-
-<Question
-	choices={[
-		{
-			text: "<code>encode</code>, as it can encode text into IDs and IDs into predictions",
-			explain: "Wrong! While the <code>encode</code> method does exist on tokenizers, it does not exist on models."
-		},
-		{
-			text: "Calling the tokenizer object directly.",
-			explain: "Exactly! The <code>__call__</code> method of the tokenizer is a very powerful method which can handle pretty much anything. It is also the method used to retrieve predictions from a model.",
-			correct: true
-		},
-		{
-			text: "<code>pad</code>",
-			explain: "Wrong! Padding is very useful, but it's just one part of the tokenizer API."
-		},
-		{
-			text: "<code>tokenize</code>",
-			explain: "The <code>tokenize</code> method is arguably one of the most useful methods, but it isn't the core of the tokenizer API."
-		}
-	]}
-/>
-
-### 9. What does the `result` variable contain in this code sample?
-
-```py
-from transformers import AutoTokenizer
-
-tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
-result = tokenizer.tokenize("Hello!")
-```
-
-<Question
-	choices={[
-		{
-			text: "A list of strings, each string being a token",
-			explain: "Absolutely! Convert this to IDs, and send them to a model!",
-            correct: true
-		},
-		{
-			text: "A list of IDs",
-			explain: "Incorrect; that's what the <code>__call__</code> or <code>convert_tokens_to_ids</code> method is for!"
-		},
-		{
-			text: "A string containing all of the tokens",
-			explain: "This would be suboptimal, as the goal is to split the string into multiple tokens."
-		}
-	]}
-/>
-
-{#if fw === 'pt'}
-### 10. Is there something wrong with the following code?
-
-```py
-from transformers import AutoTokenizer, AutoModel
-
-tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
-model = AutoModel.from_pretrained("gpt2")
-
-encoded = tokenizer("Hey!", return_tensors="pt")
-result = model(**encoded)
-```
-
-<Question
-	choices={[
-		{
-			text: "No, it seems correct.",
-			explain: "Unfortunately, coupling a model with a tokenizer that was trained with a different checkpoint is rarely a good idea. The model was not trained to make sense out of this tokenizer's output, so the model output (if it can even run!) will not make any sense."
-		},
-		{
-			text: "The tokenizer and model should always be from the same checkpoint.",
-			explain: "Right!",
-            correct: true
-		},
-		{
-			text: "It's good practice to pad and truncate with the tokenizer as every input is a batch.",
-			explain: "It's true that every model input needs to be a batch. However, truncating or padding this sequence wouldn't necessarily make sense as there is only one of it, and those are techniques to batch together a list of sentences."
-		}
-	]}
-/>
-
-{:else}
-### 10. Is there something wrong with the following code?
-
-```py
-from transformers import AutoTokenizer, TFAutoModel
-
-tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
-model = TFAutoModel.from_pretrained("gpt2")
-
-encoded = tokenizer("Hey!", return_tensors="pt")
-result = model(**encoded)
-```
-
-<Question
-	choices={[
-		{
-			text: "No, it seems correct.",
-			explain: "Unfortunately, coupling a model with a tokenizer that was trained with a different checkpoint is rarely a good idea. The model was not trained to make sense out of this tokenizer's output, so the model output (if it can even run!) will not make any sense."
-		},
-		{
-			text: "The tokenizer and model should always be from the same checkpoint.",
-			explain: "Right!",
-            correct: true
-		},
-		{
-			text: "It's good practice to pad and truncate with the tokenizer as every input is a batch.",
-			explain: "It's true that every model input needs to be a batch. However, truncating or padding this sequence wouldn't necessarily make sense as there is only one of it, and those are techniques to batch together a list of sentences."
-		}
-	]}
-/>
-
-{/if}
diff --git a/chapters/ro/chapter3/1.mdx b/chapters/ro/chapter3/1.mdx
deleted file mode 100644
index 87d1e54dd..000000000
--- a/chapters/ro/chapter3/1.mdx
+++ /dev/null
@@ -1,25 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Introduction[[introduction]]
-
-<CourseFloatingBanner
-    chapter={3}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-În [Chapter 2](/course/chapter2) am explorat cum să folosim tokenizeri și modele pretrained pentru a face predicții. Dar dacă vrei să faci fine-tune un model pre-trained pentru propriul dataset? Acesta e subiectul acestui capitol. Vei învăța:
-
-{#if fw === 'pt'}
-* Cum să pregătiți un dataset mare din Hub
-* Cum să folosiți API-ul `Trainer` pentru a face fine-tune unui model
-* Cum să creați o buclă de antrenare personalizată
-* Cum să beneficiați de biblioteca 🤗 Accelerate pentru a rula ușor această bucla de antrenare personalizare pe orice configurare distribuită.
-
-{:else}
-* Cum să pregătiți un datasetmare din Hub
-* Cum să folosiți Keras să faceți fine-tune unui model
-* Cum să folosiți Keras pentru a obține predicții
-* Cum să folosiți un indicator custom
-
-{/if}
-Pentru a încărca checkpoint-urile antrenate pe Hugging Face Hub, veți avea nevoie de un cont la huggingface.co: [creați un cont](https://huggingface.co/join)
\ No newline at end of file
diff --git a/chapters/ro/chapter3/2.mdx b/chapters/ro/chapter3/2.mdx
deleted file mode 100644
index 8d6cc6c4c..000000000
--- a/chapters/ro/chapter3/2.mdx
+++ /dev/null
@@ -1,393 +0,0 @@
-`<FrameworkSwitchCourse {fw} />`
-
-# Procesarea datelor [[processing-the-data]]
-
-{#if fw === 'pt'}
-
-<CourseFloatingBanner chapter={3}
-    classNames="absolute z-10 right-0 top-0"
-    notebooks={[
-        {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter3/section2_pt.ipynb"},
-        {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter3/section2_pt.ipynb"},
-]} />
-{:else}
-
-<CourseFloatingBanner chapter={3}
-
-classNames="absolute z-10 right-0 top-0"
-    notebooks={[
-        {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter3/section2_tf.ipynb"},
-        {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter3/section2_tf.ipynb"},
-]} />
-
-{/if}
-
-{#if fw === 'pt'}
-Continuând cu exemplul din [capitol anterior](/course/chapter2), mai jos vedeți cum putem să antrenăm un sequence classifier pe un singur batch în PyTorch:
-
-```python
-import torch
-from transformers import AdamW, AutoTokenizer, AutoModelForSequenceClassification
-
-checkpoint = "bert-base-uncased"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
-
-sequences = [
-    "Am așteptat toată viața mea pentru un curs HuggingFace.",
-    "Acest curs este fascinant!",
-]
-batch = tokenizer(sequences, padding=True, truncation=True, return_tensors="pt")
-
-# Acesta este nou
-batch["labels"] = torch.tensor([1, 1])
-
-optimizer = AdamW(model.parameters())
-loss = model(**batch).loss
-loss.backward()
-optimizer.step()
-```
-{:else}
-Continuând cu exemplul din [capitolul anterior](/course/chapter2), mai jos vedeți cum continuăm antrenarea unui sequence classifier pe un batch în TensorFlow:
-
-```python
-import tensorflow as tf
-import numpy as np
-from transformers import AutoTokenizer, TFAutoModelForSequenceClassification
-
-# Același lucru ca dinainte
-checkpoint = "bert-base-uncased"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint)
-sequences = [
-    "Am așteptat toată viața mea pentru un curs HuggingFace.",
-    "Acest curs este fascinant!",
-]
-batch = dict(tokenizer(sequence, padding=True, truncate=True, return_tensors="tf"))
-
-
-# Aceasta este nou
-model.compile(optimizer="adam", loss="sparse_categorical_crossentropy")
-etichete = tf.convert_to_tensor([1, 1])
-model.train_on_batch(batch, etichete)
-```
-
-De obicei, antrenarea modelului pe două propoziții nu va da rezultate foarte bune. Pentru a obține rezultate mai bune, veți avea nevoie să pregătiți un dataset mai mare.
-
-În această secțiune vom folosi ca exemplu datasetul MRPC (Microsoft Research Paraphrase Corpus), introdus într-un [articol](https://www.aclweb.org/anthology/I05-5002.pdf) de William B. Dolan și Chris Brockett. Datasetul constă din 5,801 perechi de propoziții, cu o etichetă care indică dacă sunt paraphraseuri sau nu (adică dacă ambele propoziții au același înțeles). Am selectat-o pentru acest capitoldeoare că este un dataset mic, așa încât să fie ușor de experimentat cu antrenarea pe el.
-
-### Încărcarea unui dataset din Hub[[loading-a-dataset-from-the-hub]]
-
-{#if fw === 'ro'}
-<Youtube id="_BZearw7f0w"/>
-{:else}
-<Youtube id="W_gMJF0xomE"/>
-{/if}
-
-Hub-ul nu conține doar modele; de asemenea, conține multiple dataseturi înm mai multe limbi. Puteți naviga prin seturile de date [aici](https://huggingface.co/datasets), și vă recomandăm să încercați să încărcați și procurați un nou dataset odată ce veți fi trecut prin această secțiune (vedeți documentația generală [aici](https://huggingface.co/docs/datasets/loading)). Dar pentru moment, să ne concentrăm pe datasetul MRPC! Este una dintre cele 10 seturi de date care compun benchmark-ul [GLUE](https://gluebenchmark.com/), care este un benchmark academic folosit pentru a măsura performanța modelelor ML în 10 diferite sarcini de clasificare a textului.
-
-Biblioteca 🤗 Datasets oferă o comandă foarte simplă pentru a descărca și a stoca un dataset din Hub. Putem să instalăm datasetul MRPC astfel:
-
-<Tip>
-⚠️ **Avertizare** Asigurați-vă că `datasets` este instalat prin rularea `pip install datasets`. Apoi, încărcați dataset-ul MRPC și printați-l pentru a vedea ce conține.
-</Tip>
-
-```py
-from datasets import load_dataset
-
-raw_datasets = load_dataset("glue", "mrpc")
-raw_datasets
-```
-
-```python out
-DatasetDict({
-    train: Dataset({
-        features: ['sentence1', 'sentence2', 'label', 'idx'],
-        num_rows: 3668
-    })
-    validation: Dataset({
-        features: ['sentence1', 'sentence2', 'label', 'idx'],
-        num_rows: 408
-    })
-    test: Dataset({
-        features: ['sentence1', 'sentence2', 'label', 'idx'],
-        num_rows: 1725
-    })
-})
-```
-
-Ai observat că am obținut un obiect `DatasetDict` care conține setul de antrenare, setul de validare și setul de testare. Fiecare dintre acestea conține câteva coloane (`sentence1`, `sentence2`, `label`, și `idx`) și o numpăr de rânduri variabil, care reprezintă numărul de elemente în fiecare set (astfel, există 3.668 perechi de fraze în setul de antrenare, 408 în setul de validare și 1.725 în setul de testare).
-
-Acest comandă descarcă și face cache datasetului, în *~/.cache/huggingface/datasets*(folderul implicit de salvare). În capitolul 2, am văzut cum putem personaliza folderul de cache stabilind variabila de mediu `HF_HOME`.
-
-Putem accesa fiecare pereche de fraze din obiectul `raw_datasets` prin indexare, asemenea unui dicționar:
-
-```py
-raw_train_dataset = raw_datasets["train"]
-raw_train_dataset[0]
-```
-
-```python
-{'idx': 0,
- 'label': 1,
- 'sentence1': 'Amrozi l-a acuzat pe fratele său, pe care l-a numit „martorul” , că distorsionează intenționat probele sale.',
- 'sentence2': 'Referindu-se la el doar sub numele de " martorul ", Amrozi l-a acuzat pe fratele său că distorsionează intenționat probele sale.'}
-```
-
-Putem vedea că labels sunt numere întregi, așadar nu vom trebui să facem nicio procesare în acest sens. Pentru a ști care număr întreg corespunde cu care label, putem inspecta variabila `features` al 'raw_train_dataset'. Acest lucru ne va spune tipul fiecărui coloană.
-
-```py
-raw_train_dataset.features
-```
-
-```python out
-{'sentence1': Value(dtype='string', id=None),
- 'sentence2': Value(dtype='string', id=None),
- 'label': ClassLabel(num_classes=2, names=['not_equivalent', 'equivalent'], names_file=None, id=None),
- 'idx': Value(dtype='int32', id=None)}
-```
-
-În spatele, `label` este obiect de tip `ClassLabel`, iar maparea numerelor întregi la numele label-ului este stocat în folderele *names*. Astfel, `0` corespunde cu `not_equivalent`, iar `1` corespunde cu `equivalent`.
-
-<Tip>
-
-✏️ **Încercați-o!** Arată elementul 15 din setul de antrenament și elementul 87 din setul de validare. Care sunt label-urile acesotra?
-
-</Tip>
-
-### Preprocessing un datset[[preprocessing-a-dataset]]
-
-{#if fw === 'pt'}
-<Youtube id="0u3ioSwev3s"/>
-{:else}
-<Youtube id="P-rZWqcB6CE"/>
-{/if}
-
-Pentru a prelucra datele, trebuie să convertim textul în numere pe care modelul le poate înțelege. Cum ai văzut în [capitol anterior](/course/chapter2), acest lucru se face cu ajutorul unui tokenizer. Putem să oferim tokenizerului o propoziție sau o listă de propoziții, așa că putem să tokenizăm direct toate primele propoziții și toate cele de-a doua propoziții ale fiecărei perechi în felul următor:
-
-```py
-from transformers import AutoTokenizer
-
-checkpoint = "bert-base-uncased"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-tokenized_sentences_1 = tokenizer(raw_datasets["train"]["sentence1"])
-tokenized_sentences_2 = tokenizer(raw_datasets["train"]["sentence2"])
-```
-
-Însă nu putem să transmitem doar două propoziții către model și să obținem o predicție dacă cele două propoziții sunt parafraze sau nu. Trebuie să controlăm cele două secvențe ca o pereche, apoi să le aplicăm preprocesarea adecvată. Norocul este că tokenizer-ul poate lua o pereche de propoziții și le poate pregăti în felul în care modelul BERT îl așteaptă: 
-
-```py
-inputs = tokenizer("Aceasta este prima propoziție.", "Aceasta este a doua.")
-inputs
-
-```
-
-```python out
-{ 
-  'input_ids': [101, 2023, 2003, 1996, 2034, 6251, 1012, 102, 2023, 2003, 1996, 2117, 2028, 1012, 102],
-  'token_type_ids': [0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1],
-  'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]
-}
-```
-
-Am discutat despre `input_ids` și `attention_mask` cheii în [Capitolul 2](/course/chapter2), dar am întârziat cu abordarea cheii `token_type_ids`. În acest exemplu, această cheie este ceea ce spune modelului care parte a inputului este prima propoziție și care este a doua.
-
-<Tip>
-✏️ **Încercați!** Luați elementul 15 din setul de antrenare și tokenizați cele două propoziții separat și ca o pereche. Care este diferența dintre rezultatele celor două? 
-</Tip>
-
-Dacă facem decode ID-urilor din `input_ids` înapoi la cuvinte:
-
-```python
-tokenizer.convert_ids_to_tokens(inputs["input_ids"])
-```
-
-Noi vom obține următorul rezultat:
-
-```python
-['[CLS]', 'acesta', 'este', 'prima', 'propoziție', '.', '[SEP]', 'acesta', 'este', 'a', 'doua', '.', '[SEP]']
-```
-
-Prin urmare, modelul așteaptă ca inputul să fie în forma `[CLS] sentence1 [SEP] sentence2 [SEP]` atunci când există două propoziții. Aliniind această informație cu `token_type_ids`, obținem:
-
-```python
-['[CLS]', 'acesta', 'este', 'prima', 'propoziție', '.', '[SEP]', 'acesta', 'este', 'a', 'doua', '.', '[SEP]']
-[      0,      0,    0,     0,       0,          0,   0,       0,      1,    1,     1,        1,     1,   1,       1]
-```
-
-Observăm,că inputul corespunzător `[CLS] sentence1 [SEP]` au toate un token type ID de `0`, în timp ce celelalte părți, corespunzătoare `sentence2 [SEP]`, au toate un token type ID de `1`.
-
-Înțelegem că dacă selectăm alt checkpoint al modelului, nu vom avea neapărat `token_type_ids` în inputurile tokenizate (de exemplu, ele nu sunt returnate dacă folosim un model DistilBERT). Acestea sunt returnate doar atunci când modelul știe ce să facă cu ele, pentru că le-a văzut în timpul pretrainingului.
-
-În acest caz, BERT este antrenat cu token type IDs și pe lângă the masked language modeling objective despre care am vorbit în [Capitolul 1](/course/chapter1), are un objective suplimentar numit _next sentence prediction_. Objectiveul este destinat modelării relației între perechi de propoziții.
-
-Cu următoare predicție a propoziției, modelului i se prezintă perechi de propoziții (cu masked tokens aleatoriu) și i se cere să prezică dacă a doua propoziție urmează primei. Pentru a face sarcina non-trivial, în jumătate dintre cazuri propizițiie urmează una pe alta în documentul original din care au fost extrase și cealaltă jumătate ele vin de la două documente diferite.
-
-În general, nu trebuie să vă faceți griji dacă există sau nu `token_type_ids` în inputurile tokenizate: atât timp cât folosiți aceelași checkpoint al modelului și a tokenizer-ului, totul va fi bine, pentru că tokenizer-ul știe ce are de oferit modelului.
-
-Acum că am văzut cum poate prelucra tokenizer-ul o pereche de propoziții, îl putem folosi acest lucru pentru a tokeniza întregul nostru dataset: exact ca în [capitolul anterior](/course/chapter2), putem să oferim tokenizer-ului o listă de perechi de propoziții oferindu-i prima listă de propoziții și apoi lista a doua. Acest lucru este compatibil cu padding-ul și truncation-ul pe care le-am văzut în [Capitolul 2](/course/chapter2). În felul acesta putem prelucra datasetul de antrenare astfel:
-
-```py
-tokenized_dataset = tokenizer(
-    raw_datasets["train"]["sentence1"],
-    raw_datasets["train"]["sentence2"],
-    padding=True,
-    truncation=True,
-)
-```
-
-Această metodă funcționează bine, dar are dezavantajul că returnează un dicționar (cu key-urile noastre, `input_ids`, `attention_mask`, și `token_type_ids` și valori care sunt liste de liste). Va funcționa doar dacă aveți destul de RAM pentru a stoca întreg dataset în tokenizării acestuia (iar dataset-urile din biblioteca 🤗 Datasets sunt fișiere [Apache Arrow](https://arrow.apache.org/) stocate pe disc, deci tu stochezi numai sample-urile pe care le ceri să se păstreaze în memorie).
-
-Acum că am înțeles modul în care tokenizer-ul nostru poate gestiona o pereche de fraze, putem folosi el pentru a tokenize întregul nostru set de date: la fel cum am făcut în [capitolul anterior](/course/chapter2), putem alimenta tokenizer-ul cu lista de prime fraze și apoi lista de fraze secunde. Această metodă este compatibilă și cu opțiunile de umplere și tăiere pe care le-am văzut în [Capitolul 2](/course/chapter2). Astfel, una dintre modalitățile prin care putem preprocesa dataset-ul de antrenare este:
-
-```py
-tokenized_dataset = tokenizer(
-    raw_datasets["train"]["sentence1"],
-    raw_datasets["train"]["sentence2"],
-    padding=True,
-    truncation=True,
-)
-```
-
-Această metodă funcționează bine, dar are dezavantajul că returnează un dicționar (cu cheile noastre, `input_ids`, `attention_mask`, și `token_type_ids`, și valori care sunt liste de liste). Va fi disponibilă doar dacă aveți suficient spațiu de memorie pentru a stoarca întregul set de date în timpul tokenizării (în timp ce dataset-urile din biblioteca 🤗 Datasets se salvează sub forma [Apache Arrow](https://arrow.apache.org/), fișiere stocate pe disch, astfel încât doar acele fragmente ale datelor pe care le cerem să fie încărcate în memorie).
-
-Pentru a păstra datele în forma de dataset, vom folosi metoda [`Dataset.map()`](https://huggingface.co/docs/datasets/package_reference/main_classes#datasets.Dataset.map). Aceasta ne permite puțin mai multă flexibilitate, dacă ne trebuie mai multă preprocesare pe lângă tokenization. Metoda `map()` aplică o funcție asupra fiecărui element al datasetului, astfel putem să definim o funcție care tokenizează input-urile noastre:
-
-```py
-def tokenize_function(example):
-    return tokenizer(example["sentence1"], example["sentence2"], truncation=True)
-```
-
-Această funcție i-a un dicționar (ca și elementele datasetului) și returnează un nou dicționar cu key-urile `input_ids`, `attention_mask`, și `token_type_ids`. Acesta va lucra chiar și dacă dicționarul "example" conține câteva sample-uri(fiecare key ca o list de propoziții), întrucât "tokenizer"-ul lucrează și cu liste cu perechi de propoziții cum am văzut mai devreme. Aceasta va permite folosirea opțiunii `batched=True` în apelul funcției `map()`, ceea ce va accelera semnificativ tokenizarea. `Tokenizer`-ul nostru este susținut de un tokenizer scris în Rust din biblioteca [🤗 Tokenizers](https://github.com/huggingface/tokenizers). Acest tokenizer poate fi extrem de rapid, dar numai dacă îi dăm multe inputuri odată.
-
-*Atenție*:Am omis argumentul `padding` din funcția noastră de tokenizare pentru moment. Acest lucru este datorat faptului că aplicarea padding-ului tuturor elementelor cu lungimea maximă nu este eficientă: în schimb, este mai bine să faceți padding elementelor atunci când creați un batch, astfel încât să vă trebuiască doar să faceți padding până la lungimea maximă doar în acest batch și nu întregului dataset. Acest lucru poate salva mult timp și resurse atunci când input-urile au lungimi foarte variabile.
-
-Aici este modul în care aplicăm funcția de tokenizare asupra tuturor dataset-urilor noastre. Folosim `batched=True` în apelul funcției `map` astfel încât funcția să fie aplicată asupra mai multor elemente ale datasetului odată. Aceasta permite preprocesarea accelerată.
-
-```py
-tokenized_datasets = raw_datasets.map(tokenize_function, batched=True)
-tokenized_datasets
-```
-
-Modul în care biblioteca 🤗 Datasets aplică această procesare este prin adăugarea de noi câmpuri la dataset-uri, unul pentru fiecare key din dicționarul returnat de funcția de preprocesare:
-
-```python out
-DatasetDict({
-    train: Dataset({
-        features: ['attention_mask', 'idx', 'input_ids', 'label', 'sentence1', 'sentence2', 'token_type_ids'],
-        num_rows: 3668
-    })
-    validation: Dataset({
-        features: ['attention_mask', 'idx', 'input_ids', 'label', 'sentence1', 'sentence2', 'token_type_ids'],
-        num_rows: 408
-    })
-    test: Dataset({
-        features: ['attention_mask', 'idx', 'input_ids', 'label', 'sentence1', 'sentence2', 'token_type_ids'],
-        num_rows: 1725
-    })
-})
-```
-
-Puteți chiar și folosi multiprocessing când aplicați funcția de preprocesare cu `map()` prin folosirea unui argument `num_proc`. Nu am făcut acest lucru aici pentru că biblioteca 🤗 Tokenizers utilizează deja mai multe thread-uri pentru a tokeniza sample-urile mai rapid, dar dacă nu folosiți un tokenizer rapid cu această bibliotecă, acest lucru v-ar putea accelera preprocesarea.
-
-Funcția `tokenize_function` returnează un dicționar cu key-urile `input_ids`, `attention_mask`, și `token_type_ids`, astfel că aceste trei câmpuri sunt adăugate tuturor split-urilor în dataset-urile noastre. Notați-vă că am putea chiar schimba câmpurile existente dacă funcția de preprocesare ar returna o nouă valoare pentru un key din dataset-ul pe care aplicăm `map()`.
-
-Ultimul lucru pe care trebuie să îl facem este să facem padding tuturor exemplelor până la lungimea celui mai mare element atunci când facem batch elementelor împreună – o tehnică pe care o denumim *dinamic padding*.
-
-### Dinamic Padding[[dynamic-padding]]
-<Youtube id="7q5NyFT8REg"/>
-{#if fw === 'pt'}
-
-Funcția care este responsabilă de a pune împreună sample-urile într-un batch se numește *collate function*. Este un argument default pe care puteți să-l transmiteți când construiți un `DataLoader`, valoarea implicită fiind o funcție care va converti sample-urile în tensors PyTorch și le va concatena (recursiv dacă elementele dumneavoastră sunt liste, tuple-uri sau dicționare). Acest lucru nu este posibil în cazul nostru deoarece input-urile noastre nu vor avea toate aceeași dimensiune. Am amânat intenționat padding-ul pentru a o aplica numai atunci când e nevoie, pe fiecare batch și să evităm astfel exemplele cu lungimi prea mari cu multe padding-uri. Acest lucru va accelera antrenarea, dar notați-vă că dacă antrenați pe un TPU, acest lucru poate cauza probleme – TPU-urile preferă forme fixe, chiar dacă aceasta înseamnă padding suplimentar.
-
-{:else}
-
-Funcția care este responsabilă de a pune împreună sample-urile într-un batch se numește *collate function*. Collator-ul default este o funcție ce va transforma sample-urile în tf. Faceți Tensor și concatenațile (recursiv dacă elementele dumneavoastră sunt liste, tuple-uri sau dicționare). Acest lucru nu este posibil în cazul nostru deoarece input-urile noastre nu vor avea toate aceeași dimensiune. Am amânat intenționat padding-ul pentru a o aplica numai atunci când e nevoie, pe fiecare batch și să evităm astfel exemplele cu lungimi prea mari cu multe padding-uri. Acest lucru va accelera antrenarea, dar notați-vă că dacă antrenați pe un TPU, acest lucru poate cauza probleme – TPU-urile preferă forme fixe, chiar dacă aceasta înseamnă padding suplimentar.
-
-{/if}
-
-Pentru a face acest lucru, trebuie să definim o funcție collate care va aplica cantitatea corectă de padding pentru elementele din dataset-ul pe care vrem să-i facem batch. Norocul este că biblioteca 🤗 Transformers ne oferă o asemenea funcție prin `DataCollatorWithPadding`. Aceasta i-a un tokenizer atunci când o inițializați(pentru a ști care padding token să folosim și dacă modelul se așteaptă ca padding-ul să fie pe stânga sau dreapta inputu-lui) și va face tot ce este nevoie:
-{#if fw === 'pt'}
-```py
-from transformers import DataCollatorWithPadding
-data_collator = DataCollatorWithPadding(tokenizer=tokenizer)
-```
-{:else}
-```py
-from transformers import DataCollatorWithPadding
-data_collator = DataCollatorWithPadding(tokenizer=tokenizer, return_tensors="tf")
-```
-{/if}
-
-Pentru a testa acest nou jucărie, să luăm câteva sample-uri din setul nostru de antrenare pe care am dori să le facem batch împreună. Aici, ștergem coloanele `idx`, `sentence1` și `sentence2` deoarece nu vor fi necesare și conțin stringuri (și nu putem crea tensore cu stringuri) și uitați-vă la lungimile fiecărui element din lotul nostru:
-
-```py
-samples = tokenized_datasets["train"][:8]
-samples = {k: v for k, v in samples.items() if k not in ["idx", "sentence1", "sentence2"]}
-[len(x) for x in samples["input_ids"]]
-```
-
-```python out
-[50, 59, 47, 67, 59, 50, 62, 32]
-```
-
-Nu e de mirare că obținem sample-uri de lungimi diferite, între 32 și 67. Dynamic padding înseamnă că sample-urilor din acest batch le-ar trebui aplicate padding cu o lungime de 67, lungimea cea mai mare din batch. Fără Dynamic padding, toate sample-urile ar fi avut padding cu maximul lungimii din întregul dataset sau maximul lungimii pe care modelul poate accepta. Să verificăm încă o dată dacă `data_collator`-ul nostru face dynamic padding pe batch:
-
-```py
-batch = data_collator(samples)
-{k: v.shape for k, v in batch.items()}
-```
-
-{#if fw === 'tf'}
-
-```python out
-{'attention_mask': TensorShape([8, 67]),
- 'input_ids': TensorShape([8, 67]),
- 'token_type_ids': TensorShape([8, 67]),
- 'labels': TensorShape([8])}
-```
-
-{:else}
-
-```python out
-{'attention_mask': torch.Size([8, 67]),
- 'input_ids': torch.Size([8, 67]),
- 'token_type_ids': torch.Size([8, 67]),
- 'labels': torch.Size([8])}
-```
-
-Looking good! Acum că am trecut de la textul raw la batch-uri pe care modelul nostru poate să le proceseze, suntem gata să îi facem fine-tune!
-
-{/if}
-
-<Tip>
-
-✏️ **Încearcă-ți norocul!** Implementează preprocesarea datelor pe dataset-ul GLUE SST-2. Acesta se diferență puțin deoarece nu conține perechi de propoziții, ci doar câte o propoziție, dar ceea ce am făcut ar trebui să rămână neschimbat. Pentru o provocare mai grea, încearcă să scrii o funcție de preprocesare care se aplică oricărui task GLUE.
-
-</Tip>
-
-{#if fw === 'tf'}
-
-Acum că avem dataset-ul nostru și un `data_collator`, este timpul să-i punem la lucru. În loc să încărcăm manual batch-urile și să le facem collate, asta însemnând prea mult lucru și, nu ar fi nici prea performantă. În schimb, există o metodă simplă care oferă o soluție performantă la acest problemă: `to_tf_dataset()`. Acest lucru va face wrap unui `tf.data.Dataset` în jurul datasetului nostru, cu o fucție opțională de collation. `tf.data.Dataset` este un format nativ TensorFlow pe care Keras-ul o poate folosi pentru `model.fit()`, astfel încât această metodă face convert unui 🤗 Dataset la un format gata să fie antrenat. Hai să-l vedem în acțiune cu datasetul nostru!
-
-```py
-tf_train_dataset = tokenized_datasets["train"].to_tf_dataset(
-    columns=["attention_mask", "input_ids", "token_type_ids"],
-    label_cols=["labels"],
-    shuffle=True,
-    collate_fn=data_collator,
-    batch_size=8,
-)
-
-tf_validation_dataset = tokenized_datasets["validation"].to_tf_dataset(
-    columns=["attention_mask", "input_ids", "token_type_ids"],
-    label_cols=["labels"],
-    shuffle=False,
-    collate_fn=data_collator,
-    batch_size=8,
-)
-```
-
-Și asta e tot! Putem lua aceste dataset-uri pentru următoarea lecție, unde antrenamentul va fi ușor după toată munca depusă pentru prelucrarea datelor.
-
-{/if}
\ No newline at end of file
diff --git a/chapters/ro/chapter3/3.mdx b/chapters/ro/chapter3/3.mdx
deleted file mode 100644
index df987c810..000000000
--- a/chapters/ro/chapter3/3.mdx
+++ /dev/null
@@ -1,174 +0,0 @@
-
-<FrameworkSwitchCourse {fw} />
-
-# Fine-tuningul unui model cu API-ul Trainer[[fine-tuning-a-model-with-the-trainer-api]]
-
-<CourseFloatingBanner chapter={3}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[ 
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter3/section3.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter3/section3.ipynb"},
-]} />
-
-<Youtube id="nvBXf7s7vTI"/>
-
-🤗 Transformers oferă o clasă `Trainer` pentru a vă ajuta să faceți fine-tune pe oricare dintre modelurile preantrenate pe care le oferă pe datasetul dvs. Odată ce ați terminat preprocesarea datelor din ultima secțiune, mai aveți doar câteva pași rămași pentru a defini `Trainerul`. Partea cea mai grea este probabil pregătirea environmentul pentru a rula `Trainer.train()`, deoarece va lua mult timp pe un CPU. Dacă nu aveți niciun GPU configurat, puteți accesa gratuit GPUuri sau TPUuri pe [Google Colab](https://colab.research.google.com/).
-
-Exemplele de cod de mai jos presupune că ați executat exemplele din secțiunea anterioară. Aici este o scurtă recapitulare despre ce aveți nevoie:
-
-```py
-from datasets import load_dataset
-from transformers import AutoTokenizer, DataCollatorWithPadding
-
-raw_datasets = load_dataset("glue", "mrpc")
-checkpoint = "bert-base-uncased"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-
-
-def tokenize_function(example):
-    return tokenizer(example["sentence1"], example["sentence2"], truncation=True)
-
-
-tokenized_datasets = raw_datasets.map(tokenize_function, batched=True)
-data_collator = DataCollatorWithPadding(tokenizer=tokenizer)
-```
-
-### Antrenarea[[training]]
-
-Înainte de a putea defini `Trainerul`, trebuie să definim o clasă `TrainingArguments` care va conține toți hyperparameters pe care `Trainer` le va folosi pentru antrenare și evaluare. Singurul argument pe care trebuie să-l oferiți este un folder în care modelul anternat va fi salvat, precum și checkpointurile de-a lungul drumului. Toate celelalte pot fi lăsate ca valori default, care ar trebui să funcționeze destul de bine pentru un fine-tune de bază.
-
-```py
-from transformers import TrainingArguments
-
-training_args = TrainingArguments("test-trainer")
-```
-
-<Tip>
-
-💡 Dacă doriți să încărcați automat modelul pe Hub în timpul antrenării, transmiteți `push_to_hub=True` în `TrainingArguments`. Ne vom întoarce la acest subiect în [Capitolul 4](/course/chapter4/3)
-
-</Tip>
-
-A doua etapă este definiția modelului nostru. Ca în capitolul anterior, vom folosi clasa `AutoModelForSequenceClassification`, cu două labeluri:
-
-```py
-from transformers import AutoModelForSequenceClassification
-
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
-```
-
-Observăm că, spre deosebire de [Capitolul 2](/course/chapter2), se emite o avertizare după crearea acestui model preantrenat. Acest lucru este datorit faptului că BERT nu a fost antrenat pentru clasificarea perechilor de propoziții, astfel încât headul modelului preantrenat a fost eliminat și un nou head adecvat pentru clasificarea secvențelor a fost adăugat în loc. Avertizările indică faptul că anumite weights nu au fost utilizate (cele care corespundeau headului eliminat) și celelalte au fost inițializate aleatoriu (cele pentru noul head). Aceasta se termină cu o recomandare de a antrena modelul, ceea ce vom face acum.
-
-Odată ce am definit modelul nostru, putem defini `Trainer` prin transmiterea tuturor obiectelor construite până acum — `model`, `training_args`, a training și validation datasets, `data_collator`, și `tokenizer`:
-
-```py
-from transformers import Trainer
-
-trainer = Trainer(
-    model,
-    training_args,
-    train_dataset=tokenized_datasets["train"],
-    eval_dataset=tokenized_datasets["validation"],
-    data_collator=data_collator,
-    tokenizer=tokenizer,
-)
-```
-
-Observăm că, dacă transmitem `tokenizer`, atunci defaultul `data_collator` folosit de `Trainer` va fi un `DataCollatorWithPadding` similar celui definit mai devreme. Din acest motiv, puteți omite linia `data_collator=data_collator` aici. A fost important să vă arătăm această parte în secțiunea 2!
-
-Pentru a face fine-tune modelului pe datasetul nostru, trebuie să apelăm metoda `train()` a `Trainerului`:
-
-```py
-trainer.train()
-```
-
-Acest lucru va începe fine-tuningul (care ar trebui să dureze câteva minute pe un GPU) și va raporta training loss la fiecare 500 de pași. Totuși, nu va raporta cât de bine sau rău se descurcă modelul. Acest lucru este datorat:
-
-1. Nu am transmis `Trainerului` să efectueze evaluarea în timpul antrenării, prin setarea `evaluation_strategy` la `"steps"` (evaluați la fiecare `eval_steps`) sau `"epoch"` (evaluați la finalul fiecărei epoch).
-2. Nu am oferit `Trainerului` o funcție `compute_metrics()` pentru a calcula metricele în timpul evaluări(altminter evalurea ar fi printat doar lossul, care nu este un număr foarte intuitiv).
-
-### Evaluare[[evaluation]]
-
-Să vedem cum putem construi o funcție `compute_metrics()` folositoare și să o utilizăm la următoarea antrenare. Funcția trebuie să primească obiectul `EvalPrediction` (un named tuple cu fieldul `predictions` și altul `label_ids`) și să returneze un dicționar ce le asociază făcând mapping valorilor string la valori float (stringurile fiind denumirile metricelor returnate, și valorile floats al acestora). Pentru a obține câteva predicții din model, putem folosi comanda `Trainer.predict()`:
-
-```py
-predictions = trainer.predict(tokenized_datasets["validation"])
-print(predictions.predictions.shape, predictions.label_ids.shape)
-```
-
-```python out
-(408, 2) (408,)
-```
-
-Outputul metodei `predict()` este un named tuple  cu trei fielduri: `predictions`, `label_ids` și `metrics`. Câmpul `metrics` va conține doar lossul asupra datasetului transmis, precum și o serie de metrice de timp (cât de mult a luat prezicerea și timpul mediu). Odată ce vom completa funcția `compute_metrics()` și îl vom oferi `Trainerului`, atunci acel field va conține și metricele returnate de `compute_metrics()`.
-
-După cum puteți vedea, `predictions` este un array bi-dimensional cu shapeul 408x2 (408 fiind numărul de elemente în datasetul folosit). Acestea sunt logiturile pentru fiecare element al datasetului pe care le-am oferit funcției `predict()` (cum ați văzut în [capitolul anterior](/course/chapter2), toate modelel Transformer returneă logituri). Pentru a le transforma în predicții pe care să le comparăm cu labelurile noastre, noi trebui să luăm indexul cu cea mai mare valoare pe axa a doua:
-
-
-```py
-import numpy as np
-
-preds = np.argmax(predictions.predictions, axis=-1)
-```
-
-Acum putem compara `preds` cu labelurile. Ca să construim funcțioa noastră `compute_metric()`, o să ne bazăm pe metricele de la librăria 🤗 [Evaluate](https://github.com/huggingface/evaluate/). Putem încărca metricele asociate cu datasetul MRPC la fel de ușor cum am încărcat datasetul, de data asta cu funcția `evaluate.load()`. Obiectul returnat are o metodă `compute()` pe care o putem folosi ca să facem calcularea metricelor:
-
-```py
-import evaluate
-
-metric = evaluate.load("glue", "mrpc")
-metric.compute(predictions=np.argmax(predictions.predictions, axis=-1), references=predictions.label_ids)
-```
-
-```python out
-{'accuracy': 0.8578431372549019, 'f1': 0.8996539792387542}
-```
-
-Rezultatele exacte pe care le veți obține pot varia, deoarece inițializarea aleatoare a headului modelului care poate schimba metricele pe care le-a atins. Aici putem vedea că modelul nostru are o precizie de 85.78% în setul de validare și un scor F1 de 89.97. Acestea sunt exact aceleași metrice folosite pentru evaluarea rezultatelor pe datasetul MRPC pentru GLUE benchmark. Tabelul din [BERT Paper](https://arxiv.org/pdf/1810.04805.pdf) a raportat un scor F1 de 88.9 pentru modelul de bază. Acela a fost un `uncased` model, dar noi utilizăm acum un `cased` model, ceea ce explică rezultatul mai bun.
-
-Pentru a reuni toate acestea într-o singură funcție `compute_metrics()`, putem scrie:
-
-```py
-def compute_metrics(eval_preds):
-    metric = evaluate.load("glue", "mrpc")
-    logits, labels = eval_preds
-    predictions = np.argmax(logits, axis=-1)
-    return metric.compute(predictions=predictions, references=labels)
-```
-
-Să vedem acum cum putem utiliza această funcție pentru a raporta metricele la sfârșitu fiecărei epoch, mai jos puteți vedea cum definim un nou `Trainer` cu funcția compute:
-
-```py
-training_args = TrainingArguments("test-trainer", evaluation_strategy="epoch")
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
-
-trainer = Trainer(
-    model,
-    training_args,
-    train_dataset=tokenized_datasets["train"],
-    eval_dataset=tokenized_datasets["validation"],
-    data_collator=data_collator,
-    tokenizer=tokenizer,
-    compute_metrics=compute_metrics,
-)
-```
-
-Observăm că am creat un nou `TrainingArguments` cu `evaluation_strategy` setat la `"epoch"` și o nouă instanță a modelului. În cazul nostru, ar fi fost suficient să continuam antrenarea prezentată anterior.
-
-Pentru a lansa o nouă antrenare, putem executa:
-
-```py
-trainer.train()
-```
-
-De data aceasta, acesta va raporta validation loss și metricele la sfârșitul fiecărui epocă pe lângă training loss. Dar acuratețea/scorul F1 pe care îl atingeți poate fi puțin diferit față de ceea ce am găsit, datorită inițializării aleatoare a headului modelului, dar ar trebui să nu difere foarte mult.
-
-`Trainerul` va funcționa în mod automat pe mai multe GPU-uri sau TPU-uri și oferă multe opțiuni, cum ar fi mixed-precision training(folosiți `fp16 = True` în argumentele de antrenare). Vom discuta despre toate opțiunile pe care le are în Capitolul 10.
-
-Cu aceasta terminăm introducerea fine-tuningului folosind API-ul `Trainer`. Un exemplu de a face acest lucru pentru majoritatea sarcinilor NLP va fi dat în [Capitolul 7](/course/chapter7), dar pentru moment să vedem cum putem face același lucru doar cu PyTorch.
-
-<Tip>
-
-✏️ **Încearcă!** Fă fine-tune unui model pe datasetul GLUE SST-2, folosind procesarea de date efectuată în secțiunea 2.
-
-</Tip>
diff --git a/chapters/ro/chapter3/3_tf.mdx b/chapters/ro/chapter3/3_tf.mdx
deleted file mode 100644
index 146a4b118..000000000
--- a/chapters/ro/chapter3/3_tf.mdx
+++ /dev/null
@@ -1,206 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Aplicarea fine-tuningului asupra unui model cu Keras[[fine-tuning-a-model-with-keras]]
-
-<CourseFloatingBanner chapter={3}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[ 
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter3/section3_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter3/section3_tf.ipynb"},
-]} />
-
-Odată ce ai finalizat toate operațiile de preprocesare a datelor din ultima secțiune, ai doar câțiva pași rămași pentru a antrena modelul. Însă, observați că `model.fit()` va rula foarte lent pe un CPU. Dacă nu aveți un GPU configurat, puteți accesa GPU-uri sau TPUs pe gratis pe [Google Colab](https://colab.research.google.com/).
-
-Exemplele de cod de mai jos presupun că ați executat deja exemplele din secțiunea precedentă. Aici este o scurtă sumarizare care recapitulează ceea ce trebuie să faceți:
-
-```py
-from datasets import load_dataset
-from transformers import AutoTokenizer, DataCollatorWithPadding
-import numpy as np
-
-raw_datasets = load_dataset("glue", "mrpc")
-checkpoint = "bert-base-uncased"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-
-
-def tokenize_function(example):
-    return tokenizer(example["sentence1"], example["sentence2"], truncation=True)
-
-
-tokenized_datasets = raw_datasets.map(tokenize_function, batched=True)
-
-data_collator = DataCollatorWithPadding(tokenizer=tokenizer, return_tensors="tf")
-
-tf_train_dataset = tokenized_datasets["train"].to_tf_dataset(
-    columns=["attention_mask", "input_ids", "token_type_ids"],
-    label_cols=["labels"],
-    shuffle=True,
-    collate_fn=data_collator,
-    batch_size=8,
-)
-
-tf_validation_dataset = tokenized_datasets["validation"].to_tf_dataset(
-    columns=["attention_mask", "input_ids", "token_type_ids"],
-    label_cols=["labels"],
-    shuffle=False,
-    collate_fn=data_collator,
-    batch_size=8,
-)
-```
-
-
-### Antrenare[[antrenare]]
-
-
-Modelele TensorFlow importate din 🤗 Transformers sunt deja modele Keras. Aici este o scurtă introducere în Keras.
-
-<Youtube id="rnTGBy2ax1c"/>
-
-
-Astfel, odată ce avem datele noastre, putem începe antrenarea lor foarte ușor.
-
-
-<Youtube id="AUozVp78dhk"/>
-
-
-În același mod ca și în [capitolul anterior](/course/chapter2), vom folosi clasa `TFAutoModelForSequenceClassification`, cu două labeluri:
-
-```py
-from transformers import TFAutoModelForSequenceClassification
-
-model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
-```
-
-Veți observa că în comparație cu [Capitolul 2](/course/chapter2), veți primi o avertizare după ce inițializați acest model preantrenat. Acest lucru se datorează faptului că BERT nu a fost antrenat pentru clasificarea perechilor de propoziții, astfel încât headul preantrenat al modelului a fost eliminat și un nou head potrivit pentru clasificarea secvențelor a fost adăugat în locul lui. Avertizările indică faptul că anumite weights nu au fost folosite (cele corespunzătoare headului de preantrenare eliminat) și că altele au fost inițializate aleatoriu (cele pentru noul capăt). Avertizarea se încheie prin încurajarea antrenării modelului, ceea ce este exact ceea ce vom face acum.
-
-
-Pentru a face fine-tune modelului pe datasetul nostru, avem de făcut `compile()` modelului și apoi să trasnmitem datele noastre spre metoda `fit()`. Acest lucru va porni procesul de fine-tuning (care ar trebui să dureze câteva minute pe un GPU) și va raporta training loss, plus validation loss la sfârșitul fiecărei epoci.
-
-<Tip>
-
-Observați că modelele 🤗 Transformers au o abilitate specială care nu este disponibilă pentru cele mai multe modele Keras - ele pot folosi automat un appropriate loss pe care le calculează intern. Ele vor utiliza această pierdere implicit dacă nu veți specifica un argument de pierdere în `compile()`. Pentru a folosi internal loss, va trebui să transmiteți labelurile ca parte din input, și nu ca nu label separat, ceea ce este modul normal de utilizare a labelurilor cu modelele Keras. Veți vedea exemple de acest tip în Partea 2 a cursului, unde definirea funcției de loss corecte poate fi dificilă. În cazul sequence classification, însă, o funcție Keras standard pentru loss se va dovedi suficient, astfel o vom folosi în acest context.
-
-</Tip>
-
-
-```py
-from tensorflow.keras.losses import SparseCategoricalCrossentropy
-
-model.compile(
-    optimizer="adam",
-    loss=SparseCategoricalCrossentropy(from_logits=True),
-    metrics=["accuracy"],
-)
-model.fit(
-    tf_train_dataset,
-    validation_data=tf_validation_dataset,
-)
-```
-
-
-<Tip warning={true}>
-
-Observați un pericol comun aici — puteți transmite doar numele pierderii ca un string în Keras, dar implicit Keras va presupune că deja ați aplicat un softmax la outputurile voastre. Multe modele, însă, produc outputurile direct înainte de aplicarea softmaxului, cunoscute și sub numele de *logit*. Trebuie să spuneți funcției loss că asta este ceea ce produce modelul tău, iar singura modalitate de a face acest lucru este de a-o chema direct, în loc de a o specifica numai cu un string.
-
-</Tip>
-
-### Îmbunătățirea performanței de antrenare
-
-<Youtube id="cpzq6ESSM5c"/>
-
-Dacă încerci codul de mai sus, sigur o să ruleze, dar vei constata că lossul scade doar lent sau doar sporadic. Principala cauză
-este *learning rateul*. Așa cum și lossul, când trimitem către Keras numele unui omptimizer ca uin string, Keras inițiază
-acel optimizer cu valori default pentru toți parametrii, inclusiv learning rateul. Din experiență, însă, știm că
-modelele transformer se bucură de un learning rate mult mai mic decât cel default pentru Adam, care este 1e-3, scris și ca 
-10 la puterea -3 sau 0.001. 5e-5 (0.00005), care este aproximativ douăzeci de ori mai mică, reprezintă o bază mult mai bună.
-
-În plus față de reducerea learning rateului, avem un al doilea truc la dispoziție: putem reduce treptat learning rateul
-pe parcursul antrenării. În documentație, vei găsi uneori această practică denumită *decaying* sau *annealing*
-learning rateul. În Keras, cel mai bun mod de a face acest lucru este să folosim un *learning rate scheduler*. O opțiune bună este
-`PolynomialDecay` — deși numele ar putea sugera altceva, cu setările default, el doar face decay liniar learning rateului din valoarea inițială
-până la valoarea finală pe parcursul antrenării; exact ceea ce ne-am dori. Pentru a utiliza corect un scheduler,
-însă, trebuie să-i spunem cât timp va dura antrenarea. Calculăm acest lucru sub forma `num_train_steps` de mai jos.
-
-```py
-from tensorflow.keras.optimizers.schedules import PolynomialDecay
-
-batch_size = 8
-num_epochs = 3
-# Numărul de pași de antrenare este numărul de sampleuri din dataset, împărțit la dimensiunea batchului și apoi înmulțit
-# cu numărul total de epoci. Observăm că `tf_train_dataset` aici este un batched tf.data.Dataset`,
-# nu datasetul original Hugging Face, astfel încât len() să fie deja num_samples // batch_size.
-num_train_steps = len(tf_train_dataset) * num_epochs
-lr_scheduler = PolynomialDecay(
-    initial_learning_rate=5e-5, end_learning_rate=0.0, decay_steps=num_train_steps
-)
-from tensorflow.keras.optimizers import Adam
-
-opt = Adam(learning_rate=lr_scheduler)
-```
-
-<Tip>
-
-Biblioteca 🤗 Transformers are funcția `create_optimizer()` care va crea un optimizer `AdamW` cu learning rate decay. Aceasta este o metodă convenabilă pe care o veți vedea în detaliu în viitoarele sec'iuni ale cursului.
-
-</Tip>
-
-Acum, avem noul nostru optimizer și putem încerca să antrenăm cu el. Începem cu reloadul modelului pentru a reseta modificările pe weighturole de la ultima rundă de antrenare ;o apoi putem face compile cu noul optimizer:
-
-```py
-import tensorflow as tf
-
-model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
-loss = tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True)
-model.compile(optimizer=opt, loss=loss, metrics=["accuracy"])
-```
-
-Acum putem face fit din nou:
-
-```py
-model.fit(tf_train_dataset, validation_data=tf_validation_dataset, epochs=3)
-```
-
-<Tip>
-
-💡 Dacă doriți să încărcați automat modelul dumneavoastră pe Hub în timpul antrenării, puteți transmite `PushToHubCallback` în metoda `model.fit()`. Mai multe despre acest lucru veți învăța în [Capitol 4](/course/chapter4/3).
-
-</Tip>
-
-### Model prediction
-
-<Youtube id="nx10eh4CoOs"/>
-
-
-Încheierea antrenării și observarea lossului scăzând este foarte frumos, dar ce se întămplă dacă doriți să obțineți efectiv outputuruke din modelul antrenat, fie pentru a calcula câteva metrice, fie pentru utilizarea modelului în producție? Pentru asta putem folosi metoda `predict()`. Aceasta va returna *logits* de la output headul al modelului, câte unul pe clasă.
-
-```py
-preds = model.predict(tf_validation_dataset)["logits"]
-```
-
-Puteți converti aceste logituri în predicțiile clasei modelului prin utilizarea `argmax` pentru a găsi logit-ul cel mai mare, care corespunde clasei celei mai probabile:
-
-```py
-class_preds = np.argmax(preds, axis=1)
-print(preds.shape, class_preds.shape)
-```
-
-```python out
-(408, 2) (408,)
-```
-
-Acum, să folosim aceste `preds` pentru a calcula câteva metrici! Puteți încărca metricele asociate cu datasetul MRPC în același mod cum am încărcat și datasetul, dar de data aceasta cu ajutorul funcției `evaluate.load()`. Obiectul returnat are o metodă de calculare `compute()` pe care o putem utiliza pentru a face metric calculation:
-
-```py
-import evaluate
-
-metric = evaluate.load("glue", "mrpc")
-metric.compute(predictions=class_preds, references=raw_datasets["validation"]["label"])
-```
-
-```python out
-{'accuracy': 0.8578431372549019, 'f1': 0.8996539792387542}
-```
-
-Rezultatele exacte pe care le veți obține pot varia, deoarece inițializarea aleatoare a headului modelului care poate schimba metricele pe care le-a atins. Aici putem vedea că modelul nostru are o precizie de 85.78% în setul de validare și un scor F1 de 89.97. Acestea sunt exact aceleași metrice folosite pentru evaluarea rezultatelor pe datasetul MRPC pentru GLUE benchmark. Tabelul din [BERT Paper](https://arxiv.org/pdf/1810.04805.pdf) a raportat un scor F1 de 88.9 pentru modelul de bază. Acela a fost un `uncased` model, dar noi utilizăm acum un `cased` model, ceea ce explică rezultatul mai bun.
-
-Acesta este punctul unde vă prezentăm introducerea la folosirea fine-tuningului cu ajutorul APIului Keras. Un exemplu bun pentru majoritatea sarcinilor NLP va fi dat în [Capitol 7](/course/chapter7). Dacă doriți să dezvoltați abilitățile dumneavoastră pe API-ul Keras, încercați să faceți fine-tune unui model pe datasetul GLUE SST-2 folosind procesarea de date din secvența 2.
\ No newline at end of file
diff --git a/chapters/ro/chapter3/4.mdx b/chapters/ro/chapter3/4.mdx
deleted file mode 100644
index bfb423625..000000000
--- a/chapters/ro/chapter3/4.mdx
+++ /dev/null
@@ -1,361 +0,0 @@
-# O antrenare completă [[a-full-training]]
-
-<CourseFloatingBanner chapter={3}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[ 
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter3/section4.ipynb"}, 
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter3/section4.ipynb"}, 
-]} />
-
-<Youtube id="Dh9CL8fyG80"/>
-
-Acum vom vedea cum putem atinge același rezultat pe care l-am obținut în secțiune anterioară fără a utiliza clasa `Trainer`. Din nou, noi presupunem că ai procesat datele în secțiunea 2. În continuare, găsiți o scurtă sinteză asupra tuturor informațiilor de care aveți nevoie:
-
-```py
-from datasets import load_dataset
-from transformers import AutoTokenizer, DataCollatorWithPadding
-
-raw_datasets = load_dataset("glue", "mrpc")
-checkpoint = "bert-base-uncased"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-
-
-def tokenize_function(example):
-    return tokenizer(example["sentence1"], example["sentence2"], truncation=True)
-
-
-tokenized_datasets = raw_datasets.map(tokenize_function, batched=True)
-data_collator = DataCollatorWithPadding(tokenizer=tokenizer)
-```
-
-### Pregătirea pentru antrenare[[prepare-for-training]]
-
-Înainte de a scrie propriul nostru loop de antrenament, vom avea nevoie să definim câteva obiecte. Primele dintre ele sunt dataloader-urile pe care le vom utiliza pentru a itera peste batch-uri. Dar înainte de a putea defini aceste datealoader-uri, trebuie să aplicăm o anumită postprocesare pe `tokenized_datasets`, pentru a avea grijă de unele lucruri care au fost automatizate de către `Trainer`. În special:
-
-- Eliminăm coloanele corespunzătoare valorilor pe care modelul nu le așteaptă (ca de exemplu, `sentence1` și `sentence2`).
-- Redenumește coloana `label` în `labels`, deoarece modelul așteaptă argumentul să fie numit `labels`.
-- Setăm formatul dataseturilor astfel încât ele să returneze tensore PyTorch în loc de liste.
-
-Metodele noastre `tokenized_datasets` au fiecare unul dintre acești pași:
-
-```py
-tokenized_datasets = tokenized_datasets.remove_columns(["sentence1", "sentence2", "idx"])
-tokenized_datasets = tokenized_datasets.rename_column("label", "labels")
-tokenized_datasets.set_format("torch")
-tokenized_datasets["train"].column_names
-```
-
-Vom verifica că rezultatul conține doar coloanele pe care vor modelul le acceptă:
-
-```python
-["attention_mask", "input_ids", "labels", "token_type_ids"]
-```
-
-Acum că am făcut asta, putem defini cu ușurință dataloader-urile noastre:
-
-```py
-from torch.utils.data import DataLoader
-
-train_dataloader = DataLoader(
-    tokenized_datasets["train"], shuffle=True, batch_size=8, collate_fn=data_collator
-)
-eval_dataloader = DataLoader(
-    tokenized_datasets["validation"], batch_size=8, collate_fn=data_collator
-)
-```
-
-Pentru a verifica rapid că nu există nici o greșeală în procesarea datelor, putem inspecta un batch-ul astfel:
-
-```py
-for batch in train_dataloader:
-    break
-{k: v.shape for k, v in batch.items()}
-```
-
-```python out
-{'attention_mask': torch.Size([8, 65]),
- 'input_ids': torch.Size([8, 65]),
- 'labels': torch.Size([8]),
- 'token_type_ids': torch.Size([8, 65])}
-```
-
-Observați că shapeurile actuale vor fi probabil ușor diferite pentru tine, deoarece am setat `shuffle=True` pentru dataloader-ul de antrenare și am făcut padding batch-urilor la lungime maximă în interiorul lor.
-
-Acum că am terminat complet procesarea datelor (un obiectiv satisfăcător, dar înșelător pentru orice specialist ML), să trecem la model. Îl inițializăm exact ca în secțiunea precedentă:
-
-```py
-from transformers import AutoModelForSequenceClassification
-
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
-```
-
-Pentru a ne asigura că totul va merge bine în timpul antrenamentului, vom transmite batch-ul nostru modelului acesta:
-
-```py
-outputs = model(**batch)
-print(outputs.loss, outputs.logits.shape)
-```
-
-```python out
-tensor(0.5441, grad_fn=<NllLossBackward>) torch.Size([8, 2])
-```
-
-Toate modelele 🤗 Transformers vor returna lossul atunci când `labels` sunt furnizate și vom primi de asemenea logiturile (două pentru fiecare input în batch-ul nostru, deci un tensor cu dimensiunea 8 x 2).
-
-Suntem aproape gata să scriem loopul nostru de antrenament! Doar că ne lipsesc două lucruri: un optimizer și learning rate scheduler. Deoarece încercăm să replicăm ceea ce a făcut `Trainer` manual, vom folosi aceleași argumente default. Optimizerul utilizat de `Trainer` este `AdamW`, care este similar cu Adam, dar cu un twist pentru weight decay regularization (vedeți ["Decoupled Weight Decay Regularization"](https://arxiv.org/abs/1711.05101) de Ilya Loshchilov și Frank Hutter):
-
-```py
-from transformers import AdamW
-
-optimizer = AdamW(model.parameters(), lr=5e-5)
-```
-
-La final, learning rate schedulerul utilizat este un linear decay de la valoarea maximă (5e-5) la 0. Pentru a-l defini cu adevărat, avem nevoie să cunoaștem numărul de pași de antrenament pe care îi vom face, care este numărul de epoci pe care dorim să le rulăm înmulțit cu numărul de batch-uri de antrenare (care este lungimea dataloader-ului de antrenare). `Trainer` folosește trei epoci ca default, deci vom continua cu asta:
-
-```py
-from transformers import get_scheduler
-
-num_epochs = 3
-num_training_steps = num_epochs * len(train_dataloader)
-lr_scheduler = get_scheduler(
-    "linear",
-    optimizer=optimizer,
-    num_warmup_steps=0,
-    num_training_steps=num_training_steps,
-)
-print(num_training_steps)
-```
-
-```python out
-1377
-```
-
-### Training Loop[[the-training-loop]]
-
-Un ultim lucru: vom dori să folosim un GPU dacă avem acces la unul (pe un CPU, instruirea poate dura câteva ore în loc de câteva minute). Pentru a face acest lucru, definim un `device` pe care vom plasa modelul și batch-urile noastre:
-
-```py
-import torch
-
-device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")
-model.to(device)
-device
-```
-
-```python out
-device(type='cuda')
-```
-
-Suntem acum gata pentru antrenare! Pentru a avea o idee când va fi finalizată antrenarea, adăugăm un progress bar peste numărul nostru de pași de antrenare, folosind biblioteca `tqdm`:
-
-```py
-from tqdm.auto import tqdm
-
-progress_bar = tqdm(range(num_training_steps))
-
-model.train()
-for epoch in range(num_epochs):
-    for batch in train_dataloader:
-        batch = {k: v.to(device) for k, v in batch.items()}
-        outputs = model(**batch)
-        loss = outputs.loss
-        loss.backward()
-
-        optimizer.step()
-        lr_scheduler.step()
-        optimizer.zero_grad()
-        progress_bar.update(1)
-```
-
-Poți să vezi că nucleul loopului de instruire are o formă similară cu cea din introducere. Nu am cerut nicio raportare, deci acest loop de antrenare nu ne va spune nimic despre cum se descurcă modelul. Trebuie să adăugăm un evaluation loop pentru a face acest lucru.
-
-
-### Evaluation Loop[[the-evaluation-loop]]
-
-La fel ca înainte, vom folosi o metrică oferită de librăria 🤗 Evaluate. Am văzut deja metoda `metric.compute()`, dar metricile pot acumula batch-urile pentru noi pe măsură ce mergem peste loopurile de  predicțoie cu metoda `add_batch()`. Când am acumulat toate batch-urile, putem să obținem rezultatul final cu `metric.compute()`. Acesta este modul în care trebuie să implementăm acest lucru într-un loop de evaluare:
-
-```py
-import evaluate
-
-metric = evaluate.load("glue", "mrpc")
-model.eval()
-for batch in eval_dataloader:
-    batch = {k: v.to(device) for k, v in batch.items()}
-    with torch.no_grad():
-        outputs = model(**batch)
-
-    logits = outputs.logits
-    predictions = torch.argmax(logits, dim=-1)
-    metric.add_batch(predictions=predictions, references=batch["labels"])
-
-metric.compute()
-```
-
-```python out
-{'accuracy': 0.8431372549019608, 'f1': 0.8907849829351535}
-```
-
-Rezultatele tale vor fi ușor diferite datorită randomizării în inițializarea headului modelului și a data shuffling, dar ele nu ar trebui să fie foart diferite.
-
-
-<Tip>
-
-✏️ **Încearcă!** Modifica loopul de antrenare dinainte pentru a face fine-tune modelul pe dataset-ul SST-2.
-
-</Tip>
-
-
-### Supercharge Training Loopul cu 🤗 Accelerate[[supercharge-your-training-loop-with-accelerate]]
-
-<Youtube id="s7dy8QRgjJ0" />
-
-Loopul de antrenare pe care l-am definit anterior funcționează bine pe un singur CPU sau GPU. Dar folosind libraria [🤗 Accelerate](https://github.com/huggingface/accelerate), cu câteva ajustări putem activa distributed training pe multiple GPU-uri sau TPU-uri. Începând de la crearea training și validation dataloaders, aceasta este este loopul manual de antrenare:
-
-```py
-from transformers import AdamW, AutoModelForSequenceClassification, get_scheduler
-
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
-optimizer = AdamW(model.parameters(), lr=3e-5)
-
-device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")
-model.to(device)
-
-num_epochs = 3
-num_training_steps = num_epochs * len(train_dataloader)
-lr_scheduler = get_scheduler(
-    "linear",
-    optimizer=optimizer,
-    num_warmup_steps=0,
-    num_training_steps=num_training_steps,
-)
-
-progress_bar = tqdm(range(num_training_steps))
-
-model.train()
-for epoch in range(num_epochs):
-    for batch in train_dataloader:
-        batch = {k: v.to(device) for k, v in batch.items()}
-        outputs = model(**batch)
-        loss = outputs.loss
-        loss.backward()
-
-        optimizer.step()
-        lr_scheduler.step()
-        optimizer.zero_grad()
-        progress_bar.update(1)
-```
-
-Și aici sunt schimbările:
-
-```diff
-+ from accelerate import Accelerator
-  from transformers import AdamW, AutoModelForSequenceClassification, get_scheduler
-
-+ accelerator = Accelerator()
-
-  model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
-  optimizer = AdamW(model.parameters(), lr=3e-5)
-
-- device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")
-- model.to(device)
-
-+ train_dataloader, eval_dataloader, model, optimizer = accelerator.prepare(
-+     train_dataloader, eval_dataloader, model, optimizer
-+ )
-
-  num_epochs = 3
-  num_training_steps = num_epochs * len(train_dataloader)
-  lr_scheduler = get_scheduler(
-      "linear",
-      optimizer=optimizer,
-      num_warmup_steps=0,
-      num_training_steps=num_training_steps
-  )
-
-  progress_bar = tqdm(range(num_training_steps))
-
-  model.train()
-  for epoch in range(num_epochs):
-      for batch in train_dataloader:
--         batch = {k: v.to(device) for k, v in batch.items()}
-          outputs = model(**batch)
-          loss = outputs.loss
--         loss.backward()
-+         accelerator.backward(loss)
-
-          optimizer.step()
-          lr_scheduler.step()
-          optimizer.zero_grad()
-          progress_bar.update(1)
-```
-
-Prima linie de adăugat este importarea librăriei. A doua linie creează un obiect `Accelerator` care va evalua environmentul și va inițializa proper distributed setup. 🤗 Accelerate gestionează automat poziționarea deviceului pentru tine, așa că poți șterge rândurile care pun modelul pe device (sau dacă preferi, poți să le schimbi cu `accelerator.device` în loc de `device`). 
-
-Partea principală a lucrului se face în linia ce trimite dataloader-urile, modelul și optimizerul la `accelerator.prepare()`. Acaeasta va face wrap acestor obiecte în containerul potrivit pentru a asigura o antrenare distribuită corespunzătoare. Ultimele schimbări sunt ștergerea linei cep une batch-ul pe device(din nou, dacă vvrei să lași acest lucru poți să le schimbi cu `accelerator.device`) și schimbarea `loss.backward()` cu `accelerator.backward(loss)`.
-
-<Tip>
-⚠️ Pentru a beneficia de viteza oferită de Cloud TPUs, recomandăm să faceți padding sampleurilor la o lungime fixă folosind argumentele `padding="max_length"` și `max_length` ale tokenizerului.
-</Tip>
-
-Dacă vrei să copiezi codul pentru a-l testa, aici este loopul complet de antrenare cu Accelerate:
-
-```py
-from accelerate import Accelerator
-from transformers import AdamW, AutoModelForSequenceClassification, get_scheduler
-
-accelerator = Accelerator()
-
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
-optimizer = AdamW(model.parameters(), lr=3e-5)
-
-train_dl, eval_dl, model, optimizer = accelerator.prepare(
-    train_dataloader, eval_dataloader, model, optimizer
-)
-
-num_epochs = 3
-num_training_steps = num_epochs * len(train_dl)
-lr_scheduler = get_scheduler(
-    "linear",
-    optimizer=optimizer,
-    num_warmup_steps=0,
-    num_training_steps=num_training_steps,
-)
-
-progress_bar = tqdm(range(num_training_steps))
-
-model.train()
-for epoch in range(num_epochs):
-    for batch in train_dl:
-        outputs = model(**batch)
-        loss = outputs.loss
-        accelerator.backward(loss)
-
-        optimizer.step()
-        lr_scheduler.step()
-        optimizer.zero_grad()
-        progress_bar.update(1)
-```
-
-Scriind în `train.py` aceste modificări, vor face scriptul executabil pe orice tip de distributed setup. Pentru a testa codul în mediul tău distribuit, rulează următoarea comandă:
-
-```bash
-accelerate config
-```
-
-Ceea ce îți va oferi să răspunzi la o serie de întrebări și să salvezi răspunsurile într-un fișier de configurare folosit de acest modul: 
-
-```bash
-accelerate launch train.py
-```
-
-Această comandă va lansa loopul de antrenare pe dispozitivele distribuite.
-
-Dacă doriți să încercați acest lucru într-un Jupyter Notebook (de exemplu, pentru a testa TPU-urile de pe Colab), înlocuiți codul cu următoarea funcție:
-
-```python
-from accelerate import notebook_launcher
-
-notebook_launcher(training_function)
-```
-
-Pentru mai multe exemple consultați [repo-ul 🤗 Accelerate](https://github.com/huggingface/accelerate/tree/main/examples).
\ No newline at end of file
diff --git a/chapters/ro/chapter3/5.mdx b/chapters/ro/chapter3/5.mdx
deleted file mode 100644
index 63d1f159a..000000000
--- a/chapters/ro/chapter3/5.mdx
+++ /dev/null
@@ -1,26 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Fine-tuning, Check![[fine-tuning-check]]
-
-<CourseFloatingBanner
-    chapter={3}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-
-A fost distractiv! În primele două capitole ai învățat despre modele și tokenizeri, iar acum știi cum să aplici fine-tune pentru datele proprii. Pentru a rezuma, în acest capitol tu:
-
-{#if fw === 'pt'}
-* Ai învățat despre dataseturi din [Hub](https://huggingface.co/datasets)
-* Ai învățat cum să încarci și să preprocesezi dataseturi, inclusiv folosind dynamic padding și collators
-* Ai implementat fine-tuningul și evaluarea unui model
-* Ai implementat un training loop la nivel de bază
-* Ai utilizat 🤗 Accelerate pentru a adapta ușor training loopul astfel încât să funcționeze cu mai multe GPU-uri sau TPU-uri
-
-{:else}
-* Ai învățat despre dataseturi din [Hub](https://huggingface.co/datasets)
-* Ai învățat cum să încarci și să preprocesezi dataseturi
-* Ai învățat cum să faci fine-tune și să evaluezi un model cu Keras
-* Ai implementat o metrică personalizată
-
-{/if}
\ No newline at end of file
diff --git a/chapters/ro/chapter3/6.mdx b/chapters/ro/chapter3/6.mdx
deleted file mode 100644
index 9ceeea782..000000000
--- a/chapters/ro/chapter3/6.mdx
+++ /dev/null
@@ -1,301 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-<!-- DISABLE-FRONTMATTER-SECTIONS
-
-# Quiz pentru finalizarea capitolului[[end-of-chapter-quiz]]
-
-<CourseFloatingBanner
-    chapter={3}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-Testează ce ai învățat în acest capitol!
-
-### 1. Datasetul `emotion` conține mesaje de pe Twitter cu labeluri cu emoții. Căutați-l în [Hub](https://huggingface.co/datasets) și citiți card-ul datasetului. Care dintre acestea nu este una dintre emoțiile sale de bază?
-
-<Question
-	choices={[
-		{
-			text: "Fericire",
-			explain: "Încercă din nou — emoția asta este prezentă în acest dataset!"
-		},
-		{
-			text: "Iubire",
-			explain: "Încercă din nou — emoția asta este prezentă în acest dataset!"
-		},
-		{
-			text: "Confuzie",
-			explain: "Corect! Confuzia nu este una dintre cele șase emoții de bază.",
-            correct: true
-		},
-        {
-			text: "Suprpiză",
-			explain: "Supriză! Încearcă din nou!"
-		}
-	]}
-/>
-
-### 2. Căutați datasetul `ar_sarcasm` în [Hub](https://huggingface.co/datasets). Care este sarcina pe care o sprijină?
-
-<Question
-	choices={[
-		{
-			text: "Clasificarea sentimentului",
-			explain: "Acesta este corect! Poți să știi grație etichetelor.",
-            correct: true
-		},
-		{
-			text: "Machine Translation",
-			explain: "Acesta nu este corect — încercați din nou, în funcție de cardul datasetului <a href='https://huggingface.co/datasets/ar_sarcasm'>ar_sarcasm</a>!"
-		},
-		{
-			text: "Reconstrucția entităților numite",
-			explain: "Acesta nu este corect — încercați din nou, în funcție de cardul datasetului <a href='https://huggingface.co/datasets/ar_sarcasm'>ar_sarcasm</a>!"
-		},
-        {
-			text: "Răspunsul întrebării",
-			explain: "Nesatisfăcător — încercați din nou!"
-		}
-	]}
-/>
-
-### 3. Cum se așteaptă modelul BERT ca o pereche de propoziții să fie procesate?
-
-<Question
-	choices={[
-		{
-			text: "Tokens_of_sentence_1 [SEP] Tokens_of_sentence_2",
-			explain: "Este necesară un token special <code>[SEP]</code> pentru a separa cele două propoziții, dar nu e doar asta!"
-		},
-		{
-			text: "[CLS] Tokens_of_sentence_1 Tokens_of_sentence_2",
-			explain:"Este necesară un token special <code>[CLS]</code> pentru a separa cele două propoziții, dar nu e doar asta!
-		},
-		{
-			text: "[CLS] Tokens_of_sentence_1 [SEP] Tokens_of_sentence_2 [SEP]",
-			explain: "Acesta este corect!",
-            correct: true
-		},
-        {
-			text: "[CLS] Token-urile propoziției_1 [SEP] Token-urile propoziției_2",
-			explain: "Este necesar un token special <code>[CLS]</code> la head, precum și un token special <code>[SEP]</code> pentru a separa cele două propoziții, dar nu e doar asta!"
-		}
-	]}
-/>
-
-{#if fw === 'pt'}
-### 4. Care sunt beneficiile metodei `Dataset.map()`?
-
-<Question
-	choices={[
-		{
-			text: "Rezultatele funcției sunt cached, deci nu va lua timp dacă re-executăm codul.",
-			explain: "Acest lucru este efectiv unul dintre beneficiile sale! Nu e doar asta...",
-            correct: true
-		},
-		{
-			text: "Se aplică multiprocessing pentru a merge mai rapid decât aplicarea funcției la fiecare element al datasetului.",
-			explain: "Acest lucru este efectiv o caracteristică specială a acestei metode, dar nu e doar asta...",
-            correct: true
-		},
-		{
-			text: "Nu încarcă întregul datasetul în memorie și salvează rezultatele la fiecare element procesat.",
-			explain: "Acest lucru este un avantaj al acestei metode. Există și altele...",
-            correct: true
-		},
-	]}
-/>
-
-### 5. Ce înseamnă "dynamic padding"?
-
-<Question
-	alegeri={[  
-		{
-			text: "Dynamic padding este atunci când faci padding inputurilor pentru fiecare batch la lungimea maximă din întregul dataset.",
-			explain: "Acest lucru implică paddingul, dar nu la lungimea maximă a întregului dataset."
-		},
-		{
-			text: "Dynamic padding este atunci când faci padding inputurilor pentru fiecare batch, la lungimea maximă a propozițiilor din acel batch.",
-			explain: "Este corect! Partea \"dynamic\" vine din faptul că dimensiunea fiecărui batch este determinată la momentul creării lui, iar toate batch-urile pot avea shape-uri diferite ca rezultat.",
-            correct: true
-		},
-		{
-			text: "Dynamic padding este atunci când faci padding inputurilor pentru ca fiecare propoziție să aibă același număr de tokenuri ca în precedentul dataset.",
-			explain: "Este greșit, și nu are nici un sens să ne uităm la ordinea din dataset, deoarece îl amestecăm în timpul antrenării."
-		},
-	]}
-/>
-
-### 6. Care este scopul unei funcții collate?
-
-<Question
-	alegeri={[  
-		{
-			text: "Asigură că toate secvențele din dataset au aceeași lungime.",
-			explain: "O funcție collate este implicată în gestionarea a câte unui batch, nu întregului dataset. De asemenea, vorbim despre funcții generice, nu <code>DataCollatorWithPadding</code> specific."
-		},
-		{
-			text: "Adună toate sampleurile dintr-un batch.",
-			explain: "Corect! Poți să dai ca argument o funcție collate în constructorul unui <code>DataLoader</code>. Am folosit funcția <code>DataCollatorWithPadding</code>, care face padding tuturor elementelor dintr-un batch, astfel încât ele să aibă aceeași lungime.",
-            correct: true
-		},
-		{
-			text: "Preprocesează întregul dataset.",
-			explain: "Acest lucru ar fi o funcție de preprocesare, nu una collate."
-		},
-        {
-			text: "Taie secvențele din dataset.",
-			explain: "O funcție collate este implicată în gestionarea a câte un batch, nu întregului dataset. Dacă ești interesat în tăierea acestora, poți utiliza argumentul <code>truncate</code> al unui <code>tokenizer</code>."
-		}
-	]}
-/>
-
-### 7. Ce se întâmplă când inițializezi una dintre clasele `AutoModelForXxx` cu un pretrained language model (ca <code>bert-base-uncased</code>) care corespunde unei alte sarcini decât aceea pentru care a fost antrenat?
-
-<Question
-	alegeri={[  
-		{
-			text: "Nimic, dar se afișează un warning.",
-			explain: "Se afișează un warning, dar asta nu este totul!"
-		},
-		{
-			text: "Headul modelului preantrenat al modelului este înlăturat și înlocuit cu un head nou potrivit pentru sarcină.",
-			explain: "Corect. De exemplu, atunci când am folosit <code>AutoModelForSequenceClassification</code> cu <code>bert-base-uncased</code>, am primit warningul la momentul inițializării modelului. Headul preantrenat nu este folosit pentru sarcina de clasificare a secvențelor, astfel încât el este înlăturat și înlocuit cu un head nou, cu weights aleatorii.",
-            correct: true
-		},
-		{
-			text: "Headul modelului preantrenat este înlăturat.",
-			explain: "Trebuie să se întâmple încă ceva. Încearcă din nou!"
-		},
-        {
-			text: "Nimic, deoarece modelul poate avea fine-tuning pentru o sarcina diferită.",
-			explain: "Headul preantrenat al modelului nu a fost antrenat să rezolve această sarcină, astfel încât el trebuie înlăturat."
-		}
-	]}
-/>
-
-### 8. Care este scopul la `TrainingArguments`?
-
-<Question
-	alegeri={[  
-		{
-			text: "Conține toți hyperparametrii utilizați pentru antrenare și evaluare cu <code>Trainer</code>.",
-			explain: "Corect!",
-            correct: true
-		},
-		{
-			text: "Specifică dimensiunea modelului.",
-			explain: "Dimensiunea modelului este definită de configurația modelului, nu clasa <code>TrainingArguments</code>. "
-		},
-		{
-			text: "Conține doar hyperparametrii utilizați pentru evaluare.",
-			explain: "În exemplul nostru, am specificat unde se va salva modelul și toate checkpoint-urile. Încearcă din nou!"
-		},
-        {
-			text: "Conține doar hyperparametrii utilizați pentru antrenare.",
-			explain: "În exemplul nostru, am folosit un <code>evaluation_strategy</code>, astfel încât acest lucru afectează și evaluarea. Încearcă din nou!"
-		}
-	]}
-/>
-
-### 9. De ce ar trebui să folosim biblioteca 🤗 Accelerate?
-
-<Question
-	alegeri={[  
-		{
-			text: "Ofereă acces la modele mai rapide.",
-			explain: "Nu, biblioteca 🤗 Accelerate nu oferă nici un model."
-		},
-		{
-			text: "Oferă un API de nivel înalt astfel încât să nu trebuiască să implementăm singuri un training loop.",
-			explain: "Acest lucru este ceea ce am făcut cu <code>Trainer</code>, nu biblioteca 🤗 Accelerate. Încearcă din nou!"
-		},
-		{
-			text: "Face ca loopurile de antrenare să funcționeze pe distributed strategies.",
-			explain: "Corect! Cu 🤗 Accelerate, loopurile de antrenare vor funcționa pentru multiple GPU-uri și TPU-uri.",
-            correct: true
-		},
-        {
-			text: "Oferă mai multe funcții de optimizare.",
-			explain: "Nu, biblioteca 🤗 Accelerate nu oferă nici o funcțiune de optimizare."
-		}
-	]}
-/>
-
-{:else}
-### 4. Ce se întâmplă când inițializezi una dintre clasele `TFAutoModelForXxx` cu un pretrained language model (ca <code>bert-base-uncased</code>) care corespunde unei alte sarcini decât aceea pentru care a fost antrenat?
-
-<Question
-	alegeri={[  
-		{
-			text: "Nimic, dar se afișează un warning.",
-			explain: "Se afișează un warning, dar asta nu este totul!"
-		},
-		{
-			text: "Headul preantrenat al modelului este înlăturat și înlocuit cu un head nou potrivit pentru sarcină.",
-			explain: "Corect. De exemplu, atunci când am folosit <code>TFAutoModelForSequenceClassification</code> cu <code>bert-base-uncased</code>, am primit warningul la momentul inițializării modelului. Headul preantrenat nu este folosit pentru sarcina de clasificare a secvențelor, astfel încât el este înlăturat și înlocuit cu un head nou, cu weights aleatorii.",
-            correct: true
-		},
-		{
-			text: "Headul preantrenat al modelului este înlăturat.",
-			explain: "Trebuie să se întâmple ceva mai mult. Încercă din nou!"
-		},
-        {
-			text: "Nimic, deoarece modelul poate fi reantrenat pentru o sarcina diferită.",
-			explain: "Headul prentrenat al modelului nu a fost antrenat să rezolve această sarcină, astfel încât el trebuie înlăturat."
-		}
-	]}
-/>
-
-### 5. Modelele TensorFlow din `transformers` sunt deja modele Keras. Ce beneficiu oferă acest lucru?
-
-<Question
-	alegeri={[  
-		{
-			text: "Modelele funcționează pe un TPU direct.",
-			explain: "Ești aproape, dar sunt necesare mici schimbări. De exemplu, trebuie să rulezi totul într-un <code>TPUStrategy</code> scop, inclusiv inițializarea modelului."
-		},
-		{
-			text: "Poți folosi metode existente precum <code>compile()</code>, <code>fit()</code>, și <code>predict()</code>.",
-			explain: "Corect! Odată ce ai datele, antrenarea pe acestea necesită foarte puțin lucru.",
-            correct: true
-		},
-		{
-			text: "Poți învăța și Keras precum și Transformers.",
-			explain: "Corect, dar căutăm altceva. :)",
-			correct: true
-		},
-        {
-			text: "Poți calcula ușor metrice legate de dataset.",
-			explain: "Keras ne ajută cu antrenarea și evaluarea modelului, dar nu calculează metrice legate de dataset."
-		}
-	]}
-/>
-
-### 6. Cum poți defini o metrică personalizată?
-
-<Question
-	alegeri={[  
-		{
-			text: "Prin subclassing pe <code>tf.keras.metrics.Metric</code>.",
-			explain: "Excelent!",
-			correct: true
-		},
-		{
-			text: "Folosind API-ul Keras.",
-			explain: "Încercă din nou!"
-		},
-		{
-			text: "Prin intermediul callable cu semnatura <code>metric_fn(y_true, y_pred)</code>.",
-			explain: "Corect!",
-			correct: true
-		},
-        {
-			text: "Prin căutarea pe Google.",
-			explain: "Acest lucru nu este răspunsul pe care îl căutăm, dar ar trebui să te ajute să-l găsești.",
-            correct: true
-		}
-	]}
-/>
-
-{/if}
\ No newline at end of file
diff --git a/chapters/ro/chapter4/1.mdx b/chapters/ro/chapter4/1.mdx
deleted file mode 100644
index 4ef56abf4..000000000
--- a/chapters/ro/chapter4/1.mdx
+++ /dev/null
@@ -1,22 +0,0 @@
-# Platforma Hugging Face Hub[[the-hugging-face-hub]]
-
-<CourseFloatingBanner
-    chapter={4}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-Platforma [Hugging Face Hub](https://huggingface.co/) –- site-ul nostru principal –- reprezintă o platformă care permite oricărui utilizator să descopere, utilizeze și contribuie la noi modele și dataseturi. Acesta găzduiește o varietate vastă de modele, cu peste 10.000 disponibile public. Ne vom concentra discuția asupra modelelor în acest capitol, iar pentru dataseturi vom vorbi în Capitolul 5.
-
-Modelele din Hub nu sunt limitate la 🤗 Transformers sau chiar și NLP. Există și alte modele, cum ar fi cele de la [Flair](https://github.com/flairNLP/flair) și [AllenNLP](https://github.com/allenai/allennlp) pentru NLP, [Asteroid](https://github.com/asteroid-team/asteroid) și [pyannote](https://github.com/pyannote/pyannote-audio) pentru speech, precum și cele de la [timm](https://github.com/rwightman/pytorch-image-models) pentru vision, doar să menționăm câteva.
-
-Fiecare dintre aceste modele este găzduit ca un repository Git, ceea ce permite crearea versiunilor și reproducerea acestuia. Oferirea modelului pe Hub înseamnă deschiderea sa comunității, făcându-l accesibil oricărui utilizator care dorește să îl utilizeze cu ușurință, eliminând astfel nevoia de a-și antrena propriul model și simplificând utilizarea acestora. 
-
-În plus, oferirea unui model pe Hub face deploy automat la un Inference API pentru acel model. Orice membru al comunității poate testa direct pe pagina modelului cu inputuri personalizate și widget-uri corespunzătoare.
-
-Cel mai bun lucru este că oferirea și utilizarea oricărui model public pe Hub este complet gratuit! Existează și [planuri plătite](https://huggingface.co/pricing) dacă doriți să oferiți modele în privat.
-
-Video-ul de mai jos arată modul în care puteți naviga prin Hub.
-
-<Youtube id="XvSGPZFEjDY"/>
-
-Crearea unui cont huggingface.co este necesară pentru a continua această parte, deoarece vom crea și gestiona repositorii pe Platforma Hugging Face Hub: [creați un cont](https://huggingface.co/join)
\ No newline at end of file
diff --git a/chapters/ro/chapter4/2.mdx b/chapters/ro/chapter4/2.mdx
deleted file mode 100644
index bbe94669b..000000000
--- a/chapters/ro/chapter4/2.mdx
+++ /dev/null
@@ -1,98 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Utilizarea modelelor preantrenate[[using-pretrained-models]]
-
-{#if fw === 'pt'}
- 
-<CourseFloatingBanner chapter={4}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter4/section2_pt.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter4/section2_pt.ipynb"},
-]} />
-
-{:else}
-
-<CourseFloatingBanner chapter={4}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter4/section2_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter4/section2_tf.ipynb"},
-]} />
-
-{/if}
-
-Hubul Model oferă o modalitate simplă de a selecta modelul adecvat, astfel încât utilizarea sa în orice bibliotecă downstream poate fi efectuată în câteva linii de cod. Să vedem cum se utilizează efectiv unul dintre aceste modele și cum putem contribui înapoi la comunitate.
-
-
-Să presupunem că noi căutăm un French-based model ce poate face mask filling.
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/camembert.gif" alt="Selecting the Camembert model." width="80%"/>
-</div>
-
-Alegem checkpointul „camembert-base” pentru al încerca. Identificatorul `camembert-base` este tot de ce avem nevoie pentru a începe. În capitolele precedente, am văzut cum putem inițializa modelul folosind funcția `pipeline()`:
-
-```py
-from transformers import pipeline
-
-camembert_fill_mask = pipeline("fill-mask", model="camembert-base")
-results = camembert_fill_mask("Le camembert est <mask> :)")
-```
-
-```python out
-[
-  {'sequence': 'Le camembert est délicieux :)', 'score': 0.49091005325317383, 'token': 7200, 'token_str': 'délicieux'}, 
-  {'sequence': 'Le camembert est excellent :)', 'score': 0.1055697426199913, 'token': 2183, 'token_str': 'excellent'}, 
-  {'sequence': 'Le camembert est succulent :)', 'score': 0.03453313186764717, 'token': 26202, 'token_str': 'succulent'}, 
-  {'sequence': 'Le camembert est meilleur :)', 'score': 0.0330314114689827, 'token': 528, 'token_str': 'meilleur'}, 
-  {'sequence': 'Le camembert est parfait :)', 'score': 0.03007650189101696, 'token': 1654, 'token_str': 'parfait'}
-]
-```
-
-În mod evident, încărcarea unui model într-un pipeline este extrem de simplu. Singurul lucru la care trebuie să atrageți atenția este că checkpointul ales este adecvat pentru sarcina pe care urmează să o execute. De exemplu, în momentul în care încărăm checkpoint-ul „camembert-base” în pipelineul `fill-mask`, este perfect în regulă. Dar dacă îl încărcam în pipelineul `text-classification`, rezultatele nu vor avea nici o logică, pentru că headul „camembert-base” nu este adecvat pentru această sarcină! Recomandăm utilizarea task selectorului în interfața Hugging Face în scopul selectării checkpointurilor adecvate:
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/tasks.png" alt="Selectorul de sarcini pe interfața web." width="80%"/>
-</div>
-
-Puteți inițializa checkpointul în mod direct folosind arhitectura modelului:
-
-{#if fw === 'pt'}
-```py
-from transformers import CamembertTokenizer, CamembertForMaskedLM
-
-tokenizer = CamembertTokenizer.from_pretrained("camembert-base")
-model = CamembertForMaskedLM.from_pretrained("camembert-base")
-```
-
-Însă, recomandăm utilizarea [claselor `Auto*`](https://huggingface.co/transformers/model_doc/auto?highlight=auto#auto-classes), deoarece acestea sunt proiectate să fie architecture-agnostic. În timp ce codul precedent limita utilizatorii la checkpoints loadable în CamemBERT architecture, utilizarea claselor `Auto*` face schimbarea checkpointurilor simplă:
-
-```py
-from transformers import AutoTokenizer, AutoModelForMaskedLM
-
-tokenizer = AutoTokenizer.from_pretrained("camembert-base")
-model = AutoModelForMaskedLM.from_pretrained("camembert-base")
-```
-{:else}
-```py
-from transformers import CamembertTokenizer, TFCamembertForMaskedLM
-
-tokenizer = CamembertTokenizer.from_pretrained("camembert-base")
-model = TFCamembertForMaskedLM.from_pretrained("camembert-base")
-```
-
-Însă, recomandăm utilizarea [claselor `TFAuto*`](https://huggingface.co/transformers/model_doc/auto?highlight=auto#auto-classes), deoarece acestea sunt proiectate să fie architecture-agnostic. În timp ce codul precedent limita utilizatorii la checkpoints loadable în CamemBERT architecture, utilizarea claselor `TFAuto*` face schimbarea checkpointurilor simplă:
-
-```py
-from transformers import AutoTokenizer, TFAutoModelForMaskedLM
-
-tokenizer = AutoTokenizer.from_pretrained("camembert-base")
-model = TFAutoModelForMaskedLM.from_pretrained("camembert-base")
-```
-{/if}
-
-<Tip>
-În momentul în care folosiți un model preantrenat, asigurați-vă să verificați cum a fost antrenat și pe ce date se bazează. De asemenea, trebuie să cunoasceți limitele și prejudecățile sale. Toată această informație va fi indicată pe cartea modelului.
-</Tip>
-
diff --git a/chapters/ro/chapter4/3.mdx b/chapters/ro/chapter4/3.mdx
deleted file mode 100644
index dda42f45e..000000000
--- a/chapters/ro/chapter4/3.mdx
+++ /dev/null
@@ -1,641 +0,0 @@
-
-**Capitolul 4**
-
-<FrameworkSwitchCourse {fw} />
-
-# Partajarea modelelor preantrenate [[sharing-pretrained-models]]
-
-{#if fw === 'pt'}
-
-<CourseFloatingBanner chapter={4}
-classNames="absolute z-10 right-0 top-0"
-notebooks={[ 
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter4/section3_pt.ipynb"}, 
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter4/section3_pt.ipynb"},
-]} />
-
-{:else}
-
-<CourseFloatingBanner chapter={4}
-classNames="absolute z-10 right-0 top-0"
-notebooks={[ 
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter4/section3_tf.ipynb"}, 
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter4/section3_tf.ipynb"},
-]} />
-
-{/if}
-
-În următoarele etape, vom explora modalitățile cele mai ușoare de a partaja modelele preantrenate pe 🤗 Hub. Există tooluri și utilities disponibile care fac posibilă partajarea și actualizarea modelelor direct pe Hub, despre care vom vorbi mai jos.
-
-<Youtube id="9yY3RB_GSPM"/>
-
-Recomandăm tuturor utilizatorilor care antrenează modele să contribuie prin partajarea lor cu comunitatea - partajarea modelelor, chiar și atunci când sunt antrenate pe dateseturi foarte specifice, va ajuta la economising timpul altor utilizatori și resurselor și va oferi acces la trained artifcats folositoare. În schimb, puteți beneficia de munca altora!
-
-Există trei moduri de a crea noi repositorii cu modele:
-
-- Utilizând API-ul `push_to_hub`
-- Utilizând biblioteca Python `huggingface_hub`
-- Utilizând interfața web
-
-Odată ce aveți creat un repository, puteți încărca fișiere în el folosind git și git-lfs. Vom trece împreună prin crearea model repositories și încărcarea fișierelor în el în următoarele secțiuni.
-
-## Utilizând API-ul `push_to_hub`[[using-the-pushtohub-api]]
-
-{#if fw === 'pt'}
-
-<Youtube id="Zh0FfmVrKX0"/>
-
-{:else}
-
-<Youtube id="pUh5cGmNV8Y"/>
-
-{/if}
-
-Cea mai simplă modalitate de a încărca fișiere pe Hub este utilizând API-ul `push_to_hub`.
-
-Înainte de a continua, aveți nevoie să creați un token de autentificare astfel încât API-ul `huggingface_hub` să știe cine sunteți și care sunt namespaces la care aveți acces de scriere. Asigurați-vă că sunteți într-un environment unde aveți instalat `transformers` (vedeti [Configurarea](/course/chapter0)). Dacă sunteți într-un notebook, puteți folosi următoarea funcție pentru a vă autentifica:
-
-```python
-from huggingface_hub import notebook_login
-
-notebook_login()
-```
-
-În terminal, puteți rula următoarea comandă:
-
-```bash
-huggingface-cli login
-```
-
-În ambele cazuri, veți fi rugați să introduceți numele utilizatorului și parola, care sunt aceleași cu cele folosite la autentificare pe Hub. Dacă nu aveți încă un profil pe Hub, vă rugăm să creați unul [aici](https://huggingface.co/join).
-
-Excelent! Acum aveți tokenul de autentificare stocat în folder-ul cache. Vom crea acum niște repositorii!
-
-{#if fw === 'pt'}
-
-Dacă ați lucrat cu API-ul `Trainer` pentru a antrena un model, cea mai ușoară modalitate de a o încărca pe Hub este să setați `push_to_hub=True` când definiți `TrainingArguments`:
-
-```py
-from transformers import TrainingArguments
-
-training_args = TrainingArguments(
-    "bert-finetuned-mrpc", save_strategy="epoch", push_to_hub=True
-)
-```
-
-Când chemați `trainer.train()`, `Trainer` va încărca modelul pe Hub de fiecare dată când este salvat (aici, la fiecare epocă) într-un repository namespaceul tău. Acest repository va fi numit după outpul directory-ul ales (aici `bert-finetuned-mrpc`), dar puteți alege un alt nume cu `hub_model_id = "un_nume_diferit"`.
-
-Pentru a încărca modelul într-o organizație din care faceți parte, este suficient să introduceți aceasta în `hub_model_id = "organizația_mea/numele_repositoriului"`.
-
-Odată ce antrenarea s-a terminat, trebuie să faceți `trainer.push_to_hub()` pentru a încărca ultima versiune a modelului. Acesta va genera apoi un model card cu toate informațiile relevante, inclusiv metadatele despre hyperparametrii utilizați și rezultatele evaluării! Aici este exemplul unui astfel de model card:
-
-<div class="flex justify-center">
-  <img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/model_card.png" alt="Un exemplu de un card auto-generat." width="100%"/>
-</div>
-
-{:else}
-
-Dacă utilizați Keras pentru a antrena modelul dumneavoastră, cea mai ușoară modalitate de a încărca-o pe Hub este să transmiteți un `PushToHubCallback` când chemați `model.fit()`:
-
-```py
-from transformers import PushToHubCallback
-
-callback = PushToHubCallback(
-    "bert-finetuned-mrpc", save_strategy="epoch", tokenizer=tokenizer
-)
-```
-
-Apoi, adăugați `callbacks=[callback]` în apelul la `model.fit()`. Callback-ul va încărca apoi modelul pe Hub de fiecare dată când se salvează(aici, la fiecare epocă) într-un repository din namespaceul tău. Acest repository va fi numit după output directory ales (aici `bert-finetuned-mrpc`), dar puteți alege un alt nume cu `hub_model_id = "un_nume_diferit"`.
-
-Pentru a încărca modelul într-o organizație din care faceți parte, este suficient să introduceți aceasta în `hub_model_id = "organizația_mea/numele_repositoriului"`.
-
-{/if}
-
-La un nivel inferior, accesarea Hub-ului se poate face direct pe modele, tokenizers și configurations objects prin metoda `push_to_hub()`. Această metodă se ocupă atât de crearea repositoriului cât si de încărcarea modelului și tokenizerului direct în el. Nu este nevoie de o interacțiune manuală, precum fața de API-ul pe care îl vom vedea mai jos.
-
-Pentru a înțelege cum funcționează, luați în considerare inițializarea unui model și a unui tokenizer:
-
-{#if fw === 'pt'}
-```py
-from transformers import AutoModelForMaskedLM, AutoTokenizer
-
-checkpoint = "camembert-base"
-
-model = AutoModelForMaskedLM.from_pretrained(checkpoint)
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-```
-{:else}
-```py
-from transformers import TFAutoModelForMaskedLM, AutoTokenizer
-
-checkpoint = "camembert-base"
-
-model = TFAutoModelForMaskedLM.from_pretrained(checkpoint)
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-```
-{/if}
-
-Sunteți liberi să faceți orice ați vrea cu acestea - adăugați tokens la tokenizer, antrenați modelul sau faceți fine-tune. Odată ce sunteți mulțumiți de modelul obținut, weighturile și tokenizerul acestuia , puteți folosi metoda `push_to_hub()` disponibilă direct pe obiectul `model`:
-
-```py
-model.push_to_hub("dummy-model")
-```
-Acest lucru va crea un nou repository `dummy-model` în profilul tău și o va popula cu fișierele modelului tău.
-Încercați același lucru cu tokenizerul, astfel încât toate fișierele să fie acum disponibile în acest repository:
-
-```py
-tokenizer.push_to_hub("dummy-model")
-```
-
-Dacă apartineți unei organizații, specificați doar argumentul `organization` pentru a încărca în namespaceul acestei organizații:
-
-```py
-tokenizer.push_to_hub("dummy-model", organization="huggingface")
-```
-
-Dacă doriți să utilizați un anumit token Hugging Face, sunteți liberi să specificați acest lucru metodei `push_to_hub()`:
-
-```py
-tokenizer.push_to_hub("dummy-model", organization="huggingface", use_auth_token="<TOKEN>")
-```
-
-Acum, mergeți la Model Hub pentru a găsi modelul încărcat: *https://huggingface.co/user-or-organization/dummy-model*.
-
-Apăsați pe tabul "Files and versions", iar acum ar trebui să vedeți fișierele vizibile în următorul screenshot:
-
-{#if fw === 'pt'}
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/push_to_hub_dummy_model.png" alt="Dummy model containing both the tokenizer and model files." width="80%"/>
-</div>
-{:else}
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/push_to_hub_dummy_model_tf.png" alt="Dummy model containing both the tokenizer and model files." width="80%"/>
-</div>
-{/if}
-
-<Tip>
-
-✏️ **Încercați!** Luați modelul și tokenizerul asociat cu checkpointul `bert-base-cased` și încărcați-l pe un repo în namespaceul tău folosind metoda `push_to_hub()`. Verificați că repo-ul apare  în pagina dumneavoastră înainte de a-l șterge.
-
-</Tip>
-
-Ați văzut că metoda `push_to_hub()` acceptă mai multe argumente, ceea ce permite încărcarea într-un repository specific sau namespace al unei organizații, sau utilizarea unui token API diferit. Vă recomandăm să vă uitați la specificația metodei disponibilă direct în [documentația 🤗 Transformers](https://huggingface.co/transformers/model_sharing) pentru a înțelge ceea ce este posibil.
-
-Metoda `push_to_hub()` este backed de packageul Python [`huggingface_hub`](https://github.com/huggingface/huggingface_hub), care oferă un API direct la Hub-ul Hugging Face. Acesta este integrat în 🤗 Transformers și în mai multe biblioteci pentru machine learning, ca de exemplu [`allenlp`](https://github.com/allenai/allennlp). Deși ne concentrăm pe integrarea în 🤗 Transformers în acest capitol, integrarea sa în propriul dumneavoastră cod sau bibliotecă este simplu.
-
-Întoarceți-vă la secțiune precedentă pentru a vedea cum să încărcați fișierele în noul repository-ul creat!
-
-## Utilizarea bibliotecii Python `huggingface_hub`
-
-Biblioteca Python `huggingface_hub` este un package care oferă un set de instrumente pentru model și datasets hubs. Oferă metode simple și clase pentru sarcini comune ca:
-Obținerea informațiilor despre repositorii pe hub și gestionarea lor. Ofere API-uri simple care lucrează pe lângă Git pentru a gestiona conținutul acestor repositorii și integrarea Hub-ului
-în proiectele și bibliotecile tale.
-
-Similar cu utilizarea API-ului `push_to_hub`, asta va necesita un token de autentificare salvat în cache. Pentru a face acest lucru, veți avea nevoie să folosiți comanda `login` din CLI, cum am menționat în secțiunea anterioară (din nou, asigurați-vă prefixați această comandă cu simbolul `!` dacă rulați în Google Colab):
-
-```bash
-huggingface-cli login
-```
-
-Packageul `huggingface_hub` oferă mai multe metode și clase utile pentru noi. În primul rând, există câteva metode pentru crearea, ștergerea și gestionarea repositoriilor:
-
-```python no-format
-from huggingface_hub import (
-    # Gestionarea utilizatorilor
-    login,
-    logout,
-    whoami,
-
-    # Crearea și gestionarea repositoriilor
-    create_repo,
-    delete_repo,
-    update_repo_visibility,
-
-    # Și câteva metode pentru a obține/schimba informațiile despre conținut
-    list_models,
-    list_datasets,
-    list_metrics,
-    list_repo_files,
-    upload_file,
-    delete_file,
-)
-```
-
-De asemenea, el oferă clasa `Repository` pentru gestionarea unei repository local. Vom explora aceste metode și clasa în următoarele secțiuni pentru a înțelege cum să le utilizați.
-
-Metoda `create_repo` poate fi utilizată pentru crearea unui nou repository în hub:
-
-```py
-from huggingface_hub import create_repo
-
-create_repo("dummy-model")
-```
-
-Acesta va crea repositarul `dummy-model` în namespaceul tău. Dacă doriți, puteți specifica care organizație să aparțină repositoriului folosind argumentul `organization`:
-
-```py
-from huggingface_hub import create_repo
-
-create_repo("dummy-model", organization="huggingface")
-```
-
-Acesta va crea repositoriul `dummy-model` în spațiul organizației `huggingface`, cu condiția că dumneavoastră să apartineți acestei organizații.
-Alte argumente care pot fi utile sunt:
-
-- `private`, pentru a specifica dacă repositarul trebuie să fie vizibil celorlați sau nu.
-- `token`, dacă doriți să vă înlocuiți token-ul stocat în cache cu un anumit token.
-- `repo_type`, dacă doriți să creați un `dataset` sau `space` în loc de model. Valorile acceptate sunt `"dataset"` și `"space"`.
-
-Acum, trebuie să adăugați fișierele în repository-ul dumneavoastră! Treceți la secțiunea următoare pentru a vedea cele trei moduri de a face acest lucru.
-
-## Utilizarea interfeței web
-
-Interfața web oferă instrumente pentru a gestiona repositorii direct în Hub. Cu ajutorul acestei interfețe, puteți crea ușor repositorii, adăuga fișiere (și chiar și fișiere mari!), explora modele, vizualiza diffuri, și multe altele.
-
-Pentru a crea un nou repositoriu, vizitați [huggingface.co/new](https://huggingface.co/new):
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/new_model.png" alt="Pagină care prezintă modelul utilizat pentru crearea unui nou repository." width="80%"/>
-</div>
-
-În primul rând, specificați deținătorul repositoriului: acesta puteți fi dumneavoastră, fie orice organizație cu care sunteți afiliat. Dacă alegeți o organizație, modelul va fi prezent pe pagina organizației și toți membrii acesteia vor avea posibilitatea să contribuie la repositoriu.
-
-În al doilea rând, introduceți numele modelului dumneavoastră. Acest lucru va fi și denumirea repositoriului. În final, puteți specifica dacă doriți ca modelul dumneavoastră să fie public sau privat. Modelele private nu sunt vizibile ceilorlalți.
-
-După crearea repositoriului, ar trebui să vedeți o pagină ca aceasta:
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/empty_model.png" alt="O pagină goală a modelului după crearea unui nou repository." width="80%"/>
-</div>
-
-Acesta este locul unde va fi găzduit modelul. Pentru a începe să populați acesta, puteți adăuga un fișier README direct din interfața web.
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/dummy_model.png" alt="Fișierul README care arată capacitățile Markdown." width="80%"/>
-</div>
-
-Fișierul README este scris în format Markdown - vă rugăm să fiți creativi cu el! A treia parte a acestui capitol se ocupă de crearea unui model card. Acestea sunt foarte importante pentru a aduce valoare modelului dumneavoastră, deoarece este acolo unde spuneți celorlalți ce poate face.
-
-Dacă vă uitați la secțiunea "Fișiere și versiuni", veți vedea că nu sunt prea multe fișiere acolo încă - doar *README.md* pe care l-ați creat dumneavoastră și *.gitattributes* care urmărește fișierele mari.
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/files.png" alt="Secțiunea 'Fișiere și versiuni' arată doar fișierul .gitattributes și README.md." width="80%"/>
-</div>
-
-Vom vedea mai târziu cum să adăugați câteva fișiere noi.
-
-## Încărcarea fișierelor modelului[[uploading-the-model-files]]
-
-Sistemul pentru a gestiona fișierele în Hugging Face Hub se bazează pe git pentru fișierele obișnuite, și pe git-lfs (care se descrifrează ca [Git Large File Storage](https://git-lfs.github.com/)) pentru fișierele mai mari.
-
-În secțiunea următoare, vom discuta despre trei metode diferite de încărcare a fișierelor în Hub: prin `huggingface_hub` și prin comanda git.
-
-### Metoda `upload_file`[[the-uploadfile-approach]]
-
-Prin `upload_file` nu este necesar să instalați git și git-lfs pe sistemul dumneavoastră. Acest lucru încarcă direct fișierele în 🤗 Hub folosind HTTP POST requests. O limitare a acestei metode este că ea nu se ocupă de fișiere care sunt mai mari de 5GB.
-Dacă fișierele dumneavoastră sunt mai mari decât 5 GB, vă rugăm să urmați celelalte două metode descrise mai jos.
-
-API-ul poate fi folosit astfel:
-
-```python
-from huggingface_hub import upload_file
-
-upload_file(
-    "<path_to_file>/config.json",
-    path_in_repo="config.json",
-    repo_id="<namespace>/dummy-model",
-)
-```
-
-Acest lucru va încărca fișierul `config.json` disponibil la `<path_to_file>` la rootul repositoriului ca `config.json`, în `dummy-model` repository.
-Alte argumente utile pot fi:
-
-- `token`, dacă doriți să înlocuiți tokenul stocat în cache cu un alt token.
-- `repo_type`, dacă doriți să încărcați într-un `dataset` sau într-un `space` în locul modelului. Valorile acceptate sunt `"dataset"` și `"space"`.
-
-### Clasa `Repository`[[the-repository-class]]
-
-Clasa `Repository` gestionează un repository local în-tro manieră asemănătoare gitului. Ea abstracționează majoritatea problemelor pe care le întâlniți cu git pentru a oferi toate caracteristicile necesare.
-
-Utilizarea acestei clase necesită ca dumneavoastră să aveți instalat git și git-lfs, așadar asigurați-vă că aveți instalat git-lfs (vezi [aici](https://git-lfs.github.com/) pentru instrucțiunile de instalare) și setat înainte de a începe.
-
-Pentru a vă juca cu repositoriul pe care l-am creat, puteți porni prin inițializarea lui ca un folder local printr-un clonarea repositoriului remote:
-
-```py
-from huggingface_hub import Repository
-
-repo = Repository("<path_to_dummy_folder>", clone_from="<namespace>/dummy-model")
-```
-
-Acesta a creat folderele `<path_to_dummy_folder>` în folderul de lucru. Acest folder conține doar fișierul `.gitattributes` pentru că acesta este singurul fișier creat atunci când inițializați repositoriul prin `create_repo`.
-
-Acum puteți folosi majoritatea metodelor tradiționale ale gitului:
-
-```python
-repo.git_pull()
-repo.git_add()
-repo.git_commit()
-repo.git_push()
-repo.git_tag()
-```
-
-Și altele! Vă recomandăm să vă uitați la documentația `Repository` disponibilă [aici](https://github.com/huggingface/huggingface_hub/tree/main/src/huggingface_hub#advanced-programmatic-repository-management) pentru o înțelegere generală a tuturor metodelor disponibile.
-
-Pentru moment, avem un model și un tokenizer pe care doriți să îl trimiteți în hub. Am reușit să clonăm repositoriul local, deci putem salva fișierele în acesta.
-
-În primul rând asigurați-vă că copia locală este la zi cu ultimele schimbări:
-
-```python
-repo.git_pull()
-```
-
-Odată ce am facut asta, salvați fișierele modelului și al tokenizerul:
-
-```python
-model.save_pretrained("<path_to_dummy_folder>")
-tokenizer.save_pretrained("<path_to_dummy_folder>")
-```
-
-Folder-ul `<path_to_dummy_folder>` acum conține toate fișierele modelului dumneavoastră și ale tokenizerul. Vom urma fluxul tradițional de git adăugând fișiere în zona de pregătire, făcând commit și push fișierelor în hub:
-
-```python
-repo.git_add()
-repo.git_commit("Adăugarea fișierelor modelului și ale tokenizerului")
-repo.git_push()
-```
-
-Felicitări! Ați reușit să încărcați primele fișiere în hub.
-
-### Folosirea Git[[the-git-based-approach]]
-
-Acesta este abordarea cea mai de bază pentru încărcarea fișierelor: vom face ast cu ajutorul git și git-lfs direct. Cea mai grea parte este abstractizată prin abordări anterioare, dar există câteva excepții cu metoda următoare, așadar ne vom referi la un use-case mai complicat.
-
-Pentru această clasă se cere să aveți instalate git și git-lfs, așadar asigurați-vă că aveți [git-lfs](https://git-lfs.github.com/) instalat (vedeți aici instrucțiunile de instalare) și configurat înainte să începeți.
-
-În primul rând, inițializați git-lfs:
-
-```bash
-git lfs install
-```
-
-```bash
-Updated git hooks.
-Git LFS initialized.
-```
-
-După ce ați făcut acest lucru, primul pas este să faceți o copie a repositoriului dumneavoastră:
-
-```bash
-git clone https://huggingface.co/<namespace>/<your-model-id>
-```
-
-Numele meu de utilizator este `lysandre` și am folosit numele modelului `dummy`, așadar comanda mea se termină cu următorul rezultat:
-
-```
-git clone https://huggingface.co/lysandre/dummy
-```
-
-Acum am un folder denumit *dummy* în folderul meu de lucru. Pot intra în folder cu ajutorul `cd` și pot examina conținutul:
-
-```bash
-cd dummy && ls
-```
-
-```bash
-README.md
-```
-
-Dacă ați creat repositoriul dumneavoastră folosind metodă din partea Hugging Face Hub, `create_repo` , acest folder ar trebui să conțină doar un fișier cu numele *.gitattributes*. Dacă ați urmat instrucțiunile din secțiunea anterioară pentru crearea repositoriului folosind interfața web, atunci folderul ar trebui să conțină un singur fișier *README.md* și, de asemenea, un fișier cu numele *.gitattributes*, pe care nu-l puteți vedea.
-
-Adăugarea unui fișier de mărime obișnuită, precum un fișier de configurare, un vocabulary file sau orice alt tip de fișier care au mai puțin de câțiva megabytes se realizează exact așa cum ați face în orice sistem git. Cu toate acestea, pentru a încărca fișiere mai mari, este necesară utilizarea a git-lfs pentru a le trimite spre *huggingface.co*.
-
-Să ne întoarcem la Python pentru a genera un model și tokenizer pe care am dori să le facem commit în repositoriul nostru dummy:
-
-{#if fw === 'pt'}
-```py
-from transformers import AutoModelForMaskedLM, AutoTokenizer
-
-checkpoint = "camembert-base"
-
-model = AutoModelForMaskedLM.from_pretrained(checkpoint)
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-
-# Faceți orice cu modelul, antrenați-l, aplicați fine-tuning... 
-
-model.save_pretrained("<path_to_dummy_folder>")
-tokenizer.save_pretrained("<path_to_dummy_folder>")
-```
-{:else}
-```py
-from transformers import TFAutoModelForMaskedLM, AutoTokenizer
-
-checkpoint = "camembert-base"
-
-model = TFAutoModelForMaskedLM.from_pretrained(checkpoint)
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-
-# Faceți orice cu modelul, antrenați-l, aplicați fine-tuning... 
-
-model.save_pretrained("<path_to_dummy_folder>")
-tokenizer.save_pretrained("<path_to_dummy_folder>")
-```
-{/if}
-
-Acum am salvat câteva artefacte de model și tokenizer, așadar să examinăm din nou folderul *dummy*:
-
-```bash
-ls
-```
-
-{#if fw === 'pt'}
-```bash
-config.json  pytorch_model.bin  README.md  sentencepiece.bpe.model  special_tokens_map.json tokenizer_config.json  tokenizer.json
-```
-Dacă priviți la dimensiunile fișierelor (de exemplu, folosind `ls -lh`), ar trebui să vedeți că singurul outlier este model state dict file (*pytorch_model.bin*), care are mai mult de 400 MB.
-
-{:else}
-```bash
-config.json  README.md  sentencepiece.bpe.model  special_tokens_map.json  tf_model.h5  tokenizer_config.json  tokenizer.json
-```
-Dacă priviți la dimensiunile fișierelor (de exemplu, folosind`ls -lh`), ar trebui să vedeți că singurul outlier este model state dict file (*t5_model.h5*), care are mai mult de 400 MB.
-
-{/if}
-
-<Tip>
-✏️ Dacă creați repositoriul folosind interfața web, fișierul *.gitattributes* va fi automat configurat pentru a considera anumite extensii de fișiere, precum *.bin* și *.h5*, ca fiind fișiere mari. În acest caz nu este necesară nici o setare suplimentară din partea ta, pentru că git-lfs le va urmări automat.
-</Tip>
-
-Acum putem continua procesul în felul nostru obișnuit cu repositoriurile Git tradiționale. Putem adăuga toate fișierele în mediul de stocare a Git folosind comanda `git add`:
-
-```bash
-git add .
-```
-
-Puteți verifica fișierele curente care sunt în stare de stocare utilizând următoarea comandă:
-
-```bash
-git status
-```
-
-
-{#if fw === 'pt'}
-```bash
-On branch main
-Your branch is up to date with 'origin/main'.
-
-Changes to be committed:
-  (use "git restore --staged <file>..." to unstage)
-  modified:   .gitattributes
-	new file:   config.json
-	new file:   pytorch_model.bin
-	new file:   sentencepiece.bpe.model
-	new file:   special_tokens_map.json
-	new file:   tokenizer.json
-	new file:   tokenizer_config.json
-```
-{:else}
-```bash
-On branch main
-Your branch is up to date with 'origin/main'.
-
-Changes to be committed:
-  (use "git restore --staged <file>..." to unstage)
-  modified:   .gitattributes
-  	new file:   config.json
-	new file:   sentencepiece.bpe.model
-	new file:   special_tokens_map.json
-	new file:   tf_model.h5
-	new file:   tokenizer.json
-	new file:   tokenizer_config.json
-```
-{/if}
-
-De asemenea, putem verifica dacă git-lfs monitorizează fisierele corecte folosind comanda sa `status`:
-
-```bash
-git lfs status
-```
-
-
-{#if fw === 'pt'}
-```bash
-On branch main
-Objects to be pushed to origin/main:
-
-
-Objects to be committed:
-
-	config.json (Git: bc20ff2)
-	pytorch_model.bin (LFS: 35686c2)
-	sentencepiece.bpe.model (LFS: 988bc5a)
-	special_tokens_map.json (Git: cb23931)
-	tokenizer.json (Git: 851ff3e)
-	tokenizer_config.json (Git: f0f7783)
-
-Objects not staged for commit:
-
-
-```
-
-Vom observa că toate fișierele au `Git` ca handler, cu excepția *pytorch_model.bin* și *sentencepiece.bpe.model*, care au `LFS`. Excelent!
-
-{:else}
-```bash
-On branch main
-Objects to be pushed to origin/main:
-
-
-Objects to be committed:
-
-	config.json (Git: bc20ff2)
-	sentencepiece.bpe.model (LFS: 988bc5a)
-	special_tokens_map.json (Git: cb23931)
-	tf_model.h5 (LFS: 86fce29)
-	tokenizer.json (Git: 851ff3e)
-	tokenizer_config.json (Git: f0f7783)
-
-Objects not staged for commit:
-
-
-```
-
-Observăm că toate fișierele au `Git` ca handler, cu excepția *t5_model.h5*, care are `LFS`. Excelent!
-
-{/if}
-
-Acum vom continua cu ultimii pași: commiting și pushing la repo-urile *huggingface.co*:
-
-```
-git commit -m "Prima versiune a modelului"
-```
-
-
-{#if fw === 'pt'}
-```bash
-[main b08aab1] First model version
- 7 files changed, 29027 insertions(+)
-  6 files changed, 36 insertions(+)
- create mode 100644 config.json
- create mode 100644 pytorch_model.bin
- create mode 100644 sentencepiece.bpe.model
- create mode 100644 special_tokens_map.json
- create mode 100644 tokenizer.json
- create mode 100644 tokenizer_config.json
-```
-{:else}
-```bash
-[main b08aab1] First model version
- 6 files changed, 36 insertions(+)
- create mode 100644 config.json
- create mode 100644 sentencepiece.bpe.model
- create mode 100644 special_tokens_map.json
- create mode 100644 tf_model.h5
- create mode 100644 tokenizer.json
- create mode 100644 tokenizer_config.json
-```
-{/if}
-
-Pushingul poate lua câteva minute, în funcție de viteza conexiunii tale la internet și mărimea fișierelor:
-
-```bash
-git push
-```
-
-```bash
-Uploading LFS objects: 100% (1/1), 433 MB | 1.3 MB/s, done.
-Enumerating objects: 11, done.
-Counting objects: 100% (11/11), done.
-Delta compression using up to 12 threads
-Compressing objects: 100% (9/9), done.
-Writing objects: 100% (9/9), 288.27 KiB | 6.27 MiB/s, done.
-Total 9 (delta 1), reused 0 (delta 0), pack-reused 0
-To https://huggingface.co/lysandre/dummy
-   891b41d..b08aab1  main -> main
-```
-
-{#if fw === 'pt'}
-Dacă ne uităm la repositoriul modelului când acest lucru este finalizat, putem vedea toate fișierele recent adăugate:
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/full_model.png" alt="Tabul 'Files and versions' conține acum toate fișierele recente adăugate." width="80%"/>
-</div>
-
-Interfața permite explorarea fișierelor modelului și a commiturilor și vizualizarea diferenței introduse de fiecare commit:
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/diffs.gif" alt="Diferența introdusă de ultimul commit." width="80%"/>
-</div>
-{:else}
-Dacă ne uităm la repositoriul modelului când acest lucru este finalizat, putem vedea toate fișierele recent adăugate:
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/full_model_tf.png" alt="Tabul 'Files and versions' conține acum toate fișierele recente adăugate." width="80%"/>
-</div>
-
-Interfața permite explorarea fișierelor modelului și a commiturilor și vizualizarea diferenței introduse de fiecare commit:
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/diffstf.gif" alt="Diferența introdusă de ultimul commit." width="80%"/>
-</div>
-{/if}
-```
\ No newline at end of file
diff --git a/chapters/ro/chapter4/4.mdx b/chapters/ro/chapter4/4.mdx
deleted file mode 100644
index 7cac09819..000000000
--- a/chapters/ro/chapter4/4.mdx
+++ /dev/null
@@ -1,88 +0,0 @@
-# Crearea unui model card[[building-a-model-card]]
-
-
-<CourseFloatingBanner
-    chapter={4}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-Model card este un fișier care este, probabil, la fel de important ca și fișierele de model si tokenizer dintr-o repositoriul modelului. Este definiția centrală a modelului, asigurând reutilizarea de către membrii comunității și reproducerea rezultatelor, oferind o platformă pe care alți membri pot construi artefecatele lor.
-
-Documentarea procesului de antrenare și evaluare ajută celorlați să înțeleagă la ce să aștepte de la un model - iar oferirea informațiilor suficiente referitoare la datele folosite si preprocesarea acestora (înainte și după antrenare) vor ajuta la identificarea și înțelegerea limitelor, biaseruile și contextului în care modelul este și nu este folositor.
-
-Prin urmare, crearea unui model card care definește modelul dvs. este un pas foarte important. Aici, oferim câteva sfaturi care v-ar putea ajuta în acest sens. Crearea model cardului se face prin intermediul fișierului `README.md`, pe care l-ați văzut anterior, care este un fișier Markdown.
-
-Conceptul de "model card" provine dintr-o direcție de cercetare a Google, publicată inițial în articolul ["Model Cards for Model Reporting"](https://arxiv.org/abs/1810.03993) scrisă de Margaret Mitchell et al. O parte semnificativă dintre informațiile conținute aici sunt bazate pe acest articol, iar noi vă recomandăm să verificați dacă doriți să înțelegeți de ce model cardurile sunt atât importante într-o lume care valorifică reproducerea, reutilizarea și echitatea.
-
-Model cardul începe cu o prezentare scurtă și generală a ceea ce este modelul - urmată de detalii suplimentare în secțiunile următoare:
-
-- Descrierea modelului
-- Utilizări intenționate și limitările modelului
-- Cum se utilizează
-- Limitări și bias
-- Datele de antrenare
-- Procedura de antrenare
-- Rezultatele evaluării
-
-Hai să vedem ce ar trebui să conțină fiecare dintre aceste secțiuni.
-
-### Descrierea modelului[[model-description]]
-
-Secțiunea de descriere a modelului conține detalii generale despre model. Aceasta include arhitectura, versiunea, dacă a fost introdus într-un articol științific, dacă este disponibilă o implementare originală, autorul și informații generale despre model. Orice drepturi de autor ar trebui să fie atribuite în această secțiune. Informația generală despre procedurile de antrenare, parametrii și avertismente pot fi menționate aici.
-
-### Utilizări intenționate și limitările modelului[[intended-uses-limitations]]
-
-Aici descrieți utilizările pentru care modelul este destinat - inclusiv limba și domeniile unde se poate aplica. Această secțiune din model card poate documenta și zone cunoscute ca nefiind în scopul modelului sau unde este probabil să funcționeze suboptimal.
-
-### Cum se utilizează[[how-to-use]]
-
-Acesta secțiune ar trebui să includă exemple despre cum să utilizați modelul. Acest lucru poate prezenta utilizarea funcției `pipeline()`, utilizarea claselor de model si tokenizer, și orice cod care credeți că ar putea fi util.
-
-### Datele de antrenare[[training-data]]
-
-Această secțiune trebuie să indice datasetul(urile) folosit pentru instruirea modelului. O descriere scurtă a datasetului(urilor) este binevenită.
-
-### Procedura de antrenare[[training-procedure]]
-
-Aici descrieți toate aspectele relevante ale antrenarii care sunt utile din punct de vedere al reproducerii. Acest lucru include orice preprocessing sau postprocessing efectuat pe date, precum și detalii ca numărul de epoci pe care a fost antrenat modelul, dimensiunea batch-ului, learning rateul si alte astfel de detalii.
-
-### Variabilele si metrice[[variable-and-metrics]]
-
-Aici descrieți metricile utilizate la evaluarea rezultatelor, precum și diferite aspecte pe care le măsurați. Menționați metricile folosite, pe ce dataset și care dataset split, astfel încât să fie ușor de comparat performanțele modelului cu cele ale altor modele.
-
-### Rezultatele evaluării[[evaluation-results]]
-
-În sfârșit, indicați cum s-a comportat modelul pe datasetul de evaluare. Dacă modelul foloseste un decision threshold, atunci includeți acest decision threshold în secțiunea respectivă - sau explicați că rezultatele sunt prezentate la diferite thresholduri pentru utilizările preconizate.
-
-## Exemplu[[example]]
-
-Aici puteți găsi câteva exemple ale unor Model Card:
-
-- [`bert-base-cased`](https://huggingface.co/bert-base-cased)
-- [`gpt2`](https://huggingface.co/gpt2)
-- [`distilbert`](https://huggingface.co/distilbert-base-uncased)
-
-Câteva exemple din alte organizații și companii pot fi găsite [aici](https://github.com/huggingface/model_card/blob/master/examples.md).
-
-## Notă[[note]]
-
-Model cardurile nu sunt o cerință obligatorie când se publică modelele si nu este necesar să includeți toate secțiunile descrise mai sus în Model Card. Cu toate acestea, documentarea explicită a modelului poate beneficia utilizatorilor viitori, deci vă recomandăm să completați cât mai multe dintre secțiuni.
-
-## Metadatele cardului de model[[model-card-metadata]]
-
-Dacă ați explorat puțin Hugging Face Hub atunci ar trebui să fi văzut că anumite modele aparțin anumitor categorii: puteți filtra acestea după diverse domenii. Categoriile modelului sunt identificate prin metadata adăugată în secțiunea de header a cardului.
-
-Spre exemplu, dacă vă uitați la modelul [`camembert-base`](https://huggingface.co/camembert-base/blob/main/README.md) atunci veți observa următoarea linii din headerul cardului:
-
-````
----
-language: fr
-license: mit
-datasets:
-- oscar
----
-```
-
-Metadatele acestei secțiuni sunt analizate de Hugging Face Hub, care apoi identifică acest model ca fiind un model francez, cu licență MIT și antrenat pe datasetul Oscar.
-
-[Toate specificările cardului](https://github.com/huggingface/hub-docs/blame/main/modelcard.md) permite specificarea a mai multor metadate, inclusiv limba, licența, etichetele, dataseturile folosite la antrenare și metricile evaluate.
\ No newline at end of file
diff --git a/chapters/ro/chapter4/5.mdx b/chapters/ro/chapter4/5.mdx
deleted file mode 100644
index 509673def..000000000
--- a/chapters/ro/chapter4/5.mdx
+++ /dev/null
@@ -1,12 +0,0 @@
-# Partea 1 este completată!
-
-<CourseFloatingBanner
-    chapter={4}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-Acesta este sfârșitul primei părți a cursului! Partea 2 va fi lansată pe data de 15 noiembrie, cu un mare eveniment comunitar, mai multe informații găsiți [aici](https://huggingface.co/blog/course-launch-event).
-
-Acum, sunteți capabili să faceți fine-tune unui model preantrenat pe o problemă de clasificare a textului (o singură sau perechi de propoziții) și să încarci rezultatele la Model Hub. Să fii sigur că ai învățat această primă secțiune, ar trebui să faci exact acest lucru pe o problemă care ți se pare interesantă (și nu neapărat în limba engleză dacă vorbiți altă limbă)! Puteți găsi ajutor în [forumurile Hugging Face](https://discuss.huggingface.co/) și să împărtășiți proiectul dvs. pe [acest subiect](https://discuss.huggingface.co/t/share-your-projects/6803) odată ce ați terminat.
-
-Ne așteptăm cu nerăbdare să vedem ceea ce veți construi cu aceste cunoștințe :)!
\ No newline at end of file
diff --git a/chapters/ro/chapter4/6.mdx b/chapters/ro/chapter4/6.mdx
deleted file mode 100644
index 746428f14..000000000
--- a/chapters/ro/chapter4/6.mdx
+++ /dev/null
@@ -1,233 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-<!-- DISABLE-FRONTMATTER-SECTIONS -->
-
-# Quiz pentru finalizarea capitolului[[end-of-chapter-quiz]]
-
-<CourseFloatingBanner
-    chapter={4}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-Să testăm ceea ce ai învățat în acest capitol!
-  
-### 1. La ce sunt limitate modelele din Hub?
-
-<Question
-	choices={[ 
-		{
-			text: "Modelele din biblioteca 🤗 Transformers.",
-			explicație: "Ținând cont că modelele din biblioteca 🤗 Transformers sunt disponibile pe Hugging Face Hub, ele nu sunt singurele!"
-		},
-		{
-			text: "Toate modelele cu o interfață similară cu 🤗 Transformers.",
-			explicație: "Nu există nicio cerință de interfață când se încarcă modelele pe Hugging Face Hub."
-		},
-		{
-			text: "Nu există limite.",
-			explicație: "Adevărat! Nu există nici o limită când se încarcă modele pe Hub.",
-            corect: true
-		},
-        {
-			text: "Modele care, într-o anumită măsură, sunt legate de NLP.",
-			explicație: "Nu există nicio cerință privind domeniul aplicației!"
-		}
-	] }
-/>
-
-### 2. Cum poți gestiona modelele pe Hub?
-
-<Question
-	choices={[ 
-		{
-			text: "Printr-un cont GCP.",
-			explicație: "Greșit! "
-		},
-		{
-			text: "Prin distribuția peer-to-peer.",
-			explicație: "Greșit!"
-		},
-		{
-			text: "Prin git și git-lfs.",
-			explicație: "Corect! Modelele din Hub sunt simple repositorii Git, care utilizează <code>git-lfs</code> pentru fișiere mari.",
-            corect: true
-		}
-	] }
-/>
-
-### 3. Ce poți face utilizând interfața web a Hugging Face Hub?
-
-<Question
-	choices={[ 
-		{
-			text: "Forkingul unui repositoriu existent.",
-			explicație: "Nu se poate face forking la un repositoriu pe Hugging Face Hub."
-		},
-		{
-			text: "Crearea unui nou model repository.",
-			explicație: "Corect! Dar nu este singurul lucru pe care îl poți face...",
-            corect: true
-		},
-		{
-			text: "Gestionarea și editarea fișierelor.",
-			explicație: "Corect! Dar nuu este singurul lucru pe care îl poți face..."
-            correct: true
-		},
-        {
-			text: "Încărcarea de fișiere.",
-			explicație: "Corect! Dar nu este singurul lucru..."
-            correct: true
-		},
-        {
-			text: "Vizualizarea diferențelor între versiuni.",
-			explicație: "Corect! Dar nu este singurul lucru pe care îl poți face...",
-            corect: true
-		}
-	] }
-/>
-
-### 4. Ce este un model card?
-
-<Question
-	choices={[ 
-		{
-			text: "O descriere a modelului, deci mai puțin importantă decât fișierele model și tokenizer.",
-			explicație: "Este într-adevăr o descriere a modelului, dar este un element important. Dacă descrierea nu este completă sau absentă, utilitatea modelului se reduce drastic."
-		},
-		{
-			text: "Un mod de asigurare a reproducerii, reutilizării și egalității.",
-			explicație: "Corect! Oferirea informațiilor adecvate în model card va ajuta utilizatorii să utilizeze modelul și să fie conștienți de limitele și biasurile acestuia. ",
-            corect: true
-		},
-		{
-			text: "Un fișier Python care poate fi rulat pentru a obține informații despre model.",
-			explicație: "Model cardurile sunt simple fișiere Markdown."
-		}
-	] }
-/>
-
-Chapitru 4
-
-### 5. Câte dintre obiectele bibliotecii 🤗 Transformers pot fi împărtășite direct pe Hub cu `push_to_hub()`?
-
-{#if fw === 'pt'}
-<Question
-	choices={[
-		{
-			text: "Un tokenizer",
-			explain: "Corect! Toți tokenizerii au metoda <code>push_to_hub</code>, și utilizând-o, vor împărtăși toate fișierele tokenizerului (vocabular, arhitectură tokenizerului, etc.) către un repo. Însă acesta nu este singura soluție corectă!",
-            correct: true
-		},
-		{
-			text: "O configurare a modelului",
-			explain: "Corect! Toate configurațiile modelelor au metoda <code>push_to_hub</code>, și utilizând-o, vor împărtăși configurația către un repo. Și ce altceva poți oferi?",
-            correct: true
-		},
-		{
-			text: "Un model",
-			explain: "Corect! Toate modelele au metoda <code>push_to_hub</code>, și utilizând-o, vor împărtăși ei, precum și fișierele de configurare către un repo. Și nu numai asta!",
-            correct: true
-		},
-        {
-			text: "Un Trainer",
-			explain: "Corect — <code>Trainer</code> implementează metoda <code>push_to_hub</code>, și utilizând-o, vor încărca modelul, configurarea sa, tokenizerul, precum și un draft a unui model card către un repo. Încearcă și altă opțiune!",
-            correct: true
-		}
-	]}
-/>
-
-{:else}
-<Question
-	choices={[
-		{
-			text: "Un tokenizer",
-			explain: "Corect! Toți tokenizerii au metoda <code>push_to_hub</code>, și utilizând-o, vor împărtăși toate fișierele tokenizerului (vocabular, arhitectură tokenizerului, etc.) către un repo. Însă acesta nu este singura soluție corectă!",
-            correct: true
-		},
-		{
-			text: "O configurare a modelului",
-			explain: "Corect! Toate configurațiile modelelor au metoda <code>push_to_hub</code>, și utilizând-o, vor împărtăși configurația către un repo. Și ce altceva poți oferi?",
-            correct: true
-		},
-		{
-			text: "Un model",
-			explain: "Corect! Toate modelele au metoda <code>push_to_hub</code>, și utilizând-o, vor împărtăși ei, precum și fișierele de configurare către un repo. Și nu numai asta!",
-            correct: true
-		},
-        {
-			text: "Toate cele trei cu un callback dedicat",
-			explain: "Corect — <code>PushToHubCallback</code> va trimite regular toate aceste obiecte către un repo în timpul antrenării.",
-            correct: true
-		}
-	]}
-/>
-{/if}
-
-### 6. Care este primul pas atunci când utilizați metoda `push_to_hub()` sau instrumentele CLI?
-
-<Question
-	choices={[
-		{
-			text: "Logarea pe website",
-			explain: "Acest lucru nu vă va ajuta local."
-		},
-		{
-			text: "Rulați 'huggingface-cli login' în terminal.",
-			explain: "Corect — acest lucru va descărca și va stoca tokenul personal.",
-            correct: true
-		},
-		{
-			text: "Rulați 'notebook_login()' într-un notebook",
-			explain: "Corect — acest lucru va afișa un widget pentru a vă autentifica.",
-            correct: true
-		},
-	]
-    }
-/>
-
-
-### 7. Aveți un model și un tokenizer, cum le puteți încărca pe ambele în Hub?
-
-<Question
-	choices={[
-		{
-			text: "Prin apelarea directă a metodei `push_to_hub` pe model și tokenizer",
-			explain: "Corect!",
-            correct: true
-		},
-		{
-			text: "În cadrul runtime-ului Python, prin wrappingul acestora într-un <code>huggingface_hub</code>",
-			explain: "Modelele și tokenizerii deja beneficiază de utilitățile <code>huggingface_hub</code>: nu vă trebuie nici un wrapping suplimentar!"
-		},
-		{
-			text: "Prin salvarea lor pe disc și apelarea <code>transformers-cli upload-model</code>",
-			explain: "Comanda <code>upload-model</code> nu există."
-		}
-	]}
-/>
-
-### 8. Carele operații git poți face cu clasa `Repository`?
-
-<Question
-	choices={[
-		{
-			text: "Un commit",
-			explain: "Corect, metoda <code>git_commit()</code> este acolo pentru a face commit.",
-            correct: true
-		},
-		{
-			text: "Un pull",
-			explain: "Acesta este scopul metodei <code>git_pull()</code>",
-            correct: true
-		},
-		{
-			text: "Un push",
-			explain: "Metoda <code>git_push()</code> face acest lucru.",
-            correct: true
-		},
-		{
-			text: "Un merge",
-			explain: "Nu, această operație nu va fi niciodată posibilă cu acest API."
-		}
-	]}
-/>
\ No newline at end of file

From 0904819e120adb0d2f043f4a379c8d747c55690d Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Tue, 27 May 2025 11:27:24 +0300
Subject: [PATCH 111/167] feat: add chapter 4 content

---
 chapters/rum/_toctree.yml   |  44 +++
 chapters/rum/chapter4/1.mdx |  22 ++
 chapters/rum/chapter4/2.mdx |  98 ++++++
 chapters/rum/chapter4/3.mdx | 641 ++++++++++++++++++++++++++++++++++++
 chapters/rum/chapter4/4.mdx |  88 +++++
 chapters/rum/chapter4/5.mdx |  12 +
 chapters/rum/chapter4/6.mdx | 233 +++++++++++++
 7 files changed, 1138 insertions(+)
 create mode 100644 chapters/rum/_toctree.yml
 create mode 100644 chapters/rum/chapter4/1.mdx
 create mode 100644 chapters/rum/chapter4/2.mdx
 create mode 100644 chapters/rum/chapter4/3.mdx
 create mode 100644 chapters/rum/chapter4/4.mdx
 create mode 100644 chapters/rum/chapter4/5.mdx
 create mode 100644 chapters/rum/chapter4/6.mdx

diff --git a/chapters/rum/_toctree.yml b/chapters/rum/_toctree.yml
new file mode 100644
index 000000000..de7e97470
--- /dev/null
+++ b/chapters/rum/_toctree.yml
@@ -0,0 +1,44 @@
+- title: 0. Configurare
+  sections:
+  - local: chapter0/1
+    title: Introducere
+
+- title: 1. Modele Transformer
+  sections:
+  - local: chapter1/1
+    title: Introducere
+  - local: chapter1/2
+    title: Procesarea limbajului natural și modelele de limbaj mari
+  - local: chapter1/3
+    title: Transformers, ce pot face?
+  - local: chapter1/4
+    title: Cum funcționează Transformers?
+  - local: chapter1/5
+    title: Modele Encoder
+  - local: chapter1/6
+    title: Modele Decoder
+  - local: chapter1/7
+    title: Modele secvență-la-secvență
+  - local: chapter1/8
+    title: Prejudecăți și limitări
+  - local: chapter1/9
+    title: Rezumat
+  - local: chapter1/10
+    title: Quiz de final de capitol
+    quiz: 1
+
+- title: 4. Partajarea modelelor și a tokenizatoarelor
+  sections:
+  - local: chapter4/1
+    title: Platforma Hugging Face Hub
+  - local: chapter4/2
+    title: Utilizarea modelelor preantrenate
+  - local: chapter4/3
+    title: Partajarea modelelor preantrenate
+  - local: chapter4/4
+    title: Crearea unui card de model
+  - local: chapter4/5
+    title: Partea 1 este completă
+  - local: chapter4/6
+    title: Quiz la final de capitol
+    quiz: 4
\ No newline at end of file
diff --git a/chapters/rum/chapter4/1.mdx b/chapters/rum/chapter4/1.mdx
new file mode 100644
index 000000000..4ef56abf4
--- /dev/null
+++ b/chapters/rum/chapter4/1.mdx
@@ -0,0 +1,22 @@
+# Platforma Hugging Face Hub[[the-hugging-face-hub]]
+
+<CourseFloatingBanner
+    chapter={4}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+Platforma [Hugging Face Hub](https://huggingface.co/) –- site-ul nostru principal –- reprezintă o platformă care permite oricărui utilizator să descopere, utilizeze și contribuie la noi modele și dataseturi. Acesta găzduiește o varietate vastă de modele, cu peste 10.000 disponibile public. Ne vom concentra discuția asupra modelelor în acest capitol, iar pentru dataseturi vom vorbi în Capitolul 5.
+
+Modelele din Hub nu sunt limitate la 🤗 Transformers sau chiar și NLP. Există și alte modele, cum ar fi cele de la [Flair](https://github.com/flairNLP/flair) și [AllenNLP](https://github.com/allenai/allennlp) pentru NLP, [Asteroid](https://github.com/asteroid-team/asteroid) și [pyannote](https://github.com/pyannote/pyannote-audio) pentru speech, precum și cele de la [timm](https://github.com/rwightman/pytorch-image-models) pentru vision, doar să menționăm câteva.
+
+Fiecare dintre aceste modele este găzduit ca un repository Git, ceea ce permite crearea versiunilor și reproducerea acestuia. Oferirea modelului pe Hub înseamnă deschiderea sa comunității, făcându-l accesibil oricărui utilizator care dorește să îl utilizeze cu ușurință, eliminând astfel nevoia de a-și antrena propriul model și simplificând utilizarea acestora. 
+
+În plus, oferirea unui model pe Hub face deploy automat la un Inference API pentru acel model. Orice membru al comunității poate testa direct pe pagina modelului cu inputuri personalizate și widget-uri corespunzătoare.
+
+Cel mai bun lucru este că oferirea și utilizarea oricărui model public pe Hub este complet gratuit! Existează și [planuri plătite](https://huggingface.co/pricing) dacă doriți să oferiți modele în privat.
+
+Video-ul de mai jos arată modul în care puteți naviga prin Hub.
+
+<Youtube id="XvSGPZFEjDY"/>
+
+Crearea unui cont huggingface.co este necesară pentru a continua această parte, deoarece vom crea și gestiona repositorii pe Platforma Hugging Face Hub: [creați un cont](https://huggingface.co/join)
\ No newline at end of file
diff --git a/chapters/rum/chapter4/2.mdx b/chapters/rum/chapter4/2.mdx
new file mode 100644
index 000000000..bbe94669b
--- /dev/null
+++ b/chapters/rum/chapter4/2.mdx
@@ -0,0 +1,98 @@
+<FrameworkSwitchCourse {fw} />
+
+# Utilizarea modelelor preantrenate[[using-pretrained-models]]
+
+{#if fw === 'pt'}
+ 
+<CourseFloatingBanner chapter={4}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter4/section2_pt.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter4/section2_pt.ipynb"},
+]} />
+
+{:else}
+
+<CourseFloatingBanner chapter={4}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter4/section2_tf.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter4/section2_tf.ipynb"},
+]} />
+
+{/if}
+
+Hubul Model oferă o modalitate simplă de a selecta modelul adecvat, astfel încât utilizarea sa în orice bibliotecă downstream poate fi efectuată în câteva linii de cod. Să vedem cum se utilizează efectiv unul dintre aceste modele și cum putem contribui înapoi la comunitate.
+
+
+Să presupunem că noi căutăm un French-based model ce poate face mask filling.
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/camembert.gif" alt="Selecting the Camembert model." width="80%"/>
+</div>
+
+Alegem checkpointul „camembert-base” pentru al încerca. Identificatorul `camembert-base` este tot de ce avem nevoie pentru a începe. În capitolele precedente, am văzut cum putem inițializa modelul folosind funcția `pipeline()`:
+
+```py
+from transformers import pipeline
+
+camembert_fill_mask = pipeline("fill-mask", model="camembert-base")
+results = camembert_fill_mask("Le camembert est <mask> :)")
+```
+
+```python out
+[
+  {'sequence': 'Le camembert est délicieux :)', 'score': 0.49091005325317383, 'token': 7200, 'token_str': 'délicieux'}, 
+  {'sequence': 'Le camembert est excellent :)', 'score': 0.1055697426199913, 'token': 2183, 'token_str': 'excellent'}, 
+  {'sequence': 'Le camembert est succulent :)', 'score': 0.03453313186764717, 'token': 26202, 'token_str': 'succulent'}, 
+  {'sequence': 'Le camembert est meilleur :)', 'score': 0.0330314114689827, 'token': 528, 'token_str': 'meilleur'}, 
+  {'sequence': 'Le camembert est parfait :)', 'score': 0.03007650189101696, 'token': 1654, 'token_str': 'parfait'}
+]
+```
+
+În mod evident, încărcarea unui model într-un pipeline este extrem de simplu. Singurul lucru la care trebuie să atrageți atenția este că checkpointul ales este adecvat pentru sarcina pe care urmează să o execute. De exemplu, în momentul în care încărăm checkpoint-ul „camembert-base” în pipelineul `fill-mask`, este perfect în regulă. Dar dacă îl încărcam în pipelineul `text-classification`, rezultatele nu vor avea nici o logică, pentru că headul „camembert-base” nu este adecvat pentru această sarcină! Recomandăm utilizarea task selectorului în interfața Hugging Face în scopul selectării checkpointurilor adecvate:
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/tasks.png" alt="Selectorul de sarcini pe interfața web." width="80%"/>
+</div>
+
+Puteți inițializa checkpointul în mod direct folosind arhitectura modelului:
+
+{#if fw === 'pt'}
+```py
+from transformers import CamembertTokenizer, CamembertForMaskedLM
+
+tokenizer = CamembertTokenizer.from_pretrained("camembert-base")
+model = CamembertForMaskedLM.from_pretrained("camembert-base")
+```
+
+Însă, recomandăm utilizarea [claselor `Auto*`](https://huggingface.co/transformers/model_doc/auto?highlight=auto#auto-classes), deoarece acestea sunt proiectate să fie architecture-agnostic. În timp ce codul precedent limita utilizatorii la checkpoints loadable în CamemBERT architecture, utilizarea claselor `Auto*` face schimbarea checkpointurilor simplă:
+
+```py
+from transformers import AutoTokenizer, AutoModelForMaskedLM
+
+tokenizer = AutoTokenizer.from_pretrained("camembert-base")
+model = AutoModelForMaskedLM.from_pretrained("camembert-base")
+```
+{:else}
+```py
+from transformers import CamembertTokenizer, TFCamembertForMaskedLM
+
+tokenizer = CamembertTokenizer.from_pretrained("camembert-base")
+model = TFCamembertForMaskedLM.from_pretrained("camembert-base")
+```
+
+Însă, recomandăm utilizarea [claselor `TFAuto*`](https://huggingface.co/transformers/model_doc/auto?highlight=auto#auto-classes), deoarece acestea sunt proiectate să fie architecture-agnostic. În timp ce codul precedent limita utilizatorii la checkpoints loadable în CamemBERT architecture, utilizarea claselor `TFAuto*` face schimbarea checkpointurilor simplă:
+
+```py
+from transformers import AutoTokenizer, TFAutoModelForMaskedLM
+
+tokenizer = AutoTokenizer.from_pretrained("camembert-base")
+model = TFAutoModelForMaskedLM.from_pretrained("camembert-base")
+```
+{/if}
+
+<Tip>
+În momentul în care folosiți un model preantrenat, asigurați-vă să verificați cum a fost antrenat și pe ce date se bazează. De asemenea, trebuie să cunoasceți limitele și prejudecățile sale. Toată această informație va fi indicată pe cartea modelului.
+</Tip>
+
diff --git a/chapters/rum/chapter4/3.mdx b/chapters/rum/chapter4/3.mdx
new file mode 100644
index 000000000..dda42f45e
--- /dev/null
+++ b/chapters/rum/chapter4/3.mdx
@@ -0,0 +1,641 @@
+
+**Capitolul 4**
+
+<FrameworkSwitchCourse {fw} />
+
+# Partajarea modelelor preantrenate [[sharing-pretrained-models]]
+
+{#if fw === 'pt'}
+
+<CourseFloatingBanner chapter={4}
+classNames="absolute z-10 right-0 top-0"
+notebooks={[ 
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter4/section3_pt.ipynb"}, 
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter4/section3_pt.ipynb"},
+]} />
+
+{:else}
+
+<CourseFloatingBanner chapter={4}
+classNames="absolute z-10 right-0 top-0"
+notebooks={[ 
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter4/section3_tf.ipynb"}, 
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter4/section3_tf.ipynb"},
+]} />
+
+{/if}
+
+În următoarele etape, vom explora modalitățile cele mai ușoare de a partaja modelele preantrenate pe 🤗 Hub. Există tooluri și utilities disponibile care fac posibilă partajarea și actualizarea modelelor direct pe Hub, despre care vom vorbi mai jos.
+
+<Youtube id="9yY3RB_GSPM"/>
+
+Recomandăm tuturor utilizatorilor care antrenează modele să contribuie prin partajarea lor cu comunitatea - partajarea modelelor, chiar și atunci când sunt antrenate pe dateseturi foarte specifice, va ajuta la economising timpul altor utilizatori și resurselor și va oferi acces la trained artifcats folositoare. În schimb, puteți beneficia de munca altora!
+
+Există trei moduri de a crea noi repositorii cu modele:
+
+- Utilizând API-ul `push_to_hub`
+- Utilizând biblioteca Python `huggingface_hub`
+- Utilizând interfața web
+
+Odată ce aveți creat un repository, puteți încărca fișiere în el folosind git și git-lfs. Vom trece împreună prin crearea model repositories și încărcarea fișierelor în el în următoarele secțiuni.
+
+## Utilizând API-ul `push_to_hub`[[using-the-pushtohub-api]]
+
+{#if fw === 'pt'}
+
+<Youtube id="Zh0FfmVrKX0"/>
+
+{:else}
+
+<Youtube id="pUh5cGmNV8Y"/>
+
+{/if}
+
+Cea mai simplă modalitate de a încărca fișiere pe Hub este utilizând API-ul `push_to_hub`.
+
+Înainte de a continua, aveți nevoie să creați un token de autentificare astfel încât API-ul `huggingface_hub` să știe cine sunteți și care sunt namespaces la care aveți acces de scriere. Asigurați-vă că sunteți într-un environment unde aveți instalat `transformers` (vedeti [Configurarea](/course/chapter0)). Dacă sunteți într-un notebook, puteți folosi următoarea funcție pentru a vă autentifica:
+
+```python
+from huggingface_hub import notebook_login
+
+notebook_login()
+```
+
+În terminal, puteți rula următoarea comandă:
+
+```bash
+huggingface-cli login
+```
+
+În ambele cazuri, veți fi rugați să introduceți numele utilizatorului și parola, care sunt aceleași cu cele folosite la autentificare pe Hub. Dacă nu aveți încă un profil pe Hub, vă rugăm să creați unul [aici](https://huggingface.co/join).
+
+Excelent! Acum aveți tokenul de autentificare stocat în folder-ul cache. Vom crea acum niște repositorii!
+
+{#if fw === 'pt'}
+
+Dacă ați lucrat cu API-ul `Trainer` pentru a antrena un model, cea mai ușoară modalitate de a o încărca pe Hub este să setați `push_to_hub=True` când definiți `TrainingArguments`:
+
+```py
+from transformers import TrainingArguments
+
+training_args = TrainingArguments(
+    "bert-finetuned-mrpc", save_strategy="epoch", push_to_hub=True
+)
+```
+
+Când chemați `trainer.train()`, `Trainer` va încărca modelul pe Hub de fiecare dată când este salvat (aici, la fiecare epocă) într-un repository namespaceul tău. Acest repository va fi numit după outpul directory-ul ales (aici `bert-finetuned-mrpc`), dar puteți alege un alt nume cu `hub_model_id = "un_nume_diferit"`.
+
+Pentru a încărca modelul într-o organizație din care faceți parte, este suficient să introduceți aceasta în `hub_model_id = "organizația_mea/numele_repositoriului"`.
+
+Odată ce antrenarea s-a terminat, trebuie să faceți `trainer.push_to_hub()` pentru a încărca ultima versiune a modelului. Acesta va genera apoi un model card cu toate informațiile relevante, inclusiv metadatele despre hyperparametrii utilizați și rezultatele evaluării! Aici este exemplul unui astfel de model card:
+
+<div class="flex justify-center">
+  <img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/model_card.png" alt="Un exemplu de un card auto-generat." width="100%"/>
+</div>
+
+{:else}
+
+Dacă utilizați Keras pentru a antrena modelul dumneavoastră, cea mai ușoară modalitate de a încărca-o pe Hub este să transmiteți un `PushToHubCallback` când chemați `model.fit()`:
+
+```py
+from transformers import PushToHubCallback
+
+callback = PushToHubCallback(
+    "bert-finetuned-mrpc", save_strategy="epoch", tokenizer=tokenizer
+)
+```
+
+Apoi, adăugați `callbacks=[callback]` în apelul la `model.fit()`. Callback-ul va încărca apoi modelul pe Hub de fiecare dată când se salvează(aici, la fiecare epocă) într-un repository din namespaceul tău. Acest repository va fi numit după output directory ales (aici `bert-finetuned-mrpc`), dar puteți alege un alt nume cu `hub_model_id = "un_nume_diferit"`.
+
+Pentru a încărca modelul într-o organizație din care faceți parte, este suficient să introduceți aceasta în `hub_model_id = "organizația_mea/numele_repositoriului"`.
+
+{/if}
+
+La un nivel inferior, accesarea Hub-ului se poate face direct pe modele, tokenizers și configurations objects prin metoda `push_to_hub()`. Această metodă se ocupă atât de crearea repositoriului cât si de încărcarea modelului și tokenizerului direct în el. Nu este nevoie de o interacțiune manuală, precum fața de API-ul pe care îl vom vedea mai jos.
+
+Pentru a înțelege cum funcționează, luați în considerare inițializarea unui model și a unui tokenizer:
+
+{#if fw === 'pt'}
+```py
+from transformers import AutoModelForMaskedLM, AutoTokenizer
+
+checkpoint = "camembert-base"
+
+model = AutoModelForMaskedLM.from_pretrained(checkpoint)
+tokenizer = AutoTokenizer.from_pretrained(checkpoint)
+```
+{:else}
+```py
+from transformers import TFAutoModelForMaskedLM, AutoTokenizer
+
+checkpoint = "camembert-base"
+
+model = TFAutoModelForMaskedLM.from_pretrained(checkpoint)
+tokenizer = AutoTokenizer.from_pretrained(checkpoint)
+```
+{/if}
+
+Sunteți liberi să faceți orice ați vrea cu acestea - adăugați tokens la tokenizer, antrenați modelul sau faceți fine-tune. Odată ce sunteți mulțumiți de modelul obținut, weighturile și tokenizerul acestuia , puteți folosi metoda `push_to_hub()` disponibilă direct pe obiectul `model`:
+
+```py
+model.push_to_hub("dummy-model")
+```
+Acest lucru va crea un nou repository `dummy-model` în profilul tău și o va popula cu fișierele modelului tău.
+Încercați același lucru cu tokenizerul, astfel încât toate fișierele să fie acum disponibile în acest repository:
+
+```py
+tokenizer.push_to_hub("dummy-model")
+```
+
+Dacă apartineți unei organizații, specificați doar argumentul `organization` pentru a încărca în namespaceul acestei organizații:
+
+```py
+tokenizer.push_to_hub("dummy-model", organization="huggingface")
+```
+
+Dacă doriți să utilizați un anumit token Hugging Face, sunteți liberi să specificați acest lucru metodei `push_to_hub()`:
+
+```py
+tokenizer.push_to_hub("dummy-model", organization="huggingface", use_auth_token="<TOKEN>")
+```
+
+Acum, mergeți la Model Hub pentru a găsi modelul încărcat: *https://huggingface.co/user-or-organization/dummy-model*.
+
+Apăsați pe tabul "Files and versions", iar acum ar trebui să vedeți fișierele vizibile în următorul screenshot:
+
+{#if fw === 'pt'}
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/push_to_hub_dummy_model.png" alt="Dummy model containing both the tokenizer and model files." width="80%"/>
+</div>
+{:else}
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/push_to_hub_dummy_model_tf.png" alt="Dummy model containing both the tokenizer and model files." width="80%"/>
+</div>
+{/if}
+
+<Tip>
+
+✏️ **Încercați!** Luați modelul și tokenizerul asociat cu checkpointul `bert-base-cased` și încărcați-l pe un repo în namespaceul tău folosind metoda `push_to_hub()`. Verificați că repo-ul apare  în pagina dumneavoastră înainte de a-l șterge.
+
+</Tip>
+
+Ați văzut că metoda `push_to_hub()` acceptă mai multe argumente, ceea ce permite încărcarea într-un repository specific sau namespace al unei organizații, sau utilizarea unui token API diferit. Vă recomandăm să vă uitați la specificația metodei disponibilă direct în [documentația 🤗 Transformers](https://huggingface.co/transformers/model_sharing) pentru a înțelge ceea ce este posibil.
+
+Metoda `push_to_hub()` este backed de packageul Python [`huggingface_hub`](https://github.com/huggingface/huggingface_hub), care oferă un API direct la Hub-ul Hugging Face. Acesta este integrat în 🤗 Transformers și în mai multe biblioteci pentru machine learning, ca de exemplu [`allenlp`](https://github.com/allenai/allennlp). Deși ne concentrăm pe integrarea în 🤗 Transformers în acest capitol, integrarea sa în propriul dumneavoastră cod sau bibliotecă este simplu.
+
+Întoarceți-vă la secțiune precedentă pentru a vedea cum să încărcați fișierele în noul repository-ul creat!
+
+## Utilizarea bibliotecii Python `huggingface_hub`
+
+Biblioteca Python `huggingface_hub` este un package care oferă un set de instrumente pentru model și datasets hubs. Oferă metode simple și clase pentru sarcini comune ca:
+Obținerea informațiilor despre repositorii pe hub și gestionarea lor. Ofere API-uri simple care lucrează pe lângă Git pentru a gestiona conținutul acestor repositorii și integrarea Hub-ului
+în proiectele și bibliotecile tale.
+
+Similar cu utilizarea API-ului `push_to_hub`, asta va necesita un token de autentificare salvat în cache. Pentru a face acest lucru, veți avea nevoie să folosiți comanda `login` din CLI, cum am menționat în secțiunea anterioară (din nou, asigurați-vă prefixați această comandă cu simbolul `!` dacă rulați în Google Colab):
+
+```bash
+huggingface-cli login
+```
+
+Packageul `huggingface_hub` oferă mai multe metode și clase utile pentru noi. În primul rând, există câteva metode pentru crearea, ștergerea și gestionarea repositoriilor:
+
+```python no-format
+from huggingface_hub import (
+    # Gestionarea utilizatorilor
+    login,
+    logout,
+    whoami,
+
+    # Crearea și gestionarea repositoriilor
+    create_repo,
+    delete_repo,
+    update_repo_visibility,
+
+    # Și câteva metode pentru a obține/schimba informațiile despre conținut
+    list_models,
+    list_datasets,
+    list_metrics,
+    list_repo_files,
+    upload_file,
+    delete_file,
+)
+```
+
+De asemenea, el oferă clasa `Repository` pentru gestionarea unei repository local. Vom explora aceste metode și clasa în următoarele secțiuni pentru a înțelege cum să le utilizați.
+
+Metoda `create_repo` poate fi utilizată pentru crearea unui nou repository în hub:
+
+```py
+from huggingface_hub import create_repo
+
+create_repo("dummy-model")
+```
+
+Acesta va crea repositarul `dummy-model` în namespaceul tău. Dacă doriți, puteți specifica care organizație să aparțină repositoriului folosind argumentul `organization`:
+
+```py
+from huggingface_hub import create_repo
+
+create_repo("dummy-model", organization="huggingface")
+```
+
+Acesta va crea repositoriul `dummy-model` în spațiul organizației `huggingface`, cu condiția că dumneavoastră să apartineți acestei organizații.
+Alte argumente care pot fi utile sunt:
+
+- `private`, pentru a specifica dacă repositarul trebuie să fie vizibil celorlați sau nu.
+- `token`, dacă doriți să vă înlocuiți token-ul stocat în cache cu un anumit token.
+- `repo_type`, dacă doriți să creați un `dataset` sau `space` în loc de model. Valorile acceptate sunt `"dataset"` și `"space"`.
+
+Acum, trebuie să adăugați fișierele în repository-ul dumneavoastră! Treceți la secțiunea următoare pentru a vedea cele trei moduri de a face acest lucru.
+
+## Utilizarea interfeței web
+
+Interfața web oferă instrumente pentru a gestiona repositorii direct în Hub. Cu ajutorul acestei interfețe, puteți crea ușor repositorii, adăuga fișiere (și chiar și fișiere mari!), explora modele, vizualiza diffuri, și multe altele.
+
+Pentru a crea un nou repositoriu, vizitați [huggingface.co/new](https://huggingface.co/new):
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/new_model.png" alt="Pagină care prezintă modelul utilizat pentru crearea unui nou repository." width="80%"/>
+</div>
+
+În primul rând, specificați deținătorul repositoriului: acesta puteți fi dumneavoastră, fie orice organizație cu care sunteți afiliat. Dacă alegeți o organizație, modelul va fi prezent pe pagina organizației și toți membrii acesteia vor avea posibilitatea să contribuie la repositoriu.
+
+În al doilea rând, introduceți numele modelului dumneavoastră. Acest lucru va fi și denumirea repositoriului. În final, puteți specifica dacă doriți ca modelul dumneavoastră să fie public sau privat. Modelele private nu sunt vizibile ceilorlalți.
+
+După crearea repositoriului, ar trebui să vedeți o pagină ca aceasta:
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/empty_model.png" alt="O pagină goală a modelului după crearea unui nou repository." width="80%"/>
+</div>
+
+Acesta este locul unde va fi găzduit modelul. Pentru a începe să populați acesta, puteți adăuga un fișier README direct din interfața web.
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/dummy_model.png" alt="Fișierul README care arată capacitățile Markdown." width="80%"/>
+</div>
+
+Fișierul README este scris în format Markdown - vă rugăm să fiți creativi cu el! A treia parte a acestui capitol se ocupă de crearea unui model card. Acestea sunt foarte importante pentru a aduce valoare modelului dumneavoastră, deoarece este acolo unde spuneți celorlalți ce poate face.
+
+Dacă vă uitați la secțiunea "Fișiere și versiuni", veți vedea că nu sunt prea multe fișiere acolo încă - doar *README.md* pe care l-ați creat dumneavoastră și *.gitattributes* care urmărește fișierele mari.
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/files.png" alt="Secțiunea 'Fișiere și versiuni' arată doar fișierul .gitattributes și README.md." width="80%"/>
+</div>
+
+Vom vedea mai târziu cum să adăugați câteva fișiere noi.
+
+## Încărcarea fișierelor modelului[[uploading-the-model-files]]
+
+Sistemul pentru a gestiona fișierele în Hugging Face Hub se bazează pe git pentru fișierele obișnuite, și pe git-lfs (care se descrifrează ca [Git Large File Storage](https://git-lfs.github.com/)) pentru fișierele mai mari.
+
+În secțiunea următoare, vom discuta despre trei metode diferite de încărcare a fișierelor în Hub: prin `huggingface_hub` și prin comanda git.
+
+### Metoda `upload_file`[[the-uploadfile-approach]]
+
+Prin `upload_file` nu este necesar să instalați git și git-lfs pe sistemul dumneavoastră. Acest lucru încarcă direct fișierele în 🤗 Hub folosind HTTP POST requests. O limitare a acestei metode este că ea nu se ocupă de fișiere care sunt mai mari de 5GB.
+Dacă fișierele dumneavoastră sunt mai mari decât 5 GB, vă rugăm să urmați celelalte două metode descrise mai jos.
+
+API-ul poate fi folosit astfel:
+
+```python
+from huggingface_hub import upload_file
+
+upload_file(
+    "<path_to_file>/config.json",
+    path_in_repo="config.json",
+    repo_id="<namespace>/dummy-model",
+)
+```
+
+Acest lucru va încărca fișierul `config.json` disponibil la `<path_to_file>` la rootul repositoriului ca `config.json`, în `dummy-model` repository.
+Alte argumente utile pot fi:
+
+- `token`, dacă doriți să înlocuiți tokenul stocat în cache cu un alt token.
+- `repo_type`, dacă doriți să încărcați într-un `dataset` sau într-un `space` în locul modelului. Valorile acceptate sunt `"dataset"` și `"space"`.
+
+### Clasa `Repository`[[the-repository-class]]
+
+Clasa `Repository` gestionează un repository local în-tro manieră asemănătoare gitului. Ea abstracționează majoritatea problemelor pe care le întâlniți cu git pentru a oferi toate caracteristicile necesare.
+
+Utilizarea acestei clase necesită ca dumneavoastră să aveți instalat git și git-lfs, așadar asigurați-vă că aveți instalat git-lfs (vezi [aici](https://git-lfs.github.com/) pentru instrucțiunile de instalare) și setat înainte de a începe.
+
+Pentru a vă juca cu repositoriul pe care l-am creat, puteți porni prin inițializarea lui ca un folder local printr-un clonarea repositoriului remote:
+
+```py
+from huggingface_hub import Repository
+
+repo = Repository("<path_to_dummy_folder>", clone_from="<namespace>/dummy-model")
+```
+
+Acesta a creat folderele `<path_to_dummy_folder>` în folderul de lucru. Acest folder conține doar fișierul `.gitattributes` pentru că acesta este singurul fișier creat atunci când inițializați repositoriul prin `create_repo`.
+
+Acum puteți folosi majoritatea metodelor tradiționale ale gitului:
+
+```python
+repo.git_pull()
+repo.git_add()
+repo.git_commit()
+repo.git_push()
+repo.git_tag()
+```
+
+Și altele! Vă recomandăm să vă uitați la documentația `Repository` disponibilă [aici](https://github.com/huggingface/huggingface_hub/tree/main/src/huggingface_hub#advanced-programmatic-repository-management) pentru o înțelegere generală a tuturor metodelor disponibile.
+
+Pentru moment, avem un model și un tokenizer pe care doriți să îl trimiteți în hub. Am reușit să clonăm repositoriul local, deci putem salva fișierele în acesta.
+
+În primul rând asigurați-vă că copia locală este la zi cu ultimele schimbări:
+
+```python
+repo.git_pull()
+```
+
+Odată ce am facut asta, salvați fișierele modelului și al tokenizerul:
+
+```python
+model.save_pretrained("<path_to_dummy_folder>")
+tokenizer.save_pretrained("<path_to_dummy_folder>")
+```
+
+Folder-ul `<path_to_dummy_folder>` acum conține toate fișierele modelului dumneavoastră și ale tokenizerul. Vom urma fluxul tradițional de git adăugând fișiere în zona de pregătire, făcând commit și push fișierelor în hub:
+
+```python
+repo.git_add()
+repo.git_commit("Adăugarea fișierelor modelului și ale tokenizerului")
+repo.git_push()
+```
+
+Felicitări! Ați reușit să încărcați primele fișiere în hub.
+
+### Folosirea Git[[the-git-based-approach]]
+
+Acesta este abordarea cea mai de bază pentru încărcarea fișierelor: vom face ast cu ajutorul git și git-lfs direct. Cea mai grea parte este abstractizată prin abordări anterioare, dar există câteva excepții cu metoda următoare, așadar ne vom referi la un use-case mai complicat.
+
+Pentru această clasă se cere să aveți instalate git și git-lfs, așadar asigurați-vă că aveți [git-lfs](https://git-lfs.github.com/) instalat (vedeți aici instrucțiunile de instalare) și configurat înainte să începeți.
+
+În primul rând, inițializați git-lfs:
+
+```bash
+git lfs install
+```
+
+```bash
+Updated git hooks.
+Git LFS initialized.
+```
+
+După ce ați făcut acest lucru, primul pas este să faceți o copie a repositoriului dumneavoastră:
+
+```bash
+git clone https://huggingface.co/<namespace>/<your-model-id>
+```
+
+Numele meu de utilizator este `lysandre` și am folosit numele modelului `dummy`, așadar comanda mea se termină cu următorul rezultat:
+
+```
+git clone https://huggingface.co/lysandre/dummy
+```
+
+Acum am un folder denumit *dummy* în folderul meu de lucru. Pot intra în folder cu ajutorul `cd` și pot examina conținutul:
+
+```bash
+cd dummy && ls
+```
+
+```bash
+README.md
+```
+
+Dacă ați creat repositoriul dumneavoastră folosind metodă din partea Hugging Face Hub, `create_repo` , acest folder ar trebui să conțină doar un fișier cu numele *.gitattributes*. Dacă ați urmat instrucțiunile din secțiunea anterioară pentru crearea repositoriului folosind interfața web, atunci folderul ar trebui să conțină un singur fișier *README.md* și, de asemenea, un fișier cu numele *.gitattributes*, pe care nu-l puteți vedea.
+
+Adăugarea unui fișier de mărime obișnuită, precum un fișier de configurare, un vocabulary file sau orice alt tip de fișier care au mai puțin de câțiva megabytes se realizează exact așa cum ați face în orice sistem git. Cu toate acestea, pentru a încărca fișiere mai mari, este necesară utilizarea a git-lfs pentru a le trimite spre *huggingface.co*.
+
+Să ne întoarcem la Python pentru a genera un model și tokenizer pe care am dori să le facem commit în repositoriul nostru dummy:
+
+{#if fw === 'pt'}
+```py
+from transformers import AutoModelForMaskedLM, AutoTokenizer
+
+checkpoint = "camembert-base"
+
+model = AutoModelForMaskedLM.from_pretrained(checkpoint)
+tokenizer = AutoTokenizer.from_pretrained(checkpoint)
+
+# Faceți orice cu modelul, antrenați-l, aplicați fine-tuning... 
+
+model.save_pretrained("<path_to_dummy_folder>")
+tokenizer.save_pretrained("<path_to_dummy_folder>")
+```
+{:else}
+```py
+from transformers import TFAutoModelForMaskedLM, AutoTokenizer
+
+checkpoint = "camembert-base"
+
+model = TFAutoModelForMaskedLM.from_pretrained(checkpoint)
+tokenizer = AutoTokenizer.from_pretrained(checkpoint)
+
+# Faceți orice cu modelul, antrenați-l, aplicați fine-tuning... 
+
+model.save_pretrained("<path_to_dummy_folder>")
+tokenizer.save_pretrained("<path_to_dummy_folder>")
+```
+{/if}
+
+Acum am salvat câteva artefacte de model și tokenizer, așadar să examinăm din nou folderul *dummy*:
+
+```bash
+ls
+```
+
+{#if fw === 'pt'}
+```bash
+config.json  pytorch_model.bin  README.md  sentencepiece.bpe.model  special_tokens_map.json tokenizer_config.json  tokenizer.json
+```
+Dacă priviți la dimensiunile fișierelor (de exemplu, folosind `ls -lh`), ar trebui să vedeți că singurul outlier este model state dict file (*pytorch_model.bin*), care are mai mult de 400 MB.
+
+{:else}
+```bash
+config.json  README.md  sentencepiece.bpe.model  special_tokens_map.json  tf_model.h5  tokenizer_config.json  tokenizer.json
+```
+Dacă priviți la dimensiunile fișierelor (de exemplu, folosind`ls -lh`), ar trebui să vedeți că singurul outlier este model state dict file (*t5_model.h5*), care are mai mult de 400 MB.
+
+{/if}
+
+<Tip>
+✏️ Dacă creați repositoriul folosind interfața web, fișierul *.gitattributes* va fi automat configurat pentru a considera anumite extensii de fișiere, precum *.bin* și *.h5*, ca fiind fișiere mari. În acest caz nu este necesară nici o setare suplimentară din partea ta, pentru că git-lfs le va urmări automat.
+</Tip>
+
+Acum putem continua procesul în felul nostru obișnuit cu repositoriurile Git tradiționale. Putem adăuga toate fișierele în mediul de stocare a Git folosind comanda `git add`:
+
+```bash
+git add .
+```
+
+Puteți verifica fișierele curente care sunt în stare de stocare utilizând următoarea comandă:
+
+```bash
+git status
+```
+
+
+{#if fw === 'pt'}
+```bash
+On branch main
+Your branch is up to date with 'origin/main'.
+
+Changes to be committed:
+  (use "git restore --staged <file>..." to unstage)
+  modified:   .gitattributes
+	new file:   config.json
+	new file:   pytorch_model.bin
+	new file:   sentencepiece.bpe.model
+	new file:   special_tokens_map.json
+	new file:   tokenizer.json
+	new file:   tokenizer_config.json
+```
+{:else}
+```bash
+On branch main
+Your branch is up to date with 'origin/main'.
+
+Changes to be committed:
+  (use "git restore --staged <file>..." to unstage)
+  modified:   .gitattributes
+  	new file:   config.json
+	new file:   sentencepiece.bpe.model
+	new file:   special_tokens_map.json
+	new file:   tf_model.h5
+	new file:   tokenizer.json
+	new file:   tokenizer_config.json
+```
+{/if}
+
+De asemenea, putem verifica dacă git-lfs monitorizează fisierele corecte folosind comanda sa `status`:
+
+```bash
+git lfs status
+```
+
+
+{#if fw === 'pt'}
+```bash
+On branch main
+Objects to be pushed to origin/main:
+
+
+Objects to be committed:
+
+	config.json (Git: bc20ff2)
+	pytorch_model.bin (LFS: 35686c2)
+	sentencepiece.bpe.model (LFS: 988bc5a)
+	special_tokens_map.json (Git: cb23931)
+	tokenizer.json (Git: 851ff3e)
+	tokenizer_config.json (Git: f0f7783)
+
+Objects not staged for commit:
+
+
+```
+
+Vom observa că toate fișierele au `Git` ca handler, cu excepția *pytorch_model.bin* și *sentencepiece.bpe.model*, care au `LFS`. Excelent!
+
+{:else}
+```bash
+On branch main
+Objects to be pushed to origin/main:
+
+
+Objects to be committed:
+
+	config.json (Git: bc20ff2)
+	sentencepiece.bpe.model (LFS: 988bc5a)
+	special_tokens_map.json (Git: cb23931)
+	tf_model.h5 (LFS: 86fce29)
+	tokenizer.json (Git: 851ff3e)
+	tokenizer_config.json (Git: f0f7783)
+
+Objects not staged for commit:
+
+
+```
+
+Observăm că toate fișierele au `Git` ca handler, cu excepția *t5_model.h5*, care are `LFS`. Excelent!
+
+{/if}
+
+Acum vom continua cu ultimii pași: commiting și pushing la repo-urile *huggingface.co*:
+
+```
+git commit -m "Prima versiune a modelului"
+```
+
+
+{#if fw === 'pt'}
+```bash
+[main b08aab1] First model version
+ 7 files changed, 29027 insertions(+)
+  6 files changed, 36 insertions(+)
+ create mode 100644 config.json
+ create mode 100644 pytorch_model.bin
+ create mode 100644 sentencepiece.bpe.model
+ create mode 100644 special_tokens_map.json
+ create mode 100644 tokenizer.json
+ create mode 100644 tokenizer_config.json
+```
+{:else}
+```bash
+[main b08aab1] First model version
+ 6 files changed, 36 insertions(+)
+ create mode 100644 config.json
+ create mode 100644 sentencepiece.bpe.model
+ create mode 100644 special_tokens_map.json
+ create mode 100644 tf_model.h5
+ create mode 100644 tokenizer.json
+ create mode 100644 tokenizer_config.json
+```
+{/if}
+
+Pushingul poate lua câteva minute, în funcție de viteza conexiunii tale la internet și mărimea fișierelor:
+
+```bash
+git push
+```
+
+```bash
+Uploading LFS objects: 100% (1/1), 433 MB | 1.3 MB/s, done.
+Enumerating objects: 11, done.
+Counting objects: 100% (11/11), done.
+Delta compression using up to 12 threads
+Compressing objects: 100% (9/9), done.
+Writing objects: 100% (9/9), 288.27 KiB | 6.27 MiB/s, done.
+Total 9 (delta 1), reused 0 (delta 0), pack-reused 0
+To https://huggingface.co/lysandre/dummy
+   891b41d..b08aab1  main -> main
+```
+
+{#if fw === 'pt'}
+Dacă ne uităm la repositoriul modelului când acest lucru este finalizat, putem vedea toate fișierele recent adăugate:
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/full_model.png" alt="Tabul 'Files and versions' conține acum toate fișierele recente adăugate." width="80%"/>
+</div>
+
+Interfața permite explorarea fișierelor modelului și a commiturilor și vizualizarea diferenței introduse de fiecare commit:
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/diffs.gif" alt="Diferența introdusă de ultimul commit." width="80%"/>
+</div>
+{:else}
+Dacă ne uităm la repositoriul modelului când acest lucru este finalizat, putem vedea toate fișierele recent adăugate:
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/full_model_tf.png" alt="Tabul 'Files and versions' conține acum toate fișierele recente adăugate." width="80%"/>
+</div>
+
+Interfața permite explorarea fișierelor modelului și a commiturilor și vizualizarea diferenței introduse de fiecare commit:
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/diffstf.gif" alt="Diferența introdusă de ultimul commit." width="80%"/>
+</div>
+{/if}
+```
\ No newline at end of file
diff --git a/chapters/rum/chapter4/4.mdx b/chapters/rum/chapter4/4.mdx
new file mode 100644
index 000000000..f8963f961
--- /dev/null
+++ b/chapters/rum/chapter4/4.mdx
@@ -0,0 +1,88 @@
+# Crearea unui card de model[[building-a-model-card]]
+
+
+<CourseFloatingBanner
+    chapter={4}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+Model card este un fișier care este, probabil, la fel de important ca și fișierele de model si tokenizer dintr-o repositoriul modelului. Este definiția centrală a modelului, asigurând reutilizarea de către membrii comunității și reproducerea rezultatelor, oferind o platformă pe care alți membri pot construi artefecatele lor.
+
+Documentarea procesului de antrenare și evaluare ajută celorlați să înțeleagă la ce să aștepte de la un model - iar oferirea informațiilor suficiente referitoare la datele folosite si preprocesarea acestora (înainte și după antrenare) vor ajuta la identificarea și înțelegerea limitelor, biaseruile și contextului în care modelul este și nu este folositor.
+
+Prin urmare, crearea unui model card care definește modelul dvs. este un pas foarte important. Aici, oferim câteva sfaturi care v-ar putea ajuta în acest sens. Crearea model cardului se face prin intermediul fișierului `README.md`, pe care l-ați văzut anterior, care este un fișier Markdown.
+
+Conceptul de "model card" provine dintr-o direcție de cercetare a Google, publicată inițial în articolul ["Model Cards for Model Reporting"](https://arxiv.org/abs/1810.03993) scrisă de Margaret Mitchell et al. O parte semnificativă dintre informațiile conținute aici sunt bazate pe acest articol, iar noi vă recomandăm să verificați dacă doriți să înțelegeți de ce model cardurile sunt atât importante într-o lume care valorifică reproducerea, reutilizarea și echitatea.
+
+Model cardul începe cu o prezentare scurtă și generală a ceea ce este modelul - urmată de detalii suplimentare în secțiunile următoare:
+
+- Descrierea modelului
+- Utilizări intenționate și limitările modelului
+- Cum se utilizează
+- Limitări și bias
+- Datele de antrenare
+- Procedura de antrenare
+- Rezultatele evaluării
+
+Hai să vedem ce ar trebui să conțină fiecare dintre aceste secțiuni.
+
+### Descrierea modelului[[model-description]]
+
+Secțiunea de descriere a modelului conține detalii generale despre model. Aceasta include arhitectura, versiunea, dacă a fost introdus într-un articol științific, dacă este disponibilă o implementare originală, autorul și informații generale despre model. Orice drepturi de autor ar trebui să fie atribuite în această secțiune. Informația generală despre procedurile de antrenare, parametrii și avertismente pot fi menționate aici.
+
+### Utilizări intenționate și limitările modelului[[intended-uses-limitations]]
+
+Aici descrieți utilizările pentru care modelul este destinat - inclusiv limba și domeniile unde se poate aplica. Această secțiune din model card poate documenta și zone cunoscute ca nefiind în scopul modelului sau unde este probabil să funcționeze suboptimal.
+
+### Cum se utilizează[[how-to-use]]
+
+Acesta secțiune ar trebui să includă exemple despre cum să utilizați modelul. Acest lucru poate prezenta utilizarea funcției `pipeline()`, utilizarea claselor de model si tokenizer, și orice cod care credeți că ar putea fi util.
+
+### Datele de antrenare[[training-data]]
+
+Această secțiune trebuie să indice datasetul(urile) folosit pentru instruirea modelului. O descriere scurtă a datasetului(urilor) este binevenită.
+
+### Procedura de antrenare[[training-procedure]]
+
+Aici descrieți toate aspectele relevante ale antrenarii care sunt utile din punct de vedere al reproducerii. Acest lucru include orice preprocessing sau postprocessing efectuat pe date, precum și detalii ca numărul de epoci pe care a fost antrenat modelul, dimensiunea batch-ului, learning rateul si alte astfel de detalii.
+
+### Variabilele si metrice[[variable-and-metrics]]
+
+Aici descrieți metricile utilizate la evaluarea rezultatelor, precum și diferite aspecte pe care le măsurați. Menționați metricile folosite, pe ce dataset și care dataset split, astfel încât să fie ușor de comparat performanțele modelului cu cele ale altor modele.
+
+### Rezultatele evaluării[[evaluation-results]]
+
+În sfârșit, indicați cum s-a comportat modelul pe datasetul de evaluare. Dacă modelul foloseste un decision threshold, atunci includeți acest decision threshold în secțiunea respectivă - sau explicați că rezultatele sunt prezentate la diferite thresholduri pentru utilizările preconizate.
+
+## Exemplu[[example]]
+
+Aici puteți găsi câteva exemple ale unor Model Card:
+
+- [`bert-base-cased`](https://huggingface.co/bert-base-cased)
+- [`gpt2`](https://huggingface.co/gpt2)
+- [`distilbert`](https://huggingface.co/distilbert-base-uncased)
+
+Câteva exemple din alte organizații și companii pot fi găsite [aici](https://github.com/huggingface/model_card/blob/master/examples.md).
+
+## Notă[[note]]
+
+Model cardurile nu sunt o cerință obligatorie când se publică modelele si nu este necesar să includeți toate secțiunile descrise mai sus în Model Card. Cu toate acestea, documentarea explicită a modelului poate beneficia utilizatorilor viitori, deci vă recomandăm să completați cât mai multe dintre secțiuni.
+
+## Metadatele cardului de model[[model-card-metadata]]
+
+Dacă ați explorat puțin Hugging Face Hub atunci ar trebui să fi văzut că anumite modele aparțin anumitor categorii: puteți filtra acestea după diverse domenii. Categoriile modelului sunt identificate prin metadata adăugată în secțiunea de header a cardului.
+
+Spre exemplu, dacă vă uitați la modelul [`camembert-base`](https://huggingface.co/camembert-base/blob/main/README.md) atunci veți observa următoarea linii din headerul cardului:
+
+````
+---
+language: fr
+license: mit
+datasets:
+- oscar
+---
+```
+
+Metadatele acestei secțiuni sunt analizate de Hugging Face Hub, care apoi identifică acest model ca fiind un model francez, cu licență MIT și antrenat pe datasetul Oscar.
+
+[Toate specificările cardului](https://github.com/huggingface/hub-docs/blame/main/modelcard.md) permite specificarea a mai multor metadate, inclusiv limba, licența, etichetele, dataseturile folosite la antrenare și metricile evaluate.
\ No newline at end of file
diff --git a/chapters/rum/chapter4/5.mdx b/chapters/rum/chapter4/5.mdx
new file mode 100644
index 000000000..deb1921ae
--- /dev/null
+++ b/chapters/rum/chapter4/5.mdx
@@ -0,0 +1,12 @@
+# Partea 1 este completă!
+
+<CourseFloatingBanner
+    chapter={4}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+Acesta este sfârșitul primei părți a cursului! Partea 2 va fi lansată pe data de 15 noiembrie, cu un mare eveniment comunitar, mai multe informații găsiți [aici](https://huggingface.co/blog/course-launch-event).
+
+Acum, sunteți capabili să faceți fine-tune unui model preantrenat pe o problemă de clasificare a textului (o singură sau perechi de propoziții) și să încarci rezultatele la Model Hub. Să fii sigur că ai învățat această primă secțiune, ar trebui să faci exact acest lucru pe o problemă care ți se pare interesantă (și nu neapărat în limba engleză dacă vorbiți altă limbă)! Puteți găsi ajutor în [forumurile Hugging Face](https://discuss.huggingface.co/) și să împărtășiți proiectul dvs. pe [acest subiect](https://discuss.huggingface.co/t/share-your-projects/6803) odată ce ați terminat.
+
+Ne așteptăm cu nerăbdare să vedem ceea ce veți construi cu aceste cunoștințe :)!
\ No newline at end of file
diff --git a/chapters/rum/chapter4/6.mdx b/chapters/rum/chapter4/6.mdx
new file mode 100644
index 000000000..1255a0ca0
--- /dev/null
+++ b/chapters/rum/chapter4/6.mdx
@@ -0,0 +1,233 @@
+<FrameworkSwitchCourse {fw} />
+
+<!-- DISABLE-FRONTMATTER-SECTIONS -->
+
+# Quiz la final de capitol[[end-of-chapter-quiz]]
+
+<CourseFloatingBanner
+    chapter={4}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+Să testăm ceea ce ai învățat în acest capitol!
+  
+### 1. La ce sunt limitate modelele din Hub?
+
+<Question
+	choices={[ 
+		{
+			text: "Modelele din biblioteca 🤗 Transformers.",
+			explicație: "Ținând cont că modelele din biblioteca 🤗 Transformers sunt disponibile pe Hugging Face Hub, ele nu sunt singurele!"
+		},
+		{
+			text: "Toate modelele cu o interfață similară cu 🤗 Transformers.",
+			explicație: "Nu există nicio cerință de interfață când se încarcă modelele pe Hugging Face Hub."
+		},
+		{
+			text: "Nu există limite.",
+			explicație: "Adevărat! Nu există nici o limită când se încarcă modele pe Hub.",
+            corect: true
+		},
+        {
+			text: "Modele care, într-o anumită măsură, sunt legate de NLP.",
+			explicație: "Nu există nicio cerință privind domeniul aplicației!"
+		}
+	] }
+/>
+
+### 2. Cum poți gestiona modelele pe Hub?
+
+<Question
+	choices={[ 
+		{
+			text: "Printr-un cont GCP.",
+			explicație: "Greșit! "
+		},
+		{
+			text: "Prin distribuția peer-to-peer.",
+			explicație: "Greșit!"
+		},
+		{
+			text: "Prin git și git-lfs.",
+			explicație: "Corect! Modelele din Hub sunt simple repositorii Git, care utilizează <code>git-lfs</code> pentru fișiere mari.",
+            corect: true
+		}
+	] }
+/>
+
+### 3. Ce poți face utilizând interfața web a Hugging Face Hub?
+
+<Question
+	choices={[ 
+		{
+			text: "Forkingul unui repositoriu existent.",
+			explicație: "Nu se poate face forking la un repositoriu pe Hugging Face Hub."
+		},
+		{
+			text: "Crearea unui nou model repository.",
+			explicație: "Corect! Dar nu este singurul lucru pe care îl poți face...",
+            corect: true
+		},
+		{
+			text: "Gestionarea și editarea fișierelor.",
+			explicație: "Corect! Dar nuu este singurul lucru pe care îl poți face..."
+            correct: true
+		},
+        {
+			text: "Încărcarea de fișiere.",
+			explicație: "Corect! Dar nu este singurul lucru..."
+            correct: true
+		},
+        {
+			text: "Vizualizarea diferențelor între versiuni.",
+			explicație: "Corect! Dar nu este singurul lucru pe care îl poți face...",
+            corect: true
+		}
+	] }
+/>
+
+### 4. Ce este un model card?
+
+<Question
+	choices={[ 
+		{
+			text: "O descriere a modelului, deci mai puțin importantă decât fișierele model și tokenizer.",
+			explicație: "Este într-adevăr o descriere a modelului, dar este un element important. Dacă descrierea nu este completă sau absentă, utilitatea modelului se reduce drastic."
+		},
+		{
+			text: "Un mod de asigurare a reproducerii, reutilizării și egalității.",
+			explicație: "Corect! Oferirea informațiilor adecvate în model card va ajuta utilizatorii să utilizeze modelul și să fie conștienți de limitele și biasurile acestuia. ",
+            corect: true
+		},
+		{
+			text: "Un fișier Python care poate fi rulat pentru a obține informații despre model.",
+			explicație: "Model cardurile sunt simple fișiere Markdown."
+		}
+	] }
+/>
+
+Chapitru 4
+
+### 5. Câte dintre obiectele bibliotecii 🤗 Transformers pot fi împărtășite direct pe Hub cu `push_to_hub()`?
+
+{#if fw === 'pt'}
+<Question
+	choices={[
+		{
+			text: "Un tokenizer",
+			explain: "Corect! Toți tokenizerii au metoda <code>push_to_hub</code>, și utilizând-o, vor împărtăși toate fișierele tokenizerului (vocabular, arhitectură tokenizerului, etc.) către un repo. Însă acesta nu este singura soluție corectă!",
+            correct: true
+		},
+		{
+			text: "O configurare a modelului",
+			explain: "Corect! Toate configurațiile modelelor au metoda <code>push_to_hub</code>, și utilizând-o, vor împărtăși configurația către un repo. Și ce altceva poți oferi?",
+            correct: true
+		},
+		{
+			text: "Un model",
+			explain: "Corect! Toate modelele au metoda <code>push_to_hub</code>, și utilizând-o, vor împărtăși ei, precum și fișierele de configurare către un repo. Și nu numai asta!",
+            correct: true
+		},
+        {
+			text: "Un Trainer",
+			explain: "Corect — <code>Trainer</code> implementează metoda <code>push_to_hub</code>, și utilizând-o, vor încărca modelul, configurarea sa, tokenizerul, precum și un draft a unui model card către un repo. Încearcă și altă opțiune!",
+            correct: true
+		}
+	]}
+/>
+
+{:else}
+<Question
+	choices={[
+		{
+			text: "Un tokenizer",
+			explain: "Corect! Toți tokenizerii au metoda <code>push_to_hub</code>, și utilizând-o, vor împărtăși toate fișierele tokenizerului (vocabular, arhitectură tokenizerului, etc.) către un repo. Însă acesta nu este singura soluție corectă!",
+            correct: true
+		},
+		{
+			text: "O configurare a modelului",
+			explain: "Corect! Toate configurațiile modelelor au metoda <code>push_to_hub</code>, și utilizând-o, vor împărtăși configurația către un repo. Și ce altceva poți oferi?",
+            correct: true
+		},
+		{
+			text: "Un model",
+			explain: "Corect! Toate modelele au metoda <code>push_to_hub</code>, și utilizând-o, vor împărtăși ei, precum și fișierele de configurare către un repo. Și nu numai asta!",
+            correct: true
+		},
+        {
+			text: "Toate cele trei cu un callback dedicat",
+			explain: "Corect — <code>PushToHubCallback</code> va trimite regular toate aceste obiecte către un repo în timpul antrenării.",
+            correct: true
+		}
+	]}
+/>
+{/if}
+
+### 6. Care este primul pas atunci când utilizați metoda `push_to_hub()` sau instrumentele CLI?
+
+<Question
+	choices={[
+		{
+			text: "Logarea pe website",
+			explain: "Acest lucru nu vă va ajuta local."
+		},
+		{
+			text: "Rulați 'huggingface-cli login' în terminal.",
+			explain: "Corect — acest lucru va descărca și va stoca tokenul personal.",
+            correct: true
+		},
+		{
+			text: "Rulați 'notebook_login()' într-un notebook",
+			explain: "Corect — acest lucru va afișa un widget pentru a vă autentifica.",
+            correct: true
+		},
+	]
+    }
+/>
+
+
+### 7. Aveți un model și un tokenizer, cum le puteți încărca pe ambele în Hub?
+
+<Question
+	choices={[
+		{
+			text: "Prin apelarea directă a metodei `push_to_hub` pe model și tokenizer",
+			explain: "Corect!",
+            correct: true
+		},
+		{
+			text: "În cadrul runtime-ului Python, prin wrappingul acestora într-un <code>huggingface_hub</code>",
+			explain: "Modelele și tokenizerii deja beneficiază de utilitățile <code>huggingface_hub</code>: nu vă trebuie nici un wrapping suplimentar!"
+		},
+		{
+			text: "Prin salvarea lor pe disc și apelarea <code>transformers-cli upload-model</code>",
+			explain: "Comanda <code>upload-model</code> nu există."
+		}
+	]}
+/>
+
+### 8. Carele operații git poți face cu clasa `Repository`?
+
+<Question
+	choices={[
+		{
+			text: "Un commit",
+			explain: "Corect, metoda <code>git_commit()</code> este acolo pentru a face commit.",
+            correct: true
+		},
+		{
+			text: "Un pull",
+			explain: "Acesta este scopul metodei <code>git_pull()</code>",
+            correct: true
+		},
+		{
+			text: "Un push",
+			explain: "Metoda <code>git_push()</code> face acest lucru.",
+            correct: true
+		},
+		{
+			text: "Un merge",
+			explain: "Nu, această operație nu va fi niciodată posibilă cu acest API."
+		}
+	]}
+/>
\ No newline at end of file

From 6f9882735d57587264b82fca8640b2b0310d9880 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Tue, 27 May 2025 11:28:10 +0300
Subject: [PATCH 112/167] fix: solve formatting

---
 chapters/rum/chapter4/3.mdx | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/chapters/rum/chapter4/3.mdx b/chapters/rum/chapter4/3.mdx
index dda42f45e..d2ab5ce4c 100644
--- a/chapters/rum/chapter4/3.mdx
+++ b/chapters/rum/chapter4/3.mdx
@@ -420,7 +420,7 @@ checkpoint = "camembert-base"
 model = AutoModelForMaskedLM.from_pretrained(checkpoint)
 tokenizer = AutoTokenizer.from_pretrained(checkpoint)
 
-# Faceți orice cu modelul, antrenați-l, aplicați fine-tuning... 
+# Faceți orice cu modelul, antrenați-l, aplicați fine-tuning...
 
 model.save_pretrained("<path_to_dummy_folder>")
 tokenizer.save_pretrained("<path_to_dummy_folder>")
@@ -434,7 +434,7 @@ checkpoint = "camembert-base"
 model = TFAutoModelForMaskedLM.from_pretrained(checkpoint)
 tokenizer = AutoTokenizer.from_pretrained(checkpoint)
 
-# Faceți orice cu modelul, antrenați-l, aplicați fine-tuning... 
+# Faceți orice cu modelul, antrenați-l, aplicați fine-tuning...
 
 model.save_pretrained("<path_to_dummy_folder>")
 tokenizer.save_pretrained("<path_to_dummy_folder>")

From e5722ca5206236a404f865c24531253eb288b5f0 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Tue, 27 May 2025 11:34:28 +0300
Subject: [PATCH 113/167] fix: revert deletion of chapter 0

---
 chapters/rum/chapter0/1.mdx | 110 ++++++++++++++++++++++++++++++++++++
 1 file changed, 110 insertions(+)
 create mode 100644 chapters/rum/chapter0/1.mdx

diff --git a/chapters/rum/chapter0/1.mdx b/chapters/rum/chapter0/1.mdx
new file mode 100644
index 000000000..c7c072707
--- /dev/null
+++ b/chapters/rum/chapter0/1.mdx
@@ -0,0 +1,110 @@
+# Introducere[[introducere]]
+
+Bun venit la cursul Hugging Face! Această introducere te va ghida în configurarea environment-ului de lucru. Dacă abia începi cursul, îți recomandăm să arunci o privire mai întâi asupra [Capitolului 1](/course/chapter1), apoi să te întorci și să îți configurezi environment-ul pentru a putea încerca singur codul.
+
+Toate bibliotecile pe care le vom folosi în acest curs sunt disponibile ca Python packages, așa că aici îți vom arăta cum să configurezi Python environment-ul și să instalezi librăriile specifice de care ai nevoie.
+
+Vom acoperi două moduri de a-ți configura environment-ul, folosind un notebook Colab sau un Python environment. Simte-te liber să alegi pe cel care ți se potrivește cel mai bine. Pentru începători, recomandăm să începi folosind un notebook Colab.
+
+Reține că nu vom acoperi sistemul Windows. Dacă folosești Windows, îți recomandăm să urmezi pașii folosind un notebook Colab. Dacă folosești o distribuție Linux sau macOS, poți folosi oricare dintre abordările descrise aici.
+
+Majoritatea cursului se bazează pe faptul că ai un cont Hugging Face. Îți recomandăm să creezi unul acum: [crează un cont](https://huggingface.co/join).
+
+## Folosirea unui notebook Google Colab[[folosind-un-notebook-google-colab]]
+
+Folosirea unui notebook Colab este cea mai simplă configurare posibilă; deschide un notebook în browserul tău și începe imediat să scrii cod!
+
+Dacă nu ești familiarizat cu Colab, îți recomandăm să începi urmând [introducerea](https://colab.research.google.com/notebooks/intro.ipynb). Colab îți permite să folosești hardware accelerat, cum ar fi GPU-uri sau TPU-uri, și este gratuit pentru sarcini mai mici.
+
+Odată ce ești confortabil să te descurci în Colab, creează un nou notebook și începe cu configurarea:
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter0/new_colab.png" alt="Un notebook Colab gol" width="80%"/>
+</div>
+
+Următorul pas este să instalezi librăriile pe care le vom folosi în acest curs. Vom folosi `pip` pentru instalare, care este managerul de packages pentru Python. În notebook-uri, poți rula comenzi de sistem începând comanda cu caracterul `!`, așa că poți instala librăria 🤗 Transformers astfel:
+
+```
+!pip install transformers
+```
+
+Te poți asigura că pachetul a fost instalat corect importându-l în cadrul mediului tău Python:
+
+```
+import transformers
+```
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter0/install.gif" alt="O animație care arată rezultatul celor două comenzi de mai sus: instalare și importarea" width="80%"/>
+</div>
+
+Aceasta instalează o versiune foarte ușoară a 🤗 Transformers. În special, nu sunt instalate framework-uri specifice de machine learning (cum ar fi PyTorch sau TensorFlow). Deoarece vom folosi multe caracteristici diferite ale librăriei, îți recomandăm să instalezi versiunea pentru development, care vine cu toate dependențele necesare pentru cam orice caz de utilizare imaginabil:
+
+```
+!pip install transformers[sentencepiece]
+```
+
+Aceasta va dura puțin timp, dar apoi vei fi gata de drum pentru restul cursului!
+
+## Folosirea unui virtual environment Python[[folosirea-unui-virtual-environment-python]]
+
+Dacă preferi să folosești un mediu virtual Python, primul pas este să instalezi Python pe sistemul tău. Îți recomandăm să urmezi [această ghidare](https://realpython.com/installing-python/) pentru a începe.
+
+Odată ce ai Python instalat, ar trebui să poți rula comenzi Python în terminalul tău. Poți începe rulând următoarea comandă pentru a te asigura că este instalat corect înainte de a trece la pașii următori: `python --version`. Aceasta ar trebui să afișeze versiunea Python disponibilă acum pe sistemul tău.
+
+Când rulezi o comandă Python în terminalul tău, cum ar fi `python --version`, ar trebui să te gândești la programul care rulează comanda ta ca la Python-ul "principal" de pe sistemul tău. Îți recomandăm să păstrezi această instalare principală liberă de orice pachete și să o folosești pentru a crea environment-uri separate pentru fiecare aplicație pe care lucrezi — în acest fel, fiecare aplicație poate avea propriile sale dependențe și pachete, și nu va trebui să te preocupi de problemele de compatibilitate potențiale cu alte aplicații.
+
+În Python, acest lucru se face prin [*virtual environments*](https://docs.python.org/3/tutorial/venv.html), care sunt directory trees autonomi ce conțin fiecare o instalare Python cu o anumită versiune Python împreună cu toate pachetele de care are nevoie aplicația. Crearea unui astfel de mediu virtual poate fi realizată cu mai multe instrumente diferite, dar vom folosi pachetul oficial Python pentru acest scop, denumit [`venv`](https://docs.python.org/3/library/venv.html#module-venv).
+
+În primul rând, creează folder în care dorești ca aplicația ta să locuiască — de exemplu, ai putea dori să faci un nou folder numit *transformers-course* în rădăcina folderului tău personal:
+
+```
+mkdir ~/transformers-course
+cd ~/transformers-course
+```
+
+Din interiorul acestui folder, creează un virtual environment folosind modulul Python `venv`:
+
+```
+python -m venv .env
+```
+
+Acum ar trebui să ai un folder numit *.env* în folderul tău altfel gol:
+
+```
+ls -a
+```
+
+```out
+.      ..    .env
+```
+
+Poți să intri și să ieși din environment folosind comenzile `activate` și `deactivate`:
+
+```
+# Activează mediul virtual
+source .env/bin/activate
+
+# Dezactivează virtual environment-ul
+deactivate
+```
+
+Te poți asigura că environment-ul este activat rulând comanda `which python`: dacă aceasta indică către virtual environment, atunci l-ai activat cu succes!
+
+```
+which python
+```
+
+```out
+/home/<user>/transformers-course/.env/bin/python
+```
+
+### Instalarea dependențelor[[instalarea-dependențelor]]
+
+La fel ca în secțiunea anterioară despre utilizarea instanțelor Google Colab, acum va trebui să instalezi pachetele necesare pentru a continua. Din nou, poți instala versiunea pentru development a 🤗 Transformers folosind managerul de pachete `pip`:
+
+```
+pip install "transformers[sentencepiece]"
+```
+
+Acum ești gata să începi!
\ No newline at end of file

From 1b93f33662828c25fb8b7dd522e91389415250c8 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Tue, 27 May 2025 11:38:25 +0300
Subject: [PATCH 114/167] fix: solve gitignore diff

---
 .gitignore | 1 +
 1 file changed, 1 insertion(+)

diff --git a/.gitignore b/.gitignore
index 9f8d58807..a1d21056b 100644
--- a/.gitignore
+++ b/.gitignore
@@ -81,3 +81,4 @@ nbs/
 # Byte-compiled
 __pycache__/
 .cache/
+

From 0cea075da875fdc15e74705e2c1f4a8388796a55 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Tue, 27 May 2025 11:50:45 +0300
Subject: [PATCH 115/167] fix: solve bad folder structure

---
 .codegpt/head                 |   1 -
 .gitignore                    |   2 -
 chapters/ro/_toctree.yml      |  28 --
 chapters/ro/chapter0/1.mdx    | 110 -----
 chapters/ro/chapter2/1.mdx    |  28 --
 chapters/ro/chapter2/2.mdx    | 364 -----------------
 chapters/ro/chapter2/3.mdx    | 235 -----------
 chapters/ro/chapter2/4.mdx    | 246 -----------
 chapters/ro/chapter2/5.mdx    | 338 ---------------
 chapters/ro/chapter2/6.mdx    | 164 --------
 chapters/ro/chapter2/7.mdx    |  19 -
 chapters/ro/chapter2/8.mdx    | 310 --------------
 chapters/ro/chapter3/1.mdx    |  25 --
 chapters/ro/chapter3/2.mdx    | 393 ------------------
 chapters/ro/chapter3/3.mdx    | 174 --------
 chapters/ro/chapter3/3_tf.mdx | 206 ----------
 chapters/ro/chapter3/4.mdx    | 361 ----------------
 chapters/ro/chapter3/5.mdx    |  26 --
 chapters/ro/chapter3/6.mdx    | 301 --------------
 chapters/ro/chapter4/1.mdx    |  22 -
 chapters/ro/chapter4/2.mdx    |  98 -----
 chapters/ro/chapter4/3.mdx    | 641 -----------------------------
 chapters/ro/chapter4/4.mdx    |  88 ----
 chapters/ro/chapter4/5.mdx    |  12 -
 chapters/ro/chapter4/6.mdx    | 233 -----------
 chapters/ro/chapter5/1.mdx    |  22 -
 chapters/ro/chapter5/2.mdx    | 173 --------
 chapters/ro/chapter5/3.mdx    | 748 ----------------------------------
 chapters/ro/chapter5/4.mdx    | 287 -------------
 chapters/ro/chapter5/5.mdx    | 404 ------------------
 chapters/ro/chapter5/6.mdx    | 517 -----------------------
 chapters/ro/chapter5/7.mdx    |  16 -
 chapters/ro/chapter5/8.mdx    | 228 -----------
 33 files changed, 6820 deletions(-)
 delete mode 100644 .codegpt/head
 delete mode 100644 chapters/ro/_toctree.yml
 delete mode 100644 chapters/ro/chapter0/1.mdx
 delete mode 100644 chapters/ro/chapter2/1.mdx
 delete mode 100644 chapters/ro/chapter2/2.mdx
 delete mode 100644 chapters/ro/chapter2/3.mdx
 delete mode 100644 chapters/ro/chapter2/4.mdx
 delete mode 100644 chapters/ro/chapter2/5.mdx
 delete mode 100644 chapters/ro/chapter2/6.mdx
 delete mode 100644 chapters/ro/chapter2/7.mdx
 delete mode 100644 chapters/ro/chapter2/8.mdx
 delete mode 100644 chapters/ro/chapter3/1.mdx
 delete mode 100644 chapters/ro/chapter3/2.mdx
 delete mode 100644 chapters/ro/chapter3/3.mdx
 delete mode 100644 chapters/ro/chapter3/3_tf.mdx
 delete mode 100644 chapters/ro/chapter3/4.mdx
 delete mode 100644 chapters/ro/chapter3/5.mdx
 delete mode 100644 chapters/ro/chapter3/6.mdx
 delete mode 100644 chapters/ro/chapter4/1.mdx
 delete mode 100644 chapters/ro/chapter4/2.mdx
 delete mode 100644 chapters/ro/chapter4/3.mdx
 delete mode 100644 chapters/ro/chapter4/4.mdx
 delete mode 100644 chapters/ro/chapter4/5.mdx
 delete mode 100644 chapters/ro/chapter4/6.mdx
 delete mode 100644 chapters/ro/chapter5/1.mdx
 delete mode 100644 chapters/ro/chapter5/2.mdx
 delete mode 100644 chapters/ro/chapter5/3.mdx
 delete mode 100644 chapters/ro/chapter5/4.mdx
 delete mode 100644 chapters/ro/chapter5/5.mdx
 delete mode 100644 chapters/ro/chapter5/6.mdx
 delete mode 100644 chapters/ro/chapter5/7.mdx
 delete mode 100644 chapters/ro/chapter5/8.mdx

diff --git a/.codegpt/head b/.codegpt/head
deleted file mode 100644
index 61e0708bd..000000000
--- a/.codegpt/head
+++ /dev/null
@@ -1 +0,0 @@
-d92002a2-d67d-44e7-9370-14bf913c3669
\ No newline at end of file
diff --git a/.gitignore b/.gitignore
index fa8e74203..a1d21056b 100644
--- a/.gitignore
+++ b/.gitignore
@@ -82,5 +82,3 @@ nbs/
 __pycache__/
 .cache/
 
-
-.codegpt
\ No newline at end of file
diff --git a/chapters/ro/_toctree.yml b/chapters/ro/_toctree.yml
deleted file mode 100644
index 25730606c..000000000
--- a/chapters/ro/_toctree.yml
+++ /dev/null
@@ -1,28 +0,0 @@
-- title: 0. Configurare
-  sections:
-  - local: chapter0/1
-    title: Introducere
-
-- title: 1. Modele Transformer
-  sections:
-  - local: chapter1/1
-    title: Introducere
-  - local: chapter1/2
-    title: Procesarea limbajului natural și modelele de limbaj mari
-  - local: chapter1/3
-    title: Transformers, ce pot face?
-  - local: chapter1/4
-    title: Cum funcționează Transformers?
-  - local: chapter1/5
-    title: Modele Encoder
-  - local: chapter1/6
-    title: Modele Decoder
-  - local: chapter1/7
-    title: Modele secvență-la-secvență
-  - local: chapter1/8
-    title: Prejudecăți și limitări
-  - local: chapter1/9
-    title: Rezumat
-  - local: chapter1/10
-    title: Quiz de final de capitol
-    quiz: 1
diff --git a/chapters/ro/chapter0/1.mdx b/chapters/ro/chapter0/1.mdx
deleted file mode 100644
index c7c072707..000000000
--- a/chapters/ro/chapter0/1.mdx
+++ /dev/null
@@ -1,110 +0,0 @@
-# Introducere[[introducere]]
-
-Bun venit la cursul Hugging Face! Această introducere te va ghida în configurarea environment-ului de lucru. Dacă abia începi cursul, îți recomandăm să arunci o privire mai întâi asupra [Capitolului 1](/course/chapter1), apoi să te întorci și să îți configurezi environment-ul pentru a putea încerca singur codul.
-
-Toate bibliotecile pe care le vom folosi în acest curs sunt disponibile ca Python packages, așa că aici îți vom arăta cum să configurezi Python environment-ul și să instalezi librăriile specifice de care ai nevoie.
-
-Vom acoperi două moduri de a-ți configura environment-ul, folosind un notebook Colab sau un Python environment. Simte-te liber să alegi pe cel care ți se potrivește cel mai bine. Pentru începători, recomandăm să începi folosind un notebook Colab.
-
-Reține că nu vom acoperi sistemul Windows. Dacă folosești Windows, îți recomandăm să urmezi pașii folosind un notebook Colab. Dacă folosești o distribuție Linux sau macOS, poți folosi oricare dintre abordările descrise aici.
-
-Majoritatea cursului se bazează pe faptul că ai un cont Hugging Face. Îți recomandăm să creezi unul acum: [crează un cont](https://huggingface.co/join).
-
-## Folosirea unui notebook Google Colab[[folosind-un-notebook-google-colab]]
-
-Folosirea unui notebook Colab este cea mai simplă configurare posibilă; deschide un notebook în browserul tău și începe imediat să scrii cod!
-
-Dacă nu ești familiarizat cu Colab, îți recomandăm să începi urmând [introducerea](https://colab.research.google.com/notebooks/intro.ipynb). Colab îți permite să folosești hardware accelerat, cum ar fi GPU-uri sau TPU-uri, și este gratuit pentru sarcini mai mici.
-
-Odată ce ești confortabil să te descurci în Colab, creează un nou notebook și începe cu configurarea:
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter0/new_colab.png" alt="Un notebook Colab gol" width="80%"/>
-</div>
-
-Următorul pas este să instalezi librăriile pe care le vom folosi în acest curs. Vom folosi `pip` pentru instalare, care este managerul de packages pentru Python. În notebook-uri, poți rula comenzi de sistem începând comanda cu caracterul `!`, așa că poți instala librăria 🤗 Transformers astfel:
-
-```
-!pip install transformers
-```
-
-Te poți asigura că pachetul a fost instalat corect importându-l în cadrul mediului tău Python:
-
-```
-import transformers
-```
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter0/install.gif" alt="O animație care arată rezultatul celor două comenzi de mai sus: instalare și importarea" width="80%"/>
-</div>
-
-Aceasta instalează o versiune foarte ușoară a 🤗 Transformers. În special, nu sunt instalate framework-uri specifice de machine learning (cum ar fi PyTorch sau TensorFlow). Deoarece vom folosi multe caracteristici diferite ale librăriei, îți recomandăm să instalezi versiunea pentru development, care vine cu toate dependențele necesare pentru cam orice caz de utilizare imaginabil:
-
-```
-!pip install transformers[sentencepiece]
-```
-
-Aceasta va dura puțin timp, dar apoi vei fi gata de drum pentru restul cursului!
-
-## Folosirea unui virtual environment Python[[folosirea-unui-virtual-environment-python]]
-
-Dacă preferi să folosești un mediu virtual Python, primul pas este să instalezi Python pe sistemul tău. Îți recomandăm să urmezi [această ghidare](https://realpython.com/installing-python/) pentru a începe.
-
-Odată ce ai Python instalat, ar trebui să poți rula comenzi Python în terminalul tău. Poți începe rulând următoarea comandă pentru a te asigura că este instalat corect înainte de a trece la pașii următori: `python --version`. Aceasta ar trebui să afișeze versiunea Python disponibilă acum pe sistemul tău.
-
-Când rulezi o comandă Python în terminalul tău, cum ar fi `python --version`, ar trebui să te gândești la programul care rulează comanda ta ca la Python-ul "principal" de pe sistemul tău. Îți recomandăm să păstrezi această instalare principală liberă de orice pachete și să o folosești pentru a crea environment-uri separate pentru fiecare aplicație pe care lucrezi — în acest fel, fiecare aplicație poate avea propriile sale dependențe și pachete, și nu va trebui să te preocupi de problemele de compatibilitate potențiale cu alte aplicații.
-
-În Python, acest lucru se face prin [*virtual environments*](https://docs.python.org/3/tutorial/venv.html), care sunt directory trees autonomi ce conțin fiecare o instalare Python cu o anumită versiune Python împreună cu toate pachetele de care are nevoie aplicația. Crearea unui astfel de mediu virtual poate fi realizată cu mai multe instrumente diferite, dar vom folosi pachetul oficial Python pentru acest scop, denumit [`venv`](https://docs.python.org/3/library/venv.html#module-venv).
-
-În primul rând, creează folder în care dorești ca aplicația ta să locuiască — de exemplu, ai putea dori să faci un nou folder numit *transformers-course* în rădăcina folderului tău personal:
-
-```
-mkdir ~/transformers-course
-cd ~/transformers-course
-```
-
-Din interiorul acestui folder, creează un virtual environment folosind modulul Python `venv`:
-
-```
-python -m venv .env
-```
-
-Acum ar trebui să ai un folder numit *.env* în folderul tău altfel gol:
-
-```
-ls -a
-```
-
-```out
-.      ..    .env
-```
-
-Poți să intri și să ieși din environment folosind comenzile `activate` și `deactivate`:
-
-```
-# Activează mediul virtual
-source .env/bin/activate
-
-# Dezactivează virtual environment-ul
-deactivate
-```
-
-Te poți asigura că environment-ul este activat rulând comanda `which python`: dacă aceasta indică către virtual environment, atunci l-ai activat cu succes!
-
-```
-which python
-```
-
-```out
-/home/<user>/transformers-course/.env/bin/python
-```
-
-### Instalarea dependențelor[[instalarea-dependențelor]]
-
-La fel ca în secțiunea anterioară despre utilizarea instanțelor Google Colab, acum va trebui să instalezi pachetele necesare pentru a continua. Din nou, poți instala versiunea pentru development a 🤗 Transformers folosind managerul de pachete `pip`:
-
-```
-pip install "transformers[sentencepiece]"
-```
-
-Acum ești gata să începi!
\ No newline at end of file
diff --git a/chapters/ro/chapter2/1.mdx b/chapters/ro/chapter2/1.mdx
deleted file mode 100644
index 75093a9f9..000000000
--- a/chapters/ro/chapter2/1.mdx
+++ /dev/null
@@ -1,28 +0,0 @@
-# Introducere[[introducere]]
-
-<CourseFloatingBanner
-    chapter={2}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-După cum ați văzut în [Capitolul 1](/course/chapter1), modelele Transformer sunt de obicei foarte voluminoase. Fiind alcătuite din milioane până la zeci de *miliarde* de parametri, instruirea și implementarea acestor modele este o sarcină complicată. În plus, cu noi modele lansate aproape zilnic și fiecare având propria sa implementare, testarea tuturor acestora nu este o sarcină ușoară.
-
-Biblioteca 🤗 Transformers a fost creată pentru a rezolva această problemă. Scopul său este de a oferi un singur API prin care orice model Transformer poate fi încărcat, instruit și salvat. Principalele caracteristici ale bibliotecii sunt:
-
-- ** Simplitate în utilizare**: Descărcarea, încărcarea și utilizarea unui model NLP de ultimă generație pentru inferență pot fi realizate în doar două linii de cod.
-- **Flexibilitate**: În esența lor, toate modelele sunt simple clase PyTorch `nn.Module` sau TensorFlow `tf.keras.Model` și pot fi manipulate ca orice alte modele în framework-urile lor respective de învățare automată (ML).
-- **Simplitate**: Aproape că nu se fac abstractizări în întreaga bibliotecă. „All in one file” este un concept de bază: trecerea înainte a unui model este definită în întregime într-un singur fișier, astfel încât codul în sine să fie ușor de înțeles și hackable.
-
-Această ultimă caracteristică face 🤗 Transformers destul de diferit de alte biblioteci ML. Modelele nu sunt construite pe module 
-care sunt partajate între fișiere; în schimb, fiecare model are propriile sale straturi. În plus, pe lângă faptul că modelele sunt mai ușor de abordat și de înțeles, acest lucru vă permite să experimentați cu ușurință pe un model fără a le afecta pe celelalte.
-
-Acest capitol va începe cu un exemplu end-to-end în care folosim împreună un model și un tokenizer pentru a replica funcția `pipeline()` introdusă în [Capitolul 1](/course/chapter1). În continuare, vom discuta despre API-ul modelului: vom analiza clasele de model și de configurare și vă vom arăta cum să încărcați un model și cum acesta procesează intrările numerice pentru a genera predicții. 
-
-Apoi vom analiza API-ul tokenizer, care este cealaltă componentă principală a funcției `pipeline()`. Tokenizerii se ocupă de prima și ultima etapă de procesare, gestionând conversia de la text la intrări numerice pentru rețeaua neuronală și conversia înapoi la text atunci când este necesar. În cele din urmă, vă vom arăta cum să vă ocupați de trimiterea mai multor propoziții printr-un model în cadrul unui lot pregătit, apoi vom încheia totul cu o examinare mai atentă a funcției  `tokenizer()`.
-
-
-<Tip>
-⚠️  
-Pentru a beneficia de toate funcțiile disponibile cu Model Hub și 🤗 Transformers, vă recomandăm <a href="https://huggingface.co/join">să vă creați un cont</a>.
-
-</Tip>
\ No newline at end of file
diff --git a/chapters/ro/chapter2/2.mdx b/chapters/ro/chapter2/2.mdx
deleted file mode 100644
index b0f1c4855..000000000
--- a/chapters/ro/chapter2/2.mdx
+++ /dev/null
@@ -1,364 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# În spatele pipeline-ului[[în-spatele-pipeline-ului]]
-
-{#if fw === 'pt'}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section2_pt.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section2_pt.ipynb"},
-]} />
-
-{:else}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section2_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section2_tf.ipynb"},
-]} />
-
-{/if}
-
-<Tip>
- 
-Aceasta este prima secțiune în care conținutul este ușor diferit în funcție de utilizarea PyTorch sau TensorFlow. Schimbați comutatorul din partea de sus a titlului pentru a selecta platforma pe care o preferați!
-</Tip>
-
-{#if fw === 'pt'}
-<Youtube id="1pedAIvTWXk"/>
-{:else}
-<Youtube id="wVN12smEvqg"/>
-{/if}
-
-Să începem cu un exemplu complet, aruncând o privire la ceea ce s-a întâmplat în spate atunci când am executat următorul cod în [Capitolul 1](/curs/capitol1):
-
-
-```python
-from transformers import pipeline
-
-classifier = pipeline("sentiment-analysis")
-classifier(
-    [
-        "I've been waiting for a HuggingFace course my whole life.",
-        "I hate this so much!",
-    ]
-)
-```
-
-și am obținut:
-
-```python out
-[{'label': 'POSITIVE', 'score': 0.9598047137260437},
- {'label': 'NEGATIVE', 'score': 0.9994558095932007}]
-```
-
-După cum am văzut în [Capitolul 1](/course/chapter1), acest pipeline grupează trei etape: preprocesarea, trecerea intrărilor prin model și postprocesarea:
-
-<div class="flex justify-center">
-<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/full_nlp_pipeline.svg" alt="The full NLP pipeline: tokenization of text, conversion to IDs, and inference through the Transformer model and the model head."/>
-<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/full_nlp_pipeline-dark.svg" alt="The full NLP pipeline: tokenization of text, conversion to IDs, and inference through the Transformer model and the model head."/>
-</div>
-
-Să trecem rapid prin fiecare dintre acestea.
-
-## Preprocesarea cu un tokenizator[[preprocesarea-cu-un-tokenizerator]]
-
-La fel ca alte rețele neuronale, modelele Transformer nu pot procesa direct text brut, astfel încât primul pas al pipeline-ului nostru este de a converti intrările de text în numere pe care modelul le poate înțelege. Pentru a face acest lucru, folosim un *tokenizer*, care va fi responsabil pentru:
-
-- Împărțirea datelor de intrare în cuvinte, părți de cuvinte sau simboluri (cum ar fi punctuația) care se numesc *tokens*
-- Maparea fiecărui token într-un număr întreg
-- Adăugarea de intrări suplimentare care pot fi utile pentru model
-
-Toată această preprocesare trebuie efectuată exact în același mod ca atunci când modelul a fost preinstruit, așa că mai întâi trebuie să descărcăm aceste informații din [Model Hub] (https://huggingface.co/models). Pentru a face acest lucru, folosim clasa `AutoTokenizer` și metoda sa `from_pretrained()`. Folosind numele checkpoint-ului modelului nostru, aceasta va prelua automat datele asociate cu tokenizer-ul modelului și le va stoca în cache (astfel încât acestea să fie descărcate doar prima dată când executați codul de mai jos).
-
-Deoarece punctul de control implicit al pipeline-ului `sentiment-analysis` este `distilbert-base-uncased-finetuned-sst-2-english` (puteți vedea fișa modelului [aici](https://huggingface.co/distilbert-base-uncased-finetuned-sst-2-english)), executăm următoarele:
-
-```python
-from transformers import AutoTokenizer
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-```
-
-Odată ce avem tokenizatorul, putem să îi transmitem direct propozițiile noastre și vom primi înapoi un dicționar care este gata să fie introdus în modelul nostru! Singurul lucru rămas de făcut este să convertim lista de ID-uri de intrare în tensori.
-
-Puteți utiliza 🤗 Transformers fără a trebui să vă faceți griji cu privire la cadrul ML utilizat ca backend; ar putea fi PyTorch sau TensorFlow, sau Flax pentru unele modele. Cu toate acestea, modelele Transformer acceptă numai *tensori * ca intrare. Dacă este prima dată când auziți despre tensori, vă puteți gândi la ei ca la matrici NumPy. Un array NumPy poate fi un scalar (0D), un vector (1D), o matrice (2D) sau poate avea mai multe dimensiuni. Este de fapt un tensor; tensorii altor cadre ML se comportă similar și sunt de obicei la fel de simplu de instanțiat ca și array-urile NumPy.
-
-Pentru a specifica tipul de tensori pe care dorim să îi primim înapoi (PyTorch, TensorFlow sau NumPy simplu), folosim argumentul `return_tensors`:
-
-
-{#if fw === 'pt'}
-```python
-raw_inputs = [
-    "I've been waiting for a HuggingFace course my whole life.",
-    "I hate this so much!",
-]
-inputs = tokenizer(raw_inputs, padding=True, truncation=True, return_tensors="pt")
-print(inputs)
-```
-{:else}
-```python
-raw_inputs = [
-    "I've been waiting for a HuggingFace course my whole life.",
-    "I hate this so much!",
-]
-inputs = tokenizer(raw_inputs, padding=True, truncation=True, return_tensors="tf")
-print(inputs)
-```
-{/if}
-
- 
-Nu vă faceți încă griji cu privire la padding și trunchiere; le vom explica mai târziu. Principalele lucruri de reținut aici sunt că puteți trece o propoziție sau o listă de propoziții, precum și specificarea tipului de tensori pe care doriți să îi primiți înapoi (dacă nu este trecut niciun tip, veți primi o listă de liste ca rezultat)
-{#if fw === 'pt'}
-
-Iată cum arată rezultatele ca tensori PyTorch:
-
-```python out
-{
-    'input_ids': tensor([
-        [  101,  1045,  1005,  2310,  2042,  3403,  2005,  1037, 17662, 12172, 2607,  2026,  2878,  2166,  1012,   102],
-        [  101,  1045,  5223,  2023,  2061,  2172,   999,   102,     0,     0,     0,     0,     0,     0,     0,     0]
-    ]), 
-    'attention_mask': tensor([
-        [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
-        [1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0]
-    ])
-}
-```
-{:else}
-
-Iată cum arată rezultatele ca tensori TensorFlow:
-
-```python out
-{
-    'input_ids': <tf.Tensor: shape=(2, 16), dtype=int32, numpy=
-        array([
-            [  101,  1045,  1005,  2310,  2042,  3403,  2005,  1037, 17662, 12172,  2607,  2026,  2878,  2166,  1012,   102],
-            [  101,  1045,  5223,  2023,  2061,  2172,   999,   102,     0,     0,     0,     0,     0,     0,     0,     0]
-        ], dtype=int32)>, 
-    'attention_mask': <tf.Tensor: shape=(2, 16), dtype=int32, numpy=
-        array([
-            [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
-            [1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0]
-        ], dtype=int32)>
-}
-```
-{/if}
-
- 
-Rezultatul în sine este un dicționar care conține două chei, `input_ids` și `attention_mask`. `input_ids` conține două rânduri de numere întregi (unul pentru fiecare propoziție) care sunt identificatorii unici ai simbolurilor din fiecare propoziție. Vom explica ce este `attention_mask` mai târziu în acest capitol. 
-
-## Parcurgerea modelului[[parcurgerea-modelului]]
-
-{#if fw === 'pt'}
-Putem descărca modelul nostru preinstruit în același mod în care am făcut-o cu tokenizatorul nostru. 🤗 Transformers oferă o clasă `AutoModel` care are și o metodă `from_pretrained()`:
-
-```python
-from transformers import AutoModel
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-model = AutoModel.from_pretrained(checkpoint)
-```
-{:else}
- 
-Putem descărca modelul nostru preinstruit în același mod în care am făcut-o cu tokenizatorul nostru. 🤗 Transformers oferă o clasă `TFAutoModel` care are și o metodă `from_pretrained`:
-
-```python
-from transformers import TFAutoModel
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-model = TFAutoModel.from_pretrained(checkpoint)
-```
-{/if}
-
- 
-În acest fragment de cod, am descărcat același checkpoint pe care l-am folosit anterior în pipeline-ul nostru (de fapt, ar fi trebuit să fie deja în cache) și am instanțiat un model cu acesta.
-
-Această arhitectură conține doar modulul Transformer de bază: având în vedere anumite intrări, acesta produce ceea ce vom numi *stări ascunse*, cunoscute și ca *caracteristici*. Pentru fiecare intrare a modelului, vom extrage un vector înalt-dimensional care reprezintă **înțelegerea contextuală a intrării respective de către modelul Transformer**.
-
-Dacă acest lucru nu are sens, nu vă faceți griji. Vom explica totul mai târziu.
-
-Deși aceste stări ascunse pot fi utile pe cont propriu, ele sunt de obicei intrări pentru o altă parte a modelului, cunoscută sub numele de *head*. În [Capitolul 1](/curs/capitol1), diferitele sarcini ar fi putut fi efectuate cu aceeași arhitectură, dar fiecăreia dintre aceste sarcini îi va fi asociat un head diferit.
-
-### Un vector multidimensional?[[un-vector-multidimensional]]
-
- 
-Vectorul emis de modulul Transformator este de obicei de dimensiuni mari. Acesta are în general trei dimensiuni:
-
-- **Dimensiunea lotului**: Numărul de secvențe prelucrate simultan (2 în exemplul nostru).
-- **Lungimea secvenței**: Lungimea reprezentării numerice a secvenței (16 în exemplul nostru).
-- **Dimensiunea ascunsă**: Dimensiunea vectorială a fiecărei intrări a modelului.
-
-Se spune că este multidimensional din cauza ultimei valori. Dimensiunea ascunsă poate fi foarte mare (768 este comună pentru modelele mai mici, iar în modelele mai mari aceasta poate ajunge la 3072 sau mai mult).
-
-Putem vedea acest lucru dacă introducem în modelul nostru intrările pe care le-am preprocesat:
-
-{#if fw === 'pt'}
-```python
-outputs = model(**inputs)
-print(outputs.last_hidden_state.shape)
-```
-
-```python out
-torch.Size([2, 16, 768])
-```
-{:else}
-```py
-outputs = model(inputs)
-print(outputs.last_hidden_state.shape)
-```
-
-```python out
-(2, 16, 768)
-```
-{/if}
-
- 
-Rețineți că ieșirile modelelor 🤗 Transformers se comportă ca `namedtuple`s sau dicționare. Puteți accesa elementele prin atribute (așa cum am făcut noi) sau prin cheie (`outputs[„last_hidden_state”]`), sau chiar prin index dacă știți exact unde se află lucrul pe care îl căutați (`outputs[0]`).
-
-### Modele de head-uri: Înțelegerea numerelor[modele-de-head-uri-înțelegerea-numerelor]]
-
-Head-urile modelelor iau ca intrare vectorul multidimensional al stărilor ascunse și le proiectează pe o altă dimensiune. Acestea sunt de obicei compuse din unul sau câteva straturi liniare:
-
-<div class="flex justify-center">
-<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/transformer_and_head.svg" alt="A Transformer network alongside its head."/>
-<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/transformer_and_head-dark.svg" alt="A Transformer network alongside its head."/>
-</div>
-
- 
-Rezultatul modelului Transformer este trimis direct la head-ul modelului pentru a fi prelucrat.
-
-În această diagramă, modelul este reprezentat de stratul său de încorporare și de straturile următoare. Stratul de încorporare convertește fiecare ID de intrare din intrarea tokenizată într-un vector care reprezintă tokenul asociat. Straturile ulterioare manipulează acești vectori folosind mecanismul de atenție pentru a produce reprezentarea finală a propozițiilor.
-
-Există multe arhitecturi diferite disponibile în 🤗 Transformers, fiecare fiind concepută în jurul abordării unei sarcini specifice. Iată o listă neexhaustivă:
-
-- `*Model` (extragerea stărilor ascunse)
-- `*ForCausalLM`
-- `*ForMaskedLM`
-- `*ForMultipleChoice`
-- `*ForQuestionAnswering`
-- `*ForSequenceClassification`
-- `*ForTokenClassification`
-- și altele 🤗
-
-{#if fw === 'pt'}
- Pentru exemplul nostru, vom avea nevoie de un model cu un head de clasificare a secvențelor (pentru a putea clasifica propozițiile ca fiind pozitive sau negative). Așadar, nu vom utiliza clasa `AutoModel`, ci `AutoModelForSequenceClassification`:
-
-```python
-from transformers import AutoModelForSequenceClassification
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
-outputs = model(**inputs)
-```
-{:else}
- Pentru exemplul nostru, vom avea nevoie de un model cu un head de clasificare a secvențelor (pentru a putea clasifica propozițiile ca fiind pozitive sau negative). Așadar, nu vom utiliza clasa `TFAutoModel`, ci `TFAutoModelForSequenceClassification`:
-
-```python
-from transformers import TFAutoModelForSequenceClassification
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint)
-outputs = model(inputs)
-```
-{/if}
- 
-Acum, dacă ne uităm la forma ieșirilor noastre, dimensiunea va fi mult mai mică: head-ul modelului ia ca intrare vectorii multidimensionali pe care i-am văzut înainte și scoate vectori care conțin două valori (una pentru fiecare etichetă):
-
-```python
-print(outputs.logits.shape)
-```
-
-{#if fw === 'pt'}
-```python out
-torch.Size([2, 2])
-```
-{:else}
-```python out
-(2, 2)
-```
-{/if}
-
- 
-Deoarece avem doar două propoziții și două etichete, rezultatul pe care îl obținem din modelul nostru este de forma 2 x 2.
-
-## Postprocesarea rezultatului[[postprocesarea-rezultatului]]
-
-Valorile pe care le obținem ca rezultat al modelului nostru nu au neapărat sens în sine. Să aruncăm o privire:
-
-```python
-print(outputs.logits)
-```
-
-{#if fw === 'pt'}
-```python out
-tensor([[-1.5607,  1.6123],
-        [ 4.1692, -3.3464]], grad_fn=<AddmmBackward>)
-```
-{:else}
-```python out
-<tf.Tensor: shape=(2, 2), dtype=float32, numpy=
-    array([[-1.5606991,  1.6122842],
-           [ 4.169231 , -3.3464472]], dtype=float32)>
-```
-{/if}
-
-Modelul nostru a prezis `[-1.5607, 1.6123]` pentru prima propoziție și `[ 4.1692, -3.3464]` pentru cea de-a doua. Acestea nu sunt probabilități, ci *logits*, scorurile brute, nenormalizate, emise de ultimul strat al modelului. Pentru a fi convertite în probabilități, acestea trebuie să treacă printr-un strat [SoftMax](https://en.wikipedia.org/wiki/Softmax_function) (toate modelele 🤗 Transformers produc logits, deoarece funcția de pierdere pentru formare va fuziona în general ultima funcție de activare, cum ar fi SoftMax, cu funcția de pierdere reală, cum ar fi entropia încrucișată):
-
-{#if fw === 'pt'}
-```py
-import torch
-
-predictions = torch.nn.functional.softmax(outputs.logits, dim=-1)
-print(predictions)
-```
-{:else}
-```py
-import tensorflow as tf
-
-predictions = tf.math.softmax(outputs.logits, axis=-1)
-print(predictions)
-```
-{/if}
-
-{#if fw === 'pt'}
-```python out
-tensor([[4.0195e-02, 9.5980e-01],
-        [9.9946e-01, 5.4418e-04]], grad_fn=<SoftmaxBackward>)
-```
-{:else}
-```python out
-tf.Tensor(
-[[4.01951671e-02 9.59804833e-01]
- [9.9945587e-01 5.4418424e-04]], shape=(2, 2), dtype=float32)
-```
-{/if}
-
- 
-Acum putem vedea că modelul a prezis `[0.0402, 0.9598]` pentru prima propoziție și `[0.9995, 0.0005]` pentru cea de-a doua. Acestea sunt scoruri de probabilitate care pot fi recunoscute.
-
-Pentru a obține etichetele corespunzătoare fiecărei poziții, putem inspecta atributul `id2label` din configurația modelului (mai multe despre acest lucru în secțiunea următoare):
-
-```python
-model.config.id2label
-```
-
-```python out
-{0: 'NEGATIVE', 1: 'POSITIVE'}
-```
-Acum putem concluziona că modelul a prezis următoarele:
- 
-- Prima propoziție: NEGATIV: 0,0402, POZITIV: 0,9598
-- A doua propoziție: NEGATIVĂ: 0,9995, POZITIVĂ: 0,0005
-
-Am reprodus cu succes cele trei etape ale pipeline-ului: preprocesarea cu tokenizere, trecerea intrărilor prin model și postprocesarea! Acum haideți să analizăm în profunzime fiecare dintre aceste etape.
-
-<Tip>
-
-✏️  
-** Încercați!** Alegeți două (sau mai multe) texte proprii și treceți-le prin conducta `sentiment-analysis`. Apoi repetați pașii pe care i-ați văzut aici și verificați dacă obțineți aceleași rezultate!
-
-</Tip>
diff --git a/chapters/ro/chapter2/3.mdx b/chapters/ro/chapter2/3.mdx
deleted file mode 100644
index e0f0758df..000000000
--- a/chapters/ro/chapter2/3.mdx
+++ /dev/null
@@ -1,235 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Modele[[modele]]
-
-{#if fw === 'pt'}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section3_pt.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section3_pt.ipynb"},
-]} />
-
-{:else}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section3_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section3_tf.ipynb"},
-]} />
-
-{/if}
-
-{#if fw === 'pt'}
-<Youtube id="AhChOFRegn4"/>
-{:else}
-<Youtube id="d3JVgghSOew"/>
-{/if}
-
-{#if fw === 'pt'}
- 
-În această secțiune vom analiza mai detaliat crearea și utilizarea unui model. Vom folosi clasa `AutoModel`, care este utilă atunci când doriți să instanțiați orice model dintr-un checkpoint.
-
-Clasa `AutoModel` și toate celelalte clase înrudite sunt, de fapt, simple wrappere ale gamei largi de modele disponibile în bibliotecă. Este un wrapper inteligent, deoarece poate ghici automat arhitectura modelului corespunzător pentru checkpoint-ul dumneavoastră și apoi instanțiază un model cu această arhitectură.
-
-{:else}
- 
-În această secțiune vom analiza mai detaliat crearea și utilizarea unui model. Vom utiliza clasa `TFAutoModel`, care este utilă atunci când doriți să instanțați un model dintr-un checkpoint.
-
-Clasa `TFAutoModel` și toate clasele înrudite cu aceasta sunt de fapt simple wrappere ale gamei largi de modele disponibile în bibliotecă. Este un wrapper inteligent, deoarece poate ghici automat arhitectura modelului corespunzător pentru checkpoint-ul dumneavoastră și apoi instanțiază un model cu această arhitectură.
-
-{/if}
-
-Cu toate acestea, dacă știți ce tip de model doriți să utilizați, puteți folosi direct clasa care definește arhitectura acestuia. Să aruncăm o privire la modul în care funcționează acest lucru cu un model BERT.
-
-## Crearea unui Transformer[[crearea-unui-transformer]]
-
-Primul lucru pe care va trebui să îl facem pentru a inițializa un model BERT este să încărcăm un obiect de configurare:
-
-{#if fw === 'pt'}
-```py
-from transformers import BertConfig, BertModel
-
-# Construirea configurației
-config = BertConfig()
-
-# Construirea modelului pornind de la configurație
-model = BertModel(config)
-```
-{:else}
-```py
-from transformers import BertConfig, TFBertModel
-
-# Construirea configurației
-config = BertConfig()
-
-#  Construirea modelului pornind de la configurație
-model = TFBertModel(config)
-```
-{/if}
-
-Configurația conține multe atribute care sunt utilizate pentru a construi modelul:
-
-```py
-print(config)
-```
-
-```python out
-BertConfig {
-  [...]
-  "hidden_size": 768,
-  "intermediate_size": 3072,
-  "max_position_embeddings": 512,
-  "num_attention_heads": 12,
-  "num_hidden_layers": 12,
-  [...]
-}
-```
-
-Deși nu ați văzut încă ce fac toate aceste atribute, ar trebui să recunoașteți unele dintre ele: atributul `hidden_size` definește dimensiunea vectorului `hidden_states`, iar `num_hidden_layers` definește numărul de straturi pe care le are modelul Transformer.
-
-### Diferite metode de încărcare[[diferite-metode-de-încărcare]]
-
-Crearea unui model din configurația implicită îl inițializează cu valori aleatorii:
-
-
-{#if fw === 'pt'}
-```py
-from transformers import BertConfig, BertModel
-
-config = BertConfig()
-model = BertModel(config)
-
-# Modelul este inițializat aleatoriu!
-```
-{:else}
-```py
-from transformers import BertConfig, TFBertModel
-
-config = BertConfig()
-model = TFBertModel(config)
-
-# Modelul este inițializat aleatoriu!
-```
-{/if}
-
-Modelul poate fi utilizat în această stare, dar va produce rezultate neclare; mai întâi trebuie să fie antrenat. Am putea antrena modelul de la zero pentru sarcina în cauză, dar, după cum ați văzut în [Capitolul 1](/course/chapter1), acest lucru ar necesita mult timp și o mulțime de date și ar avea un impact semnificativ asupra mediului. Pentru a evita efortul inutil, este esențial să puteți partaja și reutiliza modelele care au fost deja formate.
-
-Încărcarea unui model Transformer care este deja instruit este simplă - putem face acest lucru utilizând metoda `from_pr
-
-{#if fw === 'pt'}
-```py
-from transformers import BertModel
-
-model = BertModel.from_pretrained("bert-base-cased")
-```
-
-După cum ați văzut mai devreme, am putea înlocui `BertModel` cu clasa `AutoModel` echivalentă. Vom face acest lucru în continuare, deoarece acest lucru produce un cod compatibil cu checkpoint-urile; dacă codul dumneavoastră funcționează pentru un checkpoint, ar trebui să funcționeze fără probleme pentru altul. Acest lucru este valabil chiar dacă arhitectura este diferită, atât timp cât checkpoint-ul a fost instruit pentru o sarcină similară (de exemplu, o sarcină de analiză a sentimentelor).
-
-{:else}
-```py
-from transformers import TFBertModel
-
-model = TFBertModel.from_pretrained("bert-base-cased")
-```
-
-După cum ați văzut mai devreme, am putea înlocui `BertModel` cu clasa `AutoModel` echivalentă. Vom face acest lucru în continuare, deoarece acest lucru produce un cod compatibil cu checkpoint-urile; dacă codul dumneavoastră funcționează pentru un checkpoint, ar trebui să funcționeze fără probleme pentru altul. Acest lucru este valabil chiar dacă arhitectura este diferită, atât timp cât checkpoint-ul a fost instruit pentru o sarcină similară (de exemplu, o sarcină de analiză a sentimentelor).
-
-{/if}
-
-În exemplul de cod de mai sus nu am utilizat `BertConfig` și, în loc de acesta, am încărcat un model preinstruit prin intermediul identificatorului `bert-base-cased`. Acesta este un checkpoint al modelului care a fost antrenat chiar de autorii BERT; puteți găsi mai multe detalii despre acesta în [model card](https://huggingface.co/bert-base-cased).
-
-Acest model este acum inițializat cu toate weight-urile din checkpoint. Acesta poate fi utilizat direct pentru inferență pe sarcinile pe care a fost antrenat și poate fi, de asemenea, ajustat pe o sarcină nouă. Prin antrenarea cu weight-uri instruite în prealabil, putem obține rapid rezultate bune.
-
-Greutățile au fost descărcate și stocate în cache (astfel încât apelurile viitoare la metoda `from_pretrained()` nu le vor descărca din nou) în folderul cache, care are ca valoare implicită *~/.cache/huggingface/transformers*. Puteți personaliza folderul cache prin setarea variabilei de mediu `HF_HOME`.
-
-Identificatorul utilizat pentru încărcarea modelului poate fi identificatorul oricărui model de pe Model Hub, atâta timp cât acesta este compatibil cu arhitectura OARET. Lista completă a  checkpoint-urilor OARET disponibile poate fi găsită [aici](https://huggingface.co/models?filter=bert).
-
-
-### Metode de păstrare[[metode-de-păstrare]]
-
-Salvarea unui model este la fel de ușoară ca încărcarea unuia - folosim metoda `save_pretrained()`, care este analogă metodei `from_pretrained()`:
-
-```py
-model.save_pretrained("directory_on_my_computer")
-```
-
-Se salvează două fișiere pe disc:
-
-{#if fw === 'pt'}
-```
-ls directory_on_my_computer
-
-config.json pytorch_model.bin
-```
-{:else}
-```
-ls directory_on_my_computer
-
-config.json tf_model.h5
-```
-{/if}
-
-Dacă aruncați o privire la fișierul *config.json*, veți recunoaște atributele necesare pentru construirea arhitecturii modelului. Acest fișier conține, de asemenea, unele metadate, cum ar fi locul de origine al checkpoint-ului și ce versiune 🤗 Transformers ați folosit când ați salvat ultima dată checkpoint-ul.
-
-{#if fw === 'pt'}
- 
-Fișierul *pytorch_model.bin* este cunoscut sub numele de *state dictionary*; acesta conține toate weight-urile modelului dumneavoastră. Cele două fișiere merg mână în mână; configurația este necesară pentru a cunoaște arhitectura modelului, în timp ce weight-urile modelului sunt parametrii modelului.
-
-{:else}
- 
-Fișierul *tf_model.h5* este cunoscut sub numele de *state dictionary*; acesta conține toate weight-urile modelului dumneavoastră. Cele două fișiere merg mână în mână; configurația este necesară pentru a cunoaște arhitectura modelului, în timp ce weight-urile modelului sunt parametrii modelului.
-
-{/if}
-
-## Utilizarea unui model Transformer pentru inferență[[utilizarea-unui-model-transformer-pentru-inferență]]
-
-
-Acum că știți cum să încărcați și să salvați un model, să încercăm să îl folosim pentru a face câteva predicții. Modelele Transformer pot procesa doar numere - numere pe care le generează tokenizatorul. Dar înainte de a discuta despre tokenizeri, să explorăm ce intrări acceptă modelul.
-
-Tokenizerii se pot ocupa de transformarea intrărilor în tensori ai framework-ului corespunzător, dar pentru a vă ajuta să înțelegeți ce se întâmplă, vom arunca o privire rapidă la ceea ce trebuie făcut înainte de trimiterea intrărilor către model.
-
-Să spunem că avem câteva secvențe:
-
-```py
-sequences = ["Hello!", "Cool.", "Nice!"]
-```
-
-Tokenizatorul le convertește în indici de vocabular care sunt denumiți în mod obișnuit *input IDs*. Fiecare secvență este acum o listă de numere! Rezultatul este:
-
-```py no-format
-encoded_sequences = [
-    [101, 7592, 999, 102],
-    [101, 4658, 1012, 102],
-    [101, 3835, 999, 102],
-]
-```
-
-Aceasta este o listă de secvențe codificate: o listă de liste. Tensorii acceptă numai forme dreptunghiulare (gândiți-vă la matrici). Această " listă " are deja o formă dreptunghiulară, astfel încât convertirea sa într-un tensor este ușoară:
-
-{#if fw === 'pt'}
-```py
-import torch
-
-model_inputs = torch.tensor(encoded_sequences)
-```
-{:else}
-```py
-import tensorflow as tf
-
-model_inputs = tf.constant(encoded_sequences)
-```
-{/if}
-
-### Utilizarea tensorilor ca intrări în model[[utilizarea-tensorilor-ca-intrări-în-to-model]]
-
-Utilizarea tensorilor cu ajutorul modelului este extrem de simplă - trebuie doar să apelăm modelul cu intrările:
-
-```py
-output = model(model_inputs)
-```
-
-Deși modelul acceptă o mulțime de argumente diferite, doar ID-urile de intrare sunt necesare. Vom explica mai târziu ce fac celelalte argumente și când sunt necesare, 
-dar mai întâi trebuie să aruncăm o privire mai atentă la tokenizerii care construiesc intrările pe care un model Transformer le poate înțelege.
\ No newline at end of file
diff --git a/chapters/ro/chapter2/4.mdx b/chapters/ro/chapter2/4.mdx
deleted file mode 100644
index c38234e14..000000000
--- a/chapters/ro/chapter2/4.mdx
+++ /dev/null
@@ -1,246 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Tokenizere[[tokenizere]]
-
-{#if fw === 'pt'}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section4_pt.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section4_pt.ipynb"},
-]} />
-
-{:else}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section4_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section4_tf.ipynb"},
-]} />
-
-{/if}
-
-<Youtube id="VFp38yj8h3A"/>
-
-
-Tokenizoarele sunt una dintre componentele de bază ale pipeline-ului NLP. Acestea au un singur scop: să transforme textul în date care pot fi prelucrate de model. Modelele pot procesa doar numere, astfel încât tokenizerii trebuie să convertească intrările noastre de text în date numerice. În această secțiune, vom explora exact ce se întâmplă în pipeline-ul de tokenizare. 
-
-În sarcinile NLP, datele care sunt în general prelucrate sunt text brut. Iată un exemplu de astfel de text:
-
-```
-Jim Henson was a puppeteer
-
-```
-
-Cu toate acestea, modelele pot procesa doar numere, deci trebuie să găsim o modalitate de a converti textul brut în numere. Asta fac tokenizerii și există o mulțime de modalități de a face acest lucru. Scopul este de a găsi cea mai relevantă reprezentare - adică cea care are cel mai mare sens pentru model - și, dacă este posibil, cea mai mică reprezentare.
-
-Să aruncăm o privire la câteva exemple de algoritmi de tokenizare și să încercăm să răspundem la unele dintre întrebările pe care le puteți avea despre tokenizare.
-
-
-
-## Word-based[[word-based]]
-
-<Youtube id="nhJxYji1aho"/>
-
- 
-Primul tip de tokenizator care îmi vine în minte este _word-based_. În general, este foarte ușor de configurat și de utilizat, cu doar câteva reguli, și adesea produce rezultate satisfăcătoare. De exemplu, în imaginea de mai jos, obiectivul este de a împărți textul brut în cuvinte și de a găsi o reprezentare numerică pentru fiecare dintre ele:
-
-<div class="flex justify-center">
-  <img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/word_based_tokenization.svg" alt="An example of word-based tokenization."/>
-  <img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/word_based_tokenization-dark.svg" alt="An example of word-based tokenization."/>
-</div>
-
- 
-Există diferite moduri de a împărți textul. De exemplu, am putea folosi spațiu pentru a tokeniza textul în cuvinte prin aplicarea funcției `split()` din Python:
-
- 
-```py
-tokenized_text = "Jim Henson was a puppeteer".split()
-print(tokenized_text)
-```
-
-```python out
-['Jim', 'Henson', 'was', 'a', 'puppeteer']
-```
-
-Există, de asemenea, variații ale tokenizerelor de cuvinte care au reguli suplimentare pentru punctuație. Cu acest tip de tokenizator, putem ajunge la „vocabulare” destul de mari, unde un vocabular este definit de numărul total de token-uri independente pe care le avem în corpus.
-
-Fiecărui cuvânt i se atribuie un ID, începând de la 0 și mergând până la dimensiunea vocabularului. Modelul utilizează aceste ID-uri pentru a identifica fiecare cuvânt.
-
-Dacă dorim să acoperim complet o limbă cu un tokenizer bazat pe cuvinte, va trebui să avem un identificator pentru fiecare cuvânt din limbă, ceea ce va genera o cantitate uriașă de token-uri. De exemplu, există peste 500 000 de cuvinte în limba engleză, astfel încât, pentru a construi o hartă de la fiecare cuvânt la un ID de intrare, ar trebui să ținem evidența unui număr atât de mare de ID-uri. În plus, cuvinte precum „dog” sunt reprezentate diferit de cuvinte precum „dogs”, iar modelul nu va avea inițial nicio modalitate de a ști că „dog” și „dogs” sunt similare: va identifica cele două cuvinte ca neavând legătură. Același lucru este valabil și pentru alte cuvinte similare, precum „run” și „running”, pe care modelul nu le va vedea inițial ca fiind similare.
-
-În cele din urmă, avem nevoie de un token personalizat pentru a reprezenta cuvintele care nu se află în vocabularul nostru. Acesta este cunoscut sub numele de token "necunoscut", adesea reprezentat ca "[UNK]" sau "&lt;unk&gt;". În general, este un indiciu rău dacă vedeți că tokenizatorul produce o mulțime de astfel de token-uri, deoarece nu a fost capabil să recupereze reprezentarea sensibilă a unui cuvânt și veți pierde informații pe parcurs. Scopul elaborării vocabularului este de a face în așa fel încât tokenizatorul să tokenizeze cât mai puține cuvinte posibil în tokenul necunoscut.
-
-O modalitate de a reduce numărul de token-uri necunoscute este de a merge un nivel mai adânc, folosind un tokenizer _character-based_.
-
-## Character-based[[character-based]]
-
-<Youtube id="ssLq_EK2jLE"/>
-
-
-Tokenizerele character-based împart textul în caractere, și nu în cuvinte. Acest lucru are două beneficii principale:
-
-- Dimensiunea vocabularului este mult mai mică.
-- Există mult mai puține token-uri în afara vocabularului (necunoscute), deoarece fiecare cuvânt poate fi construit din caractere.
-
-Dar și aici apar unele probleme legate de spații și punctuație:
-
-
-<div class="flex justify-center">
-  <img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/character_based_tokenization.svg" alt="An example of character-based tokenization."/>
-  <img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/character_based_tokenization-dark.svg" alt="An example of character-based tokenization."/>
-</div>
-
- 
-Nici această abordare nu este perfectă. Deoarece reprezentarea se bazează acum pe caractere și nu pe cuvinte, s-ar putea spune că, din punct de vedere intuitiv, este mai puțin relevantă: fiecare caracter nu înseamnă mult în sine, în timp ce în cazul cuvintelor situația este diferită. Totuși, acest lucru variază din nou în funcție de limbă; în chineză, de exemplu, fiecare caracter conține mai multe informații decât un caracter într-o limbă latină.
-
-Un alt lucru care trebuie luat în considerare este faptul că ne vom trezi cu o cantitate foarte mare de token-uri care vor fi prelucrate de modelul nostru: în timp ce un cuvânt ar fi un singur token cu un tokenizator bazat pe cuvinte, acesta se poate transforma cu ușurință în 10 sau mai multe token-uri atunci când este convertit în caractere.
-
-Pentru a obține ce este mai bun din ambele lumi, putem utiliza o a treia tehnică care combină cele două abordări: *subword tokenization*.
-
-## Subword tokenization[[subword-tokenization]]
-
-<Youtube id="zHvTiHr506c"/>
-
-Algoritmii "Subword Tokenization " se bazează pe principiul conform căruia cuvintele utilizate frecvent nu ar trebui să fie împărțite în cuvinte secundare mai mici, dar cuvintele rare ar trebui să fie descompuse în cuvinte secundare semnificative.
-
-De exemplu, " annoyingly " ar putea fi considerat un cuvânt rar și ar putea fi descompus în " annoying " și " ly ". Este probabil ca ambele să apară mai frecvent ca subcuvinte de sine stătătoare, în timp ce, în același timp, sensul cuvântului " annoyingly " este păstrat de sensul compus al cuvintelor " annoying " și " ly ".
-
-Iată un exemplu care arată modul în care un algoritm de subword tokenization ar tokeniza secvența "Let's do tokenization!":
-
-<div class="flex justify-center">
-  <img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/bpe_subword.svg" alt="A subword tokenization algorithm."/>
-  <img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/bpe_subword-dark.svg" alt="A subword tokenization algorithm."/>
-</div>
-
-Aceste părți de cuvinte oferă în cele din urmă o mulțime de semnificații semantice: în exemplul de mai sus, "tokenization" a fost împărțit în "token" și "ization", două cuvinte care au o semnificație semantică, fiind în același timp eficiente din punct de vedere al spațiului (sunt necesare doar două cuvinte pentru a reprezenta un cuvânt lung). Acest lucru ne permite să avem o acoperire relativ bună cu vocabulare de dimensiuni mici și aproape fără token-uri necunoscute.
-
-Această abordare este utilă în special în limbile aglutinative, cum ar fi turca, în care se pot forma cuvinte complexe (aproape) arbitrar de lungi prin combinarea părților de cuvinte.
-
-### Și nu numai![[și-nu-numai]]
-
-Nu este surprinzător faptul că există mult mai multe tehnici. Iată câteva:
-
-- BPE la nivel de byte, utilizată în GPT-2
-- WordPiece, utilizată în BERT
-- SentencePiece sau Unigram, utilizate în mai multe modele multilingve
-
-Acum ar trebui să cunoașteți destul de bine cum funcționează tokenizerele pentru a începe să utilizați API-
-
-## Încărcarea și salvarea[[încărcarea-și-salvarea]]
-
-Încărcarea și salvarea tokenizerelor este la fel de simplă ca în cazul modelelor. De fapt, se bazează pe aceleași două metode: `from_pretrained()` și `save_pretrained()`. Aceste metode vor încărca sau salva algoritmul utilizat de tokenizator (un pic ca *arhitectura* modelului), precum și vocabularul său (un pic ca *weight-urile* modelului).
-
-Încărcarea tokenizatorului BERT antrenat cu același punct de control ca BERT se face în același mod ca și încărcarea modelului, cu excepția faptului că folosim clasa `BertTokenizer`:
-
-```py
-from transformers import BertTokenizer
-
-tokenizer = BertTokenizer.from_pretrained("bert-base-cased")
-```
-
-{#if fw === 'pt'}
-Similar cu `AutoModel`, clasa `AutoTokenizer` va prelua clasa tokenizer corespunzătoare din bibliotecă pe baza numelui checkpoint-ului și poate fi utilizată direct cu orice checkpoint:
-
-{:else}
-Similar cu `TFAutoModel`, clasa `AutoTokenizer` va prelua clasa tokenizer corespunzătoare din bibliotecă pe baza numelui checkpoint-ului și poate fi utilizată direct cu orice checkpoint:
-
-{/if}
-
-```py
-from transformers import AutoTokenizer
-
-tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
-```
-
-Acum putem utiliza tokenizatorul așa cum am arătat în secțiunea anterioară:
-
-```python
-tokenizer("Using a Transformer network is simple")
-```
-
-```python out
-{'input_ids': [101, 7993, 170, 11303, 1200, 2443, 1110, 3014, 102],
- 'token_type_ids': [0, 0, 0, 0, 0, 0, 0, 0, 0],
- 'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1, 1]}
-```
-
-Salvarea unui tokenizer este identică cu salvarea unui model:
-
-```py
-tokenizer.save_pretrained("directory_on_my_computer")
-```
-
-Vom vorbi mai mult despre `token_type_ids` în [Capitolul 3](/course/chapter3) și vom explica cheia `attention_mask` puțin mai târziu. Mai întâi, să vedem cum sunt generate `input_ids`. Pentru a face acest lucru, va trebui să ne uităm la metodele intermediare ale tokenizatorului.
-
-## Codificarea[[codificarea]]
-
-<Youtube id="Yffk5aydLzg"/>
-
-Al doilea pas este să convertim aceste token-uri în numere, astfel încât să putem construi un tensor din ele și să le introducem în model. Pentru a face acest lucru, tokenizatorul are un *vocabular*, care este partea pe care o descărcăm atunci când îl instanțiem cu metoda `from_pretrained()`. Din nou, trebuie să folosim același vocabular utilizat atunci când modelul a fost preinstruit.
-
-Pentru a înțelege mai bine cele două etape, le vom explora separat. Rețineți că vom utiliza unele metode care efectuează părți ale pipeline-ului de tokenizare separat pentru a vă arăta rezultatele intermediare ale acestor etape, dar, în practică, ar trebui să apelați tokenizatorul direct pe intrările dvs. (așa cum se arată în secțiunea 2).
-
-### Tokenizarea[[tokenizarea]]
-
-Procesul de tokenizare este realizat prin metoda `tokenize()`:
-
-```py
-from transformers import AutoTokenizer
-
-tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
-
-sequence = "Using a Transformer network is simple"
-tokens = tokenizer.tokenize(sequence)
-
-print(tokens)
-```
-
-Rezultatul acestei metode este o listă de șiruri de caractere, sau token-uri:
-
-```python out
-['Using', 'a', 'transform', '##er', 'network', 'is', 'simple']
-```
-
-Acest tokenizator este un tokenizator de părți de cuvinte: împarte cuvintele până când obține token-uri care pot fi reprezentate de vocabularul său. Acesta este cazul aici cu `transformer`, care este împărțit în două token-uri: `transform` și `##er`
-
-### De la token-uri la ID-uri de intrare[[de-la-token-uri-la-id-uri-de-intrare]]
-
-Conversia în ID-uri de intrare este gestionată de metoda de tokenizare `convert_tokens_to_ids()`:
-
-```py
-ids = tokenizer.convert_tokens_to_ids(tokens)
-
-print(ids)
-```
-
-```python out
-[7993, 170, 11303, 1200, 2443, 1110, 3014]
-```
-
-Aceste rezultate, odată convertite în tensorul framework-ului corespunzător, pot fi apoi utilizate ca intrări într-un model, așa cum am văzut mai devreme în acest capitol.
-
-<Tip>
-
-✏️ ** Încercați!** Replicați ultimii doi pași (tokenizarea și conversia în ID-uri de intrare) pe propozițiile de intrare pe care le-am folosit în secțiunea 2 ("I've been waiting for a HuggingFace course my whole life." și "I hate this so much!"). Verificați dacă obțineți aceleași ID-uri de intrare pe care le-am obținut mai devreme! 
-
-</Tip>
-
-## Decodificare[[decodificare]]
-
-*Decodificarea* este inversă: din indicii vocabularului, dorim să obținem un șir de caractere. Acest lucru poate fi realizat cu metoda `decode()` după cum urmează:
-
-```py
-decoded_string = tokenizer.decode([7993, 170, 11303, 1200, 2443, 1110, 3014])
-print(decoded_string)
-```
-
-```python out
-'Using a Transformer network is simple'
-```
-
-Rețineți că metoda `decode` nu numai că convertește indicii înapoi în token-uri, dar și grupează token-urile care fac parte din aceleași cuvinte pentru a produce o propoziție inteligibilă. Acest comportament va fi extrem de util atunci când vom utiliza modele care prezic text nou (fie text generat de un prompt, fie pentru probleme sequence-to-sequence, precum traducerea sau rezumarea).
-
-Până acum ar trebui să înțelegeți operațiunile atomice pe care le poate gestiona un tokenizator: tokenizarea, conversia în ID-uri și conversia ID-urilor înapoi într-un șir. Cu toate acestea, am atins doar vârful icebergului. În secțiunea următoare, vom aborda limitele metodei noastre și vom vedea cum să le depășim.
diff --git a/chapters/ro/chapter2/5.mdx b/chapters/ro/chapter2/5.mdx
deleted file mode 100644
index 1d71f6188..000000000
--- a/chapters/ro/chapter2/5.mdx
+++ /dev/null
@@ -1,338 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Gestionarea secvențelor multiple[[gestionarea-secvențelor-multiple]]
-
-{#if fw === 'pt'}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section5_pt.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section5_pt.ipynb"},
-]} />
-
-{:else}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section5_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section5_tf.ipynb"},
-]} />
-
-{/if}
-
-{#if fw === 'pt'}
-<Youtube id="M6adb1j2jPI"/>
-{:else}
-<Youtube id="ROxrFOEbsQE"/>
-{/if}
-
-În secțiunea anterioară, am explorat cel mai simplu caz de utilizare: realizarea de inferențe pe o singură secvență de lungime mică. Cu toate acestea, apar deja unele întrebări:
-
-- Cum gestionăm secvențe multiple?
-- Cum gestionăm secvențe multiple *de lungimi diferite*?
-- Indicii vocabularului sunt singurele intrări care permit unui model să funcționeze bine?
-- Există o secvență prea lungă?
-
-Să vedem ce tipuri de probleme prezintă aceste întrebări și cum le putem rezolva folosind API-ul 🤗 Transformers.
-
-
-## Modelele așteaptă un lot de intrări[[modelele-așteaptă-un-lot-de-intrări]]
-
-În exercițiul anterior ați văzut cum secvențele sunt transformate în liste de numere. Să convertim această listă de numere într-un tensor și să o transmitem modelului:
-
-{#if fw === 'pt'}
-```py
-import torch
-from transformers import AutoTokenizer, AutoModelForSequenceClassification
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
-
-sequence = "I've been waiting for a HuggingFace course my whole life."
-
-tokens = tokenizer.tokenize(sequence)
-ids = tokenizer.convert_tokens_to_ids(tokens)
-input_ids = torch.tensor(ids)
-# Această linie va eșua.
-model(input_ids)
-```
-
-```python out
-IndexError: Dimension out of range (expected to be in range of [-1, 0], but got 1)
-```
-{:else}
-```py
-import tensorflow as tf
-from transformers import AutoTokenizer, TFAutoModelForSequenceClassification
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint)
-
-sequence = "I've been waiting for a HuggingFace course my whole life."
-
-tokens = tokenizer.tokenize(sequence)
-ids = tokenizer.convert_tokens_to_ids(tokens)
-input_ids = tf.constant(ids)
-# This line will fail.
-model(input_ids)
-```
-
-```py out
-InvalidArgumentError: Input to reshape is a tensor with 14 values, but the requested shape has 196 [Op:Reshape]
-```
-{/if}
-
-Oh, nu! De ce a eșuat? Am urmat pașii din pipeline-ul din secțiunea 2.
-
-Problema este că am trimis o singură secvență către model, în timp ce modelele 🤗 Transformers așteaptă în mod implicit mai multe propoziții. Aici am încercat să facem tot ce a făcut tokenizatorul în fundal atunci când l-am aplicat unei `secvențe`. Dar, dacă vă uitați cu atenție, veți vedea că tokenizatorul nu a convertit doar lista de ID-uri de intrare într-un tensor, ci a adăugat și o dimensiune peste aceasta:
-
-{#if fw === 'pt'}
-```py
-tokenized_inputs = tokenizer(sequence, return_tensors="pt")
-print(tokenized_inputs["input_ids"])
-```
-
-```python out
-tensor([[  101,  1045,  1005,  2310,  2042,  3403,  2005,  1037, 17662, 12172,
-          2607,  2026,  2878,  2166,  1012,   102]])
-```
-{:else}
-```py
-tokenized_inputs = tokenizer(sequence, return_tensors="tf")
-print(tokenized_inputs["input_ids"])
-```
-
-```py out
-<tf.Tensor: shape=(1, 16), dtype=int32, numpy=
-array([[  101,  1045,  1005,  2310,  2042,  3403,  2005,  1037, 17662,
-        12172,  2607,  2026,  2878,  2166,  1012,   102]], dtype=int32)>
-```
-{/if}
-
-Să încercăm din nou și să adăugăm o nouă dimensiune:
-
-{#if fw === 'pt'}
-```py
-import torch
-from transformers import AutoTokenizer, AutoModelForSequenceClassification
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
-
-sequence = "I've been waiting for a HuggingFace course my whole life."
-
-tokens = tokenizer.tokenize(sequence)
-ids = tokenizer.convert_tokens_to_ids(tokens)
-
-input_ids = torch.tensor([ids])
-print("Input IDs:", input_ids)
-
-output = model(input_ids)
-print("Logits:", output.logits)
-```
-{:else}
-```py
-import tensorflow as tf
-from transformers import AutoTokenizer, TFAutoModelForSequenceClassification
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint)
-
-sequence = "I've been waiting for a HuggingFace course my whole life."
-
-tokens = tokenizer.tokenize(sequence)
-ids = tokenizer.convert_tokens_to_ids(tokens)
-
-input_ids = tf.constant([ids])
-print("Input IDs:", input_ids)
-
-output = model(input_ids)
-print("Logits:", output.logits)
-```
-{/if}
-
-Imprimăm ID-urile de intrare, precum și logit-urile rezultate - iată rezultatul:
-
-{#if fw === 'pt'}
-```python out
-Input IDs: [[ 1045,  1005,  2310,  2042,  3403,  2005,  1037, 17662, 12172,  2607, 2026,  2878,  2166,  1012]]
-Logits: [[-2.7276,  2.8789]]
-```
-{:else}
-```py out
-Input IDs: tf.Tensor(
-[[ 1045  1005  2310  2042  3403  2005  1037 17662 12172  2607  2026  2878
-   2166  1012]], shape=(1, 14), dtype=int32)
-Logits: tf.Tensor([[-2.7276208  2.8789377]], shape=(1, 2), dtype=float32)
-```
-{/if}
-
-Gruparea în loturi este acțiunea de a trimite mai multe propoziții prin model, toate odată. Dacă aveți o singură propoziție, puteți crea un lot cu o singură secvență: 
-
-```
-batched_ids = [ids, ids]
-```
-
-Acesta este un lot de două secvențe identice!
-
-<Tip>
-
-✏️ ** Încercați!** Convertiți această listă `batched_ids` într-un tensor și treceți-o prin modelul dumneavoastră. Verificați dacă obțineți aceleași logits ca înainte (dar de două ori)!
-
-</Tip>
-
-Gruparea în loturi permite modelului să funcționeze atunci când îi furnizați mai multe secvențe. Utilizarea mai multor secvențe este la fel de simplă ca și crearea unui lot cu o singură secvență. Există însă o a doua problemă. Atunci când încercați să combinați două (sau mai multe) propoziții, acestea pot avea lungimi diferite. Dacă ați mai lucrat vreodată cu tensori, știți că aceștia trebuie să aibă o formă dreptunghiulară, deci nu veți putea converti direct lista de ID-uri de intrare într-un tensor. Pentru a rezolva această problemă, de obicei *umplem* datele de intrare.
-
-## Umplerea datelor de intrare[[umplerea-datelor-de-intrare]]
-
-Următoarea serie de liste nu poate fi convertită într-un tensor:
-
-```py no-format
-batched_ids = [
-    [200, 200, 200],
-    [200, 200]
-]
-```
-
-Pentru a ocoli acest lucru, vom folosi *padding-ul* pentru ca tensorii noștri să aibă o formă dreptunghiulară. Padding-ul (umplerea datelor) asigură că toate propozițiile noastre au aceeași lungime prin adăugarea unui cuvânt special numit *padding token* la propozițiile cu mai puține valori. De exemplu, dacă aveți 10 propoziții cu 10 cuvinte și 1 propoziție cu 20 de cuvinte, padding-ul va asigura că toate propozițiile au 20 de cuvinte. În exemplul nostru, tensorul rezultat arată astfel:
-
-```py no-format
-padding_id = 100
-
-batched_ids = [
-    [200, 200, 200],
-    [200, 200, padding_id],
-]
-```
-
-ID-ul token-ului de umplere poate fi găsit în `tokenizer.pad_token_id`. Să-l folosim și să trimitem cele două propoziții prin model în mod separat și grupate împreună:
-
-{#if fw === 'pt'}
-```py no-format
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
-
-sequence1_ids = [[200, 200, 200]]
-sequence2_ids = [[200, 200]]
-batched_ids = [
-    [200, 200, 200],
-    [200, 200, tokenizer.pad_token_id],
-]
-
-print(model(torch.tensor(sequence1_ids)).logits)
-print(model(torch.tensor(sequence2_ids)).logits)
-print(model(torch.tensor(batched_ids)).logits)
-```
-
-```python out
-tensor([[ 1.5694, -1.3895]], grad_fn=<AddmmBackward>)
-tensor([[ 0.5803, -0.4125]], grad_fn=<AddmmBackward>)
-tensor([[ 1.5694, -1.3895],
-        [ 1.3373, -1.2163]], grad_fn=<AddmmBackward>)
-```
-{:else}
-```py no-format
-model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint)
-
-sequence1_ids = [[200, 200, 200]]
-sequence2_ids = [[200, 200]]
-batched_ids = [
-    [200, 200, 200],
-    [200, 200, tokenizer.pad_token_id],
-]
-
-print(model(tf.constant(sequence1_ids)).logits)
-print(model(tf.constant(sequence2_ids)).logits)
-print(model(tf.constant(batched_ids)).logits)
-```
-
-```py out
-tf.Tensor([[ 1.5693678 -1.3894581]], shape=(1, 2), dtype=float32)
-tf.Tensor([[ 0.5803005  -0.41252428]], shape=(1, 2), dtype=float32)
-tf.Tensor(
-[[ 1.5693681 -1.3894582]
- [ 1.3373486 -1.2163193]], shape=(2, 2), dtype=float32)
-```
-{/if}
-
-Este ceva în neregulă cu logit-urile din predicțiile noastre grupate: al doilea rând ar trebui să fie identic cu logit-urile pentru a doua propoziție, dar avem valori complet diferite!
-
-Acest lucru se datorează faptului că principala caracteristică a modelelor Transformer sunt straturile de atenție care *contextualizează* fiecare token. Acestea vor lua în considerare token-urile de umplutură, deoarece se ocupă de toate token-urile unei secvențe. Pentru a obține același rezultat atunci când trecem propoziții individuale de diferite lungimi prin model sau atunci când trecem un lot cu aceleași propoziții și același umplutură aplicată, trebuie să spunem acelor straturi de atenție să ignore token-urile de umplutură. Acest lucru se realizează prin utilizarea unei măști de atenție (attention mask).
-
-## Attention masks(măști de atenție)[[attention-masks]]
-
-*Măștile de atenție* sunt tensori cu exact aceeași formă ca tensorul ID-urilor de intrare, completate cu 0 și 1: valorile 1 indică faptul că ar trebui să se acorde atenție token-urilor corespunzătoare, iar valorile 0 indică faptul că nu ar trebui să se acorde atenție token-urilor corespunzătoare (adică acestea ar trebui ignorate de straturile de atenție ale modelului).
-
-Să completăm exemplul anterior cu o mască de atenție:
-
-{#if fw === 'pt'}
-```py no-format
-batched_ids = [
-    [200, 200, 200],
-    [200, 200, tokenizer.pad_token_id],
-]
-
-attention_mask = [
-    [1, 1, 1],
-    [1, 1, 0],
-]
-
-outputs = model(torch.tensor(batched_ids), attention_mask=torch.tensor(attention_mask))
-print(outputs.logits)
-```
-
-```python out
-tensor([[ 1.5694, -1.3895],
-        [ 0.5803, -0.4125]], grad_fn=<AddmmBackward>)
-```
-{:else}
-```py no-format
-batched_ids = [
-    [200, 200, 200],
-    [200, 200, tokenizer.pad_token_id],
-]
-
-attention_mask = [
-    [1, 1, 1],
-    [1, 1, 0],
-]
-
-outputs = model(tf.constant(batched_ids), attention_mask=tf.constant(attention_mask))
-print(outputs.logits)
-```
-
-```py out
-tf.Tensor(
-[[ 1.5693681  -1.3894582 ]
- [ 0.5803021  -0.41252586]], shape=(2, 2), dtype=float32)
-```
-{/if}
-
-Acum obținem aceeași logits pentru a doua propoziție din lot.
-
-Observăm cum ultima valoare a celei de-a doua secvențe este un ID de umplere, care este o valoare 0 în masca de atenție.
-
-<Tip>
-
-✏️ ** Încercați!** Aplicați manual tokenizarea pe cele două propoziții utilizate în secțiunea 2 ("I've been waiting for a HuggingFace course my whole life." și "I hate this so much!"). Treceți-le prin model și verificați dacă obțineți aceeași logiți ca în secțiunea 2. Acum grupați-le împreună folosind token-ul de umplere, apoi creați masca de atenție corespunzătoare. Verificați dacă obțineți aceleași rezultate atunci când parcurgeți modelul!
-
-</Tip>
-
-## Secvențe mai lungi[[secvențe-mai-lungi]]
-
-Cu modelele Transformer, există o limită a lungimii secvențelor pe care le putem transmite modelelor. Majoritatea modelelor gestionează secvențe de până la 512 sau 1024 de token-uri și se vor bloca atunci când li se cere să proceseze secvențe mai lungi. Există două soluții la această problemă:
-
-- Utilizați un model cu o lungime de secvență acceptată mai mare.
-- Trunchiați secvențele.
-
-Modelele au diferite lungimi de secvență acceptate, iar unele sunt specializate în tratarea secvențelor foarte lungi. [Longformer](https://huggingface.co/docs/transformers/model_doc/longformer) este un exemplu, iar altul este [LED](https://huggingface.co/docs/transformers/model_doc/led). Dacă lucrați la o sarcină care necesită secvențe foarte lungi, vă recomandăm să aruncați o privire la aceste modele.
-
-În caz contrar, vă recomandăm să vă trunchiați secvențele prin specificarea parametrului `max_sequence_length`:
-```py
-sequence = sequence[:max_sequence_length]
-```
diff --git a/chapters/ro/chapter2/6.mdx b/chapters/ro/chapter2/6.mdx
deleted file mode 100644
index a95a92d56..000000000
--- a/chapters/ro/chapter2/6.mdx
+++ /dev/null
@@ -1,164 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Să punem totul cap la cap[[să-punem-totul-cap-la-cap]]
-
-{#if fw === 'pt'}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section6_pt.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section6_pt.ipynb"},
-]} />
-
-{:else}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section6_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section6_tf.ipynb"},
-]} />
-
-{/if}
-
-În ultimele secțiuni, ne-am străduit să facem cea mai mare parte a muncii manual. Am explorat modul în care funcționează tokenizerele și am analizat tokenizarea, conversia în ID-uri de intrare, padding, trunchiere și măști de atenție.
-
-Cu toate acestea, după cum am văzut în secțiunea 2, API-ul 🤗 Transformers poate gestiona toate acestea pentru noi cu o funcție de nivel înalt în care ne vom adânci aici. Atunci când apelați `tokenizer` direct pe propoziție, primiți înapoi intrări care sunt gata să treacă prin modelul dvs:
-
-```py
-from transformers import AutoTokenizer
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-
-sequence = "I've been waiting for a HuggingFace course my whole life."
-
-model_inputs = tokenizer(sequence)
-```
-
-Aici, variabila `model_inputs` conține tot ceea ce este necesar pentru ca un model să funcționeze bine. Pentru DistilBERT, aceasta include ID-urile de intrare, precum și masca de atenție. Alte modele care acceptă intrări suplimentare le vor avea, de asemenea, la ieșire prin obiectul `tokenizer`.
-
-După cum vom vedea în câteva exemple de mai jos, această metodă este foarte eficientă. În primul rând, poate tokeniza o singură secvență:
-
-```py
-sequence = "I've been waiting for a HuggingFace course my whole life."
-
-model_inputs = tokenizer(sequence)
-```
-
-De asemenea, gestionează mai multe secvențe simultan, fără nicio modificare a API-ului:
-
-```py
-sequences = ["I've been waiting for a HuggingFace course my whole life.", "So have I!"]
-
-model_inputs = tokenizer(sequences)
-```
-
-Acesta poate umple în funcție de mai multe obiective:
-
-```py
-# Va umple secvențele până la lungimea maximă a secvenței
-model_inputs = tokenizer(sequences, padding="longest")
-
-# Va umple secvențele până la lungimea maximă a modelului
-# (512 pentru BERT sau DistilBERT)
-model_inputs = tokenizer(sequences, padding="max_length")
-
-# Va umple secvențele până la lungimea maximă specificată
-model_inputs = tokenizer(sequences, padding="max_length", max_length=8)
-```
-
-De asemenea, poate trunchia secvențele:
-
-```py
-sequences = ["I've been waiting for a HuggingFace course my whole life.", "So have I!"]
-
-# Va trunchia secvențele care sunt mai lungi decât lungimea maximă a modelului
-# (512 pentru BERT sau DistilBERT)
-model_inputs = tokenizer(sequences, truncation=True)
-
-# Va trunchia secvențele care sunt mai lungi decât lungimea maximă specificată
-model_inputs = tokenizer(sequences, max_length=8, truncation=True)
-```
-
-Obiectul `tokenizer` poate gestiona conversia în tensori specifici framework-ului, care pot fi apoi trimiși direct la model. De exemplu, în următorul exemplu de cod, solicităm tokenizatorului să returneze tensori din diferite cadre - `„pt”` returnează tensori PyTorch, `„tf”` returnează tensori TensorFlow, iar `„np”` returnează matrici NumPy:
-
-```py
-sequences = ["I've been waiting for a HuggingFace course my whole life.", "So have I!"]
-
-# Returnează tensori PyTorch
-model_inputs = tokenizer(sequences, padding=True, return_tensors="pt")
-
-# Returnează tensori TensorFlow 
-model_inputs = tokenizer(sequences, padding=True, return_tensors="tf")
-
-# Returnează array-uri NumPy 
-model_inputs = tokenizer(sequences, padding=True, return_tensors="np")
-```
-
-## Token-uri speciale[[token-uri-speciale]]
-
-Dacă aruncăm o privire la ID-urile de intrare returnate de tokenizer, vom vedea că sunt puțin diferite de cele pe care le-am avut mai devreme:
-
-```py
-sequence = "I've been waiting for a HuggingFace course my whole life."
-
-model_inputs = tokenizer(sequence)
-print(model_inputs["input_ids"])
-
-tokens = tokenizer.tokenize(sequence)
-ids = tokenizer.convert_tokens_to_ids(tokens)
-print(ids)
-```
-
-```python out
-[101, 1045, 1005, 2310, 2042, 3403, 2005, 1037, 17662, 12172, 2607, 2026, 2878, 2166, 1012, 102]
-[1045, 1005, 2310, 2042, 3403, 2005, 1037, 17662, 12172, 2607, 2026, 2878, 2166, 1012]
-```
-
-Un token ID a fost adăugat la început, iar unul la sfârșit. Să decodificăm cele două secvențe de ID-uri de mai sus pentru a vedea despre ce este vorba:
-
-```py
-print(tokenizer.decode(model_inputs["input_ids"]))
-print(tokenizer.decode(ids))
-```
-
-```python out
-"[CLS] i've been waiting for a huggingface course my whole life. [SEP]"
-"i've been waiting for a huggingface course my whole life."
-```
-
-Tokenizatorul a adăugat cuvântul special `[CLS]` la început și cuvântul special `[SEP]` la sfârșit. Acest lucru se datorează faptului că modelul a fost preinstruit cu aceste cuvinte, deci pentru a obține aceleași rezultate pentru inferență trebuie să le adăugăm și pe acestea. Rețineți că unele modele nu adaugă cuvinte speciale sau adaugă cuvinte diferite; de asemenea, modelele pot adăuga aceste cuvinte speciale doar la început sau doar la sfârșit. În orice caz, tokenizatorul știe care sunt cele așteptate și se va ocupa de acest lucru pentru dumneavoastră.
-
-## Încheiere: De la tokenizer la model[[încheiere-de-la-tokenizator--model]]
-
-Acum că am văzut toți pașii individuali pe care îi utilizează obiectul `tokenizer` atunci când este aplicat pe texte, să vedem o ultimă dată cum poate gestiona secvențe multiple (padding!), secvențe foarte lungi (trunchiere!) și mai multe tipuri de tensori cu API-ul său principal:
-
-{#if fw === 'pt'}
-```py
-import torch
-from transformers import AutoTokenizer, AutoModelForSequenceClassification
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
-sequences = ["I've been waiting for a HuggingFace course my whole life.", "So have I!"]
-
-tokens = tokenizer(sequences, padding=True, truncation=True, return_tensors="pt")
-output = model(**tokens)
-```
-{:else}
-```py
-import tensorflow as tf
-from transformers import AutoTokenizer, TFAutoModelForSequenceClassification
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint)
-sequences = ["I've been waiting for a HuggingFace course my whole life.", "So have I!"]
-
-tokens = tokenizer(sequences, padding=True, truncation=True, return_tensors="tf")
-output = model(**tokens)
-```
-{/if}
diff --git a/chapters/ro/chapter2/7.mdx b/chapters/ro/chapter2/7.mdx
deleted file mode 100644
index 2e6f1175c..000000000
--- a/chapters/ro/chapter2/7.mdx
+++ /dev/null
@@ -1,19 +0,0 @@
-# Utilizarea de bază este completă![[utilizarea-de-bază-este-completă]]
-
-<CourseFloatingBanner
-    chapter={2}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
- 
-Ați făcut o treabă excelentă dacă ați urmat cursul până aici! Pentru a sintetiza, în acest capitol ați:
-
-- Ați învățat elementele de bază ale unui model Transformer.
-- Ați învățat ce formează un pipeline de tokenizare.
-- Ați văzut cum să utilizați un model Transformer în practică.
-- Ați învățat cum să folosiți un tokenizer pentru a converti textul în tensori care sunt inteligibili pentru model.
-- Am configurat împreună un tokenizer și un model pentru a ajunge de la text la predicții.
-- Am învățat limitările ID-urilor de intrare și am învățat despre attention masks(măști de atenție).
-- V-ați antrenat cu ajutorul metodelor versatile și configurabile ale tokenizatorului.
-
-De acum înainte, ar trebui să puteți naviga liber prin documentele 🤗 Transformers: vocabularul va suna familiar și ați văzut deja metodele pe care le veți utiliza în majoritatea timpului.
\ No newline at end of file
diff --git a/chapters/ro/chapter2/8.mdx b/chapters/ro/chapter2/8.mdx
deleted file mode 100644
index c41f27936..000000000
--- a/chapters/ro/chapter2/8.mdx
+++ /dev/null
@@ -1,310 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-<!-- DISABLE-FRONTMATTER-SECTIONS -->
-
-# End-of-chapter quiz[[end-of-chapter-quiz]]
-
-<CourseFloatingBanner
-    chapter={2}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-### 1. What is the order of the language modeling pipeline?
-
-<Question
-	choices={[
-		{
-			text: "First, the model, which handles text and returns raw predictions. The tokenizer then makes sense of these predictions and converts them back to text when needed.",
-			explain: "The model cannot understand text! The tokenizer must first tokenize the text and convert it to IDs so that it is understandable by the model."
-		},
-		{
-			text: "First, the tokenizer, which handles text and returns IDs. The model handles these IDs and outputs a prediction, which can be some text.",
-			explain: "The model's prediction cannot be text straight away. The tokenizer has to be used in order to convert the prediction back to text!"
-		},
-		{
-			text: "The tokenizer handles text and returns IDs. The model handles these IDs and outputs a prediction. The tokenizer can then be used once again to convert these predictions back to some text.",
-			explain: "Correct! The tokenizer can be used for both tokenizing and de-tokenizing.",
-            correct: true
-		}
-	]}
-/>
-
-### 2. How many dimensions does the tensor output by the base Transformer model have, and what are they?
-
-<Question
-	choices={[
-		{
-			text: "2: The sequence length and the batch size",
-			explain: "False! The tensor output by the model has a third dimension: hidden size."
-		},
-		{
-			text: "2: The sequence length and the hidden size",
-			explain: "False! All Transformer models handle batches, even with a single sequence; that would be a batch size of 1!"
-		},
-		{
-			text: "3: The sequence length, the batch size, and the hidden size",
-			explain: "Correct!",
-            correct: true
-		}
-	]}
-/>
-
-### 3. Which of the following is an example of subword tokenization?
-
-<Question
-	choices={[
-		{
-			text: "WordPiece",
-			explain: "Yes, that's one example of subword tokenization!",
-            correct: true
-		},
-		{
-			text: "Character-based tokenization",
-			explain: "Character-based tokenization is not a type of subword tokenization."
-		},
-		{
-			text: "Splitting on whitespace and punctuation",
-			explain: "That's a word-based tokenization scheme!"
-		},
-		{
-			text: "BPE",
-			explain: "Yes, that's one example of subword tokenization!",
-            correct: true
-        },
-		{
-			text: "Unigram",
-			explain: "Yes, that's one example of subword tokenization!",
-            correct: true
-        },
-		{
-			text: "None of the above",
-			explain: "Incorrect!"
-        }
-	]}
-/>
-
-### 4. What is a model head?
-
-<Question
-	choices={[
-		{
-			text: "A component of the base Transformer network that redirects tensors to their correct layers",
-			explain: "Incorrect! There's no such component."
-		},
-		{
-			text: "Also known as the self-attention mechanism, it adapts the representation of a token according to the other tokens of the sequence",
-			explain: "Incorrect! The self-attention layer does contain attention \"heads,\" but these are not adaptation heads."
-		},
-		{
-			text: "An additional component, usually made up of one or a few layers, to convert the transformer predictions to a task-specific output",
-			explain: "That's right. Adaptation heads, also known simply as heads, come up in different forms: language modeling heads, question answering heads, sequence classification heads... ",
-			correct: true
-		} 
-	]}
-/>
-
-{#if fw === 'pt'}
-### 5. What is an AutoModel?
-
-<Question
-	choices={[
-		{
-			text: "A model that automatically trains on your data",
-			explain: "Incorrect. Are you mistaking this with our <a href='https://huggingface.co/autotrain'>AutoTrain</a> product?"
-		},
-		{
-			text: "An object that returns the correct architecture based on the checkpoint",
-			explain: "Exactly: the <code>AutoModel</code> only needs to know the checkpoint from which to initialize to return the correct architecture.",
-			correct: true
-		},
-		{
-			text: "A model that automatically detects the language used for its inputs to load the correct weights",
-			explain: "Incorrect; while some checkpoints and models are capable of handling multiple languages, there are no built-in tools for automatic checkpoint selection according to language. You should head over to the <a href='https://huggingface.co/models'>Model Hub</a> to find the best checkpoint for your task!"
-		} 
-	]}
-/>
-
-{:else}
-### 5. What is an TFAutoModel?
-
-<Question
-	choices={[
-		{
-			text: "A model that automatically trains on your data",
-			explain: "Incorrect. Are you mistaking this with our <a href='https://huggingface.co/autotrain'>AutoTrain</a> product?"
-		},
-		{
-			text: "An object that returns the correct architecture based on the checkpoint",
-			explain: "Exactly: the <code>TFAutoModel</code> only needs to know the checkpoint from which to initialize to return the correct architecture.",
-			correct: true
-		},
-		{
-			text: "A model that automatically detects the language used for its inputs to load the correct weights",
-			explain: "Incorrect; while some checkpoints and models are capable of handling multiple languages, there are no built-in tools for automatic checkpoint selection according to language. You should head over to the <a href='https://huggingface.co/models'>Model Hub</a> to find the best checkpoint for your task!"
-		} 
-	]}
-/>
-
-{/if}
-
-### 6. What are the techniques to be aware of when batching sequences of different lengths together?
-
-<Question
-	choices={[
-		{
-			text: "Truncating",
-			explain: "Yes, truncation is a correct way of evening out sequences so that they fit in a rectangular shape. Is it the only one, though?",
-			correct: true
-		},
-		{
-			text: "Returning tensors",
-			explain: "While the other techniques allow you to return rectangular tensors, returning tensors isn't helpful when batching sequences together."
-		},
-		{
-			text: "Padding",
-			explain: "Yes, padding is a correct way of evening out sequences so that they fit in a rectangular shape. Is it the only one, though?",
-			correct: true
-		}, 
-		{
-			text: "Attention masking",
-			explain: "Absolutely! Attention masks are of prime importance when handling sequences of different lengths. That's not the only technique to be aware of, however.",
-			correct: true
-		} 
-	]}
-/>
-
-### 7. What is the point of applying a SoftMax function to the logits output by a sequence classification model?
-
-<Question
-	choices={[
-		{
-			text: "It softens the logits so that they're more reliable.",
-			explain: "No, the SoftMax function does not affect the reliability of results."
-		},
-		{
-			text: "It applies a lower and upper bound so that they're understandable.",
-			explain: "Correct! The resulting values are bound between 0 and 1. That's not the only reason we use a SoftMax function, though.",
-            correct: true
-		},
-		{
-			text: "The total sum of the output is then 1, resulting in a possible probabilistic interpretation.",
-			explain: "Correct! That's not the only reason we use a SoftMax function, though.",
-            correct: true
-		}
-	]}
-/>
-
-### 8. What method is most of the tokenizer API centered around?
-
-<Question
-	choices={[
-		{
-			text: "<code>encode</code>, as it can encode text into IDs and IDs into predictions",
-			explain: "Wrong! While the <code>encode</code> method does exist on tokenizers, it does not exist on models."
-		},
-		{
-			text: "Calling the tokenizer object directly.",
-			explain: "Exactly! The <code>__call__</code> method of the tokenizer is a very powerful method which can handle pretty much anything. It is also the method used to retrieve predictions from a model.",
-			correct: true
-		},
-		{
-			text: "<code>pad</code>",
-			explain: "Wrong! Padding is very useful, but it's just one part of the tokenizer API."
-		},
-		{
-			text: "<code>tokenize</code>",
-			explain: "The <code>tokenize</code> method is arguably one of the most useful methods, but it isn't the core of the tokenizer API."
-		}
-	]}
-/>
-
-### 9. What does the `result` variable contain in this code sample?
-
-```py
-from transformers import AutoTokenizer
-
-tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
-result = tokenizer.tokenize("Hello!")
-```
-
-<Question
-	choices={[
-		{
-			text: "A list of strings, each string being a token",
-			explain: "Absolutely! Convert this to IDs, and send them to a model!",
-            correct: true
-		},
-		{
-			text: "A list of IDs",
-			explain: "Incorrect; that's what the <code>__call__</code> or <code>convert_tokens_to_ids</code> method is for!"
-		},
-		{
-			text: "A string containing all of the tokens",
-			explain: "This would be suboptimal, as the goal is to split the string into multiple tokens."
-		}
-	]}
-/>
-
-{#if fw === 'pt'}
-### 10. Is there something wrong with the following code?
-
-```py
-from transformers import AutoTokenizer, AutoModel
-
-tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
-model = AutoModel.from_pretrained("gpt2")
-
-encoded = tokenizer("Hey!", return_tensors="pt")
-result = model(**encoded)
-```
-
-<Question
-	choices={[
-		{
-			text: "No, it seems correct.",
-			explain: "Unfortunately, coupling a model with a tokenizer that was trained with a different checkpoint is rarely a good idea. The model was not trained to make sense out of this tokenizer's output, so the model output (if it can even run!) will not make any sense."
-		},
-		{
-			text: "The tokenizer and model should always be from the same checkpoint.",
-			explain: "Right!",
-            correct: true
-		},
-		{
-			text: "It's good practice to pad and truncate with the tokenizer as every input is a batch.",
-			explain: "It's true that every model input needs to be a batch. However, truncating or padding this sequence wouldn't necessarily make sense as there is only one of it, and those are techniques to batch together a list of sentences."
-		}
-	]}
-/>
-
-{:else}
-### 10. Is there something wrong with the following code?
-
-```py
-from transformers import AutoTokenizer, TFAutoModel
-
-tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
-model = TFAutoModel.from_pretrained("gpt2")
-
-encoded = tokenizer("Hey!", return_tensors="pt")
-result = model(**encoded)
-```
-
-<Question
-	choices={[
-		{
-			text: "No, it seems correct.",
-			explain: "Unfortunately, coupling a model with a tokenizer that was trained with a different checkpoint is rarely a good idea. The model was not trained to make sense out of this tokenizer's output, so the model output (if it can even run!) will not make any sense."
-		},
-		{
-			text: "The tokenizer and model should always be from the same checkpoint.",
-			explain: "Right!",
-            correct: true
-		},
-		{
-			text: "It's good practice to pad and truncate with the tokenizer as every input is a batch.",
-			explain: "It's true that every model input needs to be a batch. However, truncating or padding this sequence wouldn't necessarily make sense as there is only one of it, and those are techniques to batch together a list of sentences."
-		}
-	]}
-/>
-
-{/if}
diff --git a/chapters/ro/chapter3/1.mdx b/chapters/ro/chapter3/1.mdx
deleted file mode 100644
index 87d1e54dd..000000000
--- a/chapters/ro/chapter3/1.mdx
+++ /dev/null
@@ -1,25 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Introduction[[introduction]]
-
-<CourseFloatingBanner
-    chapter={3}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-În [Chapter 2](/course/chapter2) am explorat cum să folosim tokenizeri și modele pretrained pentru a face predicții. Dar dacă vrei să faci fine-tune un model pre-trained pentru propriul dataset? Acesta e subiectul acestui capitol. Vei învăța:
-
-{#if fw === 'pt'}
-* Cum să pregătiți un dataset mare din Hub
-* Cum să folosiți API-ul `Trainer` pentru a face fine-tune unui model
-* Cum să creați o buclă de antrenare personalizată
-* Cum să beneficiați de biblioteca 🤗 Accelerate pentru a rula ușor această bucla de antrenare personalizare pe orice configurare distribuită.
-
-{:else}
-* Cum să pregătiți un datasetmare din Hub
-* Cum să folosiți Keras să faceți fine-tune unui model
-* Cum să folosiți Keras pentru a obține predicții
-* Cum să folosiți un indicator custom
-
-{/if}
-Pentru a încărca checkpoint-urile antrenate pe Hugging Face Hub, veți avea nevoie de un cont la huggingface.co: [creați un cont](https://huggingface.co/join)
\ No newline at end of file
diff --git a/chapters/ro/chapter3/2.mdx b/chapters/ro/chapter3/2.mdx
deleted file mode 100644
index 8d6cc6c4c..000000000
--- a/chapters/ro/chapter3/2.mdx
+++ /dev/null
@@ -1,393 +0,0 @@
-`<FrameworkSwitchCourse {fw} />`
-
-# Procesarea datelor [[processing-the-data]]
-
-{#if fw === 'pt'}
-
-<CourseFloatingBanner chapter={3}
-    classNames="absolute z-10 right-0 top-0"
-    notebooks={[
-        {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter3/section2_pt.ipynb"},
-        {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter3/section2_pt.ipynb"},
-]} />
-{:else}
-
-<CourseFloatingBanner chapter={3}
-
-classNames="absolute z-10 right-0 top-0"
-    notebooks={[
-        {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter3/section2_tf.ipynb"},
-        {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter3/section2_tf.ipynb"},
-]} />
-
-{/if}
-
-{#if fw === 'pt'}
-Continuând cu exemplul din [capitol anterior](/course/chapter2), mai jos vedeți cum putem să antrenăm un sequence classifier pe un singur batch în PyTorch:
-
-```python
-import torch
-from transformers import AdamW, AutoTokenizer, AutoModelForSequenceClassification
-
-checkpoint = "bert-base-uncased"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
-
-sequences = [
-    "Am așteptat toată viața mea pentru un curs HuggingFace.",
-    "Acest curs este fascinant!",
-]
-batch = tokenizer(sequences, padding=True, truncation=True, return_tensors="pt")
-
-# Acesta este nou
-batch["labels"] = torch.tensor([1, 1])
-
-optimizer = AdamW(model.parameters())
-loss = model(**batch).loss
-loss.backward()
-optimizer.step()
-```
-{:else}
-Continuând cu exemplul din [capitolul anterior](/course/chapter2), mai jos vedeți cum continuăm antrenarea unui sequence classifier pe un batch în TensorFlow:
-
-```python
-import tensorflow as tf
-import numpy as np
-from transformers import AutoTokenizer, TFAutoModelForSequenceClassification
-
-# Același lucru ca dinainte
-checkpoint = "bert-base-uncased"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint)
-sequences = [
-    "Am așteptat toată viața mea pentru un curs HuggingFace.",
-    "Acest curs este fascinant!",
-]
-batch = dict(tokenizer(sequence, padding=True, truncate=True, return_tensors="tf"))
-
-
-# Aceasta este nou
-model.compile(optimizer="adam", loss="sparse_categorical_crossentropy")
-etichete = tf.convert_to_tensor([1, 1])
-model.train_on_batch(batch, etichete)
-```
-
-De obicei, antrenarea modelului pe două propoziții nu va da rezultate foarte bune. Pentru a obține rezultate mai bune, veți avea nevoie să pregătiți un dataset mai mare.
-
-În această secțiune vom folosi ca exemplu datasetul MRPC (Microsoft Research Paraphrase Corpus), introdus într-un [articol](https://www.aclweb.org/anthology/I05-5002.pdf) de William B. Dolan și Chris Brockett. Datasetul constă din 5,801 perechi de propoziții, cu o etichetă care indică dacă sunt paraphraseuri sau nu (adică dacă ambele propoziții au același înțeles). Am selectat-o pentru acest capitoldeoare că este un dataset mic, așa încât să fie ușor de experimentat cu antrenarea pe el.
-
-### Încărcarea unui dataset din Hub[[loading-a-dataset-from-the-hub]]
-
-{#if fw === 'ro'}
-<Youtube id="_BZearw7f0w"/>
-{:else}
-<Youtube id="W_gMJF0xomE"/>
-{/if}
-
-Hub-ul nu conține doar modele; de asemenea, conține multiple dataseturi înm mai multe limbi. Puteți naviga prin seturile de date [aici](https://huggingface.co/datasets), și vă recomandăm să încercați să încărcați și procurați un nou dataset odată ce veți fi trecut prin această secțiune (vedeți documentația generală [aici](https://huggingface.co/docs/datasets/loading)). Dar pentru moment, să ne concentrăm pe datasetul MRPC! Este una dintre cele 10 seturi de date care compun benchmark-ul [GLUE](https://gluebenchmark.com/), care este un benchmark academic folosit pentru a măsura performanța modelelor ML în 10 diferite sarcini de clasificare a textului.
-
-Biblioteca 🤗 Datasets oferă o comandă foarte simplă pentru a descărca și a stoca un dataset din Hub. Putem să instalăm datasetul MRPC astfel:
-
-<Tip>
-⚠️ **Avertizare** Asigurați-vă că `datasets` este instalat prin rularea `pip install datasets`. Apoi, încărcați dataset-ul MRPC și printați-l pentru a vedea ce conține.
-</Tip>
-
-```py
-from datasets import load_dataset
-
-raw_datasets = load_dataset("glue", "mrpc")
-raw_datasets
-```
-
-```python out
-DatasetDict({
-    train: Dataset({
-        features: ['sentence1', 'sentence2', 'label', 'idx'],
-        num_rows: 3668
-    })
-    validation: Dataset({
-        features: ['sentence1', 'sentence2', 'label', 'idx'],
-        num_rows: 408
-    })
-    test: Dataset({
-        features: ['sentence1', 'sentence2', 'label', 'idx'],
-        num_rows: 1725
-    })
-})
-```
-
-Ai observat că am obținut un obiect `DatasetDict` care conține setul de antrenare, setul de validare și setul de testare. Fiecare dintre acestea conține câteva coloane (`sentence1`, `sentence2`, `label`, și `idx`) și o numpăr de rânduri variabil, care reprezintă numărul de elemente în fiecare set (astfel, există 3.668 perechi de fraze în setul de antrenare, 408 în setul de validare și 1.725 în setul de testare).
-
-Acest comandă descarcă și face cache datasetului, în *~/.cache/huggingface/datasets*(folderul implicit de salvare). În capitolul 2, am văzut cum putem personaliza folderul de cache stabilind variabila de mediu `HF_HOME`.
-
-Putem accesa fiecare pereche de fraze din obiectul `raw_datasets` prin indexare, asemenea unui dicționar:
-
-```py
-raw_train_dataset = raw_datasets["train"]
-raw_train_dataset[0]
-```
-
-```python
-{'idx': 0,
- 'label': 1,
- 'sentence1': 'Amrozi l-a acuzat pe fratele său, pe care l-a numit „martorul” , că distorsionează intenționat probele sale.',
- 'sentence2': 'Referindu-se la el doar sub numele de " martorul ", Amrozi l-a acuzat pe fratele său că distorsionează intenționat probele sale.'}
-```
-
-Putem vedea că labels sunt numere întregi, așadar nu vom trebui să facem nicio procesare în acest sens. Pentru a ști care număr întreg corespunde cu care label, putem inspecta variabila `features` al 'raw_train_dataset'. Acest lucru ne va spune tipul fiecărui coloană.
-
-```py
-raw_train_dataset.features
-```
-
-```python out
-{'sentence1': Value(dtype='string', id=None),
- 'sentence2': Value(dtype='string', id=None),
- 'label': ClassLabel(num_classes=2, names=['not_equivalent', 'equivalent'], names_file=None, id=None),
- 'idx': Value(dtype='int32', id=None)}
-```
-
-În spatele, `label` este obiect de tip `ClassLabel`, iar maparea numerelor întregi la numele label-ului este stocat în folderele *names*. Astfel, `0` corespunde cu `not_equivalent`, iar `1` corespunde cu `equivalent`.
-
-<Tip>
-
-✏️ **Încercați-o!** Arată elementul 15 din setul de antrenament și elementul 87 din setul de validare. Care sunt label-urile acesotra?
-
-</Tip>
-
-### Preprocessing un datset[[preprocessing-a-dataset]]
-
-{#if fw === 'pt'}
-<Youtube id="0u3ioSwev3s"/>
-{:else}
-<Youtube id="P-rZWqcB6CE"/>
-{/if}
-
-Pentru a prelucra datele, trebuie să convertim textul în numere pe care modelul le poate înțelege. Cum ai văzut în [capitol anterior](/course/chapter2), acest lucru se face cu ajutorul unui tokenizer. Putem să oferim tokenizerului o propoziție sau o listă de propoziții, așa că putem să tokenizăm direct toate primele propoziții și toate cele de-a doua propoziții ale fiecărei perechi în felul următor:
-
-```py
-from transformers import AutoTokenizer
-
-checkpoint = "bert-base-uncased"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-tokenized_sentences_1 = tokenizer(raw_datasets["train"]["sentence1"])
-tokenized_sentences_2 = tokenizer(raw_datasets["train"]["sentence2"])
-```
-
-Însă nu putem să transmitem doar două propoziții către model și să obținem o predicție dacă cele două propoziții sunt parafraze sau nu. Trebuie să controlăm cele două secvențe ca o pereche, apoi să le aplicăm preprocesarea adecvată. Norocul este că tokenizer-ul poate lua o pereche de propoziții și le poate pregăti în felul în care modelul BERT îl așteaptă: 
-
-```py
-inputs = tokenizer("Aceasta este prima propoziție.", "Aceasta este a doua.")
-inputs
-
-```
-
-```python out
-{ 
-  'input_ids': [101, 2023, 2003, 1996, 2034, 6251, 1012, 102, 2023, 2003, 1996, 2117, 2028, 1012, 102],
-  'token_type_ids': [0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1],
-  'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]
-}
-```
-
-Am discutat despre `input_ids` și `attention_mask` cheii în [Capitolul 2](/course/chapter2), dar am întârziat cu abordarea cheii `token_type_ids`. În acest exemplu, această cheie este ceea ce spune modelului care parte a inputului este prima propoziție și care este a doua.
-
-<Tip>
-✏️ **Încercați!** Luați elementul 15 din setul de antrenare și tokenizați cele două propoziții separat și ca o pereche. Care este diferența dintre rezultatele celor două? 
-</Tip>
-
-Dacă facem decode ID-urilor din `input_ids` înapoi la cuvinte:
-
-```python
-tokenizer.convert_ids_to_tokens(inputs["input_ids"])
-```
-
-Noi vom obține următorul rezultat:
-
-```python
-['[CLS]', 'acesta', 'este', 'prima', 'propoziție', '.', '[SEP]', 'acesta', 'este', 'a', 'doua', '.', '[SEP]']
-```
-
-Prin urmare, modelul așteaptă ca inputul să fie în forma `[CLS] sentence1 [SEP] sentence2 [SEP]` atunci când există două propoziții. Aliniind această informație cu `token_type_ids`, obținem:
-
-```python
-['[CLS]', 'acesta', 'este', 'prima', 'propoziție', '.', '[SEP]', 'acesta', 'este', 'a', 'doua', '.', '[SEP]']
-[      0,      0,    0,     0,       0,          0,   0,       0,      1,    1,     1,        1,     1,   1,       1]
-```
-
-Observăm,că inputul corespunzător `[CLS] sentence1 [SEP]` au toate un token type ID de `0`, în timp ce celelalte părți, corespunzătoare `sentence2 [SEP]`, au toate un token type ID de `1`.
-
-Înțelegem că dacă selectăm alt checkpoint al modelului, nu vom avea neapărat `token_type_ids` în inputurile tokenizate (de exemplu, ele nu sunt returnate dacă folosim un model DistilBERT). Acestea sunt returnate doar atunci când modelul știe ce să facă cu ele, pentru că le-a văzut în timpul pretrainingului.
-
-În acest caz, BERT este antrenat cu token type IDs și pe lângă the masked language modeling objective despre care am vorbit în [Capitolul 1](/course/chapter1), are un objective suplimentar numit _next sentence prediction_. Objectiveul este destinat modelării relației între perechi de propoziții.
-
-Cu următoare predicție a propoziției, modelului i se prezintă perechi de propoziții (cu masked tokens aleatoriu) și i se cere să prezică dacă a doua propoziție urmează primei. Pentru a face sarcina non-trivial, în jumătate dintre cazuri propizițiie urmează una pe alta în documentul original din care au fost extrase și cealaltă jumătate ele vin de la două documente diferite.
-
-În general, nu trebuie să vă faceți griji dacă există sau nu `token_type_ids` în inputurile tokenizate: atât timp cât folosiți aceelași checkpoint al modelului și a tokenizer-ului, totul va fi bine, pentru că tokenizer-ul știe ce are de oferit modelului.
-
-Acum că am văzut cum poate prelucra tokenizer-ul o pereche de propoziții, îl putem folosi acest lucru pentru a tokeniza întregul nostru dataset: exact ca în [capitolul anterior](/course/chapter2), putem să oferim tokenizer-ului o listă de perechi de propoziții oferindu-i prima listă de propoziții și apoi lista a doua. Acest lucru este compatibil cu padding-ul și truncation-ul pe care le-am văzut în [Capitolul 2](/course/chapter2). În felul acesta putem prelucra datasetul de antrenare astfel:
-
-```py
-tokenized_dataset = tokenizer(
-    raw_datasets["train"]["sentence1"],
-    raw_datasets["train"]["sentence2"],
-    padding=True,
-    truncation=True,
-)
-```
-
-Această metodă funcționează bine, dar are dezavantajul că returnează un dicționar (cu key-urile noastre, `input_ids`, `attention_mask`, și `token_type_ids` și valori care sunt liste de liste). Va funcționa doar dacă aveți destul de RAM pentru a stoca întreg dataset în tokenizării acestuia (iar dataset-urile din biblioteca 🤗 Datasets sunt fișiere [Apache Arrow](https://arrow.apache.org/) stocate pe disc, deci tu stochezi numai sample-urile pe care le ceri să se păstreaze în memorie).
-
-Acum că am înțeles modul în care tokenizer-ul nostru poate gestiona o pereche de fraze, putem folosi el pentru a tokenize întregul nostru set de date: la fel cum am făcut în [capitolul anterior](/course/chapter2), putem alimenta tokenizer-ul cu lista de prime fraze și apoi lista de fraze secunde. Această metodă este compatibilă și cu opțiunile de umplere și tăiere pe care le-am văzut în [Capitolul 2](/course/chapter2). Astfel, una dintre modalitățile prin care putem preprocesa dataset-ul de antrenare este:
-
-```py
-tokenized_dataset = tokenizer(
-    raw_datasets["train"]["sentence1"],
-    raw_datasets["train"]["sentence2"],
-    padding=True,
-    truncation=True,
-)
-```
-
-Această metodă funcționează bine, dar are dezavantajul că returnează un dicționar (cu cheile noastre, `input_ids`, `attention_mask`, și `token_type_ids`, și valori care sunt liste de liste). Va fi disponibilă doar dacă aveți suficient spațiu de memorie pentru a stoarca întregul set de date în timpul tokenizării (în timp ce dataset-urile din biblioteca 🤗 Datasets se salvează sub forma [Apache Arrow](https://arrow.apache.org/), fișiere stocate pe disch, astfel încât doar acele fragmente ale datelor pe care le cerem să fie încărcate în memorie).
-
-Pentru a păstra datele în forma de dataset, vom folosi metoda [`Dataset.map()`](https://huggingface.co/docs/datasets/package_reference/main_classes#datasets.Dataset.map). Aceasta ne permite puțin mai multă flexibilitate, dacă ne trebuie mai multă preprocesare pe lângă tokenization. Metoda `map()` aplică o funcție asupra fiecărui element al datasetului, astfel putem să definim o funcție care tokenizează input-urile noastre:
-
-```py
-def tokenize_function(example):
-    return tokenizer(example["sentence1"], example["sentence2"], truncation=True)
-```
-
-Această funcție i-a un dicționar (ca și elementele datasetului) și returnează un nou dicționar cu key-urile `input_ids`, `attention_mask`, și `token_type_ids`. Acesta va lucra chiar și dacă dicționarul "example" conține câteva sample-uri(fiecare key ca o list de propoziții), întrucât "tokenizer"-ul lucrează și cu liste cu perechi de propoziții cum am văzut mai devreme. Aceasta va permite folosirea opțiunii `batched=True` în apelul funcției `map()`, ceea ce va accelera semnificativ tokenizarea. `Tokenizer`-ul nostru este susținut de un tokenizer scris în Rust din biblioteca [🤗 Tokenizers](https://github.com/huggingface/tokenizers). Acest tokenizer poate fi extrem de rapid, dar numai dacă îi dăm multe inputuri odată.
-
-*Atenție*:Am omis argumentul `padding` din funcția noastră de tokenizare pentru moment. Acest lucru este datorat faptului că aplicarea padding-ului tuturor elementelor cu lungimea maximă nu este eficientă: în schimb, este mai bine să faceți padding elementelor atunci când creați un batch, astfel încât să vă trebuiască doar să faceți padding până la lungimea maximă doar în acest batch și nu întregului dataset. Acest lucru poate salva mult timp și resurse atunci când input-urile au lungimi foarte variabile.
-
-Aici este modul în care aplicăm funcția de tokenizare asupra tuturor dataset-urilor noastre. Folosim `batched=True` în apelul funcției `map` astfel încât funcția să fie aplicată asupra mai multor elemente ale datasetului odată. Aceasta permite preprocesarea accelerată.
-
-```py
-tokenized_datasets = raw_datasets.map(tokenize_function, batched=True)
-tokenized_datasets
-```
-
-Modul în care biblioteca 🤗 Datasets aplică această procesare este prin adăugarea de noi câmpuri la dataset-uri, unul pentru fiecare key din dicționarul returnat de funcția de preprocesare:
-
-```python out
-DatasetDict({
-    train: Dataset({
-        features: ['attention_mask', 'idx', 'input_ids', 'label', 'sentence1', 'sentence2', 'token_type_ids'],
-        num_rows: 3668
-    })
-    validation: Dataset({
-        features: ['attention_mask', 'idx', 'input_ids', 'label', 'sentence1', 'sentence2', 'token_type_ids'],
-        num_rows: 408
-    })
-    test: Dataset({
-        features: ['attention_mask', 'idx', 'input_ids', 'label', 'sentence1', 'sentence2', 'token_type_ids'],
-        num_rows: 1725
-    })
-})
-```
-
-Puteți chiar și folosi multiprocessing când aplicați funcția de preprocesare cu `map()` prin folosirea unui argument `num_proc`. Nu am făcut acest lucru aici pentru că biblioteca 🤗 Tokenizers utilizează deja mai multe thread-uri pentru a tokeniza sample-urile mai rapid, dar dacă nu folosiți un tokenizer rapid cu această bibliotecă, acest lucru v-ar putea accelera preprocesarea.
-
-Funcția `tokenize_function` returnează un dicționar cu key-urile `input_ids`, `attention_mask`, și `token_type_ids`, astfel că aceste trei câmpuri sunt adăugate tuturor split-urilor în dataset-urile noastre. Notați-vă că am putea chiar schimba câmpurile existente dacă funcția de preprocesare ar returna o nouă valoare pentru un key din dataset-ul pe care aplicăm `map()`.
-
-Ultimul lucru pe care trebuie să îl facem este să facem padding tuturor exemplelor până la lungimea celui mai mare element atunci când facem batch elementelor împreună – o tehnică pe care o denumim *dinamic padding*.
-
-### Dinamic Padding[[dynamic-padding]]
-<Youtube id="7q5NyFT8REg"/>
-{#if fw === 'pt'}
-
-Funcția care este responsabilă de a pune împreună sample-urile într-un batch se numește *collate function*. Este un argument default pe care puteți să-l transmiteți când construiți un `DataLoader`, valoarea implicită fiind o funcție care va converti sample-urile în tensors PyTorch și le va concatena (recursiv dacă elementele dumneavoastră sunt liste, tuple-uri sau dicționare). Acest lucru nu este posibil în cazul nostru deoarece input-urile noastre nu vor avea toate aceeași dimensiune. Am amânat intenționat padding-ul pentru a o aplica numai atunci când e nevoie, pe fiecare batch și să evităm astfel exemplele cu lungimi prea mari cu multe padding-uri. Acest lucru va accelera antrenarea, dar notați-vă că dacă antrenați pe un TPU, acest lucru poate cauza probleme – TPU-urile preferă forme fixe, chiar dacă aceasta înseamnă padding suplimentar.
-
-{:else}
-
-Funcția care este responsabilă de a pune împreună sample-urile într-un batch se numește *collate function*. Collator-ul default este o funcție ce va transforma sample-urile în tf. Faceți Tensor și concatenațile (recursiv dacă elementele dumneavoastră sunt liste, tuple-uri sau dicționare). Acest lucru nu este posibil în cazul nostru deoarece input-urile noastre nu vor avea toate aceeași dimensiune. Am amânat intenționat padding-ul pentru a o aplica numai atunci când e nevoie, pe fiecare batch și să evităm astfel exemplele cu lungimi prea mari cu multe padding-uri. Acest lucru va accelera antrenarea, dar notați-vă că dacă antrenați pe un TPU, acest lucru poate cauza probleme – TPU-urile preferă forme fixe, chiar dacă aceasta înseamnă padding suplimentar.
-
-{/if}
-
-Pentru a face acest lucru, trebuie să definim o funcție collate care va aplica cantitatea corectă de padding pentru elementele din dataset-ul pe care vrem să-i facem batch. Norocul este că biblioteca 🤗 Transformers ne oferă o asemenea funcție prin `DataCollatorWithPadding`. Aceasta i-a un tokenizer atunci când o inițializați(pentru a ști care padding token să folosim și dacă modelul se așteaptă ca padding-ul să fie pe stânga sau dreapta inputu-lui) și va face tot ce este nevoie:
-{#if fw === 'pt'}
-```py
-from transformers import DataCollatorWithPadding
-data_collator = DataCollatorWithPadding(tokenizer=tokenizer)
-```
-{:else}
-```py
-from transformers import DataCollatorWithPadding
-data_collator = DataCollatorWithPadding(tokenizer=tokenizer, return_tensors="tf")
-```
-{/if}
-
-Pentru a testa acest nou jucărie, să luăm câteva sample-uri din setul nostru de antrenare pe care am dori să le facem batch împreună. Aici, ștergem coloanele `idx`, `sentence1` și `sentence2` deoarece nu vor fi necesare și conțin stringuri (și nu putem crea tensore cu stringuri) și uitați-vă la lungimile fiecărui element din lotul nostru:
-
-```py
-samples = tokenized_datasets["train"][:8]
-samples = {k: v for k, v in samples.items() if k not in ["idx", "sentence1", "sentence2"]}
-[len(x) for x in samples["input_ids"]]
-```
-
-```python out
-[50, 59, 47, 67, 59, 50, 62, 32]
-```
-
-Nu e de mirare că obținem sample-uri de lungimi diferite, între 32 și 67. Dynamic padding înseamnă că sample-urilor din acest batch le-ar trebui aplicate padding cu o lungime de 67, lungimea cea mai mare din batch. Fără Dynamic padding, toate sample-urile ar fi avut padding cu maximul lungimii din întregul dataset sau maximul lungimii pe care modelul poate accepta. Să verificăm încă o dată dacă `data_collator`-ul nostru face dynamic padding pe batch:
-
-```py
-batch = data_collator(samples)
-{k: v.shape for k, v in batch.items()}
-```
-
-{#if fw === 'tf'}
-
-```python out
-{'attention_mask': TensorShape([8, 67]),
- 'input_ids': TensorShape([8, 67]),
- 'token_type_ids': TensorShape([8, 67]),
- 'labels': TensorShape([8])}
-```
-
-{:else}
-
-```python out
-{'attention_mask': torch.Size([8, 67]),
- 'input_ids': torch.Size([8, 67]),
- 'token_type_ids': torch.Size([8, 67]),
- 'labels': torch.Size([8])}
-```
-
-Looking good! Acum că am trecut de la textul raw la batch-uri pe care modelul nostru poate să le proceseze, suntem gata să îi facem fine-tune!
-
-{/if}
-
-<Tip>
-
-✏️ **Încearcă-ți norocul!** Implementează preprocesarea datelor pe dataset-ul GLUE SST-2. Acesta se diferență puțin deoarece nu conține perechi de propoziții, ci doar câte o propoziție, dar ceea ce am făcut ar trebui să rămână neschimbat. Pentru o provocare mai grea, încearcă să scrii o funcție de preprocesare care se aplică oricărui task GLUE.
-
-</Tip>
-
-{#if fw === 'tf'}
-
-Acum că avem dataset-ul nostru și un `data_collator`, este timpul să-i punem la lucru. În loc să încărcăm manual batch-urile și să le facem collate, asta însemnând prea mult lucru și, nu ar fi nici prea performantă. În schimb, există o metodă simplă care oferă o soluție performantă la acest problemă: `to_tf_dataset()`. Acest lucru va face wrap unui `tf.data.Dataset` în jurul datasetului nostru, cu o fucție opțională de collation. `tf.data.Dataset` este un format nativ TensorFlow pe care Keras-ul o poate folosi pentru `model.fit()`, astfel încât această metodă face convert unui 🤗 Dataset la un format gata să fie antrenat. Hai să-l vedem în acțiune cu datasetul nostru!
-
-```py
-tf_train_dataset = tokenized_datasets["train"].to_tf_dataset(
-    columns=["attention_mask", "input_ids", "token_type_ids"],
-    label_cols=["labels"],
-    shuffle=True,
-    collate_fn=data_collator,
-    batch_size=8,
-)
-
-tf_validation_dataset = tokenized_datasets["validation"].to_tf_dataset(
-    columns=["attention_mask", "input_ids", "token_type_ids"],
-    label_cols=["labels"],
-    shuffle=False,
-    collate_fn=data_collator,
-    batch_size=8,
-)
-```
-
-Și asta e tot! Putem lua aceste dataset-uri pentru următoarea lecție, unde antrenamentul va fi ușor după toată munca depusă pentru prelucrarea datelor.
-
-{/if}
\ No newline at end of file
diff --git a/chapters/ro/chapter3/3.mdx b/chapters/ro/chapter3/3.mdx
deleted file mode 100644
index df987c810..000000000
--- a/chapters/ro/chapter3/3.mdx
+++ /dev/null
@@ -1,174 +0,0 @@
-
-<FrameworkSwitchCourse {fw} />
-
-# Fine-tuningul unui model cu API-ul Trainer[[fine-tuning-a-model-with-the-trainer-api]]
-
-<CourseFloatingBanner chapter={3}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[ 
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter3/section3.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter3/section3.ipynb"},
-]} />
-
-<Youtube id="nvBXf7s7vTI"/>
-
-🤗 Transformers oferă o clasă `Trainer` pentru a vă ajuta să faceți fine-tune pe oricare dintre modelurile preantrenate pe care le oferă pe datasetul dvs. Odată ce ați terminat preprocesarea datelor din ultima secțiune, mai aveți doar câteva pași rămași pentru a defini `Trainerul`. Partea cea mai grea este probabil pregătirea environmentul pentru a rula `Trainer.train()`, deoarece va lua mult timp pe un CPU. Dacă nu aveți niciun GPU configurat, puteți accesa gratuit GPUuri sau TPUuri pe [Google Colab](https://colab.research.google.com/).
-
-Exemplele de cod de mai jos presupune că ați executat exemplele din secțiunea anterioară. Aici este o scurtă recapitulare despre ce aveți nevoie:
-
-```py
-from datasets import load_dataset
-from transformers import AutoTokenizer, DataCollatorWithPadding
-
-raw_datasets = load_dataset("glue", "mrpc")
-checkpoint = "bert-base-uncased"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-
-
-def tokenize_function(example):
-    return tokenizer(example["sentence1"], example["sentence2"], truncation=True)
-
-
-tokenized_datasets = raw_datasets.map(tokenize_function, batched=True)
-data_collator = DataCollatorWithPadding(tokenizer=tokenizer)
-```
-
-### Antrenarea[[training]]
-
-Înainte de a putea defini `Trainerul`, trebuie să definim o clasă `TrainingArguments` care va conține toți hyperparameters pe care `Trainer` le va folosi pentru antrenare și evaluare. Singurul argument pe care trebuie să-l oferiți este un folder în care modelul anternat va fi salvat, precum și checkpointurile de-a lungul drumului. Toate celelalte pot fi lăsate ca valori default, care ar trebui să funcționeze destul de bine pentru un fine-tune de bază.
-
-```py
-from transformers import TrainingArguments
-
-training_args = TrainingArguments("test-trainer")
-```
-
-<Tip>
-
-💡 Dacă doriți să încărcați automat modelul pe Hub în timpul antrenării, transmiteți `push_to_hub=True` în `TrainingArguments`. Ne vom întoarce la acest subiect în [Capitolul 4](/course/chapter4/3)
-
-</Tip>
-
-A doua etapă este definiția modelului nostru. Ca în capitolul anterior, vom folosi clasa `AutoModelForSequenceClassification`, cu două labeluri:
-
-```py
-from transformers import AutoModelForSequenceClassification
-
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
-```
-
-Observăm că, spre deosebire de [Capitolul 2](/course/chapter2), se emite o avertizare după crearea acestui model preantrenat. Acest lucru este datorit faptului că BERT nu a fost antrenat pentru clasificarea perechilor de propoziții, astfel încât headul modelului preantrenat a fost eliminat și un nou head adecvat pentru clasificarea secvențelor a fost adăugat în loc. Avertizările indică faptul că anumite weights nu au fost utilizate (cele care corespundeau headului eliminat) și celelalte au fost inițializate aleatoriu (cele pentru noul head). Aceasta se termină cu o recomandare de a antrena modelul, ceea ce vom face acum.
-
-Odată ce am definit modelul nostru, putem defini `Trainer` prin transmiterea tuturor obiectelor construite până acum — `model`, `training_args`, a training și validation datasets, `data_collator`, și `tokenizer`:
-
-```py
-from transformers import Trainer
-
-trainer = Trainer(
-    model,
-    training_args,
-    train_dataset=tokenized_datasets["train"],
-    eval_dataset=tokenized_datasets["validation"],
-    data_collator=data_collator,
-    tokenizer=tokenizer,
-)
-```
-
-Observăm că, dacă transmitem `tokenizer`, atunci defaultul `data_collator` folosit de `Trainer` va fi un `DataCollatorWithPadding` similar celui definit mai devreme. Din acest motiv, puteți omite linia `data_collator=data_collator` aici. A fost important să vă arătăm această parte în secțiunea 2!
-
-Pentru a face fine-tune modelului pe datasetul nostru, trebuie să apelăm metoda `train()` a `Trainerului`:
-
-```py
-trainer.train()
-```
-
-Acest lucru va începe fine-tuningul (care ar trebui să dureze câteva minute pe un GPU) și va raporta training loss la fiecare 500 de pași. Totuși, nu va raporta cât de bine sau rău se descurcă modelul. Acest lucru este datorat:
-
-1. Nu am transmis `Trainerului` să efectueze evaluarea în timpul antrenării, prin setarea `evaluation_strategy` la `"steps"` (evaluați la fiecare `eval_steps`) sau `"epoch"` (evaluați la finalul fiecărei epoch).
-2. Nu am oferit `Trainerului` o funcție `compute_metrics()` pentru a calcula metricele în timpul evaluări(altminter evalurea ar fi printat doar lossul, care nu este un număr foarte intuitiv).
-
-### Evaluare[[evaluation]]
-
-Să vedem cum putem construi o funcție `compute_metrics()` folositoare și să o utilizăm la următoarea antrenare. Funcția trebuie să primească obiectul `EvalPrediction` (un named tuple cu fieldul `predictions` și altul `label_ids`) și să returneze un dicționar ce le asociază făcând mapping valorilor string la valori float (stringurile fiind denumirile metricelor returnate, și valorile floats al acestora). Pentru a obține câteva predicții din model, putem folosi comanda `Trainer.predict()`:
-
-```py
-predictions = trainer.predict(tokenized_datasets["validation"])
-print(predictions.predictions.shape, predictions.label_ids.shape)
-```
-
-```python out
-(408, 2) (408,)
-```
-
-Outputul metodei `predict()` este un named tuple  cu trei fielduri: `predictions`, `label_ids` și `metrics`. Câmpul `metrics` va conține doar lossul asupra datasetului transmis, precum și o serie de metrice de timp (cât de mult a luat prezicerea și timpul mediu). Odată ce vom completa funcția `compute_metrics()` și îl vom oferi `Trainerului`, atunci acel field va conține și metricele returnate de `compute_metrics()`.
-
-După cum puteți vedea, `predictions` este un array bi-dimensional cu shapeul 408x2 (408 fiind numărul de elemente în datasetul folosit). Acestea sunt logiturile pentru fiecare element al datasetului pe care le-am oferit funcției `predict()` (cum ați văzut în [capitolul anterior](/course/chapter2), toate modelel Transformer returneă logituri). Pentru a le transforma în predicții pe care să le comparăm cu labelurile noastre, noi trebui să luăm indexul cu cea mai mare valoare pe axa a doua:
-
-
-```py
-import numpy as np
-
-preds = np.argmax(predictions.predictions, axis=-1)
-```
-
-Acum putem compara `preds` cu labelurile. Ca să construim funcțioa noastră `compute_metric()`, o să ne bazăm pe metricele de la librăria 🤗 [Evaluate](https://github.com/huggingface/evaluate/). Putem încărca metricele asociate cu datasetul MRPC la fel de ușor cum am încărcat datasetul, de data asta cu funcția `evaluate.load()`. Obiectul returnat are o metodă `compute()` pe care o putem folosi ca să facem calcularea metricelor:
-
-```py
-import evaluate
-
-metric = evaluate.load("glue", "mrpc")
-metric.compute(predictions=np.argmax(predictions.predictions, axis=-1), references=predictions.label_ids)
-```
-
-```python out
-{'accuracy': 0.8578431372549019, 'f1': 0.8996539792387542}
-```
-
-Rezultatele exacte pe care le veți obține pot varia, deoarece inițializarea aleatoare a headului modelului care poate schimba metricele pe care le-a atins. Aici putem vedea că modelul nostru are o precizie de 85.78% în setul de validare și un scor F1 de 89.97. Acestea sunt exact aceleași metrice folosite pentru evaluarea rezultatelor pe datasetul MRPC pentru GLUE benchmark. Tabelul din [BERT Paper](https://arxiv.org/pdf/1810.04805.pdf) a raportat un scor F1 de 88.9 pentru modelul de bază. Acela a fost un `uncased` model, dar noi utilizăm acum un `cased` model, ceea ce explică rezultatul mai bun.
-
-Pentru a reuni toate acestea într-o singură funcție `compute_metrics()`, putem scrie:
-
-```py
-def compute_metrics(eval_preds):
-    metric = evaluate.load("glue", "mrpc")
-    logits, labels = eval_preds
-    predictions = np.argmax(logits, axis=-1)
-    return metric.compute(predictions=predictions, references=labels)
-```
-
-Să vedem acum cum putem utiliza această funcție pentru a raporta metricele la sfârșitu fiecărei epoch, mai jos puteți vedea cum definim un nou `Trainer` cu funcția compute:
-
-```py
-training_args = TrainingArguments("test-trainer", evaluation_strategy="epoch")
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
-
-trainer = Trainer(
-    model,
-    training_args,
-    train_dataset=tokenized_datasets["train"],
-    eval_dataset=tokenized_datasets["validation"],
-    data_collator=data_collator,
-    tokenizer=tokenizer,
-    compute_metrics=compute_metrics,
-)
-```
-
-Observăm că am creat un nou `TrainingArguments` cu `evaluation_strategy` setat la `"epoch"` și o nouă instanță a modelului. În cazul nostru, ar fi fost suficient să continuam antrenarea prezentată anterior.
-
-Pentru a lansa o nouă antrenare, putem executa:
-
-```py
-trainer.train()
-```
-
-De data aceasta, acesta va raporta validation loss și metricele la sfârșitul fiecărui epocă pe lângă training loss. Dar acuratețea/scorul F1 pe care îl atingeți poate fi puțin diferit față de ceea ce am găsit, datorită inițializării aleatoare a headului modelului, dar ar trebui să nu difere foarte mult.
-
-`Trainerul` va funcționa în mod automat pe mai multe GPU-uri sau TPU-uri și oferă multe opțiuni, cum ar fi mixed-precision training(folosiți `fp16 = True` în argumentele de antrenare). Vom discuta despre toate opțiunile pe care le are în Capitolul 10.
-
-Cu aceasta terminăm introducerea fine-tuningului folosind API-ul `Trainer`. Un exemplu de a face acest lucru pentru majoritatea sarcinilor NLP va fi dat în [Capitolul 7](/course/chapter7), dar pentru moment să vedem cum putem face același lucru doar cu PyTorch.
-
-<Tip>
-
-✏️ **Încearcă!** Fă fine-tune unui model pe datasetul GLUE SST-2, folosind procesarea de date efectuată în secțiunea 2.
-
-</Tip>
diff --git a/chapters/ro/chapter3/3_tf.mdx b/chapters/ro/chapter3/3_tf.mdx
deleted file mode 100644
index 146a4b118..000000000
--- a/chapters/ro/chapter3/3_tf.mdx
+++ /dev/null
@@ -1,206 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Aplicarea fine-tuningului asupra unui model cu Keras[[fine-tuning-a-model-with-keras]]
-
-<CourseFloatingBanner chapter={3}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[ 
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter3/section3_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter3/section3_tf.ipynb"},
-]} />
-
-Odată ce ai finalizat toate operațiile de preprocesare a datelor din ultima secțiune, ai doar câțiva pași rămași pentru a antrena modelul. Însă, observați că `model.fit()` va rula foarte lent pe un CPU. Dacă nu aveți un GPU configurat, puteți accesa GPU-uri sau TPUs pe gratis pe [Google Colab](https://colab.research.google.com/).
-
-Exemplele de cod de mai jos presupun că ați executat deja exemplele din secțiunea precedentă. Aici este o scurtă sumarizare care recapitulează ceea ce trebuie să faceți:
-
-```py
-from datasets import load_dataset
-from transformers import AutoTokenizer, DataCollatorWithPadding
-import numpy as np
-
-raw_datasets = load_dataset("glue", "mrpc")
-checkpoint = "bert-base-uncased"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-
-
-def tokenize_function(example):
-    return tokenizer(example["sentence1"], example["sentence2"], truncation=True)
-
-
-tokenized_datasets = raw_datasets.map(tokenize_function, batched=True)
-
-data_collator = DataCollatorWithPadding(tokenizer=tokenizer, return_tensors="tf")
-
-tf_train_dataset = tokenized_datasets["train"].to_tf_dataset(
-    columns=["attention_mask", "input_ids", "token_type_ids"],
-    label_cols=["labels"],
-    shuffle=True,
-    collate_fn=data_collator,
-    batch_size=8,
-)
-
-tf_validation_dataset = tokenized_datasets["validation"].to_tf_dataset(
-    columns=["attention_mask", "input_ids", "token_type_ids"],
-    label_cols=["labels"],
-    shuffle=False,
-    collate_fn=data_collator,
-    batch_size=8,
-)
-```
-
-
-### Antrenare[[antrenare]]
-
-
-Modelele TensorFlow importate din 🤗 Transformers sunt deja modele Keras. Aici este o scurtă introducere în Keras.
-
-<Youtube id="rnTGBy2ax1c"/>
-
-
-Astfel, odată ce avem datele noastre, putem începe antrenarea lor foarte ușor.
-
-
-<Youtube id="AUozVp78dhk"/>
-
-
-În același mod ca și în [capitolul anterior](/course/chapter2), vom folosi clasa `TFAutoModelForSequenceClassification`, cu două labeluri:
-
-```py
-from transformers import TFAutoModelForSequenceClassification
-
-model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
-```
-
-Veți observa că în comparație cu [Capitolul 2](/course/chapter2), veți primi o avertizare după ce inițializați acest model preantrenat. Acest lucru se datorează faptului că BERT nu a fost antrenat pentru clasificarea perechilor de propoziții, astfel încât headul preantrenat al modelului a fost eliminat și un nou head potrivit pentru clasificarea secvențelor a fost adăugat în locul lui. Avertizările indică faptul că anumite weights nu au fost folosite (cele corespunzătoare headului de preantrenare eliminat) și că altele au fost inițializate aleatoriu (cele pentru noul capăt). Avertizarea se încheie prin încurajarea antrenării modelului, ceea ce este exact ceea ce vom face acum.
-
-
-Pentru a face fine-tune modelului pe datasetul nostru, avem de făcut `compile()` modelului și apoi să trasnmitem datele noastre spre metoda `fit()`. Acest lucru va porni procesul de fine-tuning (care ar trebui să dureze câteva minute pe un GPU) și va raporta training loss, plus validation loss la sfârșitul fiecărei epoci.
-
-<Tip>
-
-Observați că modelele 🤗 Transformers au o abilitate specială care nu este disponibilă pentru cele mai multe modele Keras - ele pot folosi automat un appropriate loss pe care le calculează intern. Ele vor utiliza această pierdere implicit dacă nu veți specifica un argument de pierdere în `compile()`. Pentru a folosi internal loss, va trebui să transmiteți labelurile ca parte din input, și nu ca nu label separat, ceea ce este modul normal de utilizare a labelurilor cu modelele Keras. Veți vedea exemple de acest tip în Partea 2 a cursului, unde definirea funcției de loss corecte poate fi dificilă. În cazul sequence classification, însă, o funcție Keras standard pentru loss se va dovedi suficient, astfel o vom folosi în acest context.
-
-</Tip>
-
-
-```py
-from tensorflow.keras.losses import SparseCategoricalCrossentropy
-
-model.compile(
-    optimizer="adam",
-    loss=SparseCategoricalCrossentropy(from_logits=True),
-    metrics=["accuracy"],
-)
-model.fit(
-    tf_train_dataset,
-    validation_data=tf_validation_dataset,
-)
-```
-
-
-<Tip warning={true}>
-
-Observați un pericol comun aici — puteți transmite doar numele pierderii ca un string în Keras, dar implicit Keras va presupune că deja ați aplicat un softmax la outputurile voastre. Multe modele, însă, produc outputurile direct înainte de aplicarea softmaxului, cunoscute și sub numele de *logit*. Trebuie să spuneți funcției loss că asta este ceea ce produce modelul tău, iar singura modalitate de a face acest lucru este de a-o chema direct, în loc de a o specifica numai cu un string.
-
-</Tip>
-
-### Îmbunătățirea performanței de antrenare
-
-<Youtube id="cpzq6ESSM5c"/>
-
-Dacă încerci codul de mai sus, sigur o să ruleze, dar vei constata că lossul scade doar lent sau doar sporadic. Principala cauză
-este *learning rateul*. Așa cum și lossul, când trimitem către Keras numele unui omptimizer ca uin string, Keras inițiază
-acel optimizer cu valori default pentru toți parametrii, inclusiv learning rateul. Din experiență, însă, știm că
-modelele transformer se bucură de un learning rate mult mai mic decât cel default pentru Adam, care este 1e-3, scris și ca 
-10 la puterea -3 sau 0.001. 5e-5 (0.00005), care este aproximativ douăzeci de ori mai mică, reprezintă o bază mult mai bună.
-
-În plus față de reducerea learning rateului, avem un al doilea truc la dispoziție: putem reduce treptat learning rateul
-pe parcursul antrenării. În documentație, vei găsi uneori această practică denumită *decaying* sau *annealing*
-learning rateul. În Keras, cel mai bun mod de a face acest lucru este să folosim un *learning rate scheduler*. O opțiune bună este
-`PolynomialDecay` — deși numele ar putea sugera altceva, cu setările default, el doar face decay liniar learning rateului din valoarea inițială
-până la valoarea finală pe parcursul antrenării; exact ceea ce ne-am dori. Pentru a utiliza corect un scheduler,
-însă, trebuie să-i spunem cât timp va dura antrenarea. Calculăm acest lucru sub forma `num_train_steps` de mai jos.
-
-```py
-from tensorflow.keras.optimizers.schedules import PolynomialDecay
-
-batch_size = 8
-num_epochs = 3
-# Numărul de pași de antrenare este numărul de sampleuri din dataset, împărțit la dimensiunea batchului și apoi înmulțit
-# cu numărul total de epoci. Observăm că `tf_train_dataset` aici este un batched tf.data.Dataset`,
-# nu datasetul original Hugging Face, astfel încât len() să fie deja num_samples // batch_size.
-num_train_steps = len(tf_train_dataset) * num_epochs
-lr_scheduler = PolynomialDecay(
-    initial_learning_rate=5e-5, end_learning_rate=0.0, decay_steps=num_train_steps
-)
-from tensorflow.keras.optimizers import Adam
-
-opt = Adam(learning_rate=lr_scheduler)
-```
-
-<Tip>
-
-Biblioteca 🤗 Transformers are funcția `create_optimizer()` care va crea un optimizer `AdamW` cu learning rate decay. Aceasta este o metodă convenabilă pe care o veți vedea în detaliu în viitoarele sec'iuni ale cursului.
-
-</Tip>
-
-Acum, avem noul nostru optimizer și putem încerca să antrenăm cu el. Începem cu reloadul modelului pentru a reseta modificările pe weighturole de la ultima rundă de antrenare ;o apoi putem face compile cu noul optimizer:
-
-```py
-import tensorflow as tf
-
-model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
-loss = tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True)
-model.compile(optimizer=opt, loss=loss, metrics=["accuracy"])
-```
-
-Acum putem face fit din nou:
-
-```py
-model.fit(tf_train_dataset, validation_data=tf_validation_dataset, epochs=3)
-```
-
-<Tip>
-
-💡 Dacă doriți să încărcați automat modelul dumneavoastră pe Hub în timpul antrenării, puteți transmite `PushToHubCallback` în metoda `model.fit()`. Mai multe despre acest lucru veți învăța în [Capitol 4](/course/chapter4/3).
-
-</Tip>
-
-### Model prediction
-
-<Youtube id="nx10eh4CoOs"/>
-
-
-Încheierea antrenării și observarea lossului scăzând este foarte frumos, dar ce se întămplă dacă doriți să obțineți efectiv outputuruke din modelul antrenat, fie pentru a calcula câteva metrice, fie pentru utilizarea modelului în producție? Pentru asta putem folosi metoda `predict()`. Aceasta va returna *logits* de la output headul al modelului, câte unul pe clasă.
-
-```py
-preds = model.predict(tf_validation_dataset)["logits"]
-```
-
-Puteți converti aceste logituri în predicțiile clasei modelului prin utilizarea `argmax` pentru a găsi logit-ul cel mai mare, care corespunde clasei celei mai probabile:
-
-```py
-class_preds = np.argmax(preds, axis=1)
-print(preds.shape, class_preds.shape)
-```
-
-```python out
-(408, 2) (408,)
-```
-
-Acum, să folosim aceste `preds` pentru a calcula câteva metrici! Puteți încărca metricele asociate cu datasetul MRPC în același mod cum am încărcat și datasetul, dar de data aceasta cu ajutorul funcției `evaluate.load()`. Obiectul returnat are o metodă de calculare `compute()` pe care o putem utiliza pentru a face metric calculation:
-
-```py
-import evaluate
-
-metric = evaluate.load("glue", "mrpc")
-metric.compute(predictions=class_preds, references=raw_datasets["validation"]["label"])
-```
-
-```python out
-{'accuracy': 0.8578431372549019, 'f1': 0.8996539792387542}
-```
-
-Rezultatele exacte pe care le veți obține pot varia, deoarece inițializarea aleatoare a headului modelului care poate schimba metricele pe care le-a atins. Aici putem vedea că modelul nostru are o precizie de 85.78% în setul de validare și un scor F1 de 89.97. Acestea sunt exact aceleași metrice folosite pentru evaluarea rezultatelor pe datasetul MRPC pentru GLUE benchmark. Tabelul din [BERT Paper](https://arxiv.org/pdf/1810.04805.pdf) a raportat un scor F1 de 88.9 pentru modelul de bază. Acela a fost un `uncased` model, dar noi utilizăm acum un `cased` model, ceea ce explică rezultatul mai bun.
-
-Acesta este punctul unde vă prezentăm introducerea la folosirea fine-tuningului cu ajutorul APIului Keras. Un exemplu bun pentru majoritatea sarcinilor NLP va fi dat în [Capitol 7](/course/chapter7). Dacă doriți să dezvoltați abilitățile dumneavoastră pe API-ul Keras, încercați să faceți fine-tune unui model pe datasetul GLUE SST-2 folosind procesarea de date din secvența 2.
\ No newline at end of file
diff --git a/chapters/ro/chapter3/4.mdx b/chapters/ro/chapter3/4.mdx
deleted file mode 100644
index bfb423625..000000000
--- a/chapters/ro/chapter3/4.mdx
+++ /dev/null
@@ -1,361 +0,0 @@
-# O antrenare completă [[a-full-training]]
-
-<CourseFloatingBanner chapter={3}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[ 
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter3/section4.ipynb"}, 
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter3/section4.ipynb"}, 
-]} />
-
-<Youtube id="Dh9CL8fyG80"/>
-
-Acum vom vedea cum putem atinge același rezultat pe care l-am obținut în secțiune anterioară fără a utiliza clasa `Trainer`. Din nou, noi presupunem că ai procesat datele în secțiunea 2. În continuare, găsiți o scurtă sinteză asupra tuturor informațiilor de care aveți nevoie:
-
-```py
-from datasets import load_dataset
-from transformers import AutoTokenizer, DataCollatorWithPadding
-
-raw_datasets = load_dataset("glue", "mrpc")
-checkpoint = "bert-base-uncased"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-
-
-def tokenize_function(example):
-    return tokenizer(example["sentence1"], example["sentence2"], truncation=True)
-
-
-tokenized_datasets = raw_datasets.map(tokenize_function, batched=True)
-data_collator = DataCollatorWithPadding(tokenizer=tokenizer)
-```
-
-### Pregătirea pentru antrenare[[prepare-for-training]]
-
-Înainte de a scrie propriul nostru loop de antrenament, vom avea nevoie să definim câteva obiecte. Primele dintre ele sunt dataloader-urile pe care le vom utiliza pentru a itera peste batch-uri. Dar înainte de a putea defini aceste datealoader-uri, trebuie să aplicăm o anumită postprocesare pe `tokenized_datasets`, pentru a avea grijă de unele lucruri care au fost automatizate de către `Trainer`. În special:
-
-- Eliminăm coloanele corespunzătoare valorilor pe care modelul nu le așteaptă (ca de exemplu, `sentence1` și `sentence2`).
-- Redenumește coloana `label` în `labels`, deoarece modelul așteaptă argumentul să fie numit `labels`.
-- Setăm formatul dataseturilor astfel încât ele să returneze tensore PyTorch în loc de liste.
-
-Metodele noastre `tokenized_datasets` au fiecare unul dintre acești pași:
-
-```py
-tokenized_datasets = tokenized_datasets.remove_columns(["sentence1", "sentence2", "idx"])
-tokenized_datasets = tokenized_datasets.rename_column("label", "labels")
-tokenized_datasets.set_format("torch")
-tokenized_datasets["train"].column_names
-```
-
-Vom verifica că rezultatul conține doar coloanele pe care vor modelul le acceptă:
-
-```python
-["attention_mask", "input_ids", "labels", "token_type_ids"]
-```
-
-Acum că am făcut asta, putem defini cu ușurință dataloader-urile noastre:
-
-```py
-from torch.utils.data import DataLoader
-
-train_dataloader = DataLoader(
-    tokenized_datasets["train"], shuffle=True, batch_size=8, collate_fn=data_collator
-)
-eval_dataloader = DataLoader(
-    tokenized_datasets["validation"], batch_size=8, collate_fn=data_collator
-)
-```
-
-Pentru a verifica rapid că nu există nici o greșeală în procesarea datelor, putem inspecta un batch-ul astfel:
-
-```py
-for batch in train_dataloader:
-    break
-{k: v.shape for k, v in batch.items()}
-```
-
-```python out
-{'attention_mask': torch.Size([8, 65]),
- 'input_ids': torch.Size([8, 65]),
- 'labels': torch.Size([8]),
- 'token_type_ids': torch.Size([8, 65])}
-```
-
-Observați că shapeurile actuale vor fi probabil ușor diferite pentru tine, deoarece am setat `shuffle=True` pentru dataloader-ul de antrenare și am făcut padding batch-urilor la lungime maximă în interiorul lor.
-
-Acum că am terminat complet procesarea datelor (un obiectiv satisfăcător, dar înșelător pentru orice specialist ML), să trecem la model. Îl inițializăm exact ca în secțiunea precedentă:
-
-```py
-from transformers import AutoModelForSequenceClassification
-
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
-```
-
-Pentru a ne asigura că totul va merge bine în timpul antrenamentului, vom transmite batch-ul nostru modelului acesta:
-
-```py
-outputs = model(**batch)
-print(outputs.loss, outputs.logits.shape)
-```
-
-```python out
-tensor(0.5441, grad_fn=<NllLossBackward>) torch.Size([8, 2])
-```
-
-Toate modelele 🤗 Transformers vor returna lossul atunci când `labels` sunt furnizate și vom primi de asemenea logiturile (două pentru fiecare input în batch-ul nostru, deci un tensor cu dimensiunea 8 x 2).
-
-Suntem aproape gata să scriem loopul nostru de antrenament! Doar că ne lipsesc două lucruri: un optimizer și learning rate scheduler. Deoarece încercăm să replicăm ceea ce a făcut `Trainer` manual, vom folosi aceleași argumente default. Optimizerul utilizat de `Trainer` este `AdamW`, care este similar cu Adam, dar cu un twist pentru weight decay regularization (vedeți ["Decoupled Weight Decay Regularization"](https://arxiv.org/abs/1711.05101) de Ilya Loshchilov și Frank Hutter):
-
-```py
-from transformers import AdamW
-
-optimizer = AdamW(model.parameters(), lr=5e-5)
-```
-
-La final, learning rate schedulerul utilizat este un linear decay de la valoarea maximă (5e-5) la 0. Pentru a-l defini cu adevărat, avem nevoie să cunoaștem numărul de pași de antrenament pe care îi vom face, care este numărul de epoci pe care dorim să le rulăm înmulțit cu numărul de batch-uri de antrenare (care este lungimea dataloader-ului de antrenare). `Trainer` folosește trei epoci ca default, deci vom continua cu asta:
-
-```py
-from transformers import get_scheduler
-
-num_epochs = 3
-num_training_steps = num_epochs * len(train_dataloader)
-lr_scheduler = get_scheduler(
-    "linear",
-    optimizer=optimizer,
-    num_warmup_steps=0,
-    num_training_steps=num_training_steps,
-)
-print(num_training_steps)
-```
-
-```python out
-1377
-```
-
-### Training Loop[[the-training-loop]]
-
-Un ultim lucru: vom dori să folosim un GPU dacă avem acces la unul (pe un CPU, instruirea poate dura câteva ore în loc de câteva minute). Pentru a face acest lucru, definim un `device` pe care vom plasa modelul și batch-urile noastre:
-
-```py
-import torch
-
-device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")
-model.to(device)
-device
-```
-
-```python out
-device(type='cuda')
-```
-
-Suntem acum gata pentru antrenare! Pentru a avea o idee când va fi finalizată antrenarea, adăugăm un progress bar peste numărul nostru de pași de antrenare, folosind biblioteca `tqdm`:
-
-```py
-from tqdm.auto import tqdm
-
-progress_bar = tqdm(range(num_training_steps))
-
-model.train()
-for epoch in range(num_epochs):
-    for batch in train_dataloader:
-        batch = {k: v.to(device) for k, v in batch.items()}
-        outputs = model(**batch)
-        loss = outputs.loss
-        loss.backward()
-
-        optimizer.step()
-        lr_scheduler.step()
-        optimizer.zero_grad()
-        progress_bar.update(1)
-```
-
-Poți să vezi că nucleul loopului de instruire are o formă similară cu cea din introducere. Nu am cerut nicio raportare, deci acest loop de antrenare nu ne va spune nimic despre cum se descurcă modelul. Trebuie să adăugăm un evaluation loop pentru a face acest lucru.
-
-
-### Evaluation Loop[[the-evaluation-loop]]
-
-La fel ca înainte, vom folosi o metrică oferită de librăria 🤗 Evaluate. Am văzut deja metoda `metric.compute()`, dar metricile pot acumula batch-urile pentru noi pe măsură ce mergem peste loopurile de  predicțoie cu metoda `add_batch()`. Când am acumulat toate batch-urile, putem să obținem rezultatul final cu `metric.compute()`. Acesta este modul în care trebuie să implementăm acest lucru într-un loop de evaluare:
-
-```py
-import evaluate
-
-metric = evaluate.load("glue", "mrpc")
-model.eval()
-for batch in eval_dataloader:
-    batch = {k: v.to(device) for k, v in batch.items()}
-    with torch.no_grad():
-        outputs = model(**batch)
-
-    logits = outputs.logits
-    predictions = torch.argmax(logits, dim=-1)
-    metric.add_batch(predictions=predictions, references=batch["labels"])
-
-metric.compute()
-```
-
-```python out
-{'accuracy': 0.8431372549019608, 'f1': 0.8907849829351535}
-```
-
-Rezultatele tale vor fi ușor diferite datorită randomizării în inițializarea headului modelului și a data shuffling, dar ele nu ar trebui să fie foart diferite.
-
-
-<Tip>
-
-✏️ **Încearcă!** Modifica loopul de antrenare dinainte pentru a face fine-tune modelul pe dataset-ul SST-2.
-
-</Tip>
-
-
-### Supercharge Training Loopul cu 🤗 Accelerate[[supercharge-your-training-loop-with-accelerate]]
-
-<Youtube id="s7dy8QRgjJ0" />
-
-Loopul de antrenare pe care l-am definit anterior funcționează bine pe un singur CPU sau GPU. Dar folosind libraria [🤗 Accelerate](https://github.com/huggingface/accelerate), cu câteva ajustări putem activa distributed training pe multiple GPU-uri sau TPU-uri. Începând de la crearea training și validation dataloaders, aceasta este este loopul manual de antrenare:
-
-```py
-from transformers import AdamW, AutoModelForSequenceClassification, get_scheduler
-
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
-optimizer = AdamW(model.parameters(), lr=3e-5)
-
-device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")
-model.to(device)
-
-num_epochs = 3
-num_training_steps = num_epochs * len(train_dataloader)
-lr_scheduler = get_scheduler(
-    "linear",
-    optimizer=optimizer,
-    num_warmup_steps=0,
-    num_training_steps=num_training_steps,
-)
-
-progress_bar = tqdm(range(num_training_steps))
-
-model.train()
-for epoch in range(num_epochs):
-    for batch in train_dataloader:
-        batch = {k: v.to(device) for k, v in batch.items()}
-        outputs = model(**batch)
-        loss = outputs.loss
-        loss.backward()
-
-        optimizer.step()
-        lr_scheduler.step()
-        optimizer.zero_grad()
-        progress_bar.update(1)
-```
-
-Și aici sunt schimbările:
-
-```diff
-+ from accelerate import Accelerator
-  from transformers import AdamW, AutoModelForSequenceClassification, get_scheduler
-
-+ accelerator = Accelerator()
-
-  model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
-  optimizer = AdamW(model.parameters(), lr=3e-5)
-
-- device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")
-- model.to(device)
-
-+ train_dataloader, eval_dataloader, model, optimizer = accelerator.prepare(
-+     train_dataloader, eval_dataloader, model, optimizer
-+ )
-
-  num_epochs = 3
-  num_training_steps = num_epochs * len(train_dataloader)
-  lr_scheduler = get_scheduler(
-      "linear",
-      optimizer=optimizer,
-      num_warmup_steps=0,
-      num_training_steps=num_training_steps
-  )
-
-  progress_bar = tqdm(range(num_training_steps))
-
-  model.train()
-  for epoch in range(num_epochs):
-      for batch in train_dataloader:
--         batch = {k: v.to(device) for k, v in batch.items()}
-          outputs = model(**batch)
-          loss = outputs.loss
--         loss.backward()
-+         accelerator.backward(loss)
-
-          optimizer.step()
-          lr_scheduler.step()
-          optimizer.zero_grad()
-          progress_bar.update(1)
-```
-
-Prima linie de adăugat este importarea librăriei. A doua linie creează un obiect `Accelerator` care va evalua environmentul și va inițializa proper distributed setup. 🤗 Accelerate gestionează automat poziționarea deviceului pentru tine, așa că poți șterge rândurile care pun modelul pe device (sau dacă preferi, poți să le schimbi cu `accelerator.device` în loc de `device`). 
-
-Partea principală a lucrului se face în linia ce trimite dataloader-urile, modelul și optimizerul la `accelerator.prepare()`. Acaeasta va face wrap acestor obiecte în containerul potrivit pentru a asigura o antrenare distribuită corespunzătoare. Ultimele schimbări sunt ștergerea linei cep une batch-ul pe device(din nou, dacă vvrei să lași acest lucru poți să le schimbi cu `accelerator.device`) și schimbarea `loss.backward()` cu `accelerator.backward(loss)`.
-
-<Tip>
-⚠️ Pentru a beneficia de viteza oferită de Cloud TPUs, recomandăm să faceți padding sampleurilor la o lungime fixă folosind argumentele `padding="max_length"` și `max_length` ale tokenizerului.
-</Tip>
-
-Dacă vrei să copiezi codul pentru a-l testa, aici este loopul complet de antrenare cu Accelerate:
-
-```py
-from accelerate import Accelerator
-from transformers import AdamW, AutoModelForSequenceClassification, get_scheduler
-
-accelerator = Accelerator()
-
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
-optimizer = AdamW(model.parameters(), lr=3e-5)
-
-train_dl, eval_dl, model, optimizer = accelerator.prepare(
-    train_dataloader, eval_dataloader, model, optimizer
-)
-
-num_epochs = 3
-num_training_steps = num_epochs * len(train_dl)
-lr_scheduler = get_scheduler(
-    "linear",
-    optimizer=optimizer,
-    num_warmup_steps=0,
-    num_training_steps=num_training_steps,
-)
-
-progress_bar = tqdm(range(num_training_steps))
-
-model.train()
-for epoch in range(num_epochs):
-    for batch in train_dl:
-        outputs = model(**batch)
-        loss = outputs.loss
-        accelerator.backward(loss)
-
-        optimizer.step()
-        lr_scheduler.step()
-        optimizer.zero_grad()
-        progress_bar.update(1)
-```
-
-Scriind în `train.py` aceste modificări, vor face scriptul executabil pe orice tip de distributed setup. Pentru a testa codul în mediul tău distribuit, rulează următoarea comandă:
-
-```bash
-accelerate config
-```
-
-Ceea ce îți va oferi să răspunzi la o serie de întrebări și să salvezi răspunsurile într-un fișier de configurare folosit de acest modul: 
-
-```bash
-accelerate launch train.py
-```
-
-Această comandă va lansa loopul de antrenare pe dispozitivele distribuite.
-
-Dacă doriți să încercați acest lucru într-un Jupyter Notebook (de exemplu, pentru a testa TPU-urile de pe Colab), înlocuiți codul cu următoarea funcție:
-
-```python
-from accelerate import notebook_launcher
-
-notebook_launcher(training_function)
-```
-
-Pentru mai multe exemple consultați [repo-ul 🤗 Accelerate](https://github.com/huggingface/accelerate/tree/main/examples).
\ No newline at end of file
diff --git a/chapters/ro/chapter3/5.mdx b/chapters/ro/chapter3/5.mdx
deleted file mode 100644
index 63d1f159a..000000000
--- a/chapters/ro/chapter3/5.mdx
+++ /dev/null
@@ -1,26 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Fine-tuning, Check![[fine-tuning-check]]
-
-<CourseFloatingBanner
-    chapter={3}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-
-A fost distractiv! În primele două capitole ai învățat despre modele și tokenizeri, iar acum știi cum să aplici fine-tune pentru datele proprii. Pentru a rezuma, în acest capitol tu:
-
-{#if fw === 'pt'}
-* Ai învățat despre dataseturi din [Hub](https://huggingface.co/datasets)
-* Ai învățat cum să încarci și să preprocesezi dataseturi, inclusiv folosind dynamic padding și collators
-* Ai implementat fine-tuningul și evaluarea unui model
-* Ai implementat un training loop la nivel de bază
-* Ai utilizat 🤗 Accelerate pentru a adapta ușor training loopul astfel încât să funcționeze cu mai multe GPU-uri sau TPU-uri
-
-{:else}
-* Ai învățat despre dataseturi din [Hub](https://huggingface.co/datasets)
-* Ai învățat cum să încarci și să preprocesezi dataseturi
-* Ai învățat cum să faci fine-tune și să evaluezi un model cu Keras
-* Ai implementat o metrică personalizată
-
-{/if}
\ No newline at end of file
diff --git a/chapters/ro/chapter3/6.mdx b/chapters/ro/chapter3/6.mdx
deleted file mode 100644
index 9ceeea782..000000000
--- a/chapters/ro/chapter3/6.mdx
+++ /dev/null
@@ -1,301 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-<!-- DISABLE-FRONTMATTER-SECTIONS
-
-# Quiz pentru finalizarea capitolului[[end-of-chapter-quiz]]
-
-<CourseFloatingBanner
-    chapter={3}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-Testează ce ai învățat în acest capitol!
-
-### 1. Datasetul `emotion` conține mesaje de pe Twitter cu labeluri cu emoții. Căutați-l în [Hub](https://huggingface.co/datasets) și citiți card-ul datasetului. Care dintre acestea nu este una dintre emoțiile sale de bază?
-
-<Question
-	choices={[
-		{
-			text: "Fericire",
-			explain: "Încercă din nou — emoția asta este prezentă în acest dataset!"
-		},
-		{
-			text: "Iubire",
-			explain: "Încercă din nou — emoția asta este prezentă în acest dataset!"
-		},
-		{
-			text: "Confuzie",
-			explain: "Corect! Confuzia nu este una dintre cele șase emoții de bază.",
-            correct: true
-		},
-        {
-			text: "Suprpiză",
-			explain: "Supriză! Încearcă din nou!"
-		}
-	]}
-/>
-
-### 2. Căutați datasetul `ar_sarcasm` în [Hub](https://huggingface.co/datasets). Care este sarcina pe care o sprijină?
-
-<Question
-	choices={[
-		{
-			text: "Clasificarea sentimentului",
-			explain: "Acesta este corect! Poți să știi grație etichetelor.",
-            correct: true
-		},
-		{
-			text: "Machine Translation",
-			explain: "Acesta nu este corect — încercați din nou, în funcție de cardul datasetului <a href='https://huggingface.co/datasets/ar_sarcasm'>ar_sarcasm</a>!"
-		},
-		{
-			text: "Reconstrucția entităților numite",
-			explain: "Acesta nu este corect — încercați din nou, în funcție de cardul datasetului <a href='https://huggingface.co/datasets/ar_sarcasm'>ar_sarcasm</a>!"
-		},
-        {
-			text: "Răspunsul întrebării",
-			explain: "Nesatisfăcător — încercați din nou!"
-		}
-	]}
-/>
-
-### 3. Cum se așteaptă modelul BERT ca o pereche de propoziții să fie procesate?
-
-<Question
-	choices={[
-		{
-			text: "Tokens_of_sentence_1 [SEP] Tokens_of_sentence_2",
-			explain: "Este necesară un token special <code>[SEP]</code> pentru a separa cele două propoziții, dar nu e doar asta!"
-		},
-		{
-			text: "[CLS] Tokens_of_sentence_1 Tokens_of_sentence_2",
-			explain:"Este necesară un token special <code>[CLS]</code> pentru a separa cele două propoziții, dar nu e doar asta!
-		},
-		{
-			text: "[CLS] Tokens_of_sentence_1 [SEP] Tokens_of_sentence_2 [SEP]",
-			explain: "Acesta este corect!",
-            correct: true
-		},
-        {
-			text: "[CLS] Token-urile propoziției_1 [SEP] Token-urile propoziției_2",
-			explain: "Este necesar un token special <code>[CLS]</code> la head, precum și un token special <code>[SEP]</code> pentru a separa cele două propoziții, dar nu e doar asta!"
-		}
-	]}
-/>
-
-{#if fw === 'pt'}
-### 4. Care sunt beneficiile metodei `Dataset.map()`?
-
-<Question
-	choices={[
-		{
-			text: "Rezultatele funcției sunt cached, deci nu va lua timp dacă re-executăm codul.",
-			explain: "Acest lucru este efectiv unul dintre beneficiile sale! Nu e doar asta...",
-            correct: true
-		},
-		{
-			text: "Se aplică multiprocessing pentru a merge mai rapid decât aplicarea funcției la fiecare element al datasetului.",
-			explain: "Acest lucru este efectiv o caracteristică specială a acestei metode, dar nu e doar asta...",
-            correct: true
-		},
-		{
-			text: "Nu încarcă întregul datasetul în memorie și salvează rezultatele la fiecare element procesat.",
-			explain: "Acest lucru este un avantaj al acestei metode. Există și altele...",
-            correct: true
-		},
-	]}
-/>
-
-### 5. Ce înseamnă "dynamic padding"?
-
-<Question
-	alegeri={[  
-		{
-			text: "Dynamic padding este atunci când faci padding inputurilor pentru fiecare batch la lungimea maximă din întregul dataset.",
-			explain: "Acest lucru implică paddingul, dar nu la lungimea maximă a întregului dataset."
-		},
-		{
-			text: "Dynamic padding este atunci când faci padding inputurilor pentru fiecare batch, la lungimea maximă a propozițiilor din acel batch.",
-			explain: "Este corect! Partea \"dynamic\" vine din faptul că dimensiunea fiecărui batch este determinată la momentul creării lui, iar toate batch-urile pot avea shape-uri diferite ca rezultat.",
-            correct: true
-		},
-		{
-			text: "Dynamic padding este atunci când faci padding inputurilor pentru ca fiecare propoziție să aibă același număr de tokenuri ca în precedentul dataset.",
-			explain: "Este greșit, și nu are nici un sens să ne uităm la ordinea din dataset, deoarece îl amestecăm în timpul antrenării."
-		},
-	]}
-/>
-
-### 6. Care este scopul unei funcții collate?
-
-<Question
-	alegeri={[  
-		{
-			text: "Asigură că toate secvențele din dataset au aceeași lungime.",
-			explain: "O funcție collate este implicată în gestionarea a câte unui batch, nu întregului dataset. De asemenea, vorbim despre funcții generice, nu <code>DataCollatorWithPadding</code> specific."
-		},
-		{
-			text: "Adună toate sampleurile dintr-un batch.",
-			explain: "Corect! Poți să dai ca argument o funcție collate în constructorul unui <code>DataLoader</code>. Am folosit funcția <code>DataCollatorWithPadding</code>, care face padding tuturor elementelor dintr-un batch, astfel încât ele să aibă aceeași lungime.",
-            correct: true
-		},
-		{
-			text: "Preprocesează întregul dataset.",
-			explain: "Acest lucru ar fi o funcție de preprocesare, nu una collate."
-		},
-        {
-			text: "Taie secvențele din dataset.",
-			explain: "O funcție collate este implicată în gestionarea a câte un batch, nu întregului dataset. Dacă ești interesat în tăierea acestora, poți utiliza argumentul <code>truncate</code> al unui <code>tokenizer</code>."
-		}
-	]}
-/>
-
-### 7. Ce se întâmplă când inițializezi una dintre clasele `AutoModelForXxx` cu un pretrained language model (ca <code>bert-base-uncased</code>) care corespunde unei alte sarcini decât aceea pentru care a fost antrenat?
-
-<Question
-	alegeri={[  
-		{
-			text: "Nimic, dar se afișează un warning.",
-			explain: "Se afișează un warning, dar asta nu este totul!"
-		},
-		{
-			text: "Headul modelului preantrenat al modelului este înlăturat și înlocuit cu un head nou potrivit pentru sarcină.",
-			explain: "Corect. De exemplu, atunci când am folosit <code>AutoModelForSequenceClassification</code> cu <code>bert-base-uncased</code>, am primit warningul la momentul inițializării modelului. Headul preantrenat nu este folosit pentru sarcina de clasificare a secvențelor, astfel încât el este înlăturat și înlocuit cu un head nou, cu weights aleatorii.",
-            correct: true
-		},
-		{
-			text: "Headul modelului preantrenat este înlăturat.",
-			explain: "Trebuie să se întâmple încă ceva. Încearcă din nou!"
-		},
-        {
-			text: "Nimic, deoarece modelul poate avea fine-tuning pentru o sarcina diferită.",
-			explain: "Headul preantrenat al modelului nu a fost antrenat să rezolve această sarcină, astfel încât el trebuie înlăturat."
-		}
-	]}
-/>
-
-### 8. Care este scopul la `TrainingArguments`?
-
-<Question
-	alegeri={[  
-		{
-			text: "Conține toți hyperparametrii utilizați pentru antrenare și evaluare cu <code>Trainer</code>.",
-			explain: "Corect!",
-            correct: true
-		},
-		{
-			text: "Specifică dimensiunea modelului.",
-			explain: "Dimensiunea modelului este definită de configurația modelului, nu clasa <code>TrainingArguments</code>. "
-		},
-		{
-			text: "Conține doar hyperparametrii utilizați pentru evaluare.",
-			explain: "În exemplul nostru, am specificat unde se va salva modelul și toate checkpoint-urile. Încearcă din nou!"
-		},
-        {
-			text: "Conține doar hyperparametrii utilizați pentru antrenare.",
-			explain: "În exemplul nostru, am folosit un <code>evaluation_strategy</code>, astfel încât acest lucru afectează și evaluarea. Încearcă din nou!"
-		}
-	]}
-/>
-
-### 9. De ce ar trebui să folosim biblioteca 🤗 Accelerate?
-
-<Question
-	alegeri={[  
-		{
-			text: "Ofereă acces la modele mai rapide.",
-			explain: "Nu, biblioteca 🤗 Accelerate nu oferă nici un model."
-		},
-		{
-			text: "Oferă un API de nivel înalt astfel încât să nu trebuiască să implementăm singuri un training loop.",
-			explain: "Acest lucru este ceea ce am făcut cu <code>Trainer</code>, nu biblioteca 🤗 Accelerate. Încearcă din nou!"
-		},
-		{
-			text: "Face ca loopurile de antrenare să funcționeze pe distributed strategies.",
-			explain: "Corect! Cu 🤗 Accelerate, loopurile de antrenare vor funcționa pentru multiple GPU-uri și TPU-uri.",
-            correct: true
-		},
-        {
-			text: "Oferă mai multe funcții de optimizare.",
-			explain: "Nu, biblioteca 🤗 Accelerate nu oferă nici o funcțiune de optimizare."
-		}
-	]}
-/>
-
-{:else}
-### 4. Ce se întâmplă când inițializezi una dintre clasele `TFAutoModelForXxx` cu un pretrained language model (ca <code>bert-base-uncased</code>) care corespunde unei alte sarcini decât aceea pentru care a fost antrenat?
-
-<Question
-	alegeri={[  
-		{
-			text: "Nimic, dar se afișează un warning.",
-			explain: "Se afișează un warning, dar asta nu este totul!"
-		},
-		{
-			text: "Headul preantrenat al modelului este înlăturat și înlocuit cu un head nou potrivit pentru sarcină.",
-			explain: "Corect. De exemplu, atunci când am folosit <code>TFAutoModelForSequenceClassification</code> cu <code>bert-base-uncased</code>, am primit warningul la momentul inițializării modelului. Headul preantrenat nu este folosit pentru sarcina de clasificare a secvențelor, astfel încât el este înlăturat și înlocuit cu un head nou, cu weights aleatorii.",
-            correct: true
-		},
-		{
-			text: "Headul preantrenat al modelului este înlăturat.",
-			explain: "Trebuie să se întâmple ceva mai mult. Încercă din nou!"
-		},
-        {
-			text: "Nimic, deoarece modelul poate fi reantrenat pentru o sarcina diferită.",
-			explain: "Headul prentrenat al modelului nu a fost antrenat să rezolve această sarcină, astfel încât el trebuie înlăturat."
-		}
-	]}
-/>
-
-### 5. Modelele TensorFlow din `transformers` sunt deja modele Keras. Ce beneficiu oferă acest lucru?
-
-<Question
-	alegeri={[  
-		{
-			text: "Modelele funcționează pe un TPU direct.",
-			explain: "Ești aproape, dar sunt necesare mici schimbări. De exemplu, trebuie să rulezi totul într-un <code>TPUStrategy</code> scop, inclusiv inițializarea modelului."
-		},
-		{
-			text: "Poți folosi metode existente precum <code>compile()</code>, <code>fit()</code>, și <code>predict()</code>.",
-			explain: "Corect! Odată ce ai datele, antrenarea pe acestea necesită foarte puțin lucru.",
-            correct: true
-		},
-		{
-			text: "Poți învăța și Keras precum și Transformers.",
-			explain: "Corect, dar căutăm altceva. :)",
-			correct: true
-		},
-        {
-			text: "Poți calcula ușor metrice legate de dataset.",
-			explain: "Keras ne ajută cu antrenarea și evaluarea modelului, dar nu calculează metrice legate de dataset."
-		}
-	]}
-/>
-
-### 6. Cum poți defini o metrică personalizată?
-
-<Question
-	alegeri={[  
-		{
-			text: "Prin subclassing pe <code>tf.keras.metrics.Metric</code>.",
-			explain: "Excelent!",
-			correct: true
-		},
-		{
-			text: "Folosind API-ul Keras.",
-			explain: "Încercă din nou!"
-		},
-		{
-			text: "Prin intermediul callable cu semnatura <code>metric_fn(y_true, y_pred)</code>.",
-			explain: "Corect!",
-			correct: true
-		},
-        {
-			text: "Prin căutarea pe Google.",
-			explain: "Acest lucru nu este răspunsul pe care îl căutăm, dar ar trebui să te ajute să-l găsești.",
-            correct: true
-		}
-	]}
-/>
-
-{/if}
\ No newline at end of file
diff --git a/chapters/ro/chapter4/1.mdx b/chapters/ro/chapter4/1.mdx
deleted file mode 100644
index 4ef56abf4..000000000
--- a/chapters/ro/chapter4/1.mdx
+++ /dev/null
@@ -1,22 +0,0 @@
-# Platforma Hugging Face Hub[[the-hugging-face-hub]]
-
-<CourseFloatingBanner
-    chapter={4}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-Platforma [Hugging Face Hub](https://huggingface.co/) –- site-ul nostru principal –- reprezintă o platformă care permite oricărui utilizator să descopere, utilizeze și contribuie la noi modele și dataseturi. Acesta găzduiește o varietate vastă de modele, cu peste 10.000 disponibile public. Ne vom concentra discuția asupra modelelor în acest capitol, iar pentru dataseturi vom vorbi în Capitolul 5.
-
-Modelele din Hub nu sunt limitate la 🤗 Transformers sau chiar și NLP. Există și alte modele, cum ar fi cele de la [Flair](https://github.com/flairNLP/flair) și [AllenNLP](https://github.com/allenai/allennlp) pentru NLP, [Asteroid](https://github.com/asteroid-team/asteroid) și [pyannote](https://github.com/pyannote/pyannote-audio) pentru speech, precum și cele de la [timm](https://github.com/rwightman/pytorch-image-models) pentru vision, doar să menționăm câteva.
-
-Fiecare dintre aceste modele este găzduit ca un repository Git, ceea ce permite crearea versiunilor și reproducerea acestuia. Oferirea modelului pe Hub înseamnă deschiderea sa comunității, făcându-l accesibil oricărui utilizator care dorește să îl utilizeze cu ușurință, eliminând astfel nevoia de a-și antrena propriul model și simplificând utilizarea acestora. 
-
-În plus, oferirea unui model pe Hub face deploy automat la un Inference API pentru acel model. Orice membru al comunității poate testa direct pe pagina modelului cu inputuri personalizate și widget-uri corespunzătoare.
-
-Cel mai bun lucru este că oferirea și utilizarea oricărui model public pe Hub este complet gratuit! Existează și [planuri plătite](https://huggingface.co/pricing) dacă doriți să oferiți modele în privat.
-
-Video-ul de mai jos arată modul în care puteți naviga prin Hub.
-
-<Youtube id="XvSGPZFEjDY"/>
-
-Crearea unui cont huggingface.co este necesară pentru a continua această parte, deoarece vom crea și gestiona repositorii pe Platforma Hugging Face Hub: [creați un cont](https://huggingface.co/join)
\ No newline at end of file
diff --git a/chapters/ro/chapter4/2.mdx b/chapters/ro/chapter4/2.mdx
deleted file mode 100644
index bbe94669b..000000000
--- a/chapters/ro/chapter4/2.mdx
+++ /dev/null
@@ -1,98 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Utilizarea modelelor preantrenate[[using-pretrained-models]]
-
-{#if fw === 'pt'}
- 
-<CourseFloatingBanner chapter={4}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter4/section2_pt.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter4/section2_pt.ipynb"},
-]} />
-
-{:else}
-
-<CourseFloatingBanner chapter={4}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter4/section2_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter4/section2_tf.ipynb"},
-]} />
-
-{/if}
-
-Hubul Model oferă o modalitate simplă de a selecta modelul adecvat, astfel încât utilizarea sa în orice bibliotecă downstream poate fi efectuată în câteva linii de cod. Să vedem cum se utilizează efectiv unul dintre aceste modele și cum putem contribui înapoi la comunitate.
-
-
-Să presupunem că noi căutăm un French-based model ce poate face mask filling.
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/camembert.gif" alt="Selecting the Camembert model." width="80%"/>
-</div>
-
-Alegem checkpointul „camembert-base” pentru al încerca. Identificatorul `camembert-base` este tot de ce avem nevoie pentru a începe. În capitolele precedente, am văzut cum putem inițializa modelul folosind funcția `pipeline()`:
-
-```py
-from transformers import pipeline
-
-camembert_fill_mask = pipeline("fill-mask", model="camembert-base")
-results = camembert_fill_mask("Le camembert est <mask> :)")
-```
-
-```python out
-[
-  {'sequence': 'Le camembert est délicieux :)', 'score': 0.49091005325317383, 'token': 7200, 'token_str': 'délicieux'}, 
-  {'sequence': 'Le camembert est excellent :)', 'score': 0.1055697426199913, 'token': 2183, 'token_str': 'excellent'}, 
-  {'sequence': 'Le camembert est succulent :)', 'score': 0.03453313186764717, 'token': 26202, 'token_str': 'succulent'}, 
-  {'sequence': 'Le camembert est meilleur :)', 'score': 0.0330314114689827, 'token': 528, 'token_str': 'meilleur'}, 
-  {'sequence': 'Le camembert est parfait :)', 'score': 0.03007650189101696, 'token': 1654, 'token_str': 'parfait'}
-]
-```
-
-În mod evident, încărcarea unui model într-un pipeline este extrem de simplu. Singurul lucru la care trebuie să atrageți atenția este că checkpointul ales este adecvat pentru sarcina pe care urmează să o execute. De exemplu, în momentul în care încărăm checkpoint-ul „camembert-base” în pipelineul `fill-mask`, este perfect în regulă. Dar dacă îl încărcam în pipelineul `text-classification`, rezultatele nu vor avea nici o logică, pentru că headul „camembert-base” nu este adecvat pentru această sarcină! Recomandăm utilizarea task selectorului în interfața Hugging Face în scopul selectării checkpointurilor adecvate:
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/tasks.png" alt="Selectorul de sarcini pe interfața web." width="80%"/>
-</div>
-
-Puteți inițializa checkpointul în mod direct folosind arhitectura modelului:
-
-{#if fw === 'pt'}
-```py
-from transformers import CamembertTokenizer, CamembertForMaskedLM
-
-tokenizer = CamembertTokenizer.from_pretrained("camembert-base")
-model = CamembertForMaskedLM.from_pretrained("camembert-base")
-```
-
-Însă, recomandăm utilizarea [claselor `Auto*`](https://huggingface.co/transformers/model_doc/auto?highlight=auto#auto-classes), deoarece acestea sunt proiectate să fie architecture-agnostic. În timp ce codul precedent limita utilizatorii la checkpoints loadable în CamemBERT architecture, utilizarea claselor `Auto*` face schimbarea checkpointurilor simplă:
-
-```py
-from transformers import AutoTokenizer, AutoModelForMaskedLM
-
-tokenizer = AutoTokenizer.from_pretrained("camembert-base")
-model = AutoModelForMaskedLM.from_pretrained("camembert-base")
-```
-{:else}
-```py
-from transformers import CamembertTokenizer, TFCamembertForMaskedLM
-
-tokenizer = CamembertTokenizer.from_pretrained("camembert-base")
-model = TFCamembertForMaskedLM.from_pretrained("camembert-base")
-```
-
-Însă, recomandăm utilizarea [claselor `TFAuto*`](https://huggingface.co/transformers/model_doc/auto?highlight=auto#auto-classes), deoarece acestea sunt proiectate să fie architecture-agnostic. În timp ce codul precedent limita utilizatorii la checkpoints loadable în CamemBERT architecture, utilizarea claselor `TFAuto*` face schimbarea checkpointurilor simplă:
-
-```py
-from transformers import AutoTokenizer, TFAutoModelForMaskedLM
-
-tokenizer = AutoTokenizer.from_pretrained("camembert-base")
-model = TFAutoModelForMaskedLM.from_pretrained("camembert-base")
-```
-{/if}
-
-<Tip>
-În momentul în care folosiți un model preantrenat, asigurați-vă să verificați cum a fost antrenat și pe ce date se bazează. De asemenea, trebuie să cunoasceți limitele și prejudecățile sale. Toată această informație va fi indicată pe cartea modelului.
-</Tip>
-
diff --git a/chapters/ro/chapter4/3.mdx b/chapters/ro/chapter4/3.mdx
deleted file mode 100644
index dda42f45e..000000000
--- a/chapters/ro/chapter4/3.mdx
+++ /dev/null
@@ -1,641 +0,0 @@
-
-**Capitolul 4**
-
-<FrameworkSwitchCourse {fw} />
-
-# Partajarea modelelor preantrenate [[sharing-pretrained-models]]
-
-{#if fw === 'pt'}
-
-<CourseFloatingBanner chapter={4}
-classNames="absolute z-10 right-0 top-0"
-notebooks={[ 
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter4/section3_pt.ipynb"}, 
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter4/section3_pt.ipynb"},
-]} />
-
-{:else}
-
-<CourseFloatingBanner chapter={4}
-classNames="absolute z-10 right-0 top-0"
-notebooks={[ 
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter4/section3_tf.ipynb"}, 
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter4/section3_tf.ipynb"},
-]} />
-
-{/if}
-
-În următoarele etape, vom explora modalitățile cele mai ușoare de a partaja modelele preantrenate pe 🤗 Hub. Există tooluri și utilities disponibile care fac posibilă partajarea și actualizarea modelelor direct pe Hub, despre care vom vorbi mai jos.
-
-<Youtube id="9yY3RB_GSPM"/>
-
-Recomandăm tuturor utilizatorilor care antrenează modele să contribuie prin partajarea lor cu comunitatea - partajarea modelelor, chiar și atunci când sunt antrenate pe dateseturi foarte specifice, va ajuta la economising timpul altor utilizatori și resurselor și va oferi acces la trained artifcats folositoare. În schimb, puteți beneficia de munca altora!
-
-Există trei moduri de a crea noi repositorii cu modele:
-
-- Utilizând API-ul `push_to_hub`
-- Utilizând biblioteca Python `huggingface_hub`
-- Utilizând interfața web
-
-Odată ce aveți creat un repository, puteți încărca fișiere în el folosind git și git-lfs. Vom trece împreună prin crearea model repositories și încărcarea fișierelor în el în următoarele secțiuni.
-
-## Utilizând API-ul `push_to_hub`[[using-the-pushtohub-api]]
-
-{#if fw === 'pt'}
-
-<Youtube id="Zh0FfmVrKX0"/>
-
-{:else}
-
-<Youtube id="pUh5cGmNV8Y"/>
-
-{/if}
-
-Cea mai simplă modalitate de a încărca fișiere pe Hub este utilizând API-ul `push_to_hub`.
-
-Înainte de a continua, aveți nevoie să creați un token de autentificare astfel încât API-ul `huggingface_hub` să știe cine sunteți și care sunt namespaces la care aveți acces de scriere. Asigurați-vă că sunteți într-un environment unde aveți instalat `transformers` (vedeti [Configurarea](/course/chapter0)). Dacă sunteți într-un notebook, puteți folosi următoarea funcție pentru a vă autentifica:
-
-```python
-from huggingface_hub import notebook_login
-
-notebook_login()
-```
-
-În terminal, puteți rula următoarea comandă:
-
-```bash
-huggingface-cli login
-```
-
-În ambele cazuri, veți fi rugați să introduceți numele utilizatorului și parola, care sunt aceleași cu cele folosite la autentificare pe Hub. Dacă nu aveți încă un profil pe Hub, vă rugăm să creați unul [aici](https://huggingface.co/join).
-
-Excelent! Acum aveți tokenul de autentificare stocat în folder-ul cache. Vom crea acum niște repositorii!
-
-{#if fw === 'pt'}
-
-Dacă ați lucrat cu API-ul `Trainer` pentru a antrena un model, cea mai ușoară modalitate de a o încărca pe Hub este să setați `push_to_hub=True` când definiți `TrainingArguments`:
-
-```py
-from transformers import TrainingArguments
-
-training_args = TrainingArguments(
-    "bert-finetuned-mrpc", save_strategy="epoch", push_to_hub=True
-)
-```
-
-Când chemați `trainer.train()`, `Trainer` va încărca modelul pe Hub de fiecare dată când este salvat (aici, la fiecare epocă) într-un repository namespaceul tău. Acest repository va fi numit după outpul directory-ul ales (aici `bert-finetuned-mrpc`), dar puteți alege un alt nume cu `hub_model_id = "un_nume_diferit"`.
-
-Pentru a încărca modelul într-o organizație din care faceți parte, este suficient să introduceți aceasta în `hub_model_id = "organizația_mea/numele_repositoriului"`.
-
-Odată ce antrenarea s-a terminat, trebuie să faceți `trainer.push_to_hub()` pentru a încărca ultima versiune a modelului. Acesta va genera apoi un model card cu toate informațiile relevante, inclusiv metadatele despre hyperparametrii utilizați și rezultatele evaluării! Aici este exemplul unui astfel de model card:
-
-<div class="flex justify-center">
-  <img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/model_card.png" alt="Un exemplu de un card auto-generat." width="100%"/>
-</div>
-
-{:else}
-
-Dacă utilizați Keras pentru a antrena modelul dumneavoastră, cea mai ușoară modalitate de a încărca-o pe Hub este să transmiteți un `PushToHubCallback` când chemați `model.fit()`:
-
-```py
-from transformers import PushToHubCallback
-
-callback = PushToHubCallback(
-    "bert-finetuned-mrpc", save_strategy="epoch", tokenizer=tokenizer
-)
-```
-
-Apoi, adăugați `callbacks=[callback]` în apelul la `model.fit()`. Callback-ul va încărca apoi modelul pe Hub de fiecare dată când se salvează(aici, la fiecare epocă) într-un repository din namespaceul tău. Acest repository va fi numit după output directory ales (aici `bert-finetuned-mrpc`), dar puteți alege un alt nume cu `hub_model_id = "un_nume_diferit"`.
-
-Pentru a încărca modelul într-o organizație din care faceți parte, este suficient să introduceți aceasta în `hub_model_id = "organizația_mea/numele_repositoriului"`.
-
-{/if}
-
-La un nivel inferior, accesarea Hub-ului se poate face direct pe modele, tokenizers și configurations objects prin metoda `push_to_hub()`. Această metodă se ocupă atât de crearea repositoriului cât si de încărcarea modelului și tokenizerului direct în el. Nu este nevoie de o interacțiune manuală, precum fața de API-ul pe care îl vom vedea mai jos.
-
-Pentru a înțelege cum funcționează, luați în considerare inițializarea unui model și a unui tokenizer:
-
-{#if fw === 'pt'}
-```py
-from transformers import AutoModelForMaskedLM, AutoTokenizer
-
-checkpoint = "camembert-base"
-
-model = AutoModelForMaskedLM.from_pretrained(checkpoint)
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-```
-{:else}
-```py
-from transformers import TFAutoModelForMaskedLM, AutoTokenizer
-
-checkpoint = "camembert-base"
-
-model = TFAutoModelForMaskedLM.from_pretrained(checkpoint)
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-```
-{/if}
-
-Sunteți liberi să faceți orice ați vrea cu acestea - adăugați tokens la tokenizer, antrenați modelul sau faceți fine-tune. Odată ce sunteți mulțumiți de modelul obținut, weighturile și tokenizerul acestuia , puteți folosi metoda `push_to_hub()` disponibilă direct pe obiectul `model`:
-
-```py
-model.push_to_hub("dummy-model")
-```
-Acest lucru va crea un nou repository `dummy-model` în profilul tău și o va popula cu fișierele modelului tău.
-Încercați același lucru cu tokenizerul, astfel încât toate fișierele să fie acum disponibile în acest repository:
-
-```py
-tokenizer.push_to_hub("dummy-model")
-```
-
-Dacă apartineți unei organizații, specificați doar argumentul `organization` pentru a încărca în namespaceul acestei organizații:
-
-```py
-tokenizer.push_to_hub("dummy-model", organization="huggingface")
-```
-
-Dacă doriți să utilizați un anumit token Hugging Face, sunteți liberi să specificați acest lucru metodei `push_to_hub()`:
-
-```py
-tokenizer.push_to_hub("dummy-model", organization="huggingface", use_auth_token="<TOKEN>")
-```
-
-Acum, mergeți la Model Hub pentru a găsi modelul încărcat: *https://huggingface.co/user-or-organization/dummy-model*.
-
-Apăsați pe tabul "Files and versions", iar acum ar trebui să vedeți fișierele vizibile în următorul screenshot:
-
-{#if fw === 'pt'}
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/push_to_hub_dummy_model.png" alt="Dummy model containing both the tokenizer and model files." width="80%"/>
-</div>
-{:else}
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/push_to_hub_dummy_model_tf.png" alt="Dummy model containing both the tokenizer and model files." width="80%"/>
-</div>
-{/if}
-
-<Tip>
-
-✏️ **Încercați!** Luați modelul și tokenizerul asociat cu checkpointul `bert-base-cased` și încărcați-l pe un repo în namespaceul tău folosind metoda `push_to_hub()`. Verificați că repo-ul apare  în pagina dumneavoastră înainte de a-l șterge.
-
-</Tip>
-
-Ați văzut că metoda `push_to_hub()` acceptă mai multe argumente, ceea ce permite încărcarea într-un repository specific sau namespace al unei organizații, sau utilizarea unui token API diferit. Vă recomandăm să vă uitați la specificația metodei disponibilă direct în [documentația 🤗 Transformers](https://huggingface.co/transformers/model_sharing) pentru a înțelge ceea ce este posibil.
-
-Metoda `push_to_hub()` este backed de packageul Python [`huggingface_hub`](https://github.com/huggingface/huggingface_hub), care oferă un API direct la Hub-ul Hugging Face. Acesta este integrat în 🤗 Transformers și în mai multe biblioteci pentru machine learning, ca de exemplu [`allenlp`](https://github.com/allenai/allennlp). Deși ne concentrăm pe integrarea în 🤗 Transformers în acest capitol, integrarea sa în propriul dumneavoastră cod sau bibliotecă este simplu.
-
-Întoarceți-vă la secțiune precedentă pentru a vedea cum să încărcați fișierele în noul repository-ul creat!
-
-## Utilizarea bibliotecii Python `huggingface_hub`
-
-Biblioteca Python `huggingface_hub` este un package care oferă un set de instrumente pentru model și datasets hubs. Oferă metode simple și clase pentru sarcini comune ca:
-Obținerea informațiilor despre repositorii pe hub și gestionarea lor. Ofere API-uri simple care lucrează pe lângă Git pentru a gestiona conținutul acestor repositorii și integrarea Hub-ului
-în proiectele și bibliotecile tale.
-
-Similar cu utilizarea API-ului `push_to_hub`, asta va necesita un token de autentificare salvat în cache. Pentru a face acest lucru, veți avea nevoie să folosiți comanda `login` din CLI, cum am menționat în secțiunea anterioară (din nou, asigurați-vă prefixați această comandă cu simbolul `!` dacă rulați în Google Colab):
-
-```bash
-huggingface-cli login
-```
-
-Packageul `huggingface_hub` oferă mai multe metode și clase utile pentru noi. În primul rând, există câteva metode pentru crearea, ștergerea și gestionarea repositoriilor:
-
-```python no-format
-from huggingface_hub import (
-    # Gestionarea utilizatorilor
-    login,
-    logout,
-    whoami,
-
-    # Crearea și gestionarea repositoriilor
-    create_repo,
-    delete_repo,
-    update_repo_visibility,
-
-    # Și câteva metode pentru a obține/schimba informațiile despre conținut
-    list_models,
-    list_datasets,
-    list_metrics,
-    list_repo_files,
-    upload_file,
-    delete_file,
-)
-```
-
-De asemenea, el oferă clasa `Repository` pentru gestionarea unei repository local. Vom explora aceste metode și clasa în următoarele secțiuni pentru a înțelege cum să le utilizați.
-
-Metoda `create_repo` poate fi utilizată pentru crearea unui nou repository în hub:
-
-```py
-from huggingface_hub import create_repo
-
-create_repo("dummy-model")
-```
-
-Acesta va crea repositarul `dummy-model` în namespaceul tău. Dacă doriți, puteți specifica care organizație să aparțină repositoriului folosind argumentul `organization`:
-
-```py
-from huggingface_hub import create_repo
-
-create_repo("dummy-model", organization="huggingface")
-```
-
-Acesta va crea repositoriul `dummy-model` în spațiul organizației `huggingface`, cu condiția că dumneavoastră să apartineți acestei organizații.
-Alte argumente care pot fi utile sunt:
-
-- `private`, pentru a specifica dacă repositarul trebuie să fie vizibil celorlați sau nu.
-- `token`, dacă doriți să vă înlocuiți token-ul stocat în cache cu un anumit token.
-- `repo_type`, dacă doriți să creați un `dataset` sau `space` în loc de model. Valorile acceptate sunt `"dataset"` și `"space"`.
-
-Acum, trebuie să adăugați fișierele în repository-ul dumneavoastră! Treceți la secțiunea următoare pentru a vedea cele trei moduri de a face acest lucru.
-
-## Utilizarea interfeței web
-
-Interfața web oferă instrumente pentru a gestiona repositorii direct în Hub. Cu ajutorul acestei interfețe, puteți crea ușor repositorii, adăuga fișiere (și chiar și fișiere mari!), explora modele, vizualiza diffuri, și multe altele.
-
-Pentru a crea un nou repositoriu, vizitați [huggingface.co/new](https://huggingface.co/new):
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/new_model.png" alt="Pagină care prezintă modelul utilizat pentru crearea unui nou repository." width="80%"/>
-</div>
-
-În primul rând, specificați deținătorul repositoriului: acesta puteți fi dumneavoastră, fie orice organizație cu care sunteți afiliat. Dacă alegeți o organizație, modelul va fi prezent pe pagina organizației și toți membrii acesteia vor avea posibilitatea să contribuie la repositoriu.
-
-În al doilea rând, introduceți numele modelului dumneavoastră. Acest lucru va fi și denumirea repositoriului. În final, puteți specifica dacă doriți ca modelul dumneavoastră să fie public sau privat. Modelele private nu sunt vizibile ceilorlalți.
-
-După crearea repositoriului, ar trebui să vedeți o pagină ca aceasta:
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/empty_model.png" alt="O pagină goală a modelului după crearea unui nou repository." width="80%"/>
-</div>
-
-Acesta este locul unde va fi găzduit modelul. Pentru a începe să populați acesta, puteți adăuga un fișier README direct din interfața web.
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/dummy_model.png" alt="Fișierul README care arată capacitățile Markdown." width="80%"/>
-</div>
-
-Fișierul README este scris în format Markdown - vă rugăm să fiți creativi cu el! A treia parte a acestui capitol se ocupă de crearea unui model card. Acestea sunt foarte importante pentru a aduce valoare modelului dumneavoastră, deoarece este acolo unde spuneți celorlalți ce poate face.
-
-Dacă vă uitați la secțiunea "Fișiere și versiuni", veți vedea că nu sunt prea multe fișiere acolo încă - doar *README.md* pe care l-ați creat dumneavoastră și *.gitattributes* care urmărește fișierele mari.
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/files.png" alt="Secțiunea 'Fișiere și versiuni' arată doar fișierul .gitattributes și README.md." width="80%"/>
-</div>
-
-Vom vedea mai târziu cum să adăugați câteva fișiere noi.
-
-## Încărcarea fișierelor modelului[[uploading-the-model-files]]
-
-Sistemul pentru a gestiona fișierele în Hugging Face Hub se bazează pe git pentru fișierele obișnuite, și pe git-lfs (care se descrifrează ca [Git Large File Storage](https://git-lfs.github.com/)) pentru fișierele mai mari.
-
-În secțiunea următoare, vom discuta despre trei metode diferite de încărcare a fișierelor în Hub: prin `huggingface_hub` și prin comanda git.
-
-### Metoda `upload_file`[[the-uploadfile-approach]]
-
-Prin `upload_file` nu este necesar să instalați git și git-lfs pe sistemul dumneavoastră. Acest lucru încarcă direct fișierele în 🤗 Hub folosind HTTP POST requests. O limitare a acestei metode este că ea nu se ocupă de fișiere care sunt mai mari de 5GB.
-Dacă fișierele dumneavoastră sunt mai mari decât 5 GB, vă rugăm să urmați celelalte două metode descrise mai jos.
-
-API-ul poate fi folosit astfel:
-
-```python
-from huggingface_hub import upload_file
-
-upload_file(
-    "<path_to_file>/config.json",
-    path_in_repo="config.json",
-    repo_id="<namespace>/dummy-model",
-)
-```
-
-Acest lucru va încărca fișierul `config.json` disponibil la `<path_to_file>` la rootul repositoriului ca `config.json`, în `dummy-model` repository.
-Alte argumente utile pot fi:
-
-- `token`, dacă doriți să înlocuiți tokenul stocat în cache cu un alt token.
-- `repo_type`, dacă doriți să încărcați într-un `dataset` sau într-un `space` în locul modelului. Valorile acceptate sunt `"dataset"` și `"space"`.
-
-### Clasa `Repository`[[the-repository-class]]
-
-Clasa `Repository` gestionează un repository local în-tro manieră asemănătoare gitului. Ea abstracționează majoritatea problemelor pe care le întâlniți cu git pentru a oferi toate caracteristicile necesare.
-
-Utilizarea acestei clase necesită ca dumneavoastră să aveți instalat git și git-lfs, așadar asigurați-vă că aveți instalat git-lfs (vezi [aici](https://git-lfs.github.com/) pentru instrucțiunile de instalare) și setat înainte de a începe.
-
-Pentru a vă juca cu repositoriul pe care l-am creat, puteți porni prin inițializarea lui ca un folder local printr-un clonarea repositoriului remote:
-
-```py
-from huggingface_hub import Repository
-
-repo = Repository("<path_to_dummy_folder>", clone_from="<namespace>/dummy-model")
-```
-
-Acesta a creat folderele `<path_to_dummy_folder>` în folderul de lucru. Acest folder conține doar fișierul `.gitattributes` pentru că acesta este singurul fișier creat atunci când inițializați repositoriul prin `create_repo`.
-
-Acum puteți folosi majoritatea metodelor tradiționale ale gitului:
-
-```python
-repo.git_pull()
-repo.git_add()
-repo.git_commit()
-repo.git_push()
-repo.git_tag()
-```
-
-Și altele! Vă recomandăm să vă uitați la documentația `Repository` disponibilă [aici](https://github.com/huggingface/huggingface_hub/tree/main/src/huggingface_hub#advanced-programmatic-repository-management) pentru o înțelegere generală a tuturor metodelor disponibile.
-
-Pentru moment, avem un model și un tokenizer pe care doriți să îl trimiteți în hub. Am reușit să clonăm repositoriul local, deci putem salva fișierele în acesta.
-
-În primul rând asigurați-vă că copia locală este la zi cu ultimele schimbări:
-
-```python
-repo.git_pull()
-```
-
-Odată ce am facut asta, salvați fișierele modelului și al tokenizerul:
-
-```python
-model.save_pretrained("<path_to_dummy_folder>")
-tokenizer.save_pretrained("<path_to_dummy_folder>")
-```
-
-Folder-ul `<path_to_dummy_folder>` acum conține toate fișierele modelului dumneavoastră și ale tokenizerul. Vom urma fluxul tradițional de git adăugând fișiere în zona de pregătire, făcând commit și push fișierelor în hub:
-
-```python
-repo.git_add()
-repo.git_commit("Adăugarea fișierelor modelului și ale tokenizerului")
-repo.git_push()
-```
-
-Felicitări! Ați reușit să încărcați primele fișiere în hub.
-
-### Folosirea Git[[the-git-based-approach]]
-
-Acesta este abordarea cea mai de bază pentru încărcarea fișierelor: vom face ast cu ajutorul git și git-lfs direct. Cea mai grea parte este abstractizată prin abordări anterioare, dar există câteva excepții cu metoda următoare, așadar ne vom referi la un use-case mai complicat.
-
-Pentru această clasă se cere să aveți instalate git și git-lfs, așadar asigurați-vă că aveți [git-lfs](https://git-lfs.github.com/) instalat (vedeți aici instrucțiunile de instalare) și configurat înainte să începeți.
-
-În primul rând, inițializați git-lfs:
-
-```bash
-git lfs install
-```
-
-```bash
-Updated git hooks.
-Git LFS initialized.
-```
-
-După ce ați făcut acest lucru, primul pas este să faceți o copie a repositoriului dumneavoastră:
-
-```bash
-git clone https://huggingface.co/<namespace>/<your-model-id>
-```
-
-Numele meu de utilizator este `lysandre` și am folosit numele modelului `dummy`, așadar comanda mea se termină cu următorul rezultat:
-
-```
-git clone https://huggingface.co/lysandre/dummy
-```
-
-Acum am un folder denumit *dummy* în folderul meu de lucru. Pot intra în folder cu ajutorul `cd` și pot examina conținutul:
-
-```bash
-cd dummy && ls
-```
-
-```bash
-README.md
-```
-
-Dacă ați creat repositoriul dumneavoastră folosind metodă din partea Hugging Face Hub, `create_repo` , acest folder ar trebui să conțină doar un fișier cu numele *.gitattributes*. Dacă ați urmat instrucțiunile din secțiunea anterioară pentru crearea repositoriului folosind interfața web, atunci folderul ar trebui să conțină un singur fișier *README.md* și, de asemenea, un fișier cu numele *.gitattributes*, pe care nu-l puteți vedea.
-
-Adăugarea unui fișier de mărime obișnuită, precum un fișier de configurare, un vocabulary file sau orice alt tip de fișier care au mai puțin de câțiva megabytes se realizează exact așa cum ați face în orice sistem git. Cu toate acestea, pentru a încărca fișiere mai mari, este necesară utilizarea a git-lfs pentru a le trimite spre *huggingface.co*.
-
-Să ne întoarcem la Python pentru a genera un model și tokenizer pe care am dori să le facem commit în repositoriul nostru dummy:
-
-{#if fw === 'pt'}
-```py
-from transformers import AutoModelForMaskedLM, AutoTokenizer
-
-checkpoint = "camembert-base"
-
-model = AutoModelForMaskedLM.from_pretrained(checkpoint)
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-
-# Faceți orice cu modelul, antrenați-l, aplicați fine-tuning... 
-
-model.save_pretrained("<path_to_dummy_folder>")
-tokenizer.save_pretrained("<path_to_dummy_folder>")
-```
-{:else}
-```py
-from transformers import TFAutoModelForMaskedLM, AutoTokenizer
-
-checkpoint = "camembert-base"
-
-model = TFAutoModelForMaskedLM.from_pretrained(checkpoint)
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-
-# Faceți orice cu modelul, antrenați-l, aplicați fine-tuning... 
-
-model.save_pretrained("<path_to_dummy_folder>")
-tokenizer.save_pretrained("<path_to_dummy_folder>")
-```
-{/if}
-
-Acum am salvat câteva artefacte de model și tokenizer, așadar să examinăm din nou folderul *dummy*:
-
-```bash
-ls
-```
-
-{#if fw === 'pt'}
-```bash
-config.json  pytorch_model.bin  README.md  sentencepiece.bpe.model  special_tokens_map.json tokenizer_config.json  tokenizer.json
-```
-Dacă priviți la dimensiunile fișierelor (de exemplu, folosind `ls -lh`), ar trebui să vedeți că singurul outlier este model state dict file (*pytorch_model.bin*), care are mai mult de 400 MB.
-
-{:else}
-```bash
-config.json  README.md  sentencepiece.bpe.model  special_tokens_map.json  tf_model.h5  tokenizer_config.json  tokenizer.json
-```
-Dacă priviți la dimensiunile fișierelor (de exemplu, folosind`ls -lh`), ar trebui să vedeți că singurul outlier este model state dict file (*t5_model.h5*), care are mai mult de 400 MB.
-
-{/if}
-
-<Tip>
-✏️ Dacă creați repositoriul folosind interfața web, fișierul *.gitattributes* va fi automat configurat pentru a considera anumite extensii de fișiere, precum *.bin* și *.h5*, ca fiind fișiere mari. În acest caz nu este necesară nici o setare suplimentară din partea ta, pentru că git-lfs le va urmări automat.
-</Tip>
-
-Acum putem continua procesul în felul nostru obișnuit cu repositoriurile Git tradiționale. Putem adăuga toate fișierele în mediul de stocare a Git folosind comanda `git add`:
-
-```bash
-git add .
-```
-
-Puteți verifica fișierele curente care sunt în stare de stocare utilizând următoarea comandă:
-
-```bash
-git status
-```
-
-
-{#if fw === 'pt'}
-```bash
-On branch main
-Your branch is up to date with 'origin/main'.
-
-Changes to be committed:
-  (use "git restore --staged <file>..." to unstage)
-  modified:   .gitattributes
-	new file:   config.json
-	new file:   pytorch_model.bin
-	new file:   sentencepiece.bpe.model
-	new file:   special_tokens_map.json
-	new file:   tokenizer.json
-	new file:   tokenizer_config.json
-```
-{:else}
-```bash
-On branch main
-Your branch is up to date with 'origin/main'.
-
-Changes to be committed:
-  (use "git restore --staged <file>..." to unstage)
-  modified:   .gitattributes
-  	new file:   config.json
-	new file:   sentencepiece.bpe.model
-	new file:   special_tokens_map.json
-	new file:   tf_model.h5
-	new file:   tokenizer.json
-	new file:   tokenizer_config.json
-```
-{/if}
-
-De asemenea, putem verifica dacă git-lfs monitorizează fisierele corecte folosind comanda sa `status`:
-
-```bash
-git lfs status
-```
-
-
-{#if fw === 'pt'}
-```bash
-On branch main
-Objects to be pushed to origin/main:
-
-
-Objects to be committed:
-
-	config.json (Git: bc20ff2)
-	pytorch_model.bin (LFS: 35686c2)
-	sentencepiece.bpe.model (LFS: 988bc5a)
-	special_tokens_map.json (Git: cb23931)
-	tokenizer.json (Git: 851ff3e)
-	tokenizer_config.json (Git: f0f7783)
-
-Objects not staged for commit:
-
-
-```
-
-Vom observa că toate fișierele au `Git` ca handler, cu excepția *pytorch_model.bin* și *sentencepiece.bpe.model*, care au `LFS`. Excelent!
-
-{:else}
-```bash
-On branch main
-Objects to be pushed to origin/main:
-
-
-Objects to be committed:
-
-	config.json (Git: bc20ff2)
-	sentencepiece.bpe.model (LFS: 988bc5a)
-	special_tokens_map.json (Git: cb23931)
-	tf_model.h5 (LFS: 86fce29)
-	tokenizer.json (Git: 851ff3e)
-	tokenizer_config.json (Git: f0f7783)
-
-Objects not staged for commit:
-
-
-```
-
-Observăm că toate fișierele au `Git` ca handler, cu excepția *t5_model.h5*, care are `LFS`. Excelent!
-
-{/if}
-
-Acum vom continua cu ultimii pași: commiting și pushing la repo-urile *huggingface.co*:
-
-```
-git commit -m "Prima versiune a modelului"
-```
-
-
-{#if fw === 'pt'}
-```bash
-[main b08aab1] First model version
- 7 files changed, 29027 insertions(+)
-  6 files changed, 36 insertions(+)
- create mode 100644 config.json
- create mode 100644 pytorch_model.bin
- create mode 100644 sentencepiece.bpe.model
- create mode 100644 special_tokens_map.json
- create mode 100644 tokenizer.json
- create mode 100644 tokenizer_config.json
-```
-{:else}
-```bash
-[main b08aab1] First model version
- 6 files changed, 36 insertions(+)
- create mode 100644 config.json
- create mode 100644 sentencepiece.bpe.model
- create mode 100644 special_tokens_map.json
- create mode 100644 tf_model.h5
- create mode 100644 tokenizer.json
- create mode 100644 tokenizer_config.json
-```
-{/if}
-
-Pushingul poate lua câteva minute, în funcție de viteza conexiunii tale la internet și mărimea fișierelor:
-
-```bash
-git push
-```
-
-```bash
-Uploading LFS objects: 100% (1/1), 433 MB | 1.3 MB/s, done.
-Enumerating objects: 11, done.
-Counting objects: 100% (11/11), done.
-Delta compression using up to 12 threads
-Compressing objects: 100% (9/9), done.
-Writing objects: 100% (9/9), 288.27 KiB | 6.27 MiB/s, done.
-Total 9 (delta 1), reused 0 (delta 0), pack-reused 0
-To https://huggingface.co/lysandre/dummy
-   891b41d..b08aab1  main -> main
-```
-
-{#if fw === 'pt'}
-Dacă ne uităm la repositoriul modelului când acest lucru este finalizat, putem vedea toate fișierele recent adăugate:
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/full_model.png" alt="Tabul 'Files and versions' conține acum toate fișierele recente adăugate." width="80%"/>
-</div>
-
-Interfața permite explorarea fișierelor modelului și a commiturilor și vizualizarea diferenței introduse de fiecare commit:
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/diffs.gif" alt="Diferența introdusă de ultimul commit." width="80%"/>
-</div>
-{:else}
-Dacă ne uităm la repositoriul modelului când acest lucru este finalizat, putem vedea toate fișierele recent adăugate:
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/full_model_tf.png" alt="Tabul 'Files and versions' conține acum toate fișierele recente adăugate." width="80%"/>
-</div>
-
-Interfața permite explorarea fișierelor modelului și a commiturilor și vizualizarea diferenței introduse de fiecare commit:
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/diffstf.gif" alt="Diferența introdusă de ultimul commit." width="80%"/>
-</div>
-{/if}
-```
\ No newline at end of file
diff --git a/chapters/ro/chapter4/4.mdx b/chapters/ro/chapter4/4.mdx
deleted file mode 100644
index 7cac09819..000000000
--- a/chapters/ro/chapter4/4.mdx
+++ /dev/null
@@ -1,88 +0,0 @@
-# Crearea unui model card[[building-a-model-card]]
-
-
-<CourseFloatingBanner
-    chapter={4}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-Model card este un fișier care este, probabil, la fel de important ca și fișierele de model si tokenizer dintr-o repositoriul modelului. Este definiția centrală a modelului, asigurând reutilizarea de către membrii comunității și reproducerea rezultatelor, oferind o platformă pe care alți membri pot construi artefecatele lor.
-
-Documentarea procesului de antrenare și evaluare ajută celorlați să înțeleagă la ce să aștepte de la un model - iar oferirea informațiilor suficiente referitoare la datele folosite si preprocesarea acestora (înainte și după antrenare) vor ajuta la identificarea și înțelegerea limitelor, biaseruile și contextului în care modelul este și nu este folositor.
-
-Prin urmare, crearea unui model card care definește modelul dvs. este un pas foarte important. Aici, oferim câteva sfaturi care v-ar putea ajuta în acest sens. Crearea model cardului se face prin intermediul fișierului `README.md`, pe care l-ați văzut anterior, care este un fișier Markdown.
-
-Conceptul de "model card" provine dintr-o direcție de cercetare a Google, publicată inițial în articolul ["Model Cards for Model Reporting"](https://arxiv.org/abs/1810.03993) scrisă de Margaret Mitchell et al. O parte semnificativă dintre informațiile conținute aici sunt bazate pe acest articol, iar noi vă recomandăm să verificați dacă doriți să înțelegeți de ce model cardurile sunt atât importante într-o lume care valorifică reproducerea, reutilizarea și echitatea.
-
-Model cardul începe cu o prezentare scurtă și generală a ceea ce este modelul - urmată de detalii suplimentare în secțiunile următoare:
-
-- Descrierea modelului
-- Utilizări intenționate și limitările modelului
-- Cum se utilizează
-- Limitări și bias
-- Datele de antrenare
-- Procedura de antrenare
-- Rezultatele evaluării
-
-Hai să vedem ce ar trebui să conțină fiecare dintre aceste secțiuni.
-
-### Descrierea modelului[[model-description]]
-
-Secțiunea de descriere a modelului conține detalii generale despre model. Aceasta include arhitectura, versiunea, dacă a fost introdus într-un articol științific, dacă este disponibilă o implementare originală, autorul și informații generale despre model. Orice drepturi de autor ar trebui să fie atribuite în această secțiune. Informația generală despre procedurile de antrenare, parametrii și avertismente pot fi menționate aici.
-
-### Utilizări intenționate și limitările modelului[[intended-uses-limitations]]
-
-Aici descrieți utilizările pentru care modelul este destinat - inclusiv limba și domeniile unde se poate aplica. Această secțiune din model card poate documenta și zone cunoscute ca nefiind în scopul modelului sau unde este probabil să funcționeze suboptimal.
-
-### Cum se utilizează[[how-to-use]]
-
-Acesta secțiune ar trebui să includă exemple despre cum să utilizați modelul. Acest lucru poate prezenta utilizarea funcției `pipeline()`, utilizarea claselor de model si tokenizer, și orice cod care credeți că ar putea fi util.
-
-### Datele de antrenare[[training-data]]
-
-Această secțiune trebuie să indice datasetul(urile) folosit pentru instruirea modelului. O descriere scurtă a datasetului(urilor) este binevenită.
-
-### Procedura de antrenare[[training-procedure]]
-
-Aici descrieți toate aspectele relevante ale antrenarii care sunt utile din punct de vedere al reproducerii. Acest lucru include orice preprocessing sau postprocessing efectuat pe date, precum și detalii ca numărul de epoci pe care a fost antrenat modelul, dimensiunea batch-ului, learning rateul si alte astfel de detalii.
-
-### Variabilele si metrice[[variable-and-metrics]]
-
-Aici descrieți metricile utilizate la evaluarea rezultatelor, precum și diferite aspecte pe care le măsurați. Menționați metricile folosite, pe ce dataset și care dataset split, astfel încât să fie ușor de comparat performanțele modelului cu cele ale altor modele.
-
-### Rezultatele evaluării[[evaluation-results]]
-
-În sfârșit, indicați cum s-a comportat modelul pe datasetul de evaluare. Dacă modelul foloseste un decision threshold, atunci includeți acest decision threshold în secțiunea respectivă - sau explicați că rezultatele sunt prezentate la diferite thresholduri pentru utilizările preconizate.
-
-## Exemplu[[example]]
-
-Aici puteți găsi câteva exemple ale unor Model Card:
-
-- [`bert-base-cased`](https://huggingface.co/bert-base-cased)
-- [`gpt2`](https://huggingface.co/gpt2)
-- [`distilbert`](https://huggingface.co/distilbert-base-uncased)
-
-Câteva exemple din alte organizații și companii pot fi găsite [aici](https://github.com/huggingface/model_card/blob/master/examples.md).
-
-## Notă[[note]]
-
-Model cardurile nu sunt o cerință obligatorie când se publică modelele si nu este necesar să includeți toate secțiunile descrise mai sus în Model Card. Cu toate acestea, documentarea explicită a modelului poate beneficia utilizatorilor viitori, deci vă recomandăm să completați cât mai multe dintre secțiuni.
-
-## Metadatele cardului de model[[model-card-metadata]]
-
-Dacă ați explorat puțin Hugging Face Hub atunci ar trebui să fi văzut că anumite modele aparțin anumitor categorii: puteți filtra acestea după diverse domenii. Categoriile modelului sunt identificate prin metadata adăugată în secțiunea de header a cardului.
-
-Spre exemplu, dacă vă uitați la modelul [`camembert-base`](https://huggingface.co/camembert-base/blob/main/README.md) atunci veți observa următoarea linii din headerul cardului:
-
-````
----
-language: fr
-license: mit
-datasets:
-- oscar
----
-```
-
-Metadatele acestei secțiuni sunt analizate de Hugging Face Hub, care apoi identifică acest model ca fiind un model francez, cu licență MIT și antrenat pe datasetul Oscar.
-
-[Toate specificările cardului](https://github.com/huggingface/hub-docs/blame/main/modelcard.md) permite specificarea a mai multor metadate, inclusiv limba, licența, etichetele, dataseturile folosite la antrenare și metricile evaluate.
\ No newline at end of file
diff --git a/chapters/ro/chapter4/5.mdx b/chapters/ro/chapter4/5.mdx
deleted file mode 100644
index 509673def..000000000
--- a/chapters/ro/chapter4/5.mdx
+++ /dev/null
@@ -1,12 +0,0 @@
-# Partea 1 este completată!
-
-<CourseFloatingBanner
-    chapter={4}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-Acesta este sfârșitul primei părți a cursului! Partea 2 va fi lansată pe data de 15 noiembrie, cu un mare eveniment comunitar, mai multe informații găsiți [aici](https://huggingface.co/blog/course-launch-event).
-
-Acum, sunteți capabili să faceți fine-tune unui model preantrenat pe o problemă de clasificare a textului (o singură sau perechi de propoziții) și să încarci rezultatele la Model Hub. Să fii sigur că ai învățat această primă secțiune, ar trebui să faci exact acest lucru pe o problemă care ți se pare interesantă (și nu neapărat în limba engleză dacă vorbiți altă limbă)! Puteți găsi ajutor în [forumurile Hugging Face](https://discuss.huggingface.co/) și să împărtășiți proiectul dvs. pe [acest subiect](https://discuss.huggingface.co/t/share-your-projects/6803) odată ce ați terminat.
-
-Ne așteptăm cu nerăbdare să vedem ceea ce veți construi cu aceste cunoștințe :)!
\ No newline at end of file
diff --git a/chapters/ro/chapter4/6.mdx b/chapters/ro/chapter4/6.mdx
deleted file mode 100644
index 746428f14..000000000
--- a/chapters/ro/chapter4/6.mdx
+++ /dev/null
@@ -1,233 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-<!-- DISABLE-FRONTMATTER-SECTIONS -->
-
-# Quiz pentru finalizarea capitolului[[end-of-chapter-quiz]]
-
-<CourseFloatingBanner
-    chapter={4}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-Să testăm ceea ce ai învățat în acest capitol!
-  
-### 1. La ce sunt limitate modelele din Hub?
-
-<Question
-	choices={[ 
-		{
-			text: "Modelele din biblioteca 🤗 Transformers.",
-			explicație: "Ținând cont că modelele din biblioteca 🤗 Transformers sunt disponibile pe Hugging Face Hub, ele nu sunt singurele!"
-		},
-		{
-			text: "Toate modelele cu o interfață similară cu 🤗 Transformers.",
-			explicație: "Nu există nicio cerință de interfață când se încarcă modelele pe Hugging Face Hub."
-		},
-		{
-			text: "Nu există limite.",
-			explicație: "Adevărat! Nu există nici o limită când se încarcă modele pe Hub.",
-            corect: true
-		},
-        {
-			text: "Modele care, într-o anumită măsură, sunt legate de NLP.",
-			explicație: "Nu există nicio cerință privind domeniul aplicației!"
-		}
-	] }
-/>
-
-### 2. Cum poți gestiona modelele pe Hub?
-
-<Question
-	choices={[ 
-		{
-			text: "Printr-un cont GCP.",
-			explicație: "Greșit! "
-		},
-		{
-			text: "Prin distribuția peer-to-peer.",
-			explicație: "Greșit!"
-		},
-		{
-			text: "Prin git și git-lfs.",
-			explicație: "Corect! Modelele din Hub sunt simple repositorii Git, care utilizează <code>git-lfs</code> pentru fișiere mari.",
-            corect: true
-		}
-	] }
-/>
-
-### 3. Ce poți face utilizând interfața web a Hugging Face Hub?
-
-<Question
-	choices={[ 
-		{
-			text: "Forkingul unui repositoriu existent.",
-			explicație: "Nu se poate face forking la un repositoriu pe Hugging Face Hub."
-		},
-		{
-			text: "Crearea unui nou model repository.",
-			explicație: "Corect! Dar nu este singurul lucru pe care îl poți face...",
-            corect: true
-		},
-		{
-			text: "Gestionarea și editarea fișierelor.",
-			explicație: "Corect! Dar nuu este singurul lucru pe care îl poți face..."
-            correct: true
-		},
-        {
-			text: "Încărcarea de fișiere.",
-			explicație: "Corect! Dar nu este singurul lucru..."
-            correct: true
-		},
-        {
-			text: "Vizualizarea diferențelor între versiuni.",
-			explicație: "Corect! Dar nu este singurul lucru pe care îl poți face...",
-            corect: true
-		}
-	] }
-/>
-
-### 4. Ce este un model card?
-
-<Question
-	choices={[ 
-		{
-			text: "O descriere a modelului, deci mai puțin importantă decât fișierele model și tokenizer.",
-			explicație: "Este într-adevăr o descriere a modelului, dar este un element important. Dacă descrierea nu este completă sau absentă, utilitatea modelului se reduce drastic."
-		},
-		{
-			text: "Un mod de asigurare a reproducerii, reutilizării și egalității.",
-			explicație: "Corect! Oferirea informațiilor adecvate în model card va ajuta utilizatorii să utilizeze modelul și să fie conștienți de limitele și biasurile acestuia. ",
-            corect: true
-		},
-		{
-			text: "Un fișier Python care poate fi rulat pentru a obține informații despre model.",
-			explicație: "Model cardurile sunt simple fișiere Markdown."
-		}
-	] }
-/>
-
-Chapitru 4
-
-### 5. Câte dintre obiectele bibliotecii 🤗 Transformers pot fi împărtășite direct pe Hub cu `push_to_hub()`?
-
-{#if fw === 'pt'}
-<Question
-	choices={[
-		{
-			text: "Un tokenizer",
-			explain: "Corect! Toți tokenizerii au metoda <code>push_to_hub</code>, și utilizând-o, vor împărtăși toate fișierele tokenizerului (vocabular, arhitectură tokenizerului, etc.) către un repo. Însă acesta nu este singura soluție corectă!",
-            correct: true
-		},
-		{
-			text: "O configurare a modelului",
-			explain: "Corect! Toate configurațiile modelelor au metoda <code>push_to_hub</code>, și utilizând-o, vor împărtăși configurația către un repo. Și ce altceva poți oferi?",
-            correct: true
-		},
-		{
-			text: "Un model",
-			explain: "Corect! Toate modelele au metoda <code>push_to_hub</code>, și utilizând-o, vor împărtăși ei, precum și fișierele de configurare către un repo. Și nu numai asta!",
-            correct: true
-		},
-        {
-			text: "Un Trainer",
-			explain: "Corect — <code>Trainer</code> implementează metoda <code>push_to_hub</code>, și utilizând-o, vor încărca modelul, configurarea sa, tokenizerul, precum și un draft a unui model card către un repo. Încearcă și altă opțiune!",
-            correct: true
-		}
-	]}
-/>
-
-{:else}
-<Question
-	choices={[
-		{
-			text: "Un tokenizer",
-			explain: "Corect! Toți tokenizerii au metoda <code>push_to_hub</code>, și utilizând-o, vor împărtăși toate fișierele tokenizerului (vocabular, arhitectură tokenizerului, etc.) către un repo. Însă acesta nu este singura soluție corectă!",
-            correct: true
-		},
-		{
-			text: "O configurare a modelului",
-			explain: "Corect! Toate configurațiile modelelor au metoda <code>push_to_hub</code>, și utilizând-o, vor împărtăși configurația către un repo. Și ce altceva poți oferi?",
-            correct: true
-		},
-		{
-			text: "Un model",
-			explain: "Corect! Toate modelele au metoda <code>push_to_hub</code>, și utilizând-o, vor împărtăși ei, precum și fișierele de configurare către un repo. Și nu numai asta!",
-            correct: true
-		},
-        {
-			text: "Toate cele trei cu un callback dedicat",
-			explain: "Corect — <code>PushToHubCallback</code> va trimite regular toate aceste obiecte către un repo în timpul antrenării.",
-            correct: true
-		}
-	]}
-/>
-{/if}
-
-### 6. Care este primul pas atunci când utilizați metoda `push_to_hub()` sau instrumentele CLI?
-
-<Question
-	choices={[
-		{
-			text: "Logarea pe website",
-			explain: "Acest lucru nu vă va ajuta local."
-		},
-		{
-			text: "Rulați 'huggingface-cli login' în terminal.",
-			explain: "Corect — acest lucru va descărca și va stoca tokenul personal.",
-            correct: true
-		},
-		{
-			text: "Rulați 'notebook_login()' într-un notebook",
-			explain: "Corect — acest lucru va afișa un widget pentru a vă autentifica.",
-            correct: true
-		},
-	]
-    }
-/>
-
-
-### 7. Aveți un model și un tokenizer, cum le puteți încărca pe ambele în Hub?
-
-<Question
-	choices={[
-		{
-			text: "Prin apelarea directă a metodei `push_to_hub` pe model și tokenizer",
-			explain: "Corect!",
-            correct: true
-		},
-		{
-			text: "În cadrul runtime-ului Python, prin wrappingul acestora într-un <code>huggingface_hub</code>",
-			explain: "Modelele și tokenizerii deja beneficiază de utilitățile <code>huggingface_hub</code>: nu vă trebuie nici un wrapping suplimentar!"
-		},
-		{
-			text: "Prin salvarea lor pe disc și apelarea <code>transformers-cli upload-model</code>",
-			explain: "Comanda <code>upload-model</code> nu există."
-		}
-	]}
-/>
-
-### 8. Carele operații git poți face cu clasa `Repository`?
-
-<Question
-	choices={[
-		{
-			text: "Un commit",
-			explain: "Corect, metoda <code>git_commit()</code> este acolo pentru a face commit.",
-            correct: true
-		},
-		{
-			text: "Un pull",
-			explain: "Acesta este scopul metodei <code>git_pull()</code>",
-            correct: true
-		},
-		{
-			text: "Un push",
-			explain: "Metoda <code>git_push()</code> face acest lucru.",
-            correct: true
-		},
-		{
-			text: "Un merge",
-			explain: "Nu, această operație nu va fi niciodată posibilă cu acest API."
-		}
-	]}
-/>
\ No newline at end of file
diff --git a/chapters/ro/chapter5/1.mdx b/chapters/ro/chapter5/1.mdx
deleted file mode 100644
index 7fd54a2ad..000000000
--- a/chapters/ro/chapter5/1.mdx
+++ /dev/null
@@ -1,22 +0,0 @@
-# Introducere[[introduction]]
-
-<CourseFloatingBanner
-    chapter={5}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-În [Capitolul 3](/course/chapter3) ați încercat a biblioteca 🤗Datasets și ați văzut că existau trei pași principali atunci când vine vorba de fine-tuningul unui model:
-
-1. Încărcați un dataset din Hugging Face Hub.
-2. Preprocesați datele cu `Dataset.map()`.
-3. Încărcați și calculați metricele.
-
-Dar acesta este doar o mică parte a ceea ce poate face 🤗 Datasets! În acest capitol, vom trece mai in deep în această bibliotecă. Pe parcurs, vom găsi răspunsuri la următoarele întrebări:
-
-* Ce faceți atunci când datasetul tău nu este pe Hub?
-* Cum puteți tăia și împărți un dataset? (Și ce dacă tu _really_ trebuie să folosești Pandas?)
-* Ce faceți atunci când datasetul este uriaș și va topi RAM-ul laptopului dumneavoastră?
-* Ce este "memory mapping" și Apache Arrow?
-* Cum puteți crea propriul dataset și să-l trimiteți pe Hub?
-
-Tehnicile pe care le veți învăța aici vă vor pregăti pentru sarcinile avansate de tokenizare și fine-tuning din [Capitolul 6](/course/chapter6) și [Capitolul 7](/course/chapter7) -- deci luați o cafea sau două și să începem!
diff --git a/chapters/ro/chapter5/2.mdx b/chapters/ro/chapter5/2.mdx
deleted file mode 100644
index 1f78a1a05..000000000
--- a/chapters/ro/chapter5/2.mdx
+++ /dev/null
@@ -1,173 +0,0 @@
-# Ce-ar fi dacă dataset-ul meu nu este pe Hub?[[what-if-my-dataset-isnt-on-the-hub]]
-
-<CourseFloatingBanner chapter={5}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[  
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/ro/chapter5/section2.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/ro/chapter5/section2.ipynb"},  
-]} />
-
-Ai învățat să folosești [Hugging Face Hub](https://huggingface.co/datasets) pentru a descărca dataseturi, dar vei găsi adesea că lucrați cu date care sunt stocate fie pe laptopul dumneavoastră, fie pe un server. În această secțiune vă vom arăta cum poate fi utilizat 🤗 Datasets pentru a încărca dataseturi care nu sunt disponibile pe Hugging Face Hub.
-<Youtube id="HyQgpJTkRdE"/>
-
-## Lucrând cu dataseturi locale și remote[[working-with-local-and-remote-datasets]]
-
-🤗 Datasets oferă loading scripts pentru a gestiona încărcarea dataseturilor locale și remote. Suportă mai multe data formats , cum ar fi:
-
-|    Data format     | Loading script |                         Example                         |
-| :----------------: | :------------: | :-----------------------------------------------------: |
-|     CSV & TSV      |     `csv`      |     `load_dataset("csv", data_files="my_file.csv")`     |
-|     Text files     |     `text`     |    `load_dataset("text", data_files="my_file.txt")`     |
-| JSON & JSON Lines  |     `json`     |   `load_dataset("json", data_files="my_file.jsonl")`    |
-| Pickled DataFrames |    `pandas`    | `load_dataset("pandas", data_files="my_dataframe.pkl")` |
-
-As shown in the table, for each data format we just need to specify the type of loading script in the `load_dataset()` function, along with a `data_files` argument that specifies the path to one or more files. Let's start by loading a dataset from local files; later we'll see how to do the same with remote files.
-
-## Loading a local dataset[[loading-a-local-dataset]]
-
-For this example we'll use the [SQuAD-it dataset](https://github.com/crux82/squad-it/), which is a large-scale dataset for question answering in Italian.
-
-The training and test splits are hosted on GitHub, so we can download them with a simple `wget` command:
-
-În tabelele de mai sus, pentru fiecare format de date trebuie doar să specificăm tipul scriptului de încărcare din funcția `load_dataset()`, alături de un argument `data_files` care specifică calea către un sau mai multe fișiere. Începem cu încărcarea datasetului din fișierele locale; apoi vom vedea cum să faceți același lucru cu fișierele remote.
-
-## Încărcarea unui dataset local[[loading-a-local-dataset]]
-
-În acest exemplu, vom folosi [datasetul SQuAD-it](https://github.com/crux82/squad-it/), care este un large-scale dataset pentru întrebări și răspunsuri în italiană.
-
-Spliturile de training și test sunt disponibile pe GitHub, deci putem descarca cu o comanda `wget`:
-```python
-!wget https://github.com/crux82/squad-it/raw/master/SQuAD_it-train.json.gz
-!wget https://github.com/crux82/squad-it/raw/master/SQuAD_it-test.json.gz
-```
-
-This will download two compressed files called *SQuAD_it-train.json.gz* and *SQuAD_it-test.json.gz*, which we can decompress with the Linux `gzip` command:
-
-```python
-!gzip -dkv SQuAD_it-*.json.gz
-```
-
-```bash
-SQuAD_it-test.json.gz:	   87.4% -- replaced with SQuAD_it-test.json
-SQuAD_it-train.json.gz:	   82.2% -- replaced with SQuAD_it-train.json
-```
-
-
-
-Putem observa că fișierele comprimate au fost înlocuite cu _SQuAD_it-train.json_ și _SQuAD_it-test.json_, iar datele sunt stocate în formatul JSON.
-
-<Tip>
-✎ Dacă vă întrebați de ce există un caracter `!` în comenziile shell din exemplu, acest lucru se întâmplă pentru că le-am rulat în cadrul unui jupyter notebook. Simplu să ștergeți prefixul dacă doriți să descărcați și să faceți unzip datasetului într-un terminal.
-</Tip>
-
-Să încarcăm acum un fișier JSON cu funcția `load_dataset()`. Ne trebuie doar să știm dacă ne confruntăm cu un JSON obișnuit (similar cu un nested dictionary) sau JSON Lines (lines-separated JSON). Cum multe dataset-uri pentru întrebări și răspunsuri, SQuAD-it folosește formatul nested, în care toate textele sunt stocate într-un câmp numit `data`. Acest lucru ne permite să încărcăm datasetul specificând argumentul `field` astfel:
-
-```py
-from datasets import load_dataset
-
-squad_it_dataset = load_dataset("json", data_files="SQuAD_it-train.json", field="data")
-```
-
-By default, loading local files creates a `DatasetDict` object with a `train` split. We can see this by inspecting the `squad_it_dataset` object:
-
-```py
-squad_it_dataset
-```
-
-```python out
-DatasetDict({
-    train: Dataset({
-        features: ['title', 'paragraphs'],
-        num_rows: 442
-    })
-})
-```
-
-Acest lucru ne arată numărul de rânduri și numele coloanelor asociate cu setul de antrenare. Putem vizualiza un exemplu prin a indexa în `train` split astfel:
-```py
-squad_it_dataset["train"][0]
-```
-
-```python out
-{
-    "title": "Terremoto del Sichuan del 2008",
-    "paragraphs": [
-        {
-            "context": "Il terremoto del Sichuan del 2008 o il terremoto...",
-            "qas": [
-                {
-                    "answers": [{"answer_start": 29, "text": "2008"}],
-                    "id": "56cdca7862d2951400fa6826",
-                    "question": "In quale anno si è verificato il terremoto nel Sichuan?",
-                },
-                ...
-            ],
-        },
-        ...
-    ],
-}
-```
-
-Excelent, am reușit să încarcăm datasetul nostru local! Dar, deși acest lucru a funcționat pentru setul de antrenare, ceea ce dorim cu adevărat este să includem ambele splituri, `train` și `test`, într-un singur obiect `DatasetDict` astfel încât să putem aplica funcțiile `Dataset.map()` asupra ambelor splituri în același timp. Pentru a face acest lucru, putem furniza un dicționar pentru argumentul `data_files` care va face maps fiecărui spilt name cu fișierul asociat acelui split:
-
-```py
-data_files = {"train": "SQuAD_it-train.json", "test": "SQuAD_it-test.json"}
-squad_it_dataset = load_dataset("json", data_files=data_files, field="data")
-```
-
-```python out
-DatasetDict({
-    train: Dataset({
-        features: ['title', 'paragraphs'],
-        num_rows: 442
-    })
-    test: Dataset({
-        features: ['title', 'paragraphs'],
-        num_rows: 48
-    })
-})
-```
-
-Astfel obținem exact ceea ce am dori. Acum putem aplica diverse tehnici de preprocesare pentru a curăța datele, să facem tokenize recenziilor și așa mai departe.
-
-<Tip>
-
-Argumentul `data_files` al funcției `load_dataset()` este destul de flexibil și poate fi fie un singur file paths, o listă de file paths, sau un dicționar care face maps split nameurilor cu file pathurile. De asemenea putem să folosim glob files care se potrivest unui model specificat conform regulilor folosite de Unix shell (de exemplu putem să facem glob tuturor fișierelor JSON într-un folder ca un singur split setând `data_files="*.json"`). Pentru mai multe detalii consultați [documentația](https://huggingface.co/docs/datasets/loading#local-and-remote-files) 🤗 Datasets.
-
-</Tip>
-
-Scripturile de încărcare din 🤗 Datasets suportă automat decomprimarea fișierelor de intrare, astfel putem să evităm folosirea `gzip` arătând argumentul `data_files` direct către fișierele comprimate:
-
-```py
-data_files = {"train": "SQuAD_it-train.json.gz", "test": "SQuAD_it-test.json.gz"}
-squad_it_dataset = load_dataset("json", data_files=data_files, field="data")
-```
-
-Acest lucru poate fi util dacă nu dorim să manualizăm dezcomprimarea mai multe fișiere GZIP. Automatic decompression se aplică și altor formate precum ZIP și TAR, astfel putem să indicăm `data_files` către fișierele comprimate și suntem gata!
-
-Acum că știm cum să încărcăm fișierele locale pe laptop sau desktop, să vedem cum să încarcăm fișiere remote.
-
-## Încărcarea unui dataset remote[[loading-a-remote-dataset]]
-
-Dacă lucrați ca Data Scientist sau programatori într-o companie, există șanse mari că dataseturile pe care doriți să le analizați sunt stocate pe un anumit server. Din fericire, încărcarea fișierelor remote este la fel de simplă ca încărcarea celor locale! În schimb putem să oferim pathul la fișiere locale, noi oferim argumentului `data_files` de la metoda `load_dataset()` către una sau mai multe adrese URL unde sunt stocate fișierele remote. De exemplu pentru datasetul SQuAD-it găzduit pe GitHub, putem să oferitum argumentului `data_files`, URL-urile _SQuAD_it-*.json.gz_ astfel:
-
-```py
-url = "https://github.com/crux82/squad-it/raw/master/"
-data_files = {
-    "train": url + "SQuAD_it-train.json.gz",
-    "test": url + "SQuAD_it-test.json.gz",
-}
-squad_it_dataset = load_dataset("json", data_files=data_files, field="data")
-```
-
-Astfel obținem același obiect `DatasetDict` ca mai sus, dar economisim timp, deoarece nu descărcăm și decomprimăm fișierele _SQuAD_it-*.json.gz_. Asta încheie aventura noastră în diversele modalități de încarcare a dataseturilor care nu sunt găzduite pe Hugging Face Hub. Acum că am avem un dataset la dispoziție, hai să îl prelucrăm!
-
-<Tip>
-
-✏️ **Încearcă!** Alegeți alt dataset găzduit pe GitHub sau [UCI Machine Learning Repository](https://archive.ics.uci.edu/ml/index.php) și încercați să îl încărcați atât local cât și remote folosind tehniciile introduse mai sus. Pentru puncte bonus, încercați să încărcați un dataset care este stocat în format CSV sau text (consultați [documentația](https://huggingface.co/docs/datasets/loading#local-and-remote-files) pentru detalii suplimentare despre aceste formate).
-
-</Tip>
-
-
-
-
diff --git a/chapters/ro/chapter5/3.mdx b/chapters/ro/chapter5/3.mdx
deleted file mode 100644
index dcc99f474..000000000
--- a/chapters/ro/chapter5/3.mdx
+++ /dev/null
@@ -1,748 +0,0 @@
-# E timpul să facem slice și dice[[time-to-slice-and-dice]]
-
-<CourseFloatingBanner chapter={5}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter5/section3.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter5/section3.ipynb"},
-]} />
-
-În cea mai mare parte, datele cu care lucrezi nu vor fi perfect pregătite pentru antrenarea modelelor. În această secțiune vom explora features variate pe care 🤗 Datasets le oferă pentru curățirea dataseturilor.
-
-<Youtube id="tqfSFcPMgOI"/>
-
-## Slicing și dicing asupra datelor[[slicing-and-dicing-our-data]]
-
-Asemenea Pandas, 🤗 Datasets oferă mai multe funcții pentru a manipula conținutul obiectelor `Dataset` și `DatasetDict`. Am întâlnit deja metoda `Dataset.map()` în [Capitolul 3](/course/chapter3), iar în această secțiune vom explora alte funcții de care dispunem.
-
-În acest exemplu, vom folosi [Drug Review Dataset](https://archive.ics.uci.edu/ml/datasets/Drug+Review+Dataset+%28Drugs.com%29) găzduit pe [UC Irvine Machine Learning Repository](https://archive.ics.uci.edu/ml/index.php), care conține reviewurile pacienților privind diverse medicamente, alături de bolile care sunt tratate și o evaluare de 10 stele a satisfacției pacientului.
-
-În primul rând trebuie să descărcăm și să extragem datele, ceea ce se poate de făcut cu comenzile `wget` și `unzip`:
-
-```py
-!wget "https://archive.ics.uci.edu/ml/machine-learning-databases/00462/drugsCom_raw.zip"
-!unzip drugsCom_raw.zip
-```
-
-Deoarece TSV este o variantă a CSV care folosește taburi în loc de virgulă ca separator, putem încărca aceste fișiere prin folosirea scriptului de încărcare `csv` și specificarea argumentului `delimiter` în funcția `load_dataset()` astfel:
-
-```py
-from datasets import load_dataset
-
-data_files = {"train": "drugsComTrain_raw.tsv", "test": "drugsComTest_raw.tsv"}
-# \t este caracterul tab de Python
-drug_dataset = load_dataset("csv", data_files=data_files, delimiter="\t")
-```
-
-O practică bună atunci când faceți orice fel de analiză a datelor este să vă luați un mic random sample pentru a înțelege cu ce tip de date lucrați. În 🤗 Datasets, putem crea o colecție aleatorie prin legarea funcțiilor `Dataset.shuffle()` și `Dataset.select()`:
-
-```py
-drug_sample = drug_dataset["train"].shuffle(seed=42).select(range(1000))
-# Vizualizați primele câteva exemple
-drug_sample[:3]
-```
-
-```python out
-{'Unnamed: 0': [87571, 178045, 80482],
- 'drugName': ['Naproxen', 'Duloxetine', 'Mobic'],
- 'condition': ['Gout, Acute', 'ibromyalgia', 'Inflammatory Conditions'],
- 'review': ['"like the previous person mention, I&#039;m a strong believer of aleve, it works faster for my gout than the prescription meds I take. No more going to the doctor for refills.....Aleve works!"',
-  '"I have taken Cymbalta for about a year and a half for fibromyalgia pain. It is great\r\nas a pain reducer and an anti-depressant, however, the side effects outweighed \r\nany benefit I got from it. I had trouble with restlessness, being tired constantly,\r\ndizziness, dry mouth, numbness and tingling in my feet, and horrible sweating. I am\r\nbeing weaned off of it now. Went from 60 mg to 30mg and now to 15 mg. I will be\r\noff completely in about a week. The fibro pain is coming back, but I would rather deal with it than the side effects."',
-  '"I have been taking Mobic for over a year with no side effects other than an elevated blood pressure.  I had severe knee and ankle pain which completely went away after taking Mobic.  I attempted to stop the medication however pain returned after a few days."'],
- 'rating': [9.0, 3.0, 10.0],
- 'date': ['September 2, 2015', 'November 7, 2011', 'June 5, 2013'],
- 'usefulCount': [36, 13, 128]}
-```
-
-Atrageți atenția că am fixat seedul în `Dataset.shuffle()` pentru posibilitatea de reproducere. `Dataset.select()` se așteaptă la un iterabil cu indices, deci noi am scris `range(1000)` pentru a primi primele 1000 de exemple din datasetul amestecat. Din acest sample putem vedea câteva ciudățenii în datasetul nostru:
-
-* Coloana `Unnamed: 0` are un aspect neobișnuit, care sugerează că este un anonymized ID a fiecărui pacient.
-* Coloana `condition` conține labeluri majuscule și minuscule.
-* Recenziile au lungimi variate și conțin caractere Python precum `\r\n` şi caractere HTML ca `&\#039;`.
-
-Hai să vedem cum putem folosi 🤗 Datasets pentru a face față fiecărei dintre aceste probleme. Pentru a testa ipoteza identificării pacientului pentru coloana `Unnamed: 0`, putem folosi funcția `Dataset.unique()` pentru a verifica dacă numărul de ID-uri corespunde cu numărul de rânduri în fiecare split:
-
-```py
-for split in drug_dataset.keys():
-    assert len(drug_dataset[split]) == len(drug_dataset[split].unique("Unnamed: 0"))
-```
-
-Aceasta pare să confirme ipoteza, deci putem curăța datasetul puțin, redenumind coloana `Unnamed: 0` pentru a-i da un nume mai interpretabil. Putem folosi funcția `DatasetDict.rename_column()` pentru a renumea coloana în același timp în ambele splituri:
-
-```py
-drug_dataset = drug_dataset.rename_column(
-    original_column_name="Unnamed: 0", new_column_name="patient_id"
-)
-drug_dataset
-```
-
-```python out
-DatasetDict({
-    train: Dataset({
-        features: ['patient_id', 'drugName', 'condition', 'review', 'rating', 'date', 'usefulCount'],
-        num_rows: 161297
-    })
-    test: Dataset({
-        features: ['patient_id', 'drugName', 'condition', 'review', 'rating', 'date', 'usefulCount'],
-        num_rows: 53766
-    })
-})
-```
-
-<Tip>
-
-✏️ **Încearcă!** Folosiți funcția `Dataset.unique()` pentru a găsi numărul de medicamente și condiții unice în seturile de antrenare și testare.
-
-</Tip>
-
-În continuare, vom normaliza toate `condition` labels folosind `Dataset.map()`. La fel cum am făcut cu tokenizarea în [Capitolul 3](/course/chapter3), putem defini o funcție simplă care poate fi aplicată pe toate rândurile fiecărui split din `drug_dataset`:
-
-```py
-def lowercase_condition(example):
-    return {"condition": example["condition"].lower()}
-
-
-drug_dataset.map(lowercase_condition)
-```
-
-```python out
-AttributeError: 'NoneType' object has no attribute 'lower'
-```
-
-Oh no, am întâmpinat o problemă cu funcția map! Din eroarea noastră se poate deduce că unele intrări din coloana `condition` sunt `None`, care nu pot fi convertite la caracterul mic pentru că nu sunt string-uri. Vom elimina aceste rânduri folosind `Dataset.filter()`, care funcționează în mod similar cu `Dataset.map()` și se așteaptă o funcție care primește un exemplu al datasetului.
-
-În loc de a scrie o funcție explicită ca:
-
-```py
-def filter_nones(x):
-    return x["condition"] is not None
-```
-
-și apoi să rulăm `drug_dataset.filter(filter_nones)`, putem face acest lucru într-o linie folosind o _funcție lambda_. În Python, funcțiile lambda sunt funcții mici care pot fi definite fără a le numi. Ele au forma generală:
-
-```py
-lambda <argumente> : <expresie>
-```
-
-unde `lambda` este unul dintre [cuvintele cheie](https://docs.python.org/3/reference/lexical_analysis.html#keywords) Python, `<argumente>` reprezintă o listă/set de valori separate prin virgulă care definesc inputurile funcției și `<expresie>` reprezintă operațiile pe care dorim să le executăm. De exemplu, putem defini o funcție lambda care ridică un număr la pătrat:
-
-```py
-lambda x : x * x
-```
-
-Pentru a aplica această funcție la un input, trebuie să îi facem wrap și pe să punem inputul în paranteze:
-
-```py
-(lambda x: x * x)(3)
-```
-
-```python out
-9
-```
-
-La fel, putem defini funcții lambda cu mai multe argumente prin separarea acestora prin virgulă. De exemplu, putem calcula suprafața unui triunghi ca:
-
-```py
-(lambda base, height: 0.5 * base * height)(4, 8)
-```
-
-```python out
-16.0
-```
-
-Funcțiile lambda sunt utile atunci când dorim să definim funcții mici, pentru o singură folosire (pentru mai multe informații despre ele, recomandăm citirea excelentului [Real Python tutorial](https://realpython.com/python-lambda/) scris de Andre Burgaud). În contextul 🤗 Datasets, putem utiliza funcțiile lambda pentru a defini operații simple de map și filter, astfel încât să eliminăm intrările `None` din datasetul nostru:
-
-```py
-drug_dataset = drug_dataset.filter(lambda x: x["condition"] is not None)
-```
-
-Cu intrările `None` eliminate, putem normaliza coloana `condition`:
-
-```py
-drug_dataset = drug_dataset.map(lowercase_condition)
-# Verificăm dacă lowercasing a funcționat
-drug_dataset["train"]["condition"][:3]
-```
-
-```python out
-['left ventricular dysfunction', 'adhd', 'birth control']
-```
-
-Funcționează! Acum că am curățat labelurile, să vedem cum putem curăți și recenziile.
-
-## Crearea de noi coloane
-
-Atunci când lucrați cu recenziile clienților, o practică bună este să verificați numărul de cuvinte în fiecare recenzie. O recenzie poate fi doar un singur cuvânt, cum ar fi "Excelent!" sau un eseu complet care are sute de cuvinte și depinde de cazul pe care îl aveți la vedere, aici trebuie să vă asigurați că faceți față acestor extreme diferit. Pentru a calcula numărul de cuvinte în fiecare recenzie, vom folosi un heuristic aproximativ bazat pe splittingul textului prin spații.
-
-Vom defini o funcție simplă care numără numărul de cuvinte din fiecare recenzie:
-
-```py
-def compute_review_length(example):
-    return {"review_length": len(example["review"].split())}
-```
-
-Spre deosebire de funcția `lowercase_condition()`, `compute_review_length()` returnează un dicționar ale cărui key nu corespund uneia dintre numele coloanelor din dataset. În acest caz, atunci când `compute_review_length()` este transmis în `Dataset.map()`, el va fi aplicat pe toate rândurile din dataset pentru a crea o nouă coloană `review_length`:
-
-```py
-drug_dataset = drug_dataset.map(compute_review_length)
-# Inspectăm primul exemplu de training
-drug_dataset["train"][0]
-```
-
-```python out
-{'patient_id': 206461,
- 'drugName': 'Valsartan',
- 'condition': 'left ventricular dysfunction',
- 'review': '"It has no side effect, I take it in combination of Bystolic 5 Mg and Fish Oil"',
- 'rating': 9.0,
- 'date': 'May 20, 2012',
- 'usefulCount': 27,
- 'review_length': 17}
-```
-
-Așa cum era de așteptat, putem vedea o nouă coloană `review_length` adăugată la setul de antrenare. Putem sorta această nouă coloană cu `Dataset.sort()` pentru a vedea cum valorile extreme arată:
-
-```py
-drug_dataset["train"].sort("review_length")[:3]
-```
-
-```python out
-{'patient_id': [103488, 23627, 20558],
- 'drugName': ['Loestrin 21 1 / 20', 'Chlorzoxazone', 'Nucynta'],
- 'condition': ['birth control', 'muscle spasm', 'pain'],
- 'review': ['"Excellent."', '"useless"', '"ok"'],
- 'rating': [10.0, 1.0, 6.0],
- 'date': ['November 4, 2008', 'March 24, 2017', 'August 20, 2016'],
- 'usefulCount': [5, 2, 10],
- 'review_length': [1, 1, 1]}
-```
-
-Precum am presupus, unele recenii conțin doar un singur cuvânt, ceea ce, deși ar putea fi OK pentru analiza sentimentului, nu ar fi informativ dacă vrem să prezicem condiției.
-
-<Tip>
-
-🙋 O alternativă la adăugarea unei noi coloane într-un dataset este funcția `Dataset.add_column()`. Aceasta permite să oferiți coloana ca o listă Python sau array NumPy și poate fi utilă în situații în care `Dataset.map()` nu este bine adaptat pentru analiza dumneavoastră.
-
-</Tip>
-
-Hai să folosim funcția `Dataset.filter()` pentru a elimina recenziile care conțin mai puțin de 30 de cuvinte. Similar cum am făcut în cazul coloanei `condition`, putem elimina recenziile foarte scurte cerând ca recenziile să aibă o lungime mai mare decât acest prag:
-
-```py
-drug_dataset = drug_dataset.filter(lambda x: x["review_length"] > 30)
-print(drug_dataset.num_rows)
-```
-
-```python out
-{'train': 138514, 'test': 46108}
-```
-
-După cum vedeți, aceasta a eliminat aproximativ 15% din recenziile noastrem, din seturile originale de antrenare și testare.
-
-<Tip>
-
-✏️ **Încercați!** Folosiți funcția `Dataset.sort()` pentru a inspecta recenziile cu cele mai mari numere de cuvinte. Vezi [documentația](https://huggingface.co/docs/datasets/package_reference/main_classes#datasets.Dataset.sort) pentru a vedea ce argument trebuie să folosești pentru a sorta recenziile în ordine descrescătoare.
-
-</Tip>
-
-Ultima chestie de care trebuie să ne ocupăm este prezența caracterelor HTML în recenziile noastre. Putem folosi modulul `html` din Python pentru a face unescape acestor caractere:
-
-```py
-import html
-
-text = "I&#039;m a transformer called BERT"
-html.unescape(text)
-```
-
-```python out
-"I'm a transformer called BERT"
-```
-
-Vom folosi `Dataset.map()` pentru a face unescape toate caracterele HTML din corpus:
-
-```py
-drug_dataset = drug_dataset.map(lambda x: {"review": html.unescape(x["review"])})
-```
-
-În mod evident, metoda `Dataset.map()` este foarte utilă pentru procesarea datelor – și nu am abordat decât o mică parte din ceea ce poate face!
-
-## Superputerile metodei `map()`[[the-map-methods-superpowers]]
-
-Metoda `Dataset.map()` acceptă un argument `batched` care, dacă este setat pe `True`, cauzează ca ea să trimită un batch de exemple la funcția map în același timp (dimensiunea batchului poate fi configurată dar defaultul este 1.000). De exemplu, anterior am folosit o funcție map care a făcut unescaped toate caracterele HTML din recenziile noastre și i-a luat câteva secunde să execute (puteți citi timpul pe progress bars). Putem accelera acest lucru prin procesarea mai multor elemente în același timp folosind list comprehension.
-
-Când specificați `batched=True` funcția primește un dicționar cu câmpurile datasetului, dar fiecare valoare este acum _list of values_ și nu doar o singură valoare. Valoarea de return a `Dataset.map()` ar trebui să fie la fel: un dicționar cu câmpurile pe care dorim să le actualizăm sau adăugăm în datasetul nostru, și o listă de valori. De exemplu, mai jos este alt mod de a face unescape tuturor caracterelor HTML din recenziile noastre, folosind `batched=True`:
-
-```py
-new_drug_dataset = drug_dataset.map(
-    lambda x: {"review": [html.unescape(o) for o in x["review"]]}, batched=True
-)
-```
-
-Dacă executați acest cod într-un notebook, veți vedea că această comandă se execută mult mai rapid decât cea anterioră. Și nu pentru că recenziile noastre au fost deja HTML-unescaped – dacă reexecutați instrucția precedentă (fără `batched=True`), ea va lua același timp ca înainte. Acest lucru se datorează faptului că list comprehension sunt  mai rapide decât executarea aceluiași cod într-un `for` loop, și am câștigat, de asemenea, puțină performanțp accesând multe elemente în același timp, în loc unul câte unul.
-
-Folosirea `Dataset.map()` cu `batched=True` este esențială pentru a obțina viteza "rapidă" a tokenizerilor pe care îi vom întâlni în [Capitolul 6](/course/chapter6), care pot repede să facă tokenize listelor mari de texte. De exemplu, pentru a face tokenize tuturor recenziilor medicamentelor cu un tokenizer rapid, putem folosi o funcție ca aceasta:
-
-```py
-from transformers import AutoTokenizer
-
-tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
-
-
-def tokenize_function(examples):
-    return tokenizer(examples["review"], truncation=True)
-```
-
-Așa cum am văzut în [Capitolul 3](/course/chapter3), putem transmite un singur sau câteva exemple către tokenizer, așadar putem folosi această funcție cu sau fără `batched=True`. Hai să ne folosim de această oportunitate și să comparăm performanța diferitelor opțiuni. Într-un notebook puteți măsura timpul unei instrucțiie de o line prin adăugarea `%time` înaintea acelei linii de cod pe care doriți să o măsurați:
-
-```python no-format
-%time tokenized_dataset = drug_dataset.map(tokenize_function, batched=True)
-```
-
-Puteți și să măsurați un întreg cell prin scrierea `%%time` la începutul celulei. În hardware-ul pe care l-am executat, acest lucru a arătat 10.8s pentru această instrucție (este numărul scris după "Wall time").
-
-<Tip>
-
-✏️ **Încercați!** Executați aceeași instrucție cu și fără `batched=True`, apoi încercați-o cu un tokenizer lent (adaugați `use_fast=False` în metoda `AutoTokenizer.from_pretrained()`), astfel să puteți vedea ce numere obțineți pe hardwareul vostru.
-
-</Tip>
-
-Aici sunt rezultatele pe care le-am obținut cu și fără batching, folosind un tokenizer rapid și lent:
-
-Options         | Fast tokenizer | Slow tokenizer
-:--------------:|:--------------:|:-------------:
-`batched=True`  | 10.8s          | 4min41s
-`batched=False` | 59.2s          | 5min3s
-
-Aceasta înseamnă că utilizarea unui tokenizer rapid cu opțiunea `batched=True` este de 30 de ori mai rapidă decât varianta lentă fără batching - acest lucru este pur și simplu uimitor! Acesta este motivul principal pentru care tokenizerii rapizi sunt setați implicit când se utilizează `AutoTokenizer` (și de ce sunt numiți "rapizi"). Ei pot atinge o asemenea accelerație datorită faptului că codul de tokenizare este executat în Rust, care este un limbaj care facilitează paralelizarea execuției.
-
-Parallelization este și motivul pentru care tokenizerul rapid realizează o accelerare de aproape 6 ori cu batching: nu puteți paraleliza o singură operație de tokenizare, dar atunci când doriți să tokenizați multe texte în același timp, puteți să faceți split execuției pe mai multe procese, fiecare răspunzând pentru propriile texte.
-
-`Dataset.map()` are și o capacitate de parallelization proprie. Deoarece nu sunținute de Rust, nu pot să le ofere aceeași accelerație tokenizerilori înceți ca tokenizerilor rapizi, dar pot încă fi utili (în special dacă utilizați un tokenizer care nu are o variantă rapidă). Pentru a activa multiprocessingul, folosiți argumentul `num_proc` și specificați numărul de procese să fie utilizate în apelul `Dataset.map()`:
-
-```py
-slow_tokenizer = AutoTokenizer.from_pretrained("bert-base-cased", use_fast=False)
-
-
-def slow_tokenize_function(examples):
-    return slow_tokenizer(examples["review"], truncation=True)
-
-
-tokenized_dataset = drug_dataset.map(slow_tokenize_function, batched=True, num_proc=8)
-```
-
-Puteți experimenta puțin cu timpii pentru a determina numărul de procese optime; în cazul nostru 8 s-a dovedit a produce cea mai mare accelerație. Aici sunt rezultatele pe care le-am obținut cu și fără multiprocessing:
-
-Options         | Fast tokenizer | Slow tokenizer
-:--------------:|:--------------:|:-------------:
-`batched=True`  | 10.8s          | 4min41s
-`batched=False` | 59.2s          | 5min3s
-`batched=True`, `num_proc=8`  | 6.52s          | 41.3s
-`batched=False`, `num_proc=8` | 9.49s          | 45.2s
-
-Aceste rezultate sunt mult mai bune pentru tokenizerul lent, dar și performanța tokenizerului rapid a fost semnificativ îmbunătățită. Cu toate acestea, trebuie să reamintim că aceasta nu va fi întotdeauna cazul - testele noastre au arătat că este mai rapid să utilizați `batched=True` fără acest argument în cazurile în care valoarea lui `num_proc` diferă de 8. În general, nu vă recomandăm utilizarea multiplicării proceselor pentru tokenizorii rapizi cu `batched=True`.
-
-<tip>
-
-Utilizarea `num_proc` pentru a accelera procesarea este de obicei o idee excelentă, atâta timp cât funcția pe care o utilizați nu utilizează deja multiprocessing.
-
-</tip>
-
-Toate aceste funcționalități condensate într-o singură metodă este foarte impresionant, dar asta nu e totul! Cu `Dataset.map()` și `batched=True` puteți modifica numărul de elemente din datasetul dumneavoastră. Acesta este extrem de util în numeroase situații în care doriți să creați mai multe caracteristici de antrenare dintr-un singur exemplu, și vom avea nevoie de acest lucru ca parte a preprocesării pentru câteva dintre sarcinile NLP pe care le vom discuta în [Capitolul 7](/course/chapter7).
-
-<tip>
-
-💡 În machine learning, un _exemplu_ este de obicei definit ca fiind un set de _features_ care se oferă modelului. În unele contexte, acestea vor fi seturile de coloane dintr-un `Dataset`, dar în altele (ca și aici și pentru răspunderea la întrebări) mai multe caracteristici pot fi extrase dintr-un singur exemplu și să aparțină unei singure coloane.
-
-</tip>
-
-Hai să vedem cum funcționează! Aici vom tokeniza exemplele și le vom face truncatela lungimea maximă de 128, dar vom cere tokenizerului să returneze *toate* chunkurile de text în loc de prima. Acest lucru poate fi făcut cu `return_overflowing_tokens=True`:
-
-```py
-def tokenize_and_split(examples):
-    return tokenizer(
-        examples["review"],
-        truncation=True,
-        max_length=128,
-        return_overflowing_tokens=True,
-    )
-```
-
-Hai să testăm acest lucru pe un exemplu înainte de a folosi `Dataset.map()` pentru întreg datasetul:
-
-```py
-result = tokenize_and_split(drug_dataset["train"][0])
-[len(inp) for inp in result["input_ids"]]
-```
-
-```python out
-[128, 49]
-```
-
-Așadar, primul nostru exemplu din setul de antrenare a devenit două features pentru că a fost tokenizat mai mult decât lungimea maximă de tokenuri pe care am specificat-o: prima cu lungimea 128 și a doua cu lungimea 49. Acum trebuie să facem acest lucru pentru toate elementele din dataset!
-
-```py
-tokenized_dataset = drug_dataset.map(tokenize_and_split, batched=True)
-```
-
-```python out
-ArrowInvalid: Column 1 named condition expected length 1463 but got length 1000
-```
-
-Oh no! Acesta nu a funcționat! De ce? Citind eroarea vom afla motivul: existența unei incompatibilități în lungimea uneia dintre coloane - una cu o lungime de 1,463 și alta de 1,000. Dacă ați privit [documentația](https://huggingface.co/docs/datasets/package_reference/main_classes#datasets.Dataset.map) Dataset.map(), puteți să vă reamintiți că este numărul de sampleuri care sunt oferite funcției pe care noi le facem mapping; aici aceste 1,000 exemplare creează 1,463 features noi, ceea ce duce la un shape error.
-
-Problema este că încercăm să amestecăm două dataseturi cu mărimi diferite: coloanele `drug_dataset` vor avea un număr determinat de exemple (cele 1,000 din eroare), dar `tokenized_dataset` pe care îl construim va fi mai mare (cel cu 1,463 din eroare; el este mai mare decât 1,000 pentru că tokenizăm reviewrile lungi în mai multe exemple folosind `return_overflowing_tokens=True`). Acest lucru nu funcționează pentru un `Dataset`, așadar trebuie să eliminăm sau să modificămm coloanele din datasetul vechi pentru a se potrivi dimensiunea cu cea din noul dataset. Putem face ultima din cele două opțiuni folosind argumentul `remove_columns`:
-
-```py
-tokenized_dataset = drug_dataset.map(
-    tokenize_and_split, batched=True, remove_columns=drug_dataset["train"].column_names
-)
-```
-
-Acum acest lucru funcționează fără erori. Putem verifica că noul dataset are mai multe elemente decât datasetul original prin compararea lungimilor:
-
-```py
-len(tokenized_dataset["train"]), len(drug_dataset["train"])
-```
-
-```python out
-(206772, 138514)
-```
-
-Am menționat că putem rezolva problema lungimilor diferite are coloanelor prin schimbarea vechilor coloane la aceeași dimensiune cu cele noi. Pentru aceasta, vom avea nevoie de câmpul `overflow_to_sample_mapping` returnat de tokenizer atunci când setăm `return_overflowing_tokens=True`. El ne oferă un mapping de la un nou feature index la indicele sampleului din care a provenit. Prin intermediul acesta, putem asocia fiecărei key prezentă în datasetul original cu o listă de valori de dimensiune corectă prin repetarea valorilor fiecărui exemplu atâta timp cât produce caracteristici noi:
-
-```py
-def tokenize_and_split(examples):
-    result = tokenizer(
-        examples["review"],
-        truncation=True,
-        max_length=128,
-        return_overflowing_tokens=True,
-    )
-    # Extragem maparea între noul și vechiul indice
-    sample_map = result.pop("overflow_to_sample_mapping")
-    for key, values in examples.items():
-        result[key] = [values[i] for i in sample_map]
-    return result
-```
-
-Putem observa că funcționează cu `Dataset.map()` fără ca noi să avem nevoie să eliminăm coloanele vechi:
-
-```py
-tokenized_dataset = drug_dataset.map(tokenize_and_split, batched=True)
-tokenized_dataset
-```
-
-```python out
-DatasetDict({
-    train: Dataset({
-        features: ['attention_mask', 'condition', 'date', 'drugName', 'input_ids', 'patient_id', 'rating', 'review', 'review_length', 'token_type_ids', 'usefulCount'],
-        num_rows: 206772
-    })
-    test: Dataset({
-        features: ['attention_mask', 'condition', 'date', 'drugName', 'input_ids', 'patient_id', 'rating', 'review', 'review_length', 'token_type_ids', 'usefulCount'],
-        num_rows: 68876
-    })
-})
-```
-
-Obținem același număr de features training ca și înainte, dar acum am păstrat toate câmpurile vechi. Dacă ai nevoie de ele pentru post-procesare după aplicarea modelului, ar fi util să folosiți această abordare.
-
-Acum ați învățat cum pot fi utilizate 🤗 Datasets pentru preprocesarea datelor prin metode diferite. Deși funcțiile de preprocesare ale 🤗 Datasets vor acoperi majoritatea nevoilor de antrenare a modelului,
-există momente în care veți avea nevoie să treceți la Pandas pentru accesul la caracteristici mai puternice, cum ar fi `DataFrame.groupby()` sau high-level APIs pentru vizualizare. Din fericire, 🤗 Dataset a fost proiectat astfel încât să fie interoperabil cu biblioteci precum Pandas, NumPy, PyTorch, TensorFlow și JAX. Hai să vedem cum se face acest lucru.
-
-## De la `Dataset`s la `DataFrame`s și înapoi[[from-datasets-to-dataframes-and-back]]
-
-<Youtube id="tfcY1067A5Q"/>
-
-Pentru a permite conversia între diferite biblioteci, 🤗 Datasets oferă o funcțiune `Dataset.set_format()`. Această funcție schimbă doar _output format_ al datasetului, deci puteți ușor să treceți la un alt format fără a afecta _data format_ de bază, care este Apache Arrow. Formatarea se face direct. Pentru a demonstra acest lucru, hai să convertim datasetul nostru în Pandas:
-
-```py
-drug_dataset.set_format("pandas")
-```
-
-Acum, atunci când accesăm elementele din dataset, obținem `pandas.DataFrame` în loc de un dicționar:
-
-```py
-drug_dataset["train"][:3]
-```
-
-<table border="1" class="dataframe">
-  <thead>
-    <tr style="text-align: right;">
-      <th></th>
-      <th>patient_id</th>
-      <th>drugName</th>
-      <th>condition</th>
-      <th>review</th>
-      <th>rating</th>
-      <th>date</th>
-      <th>usefulCount</th>
-      <th>review_length</th>
-    </tr>
-  </thead>
-  <tbody>
-    <tr>
-      <th>0</th>
-      <td>95260</td>
-      <td>Guanfacine</td>
-      <td>adhd</td>
-      <td>"My son is halfway through his fourth week of Intuniv..."</td>
-      <td>8.0</td>
-      <td>April 27, 2010</td>
-      <td>192</td>
-      <td>141</td>
-    </tr>
-    <tr>
-      <th>1</th>
-      <td>92703</td>
-      <td>Lybrel</td>
-      <td>birth control</td>
-      <td>"I used to take another oral contraceptive, which had 21 pill cycle, and was very happy- very light periods, max 5 days, no other side effects..."</td>
-      <td>5.0</td>
-      <td>December 14, 2009</td>
-      <td>17</td>
-      <td>134</td>
-    </tr>
-    <tr>
-      <th>2</th>
-      <td>138000</td>
-      <td>Ortho Evra</td>
-      <td>birth control</td>
-      <td>"This is my first time using any form of birth control..."</td>
-      <td>8.0</td>
-      <td>November 3, 2015</td>
-      <td>10</td>
-      <td>89</td>
-    </tr>
-  </tbody>
-</table>
-
-În continuare, vom crea un `pandas.DataFrame` pentru întregul set de antrenare prin selectarea tuturor elementelor din `drug_dataset["train"]`:
-
-```py
-train_df = drug_dataset["train"][:]
-```
-
-<Tip>
-
-🚨 În spatele scenei, `Dataset.set_format()` schimbă formatul returnat pentru  `__getitem__()` dunder method a datasetului. Asta înseamnă că atunci când dorim să creăm un nou obiect ca `train_df` dintr-un `Dataset` în formatul `"pandas"`, trebuie să tăiem întreg datasetul pentru a obține un `pandas.DataFrame`. Puteți verifica voi înşivă că tipul lui `drug_dataset["train"]` este `Dataset`, indiferent de output format.
-
-</Tip>
-
-Acum putem utiliza toate funcționalitățile Pandas pe care le dorim. De exemplu, putem face fancy chaining pentru a calcula distribuția clasei printre intrările `condition`:
-
-```py
-frequencies = (
-    train_df["condition"]
-    .value_counts()
-    .to_frame()
-    .reset_index()
-    .rename(columns={"index": "condition", "condition": "frequency"})
-)
-frequencies.head()
-```
-
-<table border="1" class="dataframe">
-  <thead>
-    <tr style="text-align: right;">
-      <th></th>
-      <th>condition</th>
-      <th>frequency</th>
-    </tr>
-  </thead>
-  <tbody>
-    <tr>
-      <th>0</th>
-      <td>birth control</td>
-      <td>27655</td>
-    </tr>
-    <tr>
-      <th>1</th>
-      <td>depression</td>
-      <td>8023</td>
-    </tr>
-    <tr>
-      <th>2</th>
-      <td>acne</td>
-      <td>5209</td>
-    </tr>
-    <tr>
-      <th>3</th>
-      <td>anxiety</td>
-      <td>4991</td>
-    </tr>
-    <tr>
-      <th>4</th>
-      <td>pain</td>
-      <td>4744</td>
-    </tr>
-  </tbody>
-</table>
-
-
-Și odată ce suntem gata cu analiza noastră Pandas, putem crea întotdeauna un nou obiect `Dataset` prin utilizarea funcției `Dataset.from_pandas()`:
-
-
-```py
-from datasets import Dataset
-
-freq_dataset = Dataset.from_pandas(frequencies)
-freq_dataset
-```
-
-```python out
-Dataset({
-    features: ['condition', 'frequency'],
-    num_rows: 819
-})
-```
-
-
-<Tip>
-
-✏️ **Încercați!** Calculați media ratingului per medicament și salvați rezultatul într-un nou `Dataset`.
-
-</Tip>
-
-
-Acest lucru completează turul nostru de tehnici de preprocesare disponibile în 🤗 Datasets. Pentru a finisa secțiunea, vom crea un set de validare pentru a pregăti datasetul pentru antrenarea unui clasificator. Înainte de a face asta, noi vom reseta output formatul `drug_dataset` de la `"pandas"` la `"arrow" :
-
-
-```python
-drug_dataset.reset_format()
-```
-
-## Crearea unui set de validare [[creating-a-validation-set]]
-
-Deși avem deja un set de testare pe care îl putem folosi pentru evaluare, este o bună practică să lăsăm setul de test neschimbat și să creăm un set de validare în timpul developmentului. Odată ce sunteți fericiți cu performanța modelului pe setul de validare, puteți face o verificare finală a setului de test. Acest proces ajută la reducerea riscului ca să vă adaptați prea mult setul de test și să depuneți un model care poate eșua analizând date reale.
-
-🤗 Datasets oferă o funcție `Dataset.train_test_split()` bazată pe funcționalitatea celebră din `scikit-learn`. O vom folosi pentru a împărți setul nostru de antrenare în split-uri de `train` și `validation` (setăm argumentul `seed` pentru reproductabilitate):
-
-```python
-drug_dataset_clean = drug_dataset["train"].train_test_split(train_size=0.8, seed=42)
-# Renumește implicit "test" split-ul la "valide"
-drug_dataset_clean["validation"] = drug_dataset_clean.pop("test")
-# Adaugă setul de test în `DatasetDict`
-drug_dataset_clean["test"] = drug_dataset["test"]
-drug_dataset_clean
-```
-
-```python out
-DatasetDict({
-    train: Dataset({
-        features: ['patient_id', 'drugName', 'condition', 'review', 'rating', 'date', 'usefulCount', 'review_length', 'review_clean'],
-        num_rows: 110811
-    })
-    validation: Dataset({
-        features: ['patient_id', 'drugName', 'condition', 'review', 'rating', 'date', 'usefulCount', 'review_length', 'review_clean'],
-        num_rows: 27703
-    })
-    test: Dataset({
-        features: ['patient_id', 'drugName', 'condition', 'review', 'rating', 'date', 'usefulCount', 'review_length', 'review_clean'],
-        num_rows: 46108
-    })
-})
-```
-
-Foarte bine, am pregătit acum un dataset care este gata pentru antrenarea unor modele! În [Secțiunea 5](/course/chapter5/5) vom arăta cum puteți încărca seturile de date în Hugging Face Hub, dar în acest moment hai să punem capăt analizei noastre prin examinarea a câteva modalități de salvare a seturilor de date pe dispozitivele locale.
-
-## Salvarea unui dataset[[saving-a-dataset]]
-
-<Youtube id="blF9uxYcKHo"/>
-
-Deși 🤗 Datasets va face cache fiecărui dataset și a operațiilor efectuate asupra acestuia, există momente în care veți dori să salvați un dataset pe disc (de exemplu, în cazul în care cache-ul se șterge). După cum vedeți în tabelul de mai jos, 🤗 Datasets oferă trei funcții principale pentru salvarea datelor în formate diferite:
-
-| Format de date | Funcție |
-| :---------: | :--------------------: |
-|    Arrow    | `Dataset.save_to_disk()` |
-|     CSV     |    `Dataset.to_csv()`    |
-|    JSON     |   `Dataset.to_json()`    |
-
-Spre exemplu, hai să salvăm datasetul nostru curățat în formatul Arrow:
-
-```python
-drug_dataset_clean.save_to_disk("drug-reviews")
-```
-
-Acest lucru va crea un folder cu următoarea structură:
-
-```
-drug-reviews/
-├── dataset_dict.json
-├── test
-│   ├── dataset.arrow
-│   ├── dataset_info.json
-│   └── state.json
-├── train
-│   ├── dataset.arrow
-│   ├── dataset_info.json
-│   ├── indices.arrow
-│   └── state.json
-└── validation
-    ├── dataset.arrow
-    ├── dataset_info.json
-    ├── indices.arrow
-    └── state.json
-```
-
-unde se poate vedea că fiecare split este asociat cu propriul său tabel `dataset.arrow`, iar unele metadate în `dataset_info.json` și `state.json`. Poți să te gândești la formatul Arrow ca fiind un tabel facny de coloane și rânduri, optimizat pentru construirea aplicațiilor high-performance care procesează și transportă dataseturi mari.
-
-Odată ce setul de date este salvat, putem încărca-o folosind funcția `load_from_disk()` următoarea:
-
-```py
-from datasets import load_from_disk
-
-drug_dataset_reloaded = load_from_disk("drug-reviews")
-drug_dataset_reloaded
-```
-
-```python out
-DatasetDict({
-    train: Dataset({
-        features: ['patient_id', 'drugName', 'condition', 'review', 'rating', 'date', 'usefulCount', 'review_length'],
-        num_rows: 110811
-    })
-    validation: Dataset({
-        features: ['patient_id', 'drugName', 'condition', 'review', 'rating', 'date', 'usefulCount', 'review_length'],
-        num_rows: 27703
-    })
-    test: Dataset({
-        features: ['patient_id', 'drugName', 'condition', 'review', 'rating', 'date', 'usefulCount', 'review_length'],
-        num_rows: 46108
-    })
-})
-```
-
-Pentru formatele CSV și JSON, trebuie să stocați fiecare split într-un fișier separat. Un mod de a face acest lucru estw iterarea asupra cheilor și valorilor obiectului `DatasetDict`:
-
-```py
-for split, dataset in drug_dataset_clean.items():
-    dataset.to_json(f"drug-reviews-{split}.jsonl")
-```
-
-Acesta salvează fiecare split în [JSON Lines format](https://jsonlines.org), unde fiecare rând din setul de date este stocat ca o singură linie JSON. Aici puteți vedea cum arată primul exemplu:
-
-```bash
-!head -n 1 drug-reviews-train.jsonl
-```
-
-```python out
-{"patient_id":141780,"drugName":"Escitalopram","condition":"depression","review":"\"I seemed to experience the regular side effects of LEXAPRO, insomnia, low sex drive, sleepiness during the day. I am taking it at night because my doctor said if it made me tired to take it at night. I assumed it would and started out taking it at night. Strange dreams, some pleasant. I was diagnosed with fibromyalgia. Seems to be helping with the pain. Have had anxiety and depression in my family, and have tried quite a few other medications that haven't worked. Only have been on it for two weeks but feel more positive in my mind, want to accomplish more in my life. Hopefully the side effects will dwindle away, worth it to stick with it from hearing others responses. Great medication.\"","rating":9.0,"date":"May 29, 2011","usefulCount":10,"review_length":125}
-```
-
-Putem apoi folosi tehnicile de la [Secțiunea 2](/course/chapter5/2) pentru încărcarea fișierelor JSON:
-
-```py
-data_files = {
-    "train": "drug-reviews-train.jsonl",
-    "validation": "drug-reviews-validation.jsonl",
-    "test": "drug-reviews-test.jsonl",
-}
-drug_dataset_reloaded = load_dataset("json", data_files=data_files)
-```
-
-Și ăsta este finalul excursiei noastre în lumea manipulării datelor cu 🤗 Datasets! Acum că avem un dataset curat, pregătit pentru antrenarea unui model, aici sunt câteva idei pe care le puteți încerca:
-
-1. Folosiți tehnicile din [Capitolul 3](/course/chapter3) pentru a antrena un classifier care poate prezice starea pacientului pe baza recenziei medicamentului.
-2. Folosiți pipelineul `summarization` din [Capitolul 1](/course/chapter1) pentru a genera rezumate ale recenziilor.
-
-În următoarea secțiune, vom vedea cum 🤗 Datasets vă permite să lucrați cu dataseturi mari fără ca laptopul tău să explodeze :)!
\ No newline at end of file
diff --git a/chapters/ro/chapter5/4.mdx b/chapters/ro/chapter5/4.mdx
deleted file mode 100644
index a1261153b..000000000
--- a/chapters/ro/chapter5/4.mdx
+++ /dev/null
@@ -1,287 +0,0 @@
-# Big data?🤗 Datasets îți vin în ajutor![[big-data-datasets-to-the-rescue]]
-
-<CourseFloatingBanner chapter={5}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[ 
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter5/section4.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter5/section4.ipynb"},
-]} />
-
-În prezent, nu este de neașteptat să te confrunți cu dataseturi de câțiva gigabytes, mai ales dacă planifici să preantreenezi un transformer ca BERT sau GPT-2 de la zero. În aceste cazuri, chiar _loading_ a datelor poate fi o provocare. De exemplu, corpusul WebText folosit pentru a preantreena GPT-2 conține peste 8 milioane de documente și 40 GB de text – încărcarea acestuia în memoria RAM a laptopului tău este probabil să-i facă un atac cardiac!
-
-Norocul este că Datasets 🤗 a fost proiectat pentru a depăși aceste limitări. El te eliberează de problemele de gestionare a memoriei, tratarea dataseturilor ca fișiere _memory-mapped_, și limitele hard driveului prin _streamingul_ intrărilor dintr-un corpus.
-
-<Youtube id="JwISwTCPPWo"/>
-
-În această secțiune vom explora aceste caracteristici ale 🤗Datasets cu un corpus de 825 GB numit [Pile](https://pile.eleuther.ai). Să începem!
-
-## Ce este Pile?[[what-is-the-pile]]
-
-Pile este un corpus de text englezesc creat de [EleutherAI](https://www.eleuther.ai) pentru antrenarea large-scale language models. Acesta include o varietate diversă de dataseturi, cuprinzând articole științifice, repositoriuri GitHub și texte web filtrate. Corpusul de antrenare este disponibil în chunkuri de [14 GB](https://the-eye.eu/public/AI/pile/), dar în același timp puteți descărca și câteva dintre [componenetele 
-individuale](https://the-eye.eu/public/AI/pile_preliminary_components/). Să începem prin examinarea datasetului PubMed Abstracts, care este un corpus de rezumate din 15 milioane de publicații științifice biomedicale de pe [PubMed](https://pubmed.ncbi.nlm.nih.gov/). Datasetul este în format JSON și este comprimat cu librăria `zstandard`, așadar prima dată ne trebuie să o instalăm pe aceasta:
-
-```py
-!pip install zstandard
-```
-
-În continuare, putem încărca datasetul utilizând metoda pentru fișierele remote pe care am învățat-o în [secțiunea 2](/course/chapter5/2):
-
-```py
-from datasets import load_dataset
-
-# Acest lucru durează câteva minute, așadar poți să te duci să îți iei un ceai sau o cafea între timp :))
-data_files = "https://the-eye.eu/public/AI/pile_preliminary_components/PUBMED_title_abstracts_2019_baseline.jsonl.zst"
-pubmed_dataset = load_dataset("json", data_files=data_files, split="train")
-pubmed_dataset
-```
-
-```python out
-Dataset({
-    features: ['meta', 'text'],
-    num_rows: 15518009
-})
-```
-
-Putem observa că există 15.518.009 de linii și două colonne în datasetul nostru – e foarte mult!
-
-<Tip>
-
-✎ De abia acum, 🤗 Datasets va descompresa fișierele necesare pentru încărcarea datasetului. Dacă doriți vreei să salvezi spațiu pe hard driveul tău, puteți transmite `DownloadConfig(delete_extracted=True)` la argumentul `download_config` al `load_dataset()`. Vedeți mai multe detalii în [documentație](https://huggingface.co/docs/datasets/package_reference/builder_classes#datasets.DownloadConfig).
-
-</Tip>
-
-Acum hai să analizăm conținutul primei linii:
-
-```py
-pubmed_dataset[0]
-```
-
-```python out
-{'meta': {'pmid': 11409574, 'language': 'eng'},
- 'text': 'Epidemiology of hypoxaemia in children with acute lower respiratory infection.\nTo determine the prevalence of hypoxaemia in children aged under 5 years suffering acute lower respiratory infections (ALRI), the risk factors for hypoxaemia in children under 5 years of age with ALRI, and the association of hypoxaemia with an increased risk of dying in children of the same age ...'}
-```
-
-Okay, acesta pare a fi un rezumat dintr-un articol medical. Să vedem cât de mult spațiu RAM am folosit pentru încărcarea datasetului!
-
-## Magia memory mappingului[[the-magic-of-memory-mapping]]
-
-Una dintre modalitățile simple de măsurare a utilizării memoriei în Python este cu biblioteca `psutil`, care poate fi instalată cu `pip`:
-
-```python
-!pip install psutil
-```
-
-Biblioteca oferă o clasă `Process` ce ne permite să verificăm utilizarea memoriei procesului curent astfel:
-
-```py
-import psutil
-
-# Process.memory_info este exprimat în bytes, așadar convertim la megabyte
-print(f"Utilizare RAM: {psutil.Process().memory_info().rss / (1024 * 1024):.2f} MB")
-```
-
-```python out
-Utilizarea RAM: 5678.33 MB
-```
-
-Aici `rss` se referă la _resident set size_ , care este partea memoriei ocupată de proces în RAM. Această măsurare include și memoria folosită de Python interpreter și librariile pe care le-am încărcat, așadar cantitatea reală de memorie utilizată pentru încărcarea datelor este puțin mai mică. Pentru comparație, putem să vedem cât de mare este datasetul pe disc folosind atributul `dataset_size`. Deoarece rezultatul este exprimat în bytes, putem să îl convertim manual la gigabyte:
-
-```py
-print(f"Number of files in dataset : {pubmed_dataset.dataset_size}")
-size_gb = pubmed_dataset.dataset_size / (1024**3)
-print(f"Dataset size (cache file) : {size_gb:.2f} GB")
-```
-
-```python out
-Number of files in dataset : 20979437051
-Dataset size (cache file) : 19.54 GB
-```
-
-
-Nice – deși este aproximativ 20 GB, putem încărca și accesa datasetul cu mult mai puțin RAM!
-
-<Tip>
-
-✏️ **Încercați!** Alegeți una dintre [subseturile](https://the-eye.eu/public/AI/pile_preliminary_components/) din Pile care este mai mare decât memoria RAM a laptopului sau dispozitivului tău, încărcați-o cu 🤗 Datasets și măsurați cantitatea de memorie folosită. Pentru o măsurare precisă, veți dori să faceți acest lucru într-un proces nou. Puteți găsi dimensiunile decomprimate ale fiecărui subset în Tabelul 1 din [Pile paper](https://arxiv.org/abs/2101.00027). 
-
-</Tip>
-
-Dacă sunteți familiarizați cu Pandas, rezultatul acesta poate veni ca o surpriză din cauza celebrei [rule of thumbă](https://wesmckinney.com/blog/apache-arrow-pandas-internals/) al lui Wes Kinney, care spune că în mod normal aveți nevoie de 5 până la 10 ori mai mult spațiu pe RAM decât mărimea datasetului. Deci 🤗 Datasets această problemă de memory management? 🤗 Datasets tratează fiecare dataset ca un [memory-mapped file](https://en.wikipedia.org/wiki/Memory-mapped_file), care oferă un mapping între spațiul RAM și stocarea pe sistem, ceea ce permite bibliotecii să acceseze și să opereze asupra elementelor datasetului fără a trebui să-l încarce în totalitate în memorie.
-
-Memory-mapped files pot fi și distribuite între mai multe procese, ceea ce permite metodelor cum ar fi `Dataset.map()` să fie parallelized fără necesitatea mutării sau copierii datasetului. În spatele acestor facilități se află [formatul de memorie Apache Arrow](https://arrow.apache.org) și biblioteca [`pyarrow`](https://arrow.apache.org/docs/python/index.html), care realizează încărcarea datelor și procesarea la viteze fulgerătoare. (Pentru mai multe detalii despre Apache Arrow și compararea sa cu Pandas, vă rugăm să citiți [blogul lui Dejan Simic](https://towardsdatascience.com/apache-arrow-read-dataframe-with-zero-memory-69634092b1a).) Pentru a vedea acest lucru în acțiune, hai să încercăm un speed test prin iterarea asupra tuturor elementelor din datasetul PubMed Abstracts:
-
-```py
-import timeit
-
-code_snippet = """batch_size = 1000
-
-for idx in range(0, len(pubmed_dataset), batch_size):
-    _ = pubmed_dataset[idx:idx + batch_size]
-"""
-
-time = timeit.timeit(stmt=code_snippet, number=1, globals=globals())
-print(
-    f"Iterated over {len(pubmed_dataset)} examples (about {size_gb:.1f} GB) in "
-    f"{time:.1f}s, i.e. {size_gb/time:.3f} GB/s"
-)
-```
-
-```python out
-'Iterated over 15518009 examples (about 19.5 GB) in 64.2s, i.e. 0.304 GB/s'
-```
-
-Aici am folosit modulul `timeit` al Python pentru a măsura timpul de execuție necesar pentru a rula `code_snippet`. În mod normal veți putea trece peste un dataset la viteze de câteva sute de MB/s până la câțiva GB/s. Acest lucru funcționează bine pentru majoritatea aplicațiilor, dar uneori veți avea nevoie să lucrați cu un dataset care este prea mare ca să încapă pe hard driveul laptopului tău. De exemplu, dacă am încerca să descarcăm Pile în întregime, am avea nevoie de 825 GB de spațiu liber! Pentru a vă ajuta cu astfel de cazuri, 🤗 Datasets oferă o feature de streaming care permite accesarea și descărcarea elementelor, fără a trebui să descărcați întregul dataset. Hai să vedem cum funcționează!
-
-<Tip>
-
-💡În Jupyter notebooks poți să măsori timpul unei celule utilizând [funcția magică `%%timeit`](https://ipython.readthedocs.io/en/stable/interactive/magics.html#magic-timeit).
-
-</Tip>
-
-## Streamingul dataseturilor[[streaming-datasets]]
-
-Pentru a activa dataset streaming este suficient să dați argumentul `streaming=True` funcției `load_dataset()`. De exemplu, să încercăm să încărcăm datasetul PubMed Abstracts în streaming mode:
-
-```py
-pubmed_dataset_streamed = load_dataset(
-    "json", data_files=data_files, split="train", streaming=True
-)
-```
-
-În locul `Dataset`-ului obișnuit pe care l-am întâlnit până acum în acest capitol, obiectul returnat cu `streaming=True` este un `IterableDataset`. După nume putem deduce că pentru a accesa elementele dintr-un `IterableDataset`, trebuie să iterăm prin el. Prin urmare, putem accesa primul element al streamed datased astfel:
-
-```py
-next(iter(pubmed_dataset_streamed))
-```
-
-```python out
-{'meta': {'pmid': 11409574, 'language': 'eng'},
- 'text': 'Epidemiology of hypoxaemia in children with acute lower respiratory infection.\nTo determine the prevalence of hypoxaemia in children aged under 5 years suffering acute lower respiratory infections (ALRI), the risk factors for hypoxaemia in children under 5 years of age with ALRI, and the association of hypoxaemia with an increased risk of dying in children of the same age ...'}
-```
-
-Elementele unui streamed dataset pot fi procesate din mers folosind `IterableDataset.map()`, ceea ce este util în timpul antrenării dacă aveți nevoie să tokenizeți inputurile. Procesarea se face exact la fel ca și în [Capitolul 3](/course/chapter3), cu singura deosebire fiind că rezultatele sunt returnate una câte una:
-
-```py
-from transformers import AutoTokenizer
-
-tokenizer = AutoTokenizer.from_pretrained("distilbert-base-uncased")
-tokenized_dataset = pubmed_dataset_streamed.map(lambda x: tokenizer(x["text"]))
-next(iter(tokenized_dataset))
-```
-
-```python out
-{'input_ids': [101, 4958, 5178, 4328, 6779, ...], 'attention_mask': [1, 1, 1, 1, 1, ...]}
-```
-
-<Tip>
-
-💡 Pentru a accelera tokenizarea cu streaming puteți seta `batched=True`, ca și în secțiunea precedentă. Acest lucru va procesa exemplele, batch cu batch; dimensiunea implicită a batchului este de 1,000 și poate fi specificată cu argumentul `batch_size`.
-
-</Tip>
-
-De asemenea, puteți amesteca un streamed dataset utilizând `IterableDataset.shuffle()`, dar față de `Dataset.shuffle()` acest lucru va amesteca doar elementele dintr-un `buffer_size` predefinit:
-
-```py
-shuffled_dataset = pubmed_dataset_streamed.shuffle(buffer_size=10_000, seed=42)
-next(iter(shuffled_dataset))
-```
-
-```python out
-{'meta': {'pmid': 11410799, 'language': 'eng'},
- 'text': 'Randomized study of dose or schedule modification of granulocyte colony-stimulating factor in platinum-based chemotherapy for elderly patients with lung cancer ...'}
-```
-
-În acest exemplu, am selectat un exemplu aleatoriu din primele 10,000 exemple din buffer. Odată ce un exemplu este accesat, locul lui în buffer este completat cu următorul exemplu din corpus (adica exemplarul 10,001 în cazul de mai sus). Puteți selecta elemente dintr-un streamed dataset utilizând funcțiile `IterableDataset.take()` și `IterableDataset.skip()`, care acționează în mod similar cu `Dataset.select()`. De exemplu, pentru a selecta primele 5 exemple din PubMed Abstracts dataset putem face următorul lucru:
-
-```py
-dataset_head = pubmed_dataset_streamed.take(5)
-list(dataset_head)
-```
-
-```python out
-[{'meta': {'pmid': 11409574, 'language': 'eng'},
-  'text': 'Epidemiology of hypoxaemia in children with acute lower respiratory infection ...'},
- {'meta': {'pmid': 11409575, 'language': 'eng'},
-  'text': 'Clinical signs of hypoxaemia in children with acute lower respiratory infection: indicators of oxygen therapy ...'},
- {'meta': {'pmid': 11409576, 'language': 'eng'},
-  'text': "Hypoxaemia in children with severe pneumonia in Papua New Guinea ..."},
- {'meta': {'pmid': 11409577, 'language': 'eng'},
-  'text': 'Oxygen concentrators and cylinders ...'},
- {'meta': {'pmid': 11409578, 'language': 'eng'},
-  'text': 'Oxygen supply in rural africa: a personal experience ...'}]
-```
-
-În mod similar puteți utiliza funcția `IterableDataset.skip()` pentru a crea splituri de antrenare și validare dintr-un set de date amestecat astfel:
-
-```py
-# Săriți primele 1,000 exemple și includeți restul în setul de antrenare
-train_dataset = shuffled_dataset.skip(1000)
-# Luați primele 1,000 de exemple pentru setul de validare
-validation_dataset = shuffled_dataset.take(1000)
-```
-
-Hai să terminăm explorarea streamingului asupra datasetului cu o aplicație comună: combinarea multiplelor dataseturi împreună pentru a crea un singur corpus. 🤗 Datasets oferă o funcție `interleave_datasets()` care convertește o listă de obiecte `IterableDataset` într-un singur `IterableDataset`, unde elementele noului datasetsunt obținute prin alternarea între exemplele sursă. Această funcție este utilă, în special atunci când încercați să combinați dataseturi mari, ca exemplu vom face stream al subsetul FreeLaw din Pile, care reprezintă un dataset de 51 GB de opinii juridice din instanțe din SUA:
-
-```py
-law_dataset_streamed = load_dataset(
-    "json",
-    data_files="https://the-eye.eu/public/AI/pile_preliminary_components/FreeLaw_Opinions.jsonl.zst",
-    split="train",
-    streaming=True,
-)
-next(iter(law_dataset_streamed))
-```
-
-```python out
-{'meta': {'case_ID': '110921.json',
-  'case_jurisdiction': 'scotus.tar.gz',
-  'date_created': '2010-04-28T17:12:49Z'},
- 'text': '\n461 U.S. 238 (1983)\nOLIM ET AL.\nv.\nWAKINEKONA\nNo. 81-1581.\nSupreme Court of United States.\nArgued January 19, 1983.\nDecided April 26, 1983.\nCERTIORARI TO THE UNITED STATES COURT OF APPEALS FOR THE NINTH CIRCUIT\n*239 Michael A. Lilly, First Deputy Attorney General of Hawaii, argued the cause for petitioners. With him on the brief was James H. Dannenberg, Deputy Attorney General...'}
-```
-
-Această dataset este suficient de mare încât să pună presiune asupra RAM-ului a majorității laptopurilor, dar am reușit să îl încarcăm și să îl accesăm fără să ne facem griji. Acum hai să combinăm exemplele din dataseturile FreeLaw și PubMed Abstracts cu funcția `interleave_datasets()`:
-
-```py
-from itertools import islice
-from datasets import interleave_datasets
-
-combined_dataset = interleave_datasets([pubmed_dataset_streamed, law_dataset_streamed])
-list(islice(combined_dataset, 2))
-```
-
-```python out
-[{'meta': {'pmid': 11409574, 'language': 'eng'},
-  'text': 'Epidemiology of hypoxaemia in children with acute lower respiratory infection ...'},
- {'meta': {'case_ID': '110921.json',
-   'case_jurisdiction': 'scotus.tar.gz',
-   'date_created': '2010-04-28T17:12:49Z'},
-  'text': '\n461 U.S. 238 (1983)\nOLIM ET AL.\nv.\nWAKINEKONA\nNo. 81-1581.\nSupreme Court of United States.\nArgued January 19, 1983.\nDecided April 26, 1983.\nCERTIORARI TO THE UNITED STATES COURT OF APPEALS FOR THE NINTH CIRCUIT\n*239 Michael A. Lilly, First Deputy Attorney General of Hawaii, argued the cause for petitioners. With him on the brief was James H. Dannenberg, Deputy Attorney General...'}]
-```
-
-Aici am folosit funcția `islice()` din modulul Python `itertools` pentru a selecta primele două exemple din datasetul combinat, și putem vedea că acestea corespund primelor exemple din fiecare dintre cele două dataseturi originale.
-
-În final, dacă doriți să faceți streaming la Pile în întregime (825 GB), puteți rula toate fișierele pregătite după în acest mod:
-
-```py
-base_url = "https://the-eye.eu/public/AI/pile/"
-data_files = {
-    "train": [base_url + "train/" + f"{idx:02d}.jsonl.zst" for idx in range(30)],
-    "validation": base_url + "val.jsonl.zst",
-    "test": base_url + "test.jsonl.zst",
-}
-pile_dataset = load_dataset("json", data_files=data_files, streaming=True)
-next(iter(pile_dataset["train"]))
-```
-
-```python out
-{'meta': {'pile_set_name': 'Pile-CC'},
- 'text': 'It is done, and submitted. You can play “Survival of the Tastiest” on Android, and on the web...'}
-```
-
-<Tip>
-
-✏️ **Încercați!** Utilizați unul dintre cele mari corpusuri Common Crawl ca [`mc4`](https://huggingface.co/datasets/mc4) sau [`oscar`](https://huggingface.co/datasets/oscar) pentru a crea un streaming dataset multilingv care reprezintă proporția limbii vorbite într-o țară aleasă de tine. De exemplu, cele patru limbi naționale din Elveția sunt germana, franceza, italiana și romansha, așadar puteți încerca să creați un corpus elvețian prin samplingul subseturilor Oscar în funcție de proporția lor vorbită.
-
-</Tip>
-
-Acum aveți toate instrumentele necesare pentru a încărca și procesa dataseturi de orice formă și dimensiune – dar, din păcate, va veni un moment în care veți trebui să creați voi înșivă un dataset pentru a rezolva problema pe care o aveți. Acesta este subiectul următoarei secțiuni!
diff --git a/chapters/ro/chapter5/5.mdx b/chapters/ro/chapter5/5.mdx
deleted file mode 100644
index b200af7d8..000000000
--- a/chapters/ro/chapter5/5.mdx
+++ /dev/null
@@ -1,404 +0,0 @@
-# Crearea propriului dataset[[creating-your-own-dataset]]
-
-<CourseFloatingBanner chapter={5}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter5/section5.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter5/section5.ipynb"},
-]} />
-
-Uneori, datasetul necesar pentru a construi o aplicație NLP nu există, astfel încât veți trebui să-l creați singuri. În această secțiune vom arăta cum să creați un corpus de [GitHub issues](https://github.com/features/issues/), care sunt utilizate în mod obișnuit pentru a urmări erorile sau feature-urile din repositoriurile GitHub. Acest corpus poate fi folosit pentru diverse scopuri, inclusiv:
-
-* Explorarea timpului necesar pentru închiderea unor issues deschise sau pull requesturi
-* Antrenarea unui _multilabel classifier_ care poate eticheta issue-urile cu metadate pe baza descrierii issue-urilor (de exemplu, "bug", "enhancement" sau "question")
-* Crearea unui motor de căutare semantică pentru a găsi care issues se potrivesc query-ului utilizatorului
-
-În această secțiune ne vom focusa pe crearea corpusului, și în următoarea vom aborda aplicația motorului de căutare semantic. Pentru a păstra lucrurile meta, vom folosi issue-urile GitHub asociate cu un proiect open source popular: 🤗 Datasets! Să vedem cum să obținem datele și să explorăm informațiile conținute în aceste issue-uri.
-
-## Obținerea datelor[[getting-the-data]]
-
-Puteți găsi toate issue-urile din 🤗 Datasets navigând către tabul [Issues](https://github.com/huggingface/datasets/issues) al repositorului. Așa cum arată următorul screenshot, la momentul scrierii acestui text existau 331 de issues deschise și 668 închise.
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter5/datasets-issues.png" alt="Issue-urile GitHub asociate cu 🤗 Datasets." width="80%"/>
-</div>
-
-Dacă ați da clic pe una dintre aceste issue-uri veți găsi că aceasta conține un titlu, o descriere și un set de labeluri care caracterizează issue-ul. Un exemplu este prezentat în screenshotul următor.
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter5/datasets-issues-single.png" alt="Un issue tipic în GitHub din repositoriul 🤗 Datasets." width="80%"/>
-</div>
-
-Pentru a descărca toate issue-urile din repositoriu, vom folosi [GitHub REST API](https://docs.github.com/en/rest) pentru a enumera [`Issues` endpoint](https://docs.github.com/en/rest/reference/issues#list-repository-issues). Aceast endpoint returnează o listă de obiecte JSON, cu fiecare obiect conținând un număr mare de câmpuri care includ titlul și descrierea precum și metadata despre starea issue-ului și așa mai departe.
-
-Un mod convenabil de descărcare a issue-urilor este prin utilizarea librăriei `requests`, care este modalitatea standard pentru a face cereri HTTP în Python. Puteți instala libraria rulând comanda:
-
-```python
-!pip install requests
-```
-
-Odată cu instalarea librariei, puteți face cereri GET la `Issues` endpoint prin invocarea funcției `requests.get()`. De exemplu, puteți rula următorul cod pentru a obține primul issue din prima pagină:
-
-```py
-import requests
-
-url = "https://api.github.com/repos/huggingface/datasets/issues?page=1&per_page=1"
-response = requests.get(url)
-```
-
-Obiectul `response` conține o cantitate mare de informații utile despre requestul efectuat, inclusiv HTTP status code:
-
-```py
-response.status_code
-```
-
-```python out
-200
-```
-
-unde statusul `200` înseamnă că cererea a fost reușită (puteți găsi o listă completă de status coduri [aici](https://en.wikipedia.org/wiki/List_of_HTTP_status_codes)). De ceea ce suntem însă interesați este _payload_, care poate fi accesat în diverse formaturi precum bytes, string sau JSON. Deoarece știm că issue-urile noastre sunt în format JSON, să inspectăm payload-ul astfel:
-
-```py
-response.json()
-```
-
-```python out
-[{'url': 'https://api.github.com/repos/huggingface/datasets/issues/2792',
-  'repository_url': 'https://api.github.com/repos/huggingface/datasets',
-  'labels_url': 'https://api.github.com/repos/huggingface/datasets/issues/2792/labels{/name}',
-  'comments_url': 'https://api.github.com/repos/huggingface/datasets/issues/2792/comments',
-  'events_url': 'https://api.github.com/repos/huggingface/datasets/issues/2792/events',
-  'html_url': 'https://github.com/huggingface/datasets/pull/2792',
-  'id': 968650274,
-  'node_id': 'MDExOlB1bGxSZXF1ZXN0NzEwNzUyMjc0',
-  'number': 2792,
-  'title': 'Update GooAQ',
-  'user': {'login': 'bhavitvyamalik',
-   'id': 19718818,
-   'node_id': 'MDQ6VXNlcjE5NzE4ODE4',
-   'avatar_url': 'https://avatars.githubusercontent.com/u/19718818?v=4',
-   'gravatar_id': '',
-   'url': 'https://api.github.com/users/bhavitvyamalik',
-   'html_url': 'https://github.com/bhavitvyamalik',
-   'followers_url': 'https://api.github.com/users/bhavitvyamalik/followers',
-   'following_url': 'https://api.github.com/users/bhavitvyamalik/following{/other_user}',
-   'gists_url': 'https://api.github.com/users/bhavitvyamalik/gists{/gist_id}',
-   'starred_url': 'https://api.github.com/users/bhavitvyamalik/starred{/owner}{/repo}',
-   'subscriptions_url': 'https://api.github.com/users/bhavitvyamalik/subscriptions',
-   'organizations_url': 'https://api.github.com/users/bhavitvyamalik/orgs',
-   'repos_url': 'https://api.github.com/users/bhavitvyamalik/repos',
-   'events_url': 'https://api.github.com/users/bhavitvyamalik/events{/privacy}',
-   'received_events_url': 'https://api.github.com/users/bhavitvyamalik/received_events',
-   'type': 'User',
-   'site_admin': False},
-  'labels': [],
-  'state': 'open',
-  'locked': False,
-  'assignee': None,
-  'assignees': [],
-  'milestone': None,
-  'comments': 1,
-  'created_at': '2021-08-12T11:40:18Z',
-  'updated_at': '2021-08-12T12:31:17Z',
-  'closed_at': None,
-  'author_association': 'CONTRIBUTOR',
-  'active_lock_reason': None,
-  'pull_request': {'url': 'https://api.github.com/repos/huggingface/datasets/pulls/2792',
-   'html_url': 'https://github.com/huggingface/datasets/pull/2792',
-   'diff_url': 'https://github.com/huggingface/datasets/pull/2792.diff',
-   'patch_url': 'https://github.com/huggingface/datasets/pull/2792.patch'},
-  'body': '[GooAQ](https://github.com/allenai/gooaq) dataset was recently updated after splits were added for the same. This PR contains new updated GooAQ with train/val/test splits and updated README as well.',
-  'performed_via_github_app': None}]
-```
-
-Uau, aceasta e o cantitate mare de informație! Putem vedea câmpuri utile cum ar fi `title`, `body` și `number` care descriu problema, precum și informații despre utilizatorul GitHub care a deschis issue-ul.
-
-<Tip>
-
-✏️ **Încercați!** Faceți clic pe câteva dintre URL-urile din payload-ul JSON de mai sus pentru a vă familiariza cu tipul de informații către care se face referire pentru fiecare GitHub issue.
-
-</Tip>
-
-După cum este descris în [documentația](https://docs.github.com/en/rest/overview/resources-in-the-rest-api#rate-limiting) GitHub, solicitările neautentificate sunt limitate la 60 de solicitări pe oră. Deși puteți crește `per_page` query parameter pentru a reduce numărul de solicitări pe care le faceți, oricum veți atinge limita pentru orice repository care are mai mult de câteva mii de issues. Prin urmare, ar trebui să urmați [instrucțiunile](https://docs.github.com/en/github/authenticating-to-github/creating-a-personal-access-token) GitHub pentru crearea unui _personal access token_ astfel încât să puteți crește limita la 5.000 de solicitări pe oră. Odată ce aveți tokenul, îl puteți include ca parte a request header:
-
-```py
-GITHUB_TOKEN = xxx  # Copy your GitHub token here
-headers = {"Authorization": f"token {GITHUB_TOKEN}"}
-```
-
-<Tip warning={true}>
-
-⚠️ Nu oferiți nimănui un notebook cu `GITHUB_TOKEN` în el . Vă recomandăm să ștergeți ultima celulă odată ce ați executat-o pentru a evita scurgerea accidentală a acestor informații. Chiar mai bine, stocați tokenul într-un fișier *.env* și utilizați biblioteca `python-dotenv` pentru a îl încărca automat ca variabilă de mediu.
-
-</Tip>
-
-Acum că avem tokenul de acces, hai să creăm o funcție care să poată descărca toate issue-urile dintr-un repositoriu GitHub:
-
-```py
-import time
-import math
-from pathlib import Path
-import pandas as pd
-from tqdm.notebook import tqdm
-
-
-def fetch_issues(
-    owner="huggingface",
-    repo="datasets",
-    num_issues=10_000,
-    rate_limit=5_000,
-    issues_path=Path("."),
-):
-    if not issues_path.is_dir():
-        issues_path.mkdir(exist_ok=True)
-
-    batch = []
-    all_issues = []
-    per_page = 100  # Number of issues to return per page
-    num_pages = math.ceil(num_issues / per_page)
-    base_url = "https://api.github.com/repos"
-
-    for page in tqdm(range(num_pages)):
-        # Query with state=all to get both open and closed issues
-        query = f"issues?page={page}&per_page={per_page}&state=all"
-        issues = requests.get(f"{base_url}/{owner}/{repo}/{query}", headers=headers)
-        batch.extend(issues.json())
-
-        if len(batch) > rate_limit and len(all_issues) < num_issues:
-            all_issues.extend(batch)
-            batch = []  # Flush batch for next time period
-            print(f"Reached GitHub rate limit. Sleeping for one hour ...")
-            time.sleep(60 * 60 + 1)
-
-    all_issues.extend(batch)
-    df = pd.DataFrame.from_records(all_issues)
-    df.to_json(f"{issues_path}/{repo}-issues.jsonl", orient="records", lines=True)
-    print(
-        f"Downloaded all the issues for {repo}! Dataset stored at {issues_path}/{repo}-issues.jsonl"
-    )
-```
-
-Acum când apelăm `fetch_issues()` va descărca toate problemele în batch-uri pentru a evita depășirea limitei GitHub pe numărul de solicitări pe oră; rezultatul va fi stocat într-un fișier `_repository_name-issues.jsonl`, unde fiecare linie este un obiect JSON care reprezintă un issue. Mai jos folosim această funcție pentru a obține toate issue-urile de la 🤗 Datasets:
-
-```py
-# În dependență de conexiunea ta la internet, acest lucru poate dura câteva minute...
-fetch_issues()
-```
-
-Odată ce issue-urile sunt descărcate, le putem încărca local utilizând abilitățile noastre dobândite în [secțiunea 2](/course/chapter5/2):
-
-```py
-issues_dataset = load_dataset("json", data_files="datasets-issues.jsonl", split="train")
-issues_dataset
-```
-
-```python out
-Dataset({
-    features: ['url', 'repository_url', 'labels_url', 'comments_url', 'events_url', 'html_url', 'id', 'node_id', 'number', 'title', 'user', 'labels', 'state', 'locked', 'assignee', 'assignees', 'milestone', 'comments', 'created_at', 'updated_at', 'closed_at', 'author_association', 'active_lock_reason', 'pull_request', 'body', 'timeline_url', 'performed_via_github_app'],
-    num_rows: 3019
-})
-```
-
-Great, am creat primul nostru dataset de la zero! Dar de ce sunt mai mult de câteva mii de issue-uri atunci când tabul de issue-uri al repositoriului 🤗 Datasets afișează doar aproximativ 1.000 de issue-uri în total 🤔? Conform descris în [documentația](https://docs.github.com/en/rest/reference/issues#list-issues-assigned-to-the-authenticated-user) GitHub, acest lucru s-a întâmplat pentru că am descărcat și toate pull requesturile:
-
-> GitHub's REST API v3 considers every pull request an issue, but not every issue is a pull request. For this reason, "Issues" endpoints may return both issues and pull requests in the response. You can identify pull requests by the `pull_request` key. Be aware that the `id` of a pull request returned from "Issues" endpoints will be an issue id.
-
-Deoarece conținutul issue-urilor și pull requesturilor este destul de diferit, hai să preprocesăm puțin datele pentru a ne permite să le diferențiem între ele.
-
-## Curățarea datelor[[cleaning-up-the-data]]
-
-Fragmentul de mai sus din documentația GitHub ne spune că coloana `pull_request` poate fi utilizată pentru a diferenția între issues și pull requests. Să analizăm un sampple aleatoriu pentru a vedea care este diferența. Așa cum am făcut în [secțiunea 3](/course/chapter5/3), vom înlănțui `Dataset.shuffle()` și `Dataset.select()` pentru a crea un sample aleatoriu și apoi vom împerechea coloanele `html_url` și `pull_request` pentru a putea compara diversele URL-uri:
-
-```py
-sample = issues_dataset.shuffle(seed=666).select(range(3))
-
-# Print out the URL and pull request entries
-for url, pr in zip(sample["html_url"], sample["pull_request"]):
-    print(f">> URL: {url}")
-    print(f">> Pull request: {pr}\n")
-```
-
-```python out
->> URL: https://github.com/huggingface/datasets/pull/850
->> Pull request: {'url': 'https://api.github.com/repos/huggingface/datasets/pulls/850', 'html_url': 'https://github.com/huggingface/datasets/pull/850', 'diff_url': 'https://github.com/huggingface/datasets/pull/850.diff', 'patch_url': 'https://github.com/huggingface/datasets/pull/850.patch'}
-
->> URL: https://github.com/huggingface/datasets/issues/2773
->> Pull request: None
-
->> URL: https://github.com/huggingface/datasets/pull/783
->> Pull request: {'url': 'https://api.github.com/repos/huggingface/datasets/pulls/783', 'html_url': 'https://github.com/huggingface/datasets/pull/783', 'diff_url': 'https://github.com/huggingface/datasets/pull/783.diff', 'patch_url': 'https://github.com/huggingface/datasets/pull/783.patch'}
-```
-
-Aici putem vedea că fiecare pull request este asociat cu diverse URL-uri, în timp ce issue-urile obișnuite au o intrare `None`. Putem utiliza această distincție pentru a crea o nouă coloană `is_pull_request` care verifică dacă câmpul `pull_request` este `None` sau nu:
-
-```py
-issues_dataset = issues_dataset.map(
-    lambda x: {"is_pull_request": False if x["pull_request"] is None else True}
-)
-```
-
-<Tip>
-
-✏️ **Încercați!** Calculați timpul mediu necesar pentru închiderea issue-urilor în Datasets. Vă poate fi utilă funcția `Dataset.filter()` pentru a filtra pull requesturile și issue-urile deschise, și puteți utiliza funcția `Dataset.set_format()` pentru a converti datasetul într-un `DataFrame` astfel încât să puteți manipula cu ușurință timestampurile `created_at` și `closed_at`. Pentru puncte bonus, calculați timpul mediu necesar pentru închiderea pull requesturilor.
-
-</Tip>
-
-Deși am putea continua să curățăm datasetul prin eliminarea sau redenumirea unor coloane, este, în general, o practică bună să păstrăm datasetul cât mai "raw" posibil la acest stadiu, astfel încât să poată fi utilizat ușor în multiple aplicații.
-
-Înainte de a încărca datasetul în Hugging Face Hub, trebuie să rezolvăm chestie care lipsește din el: comentariile asociate fiecărui issue și pull request. Le vom adăuga în continuare cu-- ați ghicit -- GitHub REST API!
-
-## Îmbunătățirea datasetului[[augmenting-the-dataset]]
-
-După cum se vede în următorul screenshot, comentariile asociate unui issue sau pull request oferă o sursă bogată de informații, în special dacă suntem interesați să construim un motor de căutare pentru a răspunde la întrebările utilizatorilor despre bibliotecă.
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter5/datasets-issues-comment.png" alt="Comentariile asociate unei probleme despre 🤗 Datasets." width="80%"/>
-</div>
-
-GitHub REST API oferă un endpoint [`Comments`](https://docs.github.com/en/rest/reference/issues#list-issue-comments) care returnează toate comentariile asociate numărului problemei. Să testăm endpointul pentru a vedea ce returnează:
-
-```py
-issue_number = 2792
-url = f"https://api.github.com/repos/huggingface/datasets/issues/{issue_number}/comments"
-response = requests.get(url, headers=headers)
-response.json()
-```
-
-```python out
-[{'url': 'https://api.github.com/repos/huggingface/datasets/issues/comments/897594128',
-  'html_url': 'https://github.com/huggingface/datasets/pull/2792#issuecomment-897594128',
-  'issue_url': 'https://api.github.com/repos/huggingface/datasets/issues/2792',
-  'id': 897594128,
-  'node_id': 'IC_kwDODunzps41gDMQ',
-  'user': {'login': 'bhavitvyamalik',
-   'id': 19718818,
-   'node_id': 'MDQ6VXNlcjE5NzE4ODE4',
-   'avatar_url': 'https://avatars.githubusercontent.com/u/19718818?v=4',
-   'gravatar_id': '',
-   'url': 'https://api.github.com/users/bhavitvyamalik',
-   'html_url': 'https://github.com/bhavitvyamalik',
-   'followers_url': 'https://api.github.com/users/bhavitvyamalik/followers',
-   'following_url': 'https://api.github.com/users/bhavitvyamalik/following{/other_user}',
-   'gists_url': 'https://api.github.com/users/bhavitvyamalik/gists{/gist_id}',
-   'starred_url': 'https://api.github.com/users/bhavitvyamalik/starred{/owner}{/repo}',
-   'subscriptions_url': 'https://api.github.com/users/bhavitvyamalik/subscriptions',
-   'organizations_url': 'https://api.github.com/users/bhavitvyamalik/orgs',
-   'repos_url': 'https://api.github.com/users/bhavitvyamalik/repos',
-   'events_url': 'https://api.github.com/users/bhavitvyamalik/events{/privacy}',
-   'received_events_url': 'https://api.github.com/users/bhavitvyamalik/received_events',
-   'type': 'User',
-   'site_admin': False},
-  'created_at': '2021-08-12T12:21:52Z',
-  'updated_at': '2021-08-12T12:31:17Z',
-  'author_association': 'CONTRIBUTOR',
-  'body': "@albertvillanova my tests are failing here:\r\n```\r\ndataset_name = 'gooaq'\r\n\r\n    def test_load_dataset(self, dataset_name):\r\n        configs = self.dataset_tester.load_all_configs(dataset_name, is_local=True)[:1]\r\n>       self.dataset_tester.check_load_dataset(dataset_name, configs, is_local=True, use_local_dummy_data=True)\r\n\r\ntests/test_dataset_common.py:234: \r\n_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ \r\ntests/test_dataset_common.py:187: in check_load_dataset\r\n    self.parent.assertTrue(len(dataset[split]) > 0)\r\nE   AssertionError: False is not true\r\n```\r\nWhen I try loading dataset on local machine it works fine. Any suggestions on how can I avoid this error?",
-  'performed_via_github_app': None}]
-```
-
-Putem vedea că comentariul este stocat în câmpul `body`, așa că putem scrie o funcție simplă care returnează toate comentariile asociate unei probleme prin extragerea conținutului `body` pentru fiecare element în `response.json()`:
-
-```py
-def get_comments(issue_number):
-    url = f"https://api.github.com/repos/huggingface/datasets/issues/{issue_number}/comments"
-    response = requests.get(url, headers=headers)
-    return [r["body"] for r in response.json()]
-
-
-# Testăm dacă funcția lucrează cum ne dorim
-get_comments(2792)
-```
-
-```python out
-["@albertvillanova my tests are failing here:\r\n```\r\ndataset_name = 'gooaq'\r\n\r\n    def test_load_dataset(self, dataset_name):\r\n        configs = self.dataset_tester.load_all_configs(dataset_name, is_local=True)[:1]\r\n>       self.dataset_tester.check_load_dataset(dataset_name, configs, is_local=True, use_local_dummy_data=True)\r\n\r\ntests/test_dataset_common.py:234: \r\n_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ \r\ntests/test_dataset_common.py:187: in check_load_dataset\r\n    self.parent.assertTrue(len(dataset[split]) > 0)\r\nE   AssertionError: False is not true\r\n```\r\nWhen I try loading dataset on local machine it works fine. Any suggestions on how can I avoid this error?"]
-```
-
-Arată bine. Acum hai să folosim `Dataset.map()` pentru a adăuga noi coloane `comments` fiecărui issue în datasetul nostru:
-
-```py
-# Depending on your internet connection, this can take a few minutes...
-issues_with_comments_dataset = issues_dataset.map(
-    lambda x: {"comments": get_comments(x["number"])}
-)
-```
-
-Ultimul pas este să facem push datasetului nostru pe Hub. Să vedem cum putem face asta.
-
-## Încărcarea datasetului pe Hugging Face Hub[[uploading-the-dataset-to-the-hugging-face-hub]]
-
-<Youtube id="HaN6qCr_Afc"/.”
-
-Acum că avem datasetul nostru augmentat, este timpul să îi facem push pe Hub pentru a-l oferi comunității! Încărcarea unui dataset este foarte simplu: la fel ca modelele și tokenizerrii din 🤗 Transformers, putem utiliza o metodă `push_to_hub()` pentru a face push unui dataset. Pentru a face asta, avem nevoie de un token de autentificare, care poate fi obținut prin autentificarea pe Hugging Face Hub cu funcția `notebook_login()`:
-
-```py
-from huggingface_hub import notebook_login
-
-notebook_login()
-```
-
-Acest lucru va crea un widget unde poți să scrii usernameul și parola ta, iar un API token va fi salvat în *~/.huggingface/token*. Dacă rulezi codeul într-un terminal, te poți loga cu ajutor CLI: 
-This will create a widget where you can enter your username and password, and an API token will be saved in *~/.huggingface/token*. If you're running the code in a terminal, you can log in via the CLI instead:
-
-```bash
-huggingface-cli login
-```
-O dată ce ai făcut asta, putem încărca datasetul rulând:
-
-```py
-issues_with_comments_dataset.push_to_hub("github-issues")
-```
-
-De acum, orice poate să descarce datasetul, utilizând `load_dataset()` cu ID-ul repositoriului ca `path` argument:
-
-```py
-remote_dataset = load_dataset("lewtun/github-issues", split="train")
-remote_dataset
-```
-
-```python out
-Dataset({
-    features: ['url', 'repository_url', 'labels_url', 'comments_url', 'events_url', 'html_url', 'id', 'node_id', 'number', 'title', 'user', 'labels', 'state', 'locked', 'assignee', 'assignees', 'milestone', 'comments', 'created_at', 'updated_at', 'closed_at', 'author_association', 'active_lock_reason', 'pull_request', 'body', 'performed_via_github_app', 'is_pull_request'],
-    num_rows: 2855
-})
-```
-
-Cool, am încărcat datasetul nostru pe Hub și acum este disponibil pentru alții să îl utilizeze! Mai este doar un lucru important de făcut: adăugarea unui _dataset card_ care explică cum a fost creat corpusul și oferă alte informații utile pentru comunitate.
-
-<Tip>
-
-💡 De asemenea, puteți încărca un dataset pe Hugging Face Hub direct din terminal utilizând `huggingface-cli` și puțină magie Git. Consultați [ghidul 🤗 Datasets](https://huggingface.co/docs/datasets/share#share-a-dataset-using-the-cli) pentru detalii despre cum puteți face asta.
-
-</Tip>
-
-## Crearea unei dataset card[[creating-a-dataset-card]]
-
-Datasetiroșe bine documentate sunt mai probabil să fie utile altora (inclusiv ție din viitor!), deoarece furnizează contextul pentru a permite utilizatorilor să decidă dacă datasetul este relevant pentru taskul lor și să evalueze eventualele biasuri sau riscurile asociate cu utilizarea datasetului.
-
-Pe Hugging Face Hub, această informație este stocată în fișierul *README.md* al fiecărui dataset repository. Sunt doi pași principali pe care trebuie să îi efectuați înainte de a crea acest fișier:
-
-1. Utilizați aplicația [`datasets-tagging`](https://huggingface.co/datasets/tagging/) pentru a crea etichete de metadate în format YAML. Aceste taguri sunt utilizate pentru o varietate de funcționalități de căutare pe Hugging Face Hub și asigură că datasetul poate fi găsit ușor de membrii comunității. Deoarece am creat un dataset custom aici, veți fi nevoiți să clonați repositoriul `datasets-tagging` și să rulați aplicația local. Iată cum arată interfața:
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter5/datasets-tagger.png" alt="Interfața `datasets-tagging`." width="80%"/>
-</div>
-
-2. Citiți [ghidul 🤗 Datasets](https://github.com/huggingface/datasets/blob/master/templates/README_guide.md) despre crearea de dataset cards informative și utilizați-l ca șablon.
-
-Puteți crea fișierul *README.md* direct pe Hub și puteți găsi un template pentru dataset card în repositoriul `lewtun/github-issues`. Un screenshot a dataset card completată este afișată mai jos.
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter5/dataset-card.png" alt="Dataset card." width="80%"/>
-</div>
-
-<Tip>
-
-✏️ **Încercați!** Utilizați aplicația `dataset-tagging` și [ghidul 🤗 Datasets](https://github.com/huggingface/datasets/blob/master/templates/README_guide.md) pentru a completa fișierul *README.md* pentru datasetul de probleme GitHub.
-
-</Tip>
-
-Astfel, am văzut în această secțiune că crearea unui dataset bun poate fi destul de complicată, dar, spre norocul nsotru, încărcarea și oferirea acestuia comunității nu sunt. În secțiunea următoare, vom utiliza datasetul nou pentru a crea un motor de căutare semantic cu 🤗 Datasets care poate să asocieze întrebări cu cele mai relevante issues și comentarii.
-
-<Tip>
-
-✏️ **Încercați!** Treceți prin pașii pe care i-am făcut în această secțiune pentru a crea un dataset de issues GitHub pentru o biblioteca open source care îți place(alegeți altceva înafară de 🤗 Datasets, desigur!). Pentru puncte bonus, faceți fine-tune unui multilabel classifier pentru a prezice tagurile prezente în câmpul `labels`.
-
-</Tip>
diff --git a/chapters/ro/chapter5/6.mdx b/chapters/ro/chapter5/6.mdx
deleted file mode 100644
index 7587c5ef5..000000000
--- a/chapters/ro/chapter5/6.mdx
+++ /dev/null
@@ -1,517 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Căutare semantică cu FAISS[[semantic-search-with-faiss]]
-
-{#if fw === 'pt'}
-
-<CourseFloatingBanner chapter={5}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter5/section6_pt.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter5/section6_pt.ipynb"},
-]} />
-
-{:else}
-
-<CourseFloatingBanner chapter={5}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter5/section6_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter5/section6_tf.ipynb"},
-]} />
-
-{/if}
-
-În [secțiunea 5](/course/chapter5/5), am creat un dataset cu issues și comentarii din repositoriul 🤗 Datasets. În această secțiune, vom utiliza aceste informații pentru a construi un motor de căutare care ne poate ajuta să găsim răspunsurile la  cele mai importante cele mai importante întrebări despre bibliotecă!
-
-<Youtube id="OATCgQtNX2o"/>
-
-## Utilizarea embeddings pentru căutare semantică[[using-embeddings-for-semantic-search]]
-
-După cum am văzut în [Capitolul 1](/course/chapter1), Transformer-based language models reprezintă fiecare token într-un fragment de text ca un _embedding vector_. S-a dovedit că se poate face "pool" embeddingurilor individuale pentru a crea o reprezentare vectorială pentru fraze întregi, paragrafe sau (în anumite cazuri) documente. Aceste embeddings pot fi apoi utilizate pentru a găsi documente similare în corpus prin calcularea dot-product similarity (sau a unei alte metrice de similaritate) între fiecare embedding și returnarea documentelor cu cea mai mare suprapunere.
-
-În această secțiune, vom utiliza embeddings pentru a dezvolta un motor de căutare semantică. Aceste motoare de căutare oferă mai multe avantaje față de abordările convenționale bazate pe căutarea de cuvinte cheie într-un query cu documente.
-
-<div class="flex justify-center">
-<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter5/semantic-search.svg" alt="Căutare semantică."/>
-<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter5/semantic-search-dark.svg" alt="Căutare semantică."/>
-</div>
-
-## Încărcarea și pregătirea datasetului[[loading-and-preparing-the-dataset]]
-
-Prima lucru pe care trebuie să îl facem este să descărcăm datasetul nostru cu GitHub issues, așa că folosim funcția `load_dataset()` ca de obicei:
-
-```py
-from datasets import load_dataset
-
-issues_dataset = load_dataset("lewtun/github-issues", split="train")
-issues_dataset
-```
-
-```python out
-Dataset({
-    features: ['url', 'repository_url', 'labels_url', 'comments_url', 'events_url', 'html_url', 'id', 'node_id', 'number', 'title', 'user', 'labels', 'state', 'locked', 'assignee', 'assignees', 'milestone', 'comments', 'created_at', 'updated_at', 'closed_at', 'author_association', 'active_lock_reason', 'pull_request', 'body', 'performed_via_github_app', 'is_pull_request'],
-    num_rows: 2855
-})
-```
-
-Aici am specificat splitul default `train` în `load_dataset()`, astfel încât returnează un `Dataset` în loc de `DatasetDict`. Primul lucru care treubuie făcut este să filtrăm pull requesturile, deoarece acestea rareori tind să fie utilizate pentru a răspunde la întrebările utilizatorilor și vor introduce noise în motorul nostru de căutare. Așa cum ar trebuie deja să știți, putem utiliza funcția `Dataset.filter()` pentru a exclude aceste rânduri din datasetul nostru. În timp ce suntem aici, putem să filtrăm și rândurile fără comentari, deoarece acestea nu oferă niciun răspuns la întrebările utilizatorilor:
-
-```py
-issues_dataset = issues_dataset.filter(
-    lambda x: (x["is_pull_request"] == False și len(x["comments"]) > 0)
-)
-issues_dataset
-```
-
-```python out
-Dataset({
-    caracteristici: ['url', 'repository_url', 'labels_url', 'comments_url', 'events_url', 'html_url', 'id', 'node_id', 'number', 'title', 'user', 'labels', 'state', 'locked', 'assignee', 'assignees', 'milestone', 'comments', 'created_at', 'updated_at', 'closed_at', 'author_association', 'active_lock_reason', 'pull_request', 'body', 'performed_via_github_app', 'is_pull_request'],
-    num_rows: 771
-})
-```
-
-Putem vedea că există multe coloane în datasetul nostru, majoritatea dintre care nu sunt necesare pentru a construi motorul nostru de căutare. Din perspectiva căutării, cele mai informative coloane sunt `title`, `body` și `comments`, în timp ce `html_url` ne oferă un link înapoi la problema sursă. Hai să utilizăm funcția `Dataset.remove_columns()` pentru a elimina restul:
-
-```py
-columns = issues_dataset.column_names
-columns_to_keep = ["title", "body", "html_url", "comments"]
-columns_to_remove = set(columns_to_keep).symmetric_difference(columns)
-issues_dataset = issues_dataset.remove_columns(columns_to_remove)
-issues_dataset
-```
-
-```python out
-Dataset({
-    features: ['html_url', 'title', 'comments', 'body'],
-    num_rows: 771
-})
-```
-
-Pentru a crea embeddedurile noastre, vom completa fiecare comentariu cu titlul și body-ul problemei, deoarece aceste câmpuri adesea includ informații contextuale utile. Deoarece coloana noastră `comments` este în prezent o listă de comentarii pentru fiecare issue, trebuie să "explodăm" coloana, astfel încât fiecare rând să fie format dintr-un tuple `(html_url, title, body, comment)`. În Pandas, putem face acest lucru cu funcția [`DataFrame.explode()`](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.explode.html), care creează un rând nou pentru fiecare element dintr-o coloană asemănătoare cu o listă, în timp ce copiază toate celelalte valori ale coloanelor. Pentru a vedea acest lucru în acțiune, să trecem la formatul pandas `DataFrame` main întâi:
-
-```py
-issues_dataset.set_format("pandas")
-df = issues_dataset[:]
-```
-
-Dacă inspectăm primul rând din acest `DataFrame`, putem vedea că există patru comentarii asociate acestei probleme:
-
-```py
-df["comments"][0].tolist()
-```
-
-```python out
-['the bug code locate in ：\r\n    if data_args.task_name is not None:\r\n        # Downloading and loading a dataset from the hub.\r\n        datasets = load_dataset("glue", data_args.task_name, cache_dir=model_args.cache_dir)',
- 'Hi @jinec,\r\n\r\nFrom time to time we get this kind of `ConnectionError` coming from the github.com website: https://raw.githubusercontent.com\r\n\r\nNormally, it should work if you wait a little and then retry.\r\n\r\nCould you please confirm if the problem persists?',
- 'cannot connect，even by Web browser，please check that  there is some  problems。',
- 'I can access https://raw.githubusercontent.com/huggingface/datasets/1.7.0/datasets/glue/glue.py without problem...']
-```
-
-Când facem explode `df`, ne așteptăm să obținem un rând pentru fiecare dintre aceste comentarii. Haideți să verificăm dacă ăsta e cazul:
-
-```py
-comments_df = df.explode("comments", ignore_index=True)
-comments_df.head(4)
-```
-
-<table border="1" class="dataframe" style="table-layout: fixed; word-wrap:break-word; width: 100%;">
-  <thead>
-    <tr style="text-align: right;">
-      <th></th>
-      <th>html_url</th>
-      <th>title</th>
-      <th>comments</th>
-      <th>body</th>
-    </tr>
-  </thead>
-  <tbody>
-    <tr>
-      <th>0</th>
-      <td>https://github.com/huggingface/datasets/issues/2787</td>
-      <td>ConnectionError: Couldn't reach https://raw.githubusercontent.com</td>
-      <td>the bug code locate in ：\r\n    if data_args.task_name is not None...</td>
-      <td>Hello,\r\nI am trying to run run_glue.py and it gives me this error...</td>
-    </tr>
-    <tr>
-      <th>1</th>
-      <td>https://github.com/huggingface/datasets/issues/2787</td>
-      <td>ConnectionError: Couldn't reach https://raw.githubusercontent.com</td>
-      <td>Hi @jinec,\r\n\r\nFrom time to time we get this kind of `ConnectionError` coming from the github.com website: https://raw.githubusercontent.com...</td>
-      <td>Hello,\r\nI am trying to run run_glue.py and it gives me this error...</td>
-    </tr>
-    <tr>
-      <th>2</th>
-      <td>https://github.com/huggingface/datasets/issues/2787</td>
-      <td>ConnectionError: Couldn't reach https://raw.githubusercontent.com</td>
-      <td>cannot connect，even by Web browser，please check that  there is some  problems。</td>
-      <td>Hello,\r\nI am trying to run run_glue.py and it gives me this error...</td>
-    </tr>
-    <tr>
-      <th>3</th>
-      <td>https://github.com/huggingface/datasets/issues/2787</td>
-      <td>ConnectionError: Couldn't reach https://raw.githubusercontent.com</td>
-      <td>I can access https://raw.githubusercontent.com/huggingface/datasets/1.7.0/datasets/glue/glue.py without problem...</td>
-      <td>Hello,\r\nI am trying to run run_glue.py and it gives me this error...</td>
-    </tr>
-  </tbody>
-</table>
-
-Great, putem vedea că rândurile au fost reproduse, cu coloanele `comments` incluzând și comentariile individuale. Acum că am terminat cu Pandas, noi putem să schimăm rapid înapoi la un `Dataset` înărcând `DataFrame` în memorie:
-
-```py
-from datasets import Dataset
-
-comments_dataset = Dataset.from_pandas(comments_df)
-comments_dataset
-```
-
-```python out
-Dataset({
-    features: ['html_url', 'title', 'comments', 'body'],
-    num_rows: 2842
-})
-```
-
-Okay, acest lucru ne-a oferit câteva mii de comentarii cu care să lucrăm!
-
-
-<Tip>
-
-✏️ **Încercați!** Vezi dacă poți utiliza `Dataset.map()` pentru a exploda coloana `comments` din `issues_dataset` _fără_ a recurge la utilizarea Pandas. Acest lucru este puțin dificil; s-ar putea să găsiți utilă secțiunea ["Mapping batch"](https://huggingface.co/docs/datasets/about_map_batch#batch-mapping) din documentația 🤗 Datasets pentru această sarcină.
-
-</Tip>
-
-Acum că avem un singur comentariu pe rând, să creăm o nouă coloană `comments_length` care conține numărul de cuvinte din fiecare comentariu:
-
-```py
-comments_dataset = comments_dataset.map(
-    lambda x: {"comment_length": len(x["comments"].split())}
-)
-```
-
-Putem utiliza această nouă coloană pentru a filtra comentariile scurte, care de obicei includ lucruri precum "cc @lewtun" sau "Mulțumesc!" care nu sunt relevante pentru motorul nostru de căutare. Nu există un număr precis care trebuie selectat pentru filtru, dar aproximativ 15 cuvinte pare a fi un bun punct de plecare:
-
-```py
-comments_dataset = comments_dataset.filter(lambda x: x["comment_length"] > 15)
-comments_dataset
-```
-
-```python out
-Dataset({
-    features: ['html_url', 'title', 'comments', 'body', 'comment_length'],
-    num_rows: 2098
-})
-```
-
-După ce am curățat puțin setul nostru de date, putem să concatenăm titlul, descrirea și comentariile problemei împreună într-o nouă coloană `text`. Ca de obicei, vom scrie o funcție simplă pe care o putem transmite în `Dataset.map()`:
-
-```py
-def concatenate_text(examples):
-    return {
-        "text": examples["title"]
-        + " \n "
-        + examples["body"]
-        + " \n "
-        + examples["comments"]
-    }
-
-
-comments_dataset = comments_dataset.map(concatenate_text)
-```
-
-Suntem în final pregătiți să creăm niște embeddings! Haideți să vedem cum facem acest lucru.
-
-## Crearea embeddings-urilor de text [[creating-text-embeddings]]
-
-Am văzut în [Capitolul 2](/course/chapter2) că putem obține token embeddings prin utilizarea clasei `AutoModel`. Tot ce trebuie să facem este să alegem un checkpoint potrivit pentru a încărca modelul. Din fericire, există o bibliotecă numită `sentence-transformers` care se ocupă de crearea embeddingurilor. Așa cum se descrie în [documentația](https://www.sbert.net/examples/applications/semantic-search/README.html#symmetric-vs-asymmetric-semantic-search) bibliotecii, cazul nostru este un exemplu de _căutare semantică asimetrică_ deoarece avem o întrebare scurtă al cărei răspuns ne-ar plăcea să îl găsim într-un document mai lung, precum un comentariu la un issue. [Tabelul] (https://www.sbert.net/docs/pretrained_models.html#model-overview) util de prezentare a modelului din documentație indică faptul că checkpointul `multi-qa-mpnet-base-dot-v1` are cea mai bună performanță pentru căutarea semantică, așa că îl vom folosi acesta pentru aplicația noastră. De asemenea, vom încărca tokenizer-ul folosind același checkpoint:
-
-{#if fw === 'pt'}
-
-```py
-from transformers import AutoTokenizer, AutoModel
-
-model_ckpt = "sentence-transformers/multi-qa-mpnet-base-dot-v1"
-tokenizer = AutoTokenizer.from_pretrained(model_ckpt)
-model = AutoModel.from_pretrained(model_ckpt)
-```
-
-Pentru a accelera procesul de embedding, este util să punem modelul și inputurile pe un GPU, deci hai să facem asta acum:
-
-```py
-import torch
-
-device = torch.device("cuda")
-model.to(device)
-```
-
-{:else}
-
-```py
-from transformers import AutoTokenizer, TFAutoModel
-
-model_ckpt = "sentence-transformers/multi-qa-mpnet-base-dot-v1"
-tokenizer = AutoTokenizer.from_pretrained(model_ckpt)
-model = TFAutoModel.from_pretrained(model_ckpt, from_pt=True)
-```
-
-Notăm că am setat `from_pt=True` ca argument al metodei `from_pretrained()`. Acest lucru se datorează faptului că checkpoint-ul `multi-qa-mpnet-base-dot-v1` are doar PyTorch weights, astfel încât setarea `from_pt=True` le va converti automat în format TensorFlow pentru noi. După cum puteți vedea, este foarte simplu să treci de la un framework la altul în 🤗 Transformers!
-
-{/if}
-
-După cum am menționat anterior, dorim să reprezentăm fiecare intrare din corpusul nostru de GitHub issues sub forma unui vector, astfel încât avem nevoie să "agregăm" sau să facem media la tokem embeddings într-un anumit mod. O abordare populară este de a efectua *CLS pooling* pe outputurile modelului nostru, unde pur și simplu colectăm ultimul stadiu ascuns pentru tokenul special `[CLS]`. Următoarea funcție face acest lucru pentru noi:
-
-```py
-def cls_pooling(model_output):
-    return model_output.last_hidden_state[:, 0]
-```
-
-În continuare, vom crea o funcție ajutătoare care va tokeniza o listă de documente, va plasa tensorii pe GPU, îi va alimenta în model și, în final, va aplica CLS pooling la outputuri:
-
-{#if fw === 'pt'}
-
-```py
-def get_embeddings(text_list):
-    encoded_input = tokenizer(
-        text_list, padding=True, truncation=True, return_tensors="pt"
-    )
-    encoded_input = {k: v.to(device) for k, v in encoded_input.items()}
-    model_output = model(**encoded_input)
-    return cls_pooling(model_output)
-```
-
-Putem testa funcția oferindui prima intrare de text în corpusul nostru și analizând output shapeul:
-
-```py
-embedding = get_embeddings(comments_dataset["text"][0])
-embedding.shape
-```
-
-```python out
-torch.Size([1, 768])
-```
-
-Minunat, am transformat prima intrare din corpusul nostru într-un vector de 768 de dimensiuni! Putem utiliza `Dataset.map()` pentru a aplica funcția noastră `get_embeddings()` la fiecare rând din corpusul nostru, astfel încât să creăm o nouă coloană `embeddings` în acest mod:
-
-```py
-embeddings_dataset = comments_dataset.map(
-    lambda x: {"embeddings": get_embeddings(x["text"]).detach().cpu().numpy()[0]}
-)
-```
-
-{:else}
-
-```py
-def get_embeddings(text_list):
-    encoded_input = tokenizer(
-        text_list, padding=True, truncation=True, return_tensors="tf"
-    )
-    encoded_input = {k: v for k, v in encoded_input.items()}
-    model_output = model(**encoded_input)
-    return cls_pooling(model_output)
-```
-
-Putem testa funcția oferindui prima intrare de text în corpusul nostru și analizând output shapeul:
-
-```py
-embedding = get_embeddings(comments_dataset["text"][0])
-embedding.shape
-```
-
-```python out
-TensorShape([1, 768])
-```
-
-Minunat, am transformat prima intrare din corpusul nostru într-un vector de 768 de dimensiuni! Putem utiliza `Dataset.map()` pentru a aplica funcția noastră `get_embeddings()` la fiecare rând din corpusul nostru, astfel încât să creăm o nouă coloană `embeddings` în acest mod:
-
-```py
-embeddings_dataset = comments_dataset.map(
-    lambda x: {"embeddings": get_embeddings(x["text"]).numpy()[0]}
-)
-```
-
-{/if}
-
-Observăm că am transformat embeddingurile în matrice NumPy -- acest lucru este necesar deoarece biblioteca 🤗 Datasets cere acest format atunci când încercăm să indexăm cu FAISS, ceea ce vom face în continuare.
-
-## Utilizarea FAISS pentru căutare de similaritate eficientă[[using-faiss-for-efficient-similarity-search]]
-
-Acum că avem un dataset de embeddings, avem nevoie de o modalitate de a căuta printre ele. Pentru a face acest lucru, vom utiliza o structură de date specială din 🤗 Datasets, numită _FAISS index_. [FAISS](https://faiss.ai/) (prescurtat de la Facebook AI Similarity Search) este o bibliotecă care oferă algoritmi eficienți pentru căutarea rapidă și clusteringul al embedding vectors.
-
-Ideea de bază din spatele FAISS este crearea unei structuri de date speciale numite _index_, care permite găsirea embeddingurilor similare cu un input embedding. Crearea unui index FAISS în 🤗 Datasets este simplu -- utilizăm funcția `Dataset.add_faiss_index()` și specificăm care coloană a datasetului nostru dorim să indexăm:
-
-```py
-embeddings_dataset.add_faiss_index(column="embeddings")
-```
-
-Acum putem efectua queries pe acest index realizând o căutare a celor mai apropiați vecini cu funcția `Dataset.get_nearest_examples()`. Haideți să testăm acest lucru prin încorporarea unei întrebări astfel:
-
-{#if fw === 'pt'}
-
-```py
-question = "How can I load a dataset offline?"
-question_embedding = get_embeddings([question]).cpu().detach().numpy()
-question_embedding.shape
-```
-
-```python out
-torch.Size([1, 768])
-```
-
-{:else}
-
-```py
-question = "How can I load a dataset offline?"
-question_embedding = get_embeddings([question]).numpy()
-question_embedding.shape
-```
-
-```python out
-(1, 768)
-```
-
-{/if}
-
-La fel ca și în cazul documentelor, acum avem un vector de 768 de dimensiuni care reprezintă query-ul, pe care îl putem compara cu întregul corpus pentru a găsi embeddingurile cele mai similare:
-
-```py
-scores, samples = embeddings_dataset.get_nearest_examples(
-    "embeddings", question_embedding, k=5
-)
-```
-
-Funcția `Dataset.get_nearest_examples()` returnează un tuple cu scorurile care clasifică suprapunerea dintre query și document, și un set corespunzător de sampleuri (în acest caz, cele 5 match-uri). Haideți să colectăm acestea într-un `pandas.DataFrame` pentru a le putea sorta cu ușurință:
-
-```py
-import pandas as pd
-
-samples_df = pd.DataFrame.from_dict(samples)
-samples_df["scores"] = scores
-samples_df.sort_values("scores", ascending=False, inplace=True)
-```
-
-Acum putem itera peste primele rânduri pentru a veadea cât de bine un query se potrivește cu comentariile disponibile:
-
-```py
-for _, row in samples_df.iterrows():
-    print(f"COMMENT: {row.comments}")
-    print(f"SCORE: {row.scores}")
-    print(f"TITLE: {row.title}")
-    print(f"URL: {row.html_url}")
-    print("=" * 50)
-    print()
-```
-
-```python out
-"""
-COMMENT: Requiring online connection is a deal breaker in some cases unfortunately so it'd be great if offline mode is added similar to how `transformers` loads models offline fine.
-
-@mandubian's second bullet point suggests that there's a workaround allowing you to use your offline (custom?) dataset with `datasets`. Could you please elaborate on how that should look like?
-SCORE: 25.505046844482422
-TITLE: Discussion using datasets in offline mode
-URL: https://github.com/huggingface/datasets/issues/824
-==================================================
-
-COMMENT: The local dataset builders (csv, text , json and pandas) are now part of the `datasets` package since #1726 :)
-You can now use them offline
-\`\`\`python
-datasets = load_dataset("text", data_files=data_files)
-\`\`\`
-
-We'll do a new release soon
-SCORE: 24.555509567260742
-TITLE: Discussion using datasets in offline mode
-URL: https://github.com/huggingface/datasets/issues/824
-==================================================
-
-COMMENT: I opened a PR that allows to reload modules that have already been loaded once even if there's no internet.
-
-Let me know if you know other ways that can make the offline mode experience better. I'd be happy to add them :)
-
-I already note the "freeze" modules option, to prevent local modules updates. It would be a cool feature.
-
-----------
-
-> @mandubian's second bullet point suggests that there's a workaround allowing you to use your offline (custom?) dataset with `datasets`. Could you please elaborate on how that should look like?
-
-Indeed `load_dataset` allows to load remote dataset script (squad, glue, etc.) but also you own local ones.
-For example if you have a dataset script at `./my_dataset/my_dataset.py` then you can do
-\`\`\`python
-load_dataset("./my_dataset")
-\`\`\`
-and the dataset script will generate your dataset once and for all.
-
-----------
-
-About I'm looking into having `csv`, `json`, `text`, `pandas` dataset builders already included in the `datasets` package, so that they are available offline by default, as opposed to the other datasets that require the script to be downloaded.
-cf #1724
-SCORE: 24.14896583557129
-TITLE: Discussion using datasets in offline mode
-URL: https://github.com/huggingface/datasets/issues/824
-==================================================
-
-COMMENT: > here is my way to load a dataset offline, but it **requires** an online machine
->
-> 1. (online machine)
->
-> ```
->
-> import datasets
->
-> data = datasets.load_dataset(...)
->
-> data.save_to_disk(/YOUR/DATASET/DIR)
->
-> ```
->
-> 2. copy the dir from online to the offline machine
->
-> 3. (offline machine)
->
-> ```
->
-> import datasets
->
-> data = datasets.load_from_disk(/SAVED/DATA/DIR)
->
-> ```
->
->
->
-> HTH.
-
-
-SCORE: 22.893993377685547
-TITLE: Discussion using datasets in offline mode
-URL: https://github.com/huggingface/datasets/issues/824
-==================================================
-
-COMMENT: here is my way to load a dataset offline, but it **requires** an online machine
-1. (online machine)
-\`\`\`
-import datasets
-data = datasets.load_dataset(...)
-data.save_to_disk(/YOUR/DATASET/DIR)
-\`\`\`
-2. copy the dir from online to the offline machine
-3. (offline machine)
-\`\`\`
-import datasets
-data = datasets.load_from_disk(/SAVED/DATA/DIR)
-\`\`\`
-
-HTH.
-SCORE: 22.406635284423828
-TITLE: Discussion using datasets in offline mode
-URL: https://github.com/huggingface/datasets/issues/824
-==================================================
-"""
-```
-
-Nu-i rău! A doua încercare se pare că se potrivește cu query-ul!
-
-<Tip>
-
-✏️ **Încearcă!** Creează propriul tău query și vezi dacp poți găsi un răspuns și să extragi documentele. S-ar putea să trebuiești să crești parametrul `k` în `Dataset.get_nearest_examples()` pentru a mări căutarea.
-
-</Tip>
\ No newline at end of file
diff --git a/chapters/ro/chapter5/7.mdx b/chapters/ro/chapter5/7.mdx
deleted file mode 100644
index ca66adcd9..000000000
--- a/chapters/ro/chapter5/7.mdx
+++ /dev/null
@@ -1,16 +0,0 @@
-# 🤗 Datasets, check![[datasets-check]]
-
-<CourseFloatingBanner
-    chapter={5}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-Ei bine, a fost un tur palpitant prin biblioteca 🤗 Datasets -- felicitări pentru că ai ajuns până aici! Cu cunoștințele pe care le-ai dobândit din acest capitol, ar trebui să fii capabil să:
-
-- Încarci dataseturi de oriunde, fie Hugging Face Hub, laptopul tău sau un server remote de la compania ta.
-- Modelezi datele tale folosind o combinație a funcțiilor `Dataset.map()` și `Dataset.filter()`.
-- Schimbi rapid între data formats precum Pandas și NumPy folosind `Dataset.set_format()`.
-- Creezi propriul tău dataset și să îl publici pe Hugging Face Hub.
-- Încorporezi documentele tale folosind un model Transformer și construiești un motor de căutare semantică folosind FAISS.
-
-În [Capitolul 7](/course/chapter7), vom pune toate acestea în practică, făcând o examinare amănunțită a principalelor sarcini NLP pentru care modelele Transformer sunt excelente. Înainte de a trece mai departe, puneți-vă cunoștințele despre 🤗 Datasets la încercare cu un quiz rapid!
\ No newline at end of file
diff --git a/chapters/ro/chapter5/8.mdx b/chapters/ro/chapter5/8.mdx
deleted file mode 100644
index 6b1b08936..000000000
--- a/chapters/ro/chapter5/8.mdx
+++ /dev/null
@@ -1,228 +0,0 @@
-# Testul de sfârșit de capitol[[end-of-chapter-quiz]]
-
-<CourseFloatingBanner
-    chapter={5}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-Acest capitol a acoperit o mulțime de subiecte! Nu vă faceți griji dacă nu ați înțeles toate detaliile; capitolele următoare vă vor ajuta să înțelegeți cum funcționează lucrurile mai aprofundat.
-
-Înainte de a trece mai departe, totuși trebuie să testăm ce ați învățat în acest capitol.
-
-### 1. Funcția `load_dataset()` din 🤗 Datasets vă permite să încărcați un dataset din care dintre următoarele locații?
-
-<Question
-    choices={[
-        {
-            text: "Local, de exemplu pe laptop",
-            explain: "Corect! Puteți trece path-urile fișierelor locale ca argument al `data_files` al `load_dataset()` pentru a încărca dataseturi locale.",
-            correct: true
-        },
-        {
-            text: "Hugging Face Hub",
-            explain: "Corect! Puteți încărca dataseturi de pe Hub furnizând ID-ul datasetului, de exemplu <code>load_dataset('emotion')</code>.",
-            correct: true
-        },
-        {
-            text: "Un server remote",
-            explain: "Corect! Puteți trece URL-uri ca argument al `data_files` al `load_dataset()` pentru a încărca fișiere remote.",
-            correct: true
-        },
-    ]}
-/>
-
-### 2. Presupunem că încărcați una dintre sarcinile GLUE astfel:
-
-```py
-from datasets import load_dataset
-
-dataset = load_dataset("glue", "mrpc", split="train")
-```
-
-Care dintre următoarele comenzi va produce un exemplu aleatoriu de 50 de elemente din `dataset`?
-
-<Question
-    choices={[
-        {
-            text: "<code>dataset.sample(50)</code>",
-            explain: "Acest lucru este incorect -- nu există o metodă `Dataset.sample()`."
-        },
-        {
-            text: "<code>dataset.shuffle().select(range(50))</code>",
-            explain: "Corect! Așa cum ați văzut în acest capitol, mai întâi faceți shuffle datasetului și apoi selectați exemplele din el.",
-            correct: true
-        },
-        {
-            text: "<code>dataset.select(range(50)).shuffle()</code>",
-            explain: "Acest lucru este incorect -- deși codul va rula, va amesteca doar primele 50 de elemente din setul de date."
-        }
-    ]}
-/>
-
-### 3. Presupunem că aveți un set de date despre animale de companie numit `pets_dataset`, care are o coloană `name` care denotă numele fiecărui animal de companie. Care dintre următoarele abordări v-ar permite să filtrați setul de date pentru toate animalele de companie ale căror nume încep cu litera "L"?
-
-<Question
-    choices={[
-        {
-            text: "<code>pets_dataset.filter(lambda x : x['name'].startswith('L'))</code>",
-            explain: "Corect! Utilizarea unei funcții lambda python pentru aceste filtre rapide este o idee grozavă. Vă puteți gândi și la o altă soluție?",
-            correct: true
-        },
-        {
-            text: "<code>pets_dataset.filter(lambda x['name'].startswith('L'))</code>",
-            explain: "Acest lucru este incorect -- o funcție lambda are forma generală <code>lambda *arguments* : *expression*</code>, deci trebuie să furnizați argumente în acest caz."
-        },
-        {
-            text: "Creați o funcție ca <code>def filter_names(x): return x['name'].startswith('L')</code> și rulați <code>pets_dataset.filter(filter_names)</code>.",
-            explain: "Corect! La fel ca și cu <code>Dataset.map()</code>, puteți trece funcții explicite la <code>Dataset.filter()</code>. Acest lucru este util atunci când aveți o logică complexă care nu este potrivită pentru o funcție lambda. Care dintre celelalte soluții ar mai funcționa?",
-            correct: true
-        }
-    ]}
-/>
-
-### 4. Ce este memory mapping?
-
-<Question
-    choices={[
-        {
-            text: "Mappingul între CPU și GPU RAM",
-            explain: "Acest lucru nu este corect -- încearcă din nou!",
-        },
-        {
-            text: "Mapping între RAM și stocarea sistemului de fișiere",
-            explain: "Corect! 🤗 Datasets tratează fiecare dataset ca pe un fișier memory-mapped. Acest lucru permite bibliotecii să acceseze și să opereze pe elemente ale datasetului fără să fie nevoie să îl încarce complet în memorie.",
-            correct: true
-        },
-        {
-            text: "Mapping între două fișiere din cache-ul 🤗 Datasets",
-            explain: "Acest lucru nu este corect -- încearcă din nou!"
-        }
-    ]}
-/>
-
-### 5. Care sunt principalele beneficii ale memory-mapping?
-
-<Question
-    choices={[
-        {
-            text: "Accesarea fișierelor memory-mapped este mai rapid decât citirea de pe disc sau scrierea pe disc.",
-            explain: "Corect! Acest lucru permite 🤗 Datasets să fie extrem de rapid. Acesta însă nu este singurul beneficiu.",
-            correct: true
-        },
-        {
-            text: "Aplicațiile pot accesa segmente de date dintr-un fișier extrem de mare fără a fi necesar să citească întregul fișier în RAM mai întâi.",
-            explain: "Corect! Acest lucru permite 🤗 Datasets să încarce dataseturi de câțiva gigabytes pe laptopul tău fără a fi nevoie să supraîncărcați CPU-ul. Ce alt avantaj oferă memory-mapping?",
-            correct: true
-        },
-        {
-            text: "Acesta consumă mai puțină energie, astfel încât bateria ta ține mai mult.",
-            explain: "Acest lucru nu este corect -- încearcă din nou!"
-        }
-    ]}
-/>
-
-### 6. De ce codul următor eșuează?
-
-```py
-from datasets import load_dataset
-
-dataset = load_dataset("allocine", streaming=True, split="train")
-dataset[0]
-```
-
-<Question
-    choices={[
-        {
-            text: "Încearcă să facă streaming unui dataset prea mare pentru a încăpea în RAM.",
-            explain: "Acest lucru nu este corect -- streaming datasets sunt decompresate pe loc, și puteți prelucra dataseturi de terabytes cu foarte puțin RAM!",
-        },
-        {
-            text: "Încearcă să acceseze un <code>IterableDataset</code>.",
-            explain: "Corect! Un <code>IterableDataset</code> este un generator, nu un container, deci ar trebui să accesați elementele sale utilizând <code>next(iter(dataset))</code>.",
-            correct: true
-        },
-        {
-            text: "Datasetul <code>allocine</code> nu are o un split <code>train</code>.",
-            explain: "Acest lucru este incorect -- consultați cardul datasetului <code>allocine</code> de pe Hub pentru a vedea ce splituri conține."
-        }
-    ]}
-/>
-
-### 7. Care sunt principalele beneficii ale creării unui dataset card?
-
-<Question
-    choices={[
-        {
-            text: "Oferă informații despre utilizarea intenționată și sarcinile susținute ale datasetului, astfel încât ceilalți din comunitate să poată lua o decizie cu privire la utilizarea acestuia.",
-            explain: "Corect! Dataseturile nedocumentate pot fi utilizate pentru a antrena modele care pot să nu reflecte intențiile creatorilor sau pot produce modele a căror statut juridic este incert dacă sunt antrenate pe date care încalcă confidențialitatea sau restricțiile de licențiere. Acesta nu este singurul beneficiu, totuși!",
-            correct: true
-        },
-        {
-            text: "Ajută la sublinierea biasurilor prezente într-un corpus.",
-            explain: "Corect! Aproape toate dataseturile au o formă de bias, ceea ce poate produce consecințe negative. A fi conștient de ele ajută creatorii de modele să înțeleagă cum să abordeze biasurile indispensabile. Cu ce altceva vă pot ajuta dataset cardurile?",
-            correct: true
-        },
-        {
-            text: "Îmbunătățește șansele ca ceilalți din comunitate să utilizeze datasetul meu.",
-            explain: "Corect! Un dataset card bine scris va avea tendința de a duce la o utilizare mai mare a prețiosului tău dataset. Ce beneficiu mai oferă?",
-            correct: true
-        },
-    ]}
-/>
-
-### 8. Ce este căutarea semantică?
-
-<Question
-    choices={[
-        {
-            text: "Un mod de a căuta pentru a găsi potriviri exacte între cuvintele dintr-un query și documentele dintr-un corpus",
-            explain: "Acest lucru este incorect -- acest tip de căutare se numește *căutare lexicală*, și este ceea ce vedeți de obicei cu motoarele de căutare tradiționale."
-        },
-        {
-            text: "Un mod de a căuta documente care se potrivesc prin înțelegerea sensului contextual al unui query",
-            explain: "Corect! Căutarea semantică utilizează embedding vectors pentru a reprezenta queries și documente și utilizează o metrică de similaritate pentru a măsura cantitatea de suprapunere între ele. Cum altfel ați putea descrie-o?",
-            correct: true
-        },
-        {
-            text: "Un mod de a îmbunătăți acuratețea căutării",
-            explain: "Corect! Motoarele de căutare semantice pot captura intenția unui query mult mai bine decât potrivirea de cuvinte cheie și de obicei preia documente cu o precizie mai mare. Dar acesta nu este singurul răspuns corect -- ce alt beneficiu oferă căutarea semantică?",
-            correct: true
-        }
-    ]}
-/>
-
-### 9. Pentru căutarea semantică asimetrică, de obicei aveți:
-
-<Question
-    choices={[
-        {
-            text: "Un query scurt și un paragraf mai lung care răspunde la query",
-            explain: "Corect!",
-            correct: true
-        },
-        {
-            text: "Queries și paragrafe care sunt de aproximativ aceeași lungime",
-            explain: "Acest lucru este de fapt un exemplu de căutare semantică simetrică -- încercați din nou!"
-        },
-        {
-            text: "Un query lung și un paragraf mai scurt care răspunde la query",
-            explain: "Acest lucru este incorect -- încercați din nou!"
-        }
-    ]}
-/>
-
-### 10. Pot utiliza 🤗 Datasets pentru a încărca date pentru utilizare în alte domenii, cum ar fi speech processing?
-
-<Question
-    choices={[
-        {
-            text: "Nu",
-            explain: "Acest lucru este incorect -- 🤗 Datasets acceptă în prezent date tabulare, audio și imagini. Consultați datasetul <a href='https://huggingface.co/datasets/mnist'>MNIST</a> de pe Hub pentru a vedea un exemplu de computer vision."
-        },
-        {
-            text: "Da",
-            explain: "Corect! Consultați dezvoltările interesante cu privire la speech și vision în biblioteca 🤗 Transformers pentru a vedea cum 🤗 Datasets este utilizat în aceste domenii.",
-            correct: true
-        },
-    ]}
-/>
\ No newline at end of file

From 7e95b1f6e17ed558f866b71ccd1cceb8d159e785 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Tue, 27 May 2025 11:53:11 +0300
Subject: [PATCH 116/167] feat: add content for chapter 5

---
 chapters/rum/_toctree.yml   |  48 +++
 chapters/rum/chapter0/1.mdx | 110 ++++++
 chapters/rum/chapter5/1.mdx |  22 ++
 chapters/rum/chapter5/2.mdx | 173 +++++++++
 chapters/rum/chapter5/3.mdx | 748 ++++++++++++++++++++++++++++++++++++
 chapters/rum/chapter5/4.mdx | 287 ++++++++++++++
 chapters/rum/chapter5/5.mdx | 404 +++++++++++++++++++
 chapters/rum/chapter5/6.mdx | 517 +++++++++++++++++++++++++
 chapters/rum/chapter5/7.mdx |  16 +
 chapters/rum/chapter5/8.mdx | 228 +++++++++++
 10 files changed, 2553 insertions(+)
 create mode 100644 chapters/rum/_toctree.yml
 create mode 100644 chapters/rum/chapter0/1.mdx
 create mode 100644 chapters/rum/chapter5/1.mdx
 create mode 100644 chapters/rum/chapter5/2.mdx
 create mode 100644 chapters/rum/chapter5/3.mdx
 create mode 100644 chapters/rum/chapter5/4.mdx
 create mode 100644 chapters/rum/chapter5/5.mdx
 create mode 100644 chapters/rum/chapter5/6.mdx
 create mode 100644 chapters/rum/chapter5/7.mdx
 create mode 100644 chapters/rum/chapter5/8.mdx

diff --git a/chapters/rum/_toctree.yml b/chapters/rum/_toctree.yml
new file mode 100644
index 000000000..3e4a9c90b
--- /dev/null
+++ b/chapters/rum/_toctree.yml
@@ -0,0 +1,48 @@
+- title: 0. Configurare
+  sections:
+  - local: chapter0/1
+    title: Introducere
+
+- title: 1. Modele Transformer
+  sections:
+  - local: chapter1/1
+    title: Introducere
+  - local: chapter1/2
+    title: Procesarea limbajului natural și modelele de limbaj mari
+  - local: chapter1/3
+    title: Transformers, ce pot face?
+  - local: chapter1/4
+    title: Cum funcționează Transformers?
+  - local: chapter1/5
+    title: Modele Encoder
+  - local: chapter1/6
+    title: Modele Decoder
+  - local: chapter1/7
+    title: Modele secvență-la-secvență
+  - local: chapter1/8
+    title: Prejudecăți și limitări
+  - local: chapter1/9
+    title: Rezumat
+  - local: chapter1/10
+    title: Quiz de final de capitol
+    quiz: 1
+
+- title: 5. Biblioteca 🤗 Datasets
+  sections:
+  - local: chapter5/1
+    title: Introducere
+  - local: chapter5/2
+    title: Ce fac dacă dataset-ul meu nu este pe Hub?
+  - local: chapter5/3
+    title: E timpul să tăiem și să analizăm datele
+  - local: chapter5/4
+    title: Big data? 🤗 Datasets vine în ajutor!
+  - local: chapter5/5
+    title: Creează propriul tău dataset
+  - local: chapter5/6
+    title: Căutare semantică cu FAISS
+  - local: chapter5/7
+    title: 🤗 Datasets, verificare!
+  - local: chapter5/8
+    title: Quiz de final de capitol
+    quiz: 5
\ No newline at end of file
diff --git a/chapters/rum/chapter0/1.mdx b/chapters/rum/chapter0/1.mdx
new file mode 100644
index 000000000..c7c072707
--- /dev/null
+++ b/chapters/rum/chapter0/1.mdx
@@ -0,0 +1,110 @@
+# Introducere[[introducere]]
+
+Bun venit la cursul Hugging Face! Această introducere te va ghida în configurarea environment-ului de lucru. Dacă abia începi cursul, îți recomandăm să arunci o privire mai întâi asupra [Capitolului 1](/course/chapter1), apoi să te întorci și să îți configurezi environment-ul pentru a putea încerca singur codul.
+
+Toate bibliotecile pe care le vom folosi în acest curs sunt disponibile ca Python packages, așa că aici îți vom arăta cum să configurezi Python environment-ul și să instalezi librăriile specifice de care ai nevoie.
+
+Vom acoperi două moduri de a-ți configura environment-ul, folosind un notebook Colab sau un Python environment. Simte-te liber să alegi pe cel care ți se potrivește cel mai bine. Pentru începători, recomandăm să începi folosind un notebook Colab.
+
+Reține că nu vom acoperi sistemul Windows. Dacă folosești Windows, îți recomandăm să urmezi pașii folosind un notebook Colab. Dacă folosești o distribuție Linux sau macOS, poți folosi oricare dintre abordările descrise aici.
+
+Majoritatea cursului se bazează pe faptul că ai un cont Hugging Face. Îți recomandăm să creezi unul acum: [crează un cont](https://huggingface.co/join).
+
+## Folosirea unui notebook Google Colab[[folosind-un-notebook-google-colab]]
+
+Folosirea unui notebook Colab este cea mai simplă configurare posibilă; deschide un notebook în browserul tău și începe imediat să scrii cod!
+
+Dacă nu ești familiarizat cu Colab, îți recomandăm să începi urmând [introducerea](https://colab.research.google.com/notebooks/intro.ipynb). Colab îți permite să folosești hardware accelerat, cum ar fi GPU-uri sau TPU-uri, și este gratuit pentru sarcini mai mici.
+
+Odată ce ești confortabil să te descurci în Colab, creează un nou notebook și începe cu configurarea:
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter0/new_colab.png" alt="Un notebook Colab gol" width="80%"/>
+</div>
+
+Următorul pas este să instalezi librăriile pe care le vom folosi în acest curs. Vom folosi `pip` pentru instalare, care este managerul de packages pentru Python. În notebook-uri, poți rula comenzi de sistem începând comanda cu caracterul `!`, așa că poți instala librăria 🤗 Transformers astfel:
+
+```
+!pip install transformers
+```
+
+Te poți asigura că pachetul a fost instalat corect importându-l în cadrul mediului tău Python:
+
+```
+import transformers
+```
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter0/install.gif" alt="O animație care arată rezultatul celor două comenzi de mai sus: instalare și importarea" width="80%"/>
+</div>
+
+Aceasta instalează o versiune foarte ușoară a 🤗 Transformers. În special, nu sunt instalate framework-uri specifice de machine learning (cum ar fi PyTorch sau TensorFlow). Deoarece vom folosi multe caracteristici diferite ale librăriei, îți recomandăm să instalezi versiunea pentru development, care vine cu toate dependențele necesare pentru cam orice caz de utilizare imaginabil:
+
+```
+!pip install transformers[sentencepiece]
+```
+
+Aceasta va dura puțin timp, dar apoi vei fi gata de drum pentru restul cursului!
+
+## Folosirea unui virtual environment Python[[folosirea-unui-virtual-environment-python]]
+
+Dacă preferi să folosești un mediu virtual Python, primul pas este să instalezi Python pe sistemul tău. Îți recomandăm să urmezi [această ghidare](https://realpython.com/installing-python/) pentru a începe.
+
+Odată ce ai Python instalat, ar trebui să poți rula comenzi Python în terminalul tău. Poți începe rulând următoarea comandă pentru a te asigura că este instalat corect înainte de a trece la pașii următori: `python --version`. Aceasta ar trebui să afișeze versiunea Python disponibilă acum pe sistemul tău.
+
+Când rulezi o comandă Python în terminalul tău, cum ar fi `python --version`, ar trebui să te gândești la programul care rulează comanda ta ca la Python-ul "principal" de pe sistemul tău. Îți recomandăm să păstrezi această instalare principală liberă de orice pachete și să o folosești pentru a crea environment-uri separate pentru fiecare aplicație pe care lucrezi — în acest fel, fiecare aplicație poate avea propriile sale dependențe și pachete, și nu va trebui să te preocupi de problemele de compatibilitate potențiale cu alte aplicații.
+
+În Python, acest lucru se face prin [*virtual environments*](https://docs.python.org/3/tutorial/venv.html), care sunt directory trees autonomi ce conțin fiecare o instalare Python cu o anumită versiune Python împreună cu toate pachetele de care are nevoie aplicația. Crearea unui astfel de mediu virtual poate fi realizată cu mai multe instrumente diferite, dar vom folosi pachetul oficial Python pentru acest scop, denumit [`venv`](https://docs.python.org/3/library/venv.html#module-venv).
+
+În primul rând, creează folder în care dorești ca aplicația ta să locuiască — de exemplu, ai putea dori să faci un nou folder numit *transformers-course* în rădăcina folderului tău personal:
+
+```
+mkdir ~/transformers-course
+cd ~/transformers-course
+```
+
+Din interiorul acestui folder, creează un virtual environment folosind modulul Python `venv`:
+
+```
+python -m venv .env
+```
+
+Acum ar trebui să ai un folder numit *.env* în folderul tău altfel gol:
+
+```
+ls -a
+```
+
+```out
+.      ..    .env
+```
+
+Poți să intri și să ieși din environment folosind comenzile `activate` și `deactivate`:
+
+```
+# Activează mediul virtual
+source .env/bin/activate
+
+# Dezactivează virtual environment-ul
+deactivate
+```
+
+Te poți asigura că environment-ul este activat rulând comanda `which python`: dacă aceasta indică către virtual environment, atunci l-ai activat cu succes!
+
+```
+which python
+```
+
+```out
+/home/<user>/transformers-course/.env/bin/python
+```
+
+### Instalarea dependențelor[[instalarea-dependențelor]]
+
+La fel ca în secțiunea anterioară despre utilizarea instanțelor Google Colab, acum va trebui să instalezi pachetele necesare pentru a continua. Din nou, poți instala versiunea pentru development a 🤗 Transformers folosind managerul de pachete `pip`:
+
+```
+pip install "transformers[sentencepiece]"
+```
+
+Acum ești gata să începi!
\ No newline at end of file
diff --git a/chapters/rum/chapter5/1.mdx b/chapters/rum/chapter5/1.mdx
new file mode 100644
index 000000000..7fd54a2ad
--- /dev/null
+++ b/chapters/rum/chapter5/1.mdx
@@ -0,0 +1,22 @@
+# Introducere[[introduction]]
+
+<CourseFloatingBanner
+    chapter={5}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+În [Capitolul 3](/course/chapter3) ați încercat a biblioteca 🤗Datasets și ați văzut că existau trei pași principali atunci când vine vorba de fine-tuningul unui model:
+
+1. Încărcați un dataset din Hugging Face Hub.
+2. Preprocesați datele cu `Dataset.map()`.
+3. Încărcați și calculați metricele.
+
+Dar acesta este doar o mică parte a ceea ce poate face 🤗 Datasets! În acest capitol, vom trece mai in deep în această bibliotecă. Pe parcurs, vom găsi răspunsuri la următoarele întrebări:
+
+* Ce faceți atunci când datasetul tău nu este pe Hub?
+* Cum puteți tăia și împărți un dataset? (Și ce dacă tu _really_ trebuie să folosești Pandas?)
+* Ce faceți atunci când datasetul este uriaș și va topi RAM-ul laptopului dumneavoastră?
+* Ce este "memory mapping" și Apache Arrow?
+* Cum puteți crea propriul dataset și să-l trimiteți pe Hub?
+
+Tehnicile pe care le veți învăța aici vă vor pregăti pentru sarcinile avansate de tokenizare și fine-tuning din [Capitolul 6](/course/chapter6) și [Capitolul 7](/course/chapter7) -- deci luați o cafea sau două și să începem!
diff --git a/chapters/rum/chapter5/2.mdx b/chapters/rum/chapter5/2.mdx
new file mode 100644
index 000000000..24ab9c40a
--- /dev/null
+++ b/chapters/rum/chapter5/2.mdx
@@ -0,0 +1,173 @@
+# Ce fac dacă dataset-ul meu nu este pe Hub?[[what-if-my-dataset-isnt-on-the-hub]]
+
+<CourseFloatingBanner chapter={5}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[  
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/ro/chapter5/section2.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/ro/chapter5/section2.ipynb"},  
+]} />
+
+Ai învățat să folosești [Hugging Face Hub](https://huggingface.co/datasets) pentru a descărca dataseturi, dar vei găsi adesea că lucrați cu date care sunt stocate fie pe laptopul dumneavoastră, fie pe un server. În această secțiune vă vom arăta cum poate fi utilizat 🤗 Datasets pentru a încărca dataseturi care nu sunt disponibile pe Hugging Face Hub.
+<Youtube id="HyQgpJTkRdE"/>
+
+## Lucrând cu dataseturi locale și remote[[working-with-local-and-remote-datasets]]
+
+🤗 Datasets oferă loading scripts pentru a gestiona încărcarea dataseturilor locale și remote. Suportă mai multe data formats , cum ar fi:
+
+|    Data format     | Loading script |                         Example                         |
+| :----------------: | :------------: | :-----------------------------------------------------: |
+|     CSV & TSV      |     `csv`      |     `load_dataset("csv", data_files="my_file.csv")`     |
+|     Text files     |     `text`     |    `load_dataset("text", data_files="my_file.txt")`     |
+| JSON & JSON Lines  |     `json`     |   `load_dataset("json", data_files="my_file.jsonl")`    |
+| Pickled DataFrames |    `pandas`    | `load_dataset("pandas", data_files="my_dataframe.pkl")` |
+
+As shown in the table, for each data format we just need to specify the type of loading script in the `load_dataset()` function, along with a `data_files` argument that specifies the path to one or more files. Let's start by loading a dataset from local files; later we'll see how to do the same with remote files.
+
+## Loading a local dataset[[loading-a-local-dataset]]
+
+For this example we'll use the [SQuAD-it dataset](https://github.com/crux82/squad-it/), which is a large-scale dataset for question answering in Italian.
+
+The training and test splits are hosted on GitHub, so we can download them with a simple `wget` command:
+
+În tabelele de mai sus, pentru fiecare format de date trebuie doar să specificăm tipul scriptului de încărcare din funcția `load_dataset()`, alături de un argument `data_files` care specifică calea către un sau mai multe fișiere. Începem cu încărcarea datasetului din fișierele locale; apoi vom vedea cum să faceți același lucru cu fișierele remote.
+
+## Încărcarea unui dataset local[[loading-a-local-dataset]]
+
+În acest exemplu, vom folosi [datasetul SQuAD-it](https://github.com/crux82/squad-it/), care este un large-scale dataset pentru întrebări și răspunsuri în italiană.
+
+Spliturile de training și test sunt disponibile pe GitHub, deci putem descarca cu o comanda `wget`:
+```python
+!wget https://github.com/crux82/squad-it/raw/master/SQuAD_it-train.json.gz
+!wget https://github.com/crux82/squad-it/raw/master/SQuAD_it-test.json.gz
+```
+
+This will download two compressed files called *SQuAD_it-train.json.gz* and *SQuAD_it-test.json.gz*, which we can decompress with the Linux `gzip` command:
+
+```python
+!gzip -dkv SQuAD_it-*.json.gz
+```
+
+```bash
+SQuAD_it-test.json.gz:	   87.4% -- replaced with SQuAD_it-test.json
+SQuAD_it-train.json.gz:	   82.2% -- replaced with SQuAD_it-train.json
+```
+
+
+
+Putem observa că fișierele comprimate au fost înlocuite cu _SQuAD_it-train.json_ și _SQuAD_it-test.json_, iar datele sunt stocate în formatul JSON.
+
+<Tip>
+✎ Dacă vă întrebați de ce există un caracter `!` în comenziile shell din exemplu, acest lucru se întâmplă pentru că le-am rulat în cadrul unui jupyter notebook. Simplu să ștergeți prefixul dacă doriți să descărcați și să faceți unzip datasetului într-un terminal.
+</Tip>
+
+Să încarcăm acum un fișier JSON cu funcția `load_dataset()`. Ne trebuie doar să știm dacă ne confruntăm cu un JSON obișnuit (similar cu un nested dictionary) sau JSON Lines (lines-separated JSON). Cum multe dataset-uri pentru întrebări și răspunsuri, SQuAD-it folosește formatul nested, în care toate textele sunt stocate într-un câmp numit `data`. Acest lucru ne permite să încărcăm datasetul specificând argumentul `field` astfel:
+
+```py
+from datasets import load_dataset
+
+squad_it_dataset = load_dataset("json", data_files="SQuAD_it-train.json", field="data")
+```
+
+By default, loading local files creates a `DatasetDict` object with a `train` split. We can see this by inspecting the `squad_it_dataset` object:
+
+```py
+squad_it_dataset
+```
+
+```python out
+DatasetDict({
+    train: Dataset({
+        features: ['title', 'paragraphs'],
+        num_rows: 442
+    })
+})
+```
+
+Acest lucru ne arată numărul de rânduri și numele coloanelor asociate cu setul de antrenare. Putem vizualiza un exemplu prin a indexa în `train` split astfel:
+```py
+squad_it_dataset["train"][0]
+```
+
+```python out
+{
+    "title": "Terremoto del Sichuan del 2008",
+    "paragraphs": [
+        {
+            "context": "Il terremoto del Sichuan del 2008 o il terremoto...",
+            "qas": [
+                {
+                    "answers": [{"answer_start": 29, "text": "2008"}],
+                    "id": "56cdca7862d2951400fa6826",
+                    "question": "In quale anno si è verificato il terremoto nel Sichuan?",
+                },
+                ...
+            ],
+        },
+        ...
+    ],
+}
+```
+
+Excelent, am reușit să încarcăm datasetul nostru local! Dar, deși acest lucru a funcționat pentru setul de antrenare, ceea ce dorim cu adevărat este să includem ambele splituri, `train` și `test`, într-un singur obiect `DatasetDict` astfel încât să putem aplica funcțiile `Dataset.map()` asupra ambelor splituri în același timp. Pentru a face acest lucru, putem furniza un dicționar pentru argumentul `data_files` care va face maps fiecărui spilt name cu fișierul asociat acelui split:
+
+```py
+data_files = {"train": "SQuAD_it-train.json", "test": "SQuAD_it-test.json"}
+squad_it_dataset = load_dataset("json", data_files=data_files, field="data")
+```
+
+```python out
+DatasetDict({
+    train: Dataset({
+        features: ['title', 'paragraphs'],
+        num_rows: 442
+    })
+    test: Dataset({
+        features: ['title', 'paragraphs'],
+        num_rows: 48
+    })
+})
+```
+
+Astfel obținem exact ceea ce am dori. Acum putem aplica diverse tehnici de preprocesare pentru a curăța datele, să facem tokenize recenziilor și așa mai departe.
+
+<Tip>
+
+Argumentul `data_files` al funcției `load_dataset()` este destul de flexibil și poate fi fie un singur file paths, o listă de file paths, sau un dicționar care face maps split nameurilor cu file pathurile. De asemenea putem să folosim glob files care se potrivest unui model specificat conform regulilor folosite de Unix shell (de exemplu putem să facem glob tuturor fișierelor JSON într-un folder ca un singur split setând `data_files="*.json"`). Pentru mai multe detalii consultați [documentația](https://huggingface.co/docs/datasets/loading#local-and-remote-files) 🤗 Datasets.
+
+</Tip>
+
+Scripturile de încărcare din 🤗 Datasets suportă automat decomprimarea fișierelor de intrare, astfel putem să evităm folosirea `gzip` arătând argumentul `data_files` direct către fișierele comprimate:
+
+```py
+data_files = {"train": "SQuAD_it-train.json.gz", "test": "SQuAD_it-test.json.gz"}
+squad_it_dataset = load_dataset("json", data_files=data_files, field="data")
+```
+
+Acest lucru poate fi util dacă nu dorim să manualizăm dezcomprimarea mai multe fișiere GZIP. Automatic decompression se aplică și altor formate precum ZIP și TAR, astfel putem să indicăm `data_files` către fișierele comprimate și suntem gata!
+
+Acum că știm cum să încărcăm fișierele locale pe laptop sau desktop, să vedem cum să încarcăm fișiere remote.
+
+## Încărcarea unui dataset remote[[loading-a-remote-dataset]]
+
+Dacă lucrați ca Data Scientist sau programatori într-o companie, există șanse mari că dataseturile pe care doriți să le analizați sunt stocate pe un anumit server. Din fericire, încărcarea fișierelor remote este la fel de simplă ca încărcarea celor locale! În schimb putem să oferim pathul la fișiere locale, noi oferim argumentului `data_files` de la metoda `load_dataset()` către una sau mai multe adrese URL unde sunt stocate fișierele remote. De exemplu pentru datasetul SQuAD-it găzduit pe GitHub, putem să oferitum argumentului `data_files`, URL-urile _SQuAD_it-*.json.gz_ astfel:
+
+```py
+url = "https://github.com/crux82/squad-it/raw/master/"
+data_files = {
+    "train": url + "SQuAD_it-train.json.gz",
+    "test": url + "SQuAD_it-test.json.gz",
+}
+squad_it_dataset = load_dataset("json", data_files=data_files, field="data")
+```
+
+Astfel obținem același obiect `DatasetDict` ca mai sus, dar economisim timp, deoarece nu descărcăm și decomprimăm fișierele _SQuAD_it-*.json.gz_. Asta încheie aventura noastră în diversele modalități de încarcare a dataseturilor care nu sunt găzduite pe Hugging Face Hub. Acum că am avem un dataset la dispoziție, hai să îl prelucrăm!
+
+<Tip>
+
+✏️ **Încearcă!** Alegeți alt dataset găzduit pe GitHub sau [UCI Machine Learning Repository](https://archive.ics.uci.edu/ml/index.php) și încercați să îl încărcați atât local cât și remote folosind tehniciile introduse mai sus. Pentru puncte bonus, încercați să încărcați un dataset care este stocat în format CSV sau text (consultați [documentația](https://huggingface.co/docs/datasets/loading#local-and-remote-files) pentru detalii suplimentare despre aceste formate).
+
+</Tip>
+
+
+
+
diff --git a/chapters/rum/chapter5/3.mdx b/chapters/rum/chapter5/3.mdx
new file mode 100644
index 000000000..d91169c19
--- /dev/null
+++ b/chapters/rum/chapter5/3.mdx
@@ -0,0 +1,748 @@
+# E timpul să tăiem și să analizăm datele[[time-to-slice-and-dice]]
+
+<CourseFloatingBanner chapter={5}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter5/section3.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter5/section3.ipynb"},
+]} />
+
+În cea mai mare parte, datele cu care lucrezi nu vor fi perfect pregătite pentru antrenarea modelelor. În această secțiune vom explora features variate pe care 🤗 Datasets le oferă pentru curățirea dataseturilor.
+
+<Youtube id="tqfSFcPMgOI"/>
+
+## Slicing și dicing asupra datelor[[slicing-and-dicing-our-data]]
+
+Asemenea Pandas, 🤗 Datasets oferă mai multe funcții pentru a manipula conținutul obiectelor `Dataset` și `DatasetDict`. Am întâlnit deja metoda `Dataset.map()` în [Capitolul 3](/course/chapter3), iar în această secțiune vom explora alte funcții de care dispunem.
+
+În acest exemplu, vom folosi [Drug Review Dataset](https://archive.ics.uci.edu/ml/datasets/Drug+Review+Dataset+%28Drugs.com%29) găzduit pe [UC Irvine Machine Learning Repository](https://archive.ics.uci.edu/ml/index.php), care conține reviewurile pacienților privind diverse medicamente, alături de bolile care sunt tratate și o evaluare de 10 stele a satisfacției pacientului.
+
+În primul rând trebuie să descărcăm și să extragem datele, ceea ce se poate de făcut cu comenzile `wget` și `unzip`:
+
+```py
+!wget "https://archive.ics.uci.edu/ml/machine-learning-databases/00462/drugsCom_raw.zip"
+!unzip drugsCom_raw.zip
+```
+
+Deoarece TSV este o variantă a CSV care folosește taburi în loc de virgulă ca separator, putem încărca aceste fișiere prin folosirea scriptului de încărcare `csv` și specificarea argumentului `delimiter` în funcția `load_dataset()` astfel:
+
+```py
+from datasets import load_dataset
+
+data_files = {"train": "drugsComTrain_raw.tsv", "test": "drugsComTest_raw.tsv"}
+# \t este caracterul tab de Python
+drug_dataset = load_dataset("csv", data_files=data_files, delimiter="\t")
+```
+
+O practică bună atunci când faceți orice fel de analiză a datelor este să vă luați un mic random sample pentru a înțelege cu ce tip de date lucrați. În 🤗 Datasets, putem crea o colecție aleatorie prin legarea funcțiilor `Dataset.shuffle()` și `Dataset.select()`:
+
+```py
+drug_sample = drug_dataset["train"].shuffle(seed=42).select(range(1000))
+# Vizualizați primele câteva exemple
+drug_sample[:3]
+```
+
+```python out
+{'Unnamed: 0': [87571, 178045, 80482],
+ 'drugName': ['Naproxen', 'Duloxetine', 'Mobic'],
+ 'condition': ['Gout, Acute', 'ibromyalgia', 'Inflammatory Conditions'],
+ 'review': ['"like the previous person mention, I&#039;m a strong believer of aleve, it works faster for my gout than the prescription meds I take. No more going to the doctor for refills.....Aleve works!"',
+  '"I have taken Cymbalta for about a year and a half for fibromyalgia pain. It is great\r\nas a pain reducer and an anti-depressant, however, the side effects outweighed \r\nany benefit I got from it. I had trouble with restlessness, being tired constantly,\r\ndizziness, dry mouth, numbness and tingling in my feet, and horrible sweating. I am\r\nbeing weaned off of it now. Went from 60 mg to 30mg and now to 15 mg. I will be\r\noff completely in about a week. The fibro pain is coming back, but I would rather deal with it than the side effects."',
+  '"I have been taking Mobic for over a year with no side effects other than an elevated blood pressure.  I had severe knee and ankle pain which completely went away after taking Mobic.  I attempted to stop the medication however pain returned after a few days."'],
+ 'rating': [9.0, 3.0, 10.0],
+ 'date': ['September 2, 2015', 'November 7, 2011', 'June 5, 2013'],
+ 'usefulCount': [36, 13, 128]}
+```
+
+Atrageți atenția că am fixat seedul în `Dataset.shuffle()` pentru posibilitatea de reproducere. `Dataset.select()` se așteaptă la un iterabil cu indices, deci noi am scris `range(1000)` pentru a primi primele 1000 de exemple din datasetul amestecat. Din acest sample putem vedea câteva ciudățenii în datasetul nostru:
+
+* Coloana `Unnamed: 0` are un aspect neobișnuit, care sugerează că este un anonymized ID a fiecărui pacient.
+* Coloana `condition` conține labeluri majuscule și minuscule.
+* Recenziile au lungimi variate și conțin caractere Python precum `\r\n` şi caractere HTML ca `&\#039;`.
+
+Hai să vedem cum putem folosi 🤗 Datasets pentru a face față fiecărei dintre aceste probleme. Pentru a testa ipoteza identificării pacientului pentru coloana `Unnamed: 0`, putem folosi funcția `Dataset.unique()` pentru a verifica dacă numărul de ID-uri corespunde cu numărul de rânduri în fiecare split:
+
+```py
+for split in drug_dataset.keys():
+    assert len(drug_dataset[split]) == len(drug_dataset[split].unique("Unnamed: 0"))
+```
+
+Aceasta pare să confirme ipoteza, deci putem curăța datasetul puțin, redenumind coloana `Unnamed: 0` pentru a-i da un nume mai interpretabil. Putem folosi funcția `DatasetDict.rename_column()` pentru a renumea coloana în același timp în ambele splituri:
+
+```py
+drug_dataset = drug_dataset.rename_column(
+    original_column_name="Unnamed: 0", new_column_name="patient_id"
+)
+drug_dataset
+```
+
+```python out
+DatasetDict({
+    train: Dataset({
+        features: ['patient_id', 'drugName', 'condition', 'review', 'rating', 'date', 'usefulCount'],
+        num_rows: 161297
+    })
+    test: Dataset({
+        features: ['patient_id', 'drugName', 'condition', 'review', 'rating', 'date', 'usefulCount'],
+        num_rows: 53766
+    })
+})
+```
+
+<Tip>
+
+✏️ **Încearcă!** Folosiți funcția `Dataset.unique()` pentru a găsi numărul de medicamente și condiții unice în seturile de antrenare și testare.
+
+</Tip>
+
+În continuare, vom normaliza toate `condition` labels folosind `Dataset.map()`. La fel cum am făcut cu tokenizarea în [Capitolul 3](/course/chapter3), putem defini o funcție simplă care poate fi aplicată pe toate rândurile fiecărui split din `drug_dataset`:
+
+```py
+def lowercase_condition(example):
+    return {"condition": example["condition"].lower()}
+
+
+drug_dataset.map(lowercase_condition)
+```
+
+```python out
+AttributeError: 'NoneType' object has no attribute 'lower'
+```
+
+Oh no, am întâmpinat o problemă cu funcția map! Din eroarea noastră se poate deduce că unele intrări din coloana `condition` sunt `None`, care nu pot fi convertite la caracterul mic pentru că nu sunt string-uri. Vom elimina aceste rânduri folosind `Dataset.filter()`, care funcționează în mod similar cu `Dataset.map()` și se așteaptă o funcție care primește un exemplu al datasetului.
+
+În loc de a scrie o funcție explicită ca:
+
+```py
+def filter_nones(x):
+    return x["condition"] is not None
+```
+
+și apoi să rulăm `drug_dataset.filter(filter_nones)`, putem face acest lucru într-o linie folosind o _funcție lambda_. În Python, funcțiile lambda sunt funcții mici care pot fi definite fără a le numi. Ele au forma generală:
+
+```py
+lambda <argumente> : <expresie>
+```
+
+unde `lambda` este unul dintre [cuvintele cheie](https://docs.python.org/3/reference/lexical_analysis.html#keywords) Python, `<argumente>` reprezintă o listă/set de valori separate prin virgulă care definesc inputurile funcției și `<expresie>` reprezintă operațiile pe care dorim să le executăm. De exemplu, putem defini o funcție lambda care ridică un număr la pătrat:
+
+```py
+lambda x : x * x
+```
+
+Pentru a aplica această funcție la un input, trebuie să îi facem wrap și pe să punem inputul în paranteze:
+
+```py
+(lambda x: x * x)(3)
+```
+
+```python out
+9
+```
+
+La fel, putem defini funcții lambda cu mai multe argumente prin separarea acestora prin virgulă. De exemplu, putem calcula suprafața unui triunghi ca:
+
+```py
+(lambda base, height: 0.5 * base * height)(4, 8)
+```
+
+```python out
+16.0
+```
+
+Funcțiile lambda sunt utile atunci când dorim să definim funcții mici, pentru o singură folosire (pentru mai multe informații despre ele, recomandăm citirea excelentului [Real Python tutorial](https://realpython.com/python-lambda/) scris de Andre Burgaud). În contextul 🤗 Datasets, putem utiliza funcțiile lambda pentru a defini operații simple de map și filter, astfel încât să eliminăm intrările `None` din datasetul nostru:
+
+```py
+drug_dataset = drug_dataset.filter(lambda x: x["condition"] is not None)
+```
+
+Cu intrările `None` eliminate, putem normaliza coloana `condition`:
+
+```py
+drug_dataset = drug_dataset.map(lowercase_condition)
+# Verificăm dacă lowercasing a funcționat
+drug_dataset["train"]["condition"][:3]
+```
+
+```python out
+['left ventricular dysfunction', 'adhd', 'birth control']
+```
+
+Funcționează! Acum că am curățat labelurile, să vedem cum putem curăți și recenziile.
+
+## Crearea de noi coloane
+
+Atunci când lucrați cu recenziile clienților, o practică bună este să verificați numărul de cuvinte în fiecare recenzie. O recenzie poate fi doar un singur cuvânt, cum ar fi "Excelent!" sau un eseu complet care are sute de cuvinte și depinde de cazul pe care îl aveți la vedere, aici trebuie să vă asigurați că faceți față acestor extreme diferit. Pentru a calcula numărul de cuvinte în fiecare recenzie, vom folosi un heuristic aproximativ bazat pe splittingul textului prin spații.
+
+Vom defini o funcție simplă care numără numărul de cuvinte din fiecare recenzie:
+
+```py
+def compute_review_length(example):
+    return {"review_length": len(example["review"].split())}
+```
+
+Spre deosebire de funcția `lowercase_condition()`, `compute_review_length()` returnează un dicționar ale cărui key nu corespund uneia dintre numele coloanelor din dataset. În acest caz, atunci când `compute_review_length()` este transmis în `Dataset.map()`, el va fi aplicat pe toate rândurile din dataset pentru a crea o nouă coloană `review_length`:
+
+```py
+drug_dataset = drug_dataset.map(compute_review_length)
+# Inspectăm primul exemplu de training
+drug_dataset["train"][0]
+```
+
+```python out
+{'patient_id': 206461,
+ 'drugName': 'Valsartan',
+ 'condition': 'left ventricular dysfunction',
+ 'review': '"It has no side effect, I take it in combination of Bystolic 5 Mg and Fish Oil"',
+ 'rating': 9.0,
+ 'date': 'May 20, 2012',
+ 'usefulCount': 27,
+ 'review_length': 17}
+```
+
+Așa cum era de așteptat, putem vedea o nouă coloană `review_length` adăugată la setul de antrenare. Putem sorta această nouă coloană cu `Dataset.sort()` pentru a vedea cum valorile extreme arată:
+
+```py
+drug_dataset["train"].sort("review_length")[:3]
+```
+
+```python out
+{'patient_id': [103488, 23627, 20558],
+ 'drugName': ['Loestrin 21 1 / 20', 'Chlorzoxazone', 'Nucynta'],
+ 'condition': ['birth control', 'muscle spasm', 'pain'],
+ 'review': ['"Excellent."', '"useless"', '"ok"'],
+ 'rating': [10.0, 1.0, 6.0],
+ 'date': ['November 4, 2008', 'March 24, 2017', 'August 20, 2016'],
+ 'usefulCount': [5, 2, 10],
+ 'review_length': [1, 1, 1]}
+```
+
+Precum am presupus, unele recenii conțin doar un singur cuvânt, ceea ce, deși ar putea fi OK pentru analiza sentimentului, nu ar fi informativ dacă vrem să prezicem condiției.
+
+<Tip>
+
+🙋 O alternativă la adăugarea unei noi coloane într-un dataset este funcția `Dataset.add_column()`. Aceasta permite să oferiți coloana ca o listă Python sau array NumPy și poate fi utilă în situații în care `Dataset.map()` nu este bine adaptat pentru analiza dumneavoastră.
+
+</Tip>
+
+Hai să folosim funcția `Dataset.filter()` pentru a elimina recenziile care conțin mai puțin de 30 de cuvinte. Similar cum am făcut în cazul coloanei `condition`, putem elimina recenziile foarte scurte cerând ca recenziile să aibă o lungime mai mare decât acest prag:
+
+```py
+drug_dataset = drug_dataset.filter(lambda x: x["review_length"] > 30)
+print(drug_dataset.num_rows)
+```
+
+```python out
+{'train': 138514, 'test': 46108}
+```
+
+După cum vedeți, aceasta a eliminat aproximativ 15% din recenziile noastrem, din seturile originale de antrenare și testare.
+
+<Tip>
+
+✏️ **Încercați!** Folosiți funcția `Dataset.sort()` pentru a inspecta recenziile cu cele mai mari numere de cuvinte. Vezi [documentația](https://huggingface.co/docs/datasets/package_reference/main_classes#datasets.Dataset.sort) pentru a vedea ce argument trebuie să folosești pentru a sorta recenziile în ordine descrescătoare.
+
+</Tip>
+
+Ultima chestie de care trebuie să ne ocupăm este prezența caracterelor HTML în recenziile noastre. Putem folosi modulul `html` din Python pentru a face unescape acestor caractere:
+
+```py
+import html
+
+text = "I&#039;m a transformer called BERT"
+html.unescape(text)
+```
+
+```python out
+"I'm a transformer called BERT"
+```
+
+Vom folosi `Dataset.map()` pentru a face unescape toate caracterele HTML din corpus:
+
+```py
+drug_dataset = drug_dataset.map(lambda x: {"review": html.unescape(x["review"])})
+```
+
+În mod evident, metoda `Dataset.map()` este foarte utilă pentru procesarea datelor – și nu am abordat decât o mică parte din ceea ce poate face!
+
+## Superputerile metodei `map()`[[the-map-methods-superpowers]]
+
+Metoda `Dataset.map()` acceptă un argument `batched` care, dacă este setat pe `True`, cauzează ca ea să trimită un batch de exemple la funcția map în același timp (dimensiunea batchului poate fi configurată dar defaultul este 1.000). De exemplu, anterior am folosit o funcție map care a făcut unescaped toate caracterele HTML din recenziile noastre și i-a luat câteva secunde să execute (puteți citi timpul pe progress bars). Putem accelera acest lucru prin procesarea mai multor elemente în același timp folosind list comprehension.
+
+Când specificați `batched=True` funcția primește un dicționar cu câmpurile datasetului, dar fiecare valoare este acum _list of values_ și nu doar o singură valoare. Valoarea de return a `Dataset.map()` ar trebui să fie la fel: un dicționar cu câmpurile pe care dorim să le actualizăm sau adăugăm în datasetul nostru, și o listă de valori. De exemplu, mai jos este alt mod de a face unescape tuturor caracterelor HTML din recenziile noastre, folosind `batched=True`:
+
+```py
+new_drug_dataset = drug_dataset.map(
+    lambda x: {"review": [html.unescape(o) for o in x["review"]]}, batched=True
+)
+```
+
+Dacă executați acest cod într-un notebook, veți vedea că această comandă se execută mult mai rapid decât cea anterioră. Și nu pentru că recenziile noastre au fost deja HTML-unescaped – dacă reexecutați instrucția precedentă (fără `batched=True`), ea va lua același timp ca înainte. Acest lucru se datorează faptului că list comprehension sunt  mai rapide decât executarea aceluiași cod într-un `for` loop, și am câștigat, de asemenea, puțină performanțp accesând multe elemente în același timp, în loc unul câte unul.
+
+Folosirea `Dataset.map()` cu `batched=True` este esențială pentru a obțina viteza "rapidă" a tokenizerilor pe care îi vom întâlni în [Capitolul 6](/course/chapter6), care pot repede să facă tokenize listelor mari de texte. De exemplu, pentru a face tokenize tuturor recenziilor medicamentelor cu un tokenizer rapid, putem folosi o funcție ca aceasta:
+
+```py
+from transformers import AutoTokenizer
+
+tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
+
+
+def tokenize_function(examples):
+    return tokenizer(examples["review"], truncation=True)
+```
+
+Așa cum am văzut în [Capitolul 3](/course/chapter3), putem transmite un singur sau câteva exemple către tokenizer, așadar putem folosi această funcție cu sau fără `batched=True`. Hai să ne folosim de această oportunitate și să comparăm performanța diferitelor opțiuni. Într-un notebook puteți măsura timpul unei instrucțiie de o line prin adăugarea `%time` înaintea acelei linii de cod pe care doriți să o măsurați:
+
+```python no-format
+%time tokenized_dataset = drug_dataset.map(tokenize_function, batched=True)
+```
+
+Puteți și să măsurați un întreg cell prin scrierea `%%time` la începutul celulei. În hardware-ul pe care l-am executat, acest lucru a arătat 10.8s pentru această instrucție (este numărul scris după "Wall time").
+
+<Tip>
+
+✏️ **Încercați!** Executați aceeași instrucție cu și fără `batched=True`, apoi încercați-o cu un tokenizer lent (adaugați `use_fast=False` în metoda `AutoTokenizer.from_pretrained()`), astfel să puteți vedea ce numere obțineți pe hardwareul vostru.
+
+</Tip>
+
+Aici sunt rezultatele pe care le-am obținut cu și fără batching, folosind un tokenizer rapid și lent:
+
+Options         | Fast tokenizer | Slow tokenizer
+:--------------:|:--------------:|:-------------:
+`batched=True`  | 10.8s          | 4min41s
+`batched=False` | 59.2s          | 5min3s
+
+Aceasta înseamnă că utilizarea unui tokenizer rapid cu opțiunea `batched=True` este de 30 de ori mai rapidă decât varianta lentă fără batching - acest lucru este pur și simplu uimitor! Acesta este motivul principal pentru care tokenizerii rapizi sunt setați implicit când se utilizează `AutoTokenizer` (și de ce sunt numiți "rapizi"). Ei pot atinge o asemenea accelerație datorită faptului că codul de tokenizare este executat în Rust, care este un limbaj care facilitează paralelizarea execuției.
+
+Parallelization este și motivul pentru care tokenizerul rapid realizează o accelerare de aproape 6 ori cu batching: nu puteți paraleliza o singură operație de tokenizare, dar atunci când doriți să tokenizați multe texte în același timp, puteți să faceți split execuției pe mai multe procese, fiecare răspunzând pentru propriile texte.
+
+`Dataset.map()` are și o capacitate de parallelization proprie. Deoarece nu sunținute de Rust, nu pot să le ofere aceeași accelerație tokenizerilori înceți ca tokenizerilor rapizi, dar pot încă fi utili (în special dacă utilizați un tokenizer care nu are o variantă rapidă). Pentru a activa multiprocessingul, folosiți argumentul `num_proc` și specificați numărul de procese să fie utilizate în apelul `Dataset.map()`:
+
+```py
+slow_tokenizer = AutoTokenizer.from_pretrained("bert-base-cased", use_fast=False)
+
+
+def slow_tokenize_function(examples):
+    return slow_tokenizer(examples["review"], truncation=True)
+
+
+tokenized_dataset = drug_dataset.map(slow_tokenize_function, batched=True, num_proc=8)
+```
+
+Puteți experimenta puțin cu timpii pentru a determina numărul de procese optime; în cazul nostru 8 s-a dovedit a produce cea mai mare accelerație. Aici sunt rezultatele pe care le-am obținut cu și fără multiprocessing:
+
+Options         | Fast tokenizer | Slow tokenizer
+:--------------:|:--------------:|:-------------:
+`batched=True`  | 10.8s          | 4min41s
+`batched=False` | 59.2s          | 5min3s
+`batched=True`, `num_proc=8`  | 6.52s          | 41.3s
+`batched=False`, `num_proc=8` | 9.49s          | 45.2s
+
+Aceste rezultate sunt mult mai bune pentru tokenizerul lent, dar și performanța tokenizerului rapid a fost semnificativ îmbunătățită. Cu toate acestea, trebuie să reamintim că aceasta nu va fi întotdeauna cazul - testele noastre au arătat că este mai rapid să utilizați `batched=True` fără acest argument în cazurile în care valoarea lui `num_proc` diferă de 8. În general, nu vă recomandăm utilizarea multiplicării proceselor pentru tokenizorii rapizi cu `batched=True`.
+
+<tip>
+
+Utilizarea `num_proc` pentru a accelera procesarea este de obicei o idee excelentă, atâta timp cât funcția pe care o utilizați nu utilizează deja multiprocessing.
+
+</tip>
+
+Toate aceste funcționalități condensate într-o singură metodă este foarte impresionant, dar asta nu e totul! Cu `Dataset.map()` și `batched=True` puteți modifica numărul de elemente din datasetul dumneavoastră. Acesta este extrem de util în numeroase situații în care doriți să creați mai multe caracteristici de antrenare dintr-un singur exemplu, și vom avea nevoie de acest lucru ca parte a preprocesării pentru câteva dintre sarcinile NLP pe care le vom discuta în [Capitolul 7](/course/chapter7).
+
+<tip>
+
+💡 În machine learning, un _exemplu_ este de obicei definit ca fiind un set de _features_ care se oferă modelului. În unele contexte, acestea vor fi seturile de coloane dintr-un `Dataset`, dar în altele (ca și aici și pentru răspunderea la întrebări) mai multe caracteristici pot fi extrase dintr-un singur exemplu și să aparțină unei singure coloane.
+
+</tip>
+
+Hai să vedem cum funcționează! Aici vom tokeniza exemplele și le vom face truncatela lungimea maximă de 128, dar vom cere tokenizerului să returneze *toate* chunkurile de text în loc de prima. Acest lucru poate fi făcut cu `return_overflowing_tokens=True`:
+
+```py
+def tokenize_and_split(examples):
+    return tokenizer(
+        examples["review"],
+        truncation=True,
+        max_length=128,
+        return_overflowing_tokens=True,
+    )
+```
+
+Hai să testăm acest lucru pe un exemplu înainte de a folosi `Dataset.map()` pentru întreg datasetul:
+
+```py
+result = tokenize_and_split(drug_dataset["train"][0])
+[len(inp) for inp in result["input_ids"]]
+```
+
+```python out
+[128, 49]
+```
+
+Așadar, primul nostru exemplu din setul de antrenare a devenit două features pentru că a fost tokenizat mai mult decât lungimea maximă de tokenuri pe care am specificat-o: prima cu lungimea 128 și a doua cu lungimea 49. Acum trebuie să facem acest lucru pentru toate elementele din dataset!
+
+```py
+tokenized_dataset = drug_dataset.map(tokenize_and_split, batched=True)
+```
+
+```python out
+ArrowInvalid: Column 1 named condition expected length 1463 but got length 1000
+```
+
+Oh no! Acesta nu a funcționat! De ce? Citind eroarea vom afla motivul: existența unei incompatibilități în lungimea uneia dintre coloane - una cu o lungime de 1,463 și alta de 1,000. Dacă ați privit [documentația](https://huggingface.co/docs/datasets/package_reference/main_classes#datasets.Dataset.map) Dataset.map(), puteți să vă reamintiți că este numărul de sampleuri care sunt oferite funcției pe care noi le facem mapping; aici aceste 1,000 exemplare creează 1,463 features noi, ceea ce duce la un shape error.
+
+Problema este că încercăm să amestecăm două dataseturi cu mărimi diferite: coloanele `drug_dataset` vor avea un număr determinat de exemple (cele 1,000 din eroare), dar `tokenized_dataset` pe care îl construim va fi mai mare (cel cu 1,463 din eroare; el este mai mare decât 1,000 pentru că tokenizăm reviewrile lungi în mai multe exemple folosind `return_overflowing_tokens=True`). Acest lucru nu funcționează pentru un `Dataset`, așadar trebuie să eliminăm sau să modificămm coloanele din datasetul vechi pentru a se potrivi dimensiunea cu cea din noul dataset. Putem face ultima din cele două opțiuni folosind argumentul `remove_columns`:
+
+```py
+tokenized_dataset = drug_dataset.map(
+    tokenize_and_split, batched=True, remove_columns=drug_dataset["train"].column_names
+)
+```
+
+Acum acest lucru funcționează fără erori. Putem verifica că noul dataset are mai multe elemente decât datasetul original prin compararea lungimilor:
+
+```py
+len(tokenized_dataset["train"]), len(drug_dataset["train"])
+```
+
+```python out
+(206772, 138514)
+```
+
+Am menționat că putem rezolva problema lungimilor diferite are coloanelor prin schimbarea vechilor coloane la aceeași dimensiune cu cele noi. Pentru aceasta, vom avea nevoie de câmpul `overflow_to_sample_mapping` returnat de tokenizer atunci când setăm `return_overflowing_tokens=True`. El ne oferă un mapping de la un nou feature index la indicele sampleului din care a provenit. Prin intermediul acesta, putem asocia fiecărei key prezentă în datasetul original cu o listă de valori de dimensiune corectă prin repetarea valorilor fiecărui exemplu atâta timp cât produce caracteristici noi:
+
+```py
+def tokenize_and_split(examples):
+    result = tokenizer(
+        examples["review"],
+        truncation=True,
+        max_length=128,
+        return_overflowing_tokens=True,
+    )
+    # Extragem maparea între noul și vechiul indice
+    sample_map = result.pop("overflow_to_sample_mapping")
+    for key, values in examples.items():
+        result[key] = [values[i] for i in sample_map]
+    return result
+```
+
+Putem observa că funcționează cu `Dataset.map()` fără ca noi să avem nevoie să eliminăm coloanele vechi:
+
+```py
+tokenized_dataset = drug_dataset.map(tokenize_and_split, batched=True)
+tokenized_dataset
+```
+
+```python out
+DatasetDict({
+    train: Dataset({
+        features: ['attention_mask', 'condition', 'date', 'drugName', 'input_ids', 'patient_id', 'rating', 'review', 'review_length', 'token_type_ids', 'usefulCount'],
+        num_rows: 206772
+    })
+    test: Dataset({
+        features: ['attention_mask', 'condition', 'date', 'drugName', 'input_ids', 'patient_id', 'rating', 'review', 'review_length', 'token_type_ids', 'usefulCount'],
+        num_rows: 68876
+    })
+})
+```
+
+Obținem același număr de features training ca și înainte, dar acum am păstrat toate câmpurile vechi. Dacă ai nevoie de ele pentru post-procesare după aplicarea modelului, ar fi util să folosiți această abordare.
+
+Acum ați învățat cum pot fi utilizate 🤗 Datasets pentru preprocesarea datelor prin metode diferite. Deși funcțiile de preprocesare ale 🤗 Datasets vor acoperi majoritatea nevoilor de antrenare a modelului,
+există momente în care veți avea nevoie să treceți la Pandas pentru accesul la caracteristici mai puternice, cum ar fi `DataFrame.groupby()` sau high-level APIs pentru vizualizare. Din fericire, 🤗 Dataset a fost proiectat astfel încât să fie interoperabil cu biblioteci precum Pandas, NumPy, PyTorch, TensorFlow și JAX. Hai să vedem cum se face acest lucru.
+
+## De la `Dataset`s la `DataFrame`s și înapoi[[from-datasets-to-dataframes-and-back]]
+
+<Youtube id="tfcY1067A5Q"/>
+
+Pentru a permite conversia între diferite biblioteci, 🤗 Datasets oferă o funcțiune `Dataset.set_format()`. Această funcție schimbă doar _output format_ al datasetului, deci puteți ușor să treceți la un alt format fără a afecta _data format_ de bază, care este Apache Arrow. Formatarea se face direct. Pentru a demonstra acest lucru, hai să convertim datasetul nostru în Pandas:
+
+```py
+drug_dataset.set_format("pandas")
+```
+
+Acum, atunci când accesăm elementele din dataset, obținem `pandas.DataFrame` în loc de un dicționar:
+
+```py
+drug_dataset["train"][:3]
+```
+
+<table border="1" class="dataframe">
+  <thead>
+    <tr style="text-align: right;">
+      <th></th>
+      <th>patient_id</th>
+      <th>drugName</th>
+      <th>condition</th>
+      <th>review</th>
+      <th>rating</th>
+      <th>date</th>
+      <th>usefulCount</th>
+      <th>review_length</th>
+    </tr>
+  </thead>
+  <tbody>
+    <tr>
+      <th>0</th>
+      <td>95260</td>
+      <td>Guanfacine</td>
+      <td>adhd</td>
+      <td>"My son is halfway through his fourth week of Intuniv..."</td>
+      <td>8.0</td>
+      <td>April 27, 2010</td>
+      <td>192</td>
+      <td>141</td>
+    </tr>
+    <tr>
+      <th>1</th>
+      <td>92703</td>
+      <td>Lybrel</td>
+      <td>birth control</td>
+      <td>"I used to take another oral contraceptive, which had 21 pill cycle, and was very happy- very light periods, max 5 days, no other side effects..."</td>
+      <td>5.0</td>
+      <td>December 14, 2009</td>
+      <td>17</td>
+      <td>134</td>
+    </tr>
+    <tr>
+      <th>2</th>
+      <td>138000</td>
+      <td>Ortho Evra</td>
+      <td>birth control</td>
+      <td>"This is my first time using any form of birth control..."</td>
+      <td>8.0</td>
+      <td>November 3, 2015</td>
+      <td>10</td>
+      <td>89</td>
+    </tr>
+  </tbody>
+</table>
+
+În continuare, vom crea un `pandas.DataFrame` pentru întregul set de antrenare prin selectarea tuturor elementelor din `drug_dataset["train"]`:
+
+```py
+train_df = drug_dataset["train"][:]
+```
+
+<Tip>
+
+🚨 În spatele scenei, `Dataset.set_format()` schimbă formatul returnat pentru  `__getitem__()` dunder method a datasetului. Asta înseamnă că atunci când dorim să creăm un nou obiect ca `train_df` dintr-un `Dataset` în formatul `"pandas"`, trebuie să tăiem întreg datasetul pentru a obține un `pandas.DataFrame`. Puteți verifica voi înşivă că tipul lui `drug_dataset["train"]` este `Dataset`, indiferent de output format.
+
+</Tip>
+
+Acum putem utiliza toate funcționalitățile Pandas pe care le dorim. De exemplu, putem face fancy chaining pentru a calcula distribuția clasei printre intrările `condition`:
+
+```py
+frequencies = (
+    train_df["condition"]
+    .value_counts()
+    .to_frame()
+    .reset_index()
+    .rename(columns={"index": "condition", "condition": "frequency"})
+)
+frequencies.head()
+```
+
+<table border="1" class="dataframe">
+  <thead>
+    <tr style="text-align: right;">
+      <th></th>
+      <th>condition</th>
+      <th>frequency</th>
+    </tr>
+  </thead>
+  <tbody>
+    <tr>
+      <th>0</th>
+      <td>birth control</td>
+      <td>27655</td>
+    </tr>
+    <tr>
+      <th>1</th>
+      <td>depression</td>
+      <td>8023</td>
+    </tr>
+    <tr>
+      <th>2</th>
+      <td>acne</td>
+      <td>5209</td>
+    </tr>
+    <tr>
+      <th>3</th>
+      <td>anxiety</td>
+      <td>4991</td>
+    </tr>
+    <tr>
+      <th>4</th>
+      <td>pain</td>
+      <td>4744</td>
+    </tr>
+  </tbody>
+</table>
+
+
+Și odată ce suntem gata cu analiza noastră Pandas, putem crea întotdeauna un nou obiect `Dataset` prin utilizarea funcției `Dataset.from_pandas()`:
+
+
+```py
+from datasets import Dataset
+
+freq_dataset = Dataset.from_pandas(frequencies)
+freq_dataset
+```
+
+```python out
+Dataset({
+    features: ['condition', 'frequency'],
+    num_rows: 819
+})
+```
+
+
+<Tip>
+
+✏️ **Încercați!** Calculați media ratingului per medicament și salvați rezultatul într-un nou `Dataset`.
+
+</Tip>
+
+
+Acest lucru completează turul nostru de tehnici de preprocesare disponibile în 🤗 Datasets. Pentru a finisa secțiunea, vom crea un set de validare pentru a pregăti datasetul pentru antrenarea unui clasificator. Înainte de a face asta, noi vom reseta output formatul `drug_dataset` de la `"pandas"` la `"arrow" :
+
+
+```python
+drug_dataset.reset_format()
+```
+
+## Crearea unui set de validare [[creating-a-validation-set]]
+
+Deși avem deja un set de testare pe care îl putem folosi pentru evaluare, este o bună practică să lăsăm setul de test neschimbat și să creăm un set de validare în timpul developmentului. Odată ce sunteți fericiți cu performanța modelului pe setul de validare, puteți face o verificare finală a setului de test. Acest proces ajută la reducerea riscului ca să vă adaptați prea mult setul de test și să depuneți un model care poate eșua analizând date reale.
+
+🤗 Datasets oferă o funcție `Dataset.train_test_split()` bazată pe funcționalitatea celebră din `scikit-learn`. O vom folosi pentru a împărți setul nostru de antrenare în split-uri de `train` și `validation` (setăm argumentul `seed` pentru reproductabilitate):
+
+```python
+drug_dataset_clean = drug_dataset["train"].train_test_split(train_size=0.8, seed=42)
+# Renumește implicit "test" split-ul la "valide"
+drug_dataset_clean["validation"] = drug_dataset_clean.pop("test")
+# Adaugă setul de test în `DatasetDict`
+drug_dataset_clean["test"] = drug_dataset["test"]
+drug_dataset_clean
+```
+
+```python out
+DatasetDict({
+    train: Dataset({
+        features: ['patient_id', 'drugName', 'condition', 'review', 'rating', 'date', 'usefulCount', 'review_length', 'review_clean'],
+        num_rows: 110811
+    })
+    validation: Dataset({
+        features: ['patient_id', 'drugName', 'condition', 'review', 'rating', 'date', 'usefulCount', 'review_length', 'review_clean'],
+        num_rows: 27703
+    })
+    test: Dataset({
+        features: ['patient_id', 'drugName', 'condition', 'review', 'rating', 'date', 'usefulCount', 'review_length', 'review_clean'],
+        num_rows: 46108
+    })
+})
+```
+
+Foarte bine, am pregătit acum un dataset care este gata pentru antrenarea unor modele! În [Secțiunea 5](/course/chapter5/5) vom arăta cum puteți încărca seturile de date în Hugging Face Hub, dar în acest moment hai să punem capăt analizei noastre prin examinarea a câteva modalități de salvare a seturilor de date pe dispozitivele locale.
+
+## Salvarea unui dataset[[saving-a-dataset]]
+
+<Youtube id="blF9uxYcKHo"/>
+
+Deși 🤗 Datasets va face cache fiecărui dataset și a operațiilor efectuate asupra acestuia, există momente în care veți dori să salvați un dataset pe disc (de exemplu, în cazul în care cache-ul se șterge). După cum vedeți în tabelul de mai jos, 🤗 Datasets oferă trei funcții principale pentru salvarea datelor în formate diferite:
+
+| Format de date | Funcție |
+| :---------: | :--------------------: |
+|    Arrow    | `Dataset.save_to_disk()` |
+|     CSV     |    `Dataset.to_csv()`    |
+|    JSON     |   `Dataset.to_json()`    |
+
+Spre exemplu, hai să salvăm datasetul nostru curățat în formatul Arrow:
+
+```python
+drug_dataset_clean.save_to_disk("drug-reviews")
+```
+
+Acest lucru va crea un folder cu următoarea structură:
+
+```
+drug-reviews/
+├── dataset_dict.json
+├── test
+│   ├── dataset.arrow
+│   ├── dataset_info.json
+│   └── state.json
+├── train
+│   ├── dataset.arrow
+│   ├── dataset_info.json
+│   ├── indices.arrow
+│   └── state.json
+└── validation
+    ├── dataset.arrow
+    ├── dataset_info.json
+    ├── indices.arrow
+    └── state.json
+```
+
+unde se poate vedea că fiecare split este asociat cu propriul său tabel `dataset.arrow`, iar unele metadate în `dataset_info.json` și `state.json`. Poți să te gândești la formatul Arrow ca fiind un tabel facny de coloane și rânduri, optimizat pentru construirea aplicațiilor high-performance care procesează și transportă dataseturi mari.
+
+Odată ce setul de date este salvat, putem încărca-o folosind funcția `load_from_disk()` următoarea:
+
+```py
+from datasets import load_from_disk
+
+drug_dataset_reloaded = load_from_disk("drug-reviews")
+drug_dataset_reloaded
+```
+
+```python out
+DatasetDict({
+    train: Dataset({
+        features: ['patient_id', 'drugName', 'condition', 'review', 'rating', 'date', 'usefulCount', 'review_length'],
+        num_rows: 110811
+    })
+    validation: Dataset({
+        features: ['patient_id', 'drugName', 'condition', 'review', 'rating', 'date', 'usefulCount', 'review_length'],
+        num_rows: 27703
+    })
+    test: Dataset({
+        features: ['patient_id', 'drugName', 'condition', 'review', 'rating', 'date', 'usefulCount', 'review_length'],
+        num_rows: 46108
+    })
+})
+```
+
+Pentru formatele CSV și JSON, trebuie să stocați fiecare split într-un fișier separat. Un mod de a face acest lucru estw iterarea asupra cheilor și valorilor obiectului `DatasetDict`:
+
+```py
+for split, dataset in drug_dataset_clean.items():
+    dataset.to_json(f"drug-reviews-{split}.jsonl")
+```
+
+Acesta salvează fiecare split în [JSON Lines format](https://jsonlines.org), unde fiecare rând din setul de date este stocat ca o singură linie JSON. Aici puteți vedea cum arată primul exemplu:
+
+```bash
+!head -n 1 drug-reviews-train.jsonl
+```
+
+```python out
+{"patient_id":141780,"drugName":"Escitalopram","condition":"depression","review":"\"I seemed to experience the regular side effects of LEXAPRO, insomnia, low sex drive, sleepiness during the day. I am taking it at night because my doctor said if it made me tired to take it at night. I assumed it would and started out taking it at night. Strange dreams, some pleasant. I was diagnosed with fibromyalgia. Seems to be helping with the pain. Have had anxiety and depression in my family, and have tried quite a few other medications that haven't worked. Only have been on it for two weeks but feel more positive in my mind, want to accomplish more in my life. Hopefully the side effects will dwindle away, worth it to stick with it from hearing others responses. Great medication.\"","rating":9.0,"date":"May 29, 2011","usefulCount":10,"review_length":125}
+```
+
+Putem apoi folosi tehnicile de la [Secțiunea 2](/course/chapter5/2) pentru încărcarea fișierelor JSON:
+
+```py
+data_files = {
+    "train": "drug-reviews-train.jsonl",
+    "validation": "drug-reviews-validation.jsonl",
+    "test": "drug-reviews-test.jsonl",
+}
+drug_dataset_reloaded = load_dataset("json", data_files=data_files)
+```
+
+Și ăsta este finalul excursiei noastre în lumea manipulării datelor cu 🤗 Datasets! Acum că avem un dataset curat, pregătit pentru antrenarea unui model, aici sunt câteva idei pe care le puteți încerca:
+
+1. Folosiți tehnicile din [Capitolul 3](/course/chapter3) pentru a antrena un classifier care poate prezice starea pacientului pe baza recenziei medicamentului.
+2. Folosiți pipelineul `summarization` din [Capitolul 1](/course/chapter1) pentru a genera rezumate ale recenziilor.
+
+În următoarea secțiune, vom vedea cum 🤗 Datasets vă permite să lucrați cu dataseturi mari fără ca laptopul tău să explodeze :)!
\ No newline at end of file
diff --git a/chapters/rum/chapter5/4.mdx b/chapters/rum/chapter5/4.mdx
new file mode 100644
index 000000000..8d33eeca8
--- /dev/null
+++ b/chapters/rum/chapter5/4.mdx
@@ -0,0 +1,287 @@
+# Big data? 🤗 Datasets vine în ajutor![[big-data-datasets-to-the-rescue]]
+
+<CourseFloatingBanner chapter={5}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[ 
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter5/section4.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter5/section4.ipynb"},
+]} />
+
+În prezent, nu este de neașteptat să te confrunți cu dataseturi de câțiva gigabytes, mai ales dacă planifici să preantreenezi un transformer ca BERT sau GPT-2 de la zero. În aceste cazuri, chiar _loading_ a datelor poate fi o provocare. De exemplu, corpusul WebText folosit pentru a preantreena GPT-2 conține peste 8 milioane de documente și 40 GB de text – încărcarea acestuia în memoria RAM a laptopului tău este probabil să-i facă un atac cardiac!
+
+Norocul este că Datasets 🤗 a fost proiectat pentru a depăși aceste limitări. El te eliberează de problemele de gestionare a memoriei, tratarea dataseturilor ca fișiere _memory-mapped_, și limitele hard driveului prin _streamingul_ intrărilor dintr-un corpus.
+
+<Youtube id="JwISwTCPPWo"/>
+
+În această secțiune vom explora aceste caracteristici ale 🤗Datasets cu un corpus de 825 GB numit [Pile](https://pile.eleuther.ai). Să începem!
+
+## Ce este Pile?[[what-is-the-pile]]
+
+Pile este un corpus de text englezesc creat de [EleutherAI](https://www.eleuther.ai) pentru antrenarea large-scale language models. Acesta include o varietate diversă de dataseturi, cuprinzând articole științifice, repositoriuri GitHub și texte web filtrate. Corpusul de antrenare este disponibil în chunkuri de [14 GB](https://the-eye.eu/public/AI/pile/), dar în același timp puteți descărca și câteva dintre [componenetele 
+individuale](https://the-eye.eu/public/AI/pile_preliminary_components/). Să începem prin examinarea datasetului PubMed Abstracts, care este un corpus de rezumate din 15 milioane de publicații științifice biomedicale de pe [PubMed](https://pubmed.ncbi.nlm.nih.gov/). Datasetul este în format JSON și este comprimat cu librăria `zstandard`, așadar prima dată ne trebuie să o instalăm pe aceasta:
+
+```py
+!pip install zstandard
+```
+
+În continuare, putem încărca datasetul utilizând metoda pentru fișierele remote pe care am învățat-o în [secțiunea 2](/course/chapter5/2):
+
+```py
+from datasets import load_dataset
+
+# Acest lucru durează câteva minute, așadar poți să te duci să îți iei un ceai sau o cafea între timp :))
+data_files = "https://the-eye.eu/public/AI/pile_preliminary_components/PUBMED_title_abstracts_2019_baseline.jsonl.zst"
+pubmed_dataset = load_dataset("json", data_files=data_files, split="train")
+pubmed_dataset
+```
+
+```python out
+Dataset({
+    features: ['meta', 'text'],
+    num_rows: 15518009
+})
+```
+
+Putem observa că există 15.518.009 de linii și două colonne în datasetul nostru – e foarte mult!
+
+<Tip>
+
+✎ De abia acum, 🤗 Datasets va descompresa fișierele necesare pentru încărcarea datasetului. Dacă doriți vreei să salvezi spațiu pe hard driveul tău, puteți transmite `DownloadConfig(delete_extracted=True)` la argumentul `download_config` al `load_dataset()`. Vedeți mai multe detalii în [documentație](https://huggingface.co/docs/datasets/package_reference/builder_classes#datasets.DownloadConfig).
+
+</Tip>
+
+Acum hai să analizăm conținutul primei linii:
+
+```py
+pubmed_dataset[0]
+```
+
+```python out
+{'meta': {'pmid': 11409574, 'language': 'eng'},
+ 'text': 'Epidemiology of hypoxaemia in children with acute lower respiratory infection.\nTo determine the prevalence of hypoxaemia in children aged under 5 years suffering acute lower respiratory infections (ALRI), the risk factors for hypoxaemia in children under 5 years of age with ALRI, and the association of hypoxaemia with an increased risk of dying in children of the same age ...'}
+```
+
+Okay, acesta pare a fi un rezumat dintr-un articol medical. Să vedem cât de mult spațiu RAM am folosit pentru încărcarea datasetului!
+
+## Magia memory mappingului[[the-magic-of-memory-mapping]]
+
+Una dintre modalitățile simple de măsurare a utilizării memoriei în Python este cu biblioteca `psutil`, care poate fi instalată cu `pip`:
+
+```python
+!pip install psutil
+```
+
+Biblioteca oferă o clasă `Process` ce ne permite să verificăm utilizarea memoriei procesului curent astfel:
+
+```py
+import psutil
+
+# Process.memory_info este exprimat în bytes, așadar convertim la megabyte
+print(f"Utilizare RAM: {psutil.Process().memory_info().rss / (1024 * 1024):.2f} MB")
+```
+
+```python out
+Utilizarea RAM: 5678.33 MB
+```
+
+Aici `rss` se referă la _resident set size_ , care este partea memoriei ocupată de proces în RAM. Această măsurare include și memoria folosită de Python interpreter și librariile pe care le-am încărcat, așadar cantitatea reală de memorie utilizată pentru încărcarea datelor este puțin mai mică. Pentru comparație, putem să vedem cât de mare este datasetul pe disc folosind atributul `dataset_size`. Deoarece rezultatul este exprimat în bytes, putem să îl convertim manual la gigabyte:
+
+```py
+print(f"Number of files in dataset : {pubmed_dataset.dataset_size}")
+size_gb = pubmed_dataset.dataset_size / (1024**3)
+print(f"Dataset size (cache file) : {size_gb:.2f} GB")
+```
+
+```python out
+Number of files in dataset : 20979437051
+Dataset size (cache file) : 19.54 GB
+```
+
+
+Nice – deși este aproximativ 20 GB, putem încărca și accesa datasetul cu mult mai puțin RAM!
+
+<Tip>
+
+✏️ **Încercați!** Alegeți una dintre [subseturile](https://the-eye.eu/public/AI/pile_preliminary_components/) din Pile care este mai mare decât memoria RAM a laptopului sau dispozitivului tău, încărcați-o cu 🤗 Datasets și măsurați cantitatea de memorie folosită. Pentru o măsurare precisă, veți dori să faceți acest lucru într-un proces nou. Puteți găsi dimensiunile decomprimate ale fiecărui subset în Tabelul 1 din [Pile paper](https://arxiv.org/abs/2101.00027). 
+
+</Tip>
+
+Dacă sunteți familiarizați cu Pandas, rezultatul acesta poate veni ca o surpriză din cauza celebrei [rule of thumbă](https://wesmckinney.com/blog/apache-arrow-pandas-internals/) al lui Wes Kinney, care spune că în mod normal aveți nevoie de 5 până la 10 ori mai mult spațiu pe RAM decât mărimea datasetului. Deci 🤗 Datasets această problemă de memory management? 🤗 Datasets tratează fiecare dataset ca un [memory-mapped file](https://en.wikipedia.org/wiki/Memory-mapped_file), care oferă un mapping între spațiul RAM și stocarea pe sistem, ceea ce permite bibliotecii să acceseze și să opereze asupra elementelor datasetului fără a trebui să-l încarce în totalitate în memorie.
+
+Memory-mapped files pot fi și distribuite între mai multe procese, ceea ce permite metodelor cum ar fi `Dataset.map()` să fie parallelized fără necesitatea mutării sau copierii datasetului. În spatele acestor facilități se află [formatul de memorie Apache Arrow](https://arrow.apache.org) și biblioteca [`pyarrow`](https://arrow.apache.org/docs/python/index.html), care realizează încărcarea datelor și procesarea la viteze fulgerătoare. (Pentru mai multe detalii despre Apache Arrow și compararea sa cu Pandas, vă rugăm să citiți [blogul lui Dejan Simic](https://towardsdatascience.com/apache-arrow-read-dataframe-with-zero-memory-69634092b1a).) Pentru a vedea acest lucru în acțiune, hai să încercăm un speed test prin iterarea asupra tuturor elementelor din datasetul PubMed Abstracts:
+
+```py
+import timeit
+
+code_snippet = """batch_size = 1000
+
+for idx in range(0, len(pubmed_dataset), batch_size):
+    _ = pubmed_dataset[idx:idx + batch_size]
+"""
+
+time = timeit.timeit(stmt=code_snippet, number=1, globals=globals())
+print(
+    f"Iterated over {len(pubmed_dataset)} examples (about {size_gb:.1f} GB) in "
+    f"{time:.1f}s, i.e. {size_gb/time:.3f} GB/s"
+)
+```
+
+```python out
+'Iterated over 15518009 examples (about 19.5 GB) in 64.2s, i.e. 0.304 GB/s'
+```
+
+Aici am folosit modulul `timeit` al Python pentru a măsura timpul de execuție necesar pentru a rula `code_snippet`. În mod normal veți putea trece peste un dataset la viteze de câteva sute de MB/s până la câțiva GB/s. Acest lucru funcționează bine pentru majoritatea aplicațiilor, dar uneori veți avea nevoie să lucrați cu un dataset care este prea mare ca să încapă pe hard driveul laptopului tău. De exemplu, dacă am încerca să descarcăm Pile în întregime, am avea nevoie de 825 GB de spațiu liber! Pentru a vă ajuta cu astfel de cazuri, 🤗 Datasets oferă o feature de streaming care permite accesarea și descărcarea elementelor, fără a trebui să descărcați întregul dataset. Hai să vedem cum funcționează!
+
+<Tip>
+
+💡În Jupyter notebooks poți să măsori timpul unei celule utilizând [funcția magică `%%timeit`](https://ipython.readthedocs.io/en/stable/interactive/magics.html#magic-timeit).
+
+</Tip>
+
+## Streamingul dataseturilor[[streaming-datasets]]
+
+Pentru a activa dataset streaming este suficient să dați argumentul `streaming=True` funcției `load_dataset()`. De exemplu, să încercăm să încărcăm datasetul PubMed Abstracts în streaming mode:
+
+```py
+pubmed_dataset_streamed = load_dataset(
+    "json", data_files=data_files, split="train", streaming=True
+)
+```
+
+În locul `Dataset`-ului obișnuit pe care l-am întâlnit până acum în acest capitol, obiectul returnat cu `streaming=True` este un `IterableDataset`. După nume putem deduce că pentru a accesa elementele dintr-un `IterableDataset`, trebuie să iterăm prin el. Prin urmare, putem accesa primul element al streamed datased astfel:
+
+```py
+next(iter(pubmed_dataset_streamed))
+```
+
+```python out
+{'meta': {'pmid': 11409574, 'language': 'eng'},
+ 'text': 'Epidemiology of hypoxaemia in children with acute lower respiratory infection.\nTo determine the prevalence of hypoxaemia in children aged under 5 years suffering acute lower respiratory infections (ALRI), the risk factors for hypoxaemia in children under 5 years of age with ALRI, and the association of hypoxaemia with an increased risk of dying in children of the same age ...'}
+```
+
+Elementele unui streamed dataset pot fi procesate din mers folosind `IterableDataset.map()`, ceea ce este util în timpul antrenării dacă aveți nevoie să tokenizeți inputurile. Procesarea se face exact la fel ca și în [Capitolul 3](/course/chapter3), cu singura deosebire fiind că rezultatele sunt returnate una câte una:
+
+```py
+from transformers import AutoTokenizer
+
+tokenizer = AutoTokenizer.from_pretrained("distilbert-base-uncased")
+tokenized_dataset = pubmed_dataset_streamed.map(lambda x: tokenizer(x["text"]))
+next(iter(tokenized_dataset))
+```
+
+```python out
+{'input_ids': [101, 4958, 5178, 4328, 6779, ...], 'attention_mask': [1, 1, 1, 1, 1, ...]}
+```
+
+<Tip>
+
+💡 Pentru a accelera tokenizarea cu streaming puteți seta `batched=True`, ca și în secțiunea precedentă. Acest lucru va procesa exemplele, batch cu batch; dimensiunea implicită a batchului este de 1,000 și poate fi specificată cu argumentul `batch_size`.
+
+</Tip>
+
+De asemenea, puteți amesteca un streamed dataset utilizând `IterableDataset.shuffle()`, dar față de `Dataset.shuffle()` acest lucru va amesteca doar elementele dintr-un `buffer_size` predefinit:
+
+```py
+shuffled_dataset = pubmed_dataset_streamed.shuffle(buffer_size=10_000, seed=42)
+next(iter(shuffled_dataset))
+```
+
+```python out
+{'meta': {'pmid': 11410799, 'language': 'eng'},
+ 'text': 'Randomized study of dose or schedule modification of granulocyte colony-stimulating factor in platinum-based chemotherapy for elderly patients with lung cancer ...'}
+```
+
+În acest exemplu, am selectat un exemplu aleatoriu din primele 10,000 exemple din buffer. Odată ce un exemplu este accesat, locul lui în buffer este completat cu următorul exemplu din corpus (adica exemplarul 10,001 în cazul de mai sus). Puteți selecta elemente dintr-un streamed dataset utilizând funcțiile `IterableDataset.take()` și `IterableDataset.skip()`, care acționează în mod similar cu `Dataset.select()`. De exemplu, pentru a selecta primele 5 exemple din PubMed Abstracts dataset putem face următorul lucru:
+
+```py
+dataset_head = pubmed_dataset_streamed.take(5)
+list(dataset_head)
+```
+
+```python out
+[{'meta': {'pmid': 11409574, 'language': 'eng'},
+  'text': 'Epidemiology of hypoxaemia in children with acute lower respiratory infection ...'},
+ {'meta': {'pmid': 11409575, 'language': 'eng'},
+  'text': 'Clinical signs of hypoxaemia in children with acute lower respiratory infection: indicators of oxygen therapy ...'},
+ {'meta': {'pmid': 11409576, 'language': 'eng'},
+  'text': "Hypoxaemia in children with severe pneumonia in Papua New Guinea ..."},
+ {'meta': {'pmid': 11409577, 'language': 'eng'},
+  'text': 'Oxygen concentrators and cylinders ...'},
+ {'meta': {'pmid': 11409578, 'language': 'eng'},
+  'text': 'Oxygen supply in rural africa: a personal experience ...'}]
+```
+
+În mod similar puteți utiliza funcția `IterableDataset.skip()` pentru a crea splituri de antrenare și validare dintr-un set de date amestecat astfel:
+
+```py
+# Săriți primele 1,000 exemple și includeți restul în setul de antrenare
+train_dataset = shuffled_dataset.skip(1000)
+# Luați primele 1,000 de exemple pentru setul de validare
+validation_dataset = shuffled_dataset.take(1000)
+```
+
+Hai să terminăm explorarea streamingului asupra datasetului cu o aplicație comună: combinarea multiplelor dataseturi împreună pentru a crea un singur corpus. 🤗 Datasets oferă o funcție `interleave_datasets()` care convertește o listă de obiecte `IterableDataset` într-un singur `IterableDataset`, unde elementele noului datasetsunt obținute prin alternarea între exemplele sursă. Această funcție este utilă, în special atunci când încercați să combinați dataseturi mari, ca exemplu vom face stream al subsetul FreeLaw din Pile, care reprezintă un dataset de 51 GB de opinii juridice din instanțe din SUA:
+
+```py
+law_dataset_streamed = load_dataset(
+    "json",
+    data_files="https://the-eye.eu/public/AI/pile_preliminary_components/FreeLaw_Opinions.jsonl.zst",
+    split="train",
+    streaming=True,
+)
+next(iter(law_dataset_streamed))
+```
+
+```python out
+{'meta': {'case_ID': '110921.json',
+  'case_jurisdiction': 'scotus.tar.gz',
+  'date_created': '2010-04-28T17:12:49Z'},
+ 'text': '\n461 U.S. 238 (1983)\nOLIM ET AL.\nv.\nWAKINEKONA\nNo. 81-1581.\nSupreme Court of United States.\nArgued January 19, 1983.\nDecided April 26, 1983.\nCERTIORARI TO THE UNITED STATES COURT OF APPEALS FOR THE NINTH CIRCUIT\n*239 Michael A. Lilly, First Deputy Attorney General of Hawaii, argued the cause for petitioners. With him on the brief was James H. Dannenberg, Deputy Attorney General...'}
+```
+
+Această dataset este suficient de mare încât să pună presiune asupra RAM-ului a majorității laptopurilor, dar am reușit să îl încarcăm și să îl accesăm fără să ne facem griji. Acum hai să combinăm exemplele din dataseturile FreeLaw și PubMed Abstracts cu funcția `interleave_datasets()`:
+
+```py
+from itertools import islice
+from datasets import interleave_datasets
+
+combined_dataset = interleave_datasets([pubmed_dataset_streamed, law_dataset_streamed])
+list(islice(combined_dataset, 2))
+```
+
+```python out
+[{'meta': {'pmid': 11409574, 'language': 'eng'},
+  'text': 'Epidemiology of hypoxaemia in children with acute lower respiratory infection ...'},
+ {'meta': {'case_ID': '110921.json',
+   'case_jurisdiction': 'scotus.tar.gz',
+   'date_created': '2010-04-28T17:12:49Z'},
+  'text': '\n461 U.S. 238 (1983)\nOLIM ET AL.\nv.\nWAKINEKONA\nNo. 81-1581.\nSupreme Court of United States.\nArgued January 19, 1983.\nDecided April 26, 1983.\nCERTIORARI TO THE UNITED STATES COURT OF APPEALS FOR THE NINTH CIRCUIT\n*239 Michael A. Lilly, First Deputy Attorney General of Hawaii, argued the cause for petitioners. With him on the brief was James H. Dannenberg, Deputy Attorney General...'}]
+```
+
+Aici am folosit funcția `islice()` din modulul Python `itertools` pentru a selecta primele două exemple din datasetul combinat, și putem vedea că acestea corespund primelor exemple din fiecare dintre cele două dataseturi originale.
+
+În final, dacă doriți să faceți streaming la Pile în întregime (825 GB), puteți rula toate fișierele pregătite după în acest mod:
+
+```py
+base_url = "https://the-eye.eu/public/AI/pile/"
+data_files = {
+    "train": [base_url + "train/" + f"{idx:02d}.jsonl.zst" for idx in range(30)],
+    "validation": base_url + "val.jsonl.zst",
+    "test": base_url + "test.jsonl.zst",
+}
+pile_dataset = load_dataset("json", data_files=data_files, streaming=True)
+next(iter(pile_dataset["train"]))
+```
+
+```python out
+{'meta': {'pile_set_name': 'Pile-CC'},
+ 'text': 'It is done, and submitted. You can play “Survival of the Tastiest” on Android, and on the web...'}
+```
+
+<Tip>
+
+✏️ **Încercați!** Utilizați unul dintre cele mari corpusuri Common Crawl ca [`mc4`](https://huggingface.co/datasets/mc4) sau [`oscar`](https://huggingface.co/datasets/oscar) pentru a crea un streaming dataset multilingv care reprezintă proporția limbii vorbite într-o țară aleasă de tine. De exemplu, cele patru limbi naționale din Elveția sunt germana, franceza, italiana și romansha, așadar puteți încerca să creați un corpus elvețian prin samplingul subseturilor Oscar în funcție de proporția lor vorbită.
+
+</Tip>
+
+Acum aveți toate instrumentele necesare pentru a încărca și procesa dataseturi de orice formă și dimensiune – dar, din păcate, va veni un moment în care veți trebui să creați voi înșivă un dataset pentru a rezolva problema pe care o aveți. Acesta este subiectul următoarei secțiuni!
diff --git a/chapters/rum/chapter5/5.mdx b/chapters/rum/chapter5/5.mdx
new file mode 100644
index 000000000..3f245b7eb
--- /dev/null
+++ b/chapters/rum/chapter5/5.mdx
@@ -0,0 +1,404 @@
+# Crearea propriului tău dataset[[creating-your-own-dataset]]
+
+<CourseFloatingBanner chapter={5}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter5/section5.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter5/section5.ipynb"},
+]} />
+
+Uneori, datasetul necesar pentru a construi o aplicație NLP nu există, astfel încât veți trebui să-l creați singuri. În această secțiune vom arăta cum să creați un corpus de [GitHub issues](https://github.com/features/issues/), care sunt utilizate în mod obișnuit pentru a urmări erorile sau feature-urile din repositoriurile GitHub. Acest corpus poate fi folosit pentru diverse scopuri, inclusiv:
+
+* Explorarea timpului necesar pentru închiderea unor issues deschise sau pull requesturi
+* Antrenarea unui _multilabel classifier_ care poate eticheta issue-urile cu metadate pe baza descrierii issue-urilor (de exemplu, "bug", "enhancement" sau "question")
+* Crearea unui motor de căutare semantică pentru a găsi care issues se potrivesc query-ului utilizatorului
+
+În această secțiune ne vom focusa pe crearea corpusului, și în următoarea vom aborda aplicația motorului de căutare semantic. Pentru a păstra lucrurile meta, vom folosi issue-urile GitHub asociate cu un proiect open source popular: 🤗 Datasets! Să vedem cum să obținem datele și să explorăm informațiile conținute în aceste issue-uri.
+
+## Obținerea datelor[[getting-the-data]]
+
+Puteți găsi toate issue-urile din 🤗 Datasets navigând către tabul [Issues](https://github.com/huggingface/datasets/issues) al repositorului. Așa cum arată următorul screenshot, la momentul scrierii acestui text existau 331 de issues deschise și 668 închise.
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter5/datasets-issues.png" alt="Issue-urile GitHub asociate cu 🤗 Datasets." width="80%"/>
+</div>
+
+Dacă ați da clic pe una dintre aceste issue-uri veți găsi că aceasta conține un titlu, o descriere și un set de labeluri care caracterizează issue-ul. Un exemplu este prezentat în screenshotul următor.
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter5/datasets-issues-single.png" alt="Un issue tipic în GitHub din repositoriul 🤗 Datasets." width="80%"/>
+</div>
+
+Pentru a descărca toate issue-urile din repositoriu, vom folosi [GitHub REST API](https://docs.github.com/en/rest) pentru a enumera [`Issues` endpoint](https://docs.github.com/en/rest/reference/issues#list-repository-issues). Aceast endpoint returnează o listă de obiecte JSON, cu fiecare obiect conținând un număr mare de câmpuri care includ titlul și descrierea precum și metadata despre starea issue-ului și așa mai departe.
+
+Un mod convenabil de descărcare a issue-urilor este prin utilizarea librăriei `requests`, care este modalitatea standard pentru a face cereri HTTP în Python. Puteți instala libraria rulând comanda:
+
+```python
+!pip install requests
+```
+
+Odată cu instalarea librariei, puteți face cereri GET la `Issues` endpoint prin invocarea funcției `requests.get()`. De exemplu, puteți rula următorul cod pentru a obține primul issue din prima pagină:
+
+```py
+import requests
+
+url = "https://api.github.com/repos/huggingface/datasets/issues?page=1&per_page=1"
+response = requests.get(url)
+```
+
+Obiectul `response` conține o cantitate mare de informații utile despre requestul efectuat, inclusiv HTTP status code:
+
+```py
+response.status_code
+```
+
+```python out
+200
+```
+
+unde statusul `200` înseamnă că cererea a fost reușită (puteți găsi o listă completă de status coduri [aici](https://en.wikipedia.org/wiki/List_of_HTTP_status_codes)). De ceea ce suntem însă interesați este _payload_, care poate fi accesat în diverse formaturi precum bytes, string sau JSON. Deoarece știm că issue-urile noastre sunt în format JSON, să inspectăm payload-ul astfel:
+
+```py
+response.json()
+```
+
+```python out
+[{'url': 'https://api.github.com/repos/huggingface/datasets/issues/2792',
+  'repository_url': 'https://api.github.com/repos/huggingface/datasets',
+  'labels_url': 'https://api.github.com/repos/huggingface/datasets/issues/2792/labels{/name}',
+  'comments_url': 'https://api.github.com/repos/huggingface/datasets/issues/2792/comments',
+  'events_url': 'https://api.github.com/repos/huggingface/datasets/issues/2792/events',
+  'html_url': 'https://github.com/huggingface/datasets/pull/2792',
+  'id': 968650274,
+  'node_id': 'MDExOlB1bGxSZXF1ZXN0NzEwNzUyMjc0',
+  'number': 2792,
+  'title': 'Update GooAQ',
+  'user': {'login': 'bhavitvyamalik',
+   'id': 19718818,
+   'node_id': 'MDQ6VXNlcjE5NzE4ODE4',
+   'avatar_url': 'https://avatars.githubusercontent.com/u/19718818?v=4',
+   'gravatar_id': '',
+   'url': 'https://api.github.com/users/bhavitvyamalik',
+   'html_url': 'https://github.com/bhavitvyamalik',
+   'followers_url': 'https://api.github.com/users/bhavitvyamalik/followers',
+   'following_url': 'https://api.github.com/users/bhavitvyamalik/following{/other_user}',
+   'gists_url': 'https://api.github.com/users/bhavitvyamalik/gists{/gist_id}',
+   'starred_url': 'https://api.github.com/users/bhavitvyamalik/starred{/owner}{/repo}',
+   'subscriptions_url': 'https://api.github.com/users/bhavitvyamalik/subscriptions',
+   'organizations_url': 'https://api.github.com/users/bhavitvyamalik/orgs',
+   'repos_url': 'https://api.github.com/users/bhavitvyamalik/repos',
+   'events_url': 'https://api.github.com/users/bhavitvyamalik/events{/privacy}',
+   'received_events_url': 'https://api.github.com/users/bhavitvyamalik/received_events',
+   'type': 'User',
+   'site_admin': False},
+  'labels': [],
+  'state': 'open',
+  'locked': False,
+  'assignee': None,
+  'assignees': [],
+  'milestone': None,
+  'comments': 1,
+  'created_at': '2021-08-12T11:40:18Z',
+  'updated_at': '2021-08-12T12:31:17Z',
+  'closed_at': None,
+  'author_association': 'CONTRIBUTOR',
+  'active_lock_reason': None,
+  'pull_request': {'url': 'https://api.github.com/repos/huggingface/datasets/pulls/2792',
+   'html_url': 'https://github.com/huggingface/datasets/pull/2792',
+   'diff_url': 'https://github.com/huggingface/datasets/pull/2792.diff',
+   'patch_url': 'https://github.com/huggingface/datasets/pull/2792.patch'},
+  'body': '[GooAQ](https://github.com/allenai/gooaq) dataset was recently updated after splits were added for the same. This PR contains new updated GooAQ with train/val/test splits and updated README as well.',
+  'performed_via_github_app': None}]
+```
+
+Uau, aceasta e o cantitate mare de informație! Putem vedea câmpuri utile cum ar fi `title`, `body` și `number` care descriu problema, precum și informații despre utilizatorul GitHub care a deschis issue-ul.
+
+<Tip>
+
+✏️ **Încercați!** Faceți clic pe câteva dintre URL-urile din payload-ul JSON de mai sus pentru a vă familiariza cu tipul de informații către care se face referire pentru fiecare GitHub issue.
+
+</Tip>
+
+După cum este descris în [documentația](https://docs.github.com/en/rest/overview/resources-in-the-rest-api#rate-limiting) GitHub, solicitările neautentificate sunt limitate la 60 de solicitări pe oră. Deși puteți crește `per_page` query parameter pentru a reduce numărul de solicitări pe care le faceți, oricum veți atinge limita pentru orice repository care are mai mult de câteva mii de issues. Prin urmare, ar trebui să urmați [instrucțiunile](https://docs.github.com/en/github/authenticating-to-github/creating-a-personal-access-token) GitHub pentru crearea unui _personal access token_ astfel încât să puteți crește limita la 5.000 de solicitări pe oră. Odată ce aveți tokenul, îl puteți include ca parte a request header:
+
+```py
+GITHUB_TOKEN = xxx  # Copy your GitHub token here
+headers = {"Authorization": f"token {GITHUB_TOKEN}"}
+```
+
+<Tip warning={true}>
+
+⚠️ Nu oferiți nimănui un notebook cu `GITHUB_TOKEN` în el . Vă recomandăm să ștergeți ultima celulă odată ce ați executat-o pentru a evita scurgerea accidentală a acestor informații. Chiar mai bine, stocați tokenul într-un fișier *.env* și utilizați biblioteca `python-dotenv` pentru a îl încărca automat ca variabilă de mediu.
+
+</Tip>
+
+Acum că avem tokenul de acces, hai să creăm o funcție care să poată descărca toate issue-urile dintr-un repositoriu GitHub:
+
+```py
+import time
+import math
+from pathlib import Path
+import pandas as pd
+from tqdm.notebook import tqdm
+
+
+def fetch_issues(
+    owner="huggingface",
+    repo="datasets",
+    num_issues=10_000,
+    rate_limit=5_000,
+    issues_path=Path("."),
+):
+    if not issues_path.is_dir():
+        issues_path.mkdir(exist_ok=True)
+
+    batch = []
+    all_issues = []
+    per_page = 100  # Number of issues to return per page
+    num_pages = math.ceil(num_issues / per_page)
+    base_url = "https://api.github.com/repos"
+
+    for page in tqdm(range(num_pages)):
+        # Query with state=all to get both open and closed issues
+        query = f"issues?page={page}&per_page={per_page}&state=all"
+        issues = requests.get(f"{base_url}/{owner}/{repo}/{query}", headers=headers)
+        batch.extend(issues.json())
+
+        if len(batch) > rate_limit and len(all_issues) < num_issues:
+            all_issues.extend(batch)
+            batch = []  # Flush batch for next time period
+            print(f"Reached GitHub rate limit. Sleeping for one hour ...")
+            time.sleep(60 * 60 + 1)
+
+    all_issues.extend(batch)
+    df = pd.DataFrame.from_records(all_issues)
+    df.to_json(f"{issues_path}/{repo}-issues.jsonl", orient="records", lines=True)
+    print(
+        f"Downloaded all the issues for {repo}! Dataset stored at {issues_path}/{repo}-issues.jsonl"
+    )
+```
+
+Acum când apelăm `fetch_issues()` va descărca toate problemele în batch-uri pentru a evita depășirea limitei GitHub pe numărul de solicitări pe oră; rezultatul va fi stocat într-un fișier `_repository_name-issues.jsonl`, unde fiecare linie este un obiect JSON care reprezintă un issue. Mai jos folosim această funcție pentru a obține toate issue-urile de la 🤗 Datasets:
+
+```py
+# În dependență de conexiunea ta la internet, acest lucru poate dura câteva minute...
+fetch_issues()
+```
+
+Odată ce issue-urile sunt descărcate, le putem încărca local utilizând abilitățile noastre dobândite în [secțiunea 2](/course/chapter5/2):
+
+```py
+issues_dataset = load_dataset("json", data_files="datasets-issues.jsonl", split="train")
+issues_dataset
+```
+
+```python out
+Dataset({
+    features: ['url', 'repository_url', 'labels_url', 'comments_url', 'events_url', 'html_url', 'id', 'node_id', 'number', 'title', 'user', 'labels', 'state', 'locked', 'assignee', 'assignees', 'milestone', 'comments', 'created_at', 'updated_at', 'closed_at', 'author_association', 'active_lock_reason', 'pull_request', 'body', 'timeline_url', 'performed_via_github_app'],
+    num_rows: 3019
+})
+```
+
+Great, am creat primul nostru dataset de la zero! Dar de ce sunt mai mult de câteva mii de issue-uri atunci când tabul de issue-uri al repositoriului 🤗 Datasets afișează doar aproximativ 1.000 de issue-uri în total 🤔? Conform descris în [documentația](https://docs.github.com/en/rest/reference/issues#list-issues-assigned-to-the-authenticated-user) GitHub, acest lucru s-a întâmplat pentru că am descărcat și toate pull requesturile:
+
+> GitHub's REST API v3 considers every pull request an issue, but not every issue is a pull request. For this reason, "Issues" endpoints may return both issues and pull requests in the response. You can identify pull requests by the `pull_request` key. Be aware that the `id` of a pull request returned from "Issues" endpoints will be an issue id.
+
+Deoarece conținutul issue-urilor și pull requesturilor este destul de diferit, hai să preprocesăm puțin datele pentru a ne permite să le diferențiem între ele.
+
+## Curățarea datelor[[cleaning-up-the-data]]
+
+Fragmentul de mai sus din documentația GitHub ne spune că coloana `pull_request` poate fi utilizată pentru a diferenția între issues și pull requests. Să analizăm un sampple aleatoriu pentru a vedea care este diferența. Așa cum am făcut în [secțiunea 3](/course/chapter5/3), vom înlănțui `Dataset.shuffle()` și `Dataset.select()` pentru a crea un sample aleatoriu și apoi vom împerechea coloanele `html_url` și `pull_request` pentru a putea compara diversele URL-uri:
+
+```py
+sample = issues_dataset.shuffle(seed=666).select(range(3))
+
+# Print out the URL and pull request entries
+for url, pr in zip(sample["html_url"], sample["pull_request"]):
+    print(f">> URL: {url}")
+    print(f">> Pull request: {pr}\n")
+```
+
+```python out
+>> URL: https://github.com/huggingface/datasets/pull/850
+>> Pull request: {'url': 'https://api.github.com/repos/huggingface/datasets/pulls/850', 'html_url': 'https://github.com/huggingface/datasets/pull/850', 'diff_url': 'https://github.com/huggingface/datasets/pull/850.diff', 'patch_url': 'https://github.com/huggingface/datasets/pull/850.patch'}
+
+>> URL: https://github.com/huggingface/datasets/issues/2773
+>> Pull request: None
+
+>> URL: https://github.com/huggingface/datasets/pull/783
+>> Pull request: {'url': 'https://api.github.com/repos/huggingface/datasets/pulls/783', 'html_url': 'https://github.com/huggingface/datasets/pull/783', 'diff_url': 'https://github.com/huggingface/datasets/pull/783.diff', 'patch_url': 'https://github.com/huggingface/datasets/pull/783.patch'}
+```
+
+Aici putem vedea că fiecare pull request este asociat cu diverse URL-uri, în timp ce issue-urile obișnuite au o intrare `None`. Putem utiliza această distincție pentru a crea o nouă coloană `is_pull_request` care verifică dacă câmpul `pull_request` este `None` sau nu:
+
+```py
+issues_dataset = issues_dataset.map(
+    lambda x: {"is_pull_request": False if x["pull_request"] is None else True}
+)
+```
+
+<Tip>
+
+✏️ **Încercați!** Calculați timpul mediu necesar pentru închiderea issue-urilor în Datasets. Vă poate fi utilă funcția `Dataset.filter()` pentru a filtra pull requesturile și issue-urile deschise, și puteți utiliza funcția `Dataset.set_format()` pentru a converti datasetul într-un `DataFrame` astfel încât să puteți manipula cu ușurință timestampurile `created_at` și `closed_at`. Pentru puncte bonus, calculați timpul mediu necesar pentru închiderea pull requesturilor.
+
+</Tip>
+
+Deși am putea continua să curățăm datasetul prin eliminarea sau redenumirea unor coloane, este, în general, o practică bună să păstrăm datasetul cât mai "raw" posibil la acest stadiu, astfel încât să poată fi utilizat ușor în multiple aplicații.
+
+Înainte de a încărca datasetul în Hugging Face Hub, trebuie să rezolvăm chestie care lipsește din el: comentariile asociate fiecărui issue și pull request. Le vom adăuga în continuare cu-- ați ghicit -- GitHub REST API!
+
+## Îmbunătățirea datasetului[[augmenting-the-dataset]]
+
+După cum se vede în următorul screenshot, comentariile asociate unui issue sau pull request oferă o sursă bogată de informații, în special dacă suntem interesați să construim un motor de căutare pentru a răspunde la întrebările utilizatorilor despre bibliotecă.
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter5/datasets-issues-comment.png" alt="Comentariile asociate unei probleme despre 🤗 Datasets." width="80%"/>
+</div>
+
+GitHub REST API oferă un endpoint [`Comments`](https://docs.github.com/en/rest/reference/issues#list-issue-comments) care returnează toate comentariile asociate numărului problemei. Să testăm endpointul pentru a vedea ce returnează:
+
+```py
+issue_number = 2792
+url = f"https://api.github.com/repos/huggingface/datasets/issues/{issue_number}/comments"
+response = requests.get(url, headers=headers)
+response.json()
+```
+
+```python out
+[{'url': 'https://api.github.com/repos/huggingface/datasets/issues/comments/897594128',
+  'html_url': 'https://github.com/huggingface/datasets/pull/2792#issuecomment-897594128',
+  'issue_url': 'https://api.github.com/repos/huggingface/datasets/issues/2792',
+  'id': 897594128,
+  'node_id': 'IC_kwDODunzps41gDMQ',
+  'user': {'login': 'bhavitvyamalik',
+   'id': 19718818,
+   'node_id': 'MDQ6VXNlcjE5NzE4ODE4',
+   'avatar_url': 'https://avatars.githubusercontent.com/u/19718818?v=4',
+   'gravatar_id': '',
+   'url': 'https://api.github.com/users/bhavitvyamalik',
+   'html_url': 'https://github.com/bhavitvyamalik',
+   'followers_url': 'https://api.github.com/users/bhavitvyamalik/followers',
+   'following_url': 'https://api.github.com/users/bhavitvyamalik/following{/other_user}',
+   'gists_url': 'https://api.github.com/users/bhavitvyamalik/gists{/gist_id}',
+   'starred_url': 'https://api.github.com/users/bhavitvyamalik/starred{/owner}{/repo}',
+   'subscriptions_url': 'https://api.github.com/users/bhavitvyamalik/subscriptions',
+   'organizations_url': 'https://api.github.com/users/bhavitvyamalik/orgs',
+   'repos_url': 'https://api.github.com/users/bhavitvyamalik/repos',
+   'events_url': 'https://api.github.com/users/bhavitvyamalik/events{/privacy}',
+   'received_events_url': 'https://api.github.com/users/bhavitvyamalik/received_events',
+   'type': 'User',
+   'site_admin': False},
+  'created_at': '2021-08-12T12:21:52Z',
+  'updated_at': '2021-08-12T12:31:17Z',
+  'author_association': 'CONTRIBUTOR',
+  'body': "@albertvillanova my tests are failing here:\r\n```\r\ndataset_name = 'gooaq'\r\n\r\n    def test_load_dataset(self, dataset_name):\r\n        configs = self.dataset_tester.load_all_configs(dataset_name, is_local=True)[:1]\r\n>       self.dataset_tester.check_load_dataset(dataset_name, configs, is_local=True, use_local_dummy_data=True)\r\n\r\ntests/test_dataset_common.py:234: \r\n_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ \r\ntests/test_dataset_common.py:187: in check_load_dataset\r\n    self.parent.assertTrue(len(dataset[split]) > 0)\r\nE   AssertionError: False is not true\r\n```\r\nWhen I try loading dataset on local machine it works fine. Any suggestions on how can I avoid this error?",
+  'performed_via_github_app': None}]
+```
+
+Putem vedea că comentariul este stocat în câmpul `body`, așa că putem scrie o funcție simplă care returnează toate comentariile asociate unei probleme prin extragerea conținutului `body` pentru fiecare element în `response.json()`:
+
+```py
+def get_comments(issue_number):
+    url = f"https://api.github.com/repos/huggingface/datasets/issues/{issue_number}/comments"
+    response = requests.get(url, headers=headers)
+    return [r["body"] for r in response.json()]
+
+
+# Testăm dacă funcția lucrează cum ne dorim
+get_comments(2792)
+```
+
+```python out
+["@albertvillanova my tests are failing here:\r\n```\r\ndataset_name = 'gooaq'\r\n\r\n    def test_load_dataset(self, dataset_name):\r\n        configs = self.dataset_tester.load_all_configs(dataset_name, is_local=True)[:1]\r\n>       self.dataset_tester.check_load_dataset(dataset_name, configs, is_local=True, use_local_dummy_data=True)\r\n\r\ntests/test_dataset_common.py:234: \r\n_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ \r\ntests/test_dataset_common.py:187: in check_load_dataset\r\n    self.parent.assertTrue(len(dataset[split]) > 0)\r\nE   AssertionError: False is not true\r\n```\r\nWhen I try loading dataset on local machine it works fine. Any suggestions on how can I avoid this error?"]
+```
+
+Arată bine. Acum hai să folosim `Dataset.map()` pentru a adăuga noi coloane `comments` fiecărui issue în datasetul nostru:
+
+```py
+# Depending on your internet connection, this can take a few minutes...
+issues_with_comments_dataset = issues_dataset.map(
+    lambda x: {"comments": get_comments(x["number"])}
+)
+```
+
+Ultimul pas este să facem push datasetului nostru pe Hub. Să vedem cum putem face asta.
+
+## Încărcarea datasetului pe Hugging Face Hub[[uploading-the-dataset-to-the-hugging-face-hub]]
+
+<Youtube id="HaN6qCr_Afc"/.”
+
+Acum că avem datasetul nostru augmentat, este timpul să îi facem push pe Hub pentru a-l oferi comunității! Încărcarea unui dataset este foarte simplu: la fel ca modelele și tokenizerrii din 🤗 Transformers, putem utiliza o metodă `push_to_hub()` pentru a face push unui dataset. Pentru a face asta, avem nevoie de un token de autentificare, care poate fi obținut prin autentificarea pe Hugging Face Hub cu funcția `notebook_login()`:
+
+```py
+from huggingface_hub import notebook_login
+
+notebook_login()
+```
+
+Acest lucru va crea un widget unde poți să scrii usernameul și parola ta, iar un API token va fi salvat în *~/.huggingface/token*. Dacă rulezi codeul într-un terminal, te poți loga cu ajutor CLI: 
+This will create a widget where you can enter your username and password, and an API token will be saved in *~/.huggingface/token*. If you're running the code in a terminal, you can log in via the CLI instead:
+
+```bash
+huggingface-cli login
+```
+O dată ce ai făcut asta, putem încărca datasetul rulând:
+
+```py
+issues_with_comments_dataset.push_to_hub("github-issues")
+```
+
+De acum, orice poate să descarce datasetul, utilizând `load_dataset()` cu ID-ul repositoriului ca `path` argument:
+
+```py
+remote_dataset = load_dataset("lewtun/github-issues", split="train")
+remote_dataset
+```
+
+```python out
+Dataset({
+    features: ['url', 'repository_url', 'labels_url', 'comments_url', 'events_url', 'html_url', 'id', 'node_id', 'number', 'title', 'user', 'labels', 'state', 'locked', 'assignee', 'assignees', 'milestone', 'comments', 'created_at', 'updated_at', 'closed_at', 'author_association', 'active_lock_reason', 'pull_request', 'body', 'performed_via_github_app', 'is_pull_request'],
+    num_rows: 2855
+})
+```
+
+Cool, am încărcat datasetul nostru pe Hub și acum este disponibil pentru alții să îl utilizeze! Mai este doar un lucru important de făcut: adăugarea unui _dataset card_ care explică cum a fost creat corpusul și oferă alte informații utile pentru comunitate.
+
+<Tip>
+
+💡 De asemenea, puteți încărca un dataset pe Hugging Face Hub direct din terminal utilizând `huggingface-cli` și puțină magie Git. Consultați [ghidul 🤗 Datasets](https://huggingface.co/docs/datasets/share#share-a-dataset-using-the-cli) pentru detalii despre cum puteți face asta.
+
+</Tip>
+
+## Crearea unei dataset card[[creating-a-dataset-card]]
+
+Datasetiroșe bine documentate sunt mai probabil să fie utile altora (inclusiv ție din viitor!), deoarece furnizează contextul pentru a permite utilizatorilor să decidă dacă datasetul este relevant pentru taskul lor și să evalueze eventualele biasuri sau riscurile asociate cu utilizarea datasetului.
+
+Pe Hugging Face Hub, această informație este stocată în fișierul *README.md* al fiecărui dataset repository. Sunt doi pași principali pe care trebuie să îi efectuați înainte de a crea acest fișier:
+
+1. Utilizați aplicația [`datasets-tagging`](https://huggingface.co/datasets/tagging/) pentru a crea etichete de metadate în format YAML. Aceste taguri sunt utilizate pentru o varietate de funcționalități de căutare pe Hugging Face Hub și asigură că datasetul poate fi găsit ușor de membrii comunității. Deoarece am creat un dataset custom aici, veți fi nevoiți să clonați repositoriul `datasets-tagging` și să rulați aplicația local. Iată cum arată interfața:
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter5/datasets-tagger.png" alt="Interfața `datasets-tagging`." width="80%"/>
+</div>
+
+2. Citiți [ghidul 🤗 Datasets](https://github.com/huggingface/datasets/blob/master/templates/README_guide.md) despre crearea de dataset cards informative și utilizați-l ca șablon.
+
+Puteți crea fișierul *README.md* direct pe Hub și puteți găsi un template pentru dataset card în repositoriul `lewtun/github-issues`. Un screenshot a dataset card completată este afișată mai jos.
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter5/dataset-card.png" alt="Dataset card." width="80%"/>
+</div>
+
+<Tip>
+
+✏️ **Încercați!** Utilizați aplicația `dataset-tagging` și [ghidul 🤗 Datasets](https://github.com/huggingface/datasets/blob/master/templates/README_guide.md) pentru a completa fișierul *README.md* pentru datasetul de probleme GitHub.
+
+</Tip>
+
+Astfel, am văzut în această secțiune că crearea unui dataset bun poate fi destul de complicată, dar, spre norocul nsotru, încărcarea și oferirea acestuia comunității nu sunt. În secțiunea următoare, vom utiliza datasetul nou pentru a crea un motor de căutare semantic cu 🤗 Datasets care poate să asocieze întrebări cu cele mai relevante issues și comentarii.
+
+<Tip>
+
+✏️ **Încercați!** Treceți prin pașii pe care i-am făcut în această secțiune pentru a crea un dataset de issues GitHub pentru o biblioteca open source care îți place(alegeți altceva înafară de 🤗 Datasets, desigur!). Pentru puncte bonus, faceți fine-tune unui multilabel classifier pentru a prezice tagurile prezente în câmpul `labels`.
+
+</Tip>
diff --git a/chapters/rum/chapter5/6.mdx b/chapters/rum/chapter5/6.mdx
new file mode 100644
index 000000000..7587c5ef5
--- /dev/null
+++ b/chapters/rum/chapter5/6.mdx
@@ -0,0 +1,517 @@
+<FrameworkSwitchCourse {fw} />
+
+# Căutare semantică cu FAISS[[semantic-search-with-faiss]]
+
+{#if fw === 'pt'}
+
+<CourseFloatingBanner chapter={5}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter5/section6_pt.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter5/section6_pt.ipynb"},
+]} />
+
+{:else}
+
+<CourseFloatingBanner chapter={5}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter5/section6_tf.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter5/section6_tf.ipynb"},
+]} />
+
+{/if}
+
+În [secțiunea 5](/course/chapter5/5), am creat un dataset cu issues și comentarii din repositoriul 🤗 Datasets. În această secțiune, vom utiliza aceste informații pentru a construi un motor de căutare care ne poate ajuta să găsim răspunsurile la  cele mai importante cele mai importante întrebări despre bibliotecă!
+
+<Youtube id="OATCgQtNX2o"/>
+
+## Utilizarea embeddings pentru căutare semantică[[using-embeddings-for-semantic-search]]
+
+După cum am văzut în [Capitolul 1](/course/chapter1), Transformer-based language models reprezintă fiecare token într-un fragment de text ca un _embedding vector_. S-a dovedit că se poate face "pool" embeddingurilor individuale pentru a crea o reprezentare vectorială pentru fraze întregi, paragrafe sau (în anumite cazuri) documente. Aceste embeddings pot fi apoi utilizate pentru a găsi documente similare în corpus prin calcularea dot-product similarity (sau a unei alte metrice de similaritate) între fiecare embedding și returnarea documentelor cu cea mai mare suprapunere.
+
+În această secțiune, vom utiliza embeddings pentru a dezvolta un motor de căutare semantică. Aceste motoare de căutare oferă mai multe avantaje față de abordările convenționale bazate pe căutarea de cuvinte cheie într-un query cu documente.
+
+<div class="flex justify-center">
+<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter5/semantic-search.svg" alt="Căutare semantică."/>
+<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter5/semantic-search-dark.svg" alt="Căutare semantică."/>
+</div>
+
+## Încărcarea și pregătirea datasetului[[loading-and-preparing-the-dataset]]
+
+Prima lucru pe care trebuie să îl facem este să descărcăm datasetul nostru cu GitHub issues, așa că folosim funcția `load_dataset()` ca de obicei:
+
+```py
+from datasets import load_dataset
+
+issues_dataset = load_dataset("lewtun/github-issues", split="train")
+issues_dataset
+```
+
+```python out
+Dataset({
+    features: ['url', 'repository_url', 'labels_url', 'comments_url', 'events_url', 'html_url', 'id', 'node_id', 'number', 'title', 'user', 'labels', 'state', 'locked', 'assignee', 'assignees', 'milestone', 'comments', 'created_at', 'updated_at', 'closed_at', 'author_association', 'active_lock_reason', 'pull_request', 'body', 'performed_via_github_app', 'is_pull_request'],
+    num_rows: 2855
+})
+```
+
+Aici am specificat splitul default `train` în `load_dataset()`, astfel încât returnează un `Dataset` în loc de `DatasetDict`. Primul lucru care treubuie făcut este să filtrăm pull requesturile, deoarece acestea rareori tind să fie utilizate pentru a răspunde la întrebările utilizatorilor și vor introduce noise în motorul nostru de căutare. Așa cum ar trebuie deja să știți, putem utiliza funcția `Dataset.filter()` pentru a exclude aceste rânduri din datasetul nostru. În timp ce suntem aici, putem să filtrăm și rândurile fără comentari, deoarece acestea nu oferă niciun răspuns la întrebările utilizatorilor:
+
+```py
+issues_dataset = issues_dataset.filter(
+    lambda x: (x["is_pull_request"] == False și len(x["comments"]) > 0)
+)
+issues_dataset
+```
+
+```python out
+Dataset({
+    caracteristici: ['url', 'repository_url', 'labels_url', 'comments_url', 'events_url', 'html_url', 'id', 'node_id', 'number', 'title', 'user', 'labels', 'state', 'locked', 'assignee', 'assignees', 'milestone', 'comments', 'created_at', 'updated_at', 'closed_at', 'author_association', 'active_lock_reason', 'pull_request', 'body', 'performed_via_github_app', 'is_pull_request'],
+    num_rows: 771
+})
+```
+
+Putem vedea că există multe coloane în datasetul nostru, majoritatea dintre care nu sunt necesare pentru a construi motorul nostru de căutare. Din perspectiva căutării, cele mai informative coloane sunt `title`, `body` și `comments`, în timp ce `html_url` ne oferă un link înapoi la problema sursă. Hai să utilizăm funcția `Dataset.remove_columns()` pentru a elimina restul:
+
+```py
+columns = issues_dataset.column_names
+columns_to_keep = ["title", "body", "html_url", "comments"]
+columns_to_remove = set(columns_to_keep).symmetric_difference(columns)
+issues_dataset = issues_dataset.remove_columns(columns_to_remove)
+issues_dataset
+```
+
+```python out
+Dataset({
+    features: ['html_url', 'title', 'comments', 'body'],
+    num_rows: 771
+})
+```
+
+Pentru a crea embeddedurile noastre, vom completa fiecare comentariu cu titlul și body-ul problemei, deoarece aceste câmpuri adesea includ informații contextuale utile. Deoarece coloana noastră `comments` este în prezent o listă de comentarii pentru fiecare issue, trebuie să "explodăm" coloana, astfel încât fiecare rând să fie format dintr-un tuple `(html_url, title, body, comment)`. În Pandas, putem face acest lucru cu funcția [`DataFrame.explode()`](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.explode.html), care creează un rând nou pentru fiecare element dintr-o coloană asemănătoare cu o listă, în timp ce copiază toate celelalte valori ale coloanelor. Pentru a vedea acest lucru în acțiune, să trecem la formatul pandas `DataFrame` main întâi:
+
+```py
+issues_dataset.set_format("pandas")
+df = issues_dataset[:]
+```
+
+Dacă inspectăm primul rând din acest `DataFrame`, putem vedea că există patru comentarii asociate acestei probleme:
+
+```py
+df["comments"][0].tolist()
+```
+
+```python out
+['the bug code locate in ：\r\n    if data_args.task_name is not None:\r\n        # Downloading and loading a dataset from the hub.\r\n        datasets = load_dataset("glue", data_args.task_name, cache_dir=model_args.cache_dir)',
+ 'Hi @jinec,\r\n\r\nFrom time to time we get this kind of `ConnectionError` coming from the github.com website: https://raw.githubusercontent.com\r\n\r\nNormally, it should work if you wait a little and then retry.\r\n\r\nCould you please confirm if the problem persists?',
+ 'cannot connect，even by Web browser，please check that  there is some  problems。',
+ 'I can access https://raw.githubusercontent.com/huggingface/datasets/1.7.0/datasets/glue/glue.py without problem...']
+```
+
+Când facem explode `df`, ne așteptăm să obținem un rând pentru fiecare dintre aceste comentarii. Haideți să verificăm dacă ăsta e cazul:
+
+```py
+comments_df = df.explode("comments", ignore_index=True)
+comments_df.head(4)
+```
+
+<table border="1" class="dataframe" style="table-layout: fixed; word-wrap:break-word; width: 100%;">
+  <thead>
+    <tr style="text-align: right;">
+      <th></th>
+      <th>html_url</th>
+      <th>title</th>
+      <th>comments</th>
+      <th>body</th>
+    </tr>
+  </thead>
+  <tbody>
+    <tr>
+      <th>0</th>
+      <td>https://github.com/huggingface/datasets/issues/2787</td>
+      <td>ConnectionError: Couldn't reach https://raw.githubusercontent.com</td>
+      <td>the bug code locate in ：\r\n    if data_args.task_name is not None...</td>
+      <td>Hello,\r\nI am trying to run run_glue.py and it gives me this error...</td>
+    </tr>
+    <tr>
+      <th>1</th>
+      <td>https://github.com/huggingface/datasets/issues/2787</td>
+      <td>ConnectionError: Couldn't reach https://raw.githubusercontent.com</td>
+      <td>Hi @jinec,\r\n\r\nFrom time to time we get this kind of `ConnectionError` coming from the github.com website: https://raw.githubusercontent.com...</td>
+      <td>Hello,\r\nI am trying to run run_glue.py and it gives me this error...</td>
+    </tr>
+    <tr>
+      <th>2</th>
+      <td>https://github.com/huggingface/datasets/issues/2787</td>
+      <td>ConnectionError: Couldn't reach https://raw.githubusercontent.com</td>
+      <td>cannot connect，even by Web browser，please check that  there is some  problems。</td>
+      <td>Hello,\r\nI am trying to run run_glue.py and it gives me this error...</td>
+    </tr>
+    <tr>
+      <th>3</th>
+      <td>https://github.com/huggingface/datasets/issues/2787</td>
+      <td>ConnectionError: Couldn't reach https://raw.githubusercontent.com</td>
+      <td>I can access https://raw.githubusercontent.com/huggingface/datasets/1.7.0/datasets/glue/glue.py without problem...</td>
+      <td>Hello,\r\nI am trying to run run_glue.py and it gives me this error...</td>
+    </tr>
+  </tbody>
+</table>
+
+Great, putem vedea că rândurile au fost reproduse, cu coloanele `comments` incluzând și comentariile individuale. Acum că am terminat cu Pandas, noi putem să schimăm rapid înapoi la un `Dataset` înărcând `DataFrame` în memorie:
+
+```py
+from datasets import Dataset
+
+comments_dataset = Dataset.from_pandas(comments_df)
+comments_dataset
+```
+
+```python out
+Dataset({
+    features: ['html_url', 'title', 'comments', 'body'],
+    num_rows: 2842
+})
+```
+
+Okay, acest lucru ne-a oferit câteva mii de comentarii cu care să lucrăm!
+
+
+<Tip>
+
+✏️ **Încercați!** Vezi dacă poți utiliza `Dataset.map()` pentru a exploda coloana `comments` din `issues_dataset` _fără_ a recurge la utilizarea Pandas. Acest lucru este puțin dificil; s-ar putea să găsiți utilă secțiunea ["Mapping batch"](https://huggingface.co/docs/datasets/about_map_batch#batch-mapping) din documentația 🤗 Datasets pentru această sarcină.
+
+</Tip>
+
+Acum că avem un singur comentariu pe rând, să creăm o nouă coloană `comments_length` care conține numărul de cuvinte din fiecare comentariu:
+
+```py
+comments_dataset = comments_dataset.map(
+    lambda x: {"comment_length": len(x["comments"].split())}
+)
+```
+
+Putem utiliza această nouă coloană pentru a filtra comentariile scurte, care de obicei includ lucruri precum "cc @lewtun" sau "Mulțumesc!" care nu sunt relevante pentru motorul nostru de căutare. Nu există un număr precis care trebuie selectat pentru filtru, dar aproximativ 15 cuvinte pare a fi un bun punct de plecare:
+
+```py
+comments_dataset = comments_dataset.filter(lambda x: x["comment_length"] > 15)
+comments_dataset
+```
+
+```python out
+Dataset({
+    features: ['html_url', 'title', 'comments', 'body', 'comment_length'],
+    num_rows: 2098
+})
+```
+
+După ce am curățat puțin setul nostru de date, putem să concatenăm titlul, descrirea și comentariile problemei împreună într-o nouă coloană `text`. Ca de obicei, vom scrie o funcție simplă pe care o putem transmite în `Dataset.map()`:
+
+```py
+def concatenate_text(examples):
+    return {
+        "text": examples["title"]
+        + " \n "
+        + examples["body"]
+        + " \n "
+        + examples["comments"]
+    }
+
+
+comments_dataset = comments_dataset.map(concatenate_text)
+```
+
+Suntem în final pregătiți să creăm niște embeddings! Haideți să vedem cum facem acest lucru.
+
+## Crearea embeddings-urilor de text [[creating-text-embeddings]]
+
+Am văzut în [Capitolul 2](/course/chapter2) că putem obține token embeddings prin utilizarea clasei `AutoModel`. Tot ce trebuie să facem este să alegem un checkpoint potrivit pentru a încărca modelul. Din fericire, există o bibliotecă numită `sentence-transformers` care se ocupă de crearea embeddingurilor. Așa cum se descrie în [documentația](https://www.sbert.net/examples/applications/semantic-search/README.html#symmetric-vs-asymmetric-semantic-search) bibliotecii, cazul nostru este un exemplu de _căutare semantică asimetrică_ deoarece avem o întrebare scurtă al cărei răspuns ne-ar plăcea să îl găsim într-un document mai lung, precum un comentariu la un issue. [Tabelul] (https://www.sbert.net/docs/pretrained_models.html#model-overview) util de prezentare a modelului din documentație indică faptul că checkpointul `multi-qa-mpnet-base-dot-v1` are cea mai bună performanță pentru căutarea semantică, așa că îl vom folosi acesta pentru aplicația noastră. De asemenea, vom încărca tokenizer-ul folosind același checkpoint:
+
+{#if fw === 'pt'}
+
+```py
+from transformers import AutoTokenizer, AutoModel
+
+model_ckpt = "sentence-transformers/multi-qa-mpnet-base-dot-v1"
+tokenizer = AutoTokenizer.from_pretrained(model_ckpt)
+model = AutoModel.from_pretrained(model_ckpt)
+```
+
+Pentru a accelera procesul de embedding, este util să punem modelul și inputurile pe un GPU, deci hai să facem asta acum:
+
+```py
+import torch
+
+device = torch.device("cuda")
+model.to(device)
+```
+
+{:else}
+
+```py
+from transformers import AutoTokenizer, TFAutoModel
+
+model_ckpt = "sentence-transformers/multi-qa-mpnet-base-dot-v1"
+tokenizer = AutoTokenizer.from_pretrained(model_ckpt)
+model = TFAutoModel.from_pretrained(model_ckpt, from_pt=True)
+```
+
+Notăm că am setat `from_pt=True` ca argument al metodei `from_pretrained()`. Acest lucru se datorează faptului că checkpoint-ul `multi-qa-mpnet-base-dot-v1` are doar PyTorch weights, astfel încât setarea `from_pt=True` le va converti automat în format TensorFlow pentru noi. După cum puteți vedea, este foarte simplu să treci de la un framework la altul în 🤗 Transformers!
+
+{/if}
+
+După cum am menționat anterior, dorim să reprezentăm fiecare intrare din corpusul nostru de GitHub issues sub forma unui vector, astfel încât avem nevoie să "agregăm" sau să facem media la tokem embeddings într-un anumit mod. O abordare populară este de a efectua *CLS pooling* pe outputurile modelului nostru, unde pur și simplu colectăm ultimul stadiu ascuns pentru tokenul special `[CLS]`. Următoarea funcție face acest lucru pentru noi:
+
+```py
+def cls_pooling(model_output):
+    return model_output.last_hidden_state[:, 0]
+```
+
+În continuare, vom crea o funcție ajutătoare care va tokeniza o listă de documente, va plasa tensorii pe GPU, îi va alimenta în model și, în final, va aplica CLS pooling la outputuri:
+
+{#if fw === 'pt'}
+
+```py
+def get_embeddings(text_list):
+    encoded_input = tokenizer(
+        text_list, padding=True, truncation=True, return_tensors="pt"
+    )
+    encoded_input = {k: v.to(device) for k, v in encoded_input.items()}
+    model_output = model(**encoded_input)
+    return cls_pooling(model_output)
+```
+
+Putem testa funcția oferindui prima intrare de text în corpusul nostru și analizând output shapeul:
+
+```py
+embedding = get_embeddings(comments_dataset["text"][0])
+embedding.shape
+```
+
+```python out
+torch.Size([1, 768])
+```
+
+Minunat, am transformat prima intrare din corpusul nostru într-un vector de 768 de dimensiuni! Putem utiliza `Dataset.map()` pentru a aplica funcția noastră `get_embeddings()` la fiecare rând din corpusul nostru, astfel încât să creăm o nouă coloană `embeddings` în acest mod:
+
+```py
+embeddings_dataset = comments_dataset.map(
+    lambda x: {"embeddings": get_embeddings(x["text"]).detach().cpu().numpy()[0]}
+)
+```
+
+{:else}
+
+```py
+def get_embeddings(text_list):
+    encoded_input = tokenizer(
+        text_list, padding=True, truncation=True, return_tensors="tf"
+    )
+    encoded_input = {k: v for k, v in encoded_input.items()}
+    model_output = model(**encoded_input)
+    return cls_pooling(model_output)
+```
+
+Putem testa funcția oferindui prima intrare de text în corpusul nostru și analizând output shapeul:
+
+```py
+embedding = get_embeddings(comments_dataset["text"][0])
+embedding.shape
+```
+
+```python out
+TensorShape([1, 768])
+```
+
+Minunat, am transformat prima intrare din corpusul nostru într-un vector de 768 de dimensiuni! Putem utiliza `Dataset.map()` pentru a aplica funcția noastră `get_embeddings()` la fiecare rând din corpusul nostru, astfel încât să creăm o nouă coloană `embeddings` în acest mod:
+
+```py
+embeddings_dataset = comments_dataset.map(
+    lambda x: {"embeddings": get_embeddings(x["text"]).numpy()[0]}
+)
+```
+
+{/if}
+
+Observăm că am transformat embeddingurile în matrice NumPy -- acest lucru este necesar deoarece biblioteca 🤗 Datasets cere acest format atunci când încercăm să indexăm cu FAISS, ceea ce vom face în continuare.
+
+## Utilizarea FAISS pentru căutare de similaritate eficientă[[using-faiss-for-efficient-similarity-search]]
+
+Acum că avem un dataset de embeddings, avem nevoie de o modalitate de a căuta printre ele. Pentru a face acest lucru, vom utiliza o structură de date specială din 🤗 Datasets, numită _FAISS index_. [FAISS](https://faiss.ai/) (prescurtat de la Facebook AI Similarity Search) este o bibliotecă care oferă algoritmi eficienți pentru căutarea rapidă și clusteringul al embedding vectors.
+
+Ideea de bază din spatele FAISS este crearea unei structuri de date speciale numite _index_, care permite găsirea embeddingurilor similare cu un input embedding. Crearea unui index FAISS în 🤗 Datasets este simplu -- utilizăm funcția `Dataset.add_faiss_index()` și specificăm care coloană a datasetului nostru dorim să indexăm:
+
+```py
+embeddings_dataset.add_faiss_index(column="embeddings")
+```
+
+Acum putem efectua queries pe acest index realizând o căutare a celor mai apropiați vecini cu funcția `Dataset.get_nearest_examples()`. Haideți să testăm acest lucru prin încorporarea unei întrebări astfel:
+
+{#if fw === 'pt'}
+
+```py
+question = "How can I load a dataset offline?"
+question_embedding = get_embeddings([question]).cpu().detach().numpy()
+question_embedding.shape
+```
+
+```python out
+torch.Size([1, 768])
+```
+
+{:else}
+
+```py
+question = "How can I load a dataset offline?"
+question_embedding = get_embeddings([question]).numpy()
+question_embedding.shape
+```
+
+```python out
+(1, 768)
+```
+
+{/if}
+
+La fel ca și în cazul documentelor, acum avem un vector de 768 de dimensiuni care reprezintă query-ul, pe care îl putem compara cu întregul corpus pentru a găsi embeddingurile cele mai similare:
+
+```py
+scores, samples = embeddings_dataset.get_nearest_examples(
+    "embeddings", question_embedding, k=5
+)
+```
+
+Funcția `Dataset.get_nearest_examples()` returnează un tuple cu scorurile care clasifică suprapunerea dintre query și document, și un set corespunzător de sampleuri (în acest caz, cele 5 match-uri). Haideți să colectăm acestea într-un `pandas.DataFrame` pentru a le putea sorta cu ușurință:
+
+```py
+import pandas as pd
+
+samples_df = pd.DataFrame.from_dict(samples)
+samples_df["scores"] = scores
+samples_df.sort_values("scores", ascending=False, inplace=True)
+```
+
+Acum putem itera peste primele rânduri pentru a veadea cât de bine un query se potrivește cu comentariile disponibile:
+
+```py
+for _, row in samples_df.iterrows():
+    print(f"COMMENT: {row.comments}")
+    print(f"SCORE: {row.scores}")
+    print(f"TITLE: {row.title}")
+    print(f"URL: {row.html_url}")
+    print("=" * 50)
+    print()
+```
+
+```python out
+"""
+COMMENT: Requiring online connection is a deal breaker in some cases unfortunately so it'd be great if offline mode is added similar to how `transformers` loads models offline fine.
+
+@mandubian's second bullet point suggests that there's a workaround allowing you to use your offline (custom?) dataset with `datasets`. Could you please elaborate on how that should look like?
+SCORE: 25.505046844482422
+TITLE: Discussion using datasets in offline mode
+URL: https://github.com/huggingface/datasets/issues/824
+==================================================
+
+COMMENT: The local dataset builders (csv, text , json and pandas) are now part of the `datasets` package since #1726 :)
+You can now use them offline
+\`\`\`python
+datasets = load_dataset("text", data_files=data_files)
+\`\`\`
+
+We'll do a new release soon
+SCORE: 24.555509567260742
+TITLE: Discussion using datasets in offline mode
+URL: https://github.com/huggingface/datasets/issues/824
+==================================================
+
+COMMENT: I opened a PR that allows to reload modules that have already been loaded once even if there's no internet.
+
+Let me know if you know other ways that can make the offline mode experience better. I'd be happy to add them :)
+
+I already note the "freeze" modules option, to prevent local modules updates. It would be a cool feature.
+
+----------
+
+> @mandubian's second bullet point suggests that there's a workaround allowing you to use your offline (custom?) dataset with `datasets`. Could you please elaborate on how that should look like?
+
+Indeed `load_dataset` allows to load remote dataset script (squad, glue, etc.) but also you own local ones.
+For example if you have a dataset script at `./my_dataset/my_dataset.py` then you can do
+\`\`\`python
+load_dataset("./my_dataset")
+\`\`\`
+and the dataset script will generate your dataset once and for all.
+
+----------
+
+About I'm looking into having `csv`, `json`, `text`, `pandas` dataset builders already included in the `datasets` package, so that they are available offline by default, as opposed to the other datasets that require the script to be downloaded.
+cf #1724
+SCORE: 24.14896583557129
+TITLE: Discussion using datasets in offline mode
+URL: https://github.com/huggingface/datasets/issues/824
+==================================================
+
+COMMENT: > here is my way to load a dataset offline, but it **requires** an online machine
+>
+> 1. (online machine)
+>
+> ```
+>
+> import datasets
+>
+> data = datasets.load_dataset(...)
+>
+> data.save_to_disk(/YOUR/DATASET/DIR)
+>
+> ```
+>
+> 2. copy the dir from online to the offline machine
+>
+> 3. (offline machine)
+>
+> ```
+>
+> import datasets
+>
+> data = datasets.load_from_disk(/SAVED/DATA/DIR)
+>
+> ```
+>
+>
+>
+> HTH.
+
+
+SCORE: 22.893993377685547
+TITLE: Discussion using datasets in offline mode
+URL: https://github.com/huggingface/datasets/issues/824
+==================================================
+
+COMMENT: here is my way to load a dataset offline, but it **requires** an online machine
+1. (online machine)
+\`\`\`
+import datasets
+data = datasets.load_dataset(...)
+data.save_to_disk(/YOUR/DATASET/DIR)
+\`\`\`
+2. copy the dir from online to the offline machine
+3. (offline machine)
+\`\`\`
+import datasets
+data = datasets.load_from_disk(/SAVED/DATA/DIR)
+\`\`\`
+
+HTH.
+SCORE: 22.406635284423828
+TITLE: Discussion using datasets in offline mode
+URL: https://github.com/huggingface/datasets/issues/824
+==================================================
+"""
+```
+
+Nu-i rău! A doua încercare se pare că se potrivește cu query-ul!
+
+<Tip>
+
+✏️ **Încearcă!** Creează propriul tău query și vezi dacp poți găsi un răspuns și să extragi documentele. S-ar putea să trebuiești să crești parametrul `k` în `Dataset.get_nearest_examples()` pentru a mări căutarea.
+
+</Tip>
\ No newline at end of file
diff --git a/chapters/rum/chapter5/7.mdx b/chapters/rum/chapter5/7.mdx
new file mode 100644
index 000000000..39922875f
--- /dev/null
+++ b/chapters/rum/chapter5/7.mdx
@@ -0,0 +1,16 @@
+# 🤗 Datasets, verificare![[datasets-check]]
+
+<CourseFloatingBanner
+    chapter={5}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+Ei bine, a fost un tur palpitant prin biblioteca 🤗 Datasets -- felicitări pentru că ai ajuns până aici! Cu cunoștințele pe care le-ai dobândit din acest capitol, ar trebui să fii capabil să:
+
+- Încarci dataseturi de oriunde, fie Hugging Face Hub, laptopul tău sau un server remote de la compania ta.
+- Modelezi datele tale folosind o combinație a funcțiilor `Dataset.map()` și `Dataset.filter()`.
+- Schimbi rapid între data formats precum Pandas și NumPy folosind `Dataset.set_format()`.
+- Creezi propriul tău dataset și să îl publici pe Hugging Face Hub.
+- Încorporezi documentele tale folosind un model Transformer și construiești un motor de căutare semantică folosind FAISS.
+
+În [Capitolul 7](/course/chapter7), vom pune toate acestea în practică, făcând o examinare amănunțită a principalelor sarcini NLP pentru care modelele Transformer sunt excelente. Înainte de a trece mai departe, puneți-vă cunoștințele despre 🤗 Datasets la încercare cu un quiz rapid!
\ No newline at end of file
diff --git a/chapters/rum/chapter5/8.mdx b/chapters/rum/chapter5/8.mdx
new file mode 100644
index 000000000..5f8866c76
--- /dev/null
+++ b/chapters/rum/chapter5/8.mdx
@@ -0,0 +1,228 @@
+# Quiz de final de capitol[[end-of-chapter-quiz]]
+
+<CourseFloatingBanner
+    chapter={5}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+Acest capitol a acoperit o mulțime de subiecte! Nu vă faceți griji dacă nu ați înțeles toate detaliile; capitolele următoare vă vor ajuta să înțelegeți cum funcționează lucrurile mai aprofundat.
+
+Înainte de a trece mai departe, totuși trebuie să testăm ce ați învățat în acest capitol.
+
+### 1. Funcția `load_dataset()` din 🤗 Datasets vă permite să încărcați un dataset din care dintre următoarele locații?
+
+<Question
+    choices={[
+        {
+            text: "Local, de exemplu pe laptop",
+            explain: "Corect! Puteți trece path-urile fișierelor locale ca argument al `data_files` al `load_dataset()` pentru a încărca dataseturi locale.",
+            correct: true
+        },
+        {
+            text: "Hugging Face Hub",
+            explain: "Corect! Puteți încărca dataseturi de pe Hub furnizând ID-ul datasetului, de exemplu <code>load_dataset('emotion')</code>.",
+            correct: true
+        },
+        {
+            text: "Un server remote",
+            explain: "Corect! Puteți trece URL-uri ca argument al `data_files` al `load_dataset()` pentru a încărca fișiere remote.",
+            correct: true
+        },
+    ]}
+/>
+
+### 2. Presupunem că încărcați una dintre sarcinile GLUE astfel:
+
+```py
+from datasets import load_dataset
+
+dataset = load_dataset("glue", "mrpc", split="train")
+```
+
+Care dintre următoarele comenzi va produce un exemplu aleatoriu de 50 de elemente din `dataset`?
+
+<Question
+    choices={[
+        {
+            text: "<code>dataset.sample(50)</code>",
+            explain: "Acest lucru este incorect -- nu există o metodă `Dataset.sample()`."
+        },
+        {
+            text: "<code>dataset.shuffle().select(range(50))</code>",
+            explain: "Corect! Așa cum ați văzut în acest capitol, mai întâi faceți shuffle datasetului și apoi selectați exemplele din el.",
+            correct: true
+        },
+        {
+            text: "<code>dataset.select(range(50)).shuffle()</code>",
+            explain: "Acest lucru este incorect -- deși codul va rula, va amesteca doar primele 50 de elemente din setul de date."
+        }
+    ]}
+/>
+
+### 3. Presupunem că aveți un set de date despre animale de companie numit `pets_dataset`, care are o coloană `name` care denotă numele fiecărui animal de companie. Care dintre următoarele abordări v-ar permite să filtrați setul de date pentru toate animalele de companie ale căror nume încep cu litera "L"?
+
+<Question
+    choices={[
+        {
+            text: "<code>pets_dataset.filter(lambda x : x['name'].startswith('L'))</code>",
+            explain: "Corect! Utilizarea unei funcții lambda python pentru aceste filtre rapide este o idee grozavă. Vă puteți gândi și la o altă soluție?",
+            correct: true
+        },
+        {
+            text: "<code>pets_dataset.filter(lambda x['name'].startswith('L'))</code>",
+            explain: "Acest lucru este incorect -- o funcție lambda are forma generală <code>lambda *arguments* : *expression*</code>, deci trebuie să furnizați argumente în acest caz."
+        },
+        {
+            text: "Creați o funcție ca <code>def filter_names(x): return x['name'].startswith('L')</code> și rulați <code>pets_dataset.filter(filter_names)</code>.",
+            explain: "Corect! La fel ca și cu <code>Dataset.map()</code>, puteți trece funcții explicite la <code>Dataset.filter()</code>. Acest lucru este util atunci când aveți o logică complexă care nu este potrivită pentru o funcție lambda. Care dintre celelalte soluții ar mai funcționa?",
+            correct: true
+        }
+    ]}
+/>
+
+### 4. Ce este memory mapping?
+
+<Question
+    choices={[
+        {
+            text: "Mappingul între CPU și GPU RAM",
+            explain: "Acest lucru nu este corect -- încearcă din nou!",
+        },
+        {
+            text: "Mapping între RAM și stocarea sistemului de fișiere",
+            explain: "Corect! 🤗 Datasets tratează fiecare dataset ca pe un fișier memory-mapped. Acest lucru permite bibliotecii să acceseze și să opereze pe elemente ale datasetului fără să fie nevoie să îl încarce complet în memorie.",
+            correct: true
+        },
+        {
+            text: "Mapping între două fișiere din cache-ul 🤗 Datasets",
+            explain: "Acest lucru nu este corect -- încearcă din nou!"
+        }
+    ]}
+/>
+
+### 5. Care sunt principalele beneficii ale memory-mapping?
+
+<Question
+    choices={[
+        {
+            text: "Accesarea fișierelor memory-mapped este mai rapid decât citirea de pe disc sau scrierea pe disc.",
+            explain: "Corect! Acest lucru permite 🤗 Datasets să fie extrem de rapid. Acesta însă nu este singurul beneficiu.",
+            correct: true
+        },
+        {
+            text: "Aplicațiile pot accesa segmente de date dintr-un fișier extrem de mare fără a fi necesar să citească întregul fișier în RAM mai întâi.",
+            explain: "Corect! Acest lucru permite 🤗 Datasets să încarce dataseturi de câțiva gigabytes pe laptopul tău fără a fi nevoie să supraîncărcați CPU-ul. Ce alt avantaj oferă memory-mapping?",
+            correct: true
+        },
+        {
+            text: "Acesta consumă mai puțină energie, astfel încât bateria ta ține mai mult.",
+            explain: "Acest lucru nu este corect -- încearcă din nou!"
+        }
+    ]}
+/>
+
+### 6. De ce codul următor eșuează?
+
+```py
+from datasets import load_dataset
+
+dataset = load_dataset("allocine", streaming=True, split="train")
+dataset[0]
+```
+
+<Question
+    choices={[
+        {
+            text: "Încearcă să facă streaming unui dataset prea mare pentru a încăpea în RAM.",
+            explain: "Acest lucru nu este corect -- streaming datasets sunt decompresate pe loc, și puteți prelucra dataseturi de terabytes cu foarte puțin RAM!",
+        },
+        {
+            text: "Încearcă să acceseze un <code>IterableDataset</code>.",
+            explain: "Corect! Un <code>IterableDataset</code> este un generator, nu un container, deci ar trebui să accesați elementele sale utilizând <code>next(iter(dataset))</code>.",
+            correct: true
+        },
+        {
+            text: "Datasetul <code>allocine</code> nu are o un split <code>train</code>.",
+            explain: "Acest lucru este incorect -- consultați cardul datasetului <code>allocine</code> de pe Hub pentru a vedea ce splituri conține."
+        }
+    ]}
+/>
+
+### 7. Care sunt principalele beneficii ale creării unui dataset card?
+
+<Question
+    choices={[
+        {
+            text: "Oferă informații despre utilizarea intenționată și sarcinile susținute ale datasetului, astfel încât ceilalți din comunitate să poată lua o decizie cu privire la utilizarea acestuia.",
+            explain: "Corect! Dataseturile nedocumentate pot fi utilizate pentru a antrena modele care pot să nu reflecte intențiile creatorilor sau pot produce modele a căror statut juridic este incert dacă sunt antrenate pe date care încalcă confidențialitatea sau restricțiile de licențiere. Acesta nu este singurul beneficiu, totuși!",
+            correct: true
+        },
+        {
+            text: "Ajută la sublinierea biasurilor prezente într-un corpus.",
+            explain: "Corect! Aproape toate dataseturile au o formă de bias, ceea ce poate produce consecințe negative. A fi conștient de ele ajută creatorii de modele să înțeleagă cum să abordeze biasurile indispensabile. Cu ce altceva vă pot ajuta dataset cardurile?",
+            correct: true
+        },
+        {
+            text: "Îmbunătățește șansele ca ceilalți din comunitate să utilizeze datasetul meu.",
+            explain: "Corect! Un dataset card bine scris va avea tendința de a duce la o utilizare mai mare a prețiosului tău dataset. Ce beneficiu mai oferă?",
+            correct: true
+        },
+    ]}
+/>
+
+### 8. Ce este căutarea semantică?
+
+<Question
+    choices={[
+        {
+            text: "Un mod de a căuta pentru a găsi potriviri exacte între cuvintele dintr-un query și documentele dintr-un corpus",
+            explain: "Acest lucru este incorect -- acest tip de căutare se numește *căutare lexicală*, și este ceea ce vedeți de obicei cu motoarele de căutare tradiționale."
+        },
+        {
+            text: "Un mod de a căuta documente care se potrivesc prin înțelegerea sensului contextual al unui query",
+            explain: "Corect! Căutarea semantică utilizează embedding vectors pentru a reprezenta queries și documente și utilizează o metrică de similaritate pentru a măsura cantitatea de suprapunere între ele. Cum altfel ați putea descrie-o?",
+            correct: true
+        },
+        {
+            text: "Un mod de a îmbunătăți acuratețea căutării",
+            explain: "Corect! Motoarele de căutare semantice pot captura intenția unui query mult mai bine decât potrivirea de cuvinte cheie și de obicei preia documente cu o precizie mai mare. Dar acesta nu este singurul răspuns corect -- ce alt beneficiu oferă căutarea semantică?",
+            correct: true
+        }
+    ]}
+/>
+
+### 9. Pentru căutarea semantică asimetrică, de obicei aveți:
+
+<Question
+    choices={[
+        {
+            text: "Un query scurt și un paragraf mai lung care răspunde la query",
+            explain: "Corect!",
+            correct: true
+        },
+        {
+            text: "Queries și paragrafe care sunt de aproximativ aceeași lungime",
+            explain: "Acest lucru este de fapt un exemplu de căutare semantică simetrică -- încercați din nou!"
+        },
+        {
+            text: "Un query lung și un paragraf mai scurt care răspunde la query",
+            explain: "Acest lucru este incorect -- încercați din nou!"
+        }
+    ]}
+/>
+
+### 10. Pot utiliza 🤗 Datasets pentru a încărca date pentru utilizare în alte domenii, cum ar fi speech processing?
+
+<Question
+    choices={[
+        {
+            text: "Nu",
+            explain: "Acest lucru este incorect -- 🤗 Datasets acceptă în prezent date tabulare, audio și imagini. Consultați datasetul <a href='https://huggingface.co/datasets/mnist'>MNIST</a> de pe Hub pentru a vedea un exemplu de computer vision."
+        },
+        {
+            text: "Da",
+            explain: "Corect! Consultați dezvoltările interesante cu privire la speech și vision în biblioteca 🤗 Transformers pentru a vedea cum 🤗 Datasets este utilizat în aceste domenii.",
+            correct: true
+        },
+    ]}
+/>
\ No newline at end of file

From 16a2692b5222f50f98998c3b0499ffffed2f0775 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Tue, 27 May 2025 11:54:06 +0300
Subject: [PATCH 117/167] fix: revert missing line

---
 chapters/en/chapter5/3.mdx | 1 +
 1 file changed, 1 insertion(+)

diff --git a/chapters/en/chapter5/3.mdx b/chapters/en/chapter5/3.mdx
index bc5e75891..8b4619fa5 100644
--- a/chapters/en/chapter5/3.mdx
+++ b/chapters/en/chapter5/3.mdx
@@ -526,6 +526,7 @@ train_df = drug_dataset["train"][:]
 
 </Tip>
 
+
 From here we can use all the Pandas functionality that we want. For example, we can do fancy chaining to compute the class distribution among the `condition` entries:
 
 ```py

From 9ebc1a001c5a3e78d55a9c74b9adb1ab5d73fd4c Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Tue, 27 May 2025 14:24:36 +0300
Subject: [PATCH 118/167] fix: add missing link

---
 chapters/rum/chapter5/3.mdx | 11 ++---------
 1 file changed, 2 insertions(+), 9 deletions(-)

diff --git a/chapters/rum/chapter5/3.mdx b/chapters/rum/chapter5/3.mdx
index d91169c19..51ee179ad 100644
--- a/chapters/rum/chapter5/3.mdx
+++ b/chapters/rum/chapter5/3.mdx
@@ -170,7 +170,7 @@ drug_dataset["train"]["condition"][:3]
 
 Funcționează! Acum că am curățat labelurile, să vedem cum putem curăți și recenziile.
 
-## Crearea de noi coloane
+## Crearea de noi coloane[[creating-new-columns]]
 
 Atunci când lucrați cu recenziile clienților, o practică bună este să verificați numărul de cuvinte în fiecare recenzie. O recenzie poate fi doar un singur cuvânt, cum ar fi "Excelent!" sau un eseu complet care are sute de cuvinte și depinde de cazul pe care îl aveți la vedere, aici trebuie să vă asigurați că faceți față acestor extreme diferit. Pentru a calcula numărul de cuvinte în fiecare recenzie, vom folosi un heuristic aproximativ bazat pe splittingul textului prin spații.
 
@@ -279,7 +279,7 @@ new_drug_dataset = drug_dataset.map(
 
 Dacă executați acest cod într-un notebook, veți vedea că această comandă se execută mult mai rapid decât cea anterioră. Și nu pentru că recenziile noastre au fost deja HTML-unescaped – dacă reexecutați instrucția precedentă (fără `batched=True`), ea va lua același timp ca înainte. Acest lucru se datorează faptului că list comprehension sunt  mai rapide decât executarea aceluiași cod într-un `for` loop, și am câștigat, de asemenea, puțină performanțp accesând multe elemente în același timp, în loc unul câte unul.
 
-Folosirea `Dataset.map()` cu `batched=True` este esențială pentru a obțina viteza "rapidă" a tokenizerilor pe care îi vom întâlni în [Capitolul 6](/course/chapter6), care pot repede să facă tokenize listelor mari de texte. De exemplu, pentru a face tokenize tuturor recenziilor medicamentelor cu un tokenizer rapid, putem folosi o funcție ca aceasta:
+Folosirea `Dataset.map()` cu `batched=True` este esențială pentru a obține viteza "rapidă" a tokenizerilor pe care îi vom întâlni în [Capitolul 6](/course/chapter6), care pot repede să facă tokenize listelor mari de texte. De exemplu, pentru a face tokenize tuturor recenziilor medicamentelor cu un tokenizer rapid, putem folosi o funcție ca aceasta:
 
 ```py
 from transformers import AutoTokenizer
@@ -589,13 +589,6 @@ freq_dataset = Dataset.from_pandas(frequencies)
 freq_dataset
 ```
 
-```python out
-Dataset({
-    features: ['condition', 'frequency'],
-    num_rows: 819
-})
-```
-
 
 <Tip>
 

From c312f44458da69101235644280682f76f3218c4a Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Tue, 27 May 2025 15:38:48 +0300
Subject: [PATCH 119/167] fix: solve typos in files 3 4 6

---
 chapters/rum/chapter4/3.mdx | 31 ++++++++++++++-----------------
 chapters/rum/chapter4/4.mdx |  2 +-
 chapters/rum/chapter4/6.mdx |  4 ++--
 3 files changed, 17 insertions(+), 20 deletions(-)

diff --git a/chapters/rum/chapter4/3.mdx b/chapters/rum/chapter4/3.mdx
index d2ab5ce4c..e1c3c8a94 100644
--- a/chapters/rum/chapter4/3.mdx
+++ b/chapters/rum/chapter4/3.mdx
@@ -1,6 +1,3 @@
-
-**Capitolul 4**
-
 <FrameworkSwitchCourse {fw} />
 
 # Partajarea modelelor preantrenate [[sharing-pretrained-models]]
@@ -8,18 +5,18 @@
 {#if fw === 'pt'}
 
 <CourseFloatingBanner chapter={4}
-classNames="absolute z-10 right-0 top-0"
-notebooks={[ 
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter4/section3_pt.ipynb"}, 
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter4/section3_pt.ipynb"},
     {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter4/section3_pt.ipynb"},
 ]} />
 
 {:else}
 
 <CourseFloatingBanner chapter={4}
-classNames="absolute z-10 right-0 top-0"
-notebooks={[ 
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter4/section3_tf.ipynb"}, 
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter4/section3_tf.ipynb"},
     {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter4/section3_tf.ipynb"},
 ]} />
 
@@ -185,7 +182,7 @@ Metoda `push_to_hub()` este backed de packageul Python [`huggingface_hub`](https
 
 Întoarceți-vă la secțiune precedentă pentru a vedea cum să încărcați fișierele în noul repository-ul creat!
 
-## Utilizarea bibliotecii Python `huggingface_hub`
+## Utilizarea bibliotecii Python `huggingface_hub`[[using-the-huggingfacehub-python-library]]
 
 Biblioteca Python `huggingface_hub` este un package care oferă un set de instrumente pentru model și datasets hubs. Oferă metode simple și clase pentru sarcini comune ca:
 Obținerea informațiilor despre repositorii pe hub și gestionarea lor. Ofere API-uri simple care lucrează pe lângă Git pentru a gestiona conținutul acestor repositorii și integrarea Hub-ului
@@ -248,7 +245,7 @@ Alte argumente care pot fi utile sunt:
 
 Acum, trebuie să adăugați fișierele în repository-ul dumneavoastră! Treceți la secțiunea următoare pentru a vedea cele trei moduri de a face acest lucru.
 
-## Utilizarea interfeței web
+## Utilizarea interfeței web[[using-the-web-interface]]
 
 Interfața web oferă instrumente pentru a gestiona repositorii direct în Hub. Cu ajutorul acestei interfețe, puteți crea ușor repositorii, adăuga fișiere (și chiar și fișiere mari!), explora modele, vizualiza diffuri, și multe altele.
 
@@ -297,7 +294,7 @@ Dacă fișierele dumneavoastră sunt mai mari decât 5 GB, vă rugăm să urmaț
 
 API-ul poate fi folosit astfel:
 
-```python
+```py
 from huggingface_hub import upload_file
 
 upload_file(
@@ -331,7 +328,7 @@ Acesta a creat folderele `<path_to_dummy_folder>` în folderul de lucru. Acest f
 
 Acum puteți folosi majoritatea metodelor tradiționale ale gitului:
 
-```python
+```py
 repo.git_pull()
 repo.git_add()
 repo.git_commit()
@@ -345,20 +342,20 @@ Pentru moment, avem un model și un tokenizer pe care doriți să îl trimiteți
 
 În primul rând asigurați-vă că copia locală este la zi cu ultimele schimbări:
 
-```python
+```py
 repo.git_pull()
 ```
 
 Odată ce am facut asta, salvați fișierele modelului și al tokenizerul:
 
-```python
+```py
 model.save_pretrained("<path_to_dummy_folder>")
 tokenizer.save_pretrained("<path_to_dummy_folder>")
 ```
 
 Folder-ul `<path_to_dummy_folder>` acum conține toate fișierele modelului dumneavoastră și ale tokenizerul. Vom urma fluxul tradițional de git adăugând fișiere în zona de pregătire, făcând commit și push fișierelor în hub:
 
-```python
+```py
 repo.git_add()
 repo.git_commit("Adăugarea fișierelor modelului și ale tokenizerului")
 repo.git_push()
@@ -501,7 +498,7 @@ Your branch is up to date with 'origin/main'.
 Changes to be committed:
   (use "git restore --staged <file>..." to unstage)
   modified:   .gitattributes
-  	new file:   config.json
+	new file:   config.json
 	new file:   sentencepiece.bpe.model
 	new file:   special_tokens_map.json
 	new file:   tf_model.h5
diff --git a/chapters/rum/chapter4/4.mdx b/chapters/rum/chapter4/4.mdx
index f8963f961..98e128f1f 100644
--- a/chapters/rum/chapter4/4.mdx
+++ b/chapters/rum/chapter4/4.mdx
@@ -74,7 +74,7 @@ Dacă ați explorat puțin Hugging Face Hub atunci ar trebui să fi văzut că a
 
 Spre exemplu, dacă vă uitați la modelul [`camembert-base`](https://huggingface.co/camembert-base/blob/main/README.md) atunci veți observa următoarea linii din headerul cardului:
 
-````
+```
 ---
 language: fr
 license: mit
diff --git a/chapters/rum/chapter4/6.mdx b/chapters/rum/chapter4/6.mdx
index 1255a0ca0..9208940ac 100644
--- a/chapters/rum/chapter4/6.mdx
+++ b/chapters/rum/chapter4/6.mdx
@@ -70,12 +70,12 @@ Să testăm ceea ce ai învățat în acest capitol!
 		},
 		{
 			text: "Gestionarea și editarea fișierelor.",
-			explicație: "Corect! Dar nuu este singurul lucru pe care îl poți face..."
+			explicație: "Corect! Dar nuu este singurul lucru pe care îl poți face...",
             correct: true
 		},
         {
 			text: "Încărcarea de fișiere.",
-			explicație: "Corect! Dar nu este singurul lucru..."
+			explicație: "Corect! Dar nu este singurul lucru...",
             correct: true
 		},
         {

From 219c04d8ed570ba2b272f40174225bbfbd140244 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Tue, 27 May 2025 16:15:54 +0300
Subject: [PATCH 120/167] fix: internal server error request to file 3 chapter4

---
 chapters/rum/chapter4/3.mdx | 31 +++++++++++++++++--------------
 1 file changed, 17 insertions(+), 14 deletions(-)

diff --git a/chapters/rum/chapter4/3.mdx b/chapters/rum/chapter4/3.mdx
index e1c3c8a94..d05cc3387 100644
--- a/chapters/rum/chapter4/3.mdx
+++ b/chapters/rum/chapter4/3.mdx
@@ -1,6 +1,6 @@
 <FrameworkSwitchCourse {fw} />
 
-# Partajarea modelelor preantrenate [[sharing-pretrained-models]]
+# Partajarea modelelor preantrenate[[sharing-pretrained-models]]
 
 {#if fw === 'pt'}
 
@@ -26,7 +26,7 @@
 
 <Youtube id="9yY3RB_GSPM"/>
 
-Recomandăm tuturor utilizatorilor care antrenează modele să contribuie prin partajarea lor cu comunitatea - partajarea modelelor, chiar și atunci când sunt antrenate pe dateseturi foarte specifice, va ajuta la economising timpul altor utilizatori și resurselor și va oferi acces la trained artifcats folositoare. În schimb, puteți beneficia de munca altora!
+Recomandăm tuturor utilizatorilor care antrenează modele să contribuie prin partajarea lor cu comunitatea - partajarea modelelor, chiar și atunci când sunt antrenate pe dateseturi foarte specifice, va ajuta la economisind timpul altor utilizatori și resurselor și va oferi acces la artefacte antrenate folositoare. În schimb, puteți beneficia de munca altora!
 
 Există trei moduri de a crea noi repositorii cu modele:
 
@@ -36,6 +36,7 @@ Există trei moduri de a crea noi repositorii cu modele:
 
 Odată ce aveți creat un repository, puteți încărca fișiere în el folosind git și git-lfs. Vom trece împreună prin crearea model repositories și încărcarea fișierelor în el în următoarele secțiuni.
 
+
 ## Utilizând API-ul `push_to_hub`[[using-the-pushtohub-api]]
 
 {#if fw === 'pt'}
@@ -80,7 +81,7 @@ training_args = TrainingArguments(
 )
 ```
 
-Când chemați `trainer.train()`, `Trainer` va încărca modelul pe Hub de fiecare dată când este salvat (aici, la fiecare epocă) într-un repository namespaceul tău. Acest repository va fi numit după outpul directory-ul ales (aici `bert-finetuned-mrpc`), dar puteți alege un alt nume cu `hub_model_id = "un_nume_diferit"`.
+Când chemați `trainer.train()`, `Trainer` va încărca modelul pe Hub de fiecare dată când este salvat (aici, la fiecare epocă) într-un repository namespaceul tău. Acest repository va fi numit după output directory-ul ales (aici `bert-finetuned-mrpc`), dar puteți alege un alt nume cu `hub_model_id = "un_nume_diferit"`.
 
 Pentru a încărca modelul într-o organizație din care faceți parte, este suficient să introduceți aceasta în `hub_model_id = "organizația_mea/numele_repositoriului"`.
 
@@ -102,7 +103,7 @@ callback = PushToHubCallback(
 )
 ```
 
-Apoi, adăugați `callbacks=[callback]` în apelul la `model.fit()`. Callback-ul va încărca apoi modelul pe Hub de fiecare dată când se salvează(aici, la fiecare epocă) într-un repository din namespaceul tău. Acest repository va fi numit după output directory ales (aici `bert-finetuned-mrpc`), dar puteți alege un alt nume cu `hub_model_id = "un_nume_diferit"`.
+Apoi, adăugați `callbacks=[callback]` în apelul la `model.fit()`. Callback-ul va încărca apoi modelul pe Hub de fiecare dată când se salvează (aici, la fiecare epocă) într-un repository din namespaceul tău. Acest repository va fi numit după output directory ales (aici `bert-finetuned-mrpc`), dar puteți alege un alt nume cu `hub_model_id = "un_nume_diferit"`.
 
 Pentru a încărca modelul într-o organizație din care faceți parte, este suficient să introduceți aceasta în `hub_model_id = "organizația_mea/numele_repositoriului"`.
 
@@ -180,12 +181,12 @@ Ați văzut că metoda `push_to_hub()` acceptă mai multe argumente, ceea ce per
 
 Metoda `push_to_hub()` este backed de packageul Python [`huggingface_hub`](https://github.com/huggingface/huggingface_hub), care oferă un API direct la Hub-ul Hugging Face. Acesta este integrat în 🤗 Transformers și în mai multe biblioteci pentru machine learning, ca de exemplu [`allenlp`](https://github.com/allenai/allennlp). Deși ne concentrăm pe integrarea în 🤗 Transformers în acest capitol, integrarea sa în propriul dumneavoastră cod sau bibliotecă este simplu.
 
-Întoarceți-vă la secțiune precedentă pentru a vedea cum să încărcați fișierele în noul repository-ul creat!
+Săriți la ultima secțiune pentru a vedea cum să încărcați fișierele în noul repository-ul creat!
 
 ## Utilizarea bibliotecii Python `huggingface_hub`[[using-the-huggingfacehub-python-library]]
 
-Biblioteca Python `huggingface_hub` este un package care oferă un set de instrumente pentru model și datasets hubs. Oferă metode simple și clase pentru sarcini comune ca:
-Obținerea informațiilor despre repositorii pe hub și gestionarea lor. Ofere API-uri simple care lucrează pe lângă Git pentru a gestiona conținutul acestor repositorii și integrarea Hub-ului
+Biblioteca Python `huggingface_hub` este un package care oferă un set de instrumente pentru model și datasets hubs. Oferă metode simple și clase pentru sarcini comune ca 
+obținerea informațiilor despre repositorii pe hub și gestionarea lor. Oferă API-uri simple care lucrează pe lângă git pentru a gestiona conținutul acestor repositorii și integrarea Hub-ului
 în proiectele și bibliotecile tale.
 
 Similar cu utilizarea API-ului `push_to_hub`, asta va necesita un token de autentificare salvat în cache. Pentru a face acest lucru, veți avea nevoie să folosiți comanda `login` din CLI, cum am menționat în secțiunea anterioară (din nou, asigurați-vă prefixați această comandă cu simbolul `!` dacă rulați în Google Colab):
@@ -218,7 +219,10 @@ from huggingface_hub import (
 )
 ```
 
-De asemenea, el oferă clasa `Repository` pentru gestionarea unei repository local. Vom explora aceste metode și clasa în următoarele secțiuni pentru a înțelege cum să le utilizați.
+
+
+
+De asemenea, el oferă clasa foarte puternică `Repository` pentru gestionarea unei repository local. Vom explora aceste metode și clasa în următoarele secțiuni pentru a înțelege cum să le utilizați.
 
 Metoda `create_repo` poate fi utilizată pentru crearea unui nou repository în hub:
 
@@ -243,7 +247,7 @@ Alte argumente care pot fi utile sunt:
 - `token`, dacă doriți să vă înlocuiți token-ul stocat în cache cu un anumit token.
 - `repo_type`, dacă doriți să creați un `dataset` sau `space` în loc de model. Valorile acceptate sunt `"dataset"` și `"space"`.
 
-Acum, trebuie să adăugați fișierele în repository-ul dumneavoastră! Treceți la secțiunea următoare pentru a vedea cele trei moduri de a face acest lucru.
+Odată ce repositoriul este creat, trebuie să adăugați fișierele în el! Săriți la secțiunea următoare pentru a vedea cele trei moduri în care se poate face acest lucru.
 
 ## Utilizarea interfeței web[[using-the-web-interface]]
 
@@ -454,7 +458,7 @@ Dacă priviți la dimensiunile fișierelor (de exemplu, folosind `ls -lh`), ar t
 ```bash
 config.json  README.md  sentencepiece.bpe.model  special_tokens_map.json  tf_model.h5  tokenizer_config.json  tokenizer.json
 ```
-Dacă priviți la dimensiunile fișierelor (de exemplu, folosind`ls -lh`), ar trebui să vedeți că singurul outlier este model state dict file (*t5_model.h5*), care are mai mult de 400 MB.
+Dacă priviți la dimensiunile fișierelor (de exemplu, folosind `ls -lh`), ar trebui să vedeți că singurul outlier este model state dict file (*tf_model.h5*), care are mai mult de 400 MB.
 
 {/if}
 
@@ -556,7 +560,7 @@ Objects not staged for commit:
 
 ```
 
-Observăm că toate fișierele au `Git` ca handler, cu excepția *t5_model.h5*, care are `LFS`. Excelent!
+Observăm că toate fișierele au `Git` ca handler, cu excepția *tf_model.h5*, care are `LFS`. Excelent!
 
 {/if}
 
@@ -569,7 +573,7 @@ git commit -m "Prima versiune a modelului"
 
 {#if fw === 'pt'}
 ```bash
-[main b08aab1] First model version
+[main b08aab1] Prima versiune a modelului
  7 files changed, 29027 insertions(+)
   6 files changed, 36 insertions(+)
  create mode 100644 config.json
@@ -581,7 +585,7 @@ git commit -m "Prima versiune a modelului"
 ```
 {:else}
 ```bash
-[main b08aab1] First model version
+[main b08aab1] Prima versiune a modelului
  6 files changed, 36 insertions(+)
  create mode 100644 config.json
  create mode 100644 sentencepiece.bpe.model
@@ -635,4 +639,3 @@ Interfața permite explorarea fișierelor modelului și a commiturilor și vizua
 <img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/diffstf.gif" alt="Diferența introdusă de ultimul commit." width="80%"/>
 </div>
 {/if}
-```
\ No newline at end of file

From 092e1ccc0f64080d5039f215c961c52a43a2aa61 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Tue, 27 May 2025 20:38:36 +0300
Subject: [PATCH 121/167] fix: solve make style issue

---
 chapters/rum/chapter5/1.mdx |  2 +-
 chapters/rum/chapter5/2.mdx | 60 +++++++++++++++++--------------------
 chapters/rum/chapter5/3.mdx |  4 +--
 chapters/rum/chapter5/5.mdx |  2 +-
 chapters/rum/chapter5/6.mdx |  2 +-
 5 files changed, 33 insertions(+), 37 deletions(-)

diff --git a/chapters/rum/chapter5/1.mdx b/chapters/rum/chapter5/1.mdx
index 7fd54a2ad..816cabe1f 100644
--- a/chapters/rum/chapter5/1.mdx
+++ b/chapters/rum/chapter5/1.mdx
@@ -19,4 +19,4 @@ Dar acesta este doar o mică parte a ceea ce poate face 🤗 Datasets! În acest
 * Ce este "memory mapping" și Apache Arrow?
 * Cum puteți crea propriul dataset și să-l trimiteți pe Hub?
 
-Tehnicile pe care le veți învăța aici vă vor pregăti pentru sarcinile avansate de tokenizare și fine-tuning din [Capitolul 6](/course/chapter6) și [Capitolul 7](/course/chapter7) -- deci luați o cafea sau două și să începem!
+Tehnicile pe care le veți învăța aici vă vor pregăti pentru sarcinile avansate de tokenizare și fine-tuning din [Capitolul 6](/course/chapter6) și [Capitolul 7](/course/chapter7) -- deci luați o cafea sau două și să începem!
\ No newline at end of file
diff --git a/chapters/rum/chapter5/2.mdx b/chapters/rum/chapter5/2.mdx
index 24ab9c40a..72656f3f9 100644
--- a/chapters/rum/chapter5/2.mdx
+++ b/chapters/rum/chapter5/2.mdx
@@ -2,17 +2,18 @@
 
 <CourseFloatingBanner chapter={5}
   classNames="absolute z-10 right-0 top-0"
-  notebooks={[  
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/ro/chapter5/section2.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/ro/chapter5/section2.ipynb"},  
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter5/section2.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter5/section2.ipynb"},
 ]} />
 
-Ai învățat să folosești [Hugging Face Hub](https://huggingface.co/datasets) pentru a descărca dataseturi, dar vei găsi adesea că lucrați cu date care sunt stocate fie pe laptopul dumneavoastră, fie pe un server. În această secțiune vă vom arăta cum poate fi utilizat 🤗 Datasets pentru a încărca dataseturi care nu sunt disponibile pe Hugging Face Hub.
+Știți cum să folosiți [Hugging Face Hub](https://huggingface.co/datasets) pentru a descărca dataseturi, dar vă veți găsi adesea lucrând cu date care sunt stocate fie pe laptopul dumneavoastră, fie pe un server remote. În această secțiune vă vom arăta cum poate fi utilizat 🤗 Datasets pentru a încărca dataseturi care nu sunt disponibile pe Hugging Face Hub.
+
 <Youtube id="HyQgpJTkRdE"/>
 
 ## Lucrând cu dataseturi locale și remote[[working-with-local-and-remote-datasets]]
 
-🤗 Datasets oferă loading scripts pentru a gestiona încărcarea dataseturilor locale și remote. Suportă mai multe data formats , cum ar fi:
+🤗 Datasets oferă scripturi de încărcare pentru a gestiona încărcarea dataseturilor locale și remote. Suportă mai multe formate de date comune, cum ar fi:
 
 |    Data format     | Loading script |                         Example                         |
 | :----------------: | :------------: | :-----------------------------------------------------: |
@@ -21,27 +22,20 @@ Ai învățat să folosești [Hugging Face Hub](https://huggingface.co/datasets)
 | JSON & JSON Lines  |     `json`     |   `load_dataset("json", data_files="my_file.jsonl")`    |
 | Pickled DataFrames |    `pandas`    | `load_dataset("pandas", data_files="my_dataframe.pkl")` |
 
-As shown in the table, for each data format we just need to specify the type of loading script in the `load_dataset()` function, along with a `data_files` argument that specifies the path to one or more files. Let's start by loading a dataset from local files; later we'll see how to do the same with remote files.
-
-## Loading a local dataset[[loading-a-local-dataset]]
-
-For this example we'll use the [SQuAD-it dataset](https://github.com/crux82/squad-it/), which is a large-scale dataset for question answering in Italian.
-
-The training and test splits are hosted on GitHub, so we can download them with a simple `wget` command:
-
-În tabelele de mai sus, pentru fiecare format de date trebuie doar să specificăm tipul scriptului de încărcare din funcția `load_dataset()`, alături de un argument `data_files` care specifică calea către un sau mai multe fișiere. Începem cu încărcarea datasetului din fișierele locale; apoi vom vedea cum să faceți același lucru cu fișierele remote.
+Așa cum se arată în tabel, pentru fiecare format de date trebuie doar să specificăm tipul scriptului de încărcare în funcția `load_dataset()`, alături de un argument `data_files` care specifică calea către unul sau mai multe fișiere. Să începem prin încărcarea unui dataset din fișiere locale; mai târziu vom vedea cum să facem același lucru cu fișiere remote.
 
 ## Încărcarea unui dataset local[[loading-a-local-dataset]]
 
-În acest exemplu, vom folosi [datasetul SQuAD-it](https://github.com/crux82/squad-it/), care este un large-scale dataset pentru întrebări și răspunsuri în italiană.
+Pentru acest exemplu vom folosi [datasetul SQuAD-it](https://github.com/crux82/squad-it/), care este un dataset la scară largă pentru întrebări și răspunsuri în italiană.
+
+Spliturile de antrenare și test sunt găzduite pe GitHub, deci le putem descărca cu o comandă simplă `wget`:
 
-Spliturile de training și test sunt disponibile pe GitHub, deci putem descarca cu o comanda `wget`:
 ```python
 !wget https://github.com/crux82/squad-it/raw/master/SQuAD_it-train.json.gz
 !wget https://github.com/crux82/squad-it/raw/master/SQuAD_it-test.json.gz
 ```
 
-This will download two compressed files called *SQuAD_it-train.json.gz* and *SQuAD_it-test.json.gz*, which we can decompress with the Linux `gzip` command:
+Aceasta va descărca două fișiere comprimate numite *SQuAD_it-train.json.gz* și *SQuAD_it-test.json.gz*, pe care le putem decomprima cu comanda Linux `gzip`:
 
 ```python
 !gzip -dkv SQuAD_it-*.json.gz
@@ -52,15 +46,15 @@ SQuAD_it-test.json.gz:	   87.4% -- replaced with SQuAD_it-test.json
 SQuAD_it-train.json.gz:	   82.2% -- replaced with SQuAD_it-train.json
 ```
 
+Putem vedea că fișierele comprimate au fost înlocuite cu _SQuAD_it-train.json_ și _SQuAD_it-test.json_, și că datele sunt stocate în formatul JSON.
 
+<Tip>
 
-Putem observa că fișierele comprimate au fost înlocuite cu _SQuAD_it-train.json_ și _SQuAD_it-test.json_, iar datele sunt stocate în formatul JSON.
+✎ Dacă vă întrebați de ce există un caracter `!` în comenzile shell de mai sus, aceasta este pentru că le rulăm într-un notebook Jupyter. Pur și simplu eliminați prefixul dacă doriți să descărcați și să dezarhivați datasetul într-un terminal.
 
-<Tip>
-✎ Dacă vă întrebați de ce există un caracter `!` în comenziile shell din exemplu, acest lucru se întâmplă pentru că le-am rulat în cadrul unui jupyter notebook. Simplu să ștergeți prefixul dacă doriți să descărcați și să faceți unzip datasetului într-un terminal.
 </Tip>
 
-Să încarcăm acum un fișier JSON cu funcția `load_dataset()`. Ne trebuie doar să știm dacă ne confruntăm cu un JSON obișnuit (similar cu un nested dictionary) sau JSON Lines (lines-separated JSON). Cum multe dataset-uri pentru întrebări și răspunsuri, SQuAD-it folosește formatul nested, în care toate textele sunt stocate într-un câmp numit `data`. Acest lucru ne permite să încărcăm datasetul specificând argumentul `field` astfel:
+Pentru a încărca un fișier JSON cu funcția `load_dataset()`, trebuie doar să știm dacă avem de-a face cu JSON obișnuit (similar cu un dicționar imbricat) sau JSON Lines (JSON separat pe linii). Ca multe dataseturi de întrebări și răspunsuri, SQuAD-it folosește formatul imbricat, cu tot textul stocat într-un câmp `data`. Aceasta înseamnă că putem încărca datasetul specificând argumentul `field` după cum urmează:
 
 ```py
 from datasets import load_dataset
@@ -68,7 +62,7 @@ from datasets import load_dataset
 squad_it_dataset = load_dataset("json", data_files="SQuAD_it-train.json", field="data")
 ```
 
-By default, loading local files creates a `DatasetDict` object with a `train` split. We can see this by inspecting the `squad_it_dataset` object:
+În mod implicit, încărcarea fișierelor locale creează un obiect `DatasetDict` cu un split `train`. Putem vedea acest lucru prin inspectarea obiectului `squad_it_dataset`:
 
 ```py
 squad_it_dataset
@@ -83,7 +77,8 @@ DatasetDict({
 })
 ```
 
-Acest lucru ne arată numărul de rânduri și numele coloanelor asociate cu setul de antrenare. Putem vizualiza un exemplu prin a indexa în `train` split astfel:
+Aceasta ne arată numărul de rânduri și numele coloanelor asociate cu setul de antrenare. Putem vizualiza unul dintre exemple prin indexarea în splitul `train` după cum urmează:
+
 ```py
 squad_it_dataset["train"][0]
 ```
@@ -108,11 +103,12 @@ squad_it_dataset["train"][0]
 }
 ```
 
-Excelent, am reușit să încarcăm datasetul nostru local! Dar, deși acest lucru a funcționat pentru setul de antrenare, ceea ce dorim cu adevărat este să includem ambele splituri, `train` și `test`, într-un singur obiect `DatasetDict` astfel încât să putem aplica funcțiile `Dataset.map()` asupra ambelor splituri în același timp. Pentru a face acest lucru, putem furniza un dicționar pentru argumentul `data_files` care va face maps fiecărui spilt name cu fișierul asociat acelui split:
+Excelent, am încărcat primul nostru dataset local! Dar în timp ce acest lucru a funcționat pentru setul de antrenare, ceea ce dorim cu adevărat este să includem atât spliturile `train` cât și `test` într-un singur obiect `DatasetDict` astfel încât să putem aplica funcțiile `Dataset.map()` pe ambele splituri deodată. Pentru a face acest lucru, putem furniza un dicționar argumentului `data_files` care mapează fiecare nume de split la un fișier asociat cu acel split:
 
 ```py
 data_files = {"train": "SQuAD_it-train.json", "test": "SQuAD_it-test.json"}
 squad_it_dataset = load_dataset("json", data_files=data_files, field="data")
+squad_it_dataset
 ```
 
 ```python out
@@ -128,28 +124,28 @@ DatasetDict({
 })
 ```
 
-Astfel obținem exact ceea ce am dori. Acum putem aplica diverse tehnici de preprocesare pentru a curăța datele, să facem tokenize recenziilor și așa mai departe.
+Acesta este exact ceea ce am dorit. Acum, putem aplica diverse tehnici de preprocesare pentru a curăța datele, tokeniza recenziile și așa mai departe.
 
 <Tip>
 
-Argumentul `data_files` al funcției `load_dataset()` este destul de flexibil și poate fi fie un singur file paths, o listă de file paths, sau un dicționar care face maps split nameurilor cu file pathurile. De asemenea putem să folosim glob files care se potrivest unui model specificat conform regulilor folosite de Unix shell (de exemplu putem să facem glob tuturor fișierelor JSON într-un folder ca un singur split setând `data_files="*.json"`). Pentru mai multe detalii consultați [documentația](https://huggingface.co/docs/datasets/loading#local-and-remote-files) 🤗 Datasets.
+Argumentul `data_files` al funcției `load_dataset()` este destul de flexibil și poate fi fie o singură cale de fișier, o listă de căi de fișiere, sau un dicționar care mapează numele spliturilor la căile fișierelor. De asemenea, puteți folosi glob pentru fișiere care se potrivesc unui model specificat conform regulilor folosite de shell-ul Unix (de exemplu, puteți face glob pentru toate fișierele JSON dintr-un director ca un singur split prin setarea `data_files="*.json"`). Consultați [documentația](https://huggingface.co/docs/datasets/loading#local-and-remote-files) 🤗 Datasets pentru mai multe detalii.
 
 </Tip>
 
-Scripturile de încărcare din 🤗 Datasets suportă automat decomprimarea fișierelor de intrare, astfel putem să evităm folosirea `gzip` arătând argumentul `data_files` direct către fișierele comprimate:
+Scripturile de încărcare din 🤗 Datasets suportă de fapt decomprimarea automată a fișierelor de intrare, deci am fi putut să sărim peste folosirea `gzip` prin pointarea argumentului `data_files` direct către fișierele comprimate:
 
 ```py
 data_files = {"train": "SQuAD_it-train.json.gz", "test": "SQuAD_it-test.json.gz"}
 squad_it_dataset = load_dataset("json", data_files=data_files, field="data")
 ```
 
-Acest lucru poate fi util dacă nu dorim să manualizăm dezcomprimarea mai multe fișiere GZIP. Automatic decompression se aplică și altor formate precum ZIP și TAR, astfel putem să indicăm `data_files` către fișierele comprimate și suntem gata!
+Acest lucru poate fi util dacă nu doriți să decomprimați manual multe fișiere GZIP. Decomprimarea automată se aplică și altor formate comune precum ZIP și TAR, deci trebuie doar să pointați `data_files` către fișierele comprimate și sunteți gata!
 
-Acum că știm cum să încărcăm fișierele locale pe laptop sau desktop, să vedem cum să încarcăm fișiere remote.
+Acum că știți cum să încărcați fișiere locale pe laptopul sau desktop-ul dumneavoastră, să aruncăm o privire la încărcarea fișierelor remote.
 
 ## Încărcarea unui dataset remote[[loading-a-remote-dataset]]
 
-Dacă lucrați ca Data Scientist sau programatori într-o companie, există șanse mari că dataseturile pe care doriți să le analizați sunt stocate pe un anumit server. Din fericire, încărcarea fișierelor remote este la fel de simplă ca încărcarea celor locale! În schimb putem să oferim pathul la fișiere locale, noi oferim argumentului `data_files` de la metoda `load_dataset()` către una sau mai multe adrese URL unde sunt stocate fișierele remote. De exemplu pentru datasetul SQuAD-it găzduit pe GitHub, putem să oferitum argumentului `data_files`, URL-urile _SQuAD_it-*.json.gz_ astfel:
+Dacă lucrați ca data scientist sau programator într-o companie, există o șansă bună ca dataseturile pe care doriți să le analizați să fie stocate pe un server remote. Din fericire, încărcarea fișierelor remote este la fel de simplă ca încărcarea celor locale! În loc să furnizați o cale către fișiere locale, pointați argumentul `data_files` al `load_dataset()` către unul sau mai multe URL-uri unde sunt stocate fișierele remote. De exemplu, pentru datasetul SQuAD-it găzduit pe GitHub, putem pur și simplu să pointăm `data_files` către URL-urile _SQuAD_it-*.json.gz_ după cum urmează:
 
 ```py
 url = "https://github.com/crux82/squad-it/raw/master/"
@@ -160,11 +156,11 @@ data_files = {
 squad_it_dataset = load_dataset("json", data_files=data_files, field="data")
 ```
 
-Astfel obținem același obiect `DatasetDict` ca mai sus, dar economisim timp, deoarece nu descărcăm și decomprimăm fișierele _SQuAD_it-*.json.gz_. Asta încheie aventura noastră în diversele modalități de încarcare a dataseturilor care nu sunt găzduite pe Hugging Face Hub. Acum că am avem un dataset la dispoziție, hai să îl prelucrăm!
+Aceasta returnează același obiect `DatasetDict` obținut mai sus, dar ne economisește pasul de a descărca și decomprima manual fișierele _SQuAD_it-*.json.gz_. Aceasta încheie incursiunea noastră în diversele modalități de încărcare a dataseturilor care nu sunt găzduite pe Hugging Face Hub. Acum că avem un dataset cu care să ne jucăm, să ne murdărim mâinile cu diverse tehnici de manipulare a datelor!
 
 <Tip>
 
-✏️ **Încearcă!** Alegeți alt dataset găzduit pe GitHub sau [UCI Machine Learning Repository](https://archive.ics.uci.edu/ml/index.php) și încercați să îl încărcați atât local cât și remote folosind tehniciile introduse mai sus. Pentru puncte bonus, încercați să încărcați un dataset care este stocat în format CSV sau text (consultați [documentația](https://huggingface.co/docs/datasets/loading#local-and-remote-files) pentru detalii suplimentare despre aceste formate).
+✏️ **Încercați!** Alegeți un alt dataset găzduit pe GitHub sau [UCI Machine Learning Repository](https://archive.ics.uci.edu/ml/index.php) și încercați să îl încărcați atât local cât și remote folosind tehnicile introduse mai sus. Pentru puncte bonus, încercați să încărcați un dataset care este stocat în format CSV sau text (consultați [documentația](https://huggingface.co/docs/datasets/loading#local-and-remote-files) pentru mai multe informații despre aceste formate).
 
 </Tip>
 
diff --git a/chapters/rum/chapter5/3.mdx b/chapters/rum/chapter5/3.mdx
index 51ee179ad..c7d7f2787 100644
--- a/chapters/rum/chapter5/3.mdx
+++ b/chapters/rum/chapter5/3.mdx
@@ -120,14 +120,14 @@ def filter_nones(x):
 
 și apoi să rulăm `drug_dataset.filter(filter_nones)`, putem face acest lucru într-o linie folosind o _funcție lambda_. În Python, funcțiile lambda sunt funcții mici care pot fi definite fără a le numi. Ele au forma generală:
 
-```py
+```
 lambda <argumente> : <expresie>
 ```
 
 unde `lambda` este unul dintre [cuvintele cheie](https://docs.python.org/3/reference/lexical_analysis.html#keywords) Python, `<argumente>` reprezintă o listă/set de valori separate prin virgulă care definesc inputurile funcției și `<expresie>` reprezintă operațiile pe care dorim să le executăm. De exemplu, putem defini o funcție lambda care ridică un număr la pătrat:
 
 ```py
-lambda x : x * x
+lambda x: x * x
 ```
 
 Pentru a aplica această funcție la un input, trebuie să îi facem wrap și pe să punem inputul în paranteze:
diff --git a/chapters/rum/chapter5/5.mdx b/chapters/rum/chapter5/5.mdx
index 3f245b7eb..c14f1ed63 100644
--- a/chapters/rum/chapter5/5.mdx
+++ b/chapters/rum/chapter5/5.mdx
@@ -325,7 +325,7 @@ Ultimul pas este să facem push datasetului nostru pe Hub. Să vedem cum putem f
 
 ## Încărcarea datasetului pe Hugging Face Hub[[uploading-the-dataset-to-the-hugging-face-hub]]
 
-<Youtube id="HaN6qCr_Afc"/.”
+<Youtube id="HaN6qCr_Afc"/>
 
 Acum că avem datasetul nostru augmentat, este timpul să îi facem push pe Hub pentru a-l oferi comunității! Încărcarea unui dataset este foarte simplu: la fel ca modelele și tokenizerrii din 🤗 Transformers, putem utiliza o metodă `push_to_hub()` pentru a face push unui dataset. Pentru a face asta, avem nevoie de un token de autentificare, care poate fi obținut prin autentificarea pe Hugging Face Hub cu funcția `notebook_login()`:
 
diff --git a/chapters/rum/chapter5/6.mdx b/chapters/rum/chapter5/6.mdx
index 7587c5ef5..ee6fdfdeb 100644
--- a/chapters/rum/chapter5/6.mdx
+++ b/chapters/rum/chapter5/6.mdx
@@ -59,7 +59,7 @@ Aici am specificat splitul default `train` în `load_dataset()`, astfel încât
 
 ```py
 issues_dataset = issues_dataset.filter(
-    lambda x: (x["is_pull_request"] == False și len(x["comments"]) > 0)
+    lambda x: (x["is_pull_request"] == False and len(x["comments"]) > 0)
 )
 issues_dataset
 ```

From 827ac067261c7c004fb0aff1454eb7bfc69530a1 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Tue, 27 May 2025 20:51:03 +0300
Subject: [PATCH 122/167] fix: remove unnecessary changes

---
 .codegpt/head                 |   1 -
 .gitignore                    |   2 -
 chapters/ro/_toctree.yml      |  28 --
 chapters/ro/chapter 6/1.mdx   |  19 -
 chapters/ro/chapter 6/10.mdx  | 283 ---------------
 chapters/ro/chapter 6/2.mdx   | 257 --------------
 chapters/ro/chapter 6/3.mdx   | 473 -------------------------
 chapters/ro/chapter 6/3b.mdx  | 643 ----------------------------------
 chapters/ro/chapter 6/4.mdx   | 122 -------
 chapters/ro/chapter 6/5.mdx   | 360 -------------------
 chapters/ro/chapter 6/6.mdx   | 375 --------------------
 chapters/ro/chapter 6/7.mdx   | 381 --------------------
 chapters/ro/chapter 6/8.mdx   | 566 ------------------------------
 chapters/ro/chapter 6/9.mdx   |  16 -
 chapters/ro/chapter0/1.mdx    | 110 ------
 chapters/ro/chapter2/1.mdx    |  28 --
 chapters/ro/chapter2/2.mdx    | 364 -------------------
 chapters/ro/chapter2/3.mdx    | 235 -------------
 chapters/ro/chapter2/4.mdx    | 246 -------------
 chapters/ro/chapter2/5.mdx    | 338 ------------------
 chapters/ro/chapter2/6.mdx    | 164 ---------
 chapters/ro/chapter2/7.mdx    |  19 -
 chapters/ro/chapter2/8.mdx    | 310 ----------------
 chapters/ro/chapter3/1.mdx    |  25 --
 chapters/ro/chapter3/2.mdx    | 393 ---------------------
 chapters/ro/chapter3/3.mdx    | 174 ---------
 chapters/ro/chapter3/3_tf.mdx | 206 -----------
 chapters/ro/chapter3/4.mdx    | 361 -------------------
 chapters/ro/chapter3/5.mdx    |  26 --
 chapters/ro/chapter3/6.mdx    | 301 ----------------
 chapters/ro/chapter4/1.mdx    |  22 --
 chapters/ro/chapter4/2.mdx    |  98 ------
 chapters/ro/chapter4/3.mdx    | 641 ---------------------------------
 chapters/ro/chapter4/4.mdx    |  88 -----
 chapters/ro/chapter4/5.mdx    |  12 -
 chapters/ro/chapter4/6.mdx    | 233 ------------
 36 files changed, 7920 deletions(-)
 delete mode 100644 .codegpt/head
 delete mode 100644 chapters/ro/_toctree.yml
 delete mode 100644 chapters/ro/chapter 6/1.mdx
 delete mode 100644 chapters/ro/chapter 6/10.mdx
 delete mode 100644 chapters/ro/chapter 6/2.mdx
 delete mode 100644 chapters/ro/chapter 6/3.mdx
 delete mode 100644 chapters/ro/chapter 6/3b.mdx
 delete mode 100644 chapters/ro/chapter 6/4.mdx
 delete mode 100644 chapters/ro/chapter 6/5.mdx
 delete mode 100644 chapters/ro/chapter 6/6.mdx
 delete mode 100644 chapters/ro/chapter 6/7.mdx
 delete mode 100644 chapters/ro/chapter 6/8.mdx
 delete mode 100644 chapters/ro/chapter 6/9.mdx
 delete mode 100644 chapters/ro/chapter0/1.mdx
 delete mode 100644 chapters/ro/chapter2/1.mdx
 delete mode 100644 chapters/ro/chapter2/2.mdx
 delete mode 100644 chapters/ro/chapter2/3.mdx
 delete mode 100644 chapters/ro/chapter2/4.mdx
 delete mode 100644 chapters/ro/chapter2/5.mdx
 delete mode 100644 chapters/ro/chapter2/6.mdx
 delete mode 100644 chapters/ro/chapter2/7.mdx
 delete mode 100644 chapters/ro/chapter2/8.mdx
 delete mode 100644 chapters/ro/chapter3/1.mdx
 delete mode 100644 chapters/ro/chapter3/2.mdx
 delete mode 100644 chapters/ro/chapter3/3.mdx
 delete mode 100644 chapters/ro/chapter3/3_tf.mdx
 delete mode 100644 chapters/ro/chapter3/4.mdx
 delete mode 100644 chapters/ro/chapter3/5.mdx
 delete mode 100644 chapters/ro/chapter3/6.mdx
 delete mode 100644 chapters/ro/chapter4/1.mdx
 delete mode 100644 chapters/ro/chapter4/2.mdx
 delete mode 100644 chapters/ro/chapter4/3.mdx
 delete mode 100644 chapters/ro/chapter4/4.mdx
 delete mode 100644 chapters/ro/chapter4/5.mdx
 delete mode 100644 chapters/ro/chapter4/6.mdx

diff --git a/.codegpt/head b/.codegpt/head
deleted file mode 100644
index 61e0708bd..000000000
--- a/.codegpt/head
+++ /dev/null
@@ -1 +0,0 @@
-d92002a2-d67d-44e7-9370-14bf913c3669
\ No newline at end of file
diff --git a/.gitignore b/.gitignore
index fa8e74203..a1d21056b 100644
--- a/.gitignore
+++ b/.gitignore
@@ -82,5 +82,3 @@ nbs/
 __pycache__/
 .cache/
 
-
-.codegpt
\ No newline at end of file
diff --git a/chapters/ro/_toctree.yml b/chapters/ro/_toctree.yml
deleted file mode 100644
index 25730606c..000000000
--- a/chapters/ro/_toctree.yml
+++ /dev/null
@@ -1,28 +0,0 @@
-- title: 0. Configurare
-  sections:
-  - local: chapter0/1
-    title: Introducere
-
-- title: 1. Modele Transformer
-  sections:
-  - local: chapter1/1
-    title: Introducere
-  - local: chapter1/2
-    title: Procesarea limbajului natural și modelele de limbaj mari
-  - local: chapter1/3
-    title: Transformers, ce pot face?
-  - local: chapter1/4
-    title: Cum funcționează Transformers?
-  - local: chapter1/5
-    title: Modele Encoder
-  - local: chapter1/6
-    title: Modele Decoder
-  - local: chapter1/7
-    title: Modele secvență-la-secvență
-  - local: chapter1/8
-    title: Prejudecăți și limitări
-  - local: chapter1/9
-    title: Rezumat
-  - local: chapter1/10
-    title: Quiz de final de capitol
-    quiz: 1
diff --git a/chapters/ro/chapter 6/1.mdx b/chapters/ro/chapter 6/1.mdx
deleted file mode 100644
index 9cfd151ed..000000000
--- a/chapters/ro/chapter 6/1.mdx	
+++ /dev/null
@@ -1,19 +0,0 @@
-# Introducere[[introducere]]
-
-<CourseFloatingBanner
-    chapter={6}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-În [Capitolul 3](/course/chapter3), am examinat cum să facem fine-tune unui model pentru o anumită sarcină. Când facem acest lucru, utilizăm același tokenizer cu care modelul a fost antrenat - dar ce facem când dorim să antrenăm un model de la zero? În așa cazuri, utilizarea unui tokenizer care a fost antrenat pe un corpus dintr-un alt domeniu sau limbă este, de obicei, suboptimal. De exemplu, un tokenizer antrenat pe un corpus în limba engleză va funcționa rău pe un corpus de texte în limba japoneză, deoarece utilizarea spațiilor și a punctuației este foarte diferită în cele două limbi.
-
-În acest capitol, veți învăța cum să antrenați un tokenizer complet nou pe un corpus de texte, astfel încât să poată fi utilizat pentru a antrena un model de limbaj. Acest lucru va fi realizat cu ajutorul bibliotecii [🤗 Tokenizers](https://github.com/huggingface/tokenizers), care oferă tokenizerii "rapizi" din biblioteca [🤗 Transformers](https://github.com/huggingface/transformers). Vom examina îndeaproape caracteristicile pe care această bibliotecă le oferă și vom explora cum tokenizatorii rapizi diferă de versiunile "lente".
-
-Subiectele pe care le vom acoperi includ:
-
-* Cum să antrenați un tokenizer nou similar celui utilizat de un anumit checkpoint pe un corpus nou de texte
-* Caracteristicile speciale ale tokenizerilor rapizi
-* Diferențele dintre cei trei algoritmi principali de subword tokenization utilizate în NLP în prezent
-* Cum să construiți un tokenizer de la zero cu biblioteca 🤗 Tokenizers și să îl antrenați pe anumite date
-
-Tehnicile prezentate în acest capitol vă vor pregăti pentru secțiunea din [Capitolul 7](/course/chapter7/6), unde vom examina crearea unui model de limbaj pentru codul sursă Python. Să începem prin a explora ce înseamnă să "antrenați" un tokenizer în primul rând.
diff --git a/chapters/ro/chapter 6/10.mdx b/chapters/ro/chapter 6/10.mdx
deleted file mode 100644
index f3fcf6dc7..000000000
--- a/chapters/ro/chapter 6/10.mdx	
+++ /dev/null
@@ -1,283 +0,0 @@
-<!-- DISABLE-FRONTMATTER-SECTIONS -->
-
-# Quiz de sfârșit de capitol[[end-of-chapter-quiz]]
-
-<CourseFloatingBanner
-    chapter={6}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-Hai să testăm ceea ce ai învățat în acest capitol!
-
-### 1. Când ar trebui să antrenezi un nou tokenizer?
-
-<Question
-	choices={[
-		{
-			text: "Când datasetul tău este similar cu cel utilizat de un model preantrenat și doriți să preantrenați un model nou",
-			explain: "În acest caz, pentru a economisi timp și resurse, o alegere mai bună ar fi să folosești același tokenizer ca și modelul preantrenat și să faceți fine-tune acelui model."
-		},
-		{
-			text: "Atunci când datasetul tău este similar cu cel utilizat de un model preantrenat existent și doriți să faceți fine-tune unui nou model utilizând acest model preantrenat",
-			explain: "Pentru a face fine-tune unui model dintr-un model preantrenat, trebuie să utilizați întotdeauna același tokenizer."
-		},
-		{
-			text: "Atunci când datasetul tău este diferit de cel utilizat de un model preantrenat existent și doriți să preantrenați un nou model",
-			explain: "Corect! În acest caz nu există niciun avantaj în a utiliza același tokenizer.",
-            correct: true
-		},
-        {
-			text: "Atunci datasetul tău este diferit de cel utilizat de un model preantrenat existent, dar doriți să faceți fine-tune unui model nou utilizând acest model preantrenat",
-			explain: "Pentru a face fine-tune unui model dintr-un model preantrenat, trebuie să utilizați întotdeauna același tokenizer."
-		}
-	]}
-/>
-
-### 2. Care este avantajul utilizării unui generator de liste de texte în comparație cu o listă de liste de texte atunci când utilizați `train_new_from_iterator()`?
-
-<Question
-	choices={[
-		{
-			text: "Acesta este singurul tip pe care metoda <code>train_new_from_iterator()</code> îl acceptă.",
-			explain: "O listă de liste de texte este un tip special de generator de liste de texte, astfel încât metoda o va accepta și pe aceasta. Încercați din nou!"
-		},
-		{
-			text: "Veți evita încărcarea întregului dataset în memorie.",
-			explain: "Corect! Fiecare batch de texte va fi eliberat din memorie atunci când iterați, iar câștigul va fi vizibil mai ales dacă utilizați 🤗 Datasets pentru a stoca textele.",
-			correct: true
-		},
-		{
-			text: "Acest lucru va permite bibliotecii 🤗 Tokenizers să utilizeze multiprocessing.",
-			explain: "Nu, oricum va folosi multiprocessing."
-		},
-        {
-			text: "Tokenizerul pe care îl vei antrena va genera texte mai bune.",
-			explain: "Tokenizerul nu generează text - îl confundați cu un model lingvistic?"
-		}
-	]}
-/>
-
-### 3. Care sunt avantajele utilizării unui tokenizer "rapid"?
-
-<Question
-	choices={[
-		{
-			text: "Acesta poate procesa inputuri mai rapid decât un tokenizator lent atunci când faci batch mai multor inputuri împreună.",
-			explain: "Corect! Datorită paralelismului implementat în Rust, acesta va fi mai rapid pe batch-uri de inputuri. La ce alt beneficiu te poți gândi?",
-			correct: true
-		},
-		{
-			text: "Tokenizerele rapide tokenizează întotdeauna mai rapid decât omologii lor lenți.",
-			explain: "Un tokenizer rapid poate fi de fapt mai lent atunci când îi dai doar unul sau foarte puține texte, deoarece nu poate utiliza paralelismul."
-		},
-		{
-			text: "Poate aplica padding și truncation.",
-			explain: "Adevărat, dar și tokenizerele lente fac asta."
-		},
-        {
-			text: "Acesta are unele caracteristici suplimentare care vă permit să asociați tokenii cu intervalul de text care le-a creat.",
-			explain: "Într-adevăr - acestea se numesc offset mappings. Totuși, acesta nu este singurul avantaj.",
-			correct: true
-		}
-	]}
-/>
-
-### 4. Cum tratează pipelineul `token-classification` entitățile care se întind pe mai mulți tokeni?
-
-<Question
-	choices={[
-		{
-			text: "Entitățile cu același label sunt merged într-o singură entitate.",
-			explain: "Explicația aceasta e prea simplă. Încearcă din nou!"
-		},
-		{
-			text: "Există un label pentru începutul unei entități și un label pentru continuarea unei entități.",
-			explain: "Corect!",
-			correct: true
-		},
-		{
-			text: "Într-un cuvânt dat, atâta timp cât primul token are labelul entității, întregul cuvânt este considerat etichetat cu entitatea respectivă.",
-			explain: "Aceasta este o strategie de gestionare a entităților. Ce alte răspunsuri se aplică aici?",
-			correct: true
-		},
-        {
-			text: "Atunci când un token are labelul unei entități date, orice alt token următor cu aceeași label este considerat parte a aceleiași entități, cu excepția cazului în care este labeled ca fiind începutul unei noi entități.",
-			explain: "Acesta este cel mai comun mod de a grupa entitățile împreună - deși nu este singurul răspuns corect.",
-			correct: true
-		}
-	]}
-/>
-
-### 5. Cum gestionează pipelineul `question-answering` contextele lungi?
-
-<Question
-	choices={[
-		{
-			text: "De fapt, nu o face, deoarece trunchiază contextul lung la lungimea maximă acceptată de model.",
-			explain: "Există un truc pe care îl poți folosi pentru a gestiona contextele lungi. Îți amintești care este acesta?"
-		},
-		{
-			text: "Acesta împarte contextul în mai multe părți și calculează media rezultatelor obținute.",
-			explain: "Nu, nu ar avea sens să se facă o medie a rezultatelor, deoarece unele părți ale contextului nu vor include răspunsul."
-		},
-		{
-			text: "Acesta împarte contextul în mai multe părți (cu suprapuneri) și găsește scorul maxim pentru un răspuns în fiecare parte.",
-			explain: "Acesta este răspunsul corect!",
-			correct: true
-		},
-        {
-			text: "Acesta împarte contextul în mai multe părți (fără suprapunere, pentru eficiență) și găsește scorul maxim pentru un răspuns în fiecare parte.",
-			explain: "Nu, acesta include o anumită suprapunere între părți pentru a evita situația în care răspunsul ar fi împărțit în două părți."
-		}
-	]}
-/>
-
-### 6. Ce este normalizarea?
-
-<Question
-	choices={[
-		{
-			text: "Este vorba de orice curățare pe care tokenizerul o efectuează asupra textelor în etapele inițiale.",
-			explain: "Corect - de exemplu, ar putea implica eliminarea accentelor sau a spațiilor, sau scrierea cu mijuscule a inputurilor.",
-			correct: true
-		},
-		{
-			text: "Este o tehnică de augmentare a datelor care constă în a face textul mai normal prin eliminarea cuvintelor rare.",
-			explain: "Este incorect! Încearcă din nou."
-		},
-		{
-			text: "Acesta este ultimul pas de post-procesare în care tokenizerul adaugă tokenii speciali.",
-			explain: "Această etapă se numește pur și simplu post-procesare."
-		},
-        {
-			text: "Este atunci când embeddingurile sunt realizate cu media 0 și standard deviation 1, prin scăderea mediei și împărțirea la std.",
-			explain: "Acest proces se numește de obicei normalizare atunci când este aplicat valorilor pixelilor în computer vision, dar nu este ceea ce înseamnă normalizare în NLP."
-		}
-	]}
-/>
-
-### 7. Ce este pre-tokenizarea pentru un subword tokenizer?
-
-<Question
-	choices={[
-		{
-			text: "Acesta este pasul dinaintea tokenizării, în care se aplică augmentarea datelor (cum ar fi mascarea aleatorie).",
-			explain: "Nu, acest pas face parte din preprocesare."
-		},
-		{
-			text: "Este pasul de dinaintea tokenizării, în care operațiile de curățare dorite sunt aplicate textului.",
-			explain: "Nu, acesta este pasul de normalizare."
-		},
-		{
-			text: "Acesta este pasul dinaintea aplicării modelul de tokenizer, pentru a împărți inputul în cuvinte.",
-			explain: "Acesta este răspunsul corect!",
-			correct: true
-		},
-        {
-			text: "Acesta este pasul dinaintea aplicării modelul de  tokenizer, pentru a împărți inputul în tokenuri.",
-			explain: "Nu, împărțirea în tokenuri este sarcina modelul de tokenizer."
-		}
-	]}
-/>
-
-### 8. Selectați propozițiile care se aplică modelului de tokenizare BPE.
-
-<Question
-	choices={[
-		{
-			text: "BPE este un algoritm de tokenizare a subcuvintelor care începe cu un vocabular mic și învață reguli de merge.",
-			explain: "Acesta este într-adevăr cazul!",
-			correct: true
-		},
-		{
-			text: "BPE este un algoritm de tokenizare a subcuvintelor care începe cu un vocabular mare și elimină progresiv tokenii din acesta.",
-			explain: "Nu, aceasta este abordarea adoptată de un alt algoritm de tokenizare."
-		},
-		{
-			text: "Tokenizerele BPE învață regulile de merge prin mergeul perechii de tokeni care este cea mai frecventă.",
-			explain: "Acest lucru este corect!",
-			correct: true
-		},
-		{
-			text: "Un tokenizer BPE învață o regulă de merge prin mergeul perechii de tokeni care maximizează un scor care privilegiază perechile frecvente cu părți individuale mai puțin frecvente.",
-			explain: "Nu, aceasta este strategia aplicată de un alt algoritm de tokenizare."
-		},
-		{
-			text: "BPE tokenizează cuvintele în subcuvinte prin divizarea lor în caractere și apoi prin aplicarea regulilor de merge.",
-			explain: "Acest lucru este corect!",
-			correct: true
-		},
-		{
-			text: "BPE tokenizează cuvintele în subcuvinte prin găsirea celui mai lung subcuvânt de la început care se află în vocabular, apoi repetă procesul pentru restul textului.",
-			explain: "Nu, acesta este un alt mod de a face lucrurile al algoritmului de tokenizare."
-		},
-	]}
-/>
-
-### 9. Selectați propozițiile care se aplică modelului de tokenizare WordPiece.
-
-<Question
-	choices={[
-		{
-			text: "WordPiece este un algoritm de tokenizare a subcuvintelor care începe cu un vocabular mic și învață reguli de merge.",
-			explain: "Acesta este într-adevăr cazul!",
-			correct: true
-		},
-		{
-			text: "WordPiece este un algoritm de tokenizare a subcuvintelor care începe cu un vocabular mare și elimină progresiv tokenii din acesta.",
-			explain: "Nu, aceasta este abordarea adoptată de un alt algoritm de tokenizare."
-		},
-		{
-			text: "Tokenizerele WordPiece învață regulile de merge prin mergeul perechii de tokeni care este cea mai frecventă.",
-			explain: "Nu, aceasta este abordarea adoptată de un alt algoritm de tokenizare!",
-		},
-		{
-			text: "Un tokenizer WordPiece învață o regulă de merge prin mergeul perechii de tokeni care maximizează un scor care privilegiază perechile frecvente cu părți individuale mai puțin frecvente.",
-			explain: "Acest lucru este corect!",
-			correct: true
-		},
-		{
-			text: "WordPiece tokenizează cuvintele în subcuvinte prin găsirea celei mai probabile segmentări în tokeni, în conformitate cu modelul.",
-			explain: "Nu, acesta este modul în care funcționează un alt algoritm de tokenizare."
-		},
-		{
-			text: "WordPiece tokenizează cuvintele în subcuvinte prin găsirea celui mai lung subcuvânt de la început care se află în vocabular, apoi repetă procesul pentru restul textului.",
-			explain: "Da, acesta este modul în care WordPiece procedează pentru encoding.",
-			correct: true
-		},
-	]}
-/>
-
-### 10. Selectați propozițiile care se aplică modelului de tokenizare Unigram.
-
-<Question
-	choices={[
-		{
-			text: "Unigram este un algoritm de tokenizare a subcuvintelor care începe cu un vocabular mic și învață reguli de merge.",
-			explain: "Nu, aceasta este abordarea adoptată de un alt algoritm de tokenizare."
-		},
-		{
-			text: "Unigram este un algoritm de tokenizare a subcuvintelor care începe cu un vocabular mare și elimină progresiv tokenurile din el.",
-			explain: "Acest lucru este corect!",
-			correct: true
-		},
-		{
-			text: "Unigram își adaptează vocabularul prin minimizarea unei pierderi calculate pe întregul corpus.",
-			explain: "Acest lucru este corect!",
-			correct: true
-		},
-		{
-			text: "Unigram își adaptează vocabularul prin păstrarea celor mai frecvente subcuvinte.",
-			explain: "Nu, acest lucru este incorect."
-		},
-		{
-			text: "Unigram tokenizează cuvintele în subcuvinte prin găsirea celei mai probabile segmentări în tokenuri, conform modelului.",
-			explain: "Acest lucru este corect!",
-			correct: true
-		},
-		{
-			text: "Unigram tokenizează cuvintele în subcuvinte prin divizarea lor în caractere, apoi aplică regulile de merge.",
-			explain: "Nu, acesta este modul în care funcționează un alt algoritm de tokenizare."
-		},
-	]}
-/>
diff --git a/chapters/ro/chapter 6/2.mdx b/chapters/ro/chapter 6/2.mdx
deleted file mode 100644
index ef36da15c..000000000
--- a/chapters/ro/chapter 6/2.mdx	
+++ /dev/null
@@ -1,257 +0,0 @@
-# Antrenarea unui nou tokenizer dintr-unul vechi[[training-a-new-tokenizer-from-an-old-one]]
-
-<CourseFloatingBanner chapter={6}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter6/section2.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter6/section2.ipynb"},
-]} />
-
-Dacă un model de limbaj nu este disponibil în limba dorită sau dacă corpusul tău este foarte diferit de cel pe care modelul de limbaj a fost antrenat, este probabil că veți dori să antrenați modelul de la zero, folosind un tokenizer adaptat datelor tale. Acest lucru va necesita antrenarea unui nou tokenizer pe datasetul tău. Dar ce înseamnă exact asta? Când am examinat pentru prima dată tokenizatorii în [Capitolul 2](/course/chapter2), am văzut că majoritatea modelelor Transformer folosesc un _algoritm de subword tokenization_. Pentru a identifica care subcuvinte sunt de interes și apar cel mai frecvent în corpusul respectiv, tokenizerul trebuie să examineze cu atenție toate textele din corpus - un proces pe care îl numim *antrenare*. Regulile exacte care conduc această antrenare depind de tipul de tokenizer utilizat și vom prezenta cei trei algoritmi principali mai târziu în acest capitol.
-
-<Youtube id="DJimQynXZsQ"/>
-
-<Tip warning={true}>
-
-⚠️ Antrenarea unui tokenizer nu este același lucru ca antrenarea unui model! Antrenarea modelului folosește stochastic gradient descent pentru a face pierderea puțin mai mică pentru fiecare batch. Este randomizată prin natură (ceea ce înseamnă că trebuie să setați niște seeduri pentru a obține aceleași rezultate atunci când faceți aceeași antrenare de două ori). Antrenarea unui tokenizer este un proces statistic care încearcă să identifice care subcuvinte sunt cele mai bune pentru a fi selectate pentru un anumit corpus, și regulile exacte utilizate pentru a le selecta depind de algoritmul de tokenizare. Este determinist, ceea ce înseamnă că întotdeauna obțineți aceleași rezultate atunci când antrenați cu același algoritm pe același corpus.
-
-</Tip>
-
-## Asamblarea unui corpus[[assembling-a-corpus]]
-
-Există o interfață API foarte simplă în 🤗 Transformers pe care o puteți utiliza pentru a antrena un nou tokenizer cu aceleași caracteristici ca unul existent: `AutoTokenizer.train_new_from_iterator()`. Pentru a vedea acest lucru în acțiune, să zicem că vrem să antrenăm GPT-2 de la zero, dar într-o altă limbă decât engleza. Prima noastră sarcină va fi să adunăm multe date în acea limbă într-un corpus de antrenare. Pentru a oferi exemple pe care toată lumea le poate înțelege, nu vom folosi o limbă ca rusă sau chineza aici, ci mai degrabă o limbă engleză specializată: codul Python.
-
-Biblioteca [🤗 Datasets](https://github.com/huggingface/datasets) ne poate ajuta să asamblăm un corpus de cod sursă Python. Vom folosi funcția obișnuită `load_dataset()` pentru a descărca și a păstra în cache dataseul [CodeSearchNet](https://huggingface.co/datasets/code_search_net). Acest dataset a fost creat pentru [Provocarea CodeSearchNet](https://wandb.ai/github/CodeSearchNet/benchmark) și conține milioane de funcții din biblioteci open-source de pe GitHub în mai multe limbaje de programare. Aici, vom încărca partea Python a acestui dataset:
-
-```py
-from datasets import load_dataset
-
-# Acest lucru poate dura câteva minute pentru a încărca, așa că luați o pauză și beți o ceașcă de cafea sau ceai în timp ce așteptați!
-raw_datasets = load_dataset("code_search_net", "python")
-```
-
-Putem să ne uităm la splitul de antrenare pentru a vedea la care coloane avem acces:
-
-```py
-raw_datasets["train"]
-```
-
-```python out
-Dataset({
-    features: ['repository_name', 'func_path_in_repository', 'func_name', 'whole_func_string', 'language', 
-      'func_code_string', 'func_code_tokens', 'func_documentation_string', 'func_documentation_tokens', 'split_name', 
-      'func_code_url'
-    ],
-    num_rows: 412178
-})
-```
-
-Putem vedea că dataset-ul separă docstringurile de cod și sugerează o tokenizare a ambelor. Aici, vom folosi doar coloana `whole_func_string` pentru a antrena tokenizerul nostru. Putem să ne uităm la un exemplu al unei astfel de funcții prin indexarea în splitul de antrenare:
-
-```py
-print(raw_datasets["train"][123456]["whole_func_string"])
-```
-
-care ar trebui să printeze următorul lucru:
-
-```out
-def handle_simple_responses(
-      self, timeout_ms=None, info_cb=DEFAULT_MESSAGE_CALLBACK):
-    """Accepts normal responses from the device.
-
-    Args:
-      timeout_ms: Timeout in milliseconds to wait for each response.
-      info_cb: Optional callback for text sent from the bootloader.
-
-    Returns:
-      OKAY packet's message.
-    """
-    return self._accept_responses('OKAY', info_cb, timeout_ms=timeout_ms)
-```
-
-Primul lucru pe care trebuie să-l facem este să transformăm setul de date într-un _iterator_ de liste de texte - de exemplu, o listă de liste de texte. Utilizarea listelor de texte va permite tokenizerului nostru să funcționeze mai rapid (antrenându-se pe batch-uri de texte în loc de a procesa texte individuale unul câte unul), iar acesta ar trebui să fie un iterator dacă dorim să evităm să avem tot în memoria RAM deodată. Dacă corpusul tău este uriaș, veți dori să profitați de faptul că 🤗 Datasets nu încarcă totul în memoria RAM, ci stochează elementele datasetului pe disc.
-
-Următoarea operație ar crea o listă de liste de 1.000 de texte fiecare, dar ar încărca totul în memorie:
-
-```py
-# Nu faceți uncomment următoarei linii dacă datasetul vostru este mare, ci doar dacă este mic!
-# training_corpus = [raw_datasets["train"][i: i + 1000]["whole_func_string"] for i in range(0, len(raw_datasets["train"]), 1000)]
-```
-
-Utilizând un generator Python, putem evita ca Python să încarce orice în memorie până când este realmente necesar. Pentru a crea un astfel de generator, trebuie doar să înlocuiți parantezele pătrate cu paranteze rotunde:
-
-```py
-training_corpus = (
-    raw_datasets["train"][i : i + 1000]["whole_func_string"]
-    for i in range(0, len(raw_datasets["train"]), 1000)
-)
-```
-
-Această linie de cod nu extrage niciun element al setului de date; doar creează un obiect pe care îl puteți utiliza într-un `for` loop din Python. Textele vor fi încărcate doar atunci când veți avea nevoie de ele(adică atunci când sunteți la pasul loopului `for` care le solicită), iar doar 1.000 de texte vor fi încărcate la un moment dat. Acest mod vă permite să nu epuizați memoria RAM chiar dacă prelucrați un set de date uriaș.
-
-Problema cu un obiect generator este că poate fi utilizat doar o dată, așadar, în loc să ne ofere lista primelor 10 cifre de două ori:
-
-```py
-gen = (i for i in range(10))
-print(list(gen))
-print(list(gen))
-```
-
-noi le primim o dată și apoi o listă goală:
-
-```python out
-[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
-[]
-```
-
-Din acest motive noi definim o funcție ce returnează în schimb un generator: 
-
-```py
-def get_training_corpus():
-    return (
-        raw_datasets["train"][i : i + 1000]["whole_func_string"]
-        for i in range(0, len(raw_datasets["train"]), 1000)
-    )
-
-
-training_corpus = get_training_corpus()
-```
-
-În același timp poți defini un generator înăuntrul unui `for` loop folosing statementul `yield`:
-
-```py
-def get_training_corpus():
-    dataset = raw_datasets["train"]
-    for start_idx in range(0, len(dataset), 1000):
-        samples = dataset[start_idx : start_idx + 1000]
-        yield samples["whole_func_string"]
-```
-
-ceea ce va produce același generator ca înainte, dar îți va permite să folosești o logică mai complexă decât cea pe care ai putea să o folosești într-un list comprehension.
-
-## Antrenarea unui nou tokenizer[[training-a-new-tokenizer]]
-
-Acum că avem corpusul nostru sub forma unui iterator de batch-uri de texte, suntem gata să antrenăm un nou tokenizer. Pentru a face acest lucru, trebuie mai întâi să încărcăm tokenizerul pe care dorim să-l asociem cu modelul nostru (aici, GPT-2):
-
-```py
-from transformers import AutoTokenizer
-
-old_tokenizer = AutoTokenizer.from_pretrained("gpt2")
-```
-
-Chiar dacă urmează să antrenăm un nou tokenizer, este o idee bună să facem acest lucru pentru a evita să începem să facem tot de la zero. Astfel, nu vom fi nevoiți să specificăm nimic despre algoritmul de tokenizare sau despre special tokens pe care îi vom utiliza; noul nostru tokenizer va fi exact la fel ca GPT-2, iar singur lucrul care se va schimba este vocabularul, care va fi determinat de antrenarea pe corpusul nostru.
-
-Mai întâi, hai să vedem cum ar interpreta acest tokenizer un exemplu de funcție:
-
-```py
-example = '''def add_numbers(a, b):
-    """Add the two numbers `a` and `b`."""
-    return a + b'''
-
-tokens = old_tokenizer.tokenize(example)
-tokens
-```
-
-```python out
-['def', 'Ġadd', '_', 'n', 'umbers', '(', 'a', ',', 'Ġb', '):', 'Ċ', 'Ġ', 'Ġ', 'Ġ', 'Ġ"""', 'Add', 'Ġthe', 'Ġtwo',
- 'Ġnumbers', 'Ġ`', 'a', '`', 'Ġand', 'Ġ`', 'b', '`', '."', '""', 'Ċ', 'Ġ', 'Ġ', 'Ġ', 'Ġreturn', 'Ġa', 'Ġ+', 'Ġb']
-```
-
-Acest tokenizer are câteva simboluri speciale, cum ar fi `Ġ` și `Ċ`, care denotă spații și noi linii, respectiv. Așa cum se poate vedea, acest lucru nu este prea eficient: tokenizerul returnează tokenuri individuale pentru fiecare spațiu, când ar putea grupa împreună nivelurile de indentare (deoarece având seturi de patru sau opt spații va fi foarte comun în cod). De asemenea, a divizat numele funcției într-un mod ciudat, nefiind obișnuit să vadă cuvinte care conțin caracterele `_`.
-
-Acum hai să antrenăm un nou tokenizer și să vedem dacă rezolvă aceste probleme. Pentru aceasta, vom utiliza metoda `train_new_from_iterator()`:
-
-```py
-tokenizer = old_tokenizer.train_new_from_iterator(training_corpus, 52000)
-```
-
-Această comandă ar putea dura puțin timp dacă corpusul este foarte mare, dar pentru acest dataset de 1,6 GB de texte este extrem de rapid (1 minut și 16 secunde pe un procesor AMD Ryzen 9 3900X cu 12 nuclee).
-
-Reține că `AutoTokenizer.train_new_from_iterator()` funcționează doar dacă tokenizerul pe care îl utilizați este un tokenizer "rapid". Așa cum veți vedea în următoarea secțiune, biblioteca 🤗 Transformers conține două tipuri de tokenizeri: unii sunt scriși în pur Python, iar alții (cei rapizi) sunt susținuți de biblioteca 🤗 Tokenizers, care este scrisă în limbajul de programare Rust. Python este limbajul cel mai frecvent utilizat pentru aplicații de data science și deep learning, dar atunci când orice trebuie să fie paralelizat pentru a fi rapid, trebuie să fie scris într-un alt limbaj de programare. De exemplu, multiplicările matricelor care sunt la baza calculelor modelului sunt scrise în CUDA, o bibliotecă C optimizată pentru GPU-uri.
-
-Antrenarea unui tokenizer nou în pur  Python ar fi extrem de lent, de aceea am dezvoltat biblioteca 🤗 Tokenizers. Reține că, la fel cum nu a trebuit să învățați limbajul CUDA pentru a putea executa modelul pe un batch de inputuri pe un GPU, nu veți avea nevoie să învățați Rust pentru a utiliza un tokenizer rapid. Biblioteca 🤗 Tokenizers oferă legături Python pentru multe metode care apelează intern unele bucăți de cod în Rust; de exemplu, pentru a paraleliza antrenarea noului tokenizer sau, așa cum am văzut în [Capitolul 3](/course/chapter3), tokenizarea unui batch de inputuri.
-
-Majoritatea modelelor Transformer au un tokenizer rapid disponibil (există unele excepții pe care le puteți verifica [aici](https://huggingface.co/transformers/#supported-frameworks)), iar API-ul `AutoTokenizer` selectează întotdeauna tokenizerul rapid pentru tine dacă este disponibil. În următoarea secțiune, vom examina unele dintre celelalte caracteristici speciale ale tokenizerilor rapizi, care vor fi foarte utile pentru sarcini precum clasificarea tokenilor și răspunderea la întrebări. Înainte de a face acest lucru, totuși, să încercăm noul nostru tokenizer pe exemplul anterior:
-
-```py
-tokens = tokenizer.tokenize(example)
-tokens
-```
-
-```python out
-['def', 'Ġadd', '_', 'numbers', '(', 'a', ',', 'Ġb', '):', 'ĊĠĠĠ', 'Ġ"""', 'Add', 'Ġthe', 'Ġtwo', 'Ġnumbers', 'Ġ`',
- 'a', '`', 'Ġand', 'Ġ`', 'b', '`."""', 'ĊĠĠĠ', 'Ġreturn', 'Ġa', 'Ġ+', 'Ġb']
-```
-
-Aici din nou vedem simboluri speciale ca `Ġ` sau `Ċ` care denotă spații sau linii noi, dar în același timp putem vedea că tokenizerul nostru a învățat câțiva tokens care sunt foarte specifici la corpusul de funcții Python: de exemplu, tokenul `ĊĠĠĠ` care reprezintă indentarea, sau tokenul `Ġ"""` care reprezintă cele trei ghilimele cu care se începe un docstring. Tokenizerul, de asemenea face split corect numelui funției pe `_`. Aceasta chiar este o reprezentare compactă: comparativ, utilizând limba tokenizerul Englez pe același exemplu ne va da o propoziție mai lungă:
-
-```py
-print(len(tokens))
-print(len(old_tokenizer.tokenize(example)))
-```
-
-```python out
-27
-36
-```
-
-Hai să ne uităm la un alt exemplu:
-
-```python
-example = """class LinearLayer():
-    def __init__(self, input_size, output_size):
-        self.weight = torch.randn(input_size, output_size)
-        self.bias = torch.zeros(output_size)
-
-    def __call__(self, x):
-        return x @ self.weights + self.bias
-    """
-tokenizer.tokenize(example)
-```
-
-```python out
-['class', 'ĠLinear', 'Layer', '():', 'ĊĠĠĠ', 'Ġdef', 'Ġ__', 'init', '__(', 'self', ',', 'Ġinput', '_', 'size', ',',
- 'Ġoutput', '_', 'size', '):', 'ĊĠĠĠĠĠĠĠ', 'Ġself', '.', 'weight', 'Ġ=', 'Ġtorch', '.', 'randn', '(', 'input', '_',
- 'size', ',', 'Ġoutput', '_', 'size', ')', 'ĊĠĠĠĠĠĠĠ', 'Ġself', '.', 'bias', 'Ġ=', 'Ġtorch', '.', 'zeros', '(',
- 'output', '_', 'size', ')', 'ĊĊĠĠĠ', 'Ġdef', 'Ġ__', 'call', '__(', 'self', ',', 'Ġx', '):', 'ĊĠĠĠĠĠĠĠ',
- 'Ġreturn', 'Ġx', 'Ġ@', 'Ġself', '.', 'weights', 'Ġ+', 'Ġself', '.', 'bias', 'ĊĠĠĠĠ']
-```
-
-În plus față de tokenul corespunzător unei indentări, aici putem vedea și un token pentru o indentare dublă: `ĊĠĠĠĠĠĠĠ`. Cuvintele speciale din Python, cum ar fi `class`, `init`, `call`, `self` și `return`, sunt tokenizate fiecare ca un singur token, și putem vedea că, pe lângă divizarea la `_` și `.`, tokenizerul divizează corect chiar și numele scrise în stil camel-case: `LinearLayer` este tokenizeat ca `["ĠLinear", "Layer"]`.
-
-## Salvarea tokenizerului[[saving-the-tokenizer]]
-
-Pentru a ne asigura că îl putem utiliza mai târziu, trebuie să salvăm noul nostru tokenizer. Asemănător salvării unui model, acest lucru se realizează cu metoda `save_pretrained()`:
-
-```py
-tokenizer.save_pretrained("code-search-net-tokenizer")
-```
-
-Acest lucru va crea un nou folder numit *code-search-net-tokenizer*, care va conține toate fișierele necesare pentru a reîncărca tokenizerul. Dacă doriți să partajați acest tokenizer cu colegii și prietenii tăi, îl puteți încărca pe Hub prin conectarea la contul tău. Dacă lucrați într-un notebook, există un convenience function pentru a vă ajuta cu acest lucru:
-
-```python
-from huggingface_hub import notebook_login
-
-notebook_login()
-```
-
-Acest lucru va afișa un widget în care puteți introduce credențialele de conectare Hugging Face. Dacă nu lucrați într-un notebook, introduceți simplu următoarea linie în terminal:
-
-```bash
-huggingface-cli login
-```
-
-După ce v-ați conectat, puteți face push tokenizerului prin executarea următoarei comenzi:
-
-```py
-tokenizer.push_to_hub("code-search-net-tokenizer")
-```
-
-Acest lucru va crea un nou repositoriu în namespacel tău cu numele `code-search-net-tokenizer`, care va conține fișierul tokenizerului. După aceea, puteți încărca tokenizerul de oriunde cu metoda `from_pretrained()`:
-
-```py
-# Înlocuiți "huggingface-course" mai jos cu namespaceul tău pentru a utiliza propriul tokenizer
-tokenizer = AutoTokenizer.from_pretrained("huggingface-course/code-search-net-tokenizer")
-```
-
-Acum sunteți gata să antrenați un model de limbaj de la zero și să îl ajustați pentru sarcina voastră! Vom face acest lucru în [Capitolul 7](/course/chapter7), dar mai întâi, în continuarea acestui capitol, vom arunca o privire mai atentă asupra tokenizerilor rapizi și vom explora în detaliu ce se întâmplă atunci când apelați metoda `train_new_from_iterator()`.
\ No newline at end of file
diff --git a/chapters/ro/chapter 6/3.mdx b/chapters/ro/chapter 6/3.mdx
deleted file mode 100644
index 54fa7863f..000000000
--- a/chapters/ro/chapter 6/3.mdx	
+++ /dev/null
@@ -1,473 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Tokenizeri rapizi' puteri speciale[[fast-tokenizers-special-powers]]
-
-{#if fw === 'pt'}
-
-<CourseFloatingBanner chapter={6}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter6/section3_pt.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter6/section3_pt.ipynb"},
-]} />
-
-{:else}
-
-<CourseFloatingBanner chapter={6}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter6/section3_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter6/section3_tf.ipynb"},
-]} />
-
-{/if}
-
-În această secțiune, vom analiza mai atent capacitățile tokenizerilor din 🤗 Transformers. Până acum, i-am folosit doar pentru tokenizarea inputurilor sau decodificarea ID-urilor înapoi în text, dar tokenizerii - în special cei susținuți de biblioteca 🤗 Tokenizers - pot face mult mai multe. Pentru a ilustra aceste funcții suplimentare, vom explora modul de reproducere a rezultatelor pipeline-urilor `token-classification` (pe care le-am numit `ner`) și `question-answering` pe care le-am întâlnit pentru prima dată în [Capitolul 1](/course/chapter1).
-
-<Youtube id="g8quOxoqhHQ"/>
-
-În discuția următoare, vom face adesea distincția între tokenizatori "lenți" și "rapizi". Tokenizerii lenți sunt cei scriși în Python în interiorul bibliotecii 🤗 Transformers, în timp ce versiunile rapide sunt cele furnizate de 🤗 Tokenizers, care sunt scrise în Rust. Dacă vă amintiți de tabelul din [Capitolul 5](/course/chapter5/3) care a raportat cât timp a durat un tokenizer rapid și unul lent pentru a tokeniza datasetul Drug Review, ar trebui să aveți o idee despre de ce îi numim lenți și rapizi:
-
-|               | Fast tokenizer | Slow tokenizer
-:--------------:|:--------------:|:-------------:
-`batched=True`  | 10,8s          | 4min41s
-`batched=False` | 59,2s          | 5min3s
-
-<Tip warning={true}>
-
-⚠️ Atunci când tokenizați o singură propoziție, nu veți vedea întotdeauna o diferență de viteză între versiunea lentă și rapidă ale aceluiași tokenizer. De fapt, versiunea rapidă poate fi chiar mai lentă! Abia atunci când tokenizați multe texte în paralel, în același timp, veți putea observa clar diferența.
-
-</Tip>
-
-## Batch encoding[[batch-encoding]]
-
-<Youtube id="3umI3tm27Vw"/>
-
-Rezultatul unui tokenizer nu este un simplu dicționar Python; ceea ce obținem este de fapt un obiect special `BatchEncoding`. Este o subclasă a unui dicționar (de aceea am putut indexa acel rezultat fără nici o problemă mai devreme), dar cu metode suplimentare care sunt utilizate în principal de către tokenizerii rapizi.
-
-Pe lângă capacitățile lor de paralelizare, funcționalitatea principală a tokenizerilor rapizi este aceea că aceștia țin întotdeauna evidența intervalului original de texte din care provin tokenii finali - o funcționalitate pe care o numim *offset mapping*. Acest lucru deblochează funcții precum mappingul fiecărui cuvânt la tokens pe care îi generează sau mappingul fiecărui caracter al textului original la tokenul în care se află și invers.
-
-Acum hai să aruncăm o privire la un exemplu:
-
-```py
-from transformers import AutoTokenizer
-
-tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
-example = "My name is Sylvain and I work at Hugging Face in Brooklyn."
-encoding = tokenizer(example)
-print(type(encoding))
-```
-
-Așa cum s-a menționat anterior, în outputul tokenizerului obținem un obiect `BatchEncoding`:
-
-```python out
-<class 'transformers.tokenization_utils_base.BatchEncoding'>
-```
-
-Deoarece clasa `AutoTokenizer` selectează un tokenizer rapid în mod implicit, putem utiliza metodele suplimentare pe care acest obiect `BatchEncoding` le oferă. Avem două metode de verificare dacă tokenizerul nostru este unul lent sau rapid. Putem verifica fie atributul `is_fast` al tokenizer-ului:
-
-```python
-tokenizer.is_fast
-```
-
-```python out
-True
-```
-
-sau același atribut al `encoding`:
-
-```python
-encoding.is_fast
-```
-
-```python out
-True
-```
-
-Hai să vedem ce ne permite un tokenizer rapid să facem. În primul rând, putem accesa tokenul fără a fi nevoie să facem convert ID-urile înapoi în tokens:
-
-```py
-encoding.tokens()
-```
-
-```python out
-['[CLS]', 'My', 'name', 'is', 'S', '##yl', '##va', '##in', 'and', 'I', 'work', 'at', 'Hu', '##gging', 'Face', 'in',
- 'Brooklyn', '.', '[SEP]']
-```
-
-În acest caz tokenul la indexul 5 este `##yl`, ceea ce este o parte a cuvântului "Sylvain" în propoziția originală. În același timp putem folosi metoda `word_ids()` pentru a obține indexul cuvântului din care provine fiecare token:
-
-```py
-encoding.word_ids()
-```
-
-```python out
-[None, 0, 1, 2, 3, 3, 3, 3, 4, 5, 6, 7, 8, 8, 9, 10, 11, 12, None]
-
-Putem vedea că tokenizerul are tokeni speciali `[CLS]` și `[SEP]` care sunt mapped la `None`, iar apoi fiecare token este mapped la cuvântul din care provine. Acest lucru este deosebit de util pentru a determina dacă un token este la începutul unui cuvânt sau dacă două tokenuri sunt în același cuvânt. Ne-am putea baza pe prefixul `##` pentru aceasta, dar funcționează doar pentru tokenizeri de tip BERT; această metodă funcționează pentru orice tip de tokenizator, atâta timp cât este unul rapid. În capitolul următor, vom vedea cum putem utiliza această capabilitate pentru a aplica labeluri pe care le avem pentru fiecare cuvânt în mod corespunzător tokenurilor în sarcini precum named entity recognition (NER) și part-of-speech (POS). De asemenea, îl putem utiliza pentru a face mask tuturor tokenurilor care provin din același cuvânt în masked language modeling(o tehnică numită _whole word masking_).
-
-<Tip>
-
-Noțiunea de ceea ce este un cuvânt este complicată. De exemplu, "I'll" (o prescurtare a "I will") contează ca unul sau două cuvinte? Acest lucru depinde de tokenizer și de operațiunea de pre-tokenizare pe care o aplică. Unii tokenizeri se divid doar pe spații, așa că vor considera acest lucru ca un singur cuvânt. Alții folosesc punctuația pe lângă spații, deci vor considera două cuvinte.
-
-✏️ **Încercați!** Creați un tokenizer din checkpointurile `bert-base-cased` și `roberta-base` și tokenizați "81s" cu ele. Ce observați? Care sunt ID-urile cuvintelor?
-
-</Tip>
-
-În mod similar, există o metodă `sentence_ids()` pe care o putem utiliza pentru a face map unui token la propoziția din care provine (deși, în acest caz, `token_type_ids` returnate de tokenizer ne pot oferi aceeași informație).
-
-În cele din urmă, putem face map oricărui cuvânt sau token la caracterele din textul original și invers, prin intermediul metodelor `word_to_chars()` sau `token_to_chars()` și `char_to_word()` sau `char_to_token()`. De exemplu, metoda `word_ids()` ne-a spus că `##yl` face parte din cuvântul cu indicele 3, dar ce cuvânt este în propoziție? Putem afla astfel:
-
-```py
-start, end = encoding.word_to_chars(3)
-example[start:end]
-```
-
-```python out
-Sylvain
-```
-
-Așa cum am menționat anterior, toate acestea sunt posibile datorită faptului că tokenizerul rapid ține evidența spanului de text de la care provine fiecare token într-o listă de *offseturi*. Pentru a ilustra modul în care se utilizează acestea, în continuare vă vom arăta cum să replicați rezultatele pipelineului `token-classification` manual.
-
-<Tip>
-
-✏️ **Încercați!** Creați propriul exemplu de text și încercați să înțelegeți care tokenuri sunt asociate cu ID-ul cuvântului și, de asemenea, cum să extrageți spanurile pentru singur cuvânt. Pentru puncte bonus, încercați să utilizați două propoziții ca inputuri și să vedeți dacă ID-urile propozițiilor au sens pentru voi.
-
-</Tip>
-
-## În interiorul pipelineului `token-classification`[[inside-the-token-classification-pipeline]]
-
-În [Capitolul 1](/course/chapter1) am avut primul nostru contact aplicând NER - unde sarcina constă în identificarea părților textului care corespund entităților precum persoane, locații sau organizații - cu funcția `pipeline()` din 🤗 Transformers. Apoi, în [Capitolul 2](/course/chapter2), am văzut cum un pipeline grupează cele trei etape necesare pentru a obține predicțiile de la un text "raw": tokenizare, trecerea inputurilor prin model și post-procesare. Primele două etape din pipelineul `token-classification` sunt la fel ca în orice alt pipeline, dar post-procesarea este puțin mai complexă - hai să vedem cum!
-
-{#if fw === 'pt'}
-
-<Youtube id="0E7ltQB7fM8"/>
-
-{:else}
-
-<Youtube id="PrX4CjrVnNc"/>
-
-{/if}
-
-### Obținerea rezultatelor de bază cu pipelineul[[getting-the-base-results-with-the-pipeline]]
-
-În primul rând, trebuie să luăm un token classification pipeline pentru a obține câteva rezultate ca să le putem compara manual. Modelul utilizat în mod implicit este [`dbmdz/bert-large-cased-finetuned-conll03-english`](https://huggingface.co/dbmdz/bert-large-cased-finetuned-conll03-english); acesta aplică NER pe propoziții:
-
-```py
-from transformers import pipeline
-
-token_classifier = pipeline("token-classification")
-token_classifier("My name is Sylvain and I work at Hugging Face in Brooklyn.")
-```
-
-```python out
-[{'entity': 'I-PER', 'score': 0.9993828, 'index': 4, 'word': 'S', 'start': 11, 'end': 12},
- {'entity': 'I-PER', 'score': 0.99815476, 'index': 5, 'word': '##yl', 'start': 12, 'end': 14},
- {'entity': 'I-PER', 'score': 0.99590725, 'index': 6, 'word': '##va', 'start': 14, 'end': 16},
- {'entity': 'I-PER', 'score': 0.9992327, 'index': 7, 'word': '##in', 'start': 16, 'end': 18},
- {'entity': 'I-ORG', 'score': 0.97389334, 'index': 12, 'word': 'Hu', 'start': 33, 'end': 35},
- {'entity': 'I-ORG', 'score': 0.976115, 'index': 13, 'word': '##gging', 'start': 35, 'end': 40},
- {'entity': 'I-ORG', 'score': 0.98879766, 'index': 14, 'word': 'Face', 'start': 41, 'end': 45},
- {'entity': 'I-LOC', 'score': 0.99321055, 'index': 16, 'word': 'Brooklyn', 'start': 49, 'end': 57}]
-```
-
-Modelul a identificat fiecare token generdat de "Sylvain" ca o persoană, fiecare token generat de "Hugging Face" ca o organizație, și fiecare token "Brooklin" ca o locație". În același timp putem întreba pipelineul să grupeze împreună tokenurile care corespund cu aceeași entitate.
-
-```py
-from transformers import pipeline
-
-token_classifier = pipeline("token-classification", aggregation_strategy="simple")
-token_classifier("My name is Sylvain and I work at Hugging Face in Brooklyn.")
-```
-
-```python out
-[{'entity_group': 'PER', 'score': 0.9981694, 'word': 'Sylvain', 'start': 11, 'end': 18},
- {'entity_group': 'ORG', 'score': 0.97960204, 'word': 'Hugging Face', 'start': 33, 'end': 45},
- {'entity_group': 'LOC', 'score': 0.99321055, 'word': 'Brooklyn', 'start': 49, 'end': 57}]
-```
-
-`Aggregation_strategy` aleasă va modifica scorurile calculate pentru fiecare entitate grupată. Cu `"simple"`, scorul este doar media scorurilor pentru fiecare token din entitatea dată: de exemplu, scorul pentru "Sylvain" este media scorurilor pe care le-am văzut în exemplele anterioare pentru token-urile `S`, `##yl`, `##va` și `##in`. Alte strategii disponibile sunt:
-
-- `"first"`, unde scorul fiecărei entități este scorul primului token al acelei entități (astfel, pentru "Sylvain" ar fi 0.993828, scorul token-ului `S`)
-- `"max"`, unde scorul fiecărei entități este scorul maxim al tokenilor din acea entitate (astfel, pentru "Hugging Face" ar fi 0.98879766, scorul "Face")
-- `"average"`, unde scorul fiecărei entități este media scorurilor cuvintelor care compun acea entitate (astfel, pentru "Sylvain" nu ar exista nicio diferență față de strategia `"simple"`, dar "Hugging Face" ar avea un scor de 0.9819, media scorurilor pentru "Hugging", 0.975 și "Face", 0.98879)
-
-Acum să vedem cum putem obține aceste rezultate fără a folosi funcția `pipeline()`!
-
-### De la inputuri la predicții[[from-inputs-to-predictions]]
-
-{#if fw === 'pt'}
-
-În primul rând trebuie să tokenizăm inputurile și sp le trecem prin model. Acest lucru este făcut excat ca în [Capitolul 2](/course/chapter2); noi am inițializat tokenizerul și modelul folosind clasa `AutoXxx` și apoi am folosit-o pe exemplul nostru:
-
-```py
-from transformers import AutoTokenizer, AutoModelForTokenClassification
-
-model_checkpoint = "dbmdz/bert-large-cased-finetuned-conll03-english"
-tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
-model = AutoModelForTokenClassification.from_pretrained(model_checkpoint)
-
-example = "My name is Sylvain and I work at Hugging Face in Brooklyn."
-inputs = tokenizer(example, return_tensors="pt")
-outputs = model(**inputs)
-```
-
-Deoarece aici folosim `AutoModelForTokenClassification` , noi primim un set de logits pentru fiecare token în input sequence:
-
-```py
-print(inputs["input_ids"].shape)
-print(outputs.logits.shape)
-```
-
-```python out
-torch.Size([1, 19])
-torch.Size([1, 19, 9])
-```
-
-{:else}
-
-În primul rând trebuie să tokenizăm inputurile și să le trecem prin model. Acest lucru este făcut excat ca în [Capitolul 2](/course/chapter2); noi am inițializat tokenizerul și modelul folosind clasa `TFAutoXxx` și apoi am folosit-o pe exemplul nostru:
-
-```py
-from transformers import AutoTokenizer, TFAutoModelForTokenClassification
-
-model_checkpoint = "dbmdz/bert-large-cased-finetuned-conll03-english"
-tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
-model = TFAutoModelForTokenClassification.from_pretrained(model_checkpoint)
-
-example = "My name is Sylvain and I work at Hugging Face in Brooklyn."
-inputs = tokenizer(example, return_tensors="tf")
-outputs = model(**inputs)
-```
-
-Deoarece aici folosim `TFAutoModelForTokenClassification`, noi primim un set de logits pentru fiecare token în input sequence:
-
-```py
-print(inputs["input_ids"].shape)
-print(outputs.logits.shape)
-```
-
-```python out
-(1, 19)
-(1, 19, 9)
-```
-
-{/if}
-
-Noi avem un batch cu 1 secvență din 19 tokenuri și modelul are 9 labeluri diferite, deci outputul modelului are un shape de 1 x 19 x 9. Ca și pentru text classification pipeline, noi folosim o funcție softmax pentru a face convert logiturilor în probabilități și luăm argmax pentru a obține predicții(atrage atenția asupra fatpului că putem lua argmax pe logituri deoarece softmax nu schimbă ordinea):
-
-{#if fw === 'pt'}
-
-```py
-import torch
-
-probabilities = torch.nn.functional.softmax(outputs.logits, dim=-1)[0].tolist()
-predictions = outputs.logits.argmax(dim=-1)[0].tolist()
-print(predictions)
-```
-
-{:else}
-
-```py
-import tensorflow as tf
-
-probabilities = tf.math.softmax(outputs.logits, axis=-1)[0]
-probabilities = probabilities.numpy().tolist()
-predictions = tf.math.argmax(outputs.logits, axis=-1)[0]
-predictions = predictions.numpy().tolist()
-print(predictions)
-```
-
-{/if}
-
-```python out
-[0, 0, 0, 0, 4, 4, 4, 4, 0, 0, 0, 0, 6, 6, 6, 0, 8, 0, 0]
-```
-
-Atributul `model.config.id2label` con;ine mappingul indexilor la labeluri pe care le putem folosi pentru a înțelege predicțiile:
-
-```py
-model.config.id2label
-```
-
-```python out
-{0: 'O',
- 1: 'B-MISC',
- 2: 'I-MISC',
- 3: 'B-PER',
- 4: 'I-PER',
- 5: 'B-ORG',
- 6: 'I-ORG',
- 7: 'B-LOC',
- 8: 'I-LOC'}
-```
-
-Cum am văzut mai devreme, există 9 labeluri: `O` este labelul pentru tokenurile care nu se află în nicio entitate numită(aceasta reprezintă "exteriorul"), și avem apoi două labeluri pentru fiecare tip de entitate (divers, persoană, organizație și locație). Eticheta `B-XXX` indică faptul că tokenul se află la începutul entității `XXX` și eticheta `I-XXX` indică faptul că tokenul se află în interiorul entității `XXX`. De exemplu, în exemplul curent ne-am aștepta ca modelul nostru să clasifice tokenul `S` ca `B-PER` (începutul unei entități de-tip persoană) și tokenurile `##yl`, `##va` și `##in` ca `I-PER` (în interiorul unei entități de tip persoană).
-
-S-ar putea să credeți că modelul a greșit în acest caz, deoarece a atribuit eticheta `I-PER` tuturor acestor patru tokeni, dar acesta nu este în întregime adevărat. Există, de fapt, două formate pentru labelurile `B-` și `I-`: *IOB1* și *IOB2*. Formatul IOB2 (în roz mai jos), este cel pe care l-am introdus, în timp ce formatul IOB1 (în albastru), utilizează labelurile care încep cu `B-` doar pentru a separa două entități adiacente de același tip. Modelul pe care îl utilizăm a fost fine-tuned pe un dataset care utilizează acel format, ceea ce explică de ce atribuie labelul `I-PER` tokenului `S`.
-
-<div class="flex justify-center">
-<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter6/IOB_versions.svg" alt="IOB1 vs IOB2 format"/>
-<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter6/IOB_versions-dark.svg" alt="IOB1 vs IOB2 format"/>
-</div>
-
-Cu maparea aceasta, suntem gat a să reproducem(aproape în total) rezultat primului pipeline -- noi putem lua scorul și labelul fiecărui token care nu a fost clasificat ca `O`:
-
-```py
-results = []
-tokens = inputs.tokens()
-
-for idx, pred in enumerate(predictions):
-    label = model.config.id2label[pred]
-    if label != "O":
-        results.append(
-            {"entity": label, "score": probabilities[idx][pred], "word": tokens[idx]}
-        )
-
-print(results)
-```
-
-```python out
-[{'entity': 'I-PER', 'score': 0.9993828, 'index': 4, 'word': 'S'},
- {'entity': 'I-PER', 'score': 0.99815476, 'index': 5, 'word': '##yl'},
- {'entity': 'I-PER', 'score': 0.99590725, 'index': 6, 'word': '##va'},
- {'entity': 'I-PER', 'score': 0.9992327, 'index': 7, 'word': '##in'},
- {'entity': 'I-ORG', 'score': 0.97389334, 'index': 12, 'word': 'Hu'},
- {'entity': 'I-ORG', 'score': 0.976115, 'index': 13, 'word': '##gging'},
- {'entity': 'I-ORG', 'score': 0.98879766, 'index': 14, 'word': 'Face'},
- {'entity': 'I-LOC', 'score': 0.99321055, 'index': 16, 'word': 'Brooklyn'}]
-```
-
-Acest lucru este foarte similar cu ce am avut mai devreme, cu o excepție: pipelineul de asemenea ne-a oferit informație despre `start` și `end` al fiecărei entități în propoziția originală. Acum e momentul când offset mappingul nostru ne va ajuta. Pentru a obține offseturile, noi trebuie să setăm `return_offsets_mapping=True` când aplicăm tokenizerul pe inputurile noastre:
-
-```py
-inputs_with_offsets = tokenizer(example, return_offsets_mapping=True)
-inputs_with_offsets["offset_mapping"]
-```
-
-```python out
-[(0, 0), (0, 2), (3, 7), (8, 10), (11, 12), (12, 14), (14, 16), (16, 18), (19, 22), (23, 24), (25, 29), (30, 32),
- (33, 35), (35, 40), (41, 45), (46, 48), (49, 57), (57, 58), (0, 0)]
-```
-
-Fiecare tuple este spanul de text care corespunde fiecărui token, unde `(0, 0)` este rezervat pentru tokenii speciali. Noi am văzut înainte că tokenul la indexul 5 este `##yl`, care are aici `(12, 14)` ca offsets. Dacă luăm sliceul corespunzător în exemplul nostru:
-
-```py
-example[12:14]
-```
-
-noi obținem spanul propriu de text fără `##`:
-
-```python out
-yl
-```
-
-Folosind aceasta, putem acum completa rezultatele anterioare:
-
-
-```py
-results = []
-inputs_with_offsets = tokenizer(example, return_offsets_mapping=True)
-tokens = inputs_with_offsets.tokens()
-offsets = inputs_with_offsets["offset_mapping"]
-
-for idx, pred in enumerate(predictions):
-    label = model.config.id2label[pred]
-    if label != "O":
-        start, end = offsets[idx]
-        results.append(
-            {
-                "entity": label,
-                "score": probabilities[idx][pred],
-                "word": tokens[idx],
-                "start": start,
-                "end": end,
-            }
-        )
-
-print(results)
-```
-
-```python out
-[{'entity': 'I-PER', 'score': 0.9993828, 'index': 4, 'word': 'S', 'start': 11, 'end': 12},
- {'entity': 'I-PER', 'score': 0.99815476, 'index': 5, 'word': '##yl', 'start': 12, 'end': 14},
- {'entity': 'I-PER', 'score': 0.99590725, 'index': 6, 'word': '##va', 'start': 14, 'end': 16},
- {'entity': 'I-PER', 'score': 0.9992327, 'index': 7, 'word': '##in', 'start': 16, 'end': 18},
- {'entity': 'I-ORG', 'score': 0.97389334, 'index': 12, 'word': 'Hu', 'start': 33, 'end': 35},
- {'entity': 'I-ORG', 'score': 0.976115, 'index': 13, 'word': '##gging', 'start': 35, 'end': 40},
- {'entity': 'I-ORG', 'score': 0.98879766, 'index': 14, 'word': 'Face', 'start': 41, 'end': 45},
- {'entity': 'I-LOC', 'score': 0.99321055, 'index': 16, 'word': 'Brooklyn', 'start': 49, 'end': 57}]
-```
-
-Acest răspuns e același răspuns pe care l-am primit de la primul pipeline:
-
-### Gruparea entităților[[grouping-entities]]
-
-Utilizarea offseturilor pentru a determina cheile de start și de sfârșit pentru fiecare entitate este util, dar această informație nu este strict necesară. Când dorim să grupăm entitățile împreună, totuși, offseturile ne vor salva o mulțime de messy code. De exemplu, dacă am dori să grupăm împreună tokenii `Hu`, `##gging` și `Face`, am putea crea reguli speciale care să spună că primele două ar trebui să fie atașate și să înlăturăm `##`, iar `Face` ar trebui adăugat cu un spațiu, deoarece nu începe cu `##` -- dar acest lucru ar funcționa doar pentru acest tip particular de tokenizer. Ar trebui să scriem un alt set de reguli pentru un tokenizer SentencePiece sau unul Byte-Pair-Encoding (discutat mai târziu în acest capitol).
-
-Cu offseturile, tot acel cod custom dispare: pur și simplu putem lua spanul din textul original care începe cu primul token și se termină cu ultimul token. Deci, în cazul tokenurilor `Hu`, `##gging` și `Face`, ar trebui să începem la caracterul 33 (începutul lui `Hu`) și să ne oprim înainte de caracterul 45 (sfârșitul lui `Face`):
-
-```py
-example[33:45]
-```
-
-```python out
-Hugging Face
-```
-
-Pentru a scrie codul care post-procesează predicțiile în timp ce grupăm entitățile, vom grupa entitățile care sunt consecutive și labeled cu `I-XXX`, cu excepția primeia, care poate fi labeled ca `B-XXX` sau `I-XXX` (decidem să oprim gruparea unei entități atunci când întâlnim un `O`, un nou tip de entitate, sau un `B-XXX` care ne spune că o entitate de același tip începe):
-
-```py
-import numpy as np
-
-results = []
-inputs_with_offsets = tokenizer(example, return_offsets_mapping=True)
-tokens = inputs_with_offsets.tokens()
-offsets = inputs_with_offsets["offset_mapping"]
-
-idx = 0
-while idx < len(predictions):
-    pred = predictions[idx]
-    label = model.config.id2label[pred]
-    if label != "O":
-        # Remove the B- or I-
-        label = label[2:]
-        start, _ = offsets[idx]
-
-        # Grab all the tokens labeled with I-label
-        all_scores = []
-        while (
-            idx < len(predictions)
-            and model.config.id2label[predictions[idx]] == f"I-{label}"
-        ):
-            all_scores.append(probabilities[idx][pred])
-            _, end = offsets[idx]
-            idx += 1
-
-        # The score is the mean of all the scores of the tokens in that grouped entity
-        score = np.mean(all_scores).item()
-        word = example[start:end]
-        results.append(
-            {
-                "entity_group": label,
-                "score": score,
-                "word": word,
-                "start": start,
-                "end": end,
-            }
-        )
-    idx += 1
-
-print(results)
-```
-
-Și obținem aceleași răspuns ca de la pipelineul secundar!
-
-```python out
-[{'entity_group': 'PER', 'score': 0.9981694, 'word': 'Sylvain', 'start': 11, 'end': 18},
- {'entity_group': 'ORG', 'score': 0.97960204, 'word': 'Hugging Face', 'start': 33, 'end': 45},
- {'entity_group': 'LOC', 'score': 0.99321055, 'word': 'Brooklyn', 'start': 49, 'end': 57}]
-```
-
-Alt exemplu de sarcină unde offseturile sunt extrem de useful pentru răspunderea la întrebări. Scufundându-ne în pipelineuri, un lucru pe care îl vom face în următoarea secțiune, ne vom premite să ne uităm peste o caracteristică a tokenizerului în librăria 🤗 Transformers: vom avea de-a face cu overflowing tokens când truncăm un input de o anumită lungime.
-
diff --git a/chapters/ro/chapter 6/3b.mdx b/chapters/ro/chapter 6/3b.mdx
deleted file mode 100644
index 08acea387..000000000
--- a/chapters/ro/chapter 6/3b.mdx	
+++ /dev/null
@@ -1,643 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Tokenizeri rapizi în pipelineul QA[[fast-tokenizers-in-the-qa-pipeline]]
-
-{#if fw === 'pt'}
-
-<CourseFloatingBanner chapter={6}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter6/section3b_pt.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter6/section3b_pt.ipynb"},
-]} />
-
-{:else}
-
-<CourseFloatingBanner chapter={6}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter6/section3b_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter6/section3b_tf.ipynb"},
-]} />
-
-{/if}
-
-Acum ne vom aprofunda în pipelineul `question-answering` și să vedem cum putem valorifica offesturile pentru a primi răspunzuri la întrebări la îndemână din context, asemănător cum am făcut cu entitățile grupate în secțiunea precedentă. Pe urmă vom vedea cum vom face față contextelor foarte lungi care ajung truncate. Puteți trece peste această secțiune dacă nu sunteți interesat în întrebarea care răspunde la sarcina aceasta.
-
-{#if fw === 'pt'}
-
-<Youtube id="_wxyB3j3mk4"/>
-
-{:else}
-
-<Youtube id="b3u8RzBCX9Y"/>
-
-{/if}
-
-## Folosind `question-answering` pipeline[[using-the-question-answering-pipeline]]
-
-Cum am văzut în [Capitolul 1](/course/chapter1), noi putem folosi pipelineul `question-answering` ca acesta pentru a răspunde la o întrebare:
-
-```py
-from transformers import pipeline
-
-question_answerer = pipeline("question-answering")
-context = """
-🤗 Transformers is backed by the three most popular deep learning libraries — Jax, PyTorch, and TensorFlow — with a seamless integration
-between them. It's straightforward to train your models with one before loading them for inference with the other.
-"""
-question = "Which deep learning libraries back 🤗 Transformers?"
-question_answerer(question=question, context=context)
-```
-
-```python out
-{'score': 0.97773,
- 'start': 78,
- 'end': 105,
- 'answer': 'Jax, PyTorch and TensorFlow'}
-```
-
-Spre deosebire de alte pipelineuri, care nu put trunca și face split la text care este mai lung decât lungimea maxim acceptată de model(și, prin urmare, pot pierde informații la sfârșitul unui document), accest pipeline poate face față contextelor foarte lungi și va returna răspunsul la întrebare chiar dacă aceasta se află la sfârșit:
-
-```py
-long_context = """
-🤗 Transformers: State of the Art NLP
-
-🤗 Transformers provides thousands of pretrained models to perform tasks on texts such as classification, information extraction,
-question answering, summarization, translation, text generation and more in over 100 languages.
-Its aim is to make cutting-edge NLP easier to use for everyone.
-
-🤗 Transformers provides APIs to quickly download and use those pretrained models on a given text, fine-tune them on your own datasets and
-then share them with the community on our model hub. At the same time, each python module defining an architecture is fully standalone and
-can be modified to enable quick research experiments.
-
-Why should I use transformers?
-
-1. Easy-to-use state-of-the-art models:
-  - High performance on NLU and NLG tasks.
-  - Low barrier to entry for educators and practitioners.
-  - Few user-facing abstractions with just three classes to learn.
-  - A unified API for using all our pretrained models.
-  - Lower compute costs, smaller carbon footprint:
-
-2. Researchers can share trained models instead of always retraining.
-  - Practitioners can reduce compute time and production costs.
-  - Dozens of architectures with over 10,000 pretrained models, some in more than 100 languages.
-
-3. Choose the right framework for every part of a model's lifetime:
-  - Train state-of-the-art models in 3 lines of code.
-  - Move a single model between TF2.0/PyTorch frameworks at will.
-  - Seamlessly pick the right framework for training, evaluation and production.
-
-4. Easily customize a model or an example to your needs:
-  - We provide examples for each architecture to reproduce the results published by its original authors.
-  - Model internals are exposed as consistently as possible.
-  - Model files can be used independently of the library for quick experiments.
-
-🤗 Transformers is backed by the three most popular deep learning libraries — Jax, PyTorch and TensorFlow — with a seamless integration
-between them. It's straightforward to train your models with one before loading them for inference with the other.
-"""
-question_answerer(question=question, context=long_context)
-```
-
-```python out
-{'score': 0.97149,
- 'start': 1892,
- 'end': 1919,
- 'answer': 'Jax, PyTorch and TensorFlow'}
-```
-
-Hai să vedem cum el face toate astea!
-
-## Folosind un model pentru răspunderea la întrebări[[using-a-model-for-question-answering]]
-
-Ca în cazul oricărui altui pipeline, începem prin tokenizarea datelor de intrare și apoi le trimitem prin model. Checkpointul utilizat în mod implicit pentru pipelineul `question-answering` este [`distilbert-base-cased-distilled-squad`](https://huggingface.co/distilbert-base-cased-distilled-squad) ("squad" din nume provine de la datasetul pe care modelul a fost ajustat; vom vorbi mai multe despre datasetul SQuAD în [Capitolul 7](/course/chapter7/7)):
-
-{#if fw === 'pt'}
-
-```py
-from transformers import AutoTokenizer, AutoModelForQuestionAnswering
-
-model_checkpoint = "distilbert-base-cased-distilled-squad"
-tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
-model = AutoModelForQuestionAnswering.from_pretrained(model_checkpoint)
-
-inputs = tokenizer(question, context, return_tensors="pt")
-outputs = model(**inputs)
-```
-
-{:else}
-
-```py
-from transformers import AutoTokenizer, TFAutoModelForQuestionAnswering
-
-model_checkpoint = "distilbert-base-cased-distilled-squad"
-tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
-model = TFAutoModelForQuestionAnswering.from_pretrained(model_checkpoint)
-
-inputs = tokenizer(question, context, return_tensors="tf")
-outputs = model(**inputs)
-```
-
-{/if}
-
-Observați că noi tokenizăm întrebrea și contextul ca o perecehe, cu întrebarea prima.
-
-
-<div class="flex justify-center">
-<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter6/question_tokens.svg" alt="An example of tokenization of question and context"/>
-<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter6/question_tokens-dark.svg" alt="An example of tokenization of question and context"/>
-</div>
-
-Modelele create pentru răspunderea la întrebări funcționează puțin diferit de modelele pe care le-am văzut până acum. Folosind imaginea de mai sus ca exemplu, modelul a fost antrenat pentru a prezice indicele tokenului cu care începe răspunsului (aici 21) și indicele simbolului la care se termină răspunsul (aici 24). Acesta este motivul pentru care modelele respective nu returnează un singur tensor de logits, ci două: unul pentru logits-ul corespunzători tokenului cu care începe răspunsului și unul pentru logits-ul corespunzător tokenului de sfârșit al răspunsului. Deoarece în acest caz avem un singur input care conține 66 de token-uri, obținem:
-
-```py
-start_logits = outputs.start_logits
-end_logits = outputs.end_logits
-print(start_logits.shape, end_logits.shape)
-```
-
-{#if fw === 'pt'}
-
-```python out
-torch.Size([1, 66]) torch.Size([1, 66])
-```
-
-{:else}
-
-```python out
-(1, 66) (1, 66)
-```
-
-{/if}
-
-Pentru a converti acești logits în probabilități, vom aplica o funcție softmax - dar înainte de aceasta, trebuie să ne asigurăm că mascăm indicii care nu fac parte din context. Inputul nostru este `[CLS] întrebare [SEP] context [SEP]`, deci trebuie să mascăm token-urile întrebării, precum și tokenul `[SEP]`. Cu toate acestea, vom păstra simbolul `[CLS]`, deoarece unele modele îl folosesc pentru a indica faptul că răspunsul nu se află în context.
-
-Deoarece vom aplica ulterior un softmax, trebuie doar să înlocuim logiturile pe care dorim să le mascăm cu un număr negativ mare. Aici, folosim `-10000`:
-
-{#if fw === 'pt'}
-
-```py
-import torch
-
-sequence_ids = inputs.sequence_ids()
-# Mask everything apart from the tokens of the context
-mask = [i != 1 for i in sequence_ids]
-# Unmask the [CLS] token
-mask[0] = False
-mask = torch.tensor(mask)[None]
-
-start_logits[mask] = -10000
-end_logits[mask] = -10000
-```
-
-{:else}
-
-```py
-import tensorflow as tf
-
-sequence_ids = inputs.sequence_ids()
-# Mask everything apart from the tokens of the context
-mask = [i != 1 for i in sequence_ids]
-# Unmask the [CLS] token
-mask[0] = False
-mask = tf.constant(mask)[None]
-
-start_logits = tf.where(mask, -10000, start_logits)
-end_logits = tf.where(mask, -10000, end_logits)
-```
-
-{/if}
-
-Acum că am mascat în mod corespunzător logiturile corespunzătoare pozițiilor pe care nu dorim să le prezicem, putem aplica softmax:
-
-{#if fw === 'pt'}
-
-```py
-start_probabilities = torch.nn.functional.softmax(start_logits, dim=-1)[0]
-end_probabilities = torch.nn.functional.softmax(end_logits, dim=-1)[0]
-```
-
-{:else}
-
-```py
-start_probabilities = tf.math.softmax(start_logits, axis=-1)[0].numpy()
-end_probabilities = tf.math.softmax(end_logits, axis=-1)[0].numpy()
-```
-
-{/if}
-
-La acest stadiu, am putea lua argmax al probabilităților de început și de sfârșit - dar am putea ajunge la un indice de început care este mai mare decât indicele de sfârșit, deci trebuie să luăm câteva precauții suplimentare. Vom calcula probabilitățile fiecărui  `start_index` și `end_index` posibil în cazul în care `start_index <= end_index`, apoi vom lua un tuple `(start_index, end_index)` cu cea mai mare probabilitate.
-
-Presupunând că evenimentele "The answer starts at `start_index`" și "The answer ends at `end_index`" sunt independente, probabilitatea ca răspunsul să înceapă la `start_index` și să se termine la `end_index` este:
-
-$$\mathrm{start\_probabilities}[\mathrm{start\_index}] \times \mathrm{end\_probabilities}[\mathrm{end\_index}]$$ 
-
-Deci, pentru a calcula toate scorurile, trebuie doar să calculăm toate produsele \\(\mathrm{start\_probabilities}[\mathrm{start\_index}] \times \mathrm{end\_probabilities}[\mathrm{end\_index}]\\) unde `start_index <= end_index`.
-
-Mai întâi hai să calculăm toate produsele posibile:
-
-```py
-scores = start_probabilities[:, None] * end_probabilities[None, :]
-```
-
-{#if fw === 'pt'}
-
-Apoi vom masca valorile în care `start_index > end_index` prin stabilirea lor la `0` (celelalte probabilități sunt toate numere pozitive). Funcția `torch.triu()` returnează partea triunghiulară superioară a tensorului 2D trecut ca argument, deci va face această mascare pentru noi:
-
-```py
-scores = torch.triu(score)
-```
-
-{:else}
-
-Apoi vom masca valorile în care `start_index > end_index` prin stabilirea lor la `0` (celelalte probabilități sunt toate numere pozitive). Funcția `np.triu()` returnează partea triunghiulară superioară a tensorului 2D trecut ca argument, deci va face această mascare pentru noi:
-
-```py
-import numpy as np
-
-scores = np.triu(scores)
-```
-
-{/if}
-
-Acum trebuie doar să obținem indicele maximului. Deoarece PyTorch va returna indicele în tensorul aplatizat, trebuie să folosim operațiile floor division `//` și modulusul `%` pentru a obține `start_index` și `end_index`:
-
-```py
-max_index = scores.argmax().item()
-start_index = max_index // scores.shape[1]
-end_index = max_index % scores.shape[1]
-print(scores[start_index, end_index])
-```
-
-Nu am terminat încă, dar cel puțin avem deja scorul corect pentru răspuns (puteți verifica acest lucru comparându-l cu primul rezultat din secțiunea anterioară):
-
-```python out
-0.97773
-```
-
-<Tip>
-
-✏️ **Încercați!** Calculați indicii de început și de sfârșit pentru cele mai probabile cinci răspunsuri.
-
-</Tip>
-
-Avem `start_index` și `end_index` ale răspunsului în termeni de tokens, deci acum trebuie doar să convertim în character indices în context. Acesta este momentul în care offseturile vor fi foarte utile. Putem să le luăm și să le folosim așa cum am făcut în sarcina de clasificare a tokenurilor:
-
-```py
-inputs_with_offsets = tokenizer(question, context, return_offsets_mapping=True)
-offsets = inputs_with_offsets["offset_mapping"]
-
-start_char, _ = offsets[start_index]
-_, end_char = offsets[end_index]
-answer = context[start_char:end_char]
-```
-
-Acum trebuie doar să formatăm totul pentru a obține rezultatul nostru:
-
-```py
-result = {
-    "answer": answer,
-    "start": start_char,
-    "end": end_char,
-    "score": scores[start_index, end_index],
-}
-print(result)
-```
-
-```python out
-{'answer': 'Jax, PyTorch and TensorFlow',
- 'start': 78,
- 'end': 105,
- 'score': 0.97773}
-```
-
-Grozav! Este la fel ca în primul nostru exemplu!
-
-<Tip>
-
-✏️ **Încercați!** Utilizați cele mai bune scoruri pe care le-ați calculat anterior pentru a afișa cele mai probabile cinci răspunsuri. Pentru a vă verifica rezultatele, întoarceți-vă la primul pipeline și introduceți `top_k=5` atunci când îl apelați.
-
-</Tip>
-
-## Gestionarea contextelor lungi[[handling-long-contexts]]
-
-Dacă încercăm să tokenizăm întrebarea și contextul lung pe care le-am folosit ca un exemplu anterior, vom obține un număr de tokenuri mai mare decât lungimea maximă utilizată în pipelineul `question-answering` (care este 384):
-
-```py
-inputs = tokenizer(question, long_context)
-print(len(inputs["input_ids"]))
-```
-
-```python out
-461
-```
-
-Prin urmare, va trebui să trunchiem inputurile la lungimea maximă. Există mai multe modalități prin care putem face acest lucru, dar nu dorim să trunchiem întrebarea, ci doar contextul. Deoarece contextul este a doua propoziție, vom utiliza strategia de trunchiere `"only_second"`. Problema care apare atunci este că răspunsul la întrebare poate să nu fie în contextul trunchiat. Aici, de exemplu, am ales o întrebare la care răspunsul se află spre sfârșitul contextului, iar atunci când îl trunchiem, răspunsul nu este prezent:
-
-```py
-inputs = tokenizer(question, long_context, max_length=384, truncation="only_second")
-print(tokenizer.decode(inputs["input_ids"]))
-```
-
-```python out
-"""
-[CLS] Which deep learning libraries back [UNK] Transformers? [SEP] [UNK] Transformers : State of the Art NLP
-
-[UNK] Transformers provides thousands of pretrained models to perform tasks on texts such as classification, information extraction,
-question answering, summarization, translation, text generation and more in over 100 languages.
-Its aim is to make cutting-edge NLP easier to use for everyone.
-
-[UNK] Transformers provides APIs to quickly download and use those pretrained models on a given text, fine-tune them on your own datasets and
-then share them with the community on our model hub. At the same time, each python module defining an architecture is fully standalone and
-can be modified to enable quick research experiments.
-
-Why should I use transformers?
-
-1. Easy-to-use state-of-the-art models:
-  - High performance on NLU and NLG tasks.
-  - Low barrier to entry for educators and practitioners.
-  - Few user-facing abstractions with just three classes to learn.
-  - A unified API for using all our pretrained models.
-  - Lower compute costs, smaller carbon footprint:
-
-2. Researchers can share trained models instead of always retraining.
-  - Practitioners can reduce compute time and production costs.
-  - Dozens of architectures with over 10,000 pretrained models, some in more than 100 languages.
-
-3. Choose the right framework for every part of a model's lifetime:
-  - Train state-of-the-art models in 3 lines of code.
-  - Move a single model between TF2.0/PyTorch frameworks at will.
-  - Seamlessly pick the right framework for training, evaluation and production.
-
-4. Easily customize a model or an example to your needs:
-  - We provide examples for each architecture to reproduce the results published by its original authors.
-  - Model internal [SEP]
-"""
-```
-
-Aceasta înseamnă că modelul va avea dificultăți în a alege răspunsul corect. Pentru a rezolva acest lucru, pipelineul `question-answering` ne permite să împărțim contextul în bucăți mai mici, specificând lungimea maximă. Pentru a ne asigura că nu împărțim contextul exact în locul nepotrivit pentru a face posibilă găsirea răspunsului, aceasta include și o anumită suprapunere între bucăți.
-
-Putem cere tokenizerului (rapid sau lent) să facă acest lucru pentru noi adăugând `return_overflowing_tokens=True`, și putem specifica suprapunerea dorită cu argumentul `stride`. Iată un exemplu, folosind o propoziție mai mică:
-
-```py
-sentence = "This sentence is not too long but we are going to split it anyway."
-inputs = tokenizer(
-    sentence, truncation=True, return_overflowing_tokens=True, max_length=6, stride=2
-)
-
-for ids in inputs["input_ids"]:
-    print(tokenizer.decode(ids))
-```
-
-```python out
-'[CLS] This sentence is not [SEP]'
-'[CLS] is not too long [SEP]'
-'[CLS] too long but we [SEP]'
-'[CLS] but we are going [SEP]'
-'[CLS] are going to split [SEP]'
-'[CLS] to split it anyway [SEP]'
-'[CLS] it anyway. [SEP]'
-```
-
-După cum putem vedea, propoziția a fost împărțită în bucăți astfel încât fiecare intrare din `inputs["input_ids"]` să aibă cel mult 6 token-uri (aici ar trebui să adăugăm padding pentru ca ultima intrare să aibă aceeași dimensiune ca celelalte) și există o suprapunere de 2 tokenuri între fiecare intrare.
-
-Să aruncăm o privire mai atentă la rezultatul tokenizării:
-
-```py
-print(inputs.keys())
-```
-
-```python out
-dict_keys(['input_ids', 'attention_mask', 'overflow_to_sample_mapping'])
-```
-
-Așa cum era de așteptat, obținem ID-uri de intrare și un attention mask. Ultima cheie, `overflow_to_sample_mapping`, este o hartă care ne spune cărei propoziții îi corespunde fiecare dintre rezultate - aici avem 7 rezultate care provin toate din (singura) propoziție pe care am transmis-o tokenizerului:
-
-```py
-print(inputs["overflow_to_sample_mapping"])
-```
-
-```python out
-[0, 0, 0, 0, 0, 0, 0]
-```
-
-Acest lucru este mai util atunci când tokenizăm mai multe propoziții împreună. De exemplu, aceasta:
-
-```py
-sentences = [
-    "This sentence is not too long but we are going to split it anyway.",
-    "This sentence is shorter but will still get split.",
-]
-inputs = tokenizer(
-    sentences, truncation=True, return_overflowing_tokens=True, max_length=6, stride=2
-)
-
-print(inputs["overflow_to_sample_mapping"])
-```
-
-gets us:
-
-```python out
-[0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1]
-```
-
-ceea ce înseamnă că prima propoziție este împărțită în 7 fragmente ca înainte, iar următoarele 4 fragmente provin din a doua propoziție.
-
-Acum să ne întoarcem la contextul nostru lung. În mod implicit, pipelineul `question-answering` utilizează o lungime maximă de 384, așa cum am menționat mai devreme, și un stride de 128, care corespund modului în care modelul a fost fine-tuned (puteți ajusta acești parametri prin trecerea argumentelor `max_seq_len` și `stride` atunci când apelați pipelineul). Astfel, vom utiliza acești parametri la tokenizare. Vom adăuga, de asemenea, padding (pentru a avea sampleuri de aceeași lungime, astfel încât să putem construi tensori), precum și pentru a solicita offsets:
-
-```py
-inputs = tokenizer(
-    question,
-    long_context,
-    stride=128,
-    max_length=384,
-    padding="longest",
-    truncation="only_second",
-    return_overflowing_tokens=True,
-    return_offsets_mapping=True,
-)
-```
-
-Aceste "inputuri" vor conține ID-urile de input și attention maskurile așteptate de model, precum și offseturile și "overflow_to_sample_mapping" despre care tocmai am vorbit. Deoarece cei doi nu sunt parametri utilizați de model, îi vom scoate din `inputs` (și nu vom stoca harta, deoarece nu este utilă aici) înainte de a-l converti într-un tensor:
-
-{#if fw === 'pt'}
-
-```py
-_ = inputs.pop("overflow_to_sample_mapping")
-offsets = inputs.pop("offset_mapping")
-
-inputs = inputs.convert_to_tensors("pt")
-print(inputs["input_ids"].shape)
-```
-
-```python out
-torch.Size([2, 384])
-```
-
-{:else}
-
-```py
-_ = inputs.pop("overflow_to_sample_mapping")
-offsets = inputs.pop("offset_mapping")
-
-inputs = inputs.convert_to_tensors("tf")
-print(inputs["input_ids"].shape)
-```
-
-```python out
-(2, 384)
-```
-
-{/if}
-
-Contextul nostru lung a fost împărțit în două, ceea ce înseamnă că, după ce trece prin modelul nostru, vom avea două seturi de logits de început și de sfârșit:
-
-```py
-outputs = model(**inputs)
-
-start_logits = outputs.start_logits
-end_logits = outputs.end_logits
-print(start_logits.shape, end_logits.shape)
-```
-
-{#if fw === 'pt'}
-
-```python out
-torch.Size([2, 384]) torch.Size([2, 384])
-```
-
-{:else}
-
-```python out
-(2, 384) (2, 384)
-```
-
-{/if}
-
-Ca și înainte, mai întâi mascăm tokenii care nu fac parte din context înainte de a lua softmax. De asemenea, mascăm toți padding tokens(marcate de attention mask):
-
-{#if fw === 'pt'}
-
-```py
-sequence_ids = inputs.sequence_ids()
-# Mask everything apart from the tokens of the context
-mask = [i != 1 for i in sequence_ids]
-# Unmask the [CLS] token
-mask[0] = False
-# Mask all the [PAD] tokens
-mask = torch.logical_or(torch.tensor(mask)[None], (inputs["attention_mask"] == 0))
-
-start_logits[mask] = -10000
-end_logits[mask] = -10000
-```
-
-{:else}
-
-```py
-sequence_ids = inputs.sequence_ids()
-# Mask everything apart from the tokens of the context
-mask = [i != 1 for i in sequence_ids]
-# Unmask the [CLS] token
-mask[0] = False
-# Mask all the [PAD] tokens
-mask = tf.math.logical_or(tf.constant(mask)[None], inputs["attention_mask"] == 0)
-
-start_logits = tf.where(mask, -10000, start_logits)
-end_logits = tf.where(mask, -10000, end_logits)
-```
-
-{/if}
-
-Then we can use the softmax to convert our logits to probabilities:
-
-{#if fw === 'pt'}
-
-```py
-start_probabilities = torch.nn.functional.softmax(start_logits, dim=-1)
-end_probabilities = torch.nn.functional.softmax(end_logits, dim=-1)
-```
-
-{:else}
-
-```py
-start_probabilities = tf.math.softmax(start_logits, axis=-1).numpy()
-end_probabilities = tf.math.softmax(end_logits, axis=-1).numpy()
-```
-
-{/if}
-
-Următorul pas este similar cu ceea ce am făcut pentru contextul mic, dar îl repetăm pentru fiecare dintre cele două chunkuri. Atribuim un scor tuturor intervalelor posibile de răspuns, apoi luăm intervalul cu cel mai bun scor:
-
-{#if fw === 'pt'}
-
-```py
-candidates = []
-for start_probs, end_probs in zip(start_probabilities, end_probabilities):
-    scores = start_probs[:, None] * end_probs[None, :]
-    idx = torch.triu(scores).argmax().item()
-
-    start_idx = idx // scores.shape[1]
-    end_idx = idx % scores.shape[1]
-    score = scores[start_idx, end_idx].item()
-    candidates.append((start_idx, end_idx, score))
-
-print(candidates)
-```
-
-{:else}
-
-```py
-candidates = []
-for start_probs, end_probs in zip(start_probabilities, end_probabilities):
-    scores = start_probs[:, None] * end_probs[None, :]
-    idx = np.triu(scores).argmax().item()
-
-    start_idx = idx // scores.shape[1]
-    end_idx = idx % scores.shape[1]
-    score = scores[start_idx, end_idx].item()
-    candidates.append((start_idx, end_idx, score))
-
-print(candidates)
-```
-
-{/if}
-
-```python out
-[(0, 18, 0.33867), (173, 184, 0.97149)]
-```
-
-Cei doi candidați corespund celor mai bune răspunsuri pe care modelul le-a putut găsi în fiecare parte. Modelul este mult mai încrezător că răspunsul corect se află în a doua parte (ceea ce este un semn bun!). Acum trebuie doar să facem map celor două intervale de tokenuri cu intervalele de caractere din context (trebuie să o punem în corespondență doar pe a doua pentru a avea răspunsul nostru, dar este interesant să vedem ce a ales modelul în prima parte).
-
-<Tip>
-
-✏️ **Încercați!** Adaptați codul de mai sus pentru a returna scorurile și spanurile intervalele pentru cele mai probabile cinci răspunsuri (în total, nu pe chunk).
-
-</Tip>
-
-`offsets`-urile pe care le-am luat mai devreme este de fapt o listă de offsets, cu o listă pentru fiecare chunk de text:
-
-```py
-for candidate, offset in zip(candidates, offsets):
-    start_token, end_token, score = candidate
-    start_char, _ = offset[start_token]
-    _, end_char = offset[end_token]
-    answer = long_context[start_char:end_char]
-    result = {"answer": answer, "start": start_char, "end": end_char, "score": score}
-    print(result)
-```
-
-```python out
-{'answer': '\n🤗 Transformers: State of the Art NLP', 'start': 0, 'end': 37, 'score': 0.33867}
-{'answer': 'Jax, PyTorch and TensorFlow', 'start': 1892, 'end': 1919, 'score': 0.97149}
-```
-
-Dacă ignorăm primul rezultat, obținem același rezultat ca și pipelineul noastru pentru acest context lung - yay!
-
-<Tip>
-
-✏️ **Încercați!** Utilizați cele mai bune scoruri pe care le-ați calculat înainte pentru a afișa cele mai probabile cinci răspunsuri (pentru întregul context, nu pentru fiecare chunk). Pentru a vă verifica rezultatele, întoarceți-vă la primul pipeline și introduceți `top_k=5` atunci când îl apelați.
-
-</Tip>
-
-Aici se încheie scufundarea noastră în capacitățile tokenizerului. Vom pune toate acestea din nou în practică în capitolul următor, când vă vom arăta cum să ajustați un model pentru o serie de sarcini NLP comune.
diff --git a/chapters/ro/chapter 6/4.mdx b/chapters/ro/chapter 6/4.mdx
deleted file mode 100644
index e87d27c57..000000000
--- a/chapters/ro/chapter 6/4.mdx	
+++ /dev/null
@@ -1,122 +0,0 @@
-# Normalization and pre-tokenization[[normalization-and-pre-tokenization]]
-
-<CourseFloatingBanner chapter={6}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter6/section4.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter6/section4.ipynb"},
-]} />
-
-Înainte de a analiza în profunzime cei mai comuni trei algoritmi de subword tokenization utilizați cu modelele Transformer (Byte-Pair Encoding [BPE], WordPiece și Unigram), vom arunca mai întâi o privire la preprocesarea pe care fiecare tokenizer o aplică textului. Iată o prezentare generală a etapelor din pipelineul de tokenizare:
-
-<div class="flex justify-center">
-<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter6/tokenization_pipeline.svg" alt="The tokenization pipeline.">
-<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter6/tokenization_pipeline-dark.svg" alt="The tokenization pipeline.">
-</div>
-
-Înainte de a împărți un text în subtokens (în conformitate cu modelul său), tokenizerul efectuează doi pași: _normalization__ și _pre-tokenization_.
-
-## Normalization[[normalization]]
-
-<Youtube id="4IIC2jI9CaU"/>
-
-Etapa de normalizare implică o curățare generală, cum ar fi eliminarea spațiilor inutile, a le face minuscule, și/sau ștergerea accentelor. Dacă sunteți familiarizat cu [Unicode normalization](http://www.unicode.org/reports/tr15/) (cum ar fi NFC sau NFKC), acest lucru poate fi aplicat și de tokenizer.
-
-`Tokenizer`-ul 🤗 Transformers are un atribut numit `backend_tokenizer` care oferă acces la tokenizatorul de bază din biblioteca 🤗 Tokenizers:
-
-```py
-from transformers import AutoTokenizer
-
-tokenizer = AutoTokenizer.from_pretrained("bert-base-uncased")
-print(type(tokenizer.backend_tokenizer))
-```
-
-```python out
-<class 'tokenizers.Tokenizer'>
-```
-
-Atributul `normalizer` al obiectului `tokenizer` are o metodă `normalize_str()` pe care o putem folosi pentru a vedea cum se realizează normalizarea:
-
-```py
-print(tokenizer.backend_tokenizer.normalizer.normalize_str("Héllò hôw are ü?"))
-```
-
-```python out
-'hello how are u?'
-```
-
-În acest exemplu, din moment ce am ales checkpointul `bert-base-uncased`, normalizarea a aplicat scrierea cu minusculă și a eliminat accentele.
-
-<Tip>
-
-✏️ **Încercați!** Încărcați un tokenizer din checkpointul `bert-base-cased` și treceți-i același exemplu. Care sunt principalele diferențe pe care le puteți observa între versiunile cased și uncased ale tokenizerului?
-
-</Tip>
-
-## Pre-tokenization[[pre-tokenization]]
-
-<Youtube id="grlLV8AIXug"/>
-
-După cum vom vedea în secțiunile următoare, un tokenizer nu poate fi antrenat doar pe text raw. În schimb, trebuie mai întâi să împărțim textele în entități mici, cum ar fi cuvintele. Aici intervine etapa de pre-tokenizare. După cum am văzut în [Capitolul 2](/course/chapter2), un tokenizer bazat pe cuvinte poate împărți pur și simplu un text raw în cuvinte pe baza spațiului și a punctuației. Aceste cuvinte vor fi limitele subtokenurilor pe care tokenizerul le poate învăța în timpul instruirii sale.
-
-Pentru a vedea cum un tokenizator rapid efectuează pre-tokenizarea, putem utiliza metoda `pre_tokenize_str()` a atributului `pre_tokenizer` al obiectului `tokenizer`:
-
-```py
-tokenizer.backend_tokenizer.pre_tokenizer.pre_tokenize_str("Hello, how are  you?")
-```
-
-```python out
-[('Hello', (0, 5)), (',', (5, 6)), ('how', (7, 10)), ('are', (11, 14)), ('you', (16, 19)), ('?', (19, 20))]
-```
-
-Observați cum tokenizatorul ține deja evidența offseturilor, acesta fiind modul în care ne poate oferi mappingul offseturilor pe care l-am folosit în secțiunea anterioară. Aici, tokenizatorul ignoră cele două spații și le înlocuiește cu unul singur, dar offsetul sare între `are` și `you` pentru a ține cont de acest lucru.
-
-Deoarece utilizăm un tokenizer BERT, pre-tokenizarea implică separarea spațiilor și a punctuației. Alți tokenizatori pot avea reguli diferite pentru acest pas. De exemplu, dacă folosim tokenizatorul GPT-2:
-
-```py
-tokenizer = AutoTokenizer.from_pretrained("gpt2")
-tokenizer.backend_tokenizer.pre_tokenizer.pre_tokenize_str("Hello, how are  you?")
-```
-
-va despărți în spații și punctuație, dar va păstra spațiile și le va înlocui cu un simbol `Ġ`, permițându-i să recupereze spațiile originale dacă facem decode tokenilor:
-
-```python out
-[('Hello', (0, 5)), (',', (5, 6)), ('Ġhow', (6, 10)), ('Ġare', (10, 14)), ('Ġ', (14, 15)), ('Ġyou', (15, 19)),
- ('?', (19, 20))]
-```
-
-De asemenea, rețineți că, spre deosebire de tokenizatorul BERT, acest tokenizator nu ignoră spațiul dublu.
-
-Pentru un ultim exemplu, să aruncăm o privire la tokenizerul T5, care se bazează pe algoritmul SentencePiece:
-
-```py
-tokenizer = AutoTokenizer.from_pretrained("t5-small")
-tokenizer.backend_tokenizer.pre_tokenizer.pre_tokenize_str("Hello, how are  you?")
-```
-
-```python out
-[('▁Hello,', (0, 6)), ('▁how', (7, 10)), ('▁are', (11, 14)), ('▁you?', (16, 20))]
-```
-
-Ca și tokenizatorul GPT-2, acesta păstrează spațiile și le înlocuiește cu un token specific (`_`), dar tokenizatorul T5 separă doar spațiile, nu și punctuația. De asemenea, observați că a adăugat un spațiu implicit la începutul propoziției (înainte de `Hello`) și a ignorat spațiul dublu dintre `are` și `you`.
-
-Acum că am văzut puțin din modul în care diferite tokenizere procesează textul, putem începe să explorăm algoritmii care stau la baza acestora. Vom începe cu o privire rapidă asupra SentencePiece, care se aplică pe scară largă; apoi, în următoarele trei secțiuni, vom examina modul în care funcționează cei trei algoritmi principali utilizați pentru tokenizarea subcuvintelor.
-
-## SentencePiece[[sentencepiece]]
-
-[SentencePiece](https://github.com/google/sentencepiece) este un algoritm de tokenizare pentru preprocesarea textului pe care îl puteți utiliza cu oricare dintre modelele pe care le vom vedea în următoarele trei secțiuni. Acesta consideră textul ca o secvență de caractere Unicode și înlocuiește spațiile cu un caracter special, `▁`. Folosit împreună cu algoritmul Unigram (a se vedea [secțiunea 7](/course/chapter7/7)), nu necesită nici măcar o etapă de pre-tokenizare, ceea ce este foarte util pentru limbile în care nu se folosește caracterul spațiu (cum ar fi chineza sau japoneza).
-
-Cealaltă caracteristică principală a SentencePiece este *reversible tokenization*: deoarece nu există un tratament special al spațiilor, decodarea tokenurilor se face pur și simplu prin concatenarea lor și înlocuirea `_` cu spații - acest lucru rezultă în textul normalizat. După cum am văzut mai devreme, tokenizatorul BERT elimină spațiile care se repetă, deci tokenizarea sa nu este reversibilă.
-
-## Prezentare generală a algoritmului[[algorithm-overview]]
-
-În următoarele secțiuni, vom analiza cei trei algoritmi principali de tokenizare a subcuvintelor: BPE (utilizat de GPT-2 și alții), WordPiece (utilizat de exemplu de BERT) și Unigram (utilizat de T5 și alții). Înainte de a începe, iată o scurtă prezentare generală a modului în care funcționează fiecare dintre acestea. Nu ezitați să reveniți la acest tabel după ce citiți fiecare dintre secțiunile următoare, dacă încă nu are sens pentru dumneavoastră.
-
-Model | BPE | WordPiece | Unigram
-:----:|:---:|:---------:|:------:
-Training | Pornește de la un vocabular restrâns și învață reguli de îmbinare a tokenilor |  Pornește de la un vocabular restrâns și învață reguli de îmbinare a tokenilor | Pornește de la un vocabular mare și învață regulile de eliminare a tokenilor
-Training step | Combină tokenii corespunzători celei mai comune perechi | Combină tokenii corespunzători perechii cu cel mai bun scor pe baza frecvenței perechii, privilegiind perechile în care fiecare token individual este mai puțin frecvent| Elimină toți tokenii din vocabular care vor minimiza pierderea calculată pe întregul corpus
-Learns | Reguli de combinare și un vocabular| Doar un vocabular| Un vocabular cu un anumit scor pentru fiecare token
-Encoding | Împarte un cuvânt în caractere și aplică îmbinările învățate în timpul antrenării | Găsește cel mai lung subcuvânt începând de la început care se află în vocabular, apoi face același lucru pentru restul cuvântului | Găsește cea mai probabilă împărțire în tokens, folosind scorurile învățate în timpul antrenării
-
-Acum hai să trecem la BPE!
\ No newline at end of file
diff --git a/chapters/ro/chapter 6/5.mdx b/chapters/ro/chapter 6/5.mdx
deleted file mode 100644
index 91c26b82f..000000000
--- a/chapters/ro/chapter 6/5.mdx	
+++ /dev/null
@@ -1,360 +0,0 @@
-# Tokenizarea Byte-Pair Encoding[[byte-pair-encoding-tokenization]]
-
-<CourseFloatingBanner chapter={6}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter6/section5.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter6/section5.ipynb"},
-]} />
-
-Byte-Pair Encoding (BPE) a fost inițial dezvoltat ca un algoritm de comprimare a textelor și apoi utilizat de OpenAI pentru tokenizare la preantrenarea modelului GPT. Acesta este utilizat de o mulțime de modele Transformers, inclusiv GPT, GPT-2, RoBERTa, BART și DeBERTa.
-
-<Youtube id="HEikzVL-lZU"/>
-
-<Tip>
-
-💡 Această secțiune acoperă BPE în profunzime, mergând până la prezentarea unei implementări complete. Puteți sări la sfârșit dacă doriți doar o prezentare generală a algoritmului de tokenizare.
-
-</Tip>
-
-## Algoritmul de antrenare[[training-algorithm]]
-
-Antrenarea BPE începe prin calcularea setului unic de cuvinte utilizate în corpus (după finalizarea etapelor de normalizare și pre-tokenizare), apoi construirea vocabularului prin preluarea tuturor simbolurilor utilizate pentru scrierea acestor cuvinte. Ca un exemplu foarte simplu, să spunem că corpusul nostru utilizează aceste cinci cuvinte:
-
-```
-"hug", "pug", "pun", "bun", "hugs"
-```
-
-Vocabularul de bază va fi atunci `["b", "g", "h", "n", "p", "s", "u"]`. Pentru cazurile din lumea reală, vocabularul de bază va conține cel puțin toate caracterele ASCII și, probabil, și unele caractere Unicode. Dacă un exemplu pe care îl tokenizați utilizează un caracter care nu se află în corpusul de antrenare, acel caracter va fi convertit într-un token necunoscut. Acesta este unul dintre motivele pentru care o mulțime de modele NLP sunt foarte proaste la analizarea conținutului cu emoji, de exemplu.
-
-<Tip>
-
-Tokenizerele GPT-2 și RoBERTa (care sunt destul de asemănătoare) au o modalitate inteligentă de a rezolva acest lucru: ele nu privesc cuvintele ca fiind scrise cu caractere Unicode, ci cu bytes. În acest fel, vocabularul de bază are o dimensiune mică (256), dar fiecare caracter la care vă puteți gândi va fi inclus și nu va ajunge să fie convertit într-un token necunoscut. Acest truc se numește *byte-level BPE*.
-
-</Tip>
-
-După obținerea acestui vocabular de bază, adăugăm noi tokeni până când se atinge dimensiunea dorită a vocabularului prin învățarea prin *merges*, care sunt reguli de merge a două elemente ale vocabularului existent într-unul nou. Astfel, la început, aceste fuziuni vor crea tokenuri cu două caractere, iar apoi, pe măsură ce antrenamentul progresează, subwords mai lungi.
-
-În orice etapă din timpul antrenării tokenizerului, algoritmul BPE va căuta cea mai frecventă pereche de tokenuri existente (prin "pereche" înțelegem aici doi tokeni consecutivi într-un cuvânt). Acea pereche cea mai frecventă este cea care va fi mergea, iar noi ștergem și repetăm pentru pasul următor.
-
-Revenind la exemplul nostru anterior, să presupunem că cuvintele au următoarele frecvențe:
-
-```
-("hug", 10), ("pug", 5), ("pun", 12), ("bun", 4), ("hugs", 5)
-```
-
-înțelegând că `"hug"` a fost prezent de 10 ori în corpus, `"pug"` de 5 ori, `"pun"` de 12 ori, `"bun"` de 4 ori, iar `"hugs"` de 5 ori. Începem antrenamentul împărțind fiecare cuvânt în caractere (cele care formează vocabularul nostru inițial), astfel încât să putem vedea fiecare cuvânt ca pe o listă de tokeni:
-
-```
-("h" "u" "g", 10), ("p" "u" "g", 5), ("p" "u" "n", 12), ("b" "u" "n", 4), ("h" "u" "g" "s", 5)
-```
-
-Apoi ne uităm la perechi. Perechea `("h", "u")` este prezentă în cuvintele `"hug"` și `"hugs"`, deci de 15 ori în total în corpus. Totuși, nu este cea mai frecventă pereche: această onoare revine perechii `("u", "g")`, care este prezentă în cuvintele `"hug"`, `"pug"` și `"hugs"`, pentru un total de 20 de ori în vocabular.
-
-Astfel, prima regulă de merge învățată de tokenizer este `("u", "g") -> "ug"`, ceea ce înseamnă că `"ug"` va fi adăugat la vocabular, iar perechea ar trebui să fie merged în toate cuvintele din corpus. La sfârșitul acestei etape, vocabularul și corpus-ul arată astfel:
-
-```
-Vocabulary: ["b", "g", "h", "n", "p", "s", "u", "ug"]
-Corpus: ("h" "ug", 10), ("p" "ug", 5), ("p" "u" "n", 12), ("b" "u" "n", 4), ("h" "ug" "s", 5)
-```
-
-Acum avem câteva perechi care rezultă într-un token mai lung de două caractere: perechea `("h", "ug")`, de exemplu (prezentă de 15 ori în corpus). Cea mai frecventă pereche în această etapă este `("u", "n")`, prezentă însă de 16 ori în corpus, astfel încât a doua regulă de îmbinare învățată este `("u", "n") -> "un"`. Adăugarea acestei reguli la vocabular și mergingul tuturor aparițiilor existente ne conduce la:
-
-```
-Vocabulary: ["b", "g", "h", "n", "p", "s", "u", "ug", "un"]
-Corpus: ("h" "ug", 10), ("p" "ug", 5), ("p" "un", 12), ("b" "un", 4), ("h" "ug" "s", 5)
-```
-
-Acum, cea mai frecventă pereche este `("h", "ug")`, așa că învățăm regula de erge `("h", "ug") -> "hug"`, care ne oferă primul nostru simbol din trei litere. După fuzionare, corpusul arată astfel:
-
-```
-Vocabulary: ["b", "g", "h", "n", "p", "s", "u", "ug", "un", "hug"]
-Corpus: ("hug", 10), ("p" "ug", 5), ("p" "un", 12), ("b" "un", 4), ("hug" "s", 5)
-```
-
-Și continuăm astfel până când ajungem la dimensiunea dorită a vocabularului.
-
-<Tip>
-
-✏️ **Acum e rândul tău!** Care crezi că va fi următoarea regulă de fuziune?
-
-</Tip>
-
-## Algoritmul de tokenizare[[tokenization-algorithm]]
-
-Tokenizarea urmează îndeaproape procesul de antrenare, în sensul că noile inputuri sunt tokenizate prin aplicarea următoarelor etape:
-
-1. Normalizare
-2. Pre-tokenizare
-3. Divizarea cuvintelor în caractere individuale
-4. Aplicarea regulilor de merge învățate în ordine asupra acestor împărțiri
-
-Să luăm exemplul pe care l-am folosit în timpul antrenamentului, cu cele trei reguli de merge învățate:
-
-```
-("u", "g") -> "ug"
-("u", "n") -> "un"
-("h", "ug") -> "hug"
-```
-
-Cuvântul `"bug"` va fi tokenizat ca `["b", "ug"]`. Cu toate acestea, cuvântul `"mug"` va fi tokenizat ca `["[UNK]", "ug"]` deoarece litera `"m"` nu a fost în vocabularul de bază. De asemenea, cuvântul `"thug"` va fi tokenizat ca `["[UNK]", "hug"]`: litera `"t"` nu se află în vocabularul de bază, iar aplicarea regulilor de merge duce mai întâi la fuzionarea lui `"u"` și `"g"` și apoi la fuzionarea lui `"h"` și `"ug"`.
-
-<Tip>
-
-✏️ **Acum e rândul tău!** Cum crezi că va fi tokenizat cuvântul `"unhug"`?
-
-</Tip>
-
-## Implementarea BPE[[implementing-bpe]]
-
-Acum să aruncăm o privire la implementarea algoritmului BPE. Aceasta nu va fi o versiune optimizată pe care o puteți utiliza pe un corpus mare; dorim doar să vă arătăm codul pentru a putea înțelege algoritmul puțin mai bine.
-
-În primul rând avem nevoie de un corpus, așa că haideți să creăm unul simplu cu câteva propoziții:
-
-```python
-corpus = [
-    "This is the Hugging Face Course.",
-    "This chapter is about tokenization.",
-    "This section shows several tokenizer algorithms.",
-    "Hopefully, you will be able to understand how they are trained and generate tokens.",
-]
-```
-
-Apoi, trebuie să pre-tokenizăm acest corpus în cuvinte. Deoarece replicăm un tokenizator BPE (precum GPT-2), vom utiliza tokenizatorul `gpt2` pentru pre-tokenizare:
-
-```python
-from transformers import AutoTokenizer
-
-tokenizer = AutoTokenizer.from_pretrained("gpt2")
-```
-
-Apoi, calculăm frecvențele fiecărui cuvânt din corpus la fel ca în cazul pre-tokenizării:
-
-```python
-from collections import defaultdict
-
-word_freqs = defaultdict(int)
-
-for text in corpus:
-    words_with_offsets = tokenizer.backend_tokenizer.pre_tokenizer.pre_tokenize_str(text)
-    new_words = [word for word, offset in words_with_offsets]
-    for word in new_words:
-        word_freqs[word] += 1
-
-print(word_freqs)
-```
-
-```python out
-defaultdict(int, {'This': 3, 'Ġis': 2, 'Ġthe': 1, 'ĠHugging': 1, 'ĠFace': 1, 'ĠCourse': 1, '.': 4, 'Ġchapter': 1,
-    'Ġabout': 1, 'Ġtokenization': 1, 'Ġsection': 1, 'Ġshows': 1, 'Ġseveral': 1, 'Ġtokenizer': 1, 'Ġalgorithms': 1,
-    'Hopefully': 1, ',': 1, 'Ġyou': 1, 'Ġwill': 1, 'Ġbe': 1, 'Ġable': 1, 'Ġto': 1, 'Ġunderstand': 1, 'Ġhow': 1,
-    'Ġthey': 1, 'Ġare': 1, 'Ġtrained': 1, 'Ġand': 1, 'Ġgenerate': 1, 'Ġtokens': 1})
-```
-
-Următorul pas este calcularea vocabularului de bază, format din toate caracterele utilizate în corpus:
-
-```python
-alphabet = []
-
-for word in word_freqs.keys():
-    for letter in word:
-        if letter not in alphabet:
-            alphabet.append(letter)
-alphabet.sort()
-
-print(alphabet)
-```
-
-```python out
-[ ',', '.', 'C', 'F', 'H', 'T', 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'k', 'l', 'm', 'n', 'o', 'p', 'r', 's',
-  't', 'u', 'v', 'w', 'y', 'z', 'Ġ']
-```
-
-De asemenea, adăugăm tokenurile speciale utilizate de model la începutul vocabularului respectiv. În cazul GPT-2, singurul simbol special este `"<|endoftext|>"`:
-
-```python
-vocab = ["<|endoftext|>"] + alphabet.copy()
-```
-
-Acum trebuie să împărțim fiecare cuvânt în caractere individuale, pentru a putea începe antrenarea:
-
-```python
-splits = {word: [c for c in word] for word in word_freqs.keys()}
-```
-
-Acum că suntem pregătiți pentru antrenare, să scriem o funcție care calculează frecvența fiecărei perechi. Va trebui să folosim această funcție la fiecare etapă a antrenare:
-
-```python
-def compute_pair_freqs(splits):
-    pair_freqs = defaultdict(int)
-    for word, freq in word_freqs.items():
-        split = splits[word]
-        if len(split) == 1:
-            continue
-        for i in range(len(split) - 1):
-            pair = (split[i], split[i + 1])
-            pair_freqs[pair] += freq
-    return pair_freqs
-```
-
-Să aruncăm o privire la o parte din acest dicționar după separările inițiale:
-
-```python
-pair_freqs = compute_pair_freqs(splits)
-
-for i, key in enumerate(pair_freqs.keys()):
-    print(f"{key}: {pair_freqs[key]}")
-    if i >= 5:
-        break
-```
-
-```python out
-('T', 'h'): 3
-('h', 'i'): 3
-('i', 's'): 5
-('Ġ', 'i'): 2
-('Ġ', 't'): 7
-('t', 'h'): 3
-```
-
-Acum, pentru a găsi cea mai frecventă pereche este nevoie doar de o loop rapid:
-
-```python
-best_pair = ""
-max_freq = None
-
-for pair, freq in pair_freqs.items():
-    if max_freq is None or max_freq < freq:
-        best_pair = pair
-        max_freq = freq
-
-print(best_pair, max_freq)
-```
-
-```python out
-('Ġ', 't') 7
-```
-
-Așadar, prima îmbinare care trebuie învățată este `('Ġ', 't') -> 'Ġt'`, și adăugăm `'Ġt'` la vocabular:
-
-```python
-merges = {("Ġ", "t"): "Ġt"}
-vocab.append("Ġt")
-```
-
-Pentru a continua, trebuie să aplicăm aceast merge în dicționarul nostru `splits`. Să scriem o altă funcție pentru acest lucru:
-
-```python
-def merge_pair(a, b, splits):
-    for word in word_freqs:
-        split = splits[word]
-        if len(split) == 1:
-            continue
-
-        i = 0
-        while i < len(split) - 1:
-            if split[i] == a and split[i + 1] == b:
-                split = split[:i] + [a + b] + split[i + 2 :]
-            else:
-                i += 1
-        splits[word] = split
-    return splits
-```
-
-Și putem arunca o privire la rezultatul primului merge:
-
-```py
-splits = merge_pair("Ġ", "t", splits)
-print(splits["Ġtrained"])
-```
-
-```python out
-['Ġt', 'r', 'a', 'i', 'n', 'e', 'd']
-```
-
-Acum avem tot ce ne trebuie pentru a face bucle până când vom învăța toate mergeu-rile dorite. Ne focusăm pe o mărime a vocabularui de 50:
-
-```python
-vocab_size = 50
-
-while len(vocab) < vocab_size:
-    pair_freqs = compute_pair_freqs(splits)
-    best_pair = ""
-    max_freq = None
-    for pair, freq in pair_freqs.items():
-        if max_freq is None or max_freq < freq:
-            best_pair = pair
-            max_freq = freq
-    splits = merge_pair(*best_pair, splits)
-    merges[best_pair] = best_pair[0] + best_pair[1]
-    vocab.append(best_pair[0] + best_pair[1])
-```
-
-Ca rezultat, am învățat 19 reguli de merge(vocabularul inițial avea o dimensiune de 31 -- 30 de caractere din alfabet, plus simbolul special):
-
-```py
-print(merges)
-```
-
-```python out
-{('Ġ', 't'): 'Ġt', ('i', 's'): 'is', ('e', 'r'): 'er', ('Ġ', 'a'): 'Ġa', ('Ġt', 'o'): 'Ġto', ('e', 'n'): 'en',
- ('T', 'h'): 'Th', ('Th', 'is'): 'This', ('o', 'u'): 'ou', ('s', 'e'): 'se', ('Ġto', 'k'): 'Ġtok',
- ('Ġtok', 'en'): 'Ġtoken', ('n', 'd'): 'nd', ('Ġ', 'is'): 'Ġis', ('Ġt', 'h'): 'Ġth', ('Ġth', 'e'): 'Ġthe',
- ('i', 'n'): 'in', ('Ġa', 'b'): 'Ġab', ('Ġtoken', 'i'): 'Ġtokeni'}
-```
-
-Iar vocabularul este compus din simbolul special, alfabetul inițial și toate rezultatele merge-urilor:
-
-```py
-print(vocab)
-```
-
-```python out
-['<|endoftext|>', ',', '.', 'C', 'F', 'H', 'T', 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'k', 'l', 'm', 'n', 'o',
- 'p', 'r', 's', 't', 'u', 'v', 'w', 'y', 'z', 'Ġ', 'Ġt', 'is', 'er', 'Ġa', 'Ġto', 'en', 'Th', 'This', 'ou', 'se',
- 'Ġtok', 'Ġtoken', 'nd', 'Ġis', 'Ġth', 'Ġthe', 'in', 'Ġab', 'Ġtokeni']
-```
-
-<Tip>
-
-💡 Folosind `train_new_from_iterator()` pe același corpus nu va rezulta exact același vocabular. Acest lucru se datorează faptului că atunci când există o alegere a celei mai frecvente perechi, am selectat-o pe prima întâlnită, în timp ce biblioteca 🤗 Tokenizers o selectează pe prima pe baza ID-urilor sale interne.
-
-</Tip>
-
-Pentru a tokeniza un text nou, îl pre-tokenizăm, îl împărțim, apoi aplicăm toate regulile de merge învățate:
-
-```python
-def tokenize(text):
-    pre_tokenize_result = tokenizer._tokenizer.pre_tokenizer.pre_tokenize_str(text)
-    pre_tokenized_text = [word for word, offset in pre_tokenize_result]
-    splits = [[l for l in word] for word in pre_tokenized_text]
-    for pair, merge in merges.items():
-        for idx, split in enumerate(splits):
-            i = 0
-            while i < len(split) - 1:
-                if split[i] == pair[0] and split[i + 1] == pair[1]:
-                    split = split[:i] + [merge] + split[i + 2 :]
-                else:
-                    i += 1
-            splits[idx] = split
-
-    return sum(splits, [])
-```
-
-Putem încerca acest lucru pe orice text compus din caractere din alfabet:
-
-```py
-tokenize("This is not a token.")
-```
-
-```python out
-['This', 'Ġis', 'Ġ', 'n', 'o', 't', 'Ġa', 'Ġtoken', '.']
-```
-
-<Tip warning={true}>
-
-⚠️ Implementarea noastră va arunca o eroare dacă există un caracter necunoscut, deoarece nu am făcut nimic pentru a le gestiona. GPT-2 nu are de fapt un token necunoscut (este imposibil să obțineți un caracter necunoscut atunci când utilizați BPE la nivel de bytes), dar acest lucru s-ar putea întâmpla aici deoarece nu am inclus toate byte-urile posibile în vocabularul inițial. Acest aspect al BPE depășește domeniul de aplicare al acestei secțiuni, așa că am omis detaliile.
-
-</Tip>
-
-Asta e tot pentru algoritmul BPE! În continuare, ne vom uita la WordPiece.
\ No newline at end of file
diff --git a/chapters/ro/chapter 6/6.mdx b/chapters/ro/chapter 6/6.mdx
deleted file mode 100644
index c2b0e6450..000000000
--- a/chapters/ro/chapter 6/6.mdx	
+++ /dev/null
@@ -1,375 +0,0 @@
-# Tokenizarea WordPiece[[wordpiece-tokenization]]
-
-<CourseFloatingBanner chapter={6}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter6/section6.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter6/section6.ipynb"},
-]} />
-
-WordPiece este algoritmul de tokenizare dezvoltat de Google pentru preantrenarea BERT. De atunci, acesta a fost reutilizat în numeroase modele Transformers bazate pe BERT, cum ar fi DistilBERT, MobileBERT, Funnel Transformers și MPNET. Este foarte similar cu BPE în ceea ce privește antrenarea, dar tokenizarea efectivă se face diferit.
-
-<Youtube id="qpv6ms_t_1A"/>
-
-<Tip>
-
-💡 Această secțiune acoperă WordPiece în profunzime, mergând până la prezentarea unei implementări complete. Puteți sări la sfârșit dacă doriți doar o prezentare generală a algoritmului de tokenizare.
-
-</Tip>
-
-## Algoritmul de antrenare[[training-algorithm]]
-
-<Tip warning={true}>
-
-⚠️ Google nu a publicat niciodată implementarea sa a algoritmului de formare a WordPiece, astfel încât ceea ce urmează este cea mai bună presupunere a noastră bazată pe literatura publicată. Este posibil să nu fie 100% exactă.
-
-</Tip>
-
-La fel ca BPE, WordPiece pornește de la un vocabular restrâns care include simbolurile speciale utilizate de model și alfabetul inițial. Deoarece identifică subcuvinte prin adăugarea unui prefix (cum ar fi `##` pentru BERT), fiecare cuvânt este inițial împărțit prin adăugarea prefixului respectiv la toate caracterele din cuvânt. Astfel, de exemplu, `"word"` este împărțit astfel:
-
-```
-w ##o ##r ##d
-```
-
-Astfel, alfabetul inițial conține toate caracterele prezente la începutul unui cuvânt și caracterele prezente în interiorul unui cuvânt cu prefixul WordPiece.
-
-Apoi, la fel ca BPE, WordPiece învață reguli de merge. Principala diferență este modul în care este selectată perechea care urmează să fie merged. În loc să selecteze cea mai frecventă pereche, WordPiece calculează un scor pentru fiecare pereche, utilizând următoarea formulă:
-
-$$\mathrm{score} = (\mathrm{freq\_of\_pair}) / (\mathrm{freq\_of\_first\_element} \times \mathrm{freq\_of\_second\_element})$$
-
-Împărțind frecvența perechii la produsul frecvențelor fiecărei părți a acesteia, algoritmul prioritizează fuzionarea perechilor în care părțile individuale sunt mai puțin frecvente în vocabular. De exemplu, nu va fuziona neapărat `("un", "##able")` chiar dacă această pereche apare foarte frecvent în vocabular, deoarece cele două perechi `"un"` și `"##able"` vor apărea probabil fiecare într-o mulțime de alte cuvinte și vor avea o frecvență ridicată. În schimb, o pereche precum `("hu", "##gging")` va fi probabil fuzionată mai repede (presupunând că cuvântul "hugging" apare frecvent în vocabular), deoarece `"hu"` și `"##gging"` sunt probabil mai puțin frecvente individual.
-
-Să ne uităm la același vocabular pe care l-am folosit în exemplul de antrenare BPE:
-
-```
-("hug", 10), ("pug", 5), ("pun", 12), ("bun", 4), ("hugs", 5)
-```
-
-Spliturile aici vor fi:
-
-```
-("h" "##u" "##g", 10), ("p" "##u" "##g", 5), ("p" "##u" "##n", 12), ("b" "##u" "##n", 4), ("h" "##u" "##g" "##s", 5)
-```
-
-deci vocabularul inițial va fi `["b", "h", "p", "##g", "##n", "##s", "##u"]` (dacă uităm deocamdată de tokenurile speciale). Cea mai frecventă pereche este `("##u", "##g")` (prezentă de 20 de ori), dar frecvența individuală a lui `"##u"` este foarte mare, astfel încât scorul său nu este cel mai mare (este 1 / 36). Toate perechile cu un `"##u"` au de fapt același scor (1 / 36), astfel încât cel mai bun scor revine perechii `("##g", "##s")` - singura fără un `"##u"` - cu 1 / 20, iar prima îmbinare învățată este `("##g", "##s") -> ("##gs")`.
-
-Rețineți că atunci când facem merge, eliminăm `##` dintre cele două tokenuri, deci adăugăm `"##gs"` la vocabular și aplicăm merge în cuvintele din corpus:
-
-```
-Vocabulary: ["b", "h", "p", "##g", "##n", "##s", "##u", "##gs"]
-Corpus: ("h" "##u" "##g", 10), ("p" "##u" "##g", 5), ("p" "##u" "##n", 12), ("b" "##u" "##n", 4), ("h" "##u" "##gs", 5)
-```
-
-În acest moment, `"##u"` se află în toate perechile posibile, deci toate au același scor. Să spunem că în acest caz, prima pereche este merged, deci `("h", "##u") -> "hu"`. Acest lucru ne duce la:
-
-```
-Vocabulary: ["b", "h", "p", "##g", "##n", "##s", "##u", "##gs", "hu"]
-Corpus: ("hu" "##g", 10), ("p" "##u" "##g", 5), ("p" "##u" "##n", 12), ("b" "##u" "##n", 4), ("hu" "##gs", 5)
-```
-
-Apoi, următorul scor cu cel mai bun rezultat este împărțit de `("hu", "##g")` și `("hu", "##gs")` (cu 1/15, comparativ cu 1/21 pentru toate celelalte perechi), astfel încât prima pereche cu cel mai mare scor este merged
-
-```
-Vocabulary: ["b", "h", "p", "##g", "##n", "##s", "##u", "##gs", "hu", "hug"]
-Corpus: ("hug", 10), ("p" "##u" "##g", 5), ("p" "##u" "##n", 12), ("b" "##u" "##n", 4), ("hu" "##gs", 5)
-```
-
-și continuăm astfel până când ajungem la dimensiunea dorită a vocabularului.
-
-<Tip>
-
-✏️ **Acum e rândul tău!** Care va fi următoarea regulă de merge?
-
-</Tip>
-
-## Algoritm de tokenizare[[tokenization-algorithm]]
-
-Tokenizarea diferă în WordPiece și BPE prin faptul că WordPiece salvează doar vocabularul final, nu și regulile de merge învățate. Pornind de la cuvântul de tokenizat, WordPiece găsește cel mai lung subcuvânt care se află în vocabular, apoi îl împarte. De exemplu, dacă folosim vocabularul învățat în exemplul de mai sus, pentru cuvântul `"hugs"` cel mai lung subcuvânt de la început care se află în vocabular este `"hug"`, așa că împărțim acolo și obținem `["hug", "##s"]`. Apoi continuăm cu `"##s"`, care se află în vocabular, deci tokenizarea lui `"hugs"` este `["hug", "##s"]`.
-
-Cu BPE, am fi aplicat mergeurile învățate în ordine și am fi tokenizat acest lucru ca `["hu", "##gs"]`, deci encodingul este diferit.
-
-Ca un alt exemplu, să vedem cum ar fi tokenizat cuvântul `"bugs"`. `"b"` este cel mai lung subcuvânt care începe de la începutul cuvântului care se află în vocabular, așa că îl împărțim acolo și obținem `["b", "##ugs"]`. Apoi, `"##u"` este cel mai lung subcuvânt care începe de la începutul cuvântului `"##ugs"` care se află în vocabular, deci îl separăm și obținem `["b", "##u, "##gs"]`. În cele din urmă, `"##gs"` se află în vocabular, deci această ultimă listă este tokenizarea lui `"bugs"`.
-
-Atunci când tokenizarea ajunge într-un stadiu în care nu este posibilă găsirea unui subcuvânt în vocabular, întregul cuvânt este tokenizat ca necunoscut - astfel, de exemplu, `"mug"` ar fi tokenizat ca `["[UNK]"]`, la fel ca `"bum"` (chiar dacă putem începe cu `"b"` și `"##u"`, `"##m"` nu face parte din vocabular, iar tokenizarea rezultată va fi `["[UNK]"]`, nu `["b", "##u", "[UNK]"]`). Aceasta este o altă diferență față de BPE, care ar clasifica doar caracterele individuale care nu se află în vocabular ca necunoscute.
-
-<Tip>
-
-✏️ **Acum e rândul tău!** Cum va fi tokenizat cuvântul `"pugs"`?
-
-</Tip>
-
-## Implementând WordPiece[[implementing-wordpiece]]
-
-Acum să aruncăm o privire la o implementare a algoritmului WordPiece. La fel ca în cazul BPE, acest lucru este doar pedagogic și nu veți putea să îl utilizați pe un corpus mare.
-
-Vom utiliza același corpus ca în exemplul BPE:
-
-```python
-corpus = [
-    "This is the Hugging Face Course.",
-    "This chapter is about tokenization.",
-    "This section shows several tokenizer algorithms.",
-    "Hopefully, you will be able to understand how they are trained and generate tokens.",
-]
-```
-
-În primul rând, trebuie să pre-tokenizăm corpusul în cuvinte. Deoarece replicăm un tokenizator WordPiece (precum BERT), vom utiliza tokenizatorul `bert-base-cased` pentru pre-tokenizare:
-
-```python
-from transformers import AutoTokenizer
-
-tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
-```
-
-Apoi, calculăm frecvențele fiecărui cuvânt din corpus la fel ca în cazul pre-tokenizării:
-
-```python
-from collections import defaultdict
-
-word_freqs = defaultdict(int)
-for text in corpus:
-    words_with_offsets = tokenizer.backend_tokenizer.pre_tokenizer.pre_tokenize_str(text)
-    new_words = [word for word, offset in words_with_offsets]
-    for word in new_words:
-        word_freqs[word] += 1
-
-word_freqs
-```
-
-```python out
-defaultdict(
-    int, {'This': 3, 'is': 2, 'the': 1, 'Hugging': 1, 'Face': 1, 'Course': 1, '.': 4, 'chapter': 1, 'about': 1,
-    'tokenization': 1, 'section': 1, 'shows': 1, 'several': 1, 'tokenizer': 1, 'algorithms': 1, 'Hopefully': 1,
-    ',': 1, 'you': 1, 'will': 1, 'be': 1, 'able': 1, 'to': 1, 'understand': 1, 'how': 1, 'they': 1, 'are': 1,
-    'trained': 1, 'and': 1, 'generate': 1, 'tokens': 1})
-```
-
-După cum am văzut mai devreme, alfabetul este setul unic compus din toate primele litere ale cuvintelor și toate celelalte litere care apar în cuvintele cu prefixul `##`:
-
-```python
-alphabet = []
-for word in word_freqs.keys():
-    if word[0] not in alphabet:
-        alphabet.append(word[0])
-    for letter in word[1:]:
-        if f"##{letter}" not in alphabet:
-            alphabet.append(f"##{letter}")
-
-alphabet.sort()
-alphabet
-
-print(alphabet)
-```
-
-```python out
-['##a', '##b', '##c', '##d', '##e', '##f', '##g', '##h', '##i', '##k', '##l', '##m', '##n', '##o', '##p', '##r', '##s',
- '##t', '##u', '##v', '##w', '##y', '##z', ',', '.', 'C', 'F', 'H', 'T', 'a', 'b', 'c', 'g', 'h', 'i', 's', 't', 'u',
- 'w', 'y']
-```
-
-De asemenea, adăugăm simbolurile speciale utilizate de model la începutul vocabularului respectiv. În cazul BERT, este vorba de lista `["[PAD]", "[UNK]", "[CLS]", "[SEP]", "[MASK]"]``:
-
-```python
-vocab = ["[PAD]", "[UNK]", "[CLS]", "[SEP]", "[MASK]"] + alphabet.copy()
-```
-
-Apoi trebuie să împărțim fiecare cuvânt, cu toate literele care nu sunt primele cu prefixul `##`:
-
-```python
-splits = {
-    word: [c if i == 0 else f"##{c}" for i, c in enumerate(word)]
-    for word in word_freqs.keys()
-}
-```
-
-Acum că suntem pregătiți pentru antrenare, să scriem o funcție care calculează scorul fiecărei perechi. Va trebui să folosim această funcție la fiecare etapă a antrenării:
-
-```python
-def compute_pair_scores(splits):
-    letter_freqs = defaultdict(int)
-    pair_freqs = defaultdict(int)
-    for word, freq in word_freqs.items():
-        split = splits[word]
-        if len(split) == 1:
-            letter_freqs[split[0]] += freq
-            continue
-        for i in range(len(split) - 1):
-            pair = (split[i], split[i + 1])
-            letter_freqs[split[i]] += freq
-            pair_freqs[pair] += freq
-        letter_freqs[split[-1]] += freq
-
-    scores = {
-        pair: freq / (letter_freqs[pair[0]] * letter_freqs[pair[1]])
-        for pair, freq in pair_freqs.items()
-    }
-    return scores
-```
-
-Să aruncăm o privire la o parte din acest dicționar după separările inițiale:
-
-```python
-pair_scores = compute_pair_scores(splits)
-for i, key in enumerate(pair_scores.keys()):
-    print(f"{key}: {pair_scores[key]}")
-    if i >= 5:
-        break
-```
-
-```python out
-('T', '##h'): 0.125
-('##h', '##i'): 0.03409090909090909
-('##i', '##s'): 0.02727272727272727
-('i', '##s'): 0.1
-('t', '##h'): 0.03571428571428571
-('##h', '##e'): 0.011904761904761904
-```
-
-Acum, pentru a găsi perechea cu cel mai bun scor este nevoie doar de un loop rapid:
-
-```python
-best_pair = ""
-max_score = None
-for pair, score in pair_scores.items():
-    if max_score is None or max_score < score:
-        best_pair = pair
-        max_score = score
-
-print(best_pair, max_score)
-```
-
-```python out
-('a', '##b') 0.2
-```
-
-Așadar, primul merge de învățat este `('a', '##b') -> 'ab'`, iar noi adăugăm `'ab'` la vocabular:
-
-```python
-vocab.append("ab")
-```
-
-Pentru a continua, trebuie să aplicăm aceast merge în dicționarul nostru `splits`. Să scriem o altă funcție pentru acest lucru:
-
-```python
-def merge_pair(a, b, splits):
-    for word in word_freqs:
-        split = splits[word]
-        if len(split) == 1:
-            continue
-        i = 0
-        while i < len(split) - 1:
-            if split[i] == a and split[i + 1] == b:
-                merge = a + b[2:] if b.startswith("##") else a + b
-                split = split[:i] + [merge] + split[i + 2 :]
-            else:
-                i += 1
-        splits[word] = split
-    return splits
-```
-
-Și putem arunca o privire la rezultatul primului merge:
-
-```py
-splits = merge_pair("a", "##b", splits)
-splits["about"]
-```
-
-```python out
-['ab', '##o', '##u', '##t']
-```
-
-Acum avem tot ce ne trebuie pentru a face bucle până când vom învăța toate merge-urile dorite. Să ne propunem un vocabular de mărimea 70:
-
-```python
-vocab_size = 70
-while len(vocab) < vocab_size:
-    scores = compute_pair_scores(splits)
-    best_pair, max_score = "", None
-    for pair, score in scores.items():
-        if max_score is None or max_score < score:
-            best_pair = pair
-            max_score = score
-    splits = merge_pair(*best_pair, splits)
-    new_token = (
-        best_pair[0] + best_pair[1][2:]
-        if best_pair[1].startswith("##")
-        else best_pair[0] + best_pair[1]
-    )
-    vocab.append(new_token)
-```
-
-Ne putem uita apoi la vocabularul generat:
-
-```py
-print(vocab)
-```
-
-```python out
-['[PAD]', '[UNK]', '[CLS]', '[SEP]', '[MASK]', '##a', '##b', '##c', '##d', '##e', '##f', '##g', '##h', '##i', '##k',
- '##l', '##m', '##n', '##o', '##p', '##r', '##s', '##t', '##u', '##v', '##w', '##y', '##z', ',', '.', 'C', 'F', 'H',
- 'T', 'a', 'b', 'c', 'g', 'h', 'i', 's', 't', 'u', 'w', 'y', 'ab', '##fu', 'Fa', 'Fac', '##ct', '##ful', '##full', '##fully',
- 'Th', 'ch', '##hm', 'cha', 'chap', 'chapt', '##thm', 'Hu', 'Hug', 'Hugg', 'sh', 'th', 'is', '##thms', '##za', '##zat',
- '##ut']
-```
-
-După cum putem vedea, în comparație cu BPE, acest tokenizator învață părțile din cuvinte ca tokenuri puțin mai repede.
-
-<Tip>
-
-💡 Folosind `train_new_from_iterator()` pe același corpus nu va rezulta exact același vocabular. Acest lucru se datorează faptului că biblioteca 🤗 Tokenizers nu implementează WordPiece pentru antrenare (deoarece nu suntem complet siguri cum funcționează intern), ci utilizează BPE în schimb.
-
-</Tip>
-
-Pentru a tokeniza un text nou, îl pre-tokenizăm, îl împărțim, apoi aplicăm algoritmul de tokenizare pe fiecare cuvânt. Adică, căutăm cel mai mare subcuvânt începând de la începutul primului cuvânt și îl împărțim, apoi repetăm procesul pentru a doua parte și așa mai departe pentru restul acelui cuvânt și pentru următoarele cuvinte din text:
-
-```python
-def encode_word(word):
-    tokens = []
-    while len(word) > 0:
-        i = len(word)
-        while i > 0 and word[:i] not in vocab:
-            i -= 1
-        if i == 0:
-            return ["[UNK]"]
-        tokens.append(word[:i])
-        word = word[i:]
-        if len(word) > 0:
-            word = f"##{word}"
-    return tokens
-```
-
-Haideți să-l testăm pe un cuvânt care se află în vocabular și pe altul care nu se află:
-
-
-```python
-print(encode_word("Hugging"))
-print(encode_word("HOgging"))
-```
-
-```python out
-['Hugg', '##i', '##n', '##g']
-['[UNK]']
-```
-
-Acum, scriem o funcție care tokenizează un text:
-
-```python
-def tokenize(text):
-    pre_tokenize_result = tokenizer._tokenizer.pre_tokenizer.pre_tokenize_str(text)
-    pre_tokenized_text = [word for word, offset in pre_tokenize_result]
-    encoded_words = [encode_word(word) for word in pre_tokenized_text]
-    return sum(encoded_words, [])
-```
-
-Îl putem încerca pe orice text:
-
-```python
-tokenize("This is the Hugging Face course!")
-```
-
-```python out
-['Th', '##i', '##s', 'is', 'th', '##e', 'Hugg', '##i', '##n', '##g', 'Fac', '##e', 'c', '##o', '##u', '##r', '##s',
- '##e', '[UNK]']
-```
-
-Asta e tot pentru algoritmul WordPiece! Acum să aruncăm o privire la Unigram.
diff --git a/chapters/ro/chapter 6/7.mdx b/chapters/ro/chapter 6/7.mdx
deleted file mode 100644
index 14744a854..000000000
--- a/chapters/ro/chapter 6/7.mdx	
+++ /dev/null
@@ -1,381 +0,0 @@
-# Tokenizarea Unigram[[unigram-tokenization]]
-
-<CourseFloatingBanner chapter={6}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter6/section7.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter6/section7.ipynb"},
-]} />
-
-Algoritmul Unigram este adesea utilizat în SentencePiece, care este algoritmul de tokenizare utilizat de modele precum AlBERT, T5, mBART, Big Bird și XLNet.
-
-<Youtube id="TGZfZVuF9Yc"/>
-
-<Tip>
-
-💡 Această secțiune acoperă Unigram în profunzime, mergând până la prezentarea unei implementări complete. Puteți sări la sfârșit dacă doriți doar o prezentare generală a algoritmului de tokenizare.
-
-</Tip>
-
-## Algoritm de antrenare[[training-algorithm]]
-
-În comparație cu BPE și WordPiece, Unigram lucrează în cealaltă direcție: pornește de la un vocabular mare și elimină tokeni din acesta până când ajunge la dimensiunea dorită. Există mai multe opțiuni pentru a construi acel vocabular de bază: putem lua, de exemplu, cele mai comune substrings din cuvintele pre-tokenizate sau putem aplica BPE pe corpusul inițial cu o dimensiune mare a vocabularului.
-
-La fiecare etapă a antrenării, algoritmul Unigram calculează o pierdere pe corpus oferit, având în vedere vocabularul curent. Apoi, pentru fiecare simbol din vocabular, algoritmul calculează cu cât ar crește pierderea globală dacă simbolul ar fi eliminat și caută simbolurile care ar crește cel mai puțin pierderea. Aceste simboluri au cel mai redus efect asupra pierderii globale din corpus, deci, într-un fel, sunt "mai puțin necesare" și sunt cei mai buni candidați pentru eliminare.
-
-Aceasta este o operațiune foarte costisitoare, așa că nu eliminăm doar simbolul asociat cu cea mai mică creștere a pierderii, ci procentul \\(p\\) (\\(p\\) fiind un hyperparameter pe care îl poți controla, de obicei 10 sau 20) din simbolurile asociate cu cea mai mică creștere a pierderilor. Acest proces este se repetă până când vocabularul atinge dimensiunea dorită.
-
-Rețineți că nu eliminăm niciodată caracterele de bază, pentru a ne asigura că orice cuvânt poate fi tokenizat.
-
-Acum, acest lucru este încă puțin vag: partea principală a algoritmului este de a calcula o pierdere asupra corpusului și de a vedea cum se schimbă atunci când eliminăm unele tokenuri din vocabular, dar nu am explicat încă cum să facem acest lucru. Acest pas se bazează pe algoritmul de tokenizare al unui model Unigram, așa că îl vom analiza în continuare.
-
-Vom reutiliza corpusul din exemplele anterioare:
-
-```
-("hug", 10), ("pug", 5), ("pun", 12), ("bun", 4), ("hugs", 5)
-```
-
-iar pentru acest exemplu, vom lua toate substringurile stricte pentru vocabularul inițial:
-
-```
-["h", "u", "g", "hu", "ug", "p", "pu", "n", "un", "b", "bu", "s", "hug", "gs", "ugs"]
-```
-
-## Algoritm de tokenizare[[tokenization-algorithm]]
-
-Un model Unigram este un tip de model lingvistic care consideră că fiecare token este independent de tokenii anteriori. Este cel mai simplu model lingvistic, în sensul că probabilitatea simbolului X având în vedere contextul anterior este doar probabilitatea simbolului X. Astfel, dacă am utiliza un model lingvistic Unigram pentru a genera text, am prezice întotdeauna simbolul cel mai frecvent.
-
-Probabilitatea unui token dat este frecvența sa (numărul de ori în care îl găsim) în corpusul original, împărțită la suma tuturor aparițiilor tuturor tokenilor din vocabular (pentru a ne asigura că probabilitățile sunt egale cu 1). De exemplu, `"ug"` este prezent în `"hug"`, `"pug"`, și `"hugs"`, deci are o frecvență de 20 în corpus-ul nostru.
-
-Iată frecvențele tuturor subcuvintelor posibile din vocabular:
-
-```
-("h", 15) ("u", 36) ("g", 20) ("hu", 15) ("ug", 20) ("p", 17) ("pu", 17) ("n", 16)
-("un", 16) ("b", 4) ("bu", 4) ("s", 5) ("hug", 15) ("gs", 5) ("ugs", 5)
-```
-
-Astfel, suma tuturor frecvențelor este 210, iar probabilitatea subcuvântului `"ug"` este 20/210.
-
-<Tip>
-
-✏️ **Acum este rândul tău!** Scrie codul pentru a calcula frecvențele de mai sus și verifică de două ori dacă rezultatele afișate sunt corecte, precum și suma totală.
-
-</Tip>
-
-Acum, pentru a tokeniza un cuvânt dat, ne uităm la toate segmentările posibile în tokeni și calculăm probabilitatea fiecăruia în conformitate cu modelul Unigram. Deoarece toate token-urile sunt considerate independente, această probabilitate este doar produsul probabilității fiecărui token. De exemplu, tokenizarea `["p", "u", "g"]` a lui `"pug"` are probabilitatea:
-
-$$P([``p", ``u", ``g"]) = P(``p") \times P(``u") \times P(``g") = \frac{5}{210} \times \frac{36}{210} \times \frac{20}{210} = 0.000389$$
-
-Comparativ, tokenizarea `["pu", "g"]` are probabilitatea:
-
-$$P([``pu", ``g"]) = P(``pu") \times P(``g") = \frac{5}{210} \times \frac{20}{210} = 0.0022676$$
-
-astfel încât una este mult mai probabilă decât alta. În general, tokenizările cu cei mai puțini tokeni posibili vor avea cea mai mare probabilitate (din cauza acelei împărțiri la 210 repetată pentru fiecare token), ceea ce corespunde cu ceea ce dorim intuitiv: să împărțim un cuvânt în cel mai mic număr de tokenuri posibil.
-
-Tokenizarea unui cuvânt cu modelul Unigram este atunci tokenizarea cu cea mai mare probabilitate. În exemplul `"pug"`, iată probabilitățile pe care le-am obține pentru fiecare segmentare posibilă:
-
-```
-["p", "u", "g"] : 0.000389
-["p", "ug"] : 0.0022676
-["pu", "g"] : 0.0022676
-```
-
-Astfel, `"pug"` ar fi tokenizat ca `["p", "ug"]` sau `["pu", "g"]`, în funcție de care dintre aceste segmentări este întâlnită prima (rețineți că într-un corpus mai mare, cazurile de egalitate ca acesta vor fi rare).
-
-În acest caz, a fost ușor să găsim toate segmentările posibile și să le calculăm probabilitățile, dar în general va fi puțin mai greu. Există un algoritm clasic utilizat pentru acest lucru, numit *algoritmul Viterbi*. În esență, putem construi un grafic pentru a detecta segmentările posibile ale unui cuvânt dat, spunând că există o ramură de la caracterul _a_ la caracterul _b_ dacă subcuvântul de la _a_ la _b_ se află în vocabular, și atribuind ramurii respective probabilitatea subcuvântului.
-
-Pentru a găsi calea din acest grafic care va avea cel mai bun scor, algoritmul Viterbi determină, pentru fiecare poziție din cuvânt, segmentarea cu cel mai bun scor care se termină la poziția respectivă. Deoarece mergem de la început la sfârșit, cel mai bun scor poate fi găsit prin parcurgerea în buclă a tuturor subcuvintelor care se termină la poziția curentă și apoi folosind cel mai bun scor de tokenizare de la poziția la care începe acest subcuvânt. Apoi, trebuie doar să derulăm calea parcursă pentru a ajunge la sfârșit.
-
-Să aruncăm o privire la un exemplu folosind vocabularul nostru și cuvântul `"unhug"`. Pentru fiecare poziție, subcuvintele cu cele mai bune scoruri care se termină acolo sunt următoarele:
-
-```
-Character 0 (u): "u" (score 0.171429)
-Character 1 (n): "un" (score 0.076191)
-Character 2 (h): "un" "h" (score 0.005442)
-Character 3 (u): "un" "hu" (score 0.005442)
-Character 4 (g): "un" "hug" (score 0.005442)
-```
-
-Astfel, `"unhug"` ar fi tokenizat ca `["un", "hug"]`.
-
-<Tip>
-
-✏️ **Acum e rândul tău!** Determinați tokenizarea cuvântului `"huggun"` și scorul acestuia.
-
-</Tip>
-
-## Înapoi la antrenare[[back-to-training]]
-
-Acum că am văzut cum funcționează tokenizarea, putem analiza mai în profunzime pierderea utilizată în timpul antrenării. În orice etapă dată, această pierdere este calculată prin tokenizarea fiecărui cuvânt din corpus, utilizând vocabularul curent și modelul Unigram determinat de frecvențele fiecărui token din corpus (după cum am văzut mai devreme).
-
-Fiecare cuvânt din corpus are un scor, iar pierderea este negative log likelihood a acestor scoruri - adică suma pentru toate cuvintele din corpus a tuturor `-log(P(word))`.
-
-Să ne întoarcem la exemplul nostru cu următorul corpus:
-
-```
-("hug", 10), ("pug", 5), ("pun", 12), ("bun", 4), ("hugs", 5)
-```
-
-Tokenizarea fiecărui cuvânt cu scorurile lor respective este:
-
-```
-"hug": ["hug"] (score 0.071428)
-"pug": ["pu", "g"] (score 0.007710)
-"pun": ["pu", "n"] (score 0.006168)
-"bun": ["bu", "n"] (score 0.001451)
-"hugs": ["hug", "s"] (score 0.001701)
-```
-
-Deci, pierderea este:
-
-```
-10 * (-log(0.071428)) + 5 * (-log(0.007710)) + 12 * (-log(0.006168)) + 4 * (-log(0.001451)) + 5 * (-log(0.001701)) = 169.8
-```
-
-Acum trebuie să calculăm modul în care eliminarea fiecărui token afectează pierderea. Acest lucru este destul de plictisitor, așa că îl vom face doar pentru doi tokeni aici și vom păstra întregul proces pentru atunci când vom avea cod care să ne ajute. În acest caz (foarte) special, aveam două tokenizări echivalente ale tuturor cuvintelor: după cum am văzut mai devreme, de exemplu, `"pug"` ar putea fi tokenizat `["p", "ug"]` cu același scor. Astfel, eliminarea simbolului `"pu"` din vocabular va produce exact aceeași pierdere.
-
-Pe de altă parte, eliminarea lui `"hug"` va agrava pierderea, deoarece tokenizarea lui `"hug"` și `"hugs"` va deveni:
-
-```
-"hug": ["hu", "g"] (score 0.006802)
-"hugs": ["hu", "gs"] (score 0.001701)
-```
-
-Aceste modificări vor determina creșterea pierderii cu:
-
-```
-- 10 * (-log(0.071428)) + 10 * (-log(0.006802)) = 23.5
-```
-
-Prin urmare, tokenul `"pu"` va fi probabil eliminat din vocabular, dar nu și `"hug"`.
-
-## Implementarea Unigram[[implementarea-unigram]]
-
-Acum să implementăm în cod tot ceea ce am văzut până acum. Ca și în cazul BPE și WordPiece, aceasta nu este o implementare eficientă a algoritmului Unigram (dimpotrivă), dar ar trebui să vă ajute să-l înțelegeți puțin mai bine.
-
-Vom folosi ca exemplu același corpus ca și până acum:
-
-```python
-corpus = [
-    "This is the Hugging Face Course.",
-    "This chapter is about tokenization.",
-    "This section shows several tokenizer algorithms.",
-    "Hopefully, you will be able to understand how they are trained and generate tokens.",
-]
-```
-
-De data aceasta, vom folosi `xlnet-base-cased` ca modelul nostru:
-
-```python
-from transformers import AutoTokenizer
-
-tokenizer = AutoTokenizer.from_pretrained("xlnet-base-cased")
-```
-
-Ca și pentru BPE și WordPiece, începem prin a număra numărul de apariții ale fiecărui cuvânt în corpus:
-
-```python
-from collections import defaultdict
-
-word_freqs = defaultdict(int)
-for text in corpus:
-    words_with_offsets = tokenizer.backend_tokenizer.pre_tokenizer.pre_tokenize_str(text)
-    new_words = [word for word, offset in words_with_offsets]
-    for word in new_words:
-        word_freqs[word] += 1
-
-word_freqs
-```
-
-Apoi, trebuie să inițializăm vocabularul nostru la ceva mai mare decât dimensiunea vocabularului pe care o vom dori la final. Trebuie să includem toate caracterele de bază (altfel nu vom putea tokeniza fiecare cuvânt), dar pentru substringurile mai mari le vom păstra doar pe cele mai comune, așa că le vom sorta după frecvență:
-
-```python
-char_freqs = defaultdict(int)
-subwords_freqs = defaultdict(int)
-for word, freq in word_freqs.items():
-    for i in range(len(word)):
-        char_freqs[word[i]] += freq
-        # Loop through the subwords of length at least 2
-        for j in range(i + 2, len(word) + 1):
-            subwords_freqs[word[i:j]] += freq
-
-# Sortarea subcuvintelor după frecvență
-sorted_subwords = sorted(subwords_freqs.items(), key=lambda x: x[1], reverse=True)
-sorted_subwords[:10]
-```
-
-```python out
-[('▁t', 7), ('is', 5), ('er', 5), ('▁a', 5), ('▁to', 4), ('to', 4), ('en', 4), ('▁T', 3), ('▁Th', 3), ('▁Thi', 3)]
-```
-
-Grupăm caracterele cu cele mai bune subcuvinte pentru a ajunge la un vocabular inițial de dimensiunea 300:
-
-```python
-token_freqs = list(char_freqs.items()) + sorted_subwords[: 300 - len(char_freqs)]
-token_freqs = {token: freq for token, freq in token_freqs}
-```
-
-<Tip>
-
-💡 SentencePiece utilizează un algoritm mai eficient numit Enhanced Suffix Array (ESA) pentru a crea vocabularul inițial.
-
-</Tip>
-
-În continuare, calculăm suma tuturor frecvențelor, pentru a converti frecvențele în probabilități. Pentru modelul nostru, vom stoca logaritmii probabilităților, deoarece este mai stabil din punct de vedere numeric să adăugăm logaritmi decât să multiplicăm numere mici, iar acest lucru va simplifica calcularea pierderii modelului:
-
-```python
-from math import log
-
-total_sum = sum([freq for token, freq in token_freqs.items()])
-model = {token: -log(freq / total_sum) for token, freq in token_freqs.items()}
-```
-
-Acum funcția principală este cea care tokenizează cuvintele folosind algoritmul Viterbi. După cum am văzut mai devreme, acest algoritm calculează cea mai bună segmentare a fiecărui substringur din cuvânt, pe care o vom stoca într-o variabilă numită `best_segmentations`. Vom stoca un dicționar pentru fiecare poziție din cuvânt (de la 0 la lungimea totală a acestuia), cu două chei: indicele de început al ultimului token din cea mai bună segmentare și scorul celei mai bune segmentări. Cu ajutorul indicelui de început al ultimului token, vom putea extrage segmentarea completă odată ce lista este complet populată.
-
-Popularea listei se face cu doar două bucle: bucla principală trece peste fiecare poziție de început, iar a doua bucla încearcă toate subcuvintele care încep la acea poziție de început. Dacă substringul se află în vocabular, avem o nouă segmentare a cuvântului până la acea poziție finală, pe care o comparăm cu cea din `best_segmentations`.
-
-Odată ce bucla principală este terminată, pornim de la sfârșit și sărim de la o poziție de început la alta, înregistrând tokenii pe parcurs, până când ajungem la începutul cuvântului:
-
-```python
-def encode_word(word, model):
-    best_segmentations = [{"start": 0, "score": 1}] + [
-        {"start": None, "score": None} for _ in range(len(word))
-    ]
-    for start_idx in range(len(word)):
-        # This should be properly filled by the previous steps of the loop
-        best_score_at_start = best_segmentations[start_idx]["score"]
-        for end_idx in range(start_idx + 1, len(word) + 1):
-            token = word[start_idx:end_idx]
-            if token in model and best_score_at_start is not None:
-                score = model[token] + best_score_at_start
-                # If we have found a better segmentation ending at end_idx, we update
-                if (
-                    best_segmentations[end_idx]["score"] is None
-                    or best_segmentations[end_idx]["score"] > score
-                ):
-                    best_segmentations[end_idx] = {"start": start_idx, "score": score}
-
-    segmentation = best_segmentations[-1]
-    if segmentation["score"] is None:
-        # We did not find a tokenization of the word -> unknown
-        return ["<unk>"], None
-
-    score = segmentation["score"]
-    start = segmentation["start"]
-    end = len(word)
-    tokens = []
-    while start != 0:
-        tokens.insert(0, word[start:end])
-        next_start = best_segmentations[start]["start"]
-        end = start
-        start = next_start
-    tokens.insert(0, word[start:end])
-    return tokens, score
-```
-
-Putem încerca deja modelul nostru inițial pe câteva cuvinte:
-
-```python
-print(encode_word("Hopefully", model))
-print(encode_word("This", model))
-```
-
-```python out
-(['H', 'o', 'p', 'e', 'f', 'u', 'll', 'y'], 41.5157494601402)
-(['This'], 6.288267030694535)
-```
-
-Acum este ușor de calculat pierderea modelului pe corpus!
-
-```python
-def compute_loss(model):
-    loss = 0
-    for word, freq in word_freqs.items():
-        _, word_loss = encode_word(word, model)
-        loss += freq * word_loss
-    return loss
-```
-
-Putem verifica dacă funcționează pe modelul pe care îl avem:
-
-```python
-compute_loss(model)
-```
-
-```python out
-413.10377642940875
-```
-
-Nici calcularea scorurilor pentru fiecare token nu este foarte dificilă; trebuie doar să calculăm pierderea pentru modelele obținute prin ștergerea fiecărui tokeb:
-
-```python
-import copy
-
-
-def compute_scores(model):
-    scores = {}
-    model_loss = compute_loss(model)
-    for token, score in model.items():
-        # We always keep tokens of length 1
-        if len(token) == 1:
-            continue
-        model_without_token = copy.deepcopy(model)
-        _ = model_without_token.pop(token)
-        scores[token] = compute_loss(model_without_token) - model_loss
-    return scores
-```
-
-Îl putem încerca pe un token dat:
-
-```python
-scores = compute_scores(model)
-print(scores["ll"])
-print(scores["his"])
-```
-
-Deoarece `"ll"` este folosit în tokenizarea lui `"Hopefully"`, iar eliminarea lui ne va face, probabil, să folosim tokenul `"l"` de două ori în schimb, ne așteptăm să aibă o pierdere pozitivă. `"his"` este folosit doar în interiorul cuvântului `"This"`, care este tokenizat ca el însuși, deci ne așteptăm să aibă o pierdere zero. Iată rezultatele:
-
-```python out
-6.376412403623874
-0.0
-```
-
-<Tip>
-
-💡 Această abordare este foarte ineficientă, astfel încât SentencePiece utilizează o aproximare a pierderii modelului fără simbolul X: în loc să înceapă de la zero, înlocuiește simbolul X cu segmentarea sa în vocabularul rămas. În acest fel, toate scorurile pot fi calculate odată, în același timp cu pierderea modelului.
-
-</Tip>
-
-Cu toate acestea la locul lor, ultimul lucru pe care trebuie să îl facem este să adăugăm la vocabular tokeni speciali utilizate de model, apoi să facem o buclă până când am eliminat suficienți tokeni din vocabular pentru a ajunge la dimensiunea dorită:
-
-```python
-percent_to_remove = 0.1
-while len(model) > 100:
-    scores = compute_scores(model)
-    sorted_scores = sorted(scores.items(), key=lambda x: x[1])
-    # Remove percent_to_remove tokens with the lowest scores.
-    for i in range(int(len(model) * percent_to_remove)):
-        _ = token_freqs.pop(sorted_scores[i][0])
-
-    total_sum = sum([freq for token, freq in token_freqs.items()])
-    model = {token: -log(freq / total_sum) for token, freq in token_freqs.items()}
-```
-
-Apoi, pentru a tokeniza un text, trebuie doar să aplicăm pre-tokenizarea și apoi să folosim funcția `encode_word()`:
-
-```python
-def tokenize(text, model):
-    words_with_offsets = tokenizer.backend_tokenizer.pre_tokenizer.pre_tokenize_str(text)
-    pre_tokenized_text = [word for word, offset in words_with_offsets]
-    encoded_words = [encode_word(word, model)[0] for word in pre_tokenized_text]
-    return sum(encoded_words, [])
-
-
-tokenize("This is the Hugging Face course.", model)
-```
-
-```python out
-['▁This', '▁is', '▁the', '▁Hugging', '▁Face', '▁', 'c', 'ou', 'r', 's', 'e', '.']
-```
-
-Asta e tot pentru Unigram! Sperăm că până acum vă simțiți ca un expert în toate lucrurile legate de tokenizer. În secțiunea următoare, vom aprofunda elementele de bază ale bibliotecii 🤗 Tokenizers și vă vom arăta cum le puteți utiliza pentru a vă construi propriul tokenizer.
diff --git a/chapters/ro/chapter 6/8.mdx b/chapters/ro/chapter 6/8.mdx
deleted file mode 100644
index 4e41c84cb..000000000
--- a/chapters/ro/chapter 6/8.mdx	
+++ /dev/null
@@ -1,566 +0,0 @@
-# Construirea unui tokenizer, bloc cu bloc[[building-a-tokenizer-block-by-block]]
-
-<CourseFloatingBanner chapter={6}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter6/section8.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter6/section8.ipynb"},
-]} />
-
-După cum am văzut în secțiunile anterioare, tokenizarea cuprinde mai multe etape:
-
-- Normalizare (orice curățare a textului care este considerată necesară, cum ar fi eliminarea spațiilor sau a accentelor, normalizarea Unicode etc.)
-- Pre-tokenizarea (împărțirea inputului în cuvinte)
-- Rularea inputului prin model (utilizarea cuvintelor pre-tokenizate pentru a produce o secvență de tokeni)
-- Post-procesare (adăugarea tokenilor speciali ale tokenizerului, generarea attention maskului și a ID-urilor de tip token)
-
-Ca un reminder, iată o altă perspectivă asupra procesului general:
-
-<div class="flex justify-center">
-<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter6/tokenization_pipeline.svg" alt="The tokenization pipeline.">
-<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter6/tokenization_pipeline-dark.svg" alt="The tokenization pipeline.">
-</div>
-
-Biblioteca 🤗 Tokenizers a fost construită pentru a oferi mai multe opțiuni pentru fiecare dintre acești pași, pe care le puteți amesteca și combina împreună. În această secțiune vom vedea cum putem construi un tokenizer de la zero, spre deosebire de antrenarea unui tokenizer nou dintr-unul vechi, așa cum am făcut în [secțiunea 2](/course/chapter6/2). Veți putea apoi să construiți orice fel de tokenizer la care vă puteți gândi!
-
-<Youtube id="MR8tZm5ViWU"/>
-
-Mai exact, biblioteca este construită în jurul unei clase centrale `Tokenizer` cu building grupate în submodule:
-
-- `normalizers` conține toate tipurile posibile de `Normalizer` pe care le puteți folosi (lista completă [aici](https://huggingface.co/docs/tokenizers/api/normalizers)).
-- `pre_tokenizers` coține toate tipurile de `PreTokenizer` pe care le poți folosi(lista completă [aici](https://huggingface.co/docs/tokenizers/api/pre-tokenizers)).
-- `models` conține diferitele tipuri de `Model` pe care le puteți folosi, precum `BPE`, `WordPiece` și `Unigram` (lista completă [aici](https://huggingface.co/docs/tokenizers/api/models)).
-- `trainers` conține toate tipurile diferite de `Trainer` pe care le puteți folosi pentru a vă antrena modelul pe un corpus (unul pentru fiecare tip de model; lista completă [aici](https://huggingface.co/docs/tokenizers/api/trainers)).
-- `post_processors` conține diferitele tipuri de `PostProcessor` pe care le puteți utiliza (lista completă [aici](https://huggingface.co/docs/tokenizers/api/post-processors)).
-- `decoders` conține diferitele tipuri de `Decoder` pe care le puteți utiliza pentru a decoda rezultatele tokenizării (lista completă [aici](https://huggingface.co/docs/tokenizers/components#decoders)).
-
-Puteți găsi întreaga listă de blocuri [aici](https://huggingface.co/docs/tokenizers/components).
-
-## Obținerea unui corpus[[acquiring-a-corpus]]
-
-Pentru a antrena noul nostru tokenizer, vom utiliza un corpus mic de text (astfel încât exemplele să ruleze rapid). Pașii pentru obținerea corpusului sunt similari cu cei pe care i-am urmat la [începutul acestui capitol](/course/chapter6/2), dar de data aceasta vom utiliza datasetul [WikiText-2](https://huggingface.co/datasets/wikitext):
-
-```python
-from datasets import load_dataset
-
-dataset = load_dataset("wikitext", name="wikitext-2-raw-v1", split="train")
-
-
-def get_training_corpus():
-    for i in range(0, len(dataset), 1000):
-        yield dataset[i : i + 1000]["text"]
-```
-
-Funcția `get_training_corpus()` este un generator care va produce batch-uri de 1 000 de texte, pe care le vom utiliza pentru a antrena tokenizerul.
-
-🤗 Tokenizers pot fi, de asemenea, antrenate direct pe fișiere text. Iată cum putem genera un fișier text care să conțină toate textele/inputurile din WikiText-2 pe care le putem utiliza local:
-
-```python
-with open("wikitext-2.txt", "w", encoding="utf-8") as f:
-    for i in range(len(dataset)):
-        f.write(dataset[i]["text"] + "\n")
-```
-
-În continuare vă vom arăta cum să vă construiți propriile tokenizere BERT, GPT-2 și XLNet, bloc cu bloc. Acest lucru ne va oferi un exemplu pentru fiecare dintre cei trei algoritmi principali de tokenizare: WordPiece, BPE și Unigram. Să începem cu BERT!
-
-## Construirea unui tokenizator WordPiece de la zero[[building-a-wordpiece-tokenizer-from-scratch]]
-
-Pentru a construi un tokenizer cu biblioteca 🤗 Tokenizers, începem prin a inițializa un obiect `Tokenizer` cu un `model`, apoi îi setăm atributele `normalizer`, `pre_tokenizer`, `post_processor` și `decoder` la valorile dorite.
-
-Pentru acest exemplu, vom crea un `Tokenizer` cu un model WordPiece:
-
-```python
-from tokenizers import (
-    decoders,
-    models,
-    normalizers,
-    pre_tokenizers,
-    processors,
-    trainers,
-    Tokenizer,
-)
-
-tokenizer = Tokenizer(models.WordPiece(unk_token="[UNK]"))
-```
-
-Trebuie să specificăm `unk_token` astfel încât modelul să știe ce să returneze atunci când întâlnește caractere necunoscute. Alte argumente pe care le putem seta aici includ `vocab` al modelului nostru (vom antrena modelul, deci nu este nevoie să setăm acest lucru) și `max_input_chars_per_word`, care specifică o lungime maximă pentru fiecare cuvânt (cuvintele mai lungi decât valoarea trecută vor fi divizate).
-
-Primul pas al tokenizării este normalizarea, așa că să începem cu aceasta. Deoarece BERT este utilizat pe scară largă, există un `BertNormalizer` cu opțiunile clasice pe care le putem seta pentru BERT: `lowercase` și `strip_accents`, care se explică de la sine; `clean_text` pentru a elimina toate caracterele de control și a înlocui spațiile repetate cu unul singur; și `handle_chinese_chars`, care plasează spații în jurul caracterelor chinezești. Pentru a replica tokenizerul `bert-base-uncased`, putem seta doar acest normalizator:
-
-```python
-tokenizer.normalizer = normalizers.BertNormalizer(lowercase=True)
-```
-
-În general, atunci când construiți un nou tokenizer, nu veți avea acces la un normalizator atât de util, deja implementat în biblioteca 🤗 Tokenizers - așa că să vedem cum să creăm manual normalizatorul BERT. Biblioteca oferă un normalizator `Lowercase` și un normalizator `StripAccents` și puteți compune mai multe normalizatoare folosind un `Sequence`:
-
-```python
-tokenizer.normalizer = normalizers.Sequence(
-    [normalizers.NFD(), normalizers.Lowercase(), normalizers.StripAccents()]
-)
-```
-
-De asemenea, folosim un normalizator Unicode `NFD`, deoarece în caz contrar normalizatorul `StripAccents` nu va recunoaște corect caracterele accentuate și astfel nu le va elimina.
-
-După cum am mai văzut, putem folosi metoda `normalize_str()` a `normalizer` pentru a verifica efectele pe care le are asupra unui text dat:
-
-```python
-print(tokenizer.normalizer.normalize_str("Héllò hôw are ü?"))
-```
-
-```python out
-hello how are u?
-```
-
-<Tip>
-
-**Pentru a merge mai departe** Dacă testați cele două versiuni ale normalizatorilor anteriori pe un șir care conține caracterul Unicode `u"\u0085"` veți observa cu siguranță că acești doi normalizatori nu sunt exact echivalenți.
-Pentru a nu complica prea mult versiunea cu `normalizers.Sequence` , nu am inclus înlocuirile Regex pe care `BertNormalizer` le cere atunci când argumentul `clean_text` este setat la `True` - care este comportamentul implicit. Dar nu vă faceți griji: este posibil să obțineți exact aceeași normalizare fără a utiliza utilul `BertNormalizer` prin adăugarea a două `normalizers.Replace` la secvența normalizers.
-
-
-</Tip>
-
-Urmează etapa de pre-tokenizare. Din nou, există un `BertPreTokenizer` pre-construit pe care îl putem utiliza:
-
-```python
-tokenizer.pre_tokenizer = pre_tokenizers.BertPreTokenizer()
-```
-
-Sau îl putem construi de la zero:
-
-```python
-tokenizer.pre_tokenizer = pre_tokenizers.Whitespace()
-```
-
-Rețineți că pre-tokenizatorul `Whitespace` separă spațiul și toate caracterele care nu sunt litere, cifre sau caracterul underscore, deci tehnic separă spațiul și punctuația:
-
-```python
-tokenizer.pre_tokenizer.pre_tokenize_str("Let's test my pre-tokenizer.")
-```
-
-```python out
-[('Let', (0, 3)), ("'", (3, 4)), ('s', (4, 5)), ('test', (6, 10)), ('my', (11, 13)), ('pre', (14, 17)),
- ('-', (17, 18)), ('tokenizer', (18, 27)), ('.', (27, 28))]
-```
-
-Dacă doriți să separați doar spațiile, ar trebui să utilizați în schimb pre-tokenizerul `WhitespaceSplit`:
-
-```python
-pre_tokenizer = pre_tokenizers.WhitespaceSplit()
-pre_tokenizer.pre_tokenize_str("Let's test my pre-tokenizer.")
-```
-
-```python out
-[("Let's", (0, 5)), ('test', (6, 10)), ('my', (11, 13)), ('pre-tokenizer.', (14, 28))]
-```
-
-Ca și în cazul normalizatorilor, puteți utiliza un `Sequence` pentru a compune mai mulți pre-tokenizeri:
-
-```python
-pre_tokenizer = pre_tokenizers.Sequence(
-    [pre_tokenizers.WhitespaceSplit(), pre_tokenizers.Punctuation()]
-)
-pre_tokenizer.pre_tokenize_str("Let's test my pre-tokenizer.")
-```
-
-```python out
-[('Let', (0, 3)), ("'", (3, 4)), ('s', (4, 5)), ('test', (6, 10)), ('my', (11, 13)), ('pre', (14, 17)),
- ('-', (17, 18)), ('tokenizer', (18, 27)), ('.', (27, 28))]
-```
-
-Următorul pas în pipelineul de tokenizare este rularea inputurilor prin model. Am specificat deja modelul nostru în inițializare, dar mai trebuie să îl antrenăm, ceea ce va necesita un `WordPieceTrainer`. Principalul lucru de reținut atunci când inițializați un trainer în 🤗 Tokenizers este că trebuie să îi transmiteți toți tokenii speciali pe care intenționați să îi utilizați - în caz contrar, acesta nu le va adăuga la vocabular, deoarece acestea nu se află în corpusul de antrenare:
-
-```python
-special_tokens = ["[UNK]", "[PAD]", "[CLS]", "[SEP]", "[MASK]"]
-trainer = trainers.WordPieceTrainer(vocab_size=25000, special_tokens=special_tokens)
-```
-
-Pe lângă specificarea `vocab_size` și `special_tokens`, putem seta `min_frequency` (numărul de ori în care un simbol trebuie să apară pentru a fi inclus în vocabular) sau putem schimba `continuing_subword_prefix` (dacă dorim să folosim ceva diferit de `##`).
-
-Pentru a antrena modelul nostru folosind iteratorul pe care l-am definit anterior, trebuie doar să executăm această comandă:
-
-```python
-tokenizer.train_from_iterator(get_training_corpus(), trainer=trainer)
-```
-
-De asemenea, putem utiliza fișiere text pentru a ne antrena tokenizerul, care ar arăta astfel (în prealabil, reinițializăm modelul cu un `WordPiece` gol):
-
-```python
-tokenizer.model = models.WordPiece(unk_token="[UNK]")
-tokenizer.train(["wikitext-2.txt"], trainer=trainer)
-```
-
-În ambele cazuri, putem apoi testa tokenizerul pe un text prin apelarea metodei `encode()`:
-
-```python
-encoding = tokenizer.encode("Let's test this tokenizer.")
-print(encoding.tokens)
-```
-
-```python out
-['let', "'", 's', 'test', 'this', 'tok', '##eni', '##zer', '.']
-```
-
-`encoding`-ul obținut este un `Encoding`, care conține toate rezultatele necesare ale tokenizerului în diferitele sale atribute: `ids`, `type_ids`, `tokens`, `offsets`, `attention_mask`, `special_tokens_mask`, și `overflowing`.
-
-Ultimul pas în pipelineul de tokenizare este postprocesarea. Trebuie să adăugăm tokenul `[CLS]` la început și tokenul `[SEP]` la sfârșit (sau după fiecare propoziție, dacă avem o pereche de propoziții). Vom folosi un `TemplateProcessor` pentru aceasta, dar mai întâi trebuie să cunoaștem ID-urile tokenilor `[CLS]` și `[SEP]` din vocabular:
-
-```python
-cls_token_id = tokenizer.token_to_id("[CLS]")
-sep_token_id = tokenizer.token_to_id("[SEP]")
-print(cls_token_id, sep_token_id)
-```
-
-```python out
-(2, 3)
-```
-
-Pentru a scrie templateul pentru `TemplateProcessor`, trebuie să specificăm cum să tratăm o singură propoziție și o pereche de propoziții. Pentru ambele, scriem tokeni speciali pe care dorim să îi folosim; prima (sau singura) propoziție este reprezentată de `$A`, în timp ce a doua propoziție (dacă facem encoding unei perechi) este reprezentată de `$B`. Pentru fiecare dintre acestea (tokeni speciali și propoziții), specificăm și ID-ul tipului de token corespunzător după două puncte.
-
-Modelul clasic BERT este astfel definit după cum urmează:
-
-```python
-tokenizer.post_processor = processors.TemplateProcessing(
-    single=f"[CLS]:0 $A:0 [SEP]:0",
-    pair=f"[CLS]:0 $A:0 [SEP]:0 $B:1 [SEP]:1",
-    special_tokens=[("[CLS]", cls_token_id), ("[SEP]", sep_token_id)],
-)
-```
-
-Rețineți că trebuie să transmitem ID-urile tokenilor speciali, astfel încât tokenizerul să le poată converti corect în ID-urile lor.
-
-Odată ce acest lucru este adăugat, revenind la exemplul nostru anterior vom obține:
-
-```python
-encoding = tokenizer.encode("Let's test this tokenizer.")
-print(encoding.tokens)
-```
-
-```python out
-['[CLS]', 'let', "'", 's', 'test', 'this', 'tok', '##eni', '##zer', '.', '[SEP]']
-```
-
-Și pe o pereche de propoziții, obținem rezultatul corect:
-
-```python
-encoding = tokenizer.encode("Let's test this tokenizer...", "on a pair of sentences.")
-print(encoding.tokens)
-print(encoding.type_ids)
-```
-
-```python out
-['[CLS]', 'let', "'", 's', 'test', 'this', 'tok', '##eni', '##zer', '...', '[SEP]', 'on', 'a', 'pair', 'of', 'sentences', '.', '[SEP]']
-[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1]
-```
-
-Aproape am terminat de construit acest tokenizer de la zero - ultimul pas este să includem un decodor:
-
-```python
-tokenizer.decoder = decoders.WordPiece(prefix="##")
-```
-
-Haideți să-l testăm pe `encoding`-ul nostru anterior:
-
-```python
-tokenizer.decode(encoding.ids)
-```
-
-```python out
-"let's test this tokenizer... on a pair of sentences."
-```
-
-Grozav! Putem salva tokenizatorul nostru într-un singur fișier JSON, astfel:
-
-```python
-tokenizer.save("tokenizer.json")
-```
-
-Apoi putem reîncărca acel fișier într-un obiect `Tokenizer` cu metoda `from_file()`:
-
-```python
-new_tokenizer = Tokenizer.from_file("tokenizer.json")
-```
-
-Pentru a utiliza acest tokenizer în 🤗 Transformers, trebuie să îl încorporăm în `PreTrainedTokenizerFast`. Putem fie să folosim clasa generică, fie, dacă tokenizerul nostru corespunde unui model existent, să folosim clasa respectivă (aici, `BertTokenizerFast`). Dacă aplicați această lecție pentru a construi un tokenizer nou, va trebui să utilizați prima opțiune.
-
-Pentru a include tokenizatorul într-un `PreTrainedTokenizerFast`, putem fie să transmitem tokenizerul construit ca `tokenizer_object`, fie să transmitem fișierul tokenizerului salvat ca `tokenizer_file`. Cel mai important lucru de reținut este că trebuie să setăm manual toți tokenii speciali, deoarece această clasă nu poate deduce din obiectul `tokenizer` care tokne este tokenul mască, tokenul `[CLS]`, etc.:
-
-```python
-from transformers import PreTrainedTokenizerFast
-
-wrapped_tokenizer = PreTrainedTokenizerFast(
-    tokenizer_object=tokenizer,
-    # tokenizer_file="tokenizer.json", # You can load from the tokenizer file, alternatively
-    unk_token="[UNK]",
-    pad_token="[PAD]",
-    cls_token="[CLS]",
-    sep_token="[SEP]",
-    mask_token="[MASK]",
-)
-```
-
-Dacă utilizați o clasă specifică de tokenizer (cum ar fi `BertTokenizerFast`), va trebui să specificați doar tokenii speciali care sunt diferiți de cei impliciți (aici, niciunul):
-
-```python
-from transformers import BertTokenizerFast
-
-wrapped_tokenizer = BertTokenizerFast(tokenizer_object=tokenizer)
-```
-
-Apoi puteți utiliza acest tokenizer ca orice alt tokenizer 🤗 Transformers. Îl puteți salva cu metoda `save_pretrained()` sau îl puteți încărca în Hub cu metoda `push_to_hub()`.
-
-Acum că am văzut cum să construim un tokenizer WordPiece, hai să facem același lucru pentru un tokenizer BPE. Vom merge un pic mai repede, deoarece cunoașteți toți pașii, și vom evidenția doar diferențele.
-
-## Construirea unui tokenizer BPE de la zero[[building-a-bpe-tokenizer-from-scratch]]
-
-Să construim acum un tokenizer GPT-2. Ca și pentru tokenizer BERT, începem prin inițializarea unui `Tokenizer` cu un model BPE:
-
-```python
-tokenizer = Tokenizer(models.BPE())
-```
-
-De asemenea, la fel ca în cazul BERT, am putea inițializa acest model cu un vocabular, dacă am avea unul (în acest caz, ar trebui să oferim `vocab` și `merges`), dar din moment ce vom antrena de la zero, nu avem nevoie să facem acest lucru. De asemenea, nu trebuie să specificăm un `unk_token` deoarece GPT-2 utilizează BPE la nivel de bytes, care nu necesită acest lucru.
-
-GPT-2 nu utilizează un normalizator, deci sărim peste acest pas și trecem direct la pre-tokenizare:
-
-```python
-tokenizer.pre_tokenizer = pre_tokenizers.ByteLevel(add_prefix_space=False)
-```
-
-Opțiunea pe care am adăugat-o aici la `ByteLevel` nu este pentru a adăuga un spațiu unei propoziții (care este implicit în caz contrar). Putem arunca o privire la pre-tokenizarea unui text exemplu ca înainte:
-
-```python
-tokenizer.pre_tokenizer.pre_tokenize_str("Let's test pre-tokenization!")
-```
-
-```python out
-[('Let', (0, 3)), ("'s", (3, 5)), ('Ġtest', (5, 10)), ('Ġpre', (10, 14)), ('-', (14, 15)),
- ('tokenization', (15, 27)), ('!', (27, 28))]
-```
-
-Urmează modelul, care are nevoie de antrenare. Pentru GPT-2, singurul token special este tokenul de sfârșit de text:
-
-```python
-trainer = trainers.BpeTrainer(vocab_size=25000, special_tokens=["<|endoftext|>"])
-tokenizer.train_from_iterator(get_training_corpus(), trainer=trainer)
-```
-
-Ca și în cazul `WordPieceTrainer`, precum și `vocab_size` și `special_tokens`, putem specifica `min_frequency` dacă dorim, sau dacă avem un sufix de sfârșit de cuvânt (cum ar fi `</w>`), îl putem seta cu `end_of_word_suffix`.
-
-Acest tokenizer poate fi antrenat și pe fișiere text:
-
-```python
-tokenizer.model = models.BPE()
-tokenizer.train(["wikitext-2.txt"], trainer=trainer)
-```
-
-Să aruncăm o privire la tokenizarea unui exemplu de text:
-
-```python
-encoding = tokenizer.encode("Let's test this tokenizer.")
-print(encoding.tokens)
-```
-
-```python out
-['L', 'et', "'", 's', 'Ġtest', 'Ġthis', 'Ġto', 'ken', 'izer', '.']
-```
-
-Aplicăm postprocesarea la nivel de bytes pentru tokenizerul GPT-2 după cum urmează:
-
-```python
-tokenizer.post_processor = processors.ByteLevel(trim_offsets=False)
-```
-
-Opțiunea `trim_offsets = False` indică post-procesorului că ar trebui să lăsăm offseturile tokenilor care încep cu "Ġ" așa cum sunt: în acest fel, începutul offseturilor va indica spațiul dinaintea cuvântului, nu primul caracter al cuvântului (deoarece spațiul face parte din punct de vedere tehnic din token). Să aruncăm o privire asupra rezultatului cu textul pe căruia tocmai i-am făcut encoding, unde `'Ġtest'` este tokenul de la indexul 4:
-
-```python
-sentence = "Let's test this tokenizer."
-encoding = tokenizer.encode(sentence)
-start, end = encoding.offsets[4]
-sentence[start:end]
-```
-
-```python out
-' test'
-```
-
-În cele din urmă, adăugăm un decoder la nivel de bytes:
-
-```python
-tokenizer.decoder = decoders.ByteLevel()
-```
-
-și putem verifica de două ori dacă funcționează corect:
-
-```python
-tokenizer.decode(encoding.ids)
-```
-
-```python out
-"Let's test this tokenizer."
-```
-
-Grozav! Acum că am terminat, putem salva tokenizatorul ca înainte și îl putem încorpora într-un `PreTrainedTokenizerFast` sau `GPT2TokenizerFast` dacă dorim să îl folosim în 🤗 Transformers:
-
-```python
-from transformers import PreTrainedTokenizerFast
-
-wrapped_tokenizer = PreTrainedTokenizerFast(
-    tokenizer_object=tokenizer,
-    bos_token="<|endoftext|>",
-    eos_token="<|endoftext|>",
-)
-```
-
-or:
-
-```python
-from transformers import GPT2TokenizerFast
-
-wrapped_tokenizer = GPT2TokenizerFast(tokenizer_object=tokenizer)
-```
-
-Ca un ultim exemplu, vă vom arăta cum să construiți un tokenizer Unigram de la zero.
-
-## Construirea unui tokenizer Unigram de la zero[[building-a-unigram-tokenizer-from-scratch]]
-
-Să construim acum un tokenizer XLNet. Ca și în cazul tokenizerelor anterioare, începem prin inițializarea unui `Tokenizer` cu un model Unigram:
-
-```python
-tokenizer = Tokenizer(models.Unigram())
-```
-
-Din nou, am putea inițializa acest model cu un vocabular, dacă am avea unul.
-
-Pentru normalizare, XLNet utilizează câteva înlocuiri (care provin din SentencePiece):
-
-```python
-from tokenizers import Regex
-
-tokenizer.normalizer = normalizers.Sequence(
-    [
-        normalizers.Replace("``", '"'),
-        normalizers.Replace("''", '"'),
-        normalizers.NFKD(),
-        normalizers.StripAccents(),
-        normalizers.Replace(Regex(" {2,}"), " "),
-    ]
-)
-```
-
-Acest lucru înlocuitește <code>``</code> și <code>''</code> cu <code>"</code> și orice secvență de două sau mai multe spații cu un singur spațiu, precum și ștergerea accentelor în textele ce trebuie tokenizate.
-
-Pre-tokenizerul care trebuie utilizat pentru orice tokenizer SentencePiece este `Metaspace`:
-
-```python
-tokenizer.pre_tokenizer = pre_tokenizers.Metaspace()
-```
-
-Putem arunca o privire la pre-tokenizarea unui exemplu de text ca mai înainte:
-
-```python
-tokenizer.pre_tokenizer.pre_tokenize_str("Let's test the pre-tokenizer!")
-```
-
-```python out
-[("▁Let's", (0, 5)), ('▁test', (5, 10)), ('▁the', (10, 14)), ('▁pre-tokenizer!', (14, 29))]
-```
-
-Urmează modelul, care are nevoie de antrenare. XLNet are destul de mulți tokeni speciali:
-
-```python
-special_tokens = ["<cls>", "<sep>", "<unk>", "<pad>", "<mask>", "<s>", "</s>"]
-trainer = trainers.UnigramTrainer(
-    vocab_size=25000, special_tokens=special_tokens, unk_token="<unk>"
-)
-tokenizer.train_from_iterator(get_training_corpus(), trainer=trainer)
-```
-
-Un argument foarte important care nu trebuie uitat pentru `UnigramTrainer` este `unk_token`. Putem trece și alte argumente specifice algoritmului Unigram, cum ar fi `shrinking_factor` pentru fiecare pas în care eliminăm tokeni (valoarea implicită este 0,75) sau `max_piece_length` pentru a specifica lungimea maximă a unui token dat (valoarea implicită este 16).
-
-Acest tokenizer poate fi antrenat și pe fișiere text:
-
-```python
-tokenizer.model = models.Unigram()
-tokenizer.train(["wikitext-2.txt"], trainer=trainer)
-```
-
-Să aruncăm o privire la tokenizarea unui exemplu de text:
-
-```python
-encoding = tokenizer.encode("Let's test this tokenizer.")
-print(encoding.tokens)
-```
-
-```python out
-['▁Let', "'", 's', '▁test', '▁this', '▁to', 'ken', 'izer', '.']
-```
-
-O particularitate a XLNet este că pune tokenul `<cls>` la sfârșitul propoziției, cu un ID de tip 2 (pentru a-l distinge de ceilalți tokeni). Ca urmare, este făcut padding la stânga. Putem trata toți tokenii speciali și ID-urile de tip ale tokenilor cu un template, ca în cazul BERT, dar mai întâi trebuie să obținem ID-urile tokenilor `<cls>` și `<sep>`:
-
-```python
-cls_token_id = tokenizer.token_to_id("<cls>")
-sep_token_id = tokenizer.token_to_id("<sep>")
-print(cls_token_id, sep_token_id)
-```
-
-```python out
-0 1
-```
-
-Templateul arată astfel:
-
-```python
-tokenizer.post_processor = processors.TemplateProcessing(
-    single="$A:0 <sep>:0 <cls>:2",
-    pair="$A:0 <sep>:0 $B:1 <sep>:1 <cls>:2",
-    special_tokens=[("<sep>", sep_token_id), ("<cls>", cls_token_id)],
-)
-```
-
-Și putem testa că funcționează prin codificarea unei perechi de propoziții:
-
-```python
-encoding = tokenizer.encode("Let's test this tokenizer...", "on a pair of sentences!")
-print(encoding.tokens)
-print(encoding.type_ids)
-```
-
-```python out
-['▁Let', "'", 's', '▁test', '▁this', '▁to', 'ken', 'izer', '.', '.', '.', '<sep>', '▁', 'on', '▁', 'a', '▁pair', 
-  '▁of', '▁sentence', 's', '!', '<sep>', '<cls>']
-[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2]
-```
-
-În cele din urmă, adăugăm un decoder `Metaspace`:
-
-```python
-tokenizer.decoder = decoders.Metaspace()
-```
-
-și am terminat cu acest tokenizer! Putem salva tokenizerul ca înainte și îl putem încorpora într-un `PreTrainedTokenizerFast` sau `XLNetTokenizerFast` dacă dorim să îl folosim în 🤗 Transformers. Un lucru de reținut atunci când se utilizează `PreTrainedTokenizerFast` este că, pe lângă tokenii speciali, trebuie să spunem bibliotecii 🤗 Transformers să facă padding la stânga:
-
-```python
-from transformers import PreTrainedTokenizerFast
-
-wrapped_tokenizer = PreTrainedTokenizerFast(
-    tokenizer_object=tokenizer,
-    bos_token="<s>",
-    eos_token="</s>",
-    unk_token="<unk>",
-    pad_token="<pad>",
-    cls_token="<cls>",
-    sep_token="<sep>",
-    mask_token="<mask>",
-    padding_side="left",
-)
-```
-
-Sau alternativ:
-
-```python
-from transformers import XLNetTokenizerFast
-
-wrapped_tokenizer = XLNetTokenizerFast(tokenizer_object=tokenizer)
-```
-
-Acum că ați văzut cum sunt utilizate diferitele blocuri de construcție pentru a construi tokenizeri existenți, ar trebui să puteți scrie orice tokenizer doriți cu biblioteca 🤗 Tokenizers și să îl puteți utiliza în 🤗 Transformers.
diff --git a/chapters/ro/chapter 6/9.mdx b/chapters/ro/chapter 6/9.mdx
deleted file mode 100644
index 8fc71f8ea..000000000
--- a/chapters/ro/chapter 6/9.mdx	
+++ /dev/null
@@ -1,16 +0,0 @@
-# Tokenizers, verificați![[tokenizers-check]]
-
-<CourseFloatingBanner
-    chapter={6}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-Bună treabă la finalizarea acestui capitol!
-
-După această scufundare adâncă în tokenizers, ar trebui să:
-
-- Să fii capabil să antrenezi un nou tokenizer folosind unul vechi ca model
-- Să înțelegi modului de utilizare a offseturilor pentru a face map tokenilor în intervalul lor original de text
-- Cunoști diferențele dintre BPE, WordPiece și Unigram
-- Fii capabil să combini blocurile furnizate de biblioteca 🤗 Tokenizers pentru a vă construi propriul tokenizer
-- Să poți folosi acest tokenizer în cadrul bibliotecii 🤗 Transformers
diff --git a/chapters/ro/chapter0/1.mdx b/chapters/ro/chapter0/1.mdx
deleted file mode 100644
index c7c072707..000000000
--- a/chapters/ro/chapter0/1.mdx
+++ /dev/null
@@ -1,110 +0,0 @@
-# Introducere[[introducere]]
-
-Bun venit la cursul Hugging Face! Această introducere te va ghida în configurarea environment-ului de lucru. Dacă abia începi cursul, îți recomandăm să arunci o privire mai întâi asupra [Capitolului 1](/course/chapter1), apoi să te întorci și să îți configurezi environment-ul pentru a putea încerca singur codul.
-
-Toate bibliotecile pe care le vom folosi în acest curs sunt disponibile ca Python packages, așa că aici îți vom arăta cum să configurezi Python environment-ul și să instalezi librăriile specifice de care ai nevoie.
-
-Vom acoperi două moduri de a-ți configura environment-ul, folosind un notebook Colab sau un Python environment. Simte-te liber să alegi pe cel care ți se potrivește cel mai bine. Pentru începători, recomandăm să începi folosind un notebook Colab.
-
-Reține că nu vom acoperi sistemul Windows. Dacă folosești Windows, îți recomandăm să urmezi pașii folosind un notebook Colab. Dacă folosești o distribuție Linux sau macOS, poți folosi oricare dintre abordările descrise aici.
-
-Majoritatea cursului se bazează pe faptul că ai un cont Hugging Face. Îți recomandăm să creezi unul acum: [crează un cont](https://huggingface.co/join).
-
-## Folosirea unui notebook Google Colab[[folosind-un-notebook-google-colab]]
-
-Folosirea unui notebook Colab este cea mai simplă configurare posibilă; deschide un notebook în browserul tău și începe imediat să scrii cod!
-
-Dacă nu ești familiarizat cu Colab, îți recomandăm să începi urmând [introducerea](https://colab.research.google.com/notebooks/intro.ipynb). Colab îți permite să folosești hardware accelerat, cum ar fi GPU-uri sau TPU-uri, și este gratuit pentru sarcini mai mici.
-
-Odată ce ești confortabil să te descurci în Colab, creează un nou notebook și începe cu configurarea:
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter0/new_colab.png" alt="Un notebook Colab gol" width="80%"/>
-</div>
-
-Următorul pas este să instalezi librăriile pe care le vom folosi în acest curs. Vom folosi `pip` pentru instalare, care este managerul de packages pentru Python. În notebook-uri, poți rula comenzi de sistem începând comanda cu caracterul `!`, așa că poți instala librăria 🤗 Transformers astfel:
-
-```
-!pip install transformers
-```
-
-Te poți asigura că pachetul a fost instalat corect importându-l în cadrul mediului tău Python:
-
-```
-import transformers
-```
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter0/install.gif" alt="O animație care arată rezultatul celor două comenzi de mai sus: instalare și importarea" width="80%"/>
-</div>
-
-Aceasta instalează o versiune foarte ușoară a 🤗 Transformers. În special, nu sunt instalate framework-uri specifice de machine learning (cum ar fi PyTorch sau TensorFlow). Deoarece vom folosi multe caracteristici diferite ale librăriei, îți recomandăm să instalezi versiunea pentru development, care vine cu toate dependențele necesare pentru cam orice caz de utilizare imaginabil:
-
-```
-!pip install transformers[sentencepiece]
-```
-
-Aceasta va dura puțin timp, dar apoi vei fi gata de drum pentru restul cursului!
-
-## Folosirea unui virtual environment Python[[folosirea-unui-virtual-environment-python]]
-
-Dacă preferi să folosești un mediu virtual Python, primul pas este să instalezi Python pe sistemul tău. Îți recomandăm să urmezi [această ghidare](https://realpython.com/installing-python/) pentru a începe.
-
-Odată ce ai Python instalat, ar trebui să poți rula comenzi Python în terminalul tău. Poți începe rulând următoarea comandă pentru a te asigura că este instalat corect înainte de a trece la pașii următori: `python --version`. Aceasta ar trebui să afișeze versiunea Python disponibilă acum pe sistemul tău.
-
-Când rulezi o comandă Python în terminalul tău, cum ar fi `python --version`, ar trebui să te gândești la programul care rulează comanda ta ca la Python-ul "principal" de pe sistemul tău. Îți recomandăm să păstrezi această instalare principală liberă de orice pachete și să o folosești pentru a crea environment-uri separate pentru fiecare aplicație pe care lucrezi — în acest fel, fiecare aplicație poate avea propriile sale dependențe și pachete, și nu va trebui să te preocupi de problemele de compatibilitate potențiale cu alte aplicații.
-
-În Python, acest lucru se face prin [*virtual environments*](https://docs.python.org/3/tutorial/venv.html), care sunt directory trees autonomi ce conțin fiecare o instalare Python cu o anumită versiune Python împreună cu toate pachetele de care are nevoie aplicația. Crearea unui astfel de mediu virtual poate fi realizată cu mai multe instrumente diferite, dar vom folosi pachetul oficial Python pentru acest scop, denumit [`venv`](https://docs.python.org/3/library/venv.html#module-venv).
-
-În primul rând, creează folder în care dorești ca aplicația ta să locuiască — de exemplu, ai putea dori să faci un nou folder numit *transformers-course* în rădăcina folderului tău personal:
-
-```
-mkdir ~/transformers-course
-cd ~/transformers-course
-```
-
-Din interiorul acestui folder, creează un virtual environment folosind modulul Python `venv`:
-
-```
-python -m venv .env
-```
-
-Acum ar trebui să ai un folder numit *.env* în folderul tău altfel gol:
-
-```
-ls -a
-```
-
-```out
-.      ..    .env
-```
-
-Poți să intri și să ieși din environment folosind comenzile `activate` și `deactivate`:
-
-```
-# Activează mediul virtual
-source .env/bin/activate
-
-# Dezactivează virtual environment-ul
-deactivate
-```
-
-Te poți asigura că environment-ul este activat rulând comanda `which python`: dacă aceasta indică către virtual environment, atunci l-ai activat cu succes!
-
-```
-which python
-```
-
-```out
-/home/<user>/transformers-course/.env/bin/python
-```
-
-### Instalarea dependențelor[[instalarea-dependențelor]]
-
-La fel ca în secțiunea anterioară despre utilizarea instanțelor Google Colab, acum va trebui să instalezi pachetele necesare pentru a continua. Din nou, poți instala versiunea pentru development a 🤗 Transformers folosind managerul de pachete `pip`:
-
-```
-pip install "transformers[sentencepiece]"
-```
-
-Acum ești gata să începi!
\ No newline at end of file
diff --git a/chapters/ro/chapter2/1.mdx b/chapters/ro/chapter2/1.mdx
deleted file mode 100644
index 75093a9f9..000000000
--- a/chapters/ro/chapter2/1.mdx
+++ /dev/null
@@ -1,28 +0,0 @@
-# Introducere[[introducere]]
-
-<CourseFloatingBanner
-    chapter={2}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-După cum ați văzut în [Capitolul 1](/course/chapter1), modelele Transformer sunt de obicei foarte voluminoase. Fiind alcătuite din milioane până la zeci de *miliarde* de parametri, instruirea și implementarea acestor modele este o sarcină complicată. În plus, cu noi modele lansate aproape zilnic și fiecare având propria sa implementare, testarea tuturor acestora nu este o sarcină ușoară.
-
-Biblioteca 🤗 Transformers a fost creată pentru a rezolva această problemă. Scopul său este de a oferi un singur API prin care orice model Transformer poate fi încărcat, instruit și salvat. Principalele caracteristici ale bibliotecii sunt:
-
-- ** Simplitate în utilizare**: Descărcarea, încărcarea și utilizarea unui model NLP de ultimă generație pentru inferență pot fi realizate în doar două linii de cod.
-- **Flexibilitate**: În esența lor, toate modelele sunt simple clase PyTorch `nn.Module` sau TensorFlow `tf.keras.Model` și pot fi manipulate ca orice alte modele în framework-urile lor respective de învățare automată (ML).
-- **Simplitate**: Aproape că nu se fac abstractizări în întreaga bibliotecă. „All in one file” este un concept de bază: trecerea înainte a unui model este definită în întregime într-un singur fișier, astfel încât codul în sine să fie ușor de înțeles și hackable.
-
-Această ultimă caracteristică face 🤗 Transformers destul de diferit de alte biblioteci ML. Modelele nu sunt construite pe module 
-care sunt partajate între fișiere; în schimb, fiecare model are propriile sale straturi. În plus, pe lângă faptul că modelele sunt mai ușor de abordat și de înțeles, acest lucru vă permite să experimentați cu ușurință pe un model fără a le afecta pe celelalte.
-
-Acest capitol va începe cu un exemplu end-to-end în care folosim împreună un model și un tokenizer pentru a replica funcția `pipeline()` introdusă în [Capitolul 1](/course/chapter1). În continuare, vom discuta despre API-ul modelului: vom analiza clasele de model și de configurare și vă vom arăta cum să încărcați un model și cum acesta procesează intrările numerice pentru a genera predicții. 
-
-Apoi vom analiza API-ul tokenizer, care este cealaltă componentă principală a funcției `pipeline()`. Tokenizerii se ocupă de prima și ultima etapă de procesare, gestionând conversia de la text la intrări numerice pentru rețeaua neuronală și conversia înapoi la text atunci când este necesar. În cele din urmă, vă vom arăta cum să vă ocupați de trimiterea mai multor propoziții printr-un model în cadrul unui lot pregătit, apoi vom încheia totul cu o examinare mai atentă a funcției  `tokenizer()`.
-
-
-<Tip>
-⚠️  
-Pentru a beneficia de toate funcțiile disponibile cu Model Hub și 🤗 Transformers, vă recomandăm <a href="https://huggingface.co/join">să vă creați un cont</a>.
-
-</Tip>
\ No newline at end of file
diff --git a/chapters/ro/chapter2/2.mdx b/chapters/ro/chapter2/2.mdx
deleted file mode 100644
index b0f1c4855..000000000
--- a/chapters/ro/chapter2/2.mdx
+++ /dev/null
@@ -1,364 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# În spatele pipeline-ului[[în-spatele-pipeline-ului]]
-
-{#if fw === 'pt'}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section2_pt.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section2_pt.ipynb"},
-]} />
-
-{:else}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section2_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section2_tf.ipynb"},
-]} />
-
-{/if}
-
-<Tip>
- 
-Aceasta este prima secțiune în care conținutul este ușor diferit în funcție de utilizarea PyTorch sau TensorFlow. Schimbați comutatorul din partea de sus a titlului pentru a selecta platforma pe care o preferați!
-</Tip>
-
-{#if fw === 'pt'}
-<Youtube id="1pedAIvTWXk"/>
-{:else}
-<Youtube id="wVN12smEvqg"/>
-{/if}
-
-Să începem cu un exemplu complet, aruncând o privire la ceea ce s-a întâmplat în spate atunci când am executat următorul cod în [Capitolul 1](/curs/capitol1):
-
-
-```python
-from transformers import pipeline
-
-classifier = pipeline("sentiment-analysis")
-classifier(
-    [
-        "I've been waiting for a HuggingFace course my whole life.",
-        "I hate this so much!",
-    ]
-)
-```
-
-și am obținut:
-
-```python out
-[{'label': 'POSITIVE', 'score': 0.9598047137260437},
- {'label': 'NEGATIVE', 'score': 0.9994558095932007}]
-```
-
-După cum am văzut în [Capitolul 1](/course/chapter1), acest pipeline grupează trei etape: preprocesarea, trecerea intrărilor prin model și postprocesarea:
-
-<div class="flex justify-center">
-<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/full_nlp_pipeline.svg" alt="The full NLP pipeline: tokenization of text, conversion to IDs, and inference through the Transformer model and the model head."/>
-<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/full_nlp_pipeline-dark.svg" alt="The full NLP pipeline: tokenization of text, conversion to IDs, and inference through the Transformer model and the model head."/>
-</div>
-
-Să trecem rapid prin fiecare dintre acestea.
-
-## Preprocesarea cu un tokenizator[[preprocesarea-cu-un-tokenizerator]]
-
-La fel ca alte rețele neuronale, modelele Transformer nu pot procesa direct text brut, astfel încât primul pas al pipeline-ului nostru este de a converti intrările de text în numere pe care modelul le poate înțelege. Pentru a face acest lucru, folosim un *tokenizer*, care va fi responsabil pentru:
-
-- Împărțirea datelor de intrare în cuvinte, părți de cuvinte sau simboluri (cum ar fi punctuația) care se numesc *tokens*
-- Maparea fiecărui token într-un număr întreg
-- Adăugarea de intrări suplimentare care pot fi utile pentru model
-
-Toată această preprocesare trebuie efectuată exact în același mod ca atunci când modelul a fost preinstruit, așa că mai întâi trebuie să descărcăm aceste informații din [Model Hub] (https://huggingface.co/models). Pentru a face acest lucru, folosim clasa `AutoTokenizer` și metoda sa `from_pretrained()`. Folosind numele checkpoint-ului modelului nostru, aceasta va prelua automat datele asociate cu tokenizer-ul modelului și le va stoca în cache (astfel încât acestea să fie descărcate doar prima dată când executați codul de mai jos).
-
-Deoarece punctul de control implicit al pipeline-ului `sentiment-analysis` este `distilbert-base-uncased-finetuned-sst-2-english` (puteți vedea fișa modelului [aici](https://huggingface.co/distilbert-base-uncased-finetuned-sst-2-english)), executăm următoarele:
-
-```python
-from transformers import AutoTokenizer
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-```
-
-Odată ce avem tokenizatorul, putem să îi transmitem direct propozițiile noastre și vom primi înapoi un dicționar care este gata să fie introdus în modelul nostru! Singurul lucru rămas de făcut este să convertim lista de ID-uri de intrare în tensori.
-
-Puteți utiliza 🤗 Transformers fără a trebui să vă faceți griji cu privire la cadrul ML utilizat ca backend; ar putea fi PyTorch sau TensorFlow, sau Flax pentru unele modele. Cu toate acestea, modelele Transformer acceptă numai *tensori * ca intrare. Dacă este prima dată când auziți despre tensori, vă puteți gândi la ei ca la matrici NumPy. Un array NumPy poate fi un scalar (0D), un vector (1D), o matrice (2D) sau poate avea mai multe dimensiuni. Este de fapt un tensor; tensorii altor cadre ML se comportă similar și sunt de obicei la fel de simplu de instanțiat ca și array-urile NumPy.
-
-Pentru a specifica tipul de tensori pe care dorim să îi primim înapoi (PyTorch, TensorFlow sau NumPy simplu), folosim argumentul `return_tensors`:
-
-
-{#if fw === 'pt'}
-```python
-raw_inputs = [
-    "I've been waiting for a HuggingFace course my whole life.",
-    "I hate this so much!",
-]
-inputs = tokenizer(raw_inputs, padding=True, truncation=True, return_tensors="pt")
-print(inputs)
-```
-{:else}
-```python
-raw_inputs = [
-    "I've been waiting for a HuggingFace course my whole life.",
-    "I hate this so much!",
-]
-inputs = tokenizer(raw_inputs, padding=True, truncation=True, return_tensors="tf")
-print(inputs)
-```
-{/if}
-
- 
-Nu vă faceți încă griji cu privire la padding și trunchiere; le vom explica mai târziu. Principalele lucruri de reținut aici sunt că puteți trece o propoziție sau o listă de propoziții, precum și specificarea tipului de tensori pe care doriți să îi primiți înapoi (dacă nu este trecut niciun tip, veți primi o listă de liste ca rezultat)
-{#if fw === 'pt'}
-
-Iată cum arată rezultatele ca tensori PyTorch:
-
-```python out
-{
-    'input_ids': tensor([
-        [  101,  1045,  1005,  2310,  2042,  3403,  2005,  1037, 17662, 12172, 2607,  2026,  2878,  2166,  1012,   102],
-        [  101,  1045,  5223,  2023,  2061,  2172,   999,   102,     0,     0,     0,     0,     0,     0,     0,     0]
-    ]), 
-    'attention_mask': tensor([
-        [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
-        [1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0]
-    ])
-}
-```
-{:else}
-
-Iată cum arată rezultatele ca tensori TensorFlow:
-
-```python out
-{
-    'input_ids': <tf.Tensor: shape=(2, 16), dtype=int32, numpy=
-        array([
-            [  101,  1045,  1005,  2310,  2042,  3403,  2005,  1037, 17662, 12172,  2607,  2026,  2878,  2166,  1012,   102],
-            [  101,  1045,  5223,  2023,  2061,  2172,   999,   102,     0,     0,     0,     0,     0,     0,     0,     0]
-        ], dtype=int32)>, 
-    'attention_mask': <tf.Tensor: shape=(2, 16), dtype=int32, numpy=
-        array([
-            [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
-            [1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0]
-        ], dtype=int32)>
-}
-```
-{/if}
-
- 
-Rezultatul în sine este un dicționar care conține două chei, `input_ids` și `attention_mask`. `input_ids` conține două rânduri de numere întregi (unul pentru fiecare propoziție) care sunt identificatorii unici ai simbolurilor din fiecare propoziție. Vom explica ce este `attention_mask` mai târziu în acest capitol. 
-
-## Parcurgerea modelului[[parcurgerea-modelului]]
-
-{#if fw === 'pt'}
-Putem descărca modelul nostru preinstruit în același mod în care am făcut-o cu tokenizatorul nostru. 🤗 Transformers oferă o clasă `AutoModel` care are și o metodă `from_pretrained()`:
-
-```python
-from transformers import AutoModel
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-model = AutoModel.from_pretrained(checkpoint)
-```
-{:else}
- 
-Putem descărca modelul nostru preinstruit în același mod în care am făcut-o cu tokenizatorul nostru. 🤗 Transformers oferă o clasă `TFAutoModel` care are și o metodă `from_pretrained`:
-
-```python
-from transformers import TFAutoModel
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-model = TFAutoModel.from_pretrained(checkpoint)
-```
-{/if}
-
- 
-În acest fragment de cod, am descărcat același checkpoint pe care l-am folosit anterior în pipeline-ul nostru (de fapt, ar fi trebuit să fie deja în cache) și am instanțiat un model cu acesta.
-
-Această arhitectură conține doar modulul Transformer de bază: având în vedere anumite intrări, acesta produce ceea ce vom numi *stări ascunse*, cunoscute și ca *caracteristici*. Pentru fiecare intrare a modelului, vom extrage un vector înalt-dimensional care reprezintă **înțelegerea contextuală a intrării respective de către modelul Transformer**.
-
-Dacă acest lucru nu are sens, nu vă faceți griji. Vom explica totul mai târziu.
-
-Deși aceste stări ascunse pot fi utile pe cont propriu, ele sunt de obicei intrări pentru o altă parte a modelului, cunoscută sub numele de *head*. În [Capitolul 1](/curs/capitol1), diferitele sarcini ar fi putut fi efectuate cu aceeași arhitectură, dar fiecăreia dintre aceste sarcini îi va fi asociat un head diferit.
-
-### Un vector multidimensional?[[un-vector-multidimensional]]
-
- 
-Vectorul emis de modulul Transformator este de obicei de dimensiuni mari. Acesta are în general trei dimensiuni:
-
-- **Dimensiunea lotului**: Numărul de secvențe prelucrate simultan (2 în exemplul nostru).
-- **Lungimea secvenței**: Lungimea reprezentării numerice a secvenței (16 în exemplul nostru).
-- **Dimensiunea ascunsă**: Dimensiunea vectorială a fiecărei intrări a modelului.
-
-Se spune că este multidimensional din cauza ultimei valori. Dimensiunea ascunsă poate fi foarte mare (768 este comună pentru modelele mai mici, iar în modelele mai mari aceasta poate ajunge la 3072 sau mai mult).
-
-Putem vedea acest lucru dacă introducem în modelul nostru intrările pe care le-am preprocesat:
-
-{#if fw === 'pt'}
-```python
-outputs = model(**inputs)
-print(outputs.last_hidden_state.shape)
-```
-
-```python out
-torch.Size([2, 16, 768])
-```
-{:else}
-```py
-outputs = model(inputs)
-print(outputs.last_hidden_state.shape)
-```
-
-```python out
-(2, 16, 768)
-```
-{/if}
-
- 
-Rețineți că ieșirile modelelor 🤗 Transformers se comportă ca `namedtuple`s sau dicționare. Puteți accesa elementele prin atribute (așa cum am făcut noi) sau prin cheie (`outputs[„last_hidden_state”]`), sau chiar prin index dacă știți exact unde se află lucrul pe care îl căutați (`outputs[0]`).
-
-### Modele de head-uri: Înțelegerea numerelor[modele-de-head-uri-înțelegerea-numerelor]]
-
-Head-urile modelelor iau ca intrare vectorul multidimensional al stărilor ascunse și le proiectează pe o altă dimensiune. Acestea sunt de obicei compuse din unul sau câteva straturi liniare:
-
-<div class="flex justify-center">
-<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/transformer_and_head.svg" alt="A Transformer network alongside its head."/>
-<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/transformer_and_head-dark.svg" alt="A Transformer network alongside its head."/>
-</div>
-
- 
-Rezultatul modelului Transformer este trimis direct la head-ul modelului pentru a fi prelucrat.
-
-În această diagramă, modelul este reprezentat de stratul său de încorporare și de straturile următoare. Stratul de încorporare convertește fiecare ID de intrare din intrarea tokenizată într-un vector care reprezintă tokenul asociat. Straturile ulterioare manipulează acești vectori folosind mecanismul de atenție pentru a produce reprezentarea finală a propozițiilor.
-
-Există multe arhitecturi diferite disponibile în 🤗 Transformers, fiecare fiind concepută în jurul abordării unei sarcini specifice. Iată o listă neexhaustivă:
-
-- `*Model` (extragerea stărilor ascunse)
-- `*ForCausalLM`
-- `*ForMaskedLM`
-- `*ForMultipleChoice`
-- `*ForQuestionAnswering`
-- `*ForSequenceClassification`
-- `*ForTokenClassification`
-- și altele 🤗
-
-{#if fw === 'pt'}
- Pentru exemplul nostru, vom avea nevoie de un model cu un head de clasificare a secvențelor (pentru a putea clasifica propozițiile ca fiind pozitive sau negative). Așadar, nu vom utiliza clasa `AutoModel`, ci `AutoModelForSequenceClassification`:
-
-```python
-from transformers import AutoModelForSequenceClassification
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
-outputs = model(**inputs)
-```
-{:else}
- Pentru exemplul nostru, vom avea nevoie de un model cu un head de clasificare a secvențelor (pentru a putea clasifica propozițiile ca fiind pozitive sau negative). Așadar, nu vom utiliza clasa `TFAutoModel`, ci `TFAutoModelForSequenceClassification`:
-
-```python
-from transformers import TFAutoModelForSequenceClassification
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint)
-outputs = model(inputs)
-```
-{/if}
- 
-Acum, dacă ne uităm la forma ieșirilor noastre, dimensiunea va fi mult mai mică: head-ul modelului ia ca intrare vectorii multidimensionali pe care i-am văzut înainte și scoate vectori care conțin două valori (una pentru fiecare etichetă):
-
-```python
-print(outputs.logits.shape)
-```
-
-{#if fw === 'pt'}
-```python out
-torch.Size([2, 2])
-```
-{:else}
-```python out
-(2, 2)
-```
-{/if}
-
- 
-Deoarece avem doar două propoziții și două etichete, rezultatul pe care îl obținem din modelul nostru este de forma 2 x 2.
-
-## Postprocesarea rezultatului[[postprocesarea-rezultatului]]
-
-Valorile pe care le obținem ca rezultat al modelului nostru nu au neapărat sens în sine. Să aruncăm o privire:
-
-```python
-print(outputs.logits)
-```
-
-{#if fw === 'pt'}
-```python out
-tensor([[-1.5607,  1.6123],
-        [ 4.1692, -3.3464]], grad_fn=<AddmmBackward>)
-```
-{:else}
-```python out
-<tf.Tensor: shape=(2, 2), dtype=float32, numpy=
-    array([[-1.5606991,  1.6122842],
-           [ 4.169231 , -3.3464472]], dtype=float32)>
-```
-{/if}
-
-Modelul nostru a prezis `[-1.5607, 1.6123]` pentru prima propoziție și `[ 4.1692, -3.3464]` pentru cea de-a doua. Acestea nu sunt probabilități, ci *logits*, scorurile brute, nenormalizate, emise de ultimul strat al modelului. Pentru a fi convertite în probabilități, acestea trebuie să treacă printr-un strat [SoftMax](https://en.wikipedia.org/wiki/Softmax_function) (toate modelele 🤗 Transformers produc logits, deoarece funcția de pierdere pentru formare va fuziona în general ultima funcție de activare, cum ar fi SoftMax, cu funcția de pierdere reală, cum ar fi entropia încrucișată):
-
-{#if fw === 'pt'}
-```py
-import torch
-
-predictions = torch.nn.functional.softmax(outputs.logits, dim=-1)
-print(predictions)
-```
-{:else}
-```py
-import tensorflow as tf
-
-predictions = tf.math.softmax(outputs.logits, axis=-1)
-print(predictions)
-```
-{/if}
-
-{#if fw === 'pt'}
-```python out
-tensor([[4.0195e-02, 9.5980e-01],
-        [9.9946e-01, 5.4418e-04]], grad_fn=<SoftmaxBackward>)
-```
-{:else}
-```python out
-tf.Tensor(
-[[4.01951671e-02 9.59804833e-01]
- [9.9945587e-01 5.4418424e-04]], shape=(2, 2), dtype=float32)
-```
-{/if}
-
- 
-Acum putem vedea că modelul a prezis `[0.0402, 0.9598]` pentru prima propoziție și `[0.9995, 0.0005]` pentru cea de-a doua. Acestea sunt scoruri de probabilitate care pot fi recunoscute.
-
-Pentru a obține etichetele corespunzătoare fiecărei poziții, putem inspecta atributul `id2label` din configurația modelului (mai multe despre acest lucru în secțiunea următoare):
-
-```python
-model.config.id2label
-```
-
-```python out
-{0: 'NEGATIVE', 1: 'POSITIVE'}
-```
-Acum putem concluziona că modelul a prezis următoarele:
- 
-- Prima propoziție: NEGATIV: 0,0402, POZITIV: 0,9598
-- A doua propoziție: NEGATIVĂ: 0,9995, POZITIVĂ: 0,0005
-
-Am reprodus cu succes cele trei etape ale pipeline-ului: preprocesarea cu tokenizere, trecerea intrărilor prin model și postprocesarea! Acum haideți să analizăm în profunzime fiecare dintre aceste etape.
-
-<Tip>
-
-✏️  
-** Încercați!** Alegeți două (sau mai multe) texte proprii și treceți-le prin conducta `sentiment-analysis`. Apoi repetați pașii pe care i-ați văzut aici și verificați dacă obțineți aceleași rezultate!
-
-</Tip>
diff --git a/chapters/ro/chapter2/3.mdx b/chapters/ro/chapter2/3.mdx
deleted file mode 100644
index e0f0758df..000000000
--- a/chapters/ro/chapter2/3.mdx
+++ /dev/null
@@ -1,235 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Modele[[modele]]
-
-{#if fw === 'pt'}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section3_pt.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section3_pt.ipynb"},
-]} />
-
-{:else}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section3_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section3_tf.ipynb"},
-]} />
-
-{/if}
-
-{#if fw === 'pt'}
-<Youtube id="AhChOFRegn4"/>
-{:else}
-<Youtube id="d3JVgghSOew"/>
-{/if}
-
-{#if fw === 'pt'}
- 
-În această secțiune vom analiza mai detaliat crearea și utilizarea unui model. Vom folosi clasa `AutoModel`, care este utilă atunci când doriți să instanțiați orice model dintr-un checkpoint.
-
-Clasa `AutoModel` și toate celelalte clase înrudite sunt, de fapt, simple wrappere ale gamei largi de modele disponibile în bibliotecă. Este un wrapper inteligent, deoarece poate ghici automat arhitectura modelului corespunzător pentru checkpoint-ul dumneavoastră și apoi instanțiază un model cu această arhitectură.
-
-{:else}
- 
-În această secțiune vom analiza mai detaliat crearea și utilizarea unui model. Vom utiliza clasa `TFAutoModel`, care este utilă atunci când doriți să instanțați un model dintr-un checkpoint.
-
-Clasa `TFAutoModel` și toate clasele înrudite cu aceasta sunt de fapt simple wrappere ale gamei largi de modele disponibile în bibliotecă. Este un wrapper inteligent, deoarece poate ghici automat arhitectura modelului corespunzător pentru checkpoint-ul dumneavoastră și apoi instanțiază un model cu această arhitectură.
-
-{/if}
-
-Cu toate acestea, dacă știți ce tip de model doriți să utilizați, puteți folosi direct clasa care definește arhitectura acestuia. Să aruncăm o privire la modul în care funcționează acest lucru cu un model BERT.
-
-## Crearea unui Transformer[[crearea-unui-transformer]]
-
-Primul lucru pe care va trebui să îl facem pentru a inițializa un model BERT este să încărcăm un obiect de configurare:
-
-{#if fw === 'pt'}
-```py
-from transformers import BertConfig, BertModel
-
-# Construirea configurației
-config = BertConfig()
-
-# Construirea modelului pornind de la configurație
-model = BertModel(config)
-```
-{:else}
-```py
-from transformers import BertConfig, TFBertModel
-
-# Construirea configurației
-config = BertConfig()
-
-#  Construirea modelului pornind de la configurație
-model = TFBertModel(config)
-```
-{/if}
-
-Configurația conține multe atribute care sunt utilizate pentru a construi modelul:
-
-```py
-print(config)
-```
-
-```python out
-BertConfig {
-  [...]
-  "hidden_size": 768,
-  "intermediate_size": 3072,
-  "max_position_embeddings": 512,
-  "num_attention_heads": 12,
-  "num_hidden_layers": 12,
-  [...]
-}
-```
-
-Deși nu ați văzut încă ce fac toate aceste atribute, ar trebui să recunoașteți unele dintre ele: atributul `hidden_size` definește dimensiunea vectorului `hidden_states`, iar `num_hidden_layers` definește numărul de straturi pe care le are modelul Transformer.
-
-### Diferite metode de încărcare[[diferite-metode-de-încărcare]]
-
-Crearea unui model din configurația implicită îl inițializează cu valori aleatorii:
-
-
-{#if fw === 'pt'}
-```py
-from transformers import BertConfig, BertModel
-
-config = BertConfig()
-model = BertModel(config)
-
-# Modelul este inițializat aleatoriu!
-```
-{:else}
-```py
-from transformers import BertConfig, TFBertModel
-
-config = BertConfig()
-model = TFBertModel(config)
-
-# Modelul este inițializat aleatoriu!
-```
-{/if}
-
-Modelul poate fi utilizat în această stare, dar va produce rezultate neclare; mai întâi trebuie să fie antrenat. Am putea antrena modelul de la zero pentru sarcina în cauză, dar, după cum ați văzut în [Capitolul 1](/course/chapter1), acest lucru ar necesita mult timp și o mulțime de date și ar avea un impact semnificativ asupra mediului. Pentru a evita efortul inutil, este esențial să puteți partaja și reutiliza modelele care au fost deja formate.
-
-Încărcarea unui model Transformer care este deja instruit este simplă - putem face acest lucru utilizând metoda `from_pr
-
-{#if fw === 'pt'}
-```py
-from transformers import BertModel
-
-model = BertModel.from_pretrained("bert-base-cased")
-```
-
-După cum ați văzut mai devreme, am putea înlocui `BertModel` cu clasa `AutoModel` echivalentă. Vom face acest lucru în continuare, deoarece acest lucru produce un cod compatibil cu checkpoint-urile; dacă codul dumneavoastră funcționează pentru un checkpoint, ar trebui să funcționeze fără probleme pentru altul. Acest lucru este valabil chiar dacă arhitectura este diferită, atât timp cât checkpoint-ul a fost instruit pentru o sarcină similară (de exemplu, o sarcină de analiză a sentimentelor).
-
-{:else}
-```py
-from transformers import TFBertModel
-
-model = TFBertModel.from_pretrained("bert-base-cased")
-```
-
-După cum ați văzut mai devreme, am putea înlocui `BertModel` cu clasa `AutoModel` echivalentă. Vom face acest lucru în continuare, deoarece acest lucru produce un cod compatibil cu checkpoint-urile; dacă codul dumneavoastră funcționează pentru un checkpoint, ar trebui să funcționeze fără probleme pentru altul. Acest lucru este valabil chiar dacă arhitectura este diferită, atât timp cât checkpoint-ul a fost instruit pentru o sarcină similară (de exemplu, o sarcină de analiză a sentimentelor).
-
-{/if}
-
-În exemplul de cod de mai sus nu am utilizat `BertConfig` și, în loc de acesta, am încărcat un model preinstruit prin intermediul identificatorului `bert-base-cased`. Acesta este un checkpoint al modelului care a fost antrenat chiar de autorii BERT; puteți găsi mai multe detalii despre acesta în [model card](https://huggingface.co/bert-base-cased).
-
-Acest model este acum inițializat cu toate weight-urile din checkpoint. Acesta poate fi utilizat direct pentru inferență pe sarcinile pe care a fost antrenat și poate fi, de asemenea, ajustat pe o sarcină nouă. Prin antrenarea cu weight-uri instruite în prealabil, putem obține rapid rezultate bune.
-
-Greutățile au fost descărcate și stocate în cache (astfel încât apelurile viitoare la metoda `from_pretrained()` nu le vor descărca din nou) în folderul cache, care are ca valoare implicită *~/.cache/huggingface/transformers*. Puteți personaliza folderul cache prin setarea variabilei de mediu `HF_HOME`.
-
-Identificatorul utilizat pentru încărcarea modelului poate fi identificatorul oricărui model de pe Model Hub, atâta timp cât acesta este compatibil cu arhitectura OARET. Lista completă a  checkpoint-urilor OARET disponibile poate fi găsită [aici](https://huggingface.co/models?filter=bert).
-
-
-### Metode de păstrare[[metode-de-păstrare]]
-
-Salvarea unui model este la fel de ușoară ca încărcarea unuia - folosim metoda `save_pretrained()`, care este analogă metodei `from_pretrained()`:
-
-```py
-model.save_pretrained("directory_on_my_computer")
-```
-
-Se salvează două fișiere pe disc:
-
-{#if fw === 'pt'}
-```
-ls directory_on_my_computer
-
-config.json pytorch_model.bin
-```
-{:else}
-```
-ls directory_on_my_computer
-
-config.json tf_model.h5
-```
-{/if}
-
-Dacă aruncați o privire la fișierul *config.json*, veți recunoaște atributele necesare pentru construirea arhitecturii modelului. Acest fișier conține, de asemenea, unele metadate, cum ar fi locul de origine al checkpoint-ului și ce versiune 🤗 Transformers ați folosit când ați salvat ultima dată checkpoint-ul.
-
-{#if fw === 'pt'}
- 
-Fișierul *pytorch_model.bin* este cunoscut sub numele de *state dictionary*; acesta conține toate weight-urile modelului dumneavoastră. Cele două fișiere merg mână în mână; configurația este necesară pentru a cunoaște arhitectura modelului, în timp ce weight-urile modelului sunt parametrii modelului.
-
-{:else}
- 
-Fișierul *tf_model.h5* este cunoscut sub numele de *state dictionary*; acesta conține toate weight-urile modelului dumneavoastră. Cele două fișiere merg mână în mână; configurația este necesară pentru a cunoaște arhitectura modelului, în timp ce weight-urile modelului sunt parametrii modelului.
-
-{/if}
-
-## Utilizarea unui model Transformer pentru inferență[[utilizarea-unui-model-transformer-pentru-inferență]]
-
-
-Acum că știți cum să încărcați și să salvați un model, să încercăm să îl folosim pentru a face câteva predicții. Modelele Transformer pot procesa doar numere - numere pe care le generează tokenizatorul. Dar înainte de a discuta despre tokenizeri, să explorăm ce intrări acceptă modelul.
-
-Tokenizerii se pot ocupa de transformarea intrărilor în tensori ai framework-ului corespunzător, dar pentru a vă ajuta să înțelegeți ce se întâmplă, vom arunca o privire rapidă la ceea ce trebuie făcut înainte de trimiterea intrărilor către model.
-
-Să spunem că avem câteva secvențe:
-
-```py
-sequences = ["Hello!", "Cool.", "Nice!"]
-```
-
-Tokenizatorul le convertește în indici de vocabular care sunt denumiți în mod obișnuit *input IDs*. Fiecare secvență este acum o listă de numere! Rezultatul este:
-
-```py no-format
-encoded_sequences = [
-    [101, 7592, 999, 102],
-    [101, 4658, 1012, 102],
-    [101, 3835, 999, 102],
-]
-```
-
-Aceasta este o listă de secvențe codificate: o listă de liste. Tensorii acceptă numai forme dreptunghiulare (gândiți-vă la matrici). Această " listă " are deja o formă dreptunghiulară, astfel încât convertirea sa într-un tensor este ușoară:
-
-{#if fw === 'pt'}
-```py
-import torch
-
-model_inputs = torch.tensor(encoded_sequences)
-```
-{:else}
-```py
-import tensorflow as tf
-
-model_inputs = tf.constant(encoded_sequences)
-```
-{/if}
-
-### Utilizarea tensorilor ca intrări în model[[utilizarea-tensorilor-ca-intrări-în-to-model]]
-
-Utilizarea tensorilor cu ajutorul modelului este extrem de simplă - trebuie doar să apelăm modelul cu intrările:
-
-```py
-output = model(model_inputs)
-```
-
-Deși modelul acceptă o mulțime de argumente diferite, doar ID-urile de intrare sunt necesare. Vom explica mai târziu ce fac celelalte argumente și când sunt necesare, 
-dar mai întâi trebuie să aruncăm o privire mai atentă la tokenizerii care construiesc intrările pe care un model Transformer le poate înțelege.
\ No newline at end of file
diff --git a/chapters/ro/chapter2/4.mdx b/chapters/ro/chapter2/4.mdx
deleted file mode 100644
index c38234e14..000000000
--- a/chapters/ro/chapter2/4.mdx
+++ /dev/null
@@ -1,246 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Tokenizere[[tokenizere]]
-
-{#if fw === 'pt'}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section4_pt.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section4_pt.ipynb"},
-]} />
-
-{:else}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section4_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section4_tf.ipynb"},
-]} />
-
-{/if}
-
-<Youtube id="VFp38yj8h3A"/>
-
-
-Tokenizoarele sunt una dintre componentele de bază ale pipeline-ului NLP. Acestea au un singur scop: să transforme textul în date care pot fi prelucrate de model. Modelele pot procesa doar numere, astfel încât tokenizerii trebuie să convertească intrările noastre de text în date numerice. În această secțiune, vom explora exact ce se întâmplă în pipeline-ul de tokenizare. 
-
-În sarcinile NLP, datele care sunt în general prelucrate sunt text brut. Iată un exemplu de astfel de text:
-
-```
-Jim Henson was a puppeteer
-
-```
-
-Cu toate acestea, modelele pot procesa doar numere, deci trebuie să găsim o modalitate de a converti textul brut în numere. Asta fac tokenizerii și există o mulțime de modalități de a face acest lucru. Scopul este de a găsi cea mai relevantă reprezentare - adică cea care are cel mai mare sens pentru model - și, dacă este posibil, cea mai mică reprezentare.
-
-Să aruncăm o privire la câteva exemple de algoritmi de tokenizare și să încercăm să răspundem la unele dintre întrebările pe care le puteți avea despre tokenizare.
-
-
-
-## Word-based[[word-based]]
-
-<Youtube id="nhJxYji1aho"/>
-
- 
-Primul tip de tokenizator care îmi vine în minte este _word-based_. În general, este foarte ușor de configurat și de utilizat, cu doar câteva reguli, și adesea produce rezultate satisfăcătoare. De exemplu, în imaginea de mai jos, obiectivul este de a împărți textul brut în cuvinte și de a găsi o reprezentare numerică pentru fiecare dintre ele:
-
-<div class="flex justify-center">
-  <img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/word_based_tokenization.svg" alt="An example of word-based tokenization."/>
-  <img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/word_based_tokenization-dark.svg" alt="An example of word-based tokenization."/>
-</div>
-
- 
-Există diferite moduri de a împărți textul. De exemplu, am putea folosi spațiu pentru a tokeniza textul în cuvinte prin aplicarea funcției `split()` din Python:
-
- 
-```py
-tokenized_text = "Jim Henson was a puppeteer".split()
-print(tokenized_text)
-```
-
-```python out
-['Jim', 'Henson', 'was', 'a', 'puppeteer']
-```
-
-Există, de asemenea, variații ale tokenizerelor de cuvinte care au reguli suplimentare pentru punctuație. Cu acest tip de tokenizator, putem ajunge la „vocabulare” destul de mari, unde un vocabular este definit de numărul total de token-uri independente pe care le avem în corpus.
-
-Fiecărui cuvânt i se atribuie un ID, începând de la 0 și mergând până la dimensiunea vocabularului. Modelul utilizează aceste ID-uri pentru a identifica fiecare cuvânt.
-
-Dacă dorim să acoperim complet o limbă cu un tokenizer bazat pe cuvinte, va trebui să avem un identificator pentru fiecare cuvânt din limbă, ceea ce va genera o cantitate uriașă de token-uri. De exemplu, există peste 500 000 de cuvinte în limba engleză, astfel încât, pentru a construi o hartă de la fiecare cuvânt la un ID de intrare, ar trebui să ținem evidența unui număr atât de mare de ID-uri. În plus, cuvinte precum „dog” sunt reprezentate diferit de cuvinte precum „dogs”, iar modelul nu va avea inițial nicio modalitate de a ști că „dog” și „dogs” sunt similare: va identifica cele două cuvinte ca neavând legătură. Același lucru este valabil și pentru alte cuvinte similare, precum „run” și „running”, pe care modelul nu le va vedea inițial ca fiind similare.
-
-În cele din urmă, avem nevoie de un token personalizat pentru a reprezenta cuvintele care nu se află în vocabularul nostru. Acesta este cunoscut sub numele de token "necunoscut", adesea reprezentat ca "[UNK]" sau "&lt;unk&gt;". În general, este un indiciu rău dacă vedeți că tokenizatorul produce o mulțime de astfel de token-uri, deoarece nu a fost capabil să recupereze reprezentarea sensibilă a unui cuvânt și veți pierde informații pe parcurs. Scopul elaborării vocabularului este de a face în așa fel încât tokenizatorul să tokenizeze cât mai puține cuvinte posibil în tokenul necunoscut.
-
-O modalitate de a reduce numărul de token-uri necunoscute este de a merge un nivel mai adânc, folosind un tokenizer _character-based_.
-
-## Character-based[[character-based]]
-
-<Youtube id="ssLq_EK2jLE"/>
-
-
-Tokenizerele character-based împart textul în caractere, și nu în cuvinte. Acest lucru are două beneficii principale:
-
-- Dimensiunea vocabularului este mult mai mică.
-- Există mult mai puține token-uri în afara vocabularului (necunoscute), deoarece fiecare cuvânt poate fi construit din caractere.
-
-Dar și aici apar unele probleme legate de spații și punctuație:
-
-
-<div class="flex justify-center">
-  <img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/character_based_tokenization.svg" alt="An example of character-based tokenization."/>
-  <img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/character_based_tokenization-dark.svg" alt="An example of character-based tokenization."/>
-</div>
-
- 
-Nici această abordare nu este perfectă. Deoarece reprezentarea se bazează acum pe caractere și nu pe cuvinte, s-ar putea spune că, din punct de vedere intuitiv, este mai puțin relevantă: fiecare caracter nu înseamnă mult în sine, în timp ce în cazul cuvintelor situația este diferită. Totuși, acest lucru variază din nou în funcție de limbă; în chineză, de exemplu, fiecare caracter conține mai multe informații decât un caracter într-o limbă latină.
-
-Un alt lucru care trebuie luat în considerare este faptul că ne vom trezi cu o cantitate foarte mare de token-uri care vor fi prelucrate de modelul nostru: în timp ce un cuvânt ar fi un singur token cu un tokenizator bazat pe cuvinte, acesta se poate transforma cu ușurință în 10 sau mai multe token-uri atunci când este convertit în caractere.
-
-Pentru a obține ce este mai bun din ambele lumi, putem utiliza o a treia tehnică care combină cele două abordări: *subword tokenization*.
-
-## Subword tokenization[[subword-tokenization]]
-
-<Youtube id="zHvTiHr506c"/>
-
-Algoritmii "Subword Tokenization " se bazează pe principiul conform căruia cuvintele utilizate frecvent nu ar trebui să fie împărțite în cuvinte secundare mai mici, dar cuvintele rare ar trebui să fie descompuse în cuvinte secundare semnificative.
-
-De exemplu, " annoyingly " ar putea fi considerat un cuvânt rar și ar putea fi descompus în " annoying " și " ly ". Este probabil ca ambele să apară mai frecvent ca subcuvinte de sine stătătoare, în timp ce, în același timp, sensul cuvântului " annoyingly " este păstrat de sensul compus al cuvintelor " annoying " și " ly ".
-
-Iată un exemplu care arată modul în care un algoritm de subword tokenization ar tokeniza secvența "Let's do tokenization!":
-
-<div class="flex justify-center">
-  <img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/bpe_subword.svg" alt="A subword tokenization algorithm."/>
-  <img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/bpe_subword-dark.svg" alt="A subword tokenization algorithm."/>
-</div>
-
-Aceste părți de cuvinte oferă în cele din urmă o mulțime de semnificații semantice: în exemplul de mai sus, "tokenization" a fost împărțit în "token" și "ization", două cuvinte care au o semnificație semantică, fiind în același timp eficiente din punct de vedere al spațiului (sunt necesare doar două cuvinte pentru a reprezenta un cuvânt lung). Acest lucru ne permite să avem o acoperire relativ bună cu vocabulare de dimensiuni mici și aproape fără token-uri necunoscute.
-
-Această abordare este utilă în special în limbile aglutinative, cum ar fi turca, în care se pot forma cuvinte complexe (aproape) arbitrar de lungi prin combinarea părților de cuvinte.
-
-### Și nu numai![[și-nu-numai]]
-
-Nu este surprinzător faptul că există mult mai multe tehnici. Iată câteva:
-
-- BPE la nivel de byte, utilizată în GPT-2
-- WordPiece, utilizată în BERT
-- SentencePiece sau Unigram, utilizate în mai multe modele multilingve
-
-Acum ar trebui să cunoașteți destul de bine cum funcționează tokenizerele pentru a începe să utilizați API-
-
-## Încărcarea și salvarea[[încărcarea-și-salvarea]]
-
-Încărcarea și salvarea tokenizerelor este la fel de simplă ca în cazul modelelor. De fapt, se bazează pe aceleași două metode: `from_pretrained()` și `save_pretrained()`. Aceste metode vor încărca sau salva algoritmul utilizat de tokenizator (un pic ca *arhitectura* modelului), precum și vocabularul său (un pic ca *weight-urile* modelului).
-
-Încărcarea tokenizatorului BERT antrenat cu același punct de control ca BERT se face în același mod ca și încărcarea modelului, cu excepția faptului că folosim clasa `BertTokenizer`:
-
-```py
-from transformers import BertTokenizer
-
-tokenizer = BertTokenizer.from_pretrained("bert-base-cased")
-```
-
-{#if fw === 'pt'}
-Similar cu `AutoModel`, clasa `AutoTokenizer` va prelua clasa tokenizer corespunzătoare din bibliotecă pe baza numelui checkpoint-ului și poate fi utilizată direct cu orice checkpoint:
-
-{:else}
-Similar cu `TFAutoModel`, clasa `AutoTokenizer` va prelua clasa tokenizer corespunzătoare din bibliotecă pe baza numelui checkpoint-ului și poate fi utilizată direct cu orice checkpoint:
-
-{/if}
-
-```py
-from transformers import AutoTokenizer
-
-tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
-```
-
-Acum putem utiliza tokenizatorul așa cum am arătat în secțiunea anterioară:
-
-```python
-tokenizer("Using a Transformer network is simple")
-```
-
-```python out
-{'input_ids': [101, 7993, 170, 11303, 1200, 2443, 1110, 3014, 102],
- 'token_type_ids': [0, 0, 0, 0, 0, 0, 0, 0, 0],
- 'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1, 1]}
-```
-
-Salvarea unui tokenizer este identică cu salvarea unui model:
-
-```py
-tokenizer.save_pretrained("directory_on_my_computer")
-```
-
-Vom vorbi mai mult despre `token_type_ids` în [Capitolul 3](/course/chapter3) și vom explica cheia `attention_mask` puțin mai târziu. Mai întâi, să vedem cum sunt generate `input_ids`. Pentru a face acest lucru, va trebui să ne uităm la metodele intermediare ale tokenizatorului.
-
-## Codificarea[[codificarea]]
-
-<Youtube id="Yffk5aydLzg"/>
-
-Al doilea pas este să convertim aceste token-uri în numere, astfel încât să putem construi un tensor din ele și să le introducem în model. Pentru a face acest lucru, tokenizatorul are un *vocabular*, care este partea pe care o descărcăm atunci când îl instanțiem cu metoda `from_pretrained()`. Din nou, trebuie să folosim același vocabular utilizat atunci când modelul a fost preinstruit.
-
-Pentru a înțelege mai bine cele două etape, le vom explora separat. Rețineți că vom utiliza unele metode care efectuează părți ale pipeline-ului de tokenizare separat pentru a vă arăta rezultatele intermediare ale acestor etape, dar, în practică, ar trebui să apelați tokenizatorul direct pe intrările dvs. (așa cum se arată în secțiunea 2).
-
-### Tokenizarea[[tokenizarea]]
-
-Procesul de tokenizare este realizat prin metoda `tokenize()`:
-
-```py
-from transformers import AutoTokenizer
-
-tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
-
-sequence = "Using a Transformer network is simple"
-tokens = tokenizer.tokenize(sequence)
-
-print(tokens)
-```
-
-Rezultatul acestei metode este o listă de șiruri de caractere, sau token-uri:
-
-```python out
-['Using', 'a', 'transform', '##er', 'network', 'is', 'simple']
-```
-
-Acest tokenizator este un tokenizator de părți de cuvinte: împarte cuvintele până când obține token-uri care pot fi reprezentate de vocabularul său. Acesta este cazul aici cu `transformer`, care este împărțit în două token-uri: `transform` și `##er`
-
-### De la token-uri la ID-uri de intrare[[de-la-token-uri-la-id-uri-de-intrare]]
-
-Conversia în ID-uri de intrare este gestionată de metoda de tokenizare `convert_tokens_to_ids()`:
-
-```py
-ids = tokenizer.convert_tokens_to_ids(tokens)
-
-print(ids)
-```
-
-```python out
-[7993, 170, 11303, 1200, 2443, 1110, 3014]
-```
-
-Aceste rezultate, odată convertite în tensorul framework-ului corespunzător, pot fi apoi utilizate ca intrări într-un model, așa cum am văzut mai devreme în acest capitol.
-
-<Tip>
-
-✏️ ** Încercați!** Replicați ultimii doi pași (tokenizarea și conversia în ID-uri de intrare) pe propozițiile de intrare pe care le-am folosit în secțiunea 2 ("I've been waiting for a HuggingFace course my whole life." și "I hate this so much!"). Verificați dacă obțineți aceleași ID-uri de intrare pe care le-am obținut mai devreme! 
-
-</Tip>
-
-## Decodificare[[decodificare]]
-
-*Decodificarea* este inversă: din indicii vocabularului, dorim să obținem un șir de caractere. Acest lucru poate fi realizat cu metoda `decode()` după cum urmează:
-
-```py
-decoded_string = tokenizer.decode([7993, 170, 11303, 1200, 2443, 1110, 3014])
-print(decoded_string)
-```
-
-```python out
-'Using a Transformer network is simple'
-```
-
-Rețineți că metoda `decode` nu numai că convertește indicii înapoi în token-uri, dar și grupează token-urile care fac parte din aceleași cuvinte pentru a produce o propoziție inteligibilă. Acest comportament va fi extrem de util atunci când vom utiliza modele care prezic text nou (fie text generat de un prompt, fie pentru probleme sequence-to-sequence, precum traducerea sau rezumarea).
-
-Până acum ar trebui să înțelegeți operațiunile atomice pe care le poate gestiona un tokenizator: tokenizarea, conversia în ID-uri și conversia ID-urilor înapoi într-un șir. Cu toate acestea, am atins doar vârful icebergului. În secțiunea următoare, vom aborda limitele metodei noastre și vom vedea cum să le depășim.
diff --git a/chapters/ro/chapter2/5.mdx b/chapters/ro/chapter2/5.mdx
deleted file mode 100644
index 1d71f6188..000000000
--- a/chapters/ro/chapter2/5.mdx
+++ /dev/null
@@ -1,338 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Gestionarea secvențelor multiple[[gestionarea-secvențelor-multiple]]
-
-{#if fw === 'pt'}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section5_pt.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section5_pt.ipynb"},
-]} />
-
-{:else}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section5_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section5_tf.ipynb"},
-]} />
-
-{/if}
-
-{#if fw === 'pt'}
-<Youtube id="M6adb1j2jPI"/>
-{:else}
-<Youtube id="ROxrFOEbsQE"/>
-{/if}
-
-În secțiunea anterioară, am explorat cel mai simplu caz de utilizare: realizarea de inferențe pe o singură secvență de lungime mică. Cu toate acestea, apar deja unele întrebări:
-
-- Cum gestionăm secvențe multiple?
-- Cum gestionăm secvențe multiple *de lungimi diferite*?
-- Indicii vocabularului sunt singurele intrări care permit unui model să funcționeze bine?
-- Există o secvență prea lungă?
-
-Să vedem ce tipuri de probleme prezintă aceste întrebări și cum le putem rezolva folosind API-ul 🤗 Transformers.
-
-
-## Modelele așteaptă un lot de intrări[[modelele-așteaptă-un-lot-de-intrări]]
-
-În exercițiul anterior ați văzut cum secvențele sunt transformate în liste de numere. Să convertim această listă de numere într-un tensor și să o transmitem modelului:
-
-{#if fw === 'pt'}
-```py
-import torch
-from transformers import AutoTokenizer, AutoModelForSequenceClassification
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
-
-sequence = "I've been waiting for a HuggingFace course my whole life."
-
-tokens = tokenizer.tokenize(sequence)
-ids = tokenizer.convert_tokens_to_ids(tokens)
-input_ids = torch.tensor(ids)
-# Această linie va eșua.
-model(input_ids)
-```
-
-```python out
-IndexError: Dimension out of range (expected to be in range of [-1, 0], but got 1)
-```
-{:else}
-```py
-import tensorflow as tf
-from transformers import AutoTokenizer, TFAutoModelForSequenceClassification
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint)
-
-sequence = "I've been waiting for a HuggingFace course my whole life."
-
-tokens = tokenizer.tokenize(sequence)
-ids = tokenizer.convert_tokens_to_ids(tokens)
-input_ids = tf.constant(ids)
-# This line will fail.
-model(input_ids)
-```
-
-```py out
-InvalidArgumentError: Input to reshape is a tensor with 14 values, but the requested shape has 196 [Op:Reshape]
-```
-{/if}
-
-Oh, nu! De ce a eșuat? Am urmat pașii din pipeline-ul din secțiunea 2.
-
-Problema este că am trimis o singură secvență către model, în timp ce modelele 🤗 Transformers așteaptă în mod implicit mai multe propoziții. Aici am încercat să facem tot ce a făcut tokenizatorul în fundal atunci când l-am aplicat unei `secvențe`. Dar, dacă vă uitați cu atenție, veți vedea că tokenizatorul nu a convertit doar lista de ID-uri de intrare într-un tensor, ci a adăugat și o dimensiune peste aceasta:
-
-{#if fw === 'pt'}
-```py
-tokenized_inputs = tokenizer(sequence, return_tensors="pt")
-print(tokenized_inputs["input_ids"])
-```
-
-```python out
-tensor([[  101,  1045,  1005,  2310,  2042,  3403,  2005,  1037, 17662, 12172,
-          2607,  2026,  2878,  2166,  1012,   102]])
-```
-{:else}
-```py
-tokenized_inputs = tokenizer(sequence, return_tensors="tf")
-print(tokenized_inputs["input_ids"])
-```
-
-```py out
-<tf.Tensor: shape=(1, 16), dtype=int32, numpy=
-array([[  101,  1045,  1005,  2310,  2042,  3403,  2005,  1037, 17662,
-        12172,  2607,  2026,  2878,  2166,  1012,   102]], dtype=int32)>
-```
-{/if}
-
-Să încercăm din nou și să adăugăm o nouă dimensiune:
-
-{#if fw === 'pt'}
-```py
-import torch
-from transformers import AutoTokenizer, AutoModelForSequenceClassification
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
-
-sequence = "I've been waiting for a HuggingFace course my whole life."
-
-tokens = tokenizer.tokenize(sequence)
-ids = tokenizer.convert_tokens_to_ids(tokens)
-
-input_ids = torch.tensor([ids])
-print("Input IDs:", input_ids)
-
-output = model(input_ids)
-print("Logits:", output.logits)
-```
-{:else}
-```py
-import tensorflow as tf
-from transformers import AutoTokenizer, TFAutoModelForSequenceClassification
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint)
-
-sequence = "I've been waiting for a HuggingFace course my whole life."
-
-tokens = tokenizer.tokenize(sequence)
-ids = tokenizer.convert_tokens_to_ids(tokens)
-
-input_ids = tf.constant([ids])
-print("Input IDs:", input_ids)
-
-output = model(input_ids)
-print("Logits:", output.logits)
-```
-{/if}
-
-Imprimăm ID-urile de intrare, precum și logit-urile rezultate - iată rezultatul:
-
-{#if fw === 'pt'}
-```python out
-Input IDs: [[ 1045,  1005,  2310,  2042,  3403,  2005,  1037, 17662, 12172,  2607, 2026,  2878,  2166,  1012]]
-Logits: [[-2.7276,  2.8789]]
-```
-{:else}
-```py out
-Input IDs: tf.Tensor(
-[[ 1045  1005  2310  2042  3403  2005  1037 17662 12172  2607  2026  2878
-   2166  1012]], shape=(1, 14), dtype=int32)
-Logits: tf.Tensor([[-2.7276208  2.8789377]], shape=(1, 2), dtype=float32)
-```
-{/if}
-
-Gruparea în loturi este acțiunea de a trimite mai multe propoziții prin model, toate odată. Dacă aveți o singură propoziție, puteți crea un lot cu o singură secvență: 
-
-```
-batched_ids = [ids, ids]
-```
-
-Acesta este un lot de două secvențe identice!
-
-<Tip>
-
-✏️ ** Încercați!** Convertiți această listă `batched_ids` într-un tensor și treceți-o prin modelul dumneavoastră. Verificați dacă obțineți aceleași logits ca înainte (dar de două ori)!
-
-</Tip>
-
-Gruparea în loturi permite modelului să funcționeze atunci când îi furnizați mai multe secvențe. Utilizarea mai multor secvențe este la fel de simplă ca și crearea unui lot cu o singură secvență. Există însă o a doua problemă. Atunci când încercați să combinați două (sau mai multe) propoziții, acestea pot avea lungimi diferite. Dacă ați mai lucrat vreodată cu tensori, știți că aceștia trebuie să aibă o formă dreptunghiulară, deci nu veți putea converti direct lista de ID-uri de intrare într-un tensor. Pentru a rezolva această problemă, de obicei *umplem* datele de intrare.
-
-## Umplerea datelor de intrare[[umplerea-datelor-de-intrare]]
-
-Următoarea serie de liste nu poate fi convertită într-un tensor:
-
-```py no-format
-batched_ids = [
-    [200, 200, 200],
-    [200, 200]
-]
-```
-
-Pentru a ocoli acest lucru, vom folosi *padding-ul* pentru ca tensorii noștri să aibă o formă dreptunghiulară. Padding-ul (umplerea datelor) asigură că toate propozițiile noastre au aceeași lungime prin adăugarea unui cuvânt special numit *padding token* la propozițiile cu mai puține valori. De exemplu, dacă aveți 10 propoziții cu 10 cuvinte și 1 propoziție cu 20 de cuvinte, padding-ul va asigura că toate propozițiile au 20 de cuvinte. În exemplul nostru, tensorul rezultat arată astfel:
-
-```py no-format
-padding_id = 100
-
-batched_ids = [
-    [200, 200, 200],
-    [200, 200, padding_id],
-]
-```
-
-ID-ul token-ului de umplere poate fi găsit în `tokenizer.pad_token_id`. Să-l folosim și să trimitem cele două propoziții prin model în mod separat și grupate împreună:
-
-{#if fw === 'pt'}
-```py no-format
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
-
-sequence1_ids = [[200, 200, 200]]
-sequence2_ids = [[200, 200]]
-batched_ids = [
-    [200, 200, 200],
-    [200, 200, tokenizer.pad_token_id],
-]
-
-print(model(torch.tensor(sequence1_ids)).logits)
-print(model(torch.tensor(sequence2_ids)).logits)
-print(model(torch.tensor(batched_ids)).logits)
-```
-
-```python out
-tensor([[ 1.5694, -1.3895]], grad_fn=<AddmmBackward>)
-tensor([[ 0.5803, -0.4125]], grad_fn=<AddmmBackward>)
-tensor([[ 1.5694, -1.3895],
-        [ 1.3373, -1.2163]], grad_fn=<AddmmBackward>)
-```
-{:else}
-```py no-format
-model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint)
-
-sequence1_ids = [[200, 200, 200]]
-sequence2_ids = [[200, 200]]
-batched_ids = [
-    [200, 200, 200],
-    [200, 200, tokenizer.pad_token_id],
-]
-
-print(model(tf.constant(sequence1_ids)).logits)
-print(model(tf.constant(sequence2_ids)).logits)
-print(model(tf.constant(batched_ids)).logits)
-```
-
-```py out
-tf.Tensor([[ 1.5693678 -1.3894581]], shape=(1, 2), dtype=float32)
-tf.Tensor([[ 0.5803005  -0.41252428]], shape=(1, 2), dtype=float32)
-tf.Tensor(
-[[ 1.5693681 -1.3894582]
- [ 1.3373486 -1.2163193]], shape=(2, 2), dtype=float32)
-```
-{/if}
-
-Este ceva în neregulă cu logit-urile din predicțiile noastre grupate: al doilea rând ar trebui să fie identic cu logit-urile pentru a doua propoziție, dar avem valori complet diferite!
-
-Acest lucru se datorează faptului că principala caracteristică a modelelor Transformer sunt straturile de atenție care *contextualizează* fiecare token. Acestea vor lua în considerare token-urile de umplutură, deoarece se ocupă de toate token-urile unei secvențe. Pentru a obține același rezultat atunci când trecem propoziții individuale de diferite lungimi prin model sau atunci când trecem un lot cu aceleași propoziții și același umplutură aplicată, trebuie să spunem acelor straturi de atenție să ignore token-urile de umplutură. Acest lucru se realizează prin utilizarea unei măști de atenție (attention mask).
-
-## Attention masks(măști de atenție)[[attention-masks]]
-
-*Măștile de atenție* sunt tensori cu exact aceeași formă ca tensorul ID-urilor de intrare, completate cu 0 și 1: valorile 1 indică faptul că ar trebui să se acorde atenție token-urilor corespunzătoare, iar valorile 0 indică faptul că nu ar trebui să se acorde atenție token-urilor corespunzătoare (adică acestea ar trebui ignorate de straturile de atenție ale modelului).
-
-Să completăm exemplul anterior cu o mască de atenție:
-
-{#if fw === 'pt'}
-```py no-format
-batched_ids = [
-    [200, 200, 200],
-    [200, 200, tokenizer.pad_token_id],
-]
-
-attention_mask = [
-    [1, 1, 1],
-    [1, 1, 0],
-]
-
-outputs = model(torch.tensor(batched_ids), attention_mask=torch.tensor(attention_mask))
-print(outputs.logits)
-```
-
-```python out
-tensor([[ 1.5694, -1.3895],
-        [ 0.5803, -0.4125]], grad_fn=<AddmmBackward>)
-```
-{:else}
-```py no-format
-batched_ids = [
-    [200, 200, 200],
-    [200, 200, tokenizer.pad_token_id],
-]
-
-attention_mask = [
-    [1, 1, 1],
-    [1, 1, 0],
-]
-
-outputs = model(tf.constant(batched_ids), attention_mask=tf.constant(attention_mask))
-print(outputs.logits)
-```
-
-```py out
-tf.Tensor(
-[[ 1.5693681  -1.3894582 ]
- [ 0.5803021  -0.41252586]], shape=(2, 2), dtype=float32)
-```
-{/if}
-
-Acum obținem aceeași logits pentru a doua propoziție din lot.
-
-Observăm cum ultima valoare a celei de-a doua secvențe este un ID de umplere, care este o valoare 0 în masca de atenție.
-
-<Tip>
-
-✏️ ** Încercați!** Aplicați manual tokenizarea pe cele două propoziții utilizate în secțiunea 2 ("I've been waiting for a HuggingFace course my whole life." și "I hate this so much!"). Treceți-le prin model și verificați dacă obțineți aceeași logiți ca în secțiunea 2. Acum grupați-le împreună folosind token-ul de umplere, apoi creați masca de atenție corespunzătoare. Verificați dacă obțineți aceleași rezultate atunci când parcurgeți modelul!
-
-</Tip>
-
-## Secvențe mai lungi[[secvențe-mai-lungi]]
-
-Cu modelele Transformer, există o limită a lungimii secvențelor pe care le putem transmite modelelor. Majoritatea modelelor gestionează secvențe de până la 512 sau 1024 de token-uri și se vor bloca atunci când li se cere să proceseze secvențe mai lungi. Există două soluții la această problemă:
-
-- Utilizați un model cu o lungime de secvență acceptată mai mare.
-- Trunchiați secvențele.
-
-Modelele au diferite lungimi de secvență acceptate, iar unele sunt specializate în tratarea secvențelor foarte lungi. [Longformer](https://huggingface.co/docs/transformers/model_doc/longformer) este un exemplu, iar altul este [LED](https://huggingface.co/docs/transformers/model_doc/led). Dacă lucrați la o sarcină care necesită secvențe foarte lungi, vă recomandăm să aruncați o privire la aceste modele.
-
-În caz contrar, vă recomandăm să vă trunchiați secvențele prin specificarea parametrului `max_sequence_length`:
-```py
-sequence = sequence[:max_sequence_length]
-```
diff --git a/chapters/ro/chapter2/6.mdx b/chapters/ro/chapter2/6.mdx
deleted file mode 100644
index a95a92d56..000000000
--- a/chapters/ro/chapter2/6.mdx
+++ /dev/null
@@ -1,164 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Să punem totul cap la cap[[să-punem-totul-cap-la-cap]]
-
-{#if fw === 'pt'}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section6_pt.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section6_pt.ipynb"},
-]} />
-
-{:else}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section6_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section6_tf.ipynb"},
-]} />
-
-{/if}
-
-În ultimele secțiuni, ne-am străduit să facem cea mai mare parte a muncii manual. Am explorat modul în care funcționează tokenizerele și am analizat tokenizarea, conversia în ID-uri de intrare, padding, trunchiere și măști de atenție.
-
-Cu toate acestea, după cum am văzut în secțiunea 2, API-ul 🤗 Transformers poate gestiona toate acestea pentru noi cu o funcție de nivel înalt în care ne vom adânci aici. Atunci când apelați `tokenizer` direct pe propoziție, primiți înapoi intrări care sunt gata să treacă prin modelul dvs:
-
-```py
-from transformers import AutoTokenizer
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-
-sequence = "I've been waiting for a HuggingFace course my whole life."
-
-model_inputs = tokenizer(sequence)
-```
-
-Aici, variabila `model_inputs` conține tot ceea ce este necesar pentru ca un model să funcționeze bine. Pentru DistilBERT, aceasta include ID-urile de intrare, precum și masca de atenție. Alte modele care acceptă intrări suplimentare le vor avea, de asemenea, la ieșire prin obiectul `tokenizer`.
-
-După cum vom vedea în câteva exemple de mai jos, această metodă este foarte eficientă. În primul rând, poate tokeniza o singură secvență:
-
-```py
-sequence = "I've been waiting for a HuggingFace course my whole life."
-
-model_inputs = tokenizer(sequence)
-```
-
-De asemenea, gestionează mai multe secvențe simultan, fără nicio modificare a API-ului:
-
-```py
-sequences = ["I've been waiting for a HuggingFace course my whole life.", "So have I!"]
-
-model_inputs = tokenizer(sequences)
-```
-
-Acesta poate umple în funcție de mai multe obiective:
-
-```py
-# Va umple secvențele până la lungimea maximă a secvenței
-model_inputs = tokenizer(sequences, padding="longest")
-
-# Va umple secvențele până la lungimea maximă a modelului
-# (512 pentru BERT sau DistilBERT)
-model_inputs = tokenizer(sequences, padding="max_length")
-
-# Va umple secvențele până la lungimea maximă specificată
-model_inputs = tokenizer(sequences, padding="max_length", max_length=8)
-```
-
-De asemenea, poate trunchia secvențele:
-
-```py
-sequences = ["I've been waiting for a HuggingFace course my whole life.", "So have I!"]
-
-# Va trunchia secvențele care sunt mai lungi decât lungimea maximă a modelului
-# (512 pentru BERT sau DistilBERT)
-model_inputs = tokenizer(sequences, truncation=True)
-
-# Va trunchia secvențele care sunt mai lungi decât lungimea maximă specificată
-model_inputs = tokenizer(sequences, max_length=8, truncation=True)
-```
-
-Obiectul `tokenizer` poate gestiona conversia în tensori specifici framework-ului, care pot fi apoi trimiși direct la model. De exemplu, în următorul exemplu de cod, solicităm tokenizatorului să returneze tensori din diferite cadre - `„pt”` returnează tensori PyTorch, `„tf”` returnează tensori TensorFlow, iar `„np”` returnează matrici NumPy:
-
-```py
-sequences = ["I've been waiting for a HuggingFace course my whole life.", "So have I!"]
-
-# Returnează tensori PyTorch
-model_inputs = tokenizer(sequences, padding=True, return_tensors="pt")
-
-# Returnează tensori TensorFlow 
-model_inputs = tokenizer(sequences, padding=True, return_tensors="tf")
-
-# Returnează array-uri NumPy 
-model_inputs = tokenizer(sequences, padding=True, return_tensors="np")
-```
-
-## Token-uri speciale[[token-uri-speciale]]
-
-Dacă aruncăm o privire la ID-urile de intrare returnate de tokenizer, vom vedea că sunt puțin diferite de cele pe care le-am avut mai devreme:
-
-```py
-sequence = "I've been waiting for a HuggingFace course my whole life."
-
-model_inputs = tokenizer(sequence)
-print(model_inputs["input_ids"])
-
-tokens = tokenizer.tokenize(sequence)
-ids = tokenizer.convert_tokens_to_ids(tokens)
-print(ids)
-```
-
-```python out
-[101, 1045, 1005, 2310, 2042, 3403, 2005, 1037, 17662, 12172, 2607, 2026, 2878, 2166, 1012, 102]
-[1045, 1005, 2310, 2042, 3403, 2005, 1037, 17662, 12172, 2607, 2026, 2878, 2166, 1012]
-```
-
-Un token ID a fost adăugat la început, iar unul la sfârșit. Să decodificăm cele două secvențe de ID-uri de mai sus pentru a vedea despre ce este vorba:
-
-```py
-print(tokenizer.decode(model_inputs["input_ids"]))
-print(tokenizer.decode(ids))
-```
-
-```python out
-"[CLS] i've been waiting for a huggingface course my whole life. [SEP]"
-"i've been waiting for a huggingface course my whole life."
-```
-
-Tokenizatorul a adăugat cuvântul special `[CLS]` la început și cuvântul special `[SEP]` la sfârșit. Acest lucru se datorează faptului că modelul a fost preinstruit cu aceste cuvinte, deci pentru a obține aceleași rezultate pentru inferență trebuie să le adăugăm și pe acestea. Rețineți că unele modele nu adaugă cuvinte speciale sau adaugă cuvinte diferite; de asemenea, modelele pot adăuga aceste cuvinte speciale doar la început sau doar la sfârșit. În orice caz, tokenizatorul știe care sunt cele așteptate și se va ocupa de acest lucru pentru dumneavoastră.
-
-## Încheiere: De la tokenizer la model[[încheiere-de-la-tokenizator--model]]
-
-Acum că am văzut toți pașii individuali pe care îi utilizează obiectul `tokenizer` atunci când este aplicat pe texte, să vedem o ultimă dată cum poate gestiona secvențe multiple (padding!), secvențe foarte lungi (trunchiere!) și mai multe tipuri de tensori cu API-ul său principal:
-
-{#if fw === 'pt'}
-```py
-import torch
-from transformers import AutoTokenizer, AutoModelForSequenceClassification
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
-sequences = ["I've been waiting for a HuggingFace course my whole life.", "So have I!"]
-
-tokens = tokenizer(sequences, padding=True, truncation=True, return_tensors="pt")
-output = model(**tokens)
-```
-{:else}
-```py
-import tensorflow as tf
-from transformers import AutoTokenizer, TFAutoModelForSequenceClassification
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint)
-sequences = ["I've been waiting for a HuggingFace course my whole life.", "So have I!"]
-
-tokens = tokenizer(sequences, padding=True, truncation=True, return_tensors="tf")
-output = model(**tokens)
-```
-{/if}
diff --git a/chapters/ro/chapter2/7.mdx b/chapters/ro/chapter2/7.mdx
deleted file mode 100644
index 2e6f1175c..000000000
--- a/chapters/ro/chapter2/7.mdx
+++ /dev/null
@@ -1,19 +0,0 @@
-# Utilizarea de bază este completă![[utilizarea-de-bază-este-completă]]
-
-<CourseFloatingBanner
-    chapter={2}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
- 
-Ați făcut o treabă excelentă dacă ați urmat cursul până aici! Pentru a sintetiza, în acest capitol ați:
-
-- Ați învățat elementele de bază ale unui model Transformer.
-- Ați învățat ce formează un pipeline de tokenizare.
-- Ați văzut cum să utilizați un model Transformer în practică.
-- Ați învățat cum să folosiți un tokenizer pentru a converti textul în tensori care sunt inteligibili pentru model.
-- Am configurat împreună un tokenizer și un model pentru a ajunge de la text la predicții.
-- Am învățat limitările ID-urilor de intrare și am învățat despre attention masks(măști de atenție).
-- V-ați antrenat cu ajutorul metodelor versatile și configurabile ale tokenizatorului.
-
-De acum înainte, ar trebui să puteți naviga liber prin documentele 🤗 Transformers: vocabularul va suna familiar și ați văzut deja metodele pe care le veți utiliza în majoritatea timpului.
\ No newline at end of file
diff --git a/chapters/ro/chapter2/8.mdx b/chapters/ro/chapter2/8.mdx
deleted file mode 100644
index c41f27936..000000000
--- a/chapters/ro/chapter2/8.mdx
+++ /dev/null
@@ -1,310 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-<!-- DISABLE-FRONTMATTER-SECTIONS -->
-
-# End-of-chapter quiz[[end-of-chapter-quiz]]
-
-<CourseFloatingBanner
-    chapter={2}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-### 1. What is the order of the language modeling pipeline?
-
-<Question
-	choices={[
-		{
-			text: "First, the model, which handles text and returns raw predictions. The tokenizer then makes sense of these predictions and converts them back to text when needed.",
-			explain: "The model cannot understand text! The tokenizer must first tokenize the text and convert it to IDs so that it is understandable by the model."
-		},
-		{
-			text: "First, the tokenizer, which handles text and returns IDs. The model handles these IDs and outputs a prediction, which can be some text.",
-			explain: "The model's prediction cannot be text straight away. The tokenizer has to be used in order to convert the prediction back to text!"
-		},
-		{
-			text: "The tokenizer handles text and returns IDs. The model handles these IDs and outputs a prediction. The tokenizer can then be used once again to convert these predictions back to some text.",
-			explain: "Correct! The tokenizer can be used for both tokenizing and de-tokenizing.",
-            correct: true
-		}
-	]}
-/>
-
-### 2. How many dimensions does the tensor output by the base Transformer model have, and what are they?
-
-<Question
-	choices={[
-		{
-			text: "2: The sequence length and the batch size",
-			explain: "False! The tensor output by the model has a third dimension: hidden size."
-		},
-		{
-			text: "2: The sequence length and the hidden size",
-			explain: "False! All Transformer models handle batches, even with a single sequence; that would be a batch size of 1!"
-		},
-		{
-			text: "3: The sequence length, the batch size, and the hidden size",
-			explain: "Correct!",
-            correct: true
-		}
-	]}
-/>
-
-### 3. Which of the following is an example of subword tokenization?
-
-<Question
-	choices={[
-		{
-			text: "WordPiece",
-			explain: "Yes, that's one example of subword tokenization!",
-            correct: true
-		},
-		{
-			text: "Character-based tokenization",
-			explain: "Character-based tokenization is not a type of subword tokenization."
-		},
-		{
-			text: "Splitting on whitespace and punctuation",
-			explain: "That's a word-based tokenization scheme!"
-		},
-		{
-			text: "BPE",
-			explain: "Yes, that's one example of subword tokenization!",
-            correct: true
-        },
-		{
-			text: "Unigram",
-			explain: "Yes, that's one example of subword tokenization!",
-            correct: true
-        },
-		{
-			text: "None of the above",
-			explain: "Incorrect!"
-        }
-	]}
-/>
-
-### 4. What is a model head?
-
-<Question
-	choices={[
-		{
-			text: "A component of the base Transformer network that redirects tensors to their correct layers",
-			explain: "Incorrect! There's no such component."
-		},
-		{
-			text: "Also known as the self-attention mechanism, it adapts the representation of a token according to the other tokens of the sequence",
-			explain: "Incorrect! The self-attention layer does contain attention \"heads,\" but these are not adaptation heads."
-		},
-		{
-			text: "An additional component, usually made up of one or a few layers, to convert the transformer predictions to a task-specific output",
-			explain: "That's right. Adaptation heads, also known simply as heads, come up in different forms: language modeling heads, question answering heads, sequence classification heads... ",
-			correct: true
-		} 
-	]}
-/>
-
-{#if fw === 'pt'}
-### 5. What is an AutoModel?
-
-<Question
-	choices={[
-		{
-			text: "A model that automatically trains on your data",
-			explain: "Incorrect. Are you mistaking this with our <a href='https://huggingface.co/autotrain'>AutoTrain</a> product?"
-		},
-		{
-			text: "An object that returns the correct architecture based on the checkpoint",
-			explain: "Exactly: the <code>AutoModel</code> only needs to know the checkpoint from which to initialize to return the correct architecture.",
-			correct: true
-		},
-		{
-			text: "A model that automatically detects the language used for its inputs to load the correct weights",
-			explain: "Incorrect; while some checkpoints and models are capable of handling multiple languages, there are no built-in tools for automatic checkpoint selection according to language. You should head over to the <a href='https://huggingface.co/models'>Model Hub</a> to find the best checkpoint for your task!"
-		} 
-	]}
-/>
-
-{:else}
-### 5. What is an TFAutoModel?
-
-<Question
-	choices={[
-		{
-			text: "A model that automatically trains on your data",
-			explain: "Incorrect. Are you mistaking this with our <a href='https://huggingface.co/autotrain'>AutoTrain</a> product?"
-		},
-		{
-			text: "An object that returns the correct architecture based on the checkpoint",
-			explain: "Exactly: the <code>TFAutoModel</code> only needs to know the checkpoint from which to initialize to return the correct architecture.",
-			correct: true
-		},
-		{
-			text: "A model that automatically detects the language used for its inputs to load the correct weights",
-			explain: "Incorrect; while some checkpoints and models are capable of handling multiple languages, there are no built-in tools for automatic checkpoint selection according to language. You should head over to the <a href='https://huggingface.co/models'>Model Hub</a> to find the best checkpoint for your task!"
-		} 
-	]}
-/>
-
-{/if}
-
-### 6. What are the techniques to be aware of when batching sequences of different lengths together?
-
-<Question
-	choices={[
-		{
-			text: "Truncating",
-			explain: "Yes, truncation is a correct way of evening out sequences so that they fit in a rectangular shape. Is it the only one, though?",
-			correct: true
-		},
-		{
-			text: "Returning tensors",
-			explain: "While the other techniques allow you to return rectangular tensors, returning tensors isn't helpful when batching sequences together."
-		},
-		{
-			text: "Padding",
-			explain: "Yes, padding is a correct way of evening out sequences so that they fit in a rectangular shape. Is it the only one, though?",
-			correct: true
-		}, 
-		{
-			text: "Attention masking",
-			explain: "Absolutely! Attention masks are of prime importance when handling sequences of different lengths. That's not the only technique to be aware of, however.",
-			correct: true
-		} 
-	]}
-/>
-
-### 7. What is the point of applying a SoftMax function to the logits output by a sequence classification model?
-
-<Question
-	choices={[
-		{
-			text: "It softens the logits so that they're more reliable.",
-			explain: "No, the SoftMax function does not affect the reliability of results."
-		},
-		{
-			text: "It applies a lower and upper bound so that they're understandable.",
-			explain: "Correct! The resulting values are bound between 0 and 1. That's not the only reason we use a SoftMax function, though.",
-            correct: true
-		},
-		{
-			text: "The total sum of the output is then 1, resulting in a possible probabilistic interpretation.",
-			explain: "Correct! That's not the only reason we use a SoftMax function, though.",
-            correct: true
-		}
-	]}
-/>
-
-### 8. What method is most of the tokenizer API centered around?
-
-<Question
-	choices={[
-		{
-			text: "<code>encode</code>, as it can encode text into IDs and IDs into predictions",
-			explain: "Wrong! While the <code>encode</code> method does exist on tokenizers, it does not exist on models."
-		},
-		{
-			text: "Calling the tokenizer object directly.",
-			explain: "Exactly! The <code>__call__</code> method of the tokenizer is a very powerful method which can handle pretty much anything. It is also the method used to retrieve predictions from a model.",
-			correct: true
-		},
-		{
-			text: "<code>pad</code>",
-			explain: "Wrong! Padding is very useful, but it's just one part of the tokenizer API."
-		},
-		{
-			text: "<code>tokenize</code>",
-			explain: "The <code>tokenize</code> method is arguably one of the most useful methods, but it isn't the core of the tokenizer API."
-		}
-	]}
-/>
-
-### 9. What does the `result` variable contain in this code sample?
-
-```py
-from transformers import AutoTokenizer
-
-tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
-result = tokenizer.tokenize("Hello!")
-```
-
-<Question
-	choices={[
-		{
-			text: "A list of strings, each string being a token",
-			explain: "Absolutely! Convert this to IDs, and send them to a model!",
-            correct: true
-		},
-		{
-			text: "A list of IDs",
-			explain: "Incorrect; that's what the <code>__call__</code> or <code>convert_tokens_to_ids</code> method is for!"
-		},
-		{
-			text: "A string containing all of the tokens",
-			explain: "This would be suboptimal, as the goal is to split the string into multiple tokens."
-		}
-	]}
-/>
-
-{#if fw === 'pt'}
-### 10. Is there something wrong with the following code?
-
-```py
-from transformers import AutoTokenizer, AutoModel
-
-tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
-model = AutoModel.from_pretrained("gpt2")
-
-encoded = tokenizer("Hey!", return_tensors="pt")
-result = model(**encoded)
-```
-
-<Question
-	choices={[
-		{
-			text: "No, it seems correct.",
-			explain: "Unfortunately, coupling a model with a tokenizer that was trained with a different checkpoint is rarely a good idea. The model was not trained to make sense out of this tokenizer's output, so the model output (if it can even run!) will not make any sense."
-		},
-		{
-			text: "The tokenizer and model should always be from the same checkpoint.",
-			explain: "Right!",
-            correct: true
-		},
-		{
-			text: "It's good practice to pad and truncate with the tokenizer as every input is a batch.",
-			explain: "It's true that every model input needs to be a batch. However, truncating or padding this sequence wouldn't necessarily make sense as there is only one of it, and those are techniques to batch together a list of sentences."
-		}
-	]}
-/>
-
-{:else}
-### 10. Is there something wrong with the following code?
-
-```py
-from transformers import AutoTokenizer, TFAutoModel
-
-tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
-model = TFAutoModel.from_pretrained("gpt2")
-
-encoded = tokenizer("Hey!", return_tensors="pt")
-result = model(**encoded)
-```
-
-<Question
-	choices={[
-		{
-			text: "No, it seems correct.",
-			explain: "Unfortunately, coupling a model with a tokenizer that was trained with a different checkpoint is rarely a good idea. The model was not trained to make sense out of this tokenizer's output, so the model output (if it can even run!) will not make any sense."
-		},
-		{
-			text: "The tokenizer and model should always be from the same checkpoint.",
-			explain: "Right!",
-            correct: true
-		},
-		{
-			text: "It's good practice to pad and truncate with the tokenizer as every input is a batch.",
-			explain: "It's true that every model input needs to be a batch. However, truncating or padding this sequence wouldn't necessarily make sense as there is only one of it, and those are techniques to batch together a list of sentences."
-		}
-	]}
-/>
-
-{/if}
diff --git a/chapters/ro/chapter3/1.mdx b/chapters/ro/chapter3/1.mdx
deleted file mode 100644
index 87d1e54dd..000000000
--- a/chapters/ro/chapter3/1.mdx
+++ /dev/null
@@ -1,25 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Introduction[[introduction]]
-
-<CourseFloatingBanner
-    chapter={3}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-În [Chapter 2](/course/chapter2) am explorat cum să folosim tokenizeri și modele pretrained pentru a face predicții. Dar dacă vrei să faci fine-tune un model pre-trained pentru propriul dataset? Acesta e subiectul acestui capitol. Vei învăța:
-
-{#if fw === 'pt'}
-* Cum să pregătiți un dataset mare din Hub
-* Cum să folosiți API-ul `Trainer` pentru a face fine-tune unui model
-* Cum să creați o buclă de antrenare personalizată
-* Cum să beneficiați de biblioteca 🤗 Accelerate pentru a rula ușor această bucla de antrenare personalizare pe orice configurare distribuită.
-
-{:else}
-* Cum să pregătiți un datasetmare din Hub
-* Cum să folosiți Keras să faceți fine-tune unui model
-* Cum să folosiți Keras pentru a obține predicții
-* Cum să folosiți un indicator custom
-
-{/if}
-Pentru a încărca checkpoint-urile antrenate pe Hugging Face Hub, veți avea nevoie de un cont la huggingface.co: [creați un cont](https://huggingface.co/join)
\ No newline at end of file
diff --git a/chapters/ro/chapter3/2.mdx b/chapters/ro/chapter3/2.mdx
deleted file mode 100644
index 8d6cc6c4c..000000000
--- a/chapters/ro/chapter3/2.mdx
+++ /dev/null
@@ -1,393 +0,0 @@
-`<FrameworkSwitchCourse {fw} />`
-
-# Procesarea datelor [[processing-the-data]]
-
-{#if fw === 'pt'}
-
-<CourseFloatingBanner chapter={3}
-    classNames="absolute z-10 right-0 top-0"
-    notebooks={[
-        {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter3/section2_pt.ipynb"},
-        {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter3/section2_pt.ipynb"},
-]} />
-{:else}
-
-<CourseFloatingBanner chapter={3}
-
-classNames="absolute z-10 right-0 top-0"
-    notebooks={[
-        {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter3/section2_tf.ipynb"},
-        {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter3/section2_tf.ipynb"},
-]} />
-
-{/if}
-
-{#if fw === 'pt'}
-Continuând cu exemplul din [capitol anterior](/course/chapter2), mai jos vedeți cum putem să antrenăm un sequence classifier pe un singur batch în PyTorch:
-
-```python
-import torch
-from transformers import AdamW, AutoTokenizer, AutoModelForSequenceClassification
-
-checkpoint = "bert-base-uncased"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
-
-sequences = [
-    "Am așteptat toată viața mea pentru un curs HuggingFace.",
-    "Acest curs este fascinant!",
-]
-batch = tokenizer(sequences, padding=True, truncation=True, return_tensors="pt")
-
-# Acesta este nou
-batch["labels"] = torch.tensor([1, 1])
-
-optimizer = AdamW(model.parameters())
-loss = model(**batch).loss
-loss.backward()
-optimizer.step()
-```
-{:else}
-Continuând cu exemplul din [capitolul anterior](/course/chapter2), mai jos vedeți cum continuăm antrenarea unui sequence classifier pe un batch în TensorFlow:
-
-```python
-import tensorflow as tf
-import numpy as np
-from transformers import AutoTokenizer, TFAutoModelForSequenceClassification
-
-# Același lucru ca dinainte
-checkpoint = "bert-base-uncased"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint)
-sequences = [
-    "Am așteptat toată viața mea pentru un curs HuggingFace.",
-    "Acest curs este fascinant!",
-]
-batch = dict(tokenizer(sequence, padding=True, truncate=True, return_tensors="tf"))
-
-
-# Aceasta este nou
-model.compile(optimizer="adam", loss="sparse_categorical_crossentropy")
-etichete = tf.convert_to_tensor([1, 1])
-model.train_on_batch(batch, etichete)
-```
-
-De obicei, antrenarea modelului pe două propoziții nu va da rezultate foarte bune. Pentru a obține rezultate mai bune, veți avea nevoie să pregătiți un dataset mai mare.
-
-În această secțiune vom folosi ca exemplu datasetul MRPC (Microsoft Research Paraphrase Corpus), introdus într-un [articol](https://www.aclweb.org/anthology/I05-5002.pdf) de William B. Dolan și Chris Brockett. Datasetul constă din 5,801 perechi de propoziții, cu o etichetă care indică dacă sunt paraphraseuri sau nu (adică dacă ambele propoziții au același înțeles). Am selectat-o pentru acest capitoldeoare că este un dataset mic, așa încât să fie ușor de experimentat cu antrenarea pe el.
-
-### Încărcarea unui dataset din Hub[[loading-a-dataset-from-the-hub]]
-
-{#if fw === 'ro'}
-<Youtube id="_BZearw7f0w"/>
-{:else}
-<Youtube id="W_gMJF0xomE"/>
-{/if}
-
-Hub-ul nu conține doar modele; de asemenea, conține multiple dataseturi înm mai multe limbi. Puteți naviga prin seturile de date [aici](https://huggingface.co/datasets), și vă recomandăm să încercați să încărcați și procurați un nou dataset odată ce veți fi trecut prin această secțiune (vedeți documentația generală [aici](https://huggingface.co/docs/datasets/loading)). Dar pentru moment, să ne concentrăm pe datasetul MRPC! Este una dintre cele 10 seturi de date care compun benchmark-ul [GLUE](https://gluebenchmark.com/), care este un benchmark academic folosit pentru a măsura performanța modelelor ML în 10 diferite sarcini de clasificare a textului.
-
-Biblioteca 🤗 Datasets oferă o comandă foarte simplă pentru a descărca și a stoca un dataset din Hub. Putem să instalăm datasetul MRPC astfel:
-
-<Tip>
-⚠️ **Avertizare** Asigurați-vă că `datasets` este instalat prin rularea `pip install datasets`. Apoi, încărcați dataset-ul MRPC și printați-l pentru a vedea ce conține.
-</Tip>
-
-```py
-from datasets import load_dataset
-
-raw_datasets = load_dataset("glue", "mrpc")
-raw_datasets
-```
-
-```python out
-DatasetDict({
-    train: Dataset({
-        features: ['sentence1', 'sentence2', 'label', 'idx'],
-        num_rows: 3668
-    })
-    validation: Dataset({
-        features: ['sentence1', 'sentence2', 'label', 'idx'],
-        num_rows: 408
-    })
-    test: Dataset({
-        features: ['sentence1', 'sentence2', 'label', 'idx'],
-        num_rows: 1725
-    })
-})
-```
-
-Ai observat că am obținut un obiect `DatasetDict` care conține setul de antrenare, setul de validare și setul de testare. Fiecare dintre acestea conține câteva coloane (`sentence1`, `sentence2`, `label`, și `idx`) și o numpăr de rânduri variabil, care reprezintă numărul de elemente în fiecare set (astfel, există 3.668 perechi de fraze în setul de antrenare, 408 în setul de validare și 1.725 în setul de testare).
-
-Acest comandă descarcă și face cache datasetului, în *~/.cache/huggingface/datasets*(folderul implicit de salvare). În capitolul 2, am văzut cum putem personaliza folderul de cache stabilind variabila de mediu `HF_HOME`.
-
-Putem accesa fiecare pereche de fraze din obiectul `raw_datasets` prin indexare, asemenea unui dicționar:
-
-```py
-raw_train_dataset = raw_datasets["train"]
-raw_train_dataset[0]
-```
-
-```python
-{'idx': 0,
- 'label': 1,
- 'sentence1': 'Amrozi l-a acuzat pe fratele său, pe care l-a numit „martorul” , că distorsionează intenționat probele sale.',
- 'sentence2': 'Referindu-se la el doar sub numele de " martorul ", Amrozi l-a acuzat pe fratele său că distorsionează intenționat probele sale.'}
-```
-
-Putem vedea că labels sunt numere întregi, așadar nu vom trebui să facem nicio procesare în acest sens. Pentru a ști care număr întreg corespunde cu care label, putem inspecta variabila `features` al 'raw_train_dataset'. Acest lucru ne va spune tipul fiecărui coloană.
-
-```py
-raw_train_dataset.features
-```
-
-```python out
-{'sentence1': Value(dtype='string', id=None),
- 'sentence2': Value(dtype='string', id=None),
- 'label': ClassLabel(num_classes=2, names=['not_equivalent', 'equivalent'], names_file=None, id=None),
- 'idx': Value(dtype='int32', id=None)}
-```
-
-În spatele, `label` este obiect de tip `ClassLabel`, iar maparea numerelor întregi la numele label-ului este stocat în folderele *names*. Astfel, `0` corespunde cu `not_equivalent`, iar `1` corespunde cu `equivalent`.
-
-<Tip>
-
-✏️ **Încercați-o!** Arată elementul 15 din setul de antrenament și elementul 87 din setul de validare. Care sunt label-urile acesotra?
-
-</Tip>
-
-### Preprocessing un datset[[preprocessing-a-dataset]]
-
-{#if fw === 'pt'}
-<Youtube id="0u3ioSwev3s"/>
-{:else}
-<Youtube id="P-rZWqcB6CE"/>
-{/if}
-
-Pentru a prelucra datele, trebuie să convertim textul în numere pe care modelul le poate înțelege. Cum ai văzut în [capitol anterior](/course/chapter2), acest lucru se face cu ajutorul unui tokenizer. Putem să oferim tokenizerului o propoziție sau o listă de propoziții, așa că putem să tokenizăm direct toate primele propoziții și toate cele de-a doua propoziții ale fiecărei perechi în felul următor:
-
-```py
-from transformers import AutoTokenizer
-
-checkpoint = "bert-base-uncased"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-tokenized_sentences_1 = tokenizer(raw_datasets["train"]["sentence1"])
-tokenized_sentences_2 = tokenizer(raw_datasets["train"]["sentence2"])
-```
-
-Însă nu putem să transmitem doar două propoziții către model și să obținem o predicție dacă cele două propoziții sunt parafraze sau nu. Trebuie să controlăm cele două secvențe ca o pereche, apoi să le aplicăm preprocesarea adecvată. Norocul este că tokenizer-ul poate lua o pereche de propoziții și le poate pregăti în felul în care modelul BERT îl așteaptă: 
-
-```py
-inputs = tokenizer("Aceasta este prima propoziție.", "Aceasta este a doua.")
-inputs
-
-```
-
-```python out
-{ 
-  'input_ids': [101, 2023, 2003, 1996, 2034, 6251, 1012, 102, 2023, 2003, 1996, 2117, 2028, 1012, 102],
-  'token_type_ids': [0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1],
-  'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]
-}
-```
-
-Am discutat despre `input_ids` și `attention_mask` cheii în [Capitolul 2](/course/chapter2), dar am întârziat cu abordarea cheii `token_type_ids`. În acest exemplu, această cheie este ceea ce spune modelului care parte a inputului este prima propoziție și care este a doua.
-
-<Tip>
-✏️ **Încercați!** Luați elementul 15 din setul de antrenare și tokenizați cele două propoziții separat și ca o pereche. Care este diferența dintre rezultatele celor două? 
-</Tip>
-
-Dacă facem decode ID-urilor din `input_ids` înapoi la cuvinte:
-
-```python
-tokenizer.convert_ids_to_tokens(inputs["input_ids"])
-```
-
-Noi vom obține următorul rezultat:
-
-```python
-['[CLS]', 'acesta', 'este', 'prima', 'propoziție', '.', '[SEP]', 'acesta', 'este', 'a', 'doua', '.', '[SEP]']
-```
-
-Prin urmare, modelul așteaptă ca inputul să fie în forma `[CLS] sentence1 [SEP] sentence2 [SEP]` atunci când există două propoziții. Aliniind această informație cu `token_type_ids`, obținem:
-
-```python
-['[CLS]', 'acesta', 'este', 'prima', 'propoziție', '.', '[SEP]', 'acesta', 'este', 'a', 'doua', '.', '[SEP]']
-[      0,      0,    0,     0,       0,          0,   0,       0,      1,    1,     1,        1,     1,   1,       1]
-```
-
-Observăm,că inputul corespunzător `[CLS] sentence1 [SEP]` au toate un token type ID de `0`, în timp ce celelalte părți, corespunzătoare `sentence2 [SEP]`, au toate un token type ID de `1`.
-
-Înțelegem că dacă selectăm alt checkpoint al modelului, nu vom avea neapărat `token_type_ids` în inputurile tokenizate (de exemplu, ele nu sunt returnate dacă folosim un model DistilBERT). Acestea sunt returnate doar atunci când modelul știe ce să facă cu ele, pentru că le-a văzut în timpul pretrainingului.
-
-În acest caz, BERT este antrenat cu token type IDs și pe lângă the masked language modeling objective despre care am vorbit în [Capitolul 1](/course/chapter1), are un objective suplimentar numit _next sentence prediction_. Objectiveul este destinat modelării relației între perechi de propoziții.
-
-Cu următoare predicție a propoziției, modelului i se prezintă perechi de propoziții (cu masked tokens aleatoriu) și i se cere să prezică dacă a doua propoziție urmează primei. Pentru a face sarcina non-trivial, în jumătate dintre cazuri propizițiie urmează una pe alta în documentul original din care au fost extrase și cealaltă jumătate ele vin de la două documente diferite.
-
-În general, nu trebuie să vă faceți griji dacă există sau nu `token_type_ids` în inputurile tokenizate: atât timp cât folosiți aceelași checkpoint al modelului și a tokenizer-ului, totul va fi bine, pentru că tokenizer-ul știe ce are de oferit modelului.
-
-Acum că am văzut cum poate prelucra tokenizer-ul o pereche de propoziții, îl putem folosi acest lucru pentru a tokeniza întregul nostru dataset: exact ca în [capitolul anterior](/course/chapter2), putem să oferim tokenizer-ului o listă de perechi de propoziții oferindu-i prima listă de propoziții și apoi lista a doua. Acest lucru este compatibil cu padding-ul și truncation-ul pe care le-am văzut în [Capitolul 2](/course/chapter2). În felul acesta putem prelucra datasetul de antrenare astfel:
-
-```py
-tokenized_dataset = tokenizer(
-    raw_datasets["train"]["sentence1"],
-    raw_datasets["train"]["sentence2"],
-    padding=True,
-    truncation=True,
-)
-```
-
-Această metodă funcționează bine, dar are dezavantajul că returnează un dicționar (cu key-urile noastre, `input_ids`, `attention_mask`, și `token_type_ids` și valori care sunt liste de liste). Va funcționa doar dacă aveți destul de RAM pentru a stoca întreg dataset în tokenizării acestuia (iar dataset-urile din biblioteca 🤗 Datasets sunt fișiere [Apache Arrow](https://arrow.apache.org/) stocate pe disc, deci tu stochezi numai sample-urile pe care le ceri să se păstreaze în memorie).
-
-Acum că am înțeles modul în care tokenizer-ul nostru poate gestiona o pereche de fraze, putem folosi el pentru a tokenize întregul nostru set de date: la fel cum am făcut în [capitolul anterior](/course/chapter2), putem alimenta tokenizer-ul cu lista de prime fraze și apoi lista de fraze secunde. Această metodă este compatibilă și cu opțiunile de umplere și tăiere pe care le-am văzut în [Capitolul 2](/course/chapter2). Astfel, una dintre modalitățile prin care putem preprocesa dataset-ul de antrenare este:
-
-```py
-tokenized_dataset = tokenizer(
-    raw_datasets["train"]["sentence1"],
-    raw_datasets["train"]["sentence2"],
-    padding=True,
-    truncation=True,
-)
-```
-
-Această metodă funcționează bine, dar are dezavantajul că returnează un dicționar (cu cheile noastre, `input_ids`, `attention_mask`, și `token_type_ids`, și valori care sunt liste de liste). Va fi disponibilă doar dacă aveți suficient spațiu de memorie pentru a stoarca întregul set de date în timpul tokenizării (în timp ce dataset-urile din biblioteca 🤗 Datasets se salvează sub forma [Apache Arrow](https://arrow.apache.org/), fișiere stocate pe disch, astfel încât doar acele fragmente ale datelor pe care le cerem să fie încărcate în memorie).
-
-Pentru a păstra datele în forma de dataset, vom folosi metoda [`Dataset.map()`](https://huggingface.co/docs/datasets/package_reference/main_classes#datasets.Dataset.map). Aceasta ne permite puțin mai multă flexibilitate, dacă ne trebuie mai multă preprocesare pe lângă tokenization. Metoda `map()` aplică o funcție asupra fiecărui element al datasetului, astfel putem să definim o funcție care tokenizează input-urile noastre:
-
-```py
-def tokenize_function(example):
-    return tokenizer(example["sentence1"], example["sentence2"], truncation=True)
-```
-
-Această funcție i-a un dicționar (ca și elementele datasetului) și returnează un nou dicționar cu key-urile `input_ids`, `attention_mask`, și `token_type_ids`. Acesta va lucra chiar și dacă dicționarul "example" conține câteva sample-uri(fiecare key ca o list de propoziții), întrucât "tokenizer"-ul lucrează și cu liste cu perechi de propoziții cum am văzut mai devreme. Aceasta va permite folosirea opțiunii `batched=True` în apelul funcției `map()`, ceea ce va accelera semnificativ tokenizarea. `Tokenizer`-ul nostru este susținut de un tokenizer scris în Rust din biblioteca [🤗 Tokenizers](https://github.com/huggingface/tokenizers). Acest tokenizer poate fi extrem de rapid, dar numai dacă îi dăm multe inputuri odată.
-
-*Atenție*:Am omis argumentul `padding` din funcția noastră de tokenizare pentru moment. Acest lucru este datorat faptului că aplicarea padding-ului tuturor elementelor cu lungimea maximă nu este eficientă: în schimb, este mai bine să faceți padding elementelor atunci când creați un batch, astfel încât să vă trebuiască doar să faceți padding până la lungimea maximă doar în acest batch și nu întregului dataset. Acest lucru poate salva mult timp și resurse atunci când input-urile au lungimi foarte variabile.
-
-Aici este modul în care aplicăm funcția de tokenizare asupra tuturor dataset-urilor noastre. Folosim `batched=True` în apelul funcției `map` astfel încât funcția să fie aplicată asupra mai multor elemente ale datasetului odată. Aceasta permite preprocesarea accelerată.
-
-```py
-tokenized_datasets = raw_datasets.map(tokenize_function, batched=True)
-tokenized_datasets
-```
-
-Modul în care biblioteca 🤗 Datasets aplică această procesare este prin adăugarea de noi câmpuri la dataset-uri, unul pentru fiecare key din dicționarul returnat de funcția de preprocesare:
-
-```python out
-DatasetDict({
-    train: Dataset({
-        features: ['attention_mask', 'idx', 'input_ids', 'label', 'sentence1', 'sentence2', 'token_type_ids'],
-        num_rows: 3668
-    })
-    validation: Dataset({
-        features: ['attention_mask', 'idx', 'input_ids', 'label', 'sentence1', 'sentence2', 'token_type_ids'],
-        num_rows: 408
-    })
-    test: Dataset({
-        features: ['attention_mask', 'idx', 'input_ids', 'label', 'sentence1', 'sentence2', 'token_type_ids'],
-        num_rows: 1725
-    })
-})
-```
-
-Puteți chiar și folosi multiprocessing când aplicați funcția de preprocesare cu `map()` prin folosirea unui argument `num_proc`. Nu am făcut acest lucru aici pentru că biblioteca 🤗 Tokenizers utilizează deja mai multe thread-uri pentru a tokeniza sample-urile mai rapid, dar dacă nu folosiți un tokenizer rapid cu această bibliotecă, acest lucru v-ar putea accelera preprocesarea.
-
-Funcția `tokenize_function` returnează un dicționar cu key-urile `input_ids`, `attention_mask`, și `token_type_ids`, astfel că aceste trei câmpuri sunt adăugate tuturor split-urilor în dataset-urile noastre. Notați-vă că am putea chiar schimba câmpurile existente dacă funcția de preprocesare ar returna o nouă valoare pentru un key din dataset-ul pe care aplicăm `map()`.
-
-Ultimul lucru pe care trebuie să îl facem este să facem padding tuturor exemplelor până la lungimea celui mai mare element atunci când facem batch elementelor împreună – o tehnică pe care o denumim *dinamic padding*.
-
-### Dinamic Padding[[dynamic-padding]]
-<Youtube id="7q5NyFT8REg"/>
-{#if fw === 'pt'}
-
-Funcția care este responsabilă de a pune împreună sample-urile într-un batch se numește *collate function*. Este un argument default pe care puteți să-l transmiteți când construiți un `DataLoader`, valoarea implicită fiind o funcție care va converti sample-urile în tensors PyTorch și le va concatena (recursiv dacă elementele dumneavoastră sunt liste, tuple-uri sau dicționare). Acest lucru nu este posibil în cazul nostru deoarece input-urile noastre nu vor avea toate aceeași dimensiune. Am amânat intenționat padding-ul pentru a o aplica numai atunci când e nevoie, pe fiecare batch și să evităm astfel exemplele cu lungimi prea mari cu multe padding-uri. Acest lucru va accelera antrenarea, dar notați-vă că dacă antrenați pe un TPU, acest lucru poate cauza probleme – TPU-urile preferă forme fixe, chiar dacă aceasta înseamnă padding suplimentar.
-
-{:else}
-
-Funcția care este responsabilă de a pune împreună sample-urile într-un batch se numește *collate function*. Collator-ul default este o funcție ce va transforma sample-urile în tf. Faceți Tensor și concatenațile (recursiv dacă elementele dumneavoastră sunt liste, tuple-uri sau dicționare). Acest lucru nu este posibil în cazul nostru deoarece input-urile noastre nu vor avea toate aceeași dimensiune. Am amânat intenționat padding-ul pentru a o aplica numai atunci când e nevoie, pe fiecare batch și să evităm astfel exemplele cu lungimi prea mari cu multe padding-uri. Acest lucru va accelera antrenarea, dar notați-vă că dacă antrenați pe un TPU, acest lucru poate cauza probleme – TPU-urile preferă forme fixe, chiar dacă aceasta înseamnă padding suplimentar.
-
-{/if}
-
-Pentru a face acest lucru, trebuie să definim o funcție collate care va aplica cantitatea corectă de padding pentru elementele din dataset-ul pe care vrem să-i facem batch. Norocul este că biblioteca 🤗 Transformers ne oferă o asemenea funcție prin `DataCollatorWithPadding`. Aceasta i-a un tokenizer atunci când o inițializați(pentru a ști care padding token să folosim și dacă modelul se așteaptă ca padding-ul să fie pe stânga sau dreapta inputu-lui) și va face tot ce este nevoie:
-{#if fw === 'pt'}
-```py
-from transformers import DataCollatorWithPadding
-data_collator = DataCollatorWithPadding(tokenizer=tokenizer)
-```
-{:else}
-```py
-from transformers import DataCollatorWithPadding
-data_collator = DataCollatorWithPadding(tokenizer=tokenizer, return_tensors="tf")
-```
-{/if}
-
-Pentru a testa acest nou jucărie, să luăm câteva sample-uri din setul nostru de antrenare pe care am dori să le facem batch împreună. Aici, ștergem coloanele `idx`, `sentence1` și `sentence2` deoarece nu vor fi necesare și conțin stringuri (și nu putem crea tensore cu stringuri) și uitați-vă la lungimile fiecărui element din lotul nostru:
-
-```py
-samples = tokenized_datasets["train"][:8]
-samples = {k: v for k, v in samples.items() if k not in ["idx", "sentence1", "sentence2"]}
-[len(x) for x in samples["input_ids"]]
-```
-
-```python out
-[50, 59, 47, 67, 59, 50, 62, 32]
-```
-
-Nu e de mirare că obținem sample-uri de lungimi diferite, între 32 și 67. Dynamic padding înseamnă că sample-urilor din acest batch le-ar trebui aplicate padding cu o lungime de 67, lungimea cea mai mare din batch. Fără Dynamic padding, toate sample-urile ar fi avut padding cu maximul lungimii din întregul dataset sau maximul lungimii pe care modelul poate accepta. Să verificăm încă o dată dacă `data_collator`-ul nostru face dynamic padding pe batch:
-
-```py
-batch = data_collator(samples)
-{k: v.shape for k, v in batch.items()}
-```
-
-{#if fw === 'tf'}
-
-```python out
-{'attention_mask': TensorShape([8, 67]),
- 'input_ids': TensorShape([8, 67]),
- 'token_type_ids': TensorShape([8, 67]),
- 'labels': TensorShape([8])}
-```
-
-{:else}
-
-```python out
-{'attention_mask': torch.Size([8, 67]),
- 'input_ids': torch.Size([8, 67]),
- 'token_type_ids': torch.Size([8, 67]),
- 'labels': torch.Size([8])}
-```
-
-Looking good! Acum că am trecut de la textul raw la batch-uri pe care modelul nostru poate să le proceseze, suntem gata să îi facem fine-tune!
-
-{/if}
-
-<Tip>
-
-✏️ **Încearcă-ți norocul!** Implementează preprocesarea datelor pe dataset-ul GLUE SST-2. Acesta se diferență puțin deoarece nu conține perechi de propoziții, ci doar câte o propoziție, dar ceea ce am făcut ar trebui să rămână neschimbat. Pentru o provocare mai grea, încearcă să scrii o funcție de preprocesare care se aplică oricărui task GLUE.
-
-</Tip>
-
-{#if fw === 'tf'}
-
-Acum că avem dataset-ul nostru și un `data_collator`, este timpul să-i punem la lucru. În loc să încărcăm manual batch-urile și să le facem collate, asta însemnând prea mult lucru și, nu ar fi nici prea performantă. În schimb, există o metodă simplă care oferă o soluție performantă la acest problemă: `to_tf_dataset()`. Acest lucru va face wrap unui `tf.data.Dataset` în jurul datasetului nostru, cu o fucție opțională de collation. `tf.data.Dataset` este un format nativ TensorFlow pe care Keras-ul o poate folosi pentru `model.fit()`, astfel încât această metodă face convert unui 🤗 Dataset la un format gata să fie antrenat. Hai să-l vedem în acțiune cu datasetul nostru!
-
-```py
-tf_train_dataset = tokenized_datasets["train"].to_tf_dataset(
-    columns=["attention_mask", "input_ids", "token_type_ids"],
-    label_cols=["labels"],
-    shuffle=True,
-    collate_fn=data_collator,
-    batch_size=8,
-)
-
-tf_validation_dataset = tokenized_datasets["validation"].to_tf_dataset(
-    columns=["attention_mask", "input_ids", "token_type_ids"],
-    label_cols=["labels"],
-    shuffle=False,
-    collate_fn=data_collator,
-    batch_size=8,
-)
-```
-
-Și asta e tot! Putem lua aceste dataset-uri pentru următoarea lecție, unde antrenamentul va fi ușor după toată munca depusă pentru prelucrarea datelor.
-
-{/if}
\ No newline at end of file
diff --git a/chapters/ro/chapter3/3.mdx b/chapters/ro/chapter3/3.mdx
deleted file mode 100644
index df987c810..000000000
--- a/chapters/ro/chapter3/3.mdx
+++ /dev/null
@@ -1,174 +0,0 @@
-
-<FrameworkSwitchCourse {fw} />
-
-# Fine-tuningul unui model cu API-ul Trainer[[fine-tuning-a-model-with-the-trainer-api]]
-
-<CourseFloatingBanner chapter={3}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[ 
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter3/section3.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter3/section3.ipynb"},
-]} />
-
-<Youtube id="nvBXf7s7vTI"/>
-
-🤗 Transformers oferă o clasă `Trainer` pentru a vă ajuta să faceți fine-tune pe oricare dintre modelurile preantrenate pe care le oferă pe datasetul dvs. Odată ce ați terminat preprocesarea datelor din ultima secțiune, mai aveți doar câteva pași rămași pentru a defini `Trainerul`. Partea cea mai grea este probabil pregătirea environmentul pentru a rula `Trainer.train()`, deoarece va lua mult timp pe un CPU. Dacă nu aveți niciun GPU configurat, puteți accesa gratuit GPUuri sau TPUuri pe [Google Colab](https://colab.research.google.com/).
-
-Exemplele de cod de mai jos presupune că ați executat exemplele din secțiunea anterioară. Aici este o scurtă recapitulare despre ce aveți nevoie:
-
-```py
-from datasets import load_dataset
-from transformers import AutoTokenizer, DataCollatorWithPadding
-
-raw_datasets = load_dataset("glue", "mrpc")
-checkpoint = "bert-base-uncased"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-
-
-def tokenize_function(example):
-    return tokenizer(example["sentence1"], example["sentence2"], truncation=True)
-
-
-tokenized_datasets = raw_datasets.map(tokenize_function, batched=True)
-data_collator = DataCollatorWithPadding(tokenizer=tokenizer)
-```
-
-### Antrenarea[[training]]
-
-Înainte de a putea defini `Trainerul`, trebuie să definim o clasă `TrainingArguments` care va conține toți hyperparameters pe care `Trainer` le va folosi pentru antrenare și evaluare. Singurul argument pe care trebuie să-l oferiți este un folder în care modelul anternat va fi salvat, precum și checkpointurile de-a lungul drumului. Toate celelalte pot fi lăsate ca valori default, care ar trebui să funcționeze destul de bine pentru un fine-tune de bază.
-
-```py
-from transformers import TrainingArguments
-
-training_args = TrainingArguments("test-trainer")
-```
-
-<Tip>
-
-💡 Dacă doriți să încărcați automat modelul pe Hub în timpul antrenării, transmiteți `push_to_hub=True` în `TrainingArguments`. Ne vom întoarce la acest subiect în [Capitolul 4](/course/chapter4/3)
-
-</Tip>
-
-A doua etapă este definiția modelului nostru. Ca în capitolul anterior, vom folosi clasa `AutoModelForSequenceClassification`, cu două labeluri:
-
-```py
-from transformers import AutoModelForSequenceClassification
-
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
-```
-
-Observăm că, spre deosebire de [Capitolul 2](/course/chapter2), se emite o avertizare după crearea acestui model preantrenat. Acest lucru este datorit faptului că BERT nu a fost antrenat pentru clasificarea perechilor de propoziții, astfel încât headul modelului preantrenat a fost eliminat și un nou head adecvat pentru clasificarea secvențelor a fost adăugat în loc. Avertizările indică faptul că anumite weights nu au fost utilizate (cele care corespundeau headului eliminat) și celelalte au fost inițializate aleatoriu (cele pentru noul head). Aceasta se termină cu o recomandare de a antrena modelul, ceea ce vom face acum.
-
-Odată ce am definit modelul nostru, putem defini `Trainer` prin transmiterea tuturor obiectelor construite până acum — `model`, `training_args`, a training și validation datasets, `data_collator`, și `tokenizer`:
-
-```py
-from transformers import Trainer
-
-trainer = Trainer(
-    model,
-    training_args,
-    train_dataset=tokenized_datasets["train"],
-    eval_dataset=tokenized_datasets["validation"],
-    data_collator=data_collator,
-    tokenizer=tokenizer,
-)
-```
-
-Observăm că, dacă transmitem `tokenizer`, atunci defaultul `data_collator` folosit de `Trainer` va fi un `DataCollatorWithPadding` similar celui definit mai devreme. Din acest motiv, puteți omite linia `data_collator=data_collator` aici. A fost important să vă arătăm această parte în secțiunea 2!
-
-Pentru a face fine-tune modelului pe datasetul nostru, trebuie să apelăm metoda `train()` a `Trainerului`:
-
-```py
-trainer.train()
-```
-
-Acest lucru va începe fine-tuningul (care ar trebui să dureze câteva minute pe un GPU) și va raporta training loss la fiecare 500 de pași. Totuși, nu va raporta cât de bine sau rău se descurcă modelul. Acest lucru este datorat:
-
-1. Nu am transmis `Trainerului` să efectueze evaluarea în timpul antrenării, prin setarea `evaluation_strategy` la `"steps"` (evaluați la fiecare `eval_steps`) sau `"epoch"` (evaluați la finalul fiecărei epoch).
-2. Nu am oferit `Trainerului` o funcție `compute_metrics()` pentru a calcula metricele în timpul evaluări(altminter evalurea ar fi printat doar lossul, care nu este un număr foarte intuitiv).
-
-### Evaluare[[evaluation]]
-
-Să vedem cum putem construi o funcție `compute_metrics()` folositoare și să o utilizăm la următoarea antrenare. Funcția trebuie să primească obiectul `EvalPrediction` (un named tuple cu fieldul `predictions` și altul `label_ids`) și să returneze un dicționar ce le asociază făcând mapping valorilor string la valori float (stringurile fiind denumirile metricelor returnate, și valorile floats al acestora). Pentru a obține câteva predicții din model, putem folosi comanda `Trainer.predict()`:
-
-```py
-predictions = trainer.predict(tokenized_datasets["validation"])
-print(predictions.predictions.shape, predictions.label_ids.shape)
-```
-
-```python out
-(408, 2) (408,)
-```
-
-Outputul metodei `predict()` este un named tuple  cu trei fielduri: `predictions`, `label_ids` și `metrics`. Câmpul `metrics` va conține doar lossul asupra datasetului transmis, precum și o serie de metrice de timp (cât de mult a luat prezicerea și timpul mediu). Odată ce vom completa funcția `compute_metrics()` și îl vom oferi `Trainerului`, atunci acel field va conține și metricele returnate de `compute_metrics()`.
-
-După cum puteți vedea, `predictions` este un array bi-dimensional cu shapeul 408x2 (408 fiind numărul de elemente în datasetul folosit). Acestea sunt logiturile pentru fiecare element al datasetului pe care le-am oferit funcției `predict()` (cum ați văzut în [capitolul anterior](/course/chapter2), toate modelel Transformer returneă logituri). Pentru a le transforma în predicții pe care să le comparăm cu labelurile noastre, noi trebui să luăm indexul cu cea mai mare valoare pe axa a doua:
-
-
-```py
-import numpy as np
-
-preds = np.argmax(predictions.predictions, axis=-1)
-```
-
-Acum putem compara `preds` cu labelurile. Ca să construim funcțioa noastră `compute_metric()`, o să ne bazăm pe metricele de la librăria 🤗 [Evaluate](https://github.com/huggingface/evaluate/). Putem încărca metricele asociate cu datasetul MRPC la fel de ușor cum am încărcat datasetul, de data asta cu funcția `evaluate.load()`. Obiectul returnat are o metodă `compute()` pe care o putem folosi ca să facem calcularea metricelor:
-
-```py
-import evaluate
-
-metric = evaluate.load("glue", "mrpc")
-metric.compute(predictions=np.argmax(predictions.predictions, axis=-1), references=predictions.label_ids)
-```
-
-```python out
-{'accuracy': 0.8578431372549019, 'f1': 0.8996539792387542}
-```
-
-Rezultatele exacte pe care le veți obține pot varia, deoarece inițializarea aleatoare a headului modelului care poate schimba metricele pe care le-a atins. Aici putem vedea că modelul nostru are o precizie de 85.78% în setul de validare și un scor F1 de 89.97. Acestea sunt exact aceleași metrice folosite pentru evaluarea rezultatelor pe datasetul MRPC pentru GLUE benchmark. Tabelul din [BERT Paper](https://arxiv.org/pdf/1810.04805.pdf) a raportat un scor F1 de 88.9 pentru modelul de bază. Acela a fost un `uncased` model, dar noi utilizăm acum un `cased` model, ceea ce explică rezultatul mai bun.
-
-Pentru a reuni toate acestea într-o singură funcție `compute_metrics()`, putem scrie:
-
-```py
-def compute_metrics(eval_preds):
-    metric = evaluate.load("glue", "mrpc")
-    logits, labels = eval_preds
-    predictions = np.argmax(logits, axis=-1)
-    return metric.compute(predictions=predictions, references=labels)
-```
-
-Să vedem acum cum putem utiliza această funcție pentru a raporta metricele la sfârșitu fiecărei epoch, mai jos puteți vedea cum definim un nou `Trainer` cu funcția compute:
-
-```py
-training_args = TrainingArguments("test-trainer", evaluation_strategy="epoch")
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
-
-trainer = Trainer(
-    model,
-    training_args,
-    train_dataset=tokenized_datasets["train"],
-    eval_dataset=tokenized_datasets["validation"],
-    data_collator=data_collator,
-    tokenizer=tokenizer,
-    compute_metrics=compute_metrics,
-)
-```
-
-Observăm că am creat un nou `TrainingArguments` cu `evaluation_strategy` setat la `"epoch"` și o nouă instanță a modelului. În cazul nostru, ar fi fost suficient să continuam antrenarea prezentată anterior.
-
-Pentru a lansa o nouă antrenare, putem executa:
-
-```py
-trainer.train()
-```
-
-De data aceasta, acesta va raporta validation loss și metricele la sfârșitul fiecărui epocă pe lângă training loss. Dar acuratețea/scorul F1 pe care îl atingeți poate fi puțin diferit față de ceea ce am găsit, datorită inițializării aleatoare a headului modelului, dar ar trebui să nu difere foarte mult.
-
-`Trainerul` va funcționa în mod automat pe mai multe GPU-uri sau TPU-uri și oferă multe opțiuni, cum ar fi mixed-precision training(folosiți `fp16 = True` în argumentele de antrenare). Vom discuta despre toate opțiunile pe care le are în Capitolul 10.
-
-Cu aceasta terminăm introducerea fine-tuningului folosind API-ul `Trainer`. Un exemplu de a face acest lucru pentru majoritatea sarcinilor NLP va fi dat în [Capitolul 7](/course/chapter7), dar pentru moment să vedem cum putem face același lucru doar cu PyTorch.
-
-<Tip>
-
-✏️ **Încearcă!** Fă fine-tune unui model pe datasetul GLUE SST-2, folosind procesarea de date efectuată în secțiunea 2.
-
-</Tip>
diff --git a/chapters/ro/chapter3/3_tf.mdx b/chapters/ro/chapter3/3_tf.mdx
deleted file mode 100644
index 146a4b118..000000000
--- a/chapters/ro/chapter3/3_tf.mdx
+++ /dev/null
@@ -1,206 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Aplicarea fine-tuningului asupra unui model cu Keras[[fine-tuning-a-model-with-keras]]
-
-<CourseFloatingBanner chapter={3}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[ 
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter3/section3_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter3/section3_tf.ipynb"},
-]} />
-
-Odată ce ai finalizat toate operațiile de preprocesare a datelor din ultima secțiune, ai doar câțiva pași rămași pentru a antrena modelul. Însă, observați că `model.fit()` va rula foarte lent pe un CPU. Dacă nu aveți un GPU configurat, puteți accesa GPU-uri sau TPUs pe gratis pe [Google Colab](https://colab.research.google.com/).
-
-Exemplele de cod de mai jos presupun că ați executat deja exemplele din secțiunea precedentă. Aici este o scurtă sumarizare care recapitulează ceea ce trebuie să faceți:
-
-```py
-from datasets import load_dataset
-from transformers import AutoTokenizer, DataCollatorWithPadding
-import numpy as np
-
-raw_datasets = load_dataset("glue", "mrpc")
-checkpoint = "bert-base-uncased"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-
-
-def tokenize_function(example):
-    return tokenizer(example["sentence1"], example["sentence2"], truncation=True)
-
-
-tokenized_datasets = raw_datasets.map(tokenize_function, batched=True)
-
-data_collator = DataCollatorWithPadding(tokenizer=tokenizer, return_tensors="tf")
-
-tf_train_dataset = tokenized_datasets["train"].to_tf_dataset(
-    columns=["attention_mask", "input_ids", "token_type_ids"],
-    label_cols=["labels"],
-    shuffle=True,
-    collate_fn=data_collator,
-    batch_size=8,
-)
-
-tf_validation_dataset = tokenized_datasets["validation"].to_tf_dataset(
-    columns=["attention_mask", "input_ids", "token_type_ids"],
-    label_cols=["labels"],
-    shuffle=False,
-    collate_fn=data_collator,
-    batch_size=8,
-)
-```
-
-
-### Antrenare[[antrenare]]
-
-
-Modelele TensorFlow importate din 🤗 Transformers sunt deja modele Keras. Aici este o scurtă introducere în Keras.
-
-<Youtube id="rnTGBy2ax1c"/>
-
-
-Astfel, odată ce avem datele noastre, putem începe antrenarea lor foarte ușor.
-
-
-<Youtube id="AUozVp78dhk"/>
-
-
-În același mod ca și în [capitolul anterior](/course/chapter2), vom folosi clasa `TFAutoModelForSequenceClassification`, cu două labeluri:
-
-```py
-from transformers import TFAutoModelForSequenceClassification
-
-model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
-```
-
-Veți observa că în comparație cu [Capitolul 2](/course/chapter2), veți primi o avertizare după ce inițializați acest model preantrenat. Acest lucru se datorează faptului că BERT nu a fost antrenat pentru clasificarea perechilor de propoziții, astfel încât headul preantrenat al modelului a fost eliminat și un nou head potrivit pentru clasificarea secvențelor a fost adăugat în locul lui. Avertizările indică faptul că anumite weights nu au fost folosite (cele corespunzătoare headului de preantrenare eliminat) și că altele au fost inițializate aleatoriu (cele pentru noul capăt). Avertizarea se încheie prin încurajarea antrenării modelului, ceea ce este exact ceea ce vom face acum.
-
-
-Pentru a face fine-tune modelului pe datasetul nostru, avem de făcut `compile()` modelului și apoi să trasnmitem datele noastre spre metoda `fit()`. Acest lucru va porni procesul de fine-tuning (care ar trebui să dureze câteva minute pe un GPU) și va raporta training loss, plus validation loss la sfârșitul fiecărei epoci.
-
-<Tip>
-
-Observați că modelele 🤗 Transformers au o abilitate specială care nu este disponibilă pentru cele mai multe modele Keras - ele pot folosi automat un appropriate loss pe care le calculează intern. Ele vor utiliza această pierdere implicit dacă nu veți specifica un argument de pierdere în `compile()`. Pentru a folosi internal loss, va trebui să transmiteți labelurile ca parte din input, și nu ca nu label separat, ceea ce este modul normal de utilizare a labelurilor cu modelele Keras. Veți vedea exemple de acest tip în Partea 2 a cursului, unde definirea funcției de loss corecte poate fi dificilă. În cazul sequence classification, însă, o funcție Keras standard pentru loss se va dovedi suficient, astfel o vom folosi în acest context.
-
-</Tip>
-
-
-```py
-from tensorflow.keras.losses import SparseCategoricalCrossentropy
-
-model.compile(
-    optimizer="adam",
-    loss=SparseCategoricalCrossentropy(from_logits=True),
-    metrics=["accuracy"],
-)
-model.fit(
-    tf_train_dataset,
-    validation_data=tf_validation_dataset,
-)
-```
-
-
-<Tip warning={true}>
-
-Observați un pericol comun aici — puteți transmite doar numele pierderii ca un string în Keras, dar implicit Keras va presupune că deja ați aplicat un softmax la outputurile voastre. Multe modele, însă, produc outputurile direct înainte de aplicarea softmaxului, cunoscute și sub numele de *logit*. Trebuie să spuneți funcției loss că asta este ceea ce produce modelul tău, iar singura modalitate de a face acest lucru este de a-o chema direct, în loc de a o specifica numai cu un string.
-
-</Tip>
-
-### Îmbunătățirea performanței de antrenare
-
-<Youtube id="cpzq6ESSM5c"/>
-
-Dacă încerci codul de mai sus, sigur o să ruleze, dar vei constata că lossul scade doar lent sau doar sporadic. Principala cauză
-este *learning rateul*. Așa cum și lossul, când trimitem către Keras numele unui omptimizer ca uin string, Keras inițiază
-acel optimizer cu valori default pentru toți parametrii, inclusiv learning rateul. Din experiență, însă, știm că
-modelele transformer se bucură de un learning rate mult mai mic decât cel default pentru Adam, care este 1e-3, scris și ca 
-10 la puterea -3 sau 0.001. 5e-5 (0.00005), care este aproximativ douăzeci de ori mai mică, reprezintă o bază mult mai bună.
-
-În plus față de reducerea learning rateului, avem un al doilea truc la dispoziție: putem reduce treptat learning rateul
-pe parcursul antrenării. În documentație, vei găsi uneori această practică denumită *decaying* sau *annealing*
-learning rateul. În Keras, cel mai bun mod de a face acest lucru este să folosim un *learning rate scheduler*. O opțiune bună este
-`PolynomialDecay` — deși numele ar putea sugera altceva, cu setările default, el doar face decay liniar learning rateului din valoarea inițială
-până la valoarea finală pe parcursul antrenării; exact ceea ce ne-am dori. Pentru a utiliza corect un scheduler,
-însă, trebuie să-i spunem cât timp va dura antrenarea. Calculăm acest lucru sub forma `num_train_steps` de mai jos.
-
-```py
-from tensorflow.keras.optimizers.schedules import PolynomialDecay
-
-batch_size = 8
-num_epochs = 3
-# Numărul de pași de antrenare este numărul de sampleuri din dataset, împărțit la dimensiunea batchului și apoi înmulțit
-# cu numărul total de epoci. Observăm că `tf_train_dataset` aici este un batched tf.data.Dataset`,
-# nu datasetul original Hugging Face, astfel încât len() să fie deja num_samples // batch_size.
-num_train_steps = len(tf_train_dataset) * num_epochs
-lr_scheduler = PolynomialDecay(
-    initial_learning_rate=5e-5, end_learning_rate=0.0, decay_steps=num_train_steps
-)
-from tensorflow.keras.optimizers import Adam
-
-opt = Adam(learning_rate=lr_scheduler)
-```
-
-<Tip>
-
-Biblioteca 🤗 Transformers are funcția `create_optimizer()` care va crea un optimizer `AdamW` cu learning rate decay. Aceasta este o metodă convenabilă pe care o veți vedea în detaliu în viitoarele sec'iuni ale cursului.
-
-</Tip>
-
-Acum, avem noul nostru optimizer și putem încerca să antrenăm cu el. Începem cu reloadul modelului pentru a reseta modificările pe weighturole de la ultima rundă de antrenare ;o apoi putem face compile cu noul optimizer:
-
-```py
-import tensorflow as tf
-
-model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
-loss = tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True)
-model.compile(optimizer=opt, loss=loss, metrics=["accuracy"])
-```
-
-Acum putem face fit din nou:
-
-```py
-model.fit(tf_train_dataset, validation_data=tf_validation_dataset, epochs=3)
-```
-
-<Tip>
-
-💡 Dacă doriți să încărcați automat modelul dumneavoastră pe Hub în timpul antrenării, puteți transmite `PushToHubCallback` în metoda `model.fit()`. Mai multe despre acest lucru veți învăța în [Capitol 4](/course/chapter4/3).
-
-</Tip>
-
-### Model prediction
-
-<Youtube id="nx10eh4CoOs"/>
-
-
-Încheierea antrenării și observarea lossului scăzând este foarte frumos, dar ce se întămplă dacă doriți să obțineți efectiv outputuruke din modelul antrenat, fie pentru a calcula câteva metrice, fie pentru utilizarea modelului în producție? Pentru asta putem folosi metoda `predict()`. Aceasta va returna *logits* de la output headul al modelului, câte unul pe clasă.
-
-```py
-preds = model.predict(tf_validation_dataset)["logits"]
-```
-
-Puteți converti aceste logituri în predicțiile clasei modelului prin utilizarea `argmax` pentru a găsi logit-ul cel mai mare, care corespunde clasei celei mai probabile:
-
-```py
-class_preds = np.argmax(preds, axis=1)
-print(preds.shape, class_preds.shape)
-```
-
-```python out
-(408, 2) (408,)
-```
-
-Acum, să folosim aceste `preds` pentru a calcula câteva metrici! Puteți încărca metricele asociate cu datasetul MRPC în același mod cum am încărcat și datasetul, dar de data aceasta cu ajutorul funcției `evaluate.load()`. Obiectul returnat are o metodă de calculare `compute()` pe care o putem utiliza pentru a face metric calculation:
-
-```py
-import evaluate
-
-metric = evaluate.load("glue", "mrpc")
-metric.compute(predictions=class_preds, references=raw_datasets["validation"]["label"])
-```
-
-```python out
-{'accuracy': 0.8578431372549019, 'f1': 0.8996539792387542}
-```
-
-Rezultatele exacte pe care le veți obține pot varia, deoarece inițializarea aleatoare a headului modelului care poate schimba metricele pe care le-a atins. Aici putem vedea că modelul nostru are o precizie de 85.78% în setul de validare și un scor F1 de 89.97. Acestea sunt exact aceleași metrice folosite pentru evaluarea rezultatelor pe datasetul MRPC pentru GLUE benchmark. Tabelul din [BERT Paper](https://arxiv.org/pdf/1810.04805.pdf) a raportat un scor F1 de 88.9 pentru modelul de bază. Acela a fost un `uncased` model, dar noi utilizăm acum un `cased` model, ceea ce explică rezultatul mai bun.
-
-Acesta este punctul unde vă prezentăm introducerea la folosirea fine-tuningului cu ajutorul APIului Keras. Un exemplu bun pentru majoritatea sarcinilor NLP va fi dat în [Capitol 7](/course/chapter7). Dacă doriți să dezvoltați abilitățile dumneavoastră pe API-ul Keras, încercați să faceți fine-tune unui model pe datasetul GLUE SST-2 folosind procesarea de date din secvența 2.
\ No newline at end of file
diff --git a/chapters/ro/chapter3/4.mdx b/chapters/ro/chapter3/4.mdx
deleted file mode 100644
index bfb423625..000000000
--- a/chapters/ro/chapter3/4.mdx
+++ /dev/null
@@ -1,361 +0,0 @@
-# O antrenare completă [[a-full-training]]
-
-<CourseFloatingBanner chapter={3}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[ 
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter3/section4.ipynb"}, 
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter3/section4.ipynb"}, 
-]} />
-
-<Youtube id="Dh9CL8fyG80"/>
-
-Acum vom vedea cum putem atinge același rezultat pe care l-am obținut în secțiune anterioară fără a utiliza clasa `Trainer`. Din nou, noi presupunem că ai procesat datele în secțiunea 2. În continuare, găsiți o scurtă sinteză asupra tuturor informațiilor de care aveți nevoie:
-
-```py
-from datasets import load_dataset
-from transformers import AutoTokenizer, DataCollatorWithPadding
-
-raw_datasets = load_dataset("glue", "mrpc")
-checkpoint = "bert-base-uncased"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-
-
-def tokenize_function(example):
-    return tokenizer(example["sentence1"], example["sentence2"], truncation=True)
-
-
-tokenized_datasets = raw_datasets.map(tokenize_function, batched=True)
-data_collator = DataCollatorWithPadding(tokenizer=tokenizer)
-```
-
-### Pregătirea pentru antrenare[[prepare-for-training]]
-
-Înainte de a scrie propriul nostru loop de antrenament, vom avea nevoie să definim câteva obiecte. Primele dintre ele sunt dataloader-urile pe care le vom utiliza pentru a itera peste batch-uri. Dar înainte de a putea defini aceste datealoader-uri, trebuie să aplicăm o anumită postprocesare pe `tokenized_datasets`, pentru a avea grijă de unele lucruri care au fost automatizate de către `Trainer`. În special:
-
-- Eliminăm coloanele corespunzătoare valorilor pe care modelul nu le așteaptă (ca de exemplu, `sentence1` și `sentence2`).
-- Redenumește coloana `label` în `labels`, deoarece modelul așteaptă argumentul să fie numit `labels`.
-- Setăm formatul dataseturilor astfel încât ele să returneze tensore PyTorch în loc de liste.
-
-Metodele noastre `tokenized_datasets` au fiecare unul dintre acești pași:
-
-```py
-tokenized_datasets = tokenized_datasets.remove_columns(["sentence1", "sentence2", "idx"])
-tokenized_datasets = tokenized_datasets.rename_column("label", "labels")
-tokenized_datasets.set_format("torch")
-tokenized_datasets["train"].column_names
-```
-
-Vom verifica că rezultatul conține doar coloanele pe care vor modelul le acceptă:
-
-```python
-["attention_mask", "input_ids", "labels", "token_type_ids"]
-```
-
-Acum că am făcut asta, putem defini cu ușurință dataloader-urile noastre:
-
-```py
-from torch.utils.data import DataLoader
-
-train_dataloader = DataLoader(
-    tokenized_datasets["train"], shuffle=True, batch_size=8, collate_fn=data_collator
-)
-eval_dataloader = DataLoader(
-    tokenized_datasets["validation"], batch_size=8, collate_fn=data_collator
-)
-```
-
-Pentru a verifica rapid că nu există nici o greșeală în procesarea datelor, putem inspecta un batch-ul astfel:
-
-```py
-for batch in train_dataloader:
-    break
-{k: v.shape for k, v in batch.items()}
-```
-
-```python out
-{'attention_mask': torch.Size([8, 65]),
- 'input_ids': torch.Size([8, 65]),
- 'labels': torch.Size([8]),
- 'token_type_ids': torch.Size([8, 65])}
-```
-
-Observați că shapeurile actuale vor fi probabil ușor diferite pentru tine, deoarece am setat `shuffle=True` pentru dataloader-ul de antrenare și am făcut padding batch-urilor la lungime maximă în interiorul lor.
-
-Acum că am terminat complet procesarea datelor (un obiectiv satisfăcător, dar înșelător pentru orice specialist ML), să trecem la model. Îl inițializăm exact ca în secțiunea precedentă:
-
-```py
-from transformers import AutoModelForSequenceClassification
-
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
-```
-
-Pentru a ne asigura că totul va merge bine în timpul antrenamentului, vom transmite batch-ul nostru modelului acesta:
-
-```py
-outputs = model(**batch)
-print(outputs.loss, outputs.logits.shape)
-```
-
-```python out
-tensor(0.5441, grad_fn=<NllLossBackward>) torch.Size([8, 2])
-```
-
-Toate modelele 🤗 Transformers vor returna lossul atunci când `labels` sunt furnizate și vom primi de asemenea logiturile (două pentru fiecare input în batch-ul nostru, deci un tensor cu dimensiunea 8 x 2).
-
-Suntem aproape gata să scriem loopul nostru de antrenament! Doar că ne lipsesc două lucruri: un optimizer și learning rate scheduler. Deoarece încercăm să replicăm ceea ce a făcut `Trainer` manual, vom folosi aceleași argumente default. Optimizerul utilizat de `Trainer` este `AdamW`, care este similar cu Adam, dar cu un twist pentru weight decay regularization (vedeți ["Decoupled Weight Decay Regularization"](https://arxiv.org/abs/1711.05101) de Ilya Loshchilov și Frank Hutter):
-
-```py
-from transformers import AdamW
-
-optimizer = AdamW(model.parameters(), lr=5e-5)
-```
-
-La final, learning rate schedulerul utilizat este un linear decay de la valoarea maximă (5e-5) la 0. Pentru a-l defini cu adevărat, avem nevoie să cunoaștem numărul de pași de antrenament pe care îi vom face, care este numărul de epoci pe care dorim să le rulăm înmulțit cu numărul de batch-uri de antrenare (care este lungimea dataloader-ului de antrenare). `Trainer` folosește trei epoci ca default, deci vom continua cu asta:
-
-```py
-from transformers import get_scheduler
-
-num_epochs = 3
-num_training_steps = num_epochs * len(train_dataloader)
-lr_scheduler = get_scheduler(
-    "linear",
-    optimizer=optimizer,
-    num_warmup_steps=0,
-    num_training_steps=num_training_steps,
-)
-print(num_training_steps)
-```
-
-```python out
-1377
-```
-
-### Training Loop[[the-training-loop]]
-
-Un ultim lucru: vom dori să folosim un GPU dacă avem acces la unul (pe un CPU, instruirea poate dura câteva ore în loc de câteva minute). Pentru a face acest lucru, definim un `device` pe care vom plasa modelul și batch-urile noastre:
-
-```py
-import torch
-
-device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")
-model.to(device)
-device
-```
-
-```python out
-device(type='cuda')
-```
-
-Suntem acum gata pentru antrenare! Pentru a avea o idee când va fi finalizată antrenarea, adăugăm un progress bar peste numărul nostru de pași de antrenare, folosind biblioteca `tqdm`:
-
-```py
-from tqdm.auto import tqdm
-
-progress_bar = tqdm(range(num_training_steps))
-
-model.train()
-for epoch in range(num_epochs):
-    for batch in train_dataloader:
-        batch = {k: v.to(device) for k, v in batch.items()}
-        outputs = model(**batch)
-        loss = outputs.loss
-        loss.backward()
-
-        optimizer.step()
-        lr_scheduler.step()
-        optimizer.zero_grad()
-        progress_bar.update(1)
-```
-
-Poți să vezi că nucleul loopului de instruire are o formă similară cu cea din introducere. Nu am cerut nicio raportare, deci acest loop de antrenare nu ne va spune nimic despre cum se descurcă modelul. Trebuie să adăugăm un evaluation loop pentru a face acest lucru.
-
-
-### Evaluation Loop[[the-evaluation-loop]]
-
-La fel ca înainte, vom folosi o metrică oferită de librăria 🤗 Evaluate. Am văzut deja metoda `metric.compute()`, dar metricile pot acumula batch-urile pentru noi pe măsură ce mergem peste loopurile de  predicțoie cu metoda `add_batch()`. Când am acumulat toate batch-urile, putem să obținem rezultatul final cu `metric.compute()`. Acesta este modul în care trebuie să implementăm acest lucru într-un loop de evaluare:
-
-```py
-import evaluate
-
-metric = evaluate.load("glue", "mrpc")
-model.eval()
-for batch in eval_dataloader:
-    batch = {k: v.to(device) for k, v in batch.items()}
-    with torch.no_grad():
-        outputs = model(**batch)
-
-    logits = outputs.logits
-    predictions = torch.argmax(logits, dim=-1)
-    metric.add_batch(predictions=predictions, references=batch["labels"])
-
-metric.compute()
-```
-
-```python out
-{'accuracy': 0.8431372549019608, 'f1': 0.8907849829351535}
-```
-
-Rezultatele tale vor fi ușor diferite datorită randomizării în inițializarea headului modelului și a data shuffling, dar ele nu ar trebui să fie foart diferite.
-
-
-<Tip>
-
-✏️ **Încearcă!** Modifica loopul de antrenare dinainte pentru a face fine-tune modelul pe dataset-ul SST-2.
-
-</Tip>
-
-
-### Supercharge Training Loopul cu 🤗 Accelerate[[supercharge-your-training-loop-with-accelerate]]
-
-<Youtube id="s7dy8QRgjJ0" />
-
-Loopul de antrenare pe care l-am definit anterior funcționează bine pe un singur CPU sau GPU. Dar folosind libraria [🤗 Accelerate](https://github.com/huggingface/accelerate), cu câteva ajustări putem activa distributed training pe multiple GPU-uri sau TPU-uri. Începând de la crearea training și validation dataloaders, aceasta este este loopul manual de antrenare:
-
-```py
-from transformers import AdamW, AutoModelForSequenceClassification, get_scheduler
-
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
-optimizer = AdamW(model.parameters(), lr=3e-5)
-
-device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")
-model.to(device)
-
-num_epochs = 3
-num_training_steps = num_epochs * len(train_dataloader)
-lr_scheduler = get_scheduler(
-    "linear",
-    optimizer=optimizer,
-    num_warmup_steps=0,
-    num_training_steps=num_training_steps,
-)
-
-progress_bar = tqdm(range(num_training_steps))
-
-model.train()
-for epoch in range(num_epochs):
-    for batch in train_dataloader:
-        batch = {k: v.to(device) for k, v in batch.items()}
-        outputs = model(**batch)
-        loss = outputs.loss
-        loss.backward()
-
-        optimizer.step()
-        lr_scheduler.step()
-        optimizer.zero_grad()
-        progress_bar.update(1)
-```
-
-Și aici sunt schimbările:
-
-```diff
-+ from accelerate import Accelerator
-  from transformers import AdamW, AutoModelForSequenceClassification, get_scheduler
-
-+ accelerator = Accelerator()
-
-  model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
-  optimizer = AdamW(model.parameters(), lr=3e-5)
-
-- device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")
-- model.to(device)
-
-+ train_dataloader, eval_dataloader, model, optimizer = accelerator.prepare(
-+     train_dataloader, eval_dataloader, model, optimizer
-+ )
-
-  num_epochs = 3
-  num_training_steps = num_epochs * len(train_dataloader)
-  lr_scheduler = get_scheduler(
-      "linear",
-      optimizer=optimizer,
-      num_warmup_steps=0,
-      num_training_steps=num_training_steps
-  )
-
-  progress_bar = tqdm(range(num_training_steps))
-
-  model.train()
-  for epoch in range(num_epochs):
-      for batch in train_dataloader:
--         batch = {k: v.to(device) for k, v in batch.items()}
-          outputs = model(**batch)
-          loss = outputs.loss
--         loss.backward()
-+         accelerator.backward(loss)
-
-          optimizer.step()
-          lr_scheduler.step()
-          optimizer.zero_grad()
-          progress_bar.update(1)
-```
-
-Prima linie de adăugat este importarea librăriei. A doua linie creează un obiect `Accelerator` care va evalua environmentul și va inițializa proper distributed setup. 🤗 Accelerate gestionează automat poziționarea deviceului pentru tine, așa că poți șterge rândurile care pun modelul pe device (sau dacă preferi, poți să le schimbi cu `accelerator.device` în loc de `device`). 
-
-Partea principală a lucrului se face în linia ce trimite dataloader-urile, modelul și optimizerul la `accelerator.prepare()`. Acaeasta va face wrap acestor obiecte în containerul potrivit pentru a asigura o antrenare distribuită corespunzătoare. Ultimele schimbări sunt ștergerea linei cep une batch-ul pe device(din nou, dacă vvrei să lași acest lucru poți să le schimbi cu `accelerator.device`) și schimbarea `loss.backward()` cu `accelerator.backward(loss)`.
-
-<Tip>
-⚠️ Pentru a beneficia de viteza oferită de Cloud TPUs, recomandăm să faceți padding sampleurilor la o lungime fixă folosind argumentele `padding="max_length"` și `max_length` ale tokenizerului.
-</Tip>
-
-Dacă vrei să copiezi codul pentru a-l testa, aici este loopul complet de antrenare cu Accelerate:
-
-```py
-from accelerate import Accelerator
-from transformers import AdamW, AutoModelForSequenceClassification, get_scheduler
-
-accelerator = Accelerator()
-
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
-optimizer = AdamW(model.parameters(), lr=3e-5)
-
-train_dl, eval_dl, model, optimizer = accelerator.prepare(
-    train_dataloader, eval_dataloader, model, optimizer
-)
-
-num_epochs = 3
-num_training_steps = num_epochs * len(train_dl)
-lr_scheduler = get_scheduler(
-    "linear",
-    optimizer=optimizer,
-    num_warmup_steps=0,
-    num_training_steps=num_training_steps,
-)
-
-progress_bar = tqdm(range(num_training_steps))
-
-model.train()
-for epoch in range(num_epochs):
-    for batch in train_dl:
-        outputs = model(**batch)
-        loss = outputs.loss
-        accelerator.backward(loss)
-
-        optimizer.step()
-        lr_scheduler.step()
-        optimizer.zero_grad()
-        progress_bar.update(1)
-```
-
-Scriind în `train.py` aceste modificări, vor face scriptul executabil pe orice tip de distributed setup. Pentru a testa codul în mediul tău distribuit, rulează următoarea comandă:
-
-```bash
-accelerate config
-```
-
-Ceea ce îți va oferi să răspunzi la o serie de întrebări și să salvezi răspunsurile într-un fișier de configurare folosit de acest modul: 
-
-```bash
-accelerate launch train.py
-```
-
-Această comandă va lansa loopul de antrenare pe dispozitivele distribuite.
-
-Dacă doriți să încercați acest lucru într-un Jupyter Notebook (de exemplu, pentru a testa TPU-urile de pe Colab), înlocuiți codul cu următoarea funcție:
-
-```python
-from accelerate import notebook_launcher
-
-notebook_launcher(training_function)
-```
-
-Pentru mai multe exemple consultați [repo-ul 🤗 Accelerate](https://github.com/huggingface/accelerate/tree/main/examples).
\ No newline at end of file
diff --git a/chapters/ro/chapter3/5.mdx b/chapters/ro/chapter3/5.mdx
deleted file mode 100644
index 63d1f159a..000000000
--- a/chapters/ro/chapter3/5.mdx
+++ /dev/null
@@ -1,26 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Fine-tuning, Check![[fine-tuning-check]]
-
-<CourseFloatingBanner
-    chapter={3}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-
-A fost distractiv! În primele două capitole ai învățat despre modele și tokenizeri, iar acum știi cum să aplici fine-tune pentru datele proprii. Pentru a rezuma, în acest capitol tu:
-
-{#if fw === 'pt'}
-* Ai învățat despre dataseturi din [Hub](https://huggingface.co/datasets)
-* Ai învățat cum să încarci și să preprocesezi dataseturi, inclusiv folosind dynamic padding și collators
-* Ai implementat fine-tuningul și evaluarea unui model
-* Ai implementat un training loop la nivel de bază
-* Ai utilizat 🤗 Accelerate pentru a adapta ușor training loopul astfel încât să funcționeze cu mai multe GPU-uri sau TPU-uri
-
-{:else}
-* Ai învățat despre dataseturi din [Hub](https://huggingface.co/datasets)
-* Ai învățat cum să încarci și să preprocesezi dataseturi
-* Ai învățat cum să faci fine-tune și să evaluezi un model cu Keras
-* Ai implementat o metrică personalizată
-
-{/if}
\ No newline at end of file
diff --git a/chapters/ro/chapter3/6.mdx b/chapters/ro/chapter3/6.mdx
deleted file mode 100644
index 9ceeea782..000000000
--- a/chapters/ro/chapter3/6.mdx
+++ /dev/null
@@ -1,301 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-<!-- DISABLE-FRONTMATTER-SECTIONS
-
-# Quiz pentru finalizarea capitolului[[end-of-chapter-quiz]]
-
-<CourseFloatingBanner
-    chapter={3}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-Testează ce ai învățat în acest capitol!
-
-### 1. Datasetul `emotion` conține mesaje de pe Twitter cu labeluri cu emoții. Căutați-l în [Hub](https://huggingface.co/datasets) și citiți card-ul datasetului. Care dintre acestea nu este una dintre emoțiile sale de bază?
-
-<Question
-	choices={[
-		{
-			text: "Fericire",
-			explain: "Încercă din nou — emoția asta este prezentă în acest dataset!"
-		},
-		{
-			text: "Iubire",
-			explain: "Încercă din nou — emoția asta este prezentă în acest dataset!"
-		},
-		{
-			text: "Confuzie",
-			explain: "Corect! Confuzia nu este una dintre cele șase emoții de bază.",
-            correct: true
-		},
-        {
-			text: "Suprpiză",
-			explain: "Supriză! Încearcă din nou!"
-		}
-	]}
-/>
-
-### 2. Căutați datasetul `ar_sarcasm` în [Hub](https://huggingface.co/datasets). Care este sarcina pe care o sprijină?
-
-<Question
-	choices={[
-		{
-			text: "Clasificarea sentimentului",
-			explain: "Acesta este corect! Poți să știi grație etichetelor.",
-            correct: true
-		},
-		{
-			text: "Machine Translation",
-			explain: "Acesta nu este corect — încercați din nou, în funcție de cardul datasetului <a href='https://huggingface.co/datasets/ar_sarcasm'>ar_sarcasm</a>!"
-		},
-		{
-			text: "Reconstrucția entităților numite",
-			explain: "Acesta nu este corect — încercați din nou, în funcție de cardul datasetului <a href='https://huggingface.co/datasets/ar_sarcasm'>ar_sarcasm</a>!"
-		},
-        {
-			text: "Răspunsul întrebării",
-			explain: "Nesatisfăcător — încercați din nou!"
-		}
-	]}
-/>
-
-### 3. Cum se așteaptă modelul BERT ca o pereche de propoziții să fie procesate?
-
-<Question
-	choices={[
-		{
-			text: "Tokens_of_sentence_1 [SEP] Tokens_of_sentence_2",
-			explain: "Este necesară un token special <code>[SEP]</code> pentru a separa cele două propoziții, dar nu e doar asta!"
-		},
-		{
-			text: "[CLS] Tokens_of_sentence_1 Tokens_of_sentence_2",
-			explain:"Este necesară un token special <code>[CLS]</code> pentru a separa cele două propoziții, dar nu e doar asta!
-		},
-		{
-			text: "[CLS] Tokens_of_sentence_1 [SEP] Tokens_of_sentence_2 [SEP]",
-			explain: "Acesta este corect!",
-            correct: true
-		},
-        {
-			text: "[CLS] Token-urile propoziției_1 [SEP] Token-urile propoziției_2",
-			explain: "Este necesar un token special <code>[CLS]</code> la head, precum și un token special <code>[SEP]</code> pentru a separa cele două propoziții, dar nu e doar asta!"
-		}
-	]}
-/>
-
-{#if fw === 'pt'}
-### 4. Care sunt beneficiile metodei `Dataset.map()`?
-
-<Question
-	choices={[
-		{
-			text: "Rezultatele funcției sunt cached, deci nu va lua timp dacă re-executăm codul.",
-			explain: "Acest lucru este efectiv unul dintre beneficiile sale! Nu e doar asta...",
-            correct: true
-		},
-		{
-			text: "Se aplică multiprocessing pentru a merge mai rapid decât aplicarea funcției la fiecare element al datasetului.",
-			explain: "Acest lucru este efectiv o caracteristică specială a acestei metode, dar nu e doar asta...",
-            correct: true
-		},
-		{
-			text: "Nu încarcă întregul datasetul în memorie și salvează rezultatele la fiecare element procesat.",
-			explain: "Acest lucru este un avantaj al acestei metode. Există și altele...",
-            correct: true
-		},
-	]}
-/>
-
-### 5. Ce înseamnă "dynamic padding"?
-
-<Question
-	alegeri={[  
-		{
-			text: "Dynamic padding este atunci când faci padding inputurilor pentru fiecare batch la lungimea maximă din întregul dataset.",
-			explain: "Acest lucru implică paddingul, dar nu la lungimea maximă a întregului dataset."
-		},
-		{
-			text: "Dynamic padding este atunci când faci padding inputurilor pentru fiecare batch, la lungimea maximă a propozițiilor din acel batch.",
-			explain: "Este corect! Partea \"dynamic\" vine din faptul că dimensiunea fiecărui batch este determinată la momentul creării lui, iar toate batch-urile pot avea shape-uri diferite ca rezultat.",
-            correct: true
-		},
-		{
-			text: "Dynamic padding este atunci când faci padding inputurilor pentru ca fiecare propoziție să aibă același număr de tokenuri ca în precedentul dataset.",
-			explain: "Este greșit, și nu are nici un sens să ne uităm la ordinea din dataset, deoarece îl amestecăm în timpul antrenării."
-		},
-	]}
-/>
-
-### 6. Care este scopul unei funcții collate?
-
-<Question
-	alegeri={[  
-		{
-			text: "Asigură că toate secvențele din dataset au aceeași lungime.",
-			explain: "O funcție collate este implicată în gestionarea a câte unui batch, nu întregului dataset. De asemenea, vorbim despre funcții generice, nu <code>DataCollatorWithPadding</code> specific."
-		},
-		{
-			text: "Adună toate sampleurile dintr-un batch.",
-			explain: "Corect! Poți să dai ca argument o funcție collate în constructorul unui <code>DataLoader</code>. Am folosit funcția <code>DataCollatorWithPadding</code>, care face padding tuturor elementelor dintr-un batch, astfel încât ele să aibă aceeași lungime.",
-            correct: true
-		},
-		{
-			text: "Preprocesează întregul dataset.",
-			explain: "Acest lucru ar fi o funcție de preprocesare, nu una collate."
-		},
-        {
-			text: "Taie secvențele din dataset.",
-			explain: "O funcție collate este implicată în gestionarea a câte un batch, nu întregului dataset. Dacă ești interesat în tăierea acestora, poți utiliza argumentul <code>truncate</code> al unui <code>tokenizer</code>."
-		}
-	]}
-/>
-
-### 7. Ce se întâmplă când inițializezi una dintre clasele `AutoModelForXxx` cu un pretrained language model (ca <code>bert-base-uncased</code>) care corespunde unei alte sarcini decât aceea pentru care a fost antrenat?
-
-<Question
-	alegeri={[  
-		{
-			text: "Nimic, dar se afișează un warning.",
-			explain: "Se afișează un warning, dar asta nu este totul!"
-		},
-		{
-			text: "Headul modelului preantrenat al modelului este înlăturat și înlocuit cu un head nou potrivit pentru sarcină.",
-			explain: "Corect. De exemplu, atunci când am folosit <code>AutoModelForSequenceClassification</code> cu <code>bert-base-uncased</code>, am primit warningul la momentul inițializării modelului. Headul preantrenat nu este folosit pentru sarcina de clasificare a secvențelor, astfel încât el este înlăturat și înlocuit cu un head nou, cu weights aleatorii.",
-            correct: true
-		},
-		{
-			text: "Headul modelului preantrenat este înlăturat.",
-			explain: "Trebuie să se întâmple încă ceva. Încearcă din nou!"
-		},
-        {
-			text: "Nimic, deoarece modelul poate avea fine-tuning pentru o sarcina diferită.",
-			explain: "Headul preantrenat al modelului nu a fost antrenat să rezolve această sarcină, astfel încât el trebuie înlăturat."
-		}
-	]}
-/>
-
-### 8. Care este scopul la `TrainingArguments`?
-
-<Question
-	alegeri={[  
-		{
-			text: "Conține toți hyperparametrii utilizați pentru antrenare și evaluare cu <code>Trainer</code>.",
-			explain: "Corect!",
-            correct: true
-		},
-		{
-			text: "Specifică dimensiunea modelului.",
-			explain: "Dimensiunea modelului este definită de configurația modelului, nu clasa <code>TrainingArguments</code>. "
-		},
-		{
-			text: "Conține doar hyperparametrii utilizați pentru evaluare.",
-			explain: "În exemplul nostru, am specificat unde se va salva modelul și toate checkpoint-urile. Încearcă din nou!"
-		},
-        {
-			text: "Conține doar hyperparametrii utilizați pentru antrenare.",
-			explain: "În exemplul nostru, am folosit un <code>evaluation_strategy</code>, astfel încât acest lucru afectează și evaluarea. Încearcă din nou!"
-		}
-	]}
-/>
-
-### 9. De ce ar trebui să folosim biblioteca 🤗 Accelerate?
-
-<Question
-	alegeri={[  
-		{
-			text: "Ofereă acces la modele mai rapide.",
-			explain: "Nu, biblioteca 🤗 Accelerate nu oferă nici un model."
-		},
-		{
-			text: "Oferă un API de nivel înalt astfel încât să nu trebuiască să implementăm singuri un training loop.",
-			explain: "Acest lucru este ceea ce am făcut cu <code>Trainer</code>, nu biblioteca 🤗 Accelerate. Încearcă din nou!"
-		},
-		{
-			text: "Face ca loopurile de antrenare să funcționeze pe distributed strategies.",
-			explain: "Corect! Cu 🤗 Accelerate, loopurile de antrenare vor funcționa pentru multiple GPU-uri și TPU-uri.",
-            correct: true
-		},
-        {
-			text: "Oferă mai multe funcții de optimizare.",
-			explain: "Nu, biblioteca 🤗 Accelerate nu oferă nici o funcțiune de optimizare."
-		}
-	]}
-/>
-
-{:else}
-### 4. Ce se întâmplă când inițializezi una dintre clasele `TFAutoModelForXxx` cu un pretrained language model (ca <code>bert-base-uncased</code>) care corespunde unei alte sarcini decât aceea pentru care a fost antrenat?
-
-<Question
-	alegeri={[  
-		{
-			text: "Nimic, dar se afișează un warning.",
-			explain: "Se afișează un warning, dar asta nu este totul!"
-		},
-		{
-			text: "Headul preantrenat al modelului este înlăturat și înlocuit cu un head nou potrivit pentru sarcină.",
-			explain: "Corect. De exemplu, atunci când am folosit <code>TFAutoModelForSequenceClassification</code> cu <code>bert-base-uncased</code>, am primit warningul la momentul inițializării modelului. Headul preantrenat nu este folosit pentru sarcina de clasificare a secvențelor, astfel încât el este înlăturat și înlocuit cu un head nou, cu weights aleatorii.",
-            correct: true
-		},
-		{
-			text: "Headul preantrenat al modelului este înlăturat.",
-			explain: "Trebuie să se întâmple ceva mai mult. Încercă din nou!"
-		},
-        {
-			text: "Nimic, deoarece modelul poate fi reantrenat pentru o sarcina diferită.",
-			explain: "Headul prentrenat al modelului nu a fost antrenat să rezolve această sarcină, astfel încât el trebuie înlăturat."
-		}
-	]}
-/>
-
-### 5. Modelele TensorFlow din `transformers` sunt deja modele Keras. Ce beneficiu oferă acest lucru?
-
-<Question
-	alegeri={[  
-		{
-			text: "Modelele funcționează pe un TPU direct.",
-			explain: "Ești aproape, dar sunt necesare mici schimbări. De exemplu, trebuie să rulezi totul într-un <code>TPUStrategy</code> scop, inclusiv inițializarea modelului."
-		},
-		{
-			text: "Poți folosi metode existente precum <code>compile()</code>, <code>fit()</code>, și <code>predict()</code>.",
-			explain: "Corect! Odată ce ai datele, antrenarea pe acestea necesită foarte puțin lucru.",
-            correct: true
-		},
-		{
-			text: "Poți învăța și Keras precum și Transformers.",
-			explain: "Corect, dar căutăm altceva. :)",
-			correct: true
-		},
-        {
-			text: "Poți calcula ușor metrice legate de dataset.",
-			explain: "Keras ne ajută cu antrenarea și evaluarea modelului, dar nu calculează metrice legate de dataset."
-		}
-	]}
-/>
-
-### 6. Cum poți defini o metrică personalizată?
-
-<Question
-	alegeri={[  
-		{
-			text: "Prin subclassing pe <code>tf.keras.metrics.Metric</code>.",
-			explain: "Excelent!",
-			correct: true
-		},
-		{
-			text: "Folosind API-ul Keras.",
-			explain: "Încercă din nou!"
-		},
-		{
-			text: "Prin intermediul callable cu semnatura <code>metric_fn(y_true, y_pred)</code>.",
-			explain: "Corect!",
-			correct: true
-		},
-        {
-			text: "Prin căutarea pe Google.",
-			explain: "Acest lucru nu este răspunsul pe care îl căutăm, dar ar trebui să te ajute să-l găsești.",
-            correct: true
-		}
-	]}
-/>
-
-{/if}
\ No newline at end of file
diff --git a/chapters/ro/chapter4/1.mdx b/chapters/ro/chapter4/1.mdx
deleted file mode 100644
index 4ef56abf4..000000000
--- a/chapters/ro/chapter4/1.mdx
+++ /dev/null
@@ -1,22 +0,0 @@
-# Platforma Hugging Face Hub[[the-hugging-face-hub]]
-
-<CourseFloatingBanner
-    chapter={4}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-Platforma [Hugging Face Hub](https://huggingface.co/) –- site-ul nostru principal –- reprezintă o platformă care permite oricărui utilizator să descopere, utilizeze și contribuie la noi modele și dataseturi. Acesta găzduiește o varietate vastă de modele, cu peste 10.000 disponibile public. Ne vom concentra discuția asupra modelelor în acest capitol, iar pentru dataseturi vom vorbi în Capitolul 5.
-
-Modelele din Hub nu sunt limitate la 🤗 Transformers sau chiar și NLP. Există și alte modele, cum ar fi cele de la [Flair](https://github.com/flairNLP/flair) și [AllenNLP](https://github.com/allenai/allennlp) pentru NLP, [Asteroid](https://github.com/asteroid-team/asteroid) și [pyannote](https://github.com/pyannote/pyannote-audio) pentru speech, precum și cele de la [timm](https://github.com/rwightman/pytorch-image-models) pentru vision, doar să menționăm câteva.
-
-Fiecare dintre aceste modele este găzduit ca un repository Git, ceea ce permite crearea versiunilor și reproducerea acestuia. Oferirea modelului pe Hub înseamnă deschiderea sa comunității, făcându-l accesibil oricărui utilizator care dorește să îl utilizeze cu ușurință, eliminând astfel nevoia de a-și antrena propriul model și simplificând utilizarea acestora. 
-
-În plus, oferirea unui model pe Hub face deploy automat la un Inference API pentru acel model. Orice membru al comunității poate testa direct pe pagina modelului cu inputuri personalizate și widget-uri corespunzătoare.
-
-Cel mai bun lucru este că oferirea și utilizarea oricărui model public pe Hub este complet gratuit! Existează și [planuri plătite](https://huggingface.co/pricing) dacă doriți să oferiți modele în privat.
-
-Video-ul de mai jos arată modul în care puteți naviga prin Hub.
-
-<Youtube id="XvSGPZFEjDY"/>
-
-Crearea unui cont huggingface.co este necesară pentru a continua această parte, deoarece vom crea și gestiona repositorii pe Platforma Hugging Face Hub: [creați un cont](https://huggingface.co/join)
\ No newline at end of file
diff --git a/chapters/ro/chapter4/2.mdx b/chapters/ro/chapter4/2.mdx
deleted file mode 100644
index bbe94669b..000000000
--- a/chapters/ro/chapter4/2.mdx
+++ /dev/null
@@ -1,98 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Utilizarea modelelor preantrenate[[using-pretrained-models]]
-
-{#if fw === 'pt'}
- 
-<CourseFloatingBanner chapter={4}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter4/section2_pt.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter4/section2_pt.ipynb"},
-]} />
-
-{:else}
-
-<CourseFloatingBanner chapter={4}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter4/section2_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter4/section2_tf.ipynb"},
-]} />
-
-{/if}
-
-Hubul Model oferă o modalitate simplă de a selecta modelul adecvat, astfel încât utilizarea sa în orice bibliotecă downstream poate fi efectuată în câteva linii de cod. Să vedem cum se utilizează efectiv unul dintre aceste modele și cum putem contribui înapoi la comunitate.
-
-
-Să presupunem că noi căutăm un French-based model ce poate face mask filling.
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/camembert.gif" alt="Selecting the Camembert model." width="80%"/>
-</div>
-
-Alegem checkpointul „camembert-base” pentru al încerca. Identificatorul `camembert-base` este tot de ce avem nevoie pentru a începe. În capitolele precedente, am văzut cum putem inițializa modelul folosind funcția `pipeline()`:
-
-```py
-from transformers import pipeline
-
-camembert_fill_mask = pipeline("fill-mask", model="camembert-base")
-results = camembert_fill_mask("Le camembert est <mask> :)")
-```
-
-```python out
-[
-  {'sequence': 'Le camembert est délicieux :)', 'score': 0.49091005325317383, 'token': 7200, 'token_str': 'délicieux'}, 
-  {'sequence': 'Le camembert est excellent :)', 'score': 0.1055697426199913, 'token': 2183, 'token_str': 'excellent'}, 
-  {'sequence': 'Le camembert est succulent :)', 'score': 0.03453313186764717, 'token': 26202, 'token_str': 'succulent'}, 
-  {'sequence': 'Le camembert est meilleur :)', 'score': 0.0330314114689827, 'token': 528, 'token_str': 'meilleur'}, 
-  {'sequence': 'Le camembert est parfait :)', 'score': 0.03007650189101696, 'token': 1654, 'token_str': 'parfait'}
-]
-```
-
-În mod evident, încărcarea unui model într-un pipeline este extrem de simplu. Singurul lucru la care trebuie să atrageți atenția este că checkpointul ales este adecvat pentru sarcina pe care urmează să o execute. De exemplu, în momentul în care încărăm checkpoint-ul „camembert-base” în pipelineul `fill-mask`, este perfect în regulă. Dar dacă îl încărcam în pipelineul `text-classification`, rezultatele nu vor avea nici o logică, pentru că headul „camembert-base” nu este adecvat pentru această sarcină! Recomandăm utilizarea task selectorului în interfața Hugging Face în scopul selectării checkpointurilor adecvate:
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/tasks.png" alt="Selectorul de sarcini pe interfața web." width="80%"/>
-</div>
-
-Puteți inițializa checkpointul în mod direct folosind arhitectura modelului:
-
-{#if fw === 'pt'}
-```py
-from transformers import CamembertTokenizer, CamembertForMaskedLM
-
-tokenizer = CamembertTokenizer.from_pretrained("camembert-base")
-model = CamembertForMaskedLM.from_pretrained("camembert-base")
-```
-
-Însă, recomandăm utilizarea [claselor `Auto*`](https://huggingface.co/transformers/model_doc/auto?highlight=auto#auto-classes), deoarece acestea sunt proiectate să fie architecture-agnostic. În timp ce codul precedent limita utilizatorii la checkpoints loadable în CamemBERT architecture, utilizarea claselor `Auto*` face schimbarea checkpointurilor simplă:
-
-```py
-from transformers import AutoTokenizer, AutoModelForMaskedLM
-
-tokenizer = AutoTokenizer.from_pretrained("camembert-base")
-model = AutoModelForMaskedLM.from_pretrained("camembert-base")
-```
-{:else}
-```py
-from transformers import CamembertTokenizer, TFCamembertForMaskedLM
-
-tokenizer = CamembertTokenizer.from_pretrained("camembert-base")
-model = TFCamembertForMaskedLM.from_pretrained("camembert-base")
-```
-
-Însă, recomandăm utilizarea [claselor `TFAuto*`](https://huggingface.co/transformers/model_doc/auto?highlight=auto#auto-classes), deoarece acestea sunt proiectate să fie architecture-agnostic. În timp ce codul precedent limita utilizatorii la checkpoints loadable în CamemBERT architecture, utilizarea claselor `TFAuto*` face schimbarea checkpointurilor simplă:
-
-```py
-from transformers import AutoTokenizer, TFAutoModelForMaskedLM
-
-tokenizer = AutoTokenizer.from_pretrained("camembert-base")
-model = TFAutoModelForMaskedLM.from_pretrained("camembert-base")
-```
-{/if}
-
-<Tip>
-În momentul în care folosiți un model preantrenat, asigurați-vă să verificați cum a fost antrenat și pe ce date se bazează. De asemenea, trebuie să cunoasceți limitele și prejudecățile sale. Toată această informație va fi indicată pe cartea modelului.
-</Tip>
-
diff --git a/chapters/ro/chapter4/3.mdx b/chapters/ro/chapter4/3.mdx
deleted file mode 100644
index dda42f45e..000000000
--- a/chapters/ro/chapter4/3.mdx
+++ /dev/null
@@ -1,641 +0,0 @@
-
-**Capitolul 4**
-
-<FrameworkSwitchCourse {fw} />
-
-# Partajarea modelelor preantrenate [[sharing-pretrained-models]]
-
-{#if fw === 'pt'}
-
-<CourseFloatingBanner chapter={4}
-classNames="absolute z-10 right-0 top-0"
-notebooks={[ 
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter4/section3_pt.ipynb"}, 
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter4/section3_pt.ipynb"},
-]} />
-
-{:else}
-
-<CourseFloatingBanner chapter={4}
-classNames="absolute z-10 right-0 top-0"
-notebooks={[ 
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter4/section3_tf.ipynb"}, 
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter4/section3_tf.ipynb"},
-]} />
-
-{/if}
-
-În următoarele etape, vom explora modalitățile cele mai ușoare de a partaja modelele preantrenate pe 🤗 Hub. Există tooluri și utilities disponibile care fac posibilă partajarea și actualizarea modelelor direct pe Hub, despre care vom vorbi mai jos.
-
-<Youtube id="9yY3RB_GSPM"/>
-
-Recomandăm tuturor utilizatorilor care antrenează modele să contribuie prin partajarea lor cu comunitatea - partajarea modelelor, chiar și atunci când sunt antrenate pe dateseturi foarte specifice, va ajuta la economising timpul altor utilizatori și resurselor și va oferi acces la trained artifcats folositoare. În schimb, puteți beneficia de munca altora!
-
-Există trei moduri de a crea noi repositorii cu modele:
-
-- Utilizând API-ul `push_to_hub`
-- Utilizând biblioteca Python `huggingface_hub`
-- Utilizând interfața web
-
-Odată ce aveți creat un repository, puteți încărca fișiere în el folosind git și git-lfs. Vom trece împreună prin crearea model repositories și încărcarea fișierelor în el în următoarele secțiuni.
-
-## Utilizând API-ul `push_to_hub`[[using-the-pushtohub-api]]
-
-{#if fw === 'pt'}
-
-<Youtube id="Zh0FfmVrKX0"/>
-
-{:else}
-
-<Youtube id="pUh5cGmNV8Y"/>
-
-{/if}
-
-Cea mai simplă modalitate de a încărca fișiere pe Hub este utilizând API-ul `push_to_hub`.
-
-Înainte de a continua, aveți nevoie să creați un token de autentificare astfel încât API-ul `huggingface_hub` să știe cine sunteți și care sunt namespaces la care aveți acces de scriere. Asigurați-vă că sunteți într-un environment unde aveți instalat `transformers` (vedeti [Configurarea](/course/chapter0)). Dacă sunteți într-un notebook, puteți folosi următoarea funcție pentru a vă autentifica:
-
-```python
-from huggingface_hub import notebook_login
-
-notebook_login()
-```
-
-În terminal, puteți rula următoarea comandă:
-
-```bash
-huggingface-cli login
-```
-
-În ambele cazuri, veți fi rugați să introduceți numele utilizatorului și parola, care sunt aceleași cu cele folosite la autentificare pe Hub. Dacă nu aveți încă un profil pe Hub, vă rugăm să creați unul [aici](https://huggingface.co/join).
-
-Excelent! Acum aveți tokenul de autentificare stocat în folder-ul cache. Vom crea acum niște repositorii!
-
-{#if fw === 'pt'}
-
-Dacă ați lucrat cu API-ul `Trainer` pentru a antrena un model, cea mai ușoară modalitate de a o încărca pe Hub este să setați `push_to_hub=True` când definiți `TrainingArguments`:
-
-```py
-from transformers import TrainingArguments
-
-training_args = TrainingArguments(
-    "bert-finetuned-mrpc", save_strategy="epoch", push_to_hub=True
-)
-```
-
-Când chemați `trainer.train()`, `Trainer` va încărca modelul pe Hub de fiecare dată când este salvat (aici, la fiecare epocă) într-un repository namespaceul tău. Acest repository va fi numit după outpul directory-ul ales (aici `bert-finetuned-mrpc`), dar puteți alege un alt nume cu `hub_model_id = "un_nume_diferit"`.
-
-Pentru a încărca modelul într-o organizație din care faceți parte, este suficient să introduceți aceasta în `hub_model_id = "organizația_mea/numele_repositoriului"`.
-
-Odată ce antrenarea s-a terminat, trebuie să faceți `trainer.push_to_hub()` pentru a încărca ultima versiune a modelului. Acesta va genera apoi un model card cu toate informațiile relevante, inclusiv metadatele despre hyperparametrii utilizați și rezultatele evaluării! Aici este exemplul unui astfel de model card:
-
-<div class="flex justify-center">
-  <img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/model_card.png" alt="Un exemplu de un card auto-generat." width="100%"/>
-</div>
-
-{:else}
-
-Dacă utilizați Keras pentru a antrena modelul dumneavoastră, cea mai ușoară modalitate de a încărca-o pe Hub este să transmiteți un `PushToHubCallback` când chemați `model.fit()`:
-
-```py
-from transformers import PushToHubCallback
-
-callback = PushToHubCallback(
-    "bert-finetuned-mrpc", save_strategy="epoch", tokenizer=tokenizer
-)
-```
-
-Apoi, adăugați `callbacks=[callback]` în apelul la `model.fit()`. Callback-ul va încărca apoi modelul pe Hub de fiecare dată când se salvează(aici, la fiecare epocă) într-un repository din namespaceul tău. Acest repository va fi numit după output directory ales (aici `bert-finetuned-mrpc`), dar puteți alege un alt nume cu `hub_model_id = "un_nume_diferit"`.
-
-Pentru a încărca modelul într-o organizație din care faceți parte, este suficient să introduceți aceasta în `hub_model_id = "organizația_mea/numele_repositoriului"`.
-
-{/if}
-
-La un nivel inferior, accesarea Hub-ului se poate face direct pe modele, tokenizers și configurations objects prin metoda `push_to_hub()`. Această metodă se ocupă atât de crearea repositoriului cât si de încărcarea modelului și tokenizerului direct în el. Nu este nevoie de o interacțiune manuală, precum fața de API-ul pe care îl vom vedea mai jos.
-
-Pentru a înțelege cum funcționează, luați în considerare inițializarea unui model și a unui tokenizer:
-
-{#if fw === 'pt'}
-```py
-from transformers import AutoModelForMaskedLM, AutoTokenizer
-
-checkpoint = "camembert-base"
-
-model = AutoModelForMaskedLM.from_pretrained(checkpoint)
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-```
-{:else}
-```py
-from transformers import TFAutoModelForMaskedLM, AutoTokenizer
-
-checkpoint = "camembert-base"
-
-model = TFAutoModelForMaskedLM.from_pretrained(checkpoint)
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-```
-{/if}
-
-Sunteți liberi să faceți orice ați vrea cu acestea - adăugați tokens la tokenizer, antrenați modelul sau faceți fine-tune. Odată ce sunteți mulțumiți de modelul obținut, weighturile și tokenizerul acestuia , puteți folosi metoda `push_to_hub()` disponibilă direct pe obiectul `model`:
-
-```py
-model.push_to_hub("dummy-model")
-```
-Acest lucru va crea un nou repository `dummy-model` în profilul tău și o va popula cu fișierele modelului tău.
-Încercați același lucru cu tokenizerul, astfel încât toate fișierele să fie acum disponibile în acest repository:
-
-```py
-tokenizer.push_to_hub("dummy-model")
-```
-
-Dacă apartineți unei organizații, specificați doar argumentul `organization` pentru a încărca în namespaceul acestei organizații:
-
-```py
-tokenizer.push_to_hub("dummy-model", organization="huggingface")
-```
-
-Dacă doriți să utilizați un anumit token Hugging Face, sunteți liberi să specificați acest lucru metodei `push_to_hub()`:
-
-```py
-tokenizer.push_to_hub("dummy-model", organization="huggingface", use_auth_token="<TOKEN>")
-```
-
-Acum, mergeți la Model Hub pentru a găsi modelul încărcat: *https://huggingface.co/user-or-organization/dummy-model*.
-
-Apăsați pe tabul "Files and versions", iar acum ar trebui să vedeți fișierele vizibile în următorul screenshot:
-
-{#if fw === 'pt'}
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/push_to_hub_dummy_model.png" alt="Dummy model containing both the tokenizer and model files." width="80%"/>
-</div>
-{:else}
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/push_to_hub_dummy_model_tf.png" alt="Dummy model containing both the tokenizer and model files." width="80%"/>
-</div>
-{/if}
-
-<Tip>
-
-✏️ **Încercați!** Luați modelul și tokenizerul asociat cu checkpointul `bert-base-cased` și încărcați-l pe un repo în namespaceul tău folosind metoda `push_to_hub()`. Verificați că repo-ul apare  în pagina dumneavoastră înainte de a-l șterge.
-
-</Tip>
-
-Ați văzut că metoda `push_to_hub()` acceptă mai multe argumente, ceea ce permite încărcarea într-un repository specific sau namespace al unei organizații, sau utilizarea unui token API diferit. Vă recomandăm să vă uitați la specificația metodei disponibilă direct în [documentația 🤗 Transformers](https://huggingface.co/transformers/model_sharing) pentru a înțelge ceea ce este posibil.
-
-Metoda `push_to_hub()` este backed de packageul Python [`huggingface_hub`](https://github.com/huggingface/huggingface_hub), care oferă un API direct la Hub-ul Hugging Face. Acesta este integrat în 🤗 Transformers și în mai multe biblioteci pentru machine learning, ca de exemplu [`allenlp`](https://github.com/allenai/allennlp). Deși ne concentrăm pe integrarea în 🤗 Transformers în acest capitol, integrarea sa în propriul dumneavoastră cod sau bibliotecă este simplu.
-
-Întoarceți-vă la secțiune precedentă pentru a vedea cum să încărcați fișierele în noul repository-ul creat!
-
-## Utilizarea bibliotecii Python `huggingface_hub`
-
-Biblioteca Python `huggingface_hub` este un package care oferă un set de instrumente pentru model și datasets hubs. Oferă metode simple și clase pentru sarcini comune ca:
-Obținerea informațiilor despre repositorii pe hub și gestionarea lor. Ofere API-uri simple care lucrează pe lângă Git pentru a gestiona conținutul acestor repositorii și integrarea Hub-ului
-în proiectele și bibliotecile tale.
-
-Similar cu utilizarea API-ului `push_to_hub`, asta va necesita un token de autentificare salvat în cache. Pentru a face acest lucru, veți avea nevoie să folosiți comanda `login` din CLI, cum am menționat în secțiunea anterioară (din nou, asigurați-vă prefixați această comandă cu simbolul `!` dacă rulați în Google Colab):
-
-```bash
-huggingface-cli login
-```
-
-Packageul `huggingface_hub` oferă mai multe metode și clase utile pentru noi. În primul rând, există câteva metode pentru crearea, ștergerea și gestionarea repositoriilor:
-
-```python no-format
-from huggingface_hub import (
-    # Gestionarea utilizatorilor
-    login,
-    logout,
-    whoami,
-
-    # Crearea și gestionarea repositoriilor
-    create_repo,
-    delete_repo,
-    update_repo_visibility,
-
-    # Și câteva metode pentru a obține/schimba informațiile despre conținut
-    list_models,
-    list_datasets,
-    list_metrics,
-    list_repo_files,
-    upload_file,
-    delete_file,
-)
-```
-
-De asemenea, el oferă clasa `Repository` pentru gestionarea unei repository local. Vom explora aceste metode și clasa în următoarele secțiuni pentru a înțelege cum să le utilizați.
-
-Metoda `create_repo` poate fi utilizată pentru crearea unui nou repository în hub:
-
-```py
-from huggingface_hub import create_repo
-
-create_repo("dummy-model")
-```
-
-Acesta va crea repositarul `dummy-model` în namespaceul tău. Dacă doriți, puteți specifica care organizație să aparțină repositoriului folosind argumentul `organization`:
-
-```py
-from huggingface_hub import create_repo
-
-create_repo("dummy-model", organization="huggingface")
-```
-
-Acesta va crea repositoriul `dummy-model` în spațiul organizației `huggingface`, cu condiția că dumneavoastră să apartineți acestei organizații.
-Alte argumente care pot fi utile sunt:
-
-- `private`, pentru a specifica dacă repositarul trebuie să fie vizibil celorlați sau nu.
-- `token`, dacă doriți să vă înlocuiți token-ul stocat în cache cu un anumit token.
-- `repo_type`, dacă doriți să creați un `dataset` sau `space` în loc de model. Valorile acceptate sunt `"dataset"` și `"space"`.
-
-Acum, trebuie să adăugați fișierele în repository-ul dumneavoastră! Treceți la secțiunea următoare pentru a vedea cele trei moduri de a face acest lucru.
-
-## Utilizarea interfeței web
-
-Interfața web oferă instrumente pentru a gestiona repositorii direct în Hub. Cu ajutorul acestei interfețe, puteți crea ușor repositorii, adăuga fișiere (și chiar și fișiere mari!), explora modele, vizualiza diffuri, și multe altele.
-
-Pentru a crea un nou repositoriu, vizitați [huggingface.co/new](https://huggingface.co/new):
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/new_model.png" alt="Pagină care prezintă modelul utilizat pentru crearea unui nou repository." width="80%"/>
-</div>
-
-În primul rând, specificați deținătorul repositoriului: acesta puteți fi dumneavoastră, fie orice organizație cu care sunteți afiliat. Dacă alegeți o organizație, modelul va fi prezent pe pagina organizației și toți membrii acesteia vor avea posibilitatea să contribuie la repositoriu.
-
-În al doilea rând, introduceți numele modelului dumneavoastră. Acest lucru va fi și denumirea repositoriului. În final, puteți specifica dacă doriți ca modelul dumneavoastră să fie public sau privat. Modelele private nu sunt vizibile ceilorlalți.
-
-După crearea repositoriului, ar trebui să vedeți o pagină ca aceasta:
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/empty_model.png" alt="O pagină goală a modelului după crearea unui nou repository." width="80%"/>
-</div>
-
-Acesta este locul unde va fi găzduit modelul. Pentru a începe să populați acesta, puteți adăuga un fișier README direct din interfața web.
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/dummy_model.png" alt="Fișierul README care arată capacitățile Markdown." width="80%"/>
-</div>
-
-Fișierul README este scris în format Markdown - vă rugăm să fiți creativi cu el! A treia parte a acestui capitol se ocupă de crearea unui model card. Acestea sunt foarte importante pentru a aduce valoare modelului dumneavoastră, deoarece este acolo unde spuneți celorlalți ce poate face.
-
-Dacă vă uitați la secțiunea "Fișiere și versiuni", veți vedea că nu sunt prea multe fișiere acolo încă - doar *README.md* pe care l-ați creat dumneavoastră și *.gitattributes* care urmărește fișierele mari.
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/files.png" alt="Secțiunea 'Fișiere și versiuni' arată doar fișierul .gitattributes și README.md." width="80%"/>
-</div>
-
-Vom vedea mai târziu cum să adăugați câteva fișiere noi.
-
-## Încărcarea fișierelor modelului[[uploading-the-model-files]]
-
-Sistemul pentru a gestiona fișierele în Hugging Face Hub se bazează pe git pentru fișierele obișnuite, și pe git-lfs (care se descrifrează ca [Git Large File Storage](https://git-lfs.github.com/)) pentru fișierele mai mari.
-
-În secțiunea următoare, vom discuta despre trei metode diferite de încărcare a fișierelor în Hub: prin `huggingface_hub` și prin comanda git.
-
-### Metoda `upload_file`[[the-uploadfile-approach]]
-
-Prin `upload_file` nu este necesar să instalați git și git-lfs pe sistemul dumneavoastră. Acest lucru încarcă direct fișierele în 🤗 Hub folosind HTTP POST requests. O limitare a acestei metode este că ea nu se ocupă de fișiere care sunt mai mari de 5GB.
-Dacă fișierele dumneavoastră sunt mai mari decât 5 GB, vă rugăm să urmați celelalte două metode descrise mai jos.
-
-API-ul poate fi folosit astfel:
-
-```python
-from huggingface_hub import upload_file
-
-upload_file(
-    "<path_to_file>/config.json",
-    path_in_repo="config.json",
-    repo_id="<namespace>/dummy-model",
-)
-```
-
-Acest lucru va încărca fișierul `config.json` disponibil la `<path_to_file>` la rootul repositoriului ca `config.json`, în `dummy-model` repository.
-Alte argumente utile pot fi:
-
-- `token`, dacă doriți să înlocuiți tokenul stocat în cache cu un alt token.
-- `repo_type`, dacă doriți să încărcați într-un `dataset` sau într-un `space` în locul modelului. Valorile acceptate sunt `"dataset"` și `"space"`.
-
-### Clasa `Repository`[[the-repository-class]]
-
-Clasa `Repository` gestionează un repository local în-tro manieră asemănătoare gitului. Ea abstracționează majoritatea problemelor pe care le întâlniți cu git pentru a oferi toate caracteristicile necesare.
-
-Utilizarea acestei clase necesită ca dumneavoastră să aveți instalat git și git-lfs, așadar asigurați-vă că aveți instalat git-lfs (vezi [aici](https://git-lfs.github.com/) pentru instrucțiunile de instalare) și setat înainte de a începe.
-
-Pentru a vă juca cu repositoriul pe care l-am creat, puteți porni prin inițializarea lui ca un folder local printr-un clonarea repositoriului remote:
-
-```py
-from huggingface_hub import Repository
-
-repo = Repository("<path_to_dummy_folder>", clone_from="<namespace>/dummy-model")
-```
-
-Acesta a creat folderele `<path_to_dummy_folder>` în folderul de lucru. Acest folder conține doar fișierul `.gitattributes` pentru că acesta este singurul fișier creat atunci când inițializați repositoriul prin `create_repo`.
-
-Acum puteți folosi majoritatea metodelor tradiționale ale gitului:
-
-```python
-repo.git_pull()
-repo.git_add()
-repo.git_commit()
-repo.git_push()
-repo.git_tag()
-```
-
-Și altele! Vă recomandăm să vă uitați la documentația `Repository` disponibilă [aici](https://github.com/huggingface/huggingface_hub/tree/main/src/huggingface_hub#advanced-programmatic-repository-management) pentru o înțelegere generală a tuturor metodelor disponibile.
-
-Pentru moment, avem un model și un tokenizer pe care doriți să îl trimiteți în hub. Am reușit să clonăm repositoriul local, deci putem salva fișierele în acesta.
-
-În primul rând asigurați-vă că copia locală este la zi cu ultimele schimbări:
-
-```python
-repo.git_pull()
-```
-
-Odată ce am facut asta, salvați fișierele modelului și al tokenizerul:
-
-```python
-model.save_pretrained("<path_to_dummy_folder>")
-tokenizer.save_pretrained("<path_to_dummy_folder>")
-```
-
-Folder-ul `<path_to_dummy_folder>` acum conține toate fișierele modelului dumneavoastră și ale tokenizerul. Vom urma fluxul tradițional de git adăugând fișiere în zona de pregătire, făcând commit și push fișierelor în hub:
-
-```python
-repo.git_add()
-repo.git_commit("Adăugarea fișierelor modelului și ale tokenizerului")
-repo.git_push()
-```
-
-Felicitări! Ați reușit să încărcați primele fișiere în hub.
-
-### Folosirea Git[[the-git-based-approach]]
-
-Acesta este abordarea cea mai de bază pentru încărcarea fișierelor: vom face ast cu ajutorul git și git-lfs direct. Cea mai grea parte este abstractizată prin abordări anterioare, dar există câteva excepții cu metoda următoare, așadar ne vom referi la un use-case mai complicat.
-
-Pentru această clasă se cere să aveți instalate git și git-lfs, așadar asigurați-vă că aveți [git-lfs](https://git-lfs.github.com/) instalat (vedeți aici instrucțiunile de instalare) și configurat înainte să începeți.
-
-În primul rând, inițializați git-lfs:
-
-```bash
-git lfs install
-```
-
-```bash
-Updated git hooks.
-Git LFS initialized.
-```
-
-După ce ați făcut acest lucru, primul pas este să faceți o copie a repositoriului dumneavoastră:
-
-```bash
-git clone https://huggingface.co/<namespace>/<your-model-id>
-```
-
-Numele meu de utilizator este `lysandre` și am folosit numele modelului `dummy`, așadar comanda mea se termină cu următorul rezultat:
-
-```
-git clone https://huggingface.co/lysandre/dummy
-```
-
-Acum am un folder denumit *dummy* în folderul meu de lucru. Pot intra în folder cu ajutorul `cd` și pot examina conținutul:
-
-```bash
-cd dummy && ls
-```
-
-```bash
-README.md
-```
-
-Dacă ați creat repositoriul dumneavoastră folosind metodă din partea Hugging Face Hub, `create_repo` , acest folder ar trebui să conțină doar un fișier cu numele *.gitattributes*. Dacă ați urmat instrucțiunile din secțiunea anterioară pentru crearea repositoriului folosind interfața web, atunci folderul ar trebui să conțină un singur fișier *README.md* și, de asemenea, un fișier cu numele *.gitattributes*, pe care nu-l puteți vedea.
-
-Adăugarea unui fișier de mărime obișnuită, precum un fișier de configurare, un vocabulary file sau orice alt tip de fișier care au mai puțin de câțiva megabytes se realizează exact așa cum ați face în orice sistem git. Cu toate acestea, pentru a încărca fișiere mai mari, este necesară utilizarea a git-lfs pentru a le trimite spre *huggingface.co*.
-
-Să ne întoarcem la Python pentru a genera un model și tokenizer pe care am dori să le facem commit în repositoriul nostru dummy:
-
-{#if fw === 'pt'}
-```py
-from transformers import AutoModelForMaskedLM, AutoTokenizer
-
-checkpoint = "camembert-base"
-
-model = AutoModelForMaskedLM.from_pretrained(checkpoint)
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-
-# Faceți orice cu modelul, antrenați-l, aplicați fine-tuning... 
-
-model.save_pretrained("<path_to_dummy_folder>")
-tokenizer.save_pretrained("<path_to_dummy_folder>")
-```
-{:else}
-```py
-from transformers import TFAutoModelForMaskedLM, AutoTokenizer
-
-checkpoint = "camembert-base"
-
-model = TFAutoModelForMaskedLM.from_pretrained(checkpoint)
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-
-# Faceți orice cu modelul, antrenați-l, aplicați fine-tuning... 
-
-model.save_pretrained("<path_to_dummy_folder>")
-tokenizer.save_pretrained("<path_to_dummy_folder>")
-```
-{/if}
-
-Acum am salvat câteva artefacte de model și tokenizer, așadar să examinăm din nou folderul *dummy*:
-
-```bash
-ls
-```
-
-{#if fw === 'pt'}
-```bash
-config.json  pytorch_model.bin  README.md  sentencepiece.bpe.model  special_tokens_map.json tokenizer_config.json  tokenizer.json
-```
-Dacă priviți la dimensiunile fișierelor (de exemplu, folosind `ls -lh`), ar trebui să vedeți că singurul outlier este model state dict file (*pytorch_model.bin*), care are mai mult de 400 MB.
-
-{:else}
-```bash
-config.json  README.md  sentencepiece.bpe.model  special_tokens_map.json  tf_model.h5  tokenizer_config.json  tokenizer.json
-```
-Dacă priviți la dimensiunile fișierelor (de exemplu, folosind`ls -lh`), ar trebui să vedeți că singurul outlier este model state dict file (*t5_model.h5*), care are mai mult de 400 MB.
-
-{/if}
-
-<Tip>
-✏️ Dacă creați repositoriul folosind interfața web, fișierul *.gitattributes* va fi automat configurat pentru a considera anumite extensii de fișiere, precum *.bin* și *.h5*, ca fiind fișiere mari. În acest caz nu este necesară nici o setare suplimentară din partea ta, pentru că git-lfs le va urmări automat.
-</Tip>
-
-Acum putem continua procesul în felul nostru obișnuit cu repositoriurile Git tradiționale. Putem adăuga toate fișierele în mediul de stocare a Git folosind comanda `git add`:
-
-```bash
-git add .
-```
-
-Puteți verifica fișierele curente care sunt în stare de stocare utilizând următoarea comandă:
-
-```bash
-git status
-```
-
-
-{#if fw === 'pt'}
-```bash
-On branch main
-Your branch is up to date with 'origin/main'.
-
-Changes to be committed:
-  (use "git restore --staged <file>..." to unstage)
-  modified:   .gitattributes
-	new file:   config.json
-	new file:   pytorch_model.bin
-	new file:   sentencepiece.bpe.model
-	new file:   special_tokens_map.json
-	new file:   tokenizer.json
-	new file:   tokenizer_config.json
-```
-{:else}
-```bash
-On branch main
-Your branch is up to date with 'origin/main'.
-
-Changes to be committed:
-  (use "git restore --staged <file>..." to unstage)
-  modified:   .gitattributes
-  	new file:   config.json
-	new file:   sentencepiece.bpe.model
-	new file:   special_tokens_map.json
-	new file:   tf_model.h5
-	new file:   tokenizer.json
-	new file:   tokenizer_config.json
-```
-{/if}
-
-De asemenea, putem verifica dacă git-lfs monitorizează fisierele corecte folosind comanda sa `status`:
-
-```bash
-git lfs status
-```
-
-
-{#if fw === 'pt'}
-```bash
-On branch main
-Objects to be pushed to origin/main:
-
-
-Objects to be committed:
-
-	config.json (Git: bc20ff2)
-	pytorch_model.bin (LFS: 35686c2)
-	sentencepiece.bpe.model (LFS: 988bc5a)
-	special_tokens_map.json (Git: cb23931)
-	tokenizer.json (Git: 851ff3e)
-	tokenizer_config.json (Git: f0f7783)
-
-Objects not staged for commit:
-
-
-```
-
-Vom observa că toate fișierele au `Git` ca handler, cu excepția *pytorch_model.bin* și *sentencepiece.bpe.model*, care au `LFS`. Excelent!
-
-{:else}
-```bash
-On branch main
-Objects to be pushed to origin/main:
-
-
-Objects to be committed:
-
-	config.json (Git: bc20ff2)
-	sentencepiece.bpe.model (LFS: 988bc5a)
-	special_tokens_map.json (Git: cb23931)
-	tf_model.h5 (LFS: 86fce29)
-	tokenizer.json (Git: 851ff3e)
-	tokenizer_config.json (Git: f0f7783)
-
-Objects not staged for commit:
-
-
-```
-
-Observăm că toate fișierele au `Git` ca handler, cu excepția *t5_model.h5*, care are `LFS`. Excelent!
-
-{/if}
-
-Acum vom continua cu ultimii pași: commiting și pushing la repo-urile *huggingface.co*:
-
-```
-git commit -m "Prima versiune a modelului"
-```
-
-
-{#if fw === 'pt'}
-```bash
-[main b08aab1] First model version
- 7 files changed, 29027 insertions(+)
-  6 files changed, 36 insertions(+)
- create mode 100644 config.json
- create mode 100644 pytorch_model.bin
- create mode 100644 sentencepiece.bpe.model
- create mode 100644 special_tokens_map.json
- create mode 100644 tokenizer.json
- create mode 100644 tokenizer_config.json
-```
-{:else}
-```bash
-[main b08aab1] First model version
- 6 files changed, 36 insertions(+)
- create mode 100644 config.json
- create mode 100644 sentencepiece.bpe.model
- create mode 100644 special_tokens_map.json
- create mode 100644 tf_model.h5
- create mode 100644 tokenizer.json
- create mode 100644 tokenizer_config.json
-```
-{/if}
-
-Pushingul poate lua câteva minute, în funcție de viteza conexiunii tale la internet și mărimea fișierelor:
-
-```bash
-git push
-```
-
-```bash
-Uploading LFS objects: 100% (1/1), 433 MB | 1.3 MB/s, done.
-Enumerating objects: 11, done.
-Counting objects: 100% (11/11), done.
-Delta compression using up to 12 threads
-Compressing objects: 100% (9/9), done.
-Writing objects: 100% (9/9), 288.27 KiB | 6.27 MiB/s, done.
-Total 9 (delta 1), reused 0 (delta 0), pack-reused 0
-To https://huggingface.co/lysandre/dummy
-   891b41d..b08aab1  main -> main
-```
-
-{#if fw === 'pt'}
-Dacă ne uităm la repositoriul modelului când acest lucru este finalizat, putem vedea toate fișierele recent adăugate:
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/full_model.png" alt="Tabul 'Files and versions' conține acum toate fișierele recente adăugate." width="80%"/>
-</div>
-
-Interfața permite explorarea fișierelor modelului și a commiturilor și vizualizarea diferenței introduse de fiecare commit:
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/diffs.gif" alt="Diferența introdusă de ultimul commit." width="80%"/>
-</div>
-{:else}
-Dacă ne uităm la repositoriul modelului când acest lucru este finalizat, putem vedea toate fișierele recent adăugate:
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/full_model_tf.png" alt="Tabul 'Files and versions' conține acum toate fișierele recente adăugate." width="80%"/>
-</div>
-
-Interfața permite explorarea fișierelor modelului și a commiturilor și vizualizarea diferenței introduse de fiecare commit:
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/diffstf.gif" alt="Diferența introdusă de ultimul commit." width="80%"/>
-</div>
-{/if}
-```
\ No newline at end of file
diff --git a/chapters/ro/chapter4/4.mdx b/chapters/ro/chapter4/4.mdx
deleted file mode 100644
index 7cac09819..000000000
--- a/chapters/ro/chapter4/4.mdx
+++ /dev/null
@@ -1,88 +0,0 @@
-# Crearea unui model card[[building-a-model-card]]
-
-
-<CourseFloatingBanner
-    chapter={4}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-Model card este un fișier care este, probabil, la fel de important ca și fișierele de model si tokenizer dintr-o repositoriul modelului. Este definiția centrală a modelului, asigurând reutilizarea de către membrii comunității și reproducerea rezultatelor, oferind o platformă pe care alți membri pot construi artefecatele lor.
-
-Documentarea procesului de antrenare și evaluare ajută celorlați să înțeleagă la ce să aștepte de la un model - iar oferirea informațiilor suficiente referitoare la datele folosite si preprocesarea acestora (înainte și după antrenare) vor ajuta la identificarea și înțelegerea limitelor, biaseruile și contextului în care modelul este și nu este folositor.
-
-Prin urmare, crearea unui model card care definește modelul dvs. este un pas foarte important. Aici, oferim câteva sfaturi care v-ar putea ajuta în acest sens. Crearea model cardului se face prin intermediul fișierului `README.md`, pe care l-ați văzut anterior, care este un fișier Markdown.
-
-Conceptul de "model card" provine dintr-o direcție de cercetare a Google, publicată inițial în articolul ["Model Cards for Model Reporting"](https://arxiv.org/abs/1810.03993) scrisă de Margaret Mitchell et al. O parte semnificativă dintre informațiile conținute aici sunt bazate pe acest articol, iar noi vă recomandăm să verificați dacă doriți să înțelegeți de ce model cardurile sunt atât importante într-o lume care valorifică reproducerea, reutilizarea și echitatea.
-
-Model cardul începe cu o prezentare scurtă și generală a ceea ce este modelul - urmată de detalii suplimentare în secțiunile următoare:
-
-- Descrierea modelului
-- Utilizări intenționate și limitările modelului
-- Cum se utilizează
-- Limitări și bias
-- Datele de antrenare
-- Procedura de antrenare
-- Rezultatele evaluării
-
-Hai să vedem ce ar trebui să conțină fiecare dintre aceste secțiuni.
-
-### Descrierea modelului[[model-description]]
-
-Secțiunea de descriere a modelului conține detalii generale despre model. Aceasta include arhitectura, versiunea, dacă a fost introdus într-un articol științific, dacă este disponibilă o implementare originală, autorul și informații generale despre model. Orice drepturi de autor ar trebui să fie atribuite în această secțiune. Informația generală despre procedurile de antrenare, parametrii și avertismente pot fi menționate aici.
-
-### Utilizări intenționate și limitările modelului[[intended-uses-limitations]]
-
-Aici descrieți utilizările pentru care modelul este destinat - inclusiv limba și domeniile unde se poate aplica. Această secțiune din model card poate documenta și zone cunoscute ca nefiind în scopul modelului sau unde este probabil să funcționeze suboptimal.
-
-### Cum se utilizează[[how-to-use]]
-
-Acesta secțiune ar trebui să includă exemple despre cum să utilizați modelul. Acest lucru poate prezenta utilizarea funcției `pipeline()`, utilizarea claselor de model si tokenizer, și orice cod care credeți că ar putea fi util.
-
-### Datele de antrenare[[training-data]]
-
-Această secțiune trebuie să indice datasetul(urile) folosit pentru instruirea modelului. O descriere scurtă a datasetului(urilor) este binevenită.
-
-### Procedura de antrenare[[training-procedure]]
-
-Aici descrieți toate aspectele relevante ale antrenarii care sunt utile din punct de vedere al reproducerii. Acest lucru include orice preprocessing sau postprocessing efectuat pe date, precum și detalii ca numărul de epoci pe care a fost antrenat modelul, dimensiunea batch-ului, learning rateul si alte astfel de detalii.
-
-### Variabilele si metrice[[variable-and-metrics]]
-
-Aici descrieți metricile utilizate la evaluarea rezultatelor, precum și diferite aspecte pe care le măsurați. Menționați metricile folosite, pe ce dataset și care dataset split, astfel încât să fie ușor de comparat performanțele modelului cu cele ale altor modele.
-
-### Rezultatele evaluării[[evaluation-results]]
-
-În sfârșit, indicați cum s-a comportat modelul pe datasetul de evaluare. Dacă modelul foloseste un decision threshold, atunci includeți acest decision threshold în secțiunea respectivă - sau explicați că rezultatele sunt prezentate la diferite thresholduri pentru utilizările preconizate.
-
-## Exemplu[[example]]
-
-Aici puteți găsi câteva exemple ale unor Model Card:
-
-- [`bert-base-cased`](https://huggingface.co/bert-base-cased)
-- [`gpt2`](https://huggingface.co/gpt2)
-- [`distilbert`](https://huggingface.co/distilbert-base-uncased)
-
-Câteva exemple din alte organizații și companii pot fi găsite [aici](https://github.com/huggingface/model_card/blob/master/examples.md).
-
-## Notă[[note]]
-
-Model cardurile nu sunt o cerință obligatorie când se publică modelele si nu este necesar să includeți toate secțiunile descrise mai sus în Model Card. Cu toate acestea, documentarea explicită a modelului poate beneficia utilizatorilor viitori, deci vă recomandăm să completați cât mai multe dintre secțiuni.
-
-## Metadatele cardului de model[[model-card-metadata]]
-
-Dacă ați explorat puțin Hugging Face Hub atunci ar trebui să fi văzut că anumite modele aparțin anumitor categorii: puteți filtra acestea după diverse domenii. Categoriile modelului sunt identificate prin metadata adăugată în secțiunea de header a cardului.
-
-Spre exemplu, dacă vă uitați la modelul [`camembert-base`](https://huggingface.co/camembert-base/blob/main/README.md) atunci veți observa următoarea linii din headerul cardului:
-
-````
----
-language: fr
-license: mit
-datasets:
-- oscar
----
-```
-
-Metadatele acestei secțiuni sunt analizate de Hugging Face Hub, care apoi identifică acest model ca fiind un model francez, cu licență MIT și antrenat pe datasetul Oscar.
-
-[Toate specificările cardului](https://github.com/huggingface/hub-docs/blame/main/modelcard.md) permite specificarea a mai multor metadate, inclusiv limba, licența, etichetele, dataseturile folosite la antrenare și metricile evaluate.
\ No newline at end of file
diff --git a/chapters/ro/chapter4/5.mdx b/chapters/ro/chapter4/5.mdx
deleted file mode 100644
index 509673def..000000000
--- a/chapters/ro/chapter4/5.mdx
+++ /dev/null
@@ -1,12 +0,0 @@
-# Partea 1 este completată!
-
-<CourseFloatingBanner
-    chapter={4}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-Acesta este sfârșitul primei părți a cursului! Partea 2 va fi lansată pe data de 15 noiembrie, cu un mare eveniment comunitar, mai multe informații găsiți [aici](https://huggingface.co/blog/course-launch-event).
-
-Acum, sunteți capabili să faceți fine-tune unui model preantrenat pe o problemă de clasificare a textului (o singură sau perechi de propoziții) și să încarci rezultatele la Model Hub. Să fii sigur că ai învățat această primă secțiune, ar trebui să faci exact acest lucru pe o problemă care ți se pare interesantă (și nu neapărat în limba engleză dacă vorbiți altă limbă)! Puteți găsi ajutor în [forumurile Hugging Face](https://discuss.huggingface.co/) și să împărtășiți proiectul dvs. pe [acest subiect](https://discuss.huggingface.co/t/share-your-projects/6803) odată ce ați terminat.
-
-Ne așteptăm cu nerăbdare să vedem ceea ce veți construi cu aceste cunoștințe :)!
\ No newline at end of file
diff --git a/chapters/ro/chapter4/6.mdx b/chapters/ro/chapter4/6.mdx
deleted file mode 100644
index 746428f14..000000000
--- a/chapters/ro/chapter4/6.mdx
+++ /dev/null
@@ -1,233 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-<!-- DISABLE-FRONTMATTER-SECTIONS -->
-
-# Quiz pentru finalizarea capitolului[[end-of-chapter-quiz]]
-
-<CourseFloatingBanner
-    chapter={4}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-Să testăm ceea ce ai învățat în acest capitol!
-  
-### 1. La ce sunt limitate modelele din Hub?
-
-<Question
-	choices={[ 
-		{
-			text: "Modelele din biblioteca 🤗 Transformers.",
-			explicație: "Ținând cont că modelele din biblioteca 🤗 Transformers sunt disponibile pe Hugging Face Hub, ele nu sunt singurele!"
-		},
-		{
-			text: "Toate modelele cu o interfață similară cu 🤗 Transformers.",
-			explicație: "Nu există nicio cerință de interfață când se încarcă modelele pe Hugging Face Hub."
-		},
-		{
-			text: "Nu există limite.",
-			explicație: "Adevărat! Nu există nici o limită când se încarcă modele pe Hub.",
-            corect: true
-		},
-        {
-			text: "Modele care, într-o anumită măsură, sunt legate de NLP.",
-			explicație: "Nu există nicio cerință privind domeniul aplicației!"
-		}
-	] }
-/>
-
-### 2. Cum poți gestiona modelele pe Hub?
-
-<Question
-	choices={[ 
-		{
-			text: "Printr-un cont GCP.",
-			explicație: "Greșit! "
-		},
-		{
-			text: "Prin distribuția peer-to-peer.",
-			explicație: "Greșit!"
-		},
-		{
-			text: "Prin git și git-lfs.",
-			explicație: "Corect! Modelele din Hub sunt simple repositorii Git, care utilizează <code>git-lfs</code> pentru fișiere mari.",
-            corect: true
-		}
-	] }
-/>
-
-### 3. Ce poți face utilizând interfața web a Hugging Face Hub?
-
-<Question
-	choices={[ 
-		{
-			text: "Forkingul unui repositoriu existent.",
-			explicație: "Nu se poate face forking la un repositoriu pe Hugging Face Hub."
-		},
-		{
-			text: "Crearea unui nou model repository.",
-			explicație: "Corect! Dar nu este singurul lucru pe care îl poți face...",
-            corect: true
-		},
-		{
-			text: "Gestionarea și editarea fișierelor.",
-			explicație: "Corect! Dar nuu este singurul lucru pe care îl poți face..."
-            correct: true
-		},
-        {
-			text: "Încărcarea de fișiere.",
-			explicație: "Corect! Dar nu este singurul lucru..."
-            correct: true
-		},
-        {
-			text: "Vizualizarea diferențelor între versiuni.",
-			explicație: "Corect! Dar nu este singurul lucru pe care îl poți face...",
-            corect: true
-		}
-	] }
-/>
-
-### 4. Ce este un model card?
-
-<Question
-	choices={[ 
-		{
-			text: "O descriere a modelului, deci mai puțin importantă decât fișierele model și tokenizer.",
-			explicație: "Este într-adevăr o descriere a modelului, dar este un element important. Dacă descrierea nu este completă sau absentă, utilitatea modelului se reduce drastic."
-		},
-		{
-			text: "Un mod de asigurare a reproducerii, reutilizării și egalității.",
-			explicație: "Corect! Oferirea informațiilor adecvate în model card va ajuta utilizatorii să utilizeze modelul și să fie conștienți de limitele și biasurile acestuia. ",
-            corect: true
-		},
-		{
-			text: "Un fișier Python care poate fi rulat pentru a obține informații despre model.",
-			explicație: "Model cardurile sunt simple fișiere Markdown."
-		}
-	] }
-/>
-
-Chapitru 4
-
-### 5. Câte dintre obiectele bibliotecii 🤗 Transformers pot fi împărtășite direct pe Hub cu `push_to_hub()`?
-
-{#if fw === 'pt'}
-<Question
-	choices={[
-		{
-			text: "Un tokenizer",
-			explain: "Corect! Toți tokenizerii au metoda <code>push_to_hub</code>, și utilizând-o, vor împărtăși toate fișierele tokenizerului (vocabular, arhitectură tokenizerului, etc.) către un repo. Însă acesta nu este singura soluție corectă!",
-            correct: true
-		},
-		{
-			text: "O configurare a modelului",
-			explain: "Corect! Toate configurațiile modelelor au metoda <code>push_to_hub</code>, și utilizând-o, vor împărtăși configurația către un repo. Și ce altceva poți oferi?",
-            correct: true
-		},
-		{
-			text: "Un model",
-			explain: "Corect! Toate modelele au metoda <code>push_to_hub</code>, și utilizând-o, vor împărtăși ei, precum și fișierele de configurare către un repo. Și nu numai asta!",
-            correct: true
-		},
-        {
-			text: "Un Trainer",
-			explain: "Corect — <code>Trainer</code> implementează metoda <code>push_to_hub</code>, și utilizând-o, vor încărca modelul, configurarea sa, tokenizerul, precum și un draft a unui model card către un repo. Încearcă și altă opțiune!",
-            correct: true
-		}
-	]}
-/>
-
-{:else}
-<Question
-	choices={[
-		{
-			text: "Un tokenizer",
-			explain: "Corect! Toți tokenizerii au metoda <code>push_to_hub</code>, și utilizând-o, vor împărtăși toate fișierele tokenizerului (vocabular, arhitectură tokenizerului, etc.) către un repo. Însă acesta nu este singura soluție corectă!",
-            correct: true
-		},
-		{
-			text: "O configurare a modelului",
-			explain: "Corect! Toate configurațiile modelelor au metoda <code>push_to_hub</code>, și utilizând-o, vor împărtăși configurația către un repo. Și ce altceva poți oferi?",
-            correct: true
-		},
-		{
-			text: "Un model",
-			explain: "Corect! Toate modelele au metoda <code>push_to_hub</code>, și utilizând-o, vor împărtăși ei, precum și fișierele de configurare către un repo. Și nu numai asta!",
-            correct: true
-		},
-        {
-			text: "Toate cele trei cu un callback dedicat",
-			explain: "Corect — <code>PushToHubCallback</code> va trimite regular toate aceste obiecte către un repo în timpul antrenării.",
-            correct: true
-		}
-	]}
-/>
-{/if}
-
-### 6. Care este primul pas atunci când utilizați metoda `push_to_hub()` sau instrumentele CLI?
-
-<Question
-	choices={[
-		{
-			text: "Logarea pe website",
-			explain: "Acest lucru nu vă va ajuta local."
-		},
-		{
-			text: "Rulați 'huggingface-cli login' în terminal.",
-			explain: "Corect — acest lucru va descărca și va stoca tokenul personal.",
-            correct: true
-		},
-		{
-			text: "Rulați 'notebook_login()' într-un notebook",
-			explain: "Corect — acest lucru va afișa un widget pentru a vă autentifica.",
-            correct: true
-		},
-	]
-    }
-/>
-
-
-### 7. Aveți un model și un tokenizer, cum le puteți încărca pe ambele în Hub?
-
-<Question
-	choices={[
-		{
-			text: "Prin apelarea directă a metodei `push_to_hub` pe model și tokenizer",
-			explain: "Corect!",
-            correct: true
-		},
-		{
-			text: "În cadrul runtime-ului Python, prin wrappingul acestora într-un <code>huggingface_hub</code>",
-			explain: "Modelele și tokenizerii deja beneficiază de utilitățile <code>huggingface_hub</code>: nu vă trebuie nici un wrapping suplimentar!"
-		},
-		{
-			text: "Prin salvarea lor pe disc și apelarea <code>transformers-cli upload-model</code>",
-			explain: "Comanda <code>upload-model</code> nu există."
-		}
-	]}
-/>
-
-### 8. Carele operații git poți face cu clasa `Repository`?
-
-<Question
-	choices={[
-		{
-			text: "Un commit",
-			explain: "Corect, metoda <code>git_commit()</code> este acolo pentru a face commit.",
-            correct: true
-		},
-		{
-			text: "Un pull",
-			explain: "Acesta este scopul metodei <code>git_pull()</code>",
-            correct: true
-		},
-		{
-			text: "Un push",
-			explain: "Metoda <code>git_push()</code> face acest lucru.",
-            correct: true
-		},
-		{
-			text: "Un merge",
-			explain: "Nu, această operație nu va fi niciodată posibilă cu acest API."
-		}
-	]}
-/>
\ No newline at end of file

From c1170187ba99e85c2d5ba60c07b44d205116cc2e Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Tue, 27 May 2025 20:59:29 +0300
Subject: [PATCH 123/167] feat: add translated content for chapter 6

---
 chapters/rum/_toctree.yml    |  54 +++
 chapters/rum/chapter0/1.mdx  | 110 ++++++
 chapters/rum/chapter6/1.mdx  |  19 ++
 chapters/rum/chapter6/10.mdx | 283 +++++++++++++++
 chapters/rum/chapter6/2.mdx  | 257 ++++++++++++++
 chapters/rum/chapter6/3.mdx  | 473 ++++++++++++++++++++++++++
 chapters/rum/chapter6/3b.mdx | 643 +++++++++++++++++++++++++++++++++++
 chapters/rum/chapter6/4.mdx  | 122 +++++++
 chapters/rum/chapter6/5.mdx  | 360 ++++++++++++++++++++
 chapters/rum/chapter6/6.mdx  | 375 ++++++++++++++++++++
 chapters/rum/chapter6/7.mdx  | 381 +++++++++++++++++++++
 chapters/rum/chapter6/8.mdx  | 566 ++++++++++++++++++++++++++++++
 chapters/rum/chapter6/9.mdx  |  16 +
 13 files changed, 3659 insertions(+)
 create mode 100644 chapters/rum/_toctree.yml
 create mode 100644 chapters/rum/chapter0/1.mdx
 create mode 100644 chapters/rum/chapter6/1.mdx
 create mode 100644 chapters/rum/chapter6/10.mdx
 create mode 100644 chapters/rum/chapter6/2.mdx
 create mode 100644 chapters/rum/chapter6/3.mdx
 create mode 100644 chapters/rum/chapter6/3b.mdx
 create mode 100644 chapters/rum/chapter6/4.mdx
 create mode 100644 chapters/rum/chapter6/5.mdx
 create mode 100644 chapters/rum/chapter6/6.mdx
 create mode 100644 chapters/rum/chapter6/7.mdx
 create mode 100644 chapters/rum/chapter6/8.mdx
 create mode 100644 chapters/rum/chapter6/9.mdx

diff --git a/chapters/rum/_toctree.yml b/chapters/rum/_toctree.yml
new file mode 100644
index 000000000..9c9bd3d44
--- /dev/null
+++ b/chapters/rum/_toctree.yml
@@ -0,0 +1,54 @@
+- title: 0. Configurare
+  sections:
+  - local: chapter0/1
+    title: Introducere
+
+- title: 1. Modele Transformer
+  sections:
+  - local: chapter1/1
+    title: Introducere
+  - local: chapter1/2
+    title: Procesarea limbajului natural și modelele de limbaj mari
+  - local: chapter1/3
+    title: Transformers, ce pot face?
+  - local: chapter1/4
+    title: Cum funcționează Transformers?
+  - local: chapter1/5
+    title: Modele Encoder
+  - local: chapter1/6
+    title: Modele Decoder
+  - local: chapter1/7
+    title: Modele secvență-la-secvență
+  - local: chapter1/8
+    title: Prejudecăți și limitări
+  - local: chapter1/9
+    title: Rezumat
+  - local: chapter1/10
+    title: Quiz de final de capitol
+    quiz: 1
+
+- title: 6. Biblioteca 🤗 Tokenizers
+  sections:
+  - local: chapter6/1
+    title: Introducere
+  - local: chapter6/2
+    title: Antrenarea unui nou tokenizer dintr-unul vechi
+  - local: chapter6/3
+    title: Superputerile tokenizerilor rapizi
+  - local: chapter6/3b
+    title: Tokenizerii rapizi în pipeline-ul de QA
+  - local: chapter6/4
+    title: Normalizare și pre-tokenizare
+  - local: chapter6/5
+    title: Tokenizare Byte-Pair Encoding
+  - local: chapter6/6
+    title: Tokenizare WordPiece
+  - local: chapter6/7
+    title: Tokenizare Unigram
+  - local: chapter6/8
+    title: Construirea unui tokenizer, bloc cu bloc
+  - local: chapter6/9
+    title: Tokenizeri, verificare!
+  - local: chapter6/10
+    title: Quiz de sfârșit de capitol
+    quiz: 6
\ No newline at end of file
diff --git a/chapters/rum/chapter0/1.mdx b/chapters/rum/chapter0/1.mdx
new file mode 100644
index 000000000..c7c072707
--- /dev/null
+++ b/chapters/rum/chapter0/1.mdx
@@ -0,0 +1,110 @@
+# Introducere[[introducere]]
+
+Bun venit la cursul Hugging Face! Această introducere te va ghida în configurarea environment-ului de lucru. Dacă abia începi cursul, îți recomandăm să arunci o privire mai întâi asupra [Capitolului 1](/course/chapter1), apoi să te întorci și să îți configurezi environment-ul pentru a putea încerca singur codul.
+
+Toate bibliotecile pe care le vom folosi în acest curs sunt disponibile ca Python packages, așa că aici îți vom arăta cum să configurezi Python environment-ul și să instalezi librăriile specifice de care ai nevoie.
+
+Vom acoperi două moduri de a-ți configura environment-ul, folosind un notebook Colab sau un Python environment. Simte-te liber să alegi pe cel care ți se potrivește cel mai bine. Pentru începători, recomandăm să începi folosind un notebook Colab.
+
+Reține că nu vom acoperi sistemul Windows. Dacă folosești Windows, îți recomandăm să urmezi pașii folosind un notebook Colab. Dacă folosești o distribuție Linux sau macOS, poți folosi oricare dintre abordările descrise aici.
+
+Majoritatea cursului se bazează pe faptul că ai un cont Hugging Face. Îți recomandăm să creezi unul acum: [crează un cont](https://huggingface.co/join).
+
+## Folosirea unui notebook Google Colab[[folosind-un-notebook-google-colab]]
+
+Folosirea unui notebook Colab este cea mai simplă configurare posibilă; deschide un notebook în browserul tău și începe imediat să scrii cod!
+
+Dacă nu ești familiarizat cu Colab, îți recomandăm să începi urmând [introducerea](https://colab.research.google.com/notebooks/intro.ipynb). Colab îți permite să folosești hardware accelerat, cum ar fi GPU-uri sau TPU-uri, și este gratuit pentru sarcini mai mici.
+
+Odată ce ești confortabil să te descurci în Colab, creează un nou notebook și începe cu configurarea:
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter0/new_colab.png" alt="Un notebook Colab gol" width="80%"/>
+</div>
+
+Următorul pas este să instalezi librăriile pe care le vom folosi în acest curs. Vom folosi `pip` pentru instalare, care este managerul de packages pentru Python. În notebook-uri, poți rula comenzi de sistem începând comanda cu caracterul `!`, așa că poți instala librăria 🤗 Transformers astfel:
+
+```
+!pip install transformers
+```
+
+Te poți asigura că pachetul a fost instalat corect importându-l în cadrul mediului tău Python:
+
+```
+import transformers
+```
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter0/install.gif" alt="O animație care arată rezultatul celor două comenzi de mai sus: instalare și importarea" width="80%"/>
+</div>
+
+Aceasta instalează o versiune foarte ușoară a 🤗 Transformers. În special, nu sunt instalate framework-uri specifice de machine learning (cum ar fi PyTorch sau TensorFlow). Deoarece vom folosi multe caracteristici diferite ale librăriei, îți recomandăm să instalezi versiunea pentru development, care vine cu toate dependențele necesare pentru cam orice caz de utilizare imaginabil:
+
+```
+!pip install transformers[sentencepiece]
+```
+
+Aceasta va dura puțin timp, dar apoi vei fi gata de drum pentru restul cursului!
+
+## Folosirea unui virtual environment Python[[folosirea-unui-virtual-environment-python]]
+
+Dacă preferi să folosești un mediu virtual Python, primul pas este să instalezi Python pe sistemul tău. Îți recomandăm să urmezi [această ghidare](https://realpython.com/installing-python/) pentru a începe.
+
+Odată ce ai Python instalat, ar trebui să poți rula comenzi Python în terminalul tău. Poți începe rulând următoarea comandă pentru a te asigura că este instalat corect înainte de a trece la pașii următori: `python --version`. Aceasta ar trebui să afișeze versiunea Python disponibilă acum pe sistemul tău.
+
+Când rulezi o comandă Python în terminalul tău, cum ar fi `python --version`, ar trebui să te gândești la programul care rulează comanda ta ca la Python-ul "principal" de pe sistemul tău. Îți recomandăm să păstrezi această instalare principală liberă de orice pachete și să o folosești pentru a crea environment-uri separate pentru fiecare aplicație pe care lucrezi — în acest fel, fiecare aplicație poate avea propriile sale dependențe și pachete, și nu va trebui să te preocupi de problemele de compatibilitate potențiale cu alte aplicații.
+
+În Python, acest lucru se face prin [*virtual environments*](https://docs.python.org/3/tutorial/venv.html), care sunt directory trees autonomi ce conțin fiecare o instalare Python cu o anumită versiune Python împreună cu toate pachetele de care are nevoie aplicația. Crearea unui astfel de mediu virtual poate fi realizată cu mai multe instrumente diferite, dar vom folosi pachetul oficial Python pentru acest scop, denumit [`venv`](https://docs.python.org/3/library/venv.html#module-venv).
+
+În primul rând, creează folder în care dorești ca aplicația ta să locuiască — de exemplu, ai putea dori să faci un nou folder numit *transformers-course* în rădăcina folderului tău personal:
+
+```
+mkdir ~/transformers-course
+cd ~/transformers-course
+```
+
+Din interiorul acestui folder, creează un virtual environment folosind modulul Python `venv`:
+
+```
+python -m venv .env
+```
+
+Acum ar trebui să ai un folder numit *.env* în folderul tău altfel gol:
+
+```
+ls -a
+```
+
+```out
+.      ..    .env
+```
+
+Poți să intri și să ieși din environment folosind comenzile `activate` și `deactivate`:
+
+```
+# Activează mediul virtual
+source .env/bin/activate
+
+# Dezactivează virtual environment-ul
+deactivate
+```
+
+Te poți asigura că environment-ul este activat rulând comanda `which python`: dacă aceasta indică către virtual environment, atunci l-ai activat cu succes!
+
+```
+which python
+```
+
+```out
+/home/<user>/transformers-course/.env/bin/python
+```
+
+### Instalarea dependențelor[[instalarea-dependențelor]]
+
+La fel ca în secțiunea anterioară despre utilizarea instanțelor Google Colab, acum va trebui să instalezi pachetele necesare pentru a continua. Din nou, poți instala versiunea pentru development a 🤗 Transformers folosind managerul de pachete `pip`:
+
+```
+pip install "transformers[sentencepiece]"
+```
+
+Acum ești gata să începi!
\ No newline at end of file
diff --git a/chapters/rum/chapter6/1.mdx b/chapters/rum/chapter6/1.mdx
new file mode 100644
index 000000000..9cfd151ed
--- /dev/null
+++ b/chapters/rum/chapter6/1.mdx
@@ -0,0 +1,19 @@
+# Introducere[[introducere]]
+
+<CourseFloatingBanner
+    chapter={6}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+În [Capitolul 3](/course/chapter3), am examinat cum să facem fine-tune unui model pentru o anumită sarcină. Când facem acest lucru, utilizăm același tokenizer cu care modelul a fost antrenat - dar ce facem când dorim să antrenăm un model de la zero? În așa cazuri, utilizarea unui tokenizer care a fost antrenat pe un corpus dintr-un alt domeniu sau limbă este, de obicei, suboptimal. De exemplu, un tokenizer antrenat pe un corpus în limba engleză va funcționa rău pe un corpus de texte în limba japoneză, deoarece utilizarea spațiilor și a punctuației este foarte diferită în cele două limbi.
+
+În acest capitol, veți învăța cum să antrenați un tokenizer complet nou pe un corpus de texte, astfel încât să poată fi utilizat pentru a antrena un model de limbaj. Acest lucru va fi realizat cu ajutorul bibliotecii [🤗 Tokenizers](https://github.com/huggingface/tokenizers), care oferă tokenizerii "rapizi" din biblioteca [🤗 Transformers](https://github.com/huggingface/transformers). Vom examina îndeaproape caracteristicile pe care această bibliotecă le oferă și vom explora cum tokenizatorii rapizi diferă de versiunile "lente".
+
+Subiectele pe care le vom acoperi includ:
+
+* Cum să antrenați un tokenizer nou similar celui utilizat de un anumit checkpoint pe un corpus nou de texte
+* Caracteristicile speciale ale tokenizerilor rapizi
+* Diferențele dintre cei trei algoritmi principali de subword tokenization utilizate în NLP în prezent
+* Cum să construiți un tokenizer de la zero cu biblioteca 🤗 Tokenizers și să îl antrenați pe anumite date
+
+Tehnicile prezentate în acest capitol vă vor pregăti pentru secțiunea din [Capitolul 7](/course/chapter7/6), unde vom examina crearea unui model de limbaj pentru codul sursă Python. Să începem prin a explora ce înseamnă să "antrenați" un tokenizer în primul rând.
diff --git a/chapters/rum/chapter6/10.mdx b/chapters/rum/chapter6/10.mdx
new file mode 100644
index 000000000..f3fcf6dc7
--- /dev/null
+++ b/chapters/rum/chapter6/10.mdx
@@ -0,0 +1,283 @@
+<!-- DISABLE-FRONTMATTER-SECTIONS -->
+
+# Quiz de sfârșit de capitol[[end-of-chapter-quiz]]
+
+<CourseFloatingBanner
+    chapter={6}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+Hai să testăm ceea ce ai învățat în acest capitol!
+
+### 1. Când ar trebui să antrenezi un nou tokenizer?
+
+<Question
+	choices={[
+		{
+			text: "Când datasetul tău este similar cu cel utilizat de un model preantrenat și doriți să preantrenați un model nou",
+			explain: "În acest caz, pentru a economisi timp și resurse, o alegere mai bună ar fi să folosești același tokenizer ca și modelul preantrenat și să faceți fine-tune acelui model."
+		},
+		{
+			text: "Atunci când datasetul tău este similar cu cel utilizat de un model preantrenat existent și doriți să faceți fine-tune unui nou model utilizând acest model preantrenat",
+			explain: "Pentru a face fine-tune unui model dintr-un model preantrenat, trebuie să utilizați întotdeauna același tokenizer."
+		},
+		{
+			text: "Atunci când datasetul tău este diferit de cel utilizat de un model preantrenat existent și doriți să preantrenați un nou model",
+			explain: "Corect! În acest caz nu există niciun avantaj în a utiliza același tokenizer.",
+            correct: true
+		},
+        {
+			text: "Atunci datasetul tău este diferit de cel utilizat de un model preantrenat existent, dar doriți să faceți fine-tune unui model nou utilizând acest model preantrenat",
+			explain: "Pentru a face fine-tune unui model dintr-un model preantrenat, trebuie să utilizați întotdeauna același tokenizer."
+		}
+	]}
+/>
+
+### 2. Care este avantajul utilizării unui generator de liste de texte în comparație cu o listă de liste de texte atunci când utilizați `train_new_from_iterator()`?
+
+<Question
+	choices={[
+		{
+			text: "Acesta este singurul tip pe care metoda <code>train_new_from_iterator()</code> îl acceptă.",
+			explain: "O listă de liste de texte este un tip special de generator de liste de texte, astfel încât metoda o va accepta și pe aceasta. Încercați din nou!"
+		},
+		{
+			text: "Veți evita încărcarea întregului dataset în memorie.",
+			explain: "Corect! Fiecare batch de texte va fi eliberat din memorie atunci când iterați, iar câștigul va fi vizibil mai ales dacă utilizați 🤗 Datasets pentru a stoca textele.",
+			correct: true
+		},
+		{
+			text: "Acest lucru va permite bibliotecii 🤗 Tokenizers să utilizeze multiprocessing.",
+			explain: "Nu, oricum va folosi multiprocessing."
+		},
+        {
+			text: "Tokenizerul pe care îl vei antrena va genera texte mai bune.",
+			explain: "Tokenizerul nu generează text - îl confundați cu un model lingvistic?"
+		}
+	]}
+/>
+
+### 3. Care sunt avantajele utilizării unui tokenizer "rapid"?
+
+<Question
+	choices={[
+		{
+			text: "Acesta poate procesa inputuri mai rapid decât un tokenizator lent atunci când faci batch mai multor inputuri împreună.",
+			explain: "Corect! Datorită paralelismului implementat în Rust, acesta va fi mai rapid pe batch-uri de inputuri. La ce alt beneficiu te poți gândi?",
+			correct: true
+		},
+		{
+			text: "Tokenizerele rapide tokenizează întotdeauna mai rapid decât omologii lor lenți.",
+			explain: "Un tokenizer rapid poate fi de fapt mai lent atunci când îi dai doar unul sau foarte puține texte, deoarece nu poate utiliza paralelismul."
+		},
+		{
+			text: "Poate aplica padding și truncation.",
+			explain: "Adevărat, dar și tokenizerele lente fac asta."
+		},
+        {
+			text: "Acesta are unele caracteristici suplimentare care vă permit să asociați tokenii cu intervalul de text care le-a creat.",
+			explain: "Într-adevăr - acestea se numesc offset mappings. Totuși, acesta nu este singurul avantaj.",
+			correct: true
+		}
+	]}
+/>
+
+### 4. Cum tratează pipelineul `token-classification` entitățile care se întind pe mai mulți tokeni?
+
+<Question
+	choices={[
+		{
+			text: "Entitățile cu același label sunt merged într-o singură entitate.",
+			explain: "Explicația aceasta e prea simplă. Încearcă din nou!"
+		},
+		{
+			text: "Există un label pentru începutul unei entități și un label pentru continuarea unei entități.",
+			explain: "Corect!",
+			correct: true
+		},
+		{
+			text: "Într-un cuvânt dat, atâta timp cât primul token are labelul entității, întregul cuvânt este considerat etichetat cu entitatea respectivă.",
+			explain: "Aceasta este o strategie de gestionare a entităților. Ce alte răspunsuri se aplică aici?",
+			correct: true
+		},
+        {
+			text: "Atunci când un token are labelul unei entități date, orice alt token următor cu aceeași label este considerat parte a aceleiași entități, cu excepția cazului în care este labeled ca fiind începutul unei noi entități.",
+			explain: "Acesta este cel mai comun mod de a grupa entitățile împreună - deși nu este singurul răspuns corect.",
+			correct: true
+		}
+	]}
+/>
+
+### 5. Cum gestionează pipelineul `question-answering` contextele lungi?
+
+<Question
+	choices={[
+		{
+			text: "De fapt, nu o face, deoarece trunchiază contextul lung la lungimea maximă acceptată de model.",
+			explain: "Există un truc pe care îl poți folosi pentru a gestiona contextele lungi. Îți amintești care este acesta?"
+		},
+		{
+			text: "Acesta împarte contextul în mai multe părți și calculează media rezultatelor obținute.",
+			explain: "Nu, nu ar avea sens să se facă o medie a rezultatelor, deoarece unele părți ale contextului nu vor include răspunsul."
+		},
+		{
+			text: "Acesta împarte contextul în mai multe părți (cu suprapuneri) și găsește scorul maxim pentru un răspuns în fiecare parte.",
+			explain: "Acesta este răspunsul corect!",
+			correct: true
+		},
+        {
+			text: "Acesta împarte contextul în mai multe părți (fără suprapunere, pentru eficiență) și găsește scorul maxim pentru un răspuns în fiecare parte.",
+			explain: "Nu, acesta include o anumită suprapunere între părți pentru a evita situația în care răspunsul ar fi împărțit în două părți."
+		}
+	]}
+/>
+
+### 6. Ce este normalizarea?
+
+<Question
+	choices={[
+		{
+			text: "Este vorba de orice curățare pe care tokenizerul o efectuează asupra textelor în etapele inițiale.",
+			explain: "Corect - de exemplu, ar putea implica eliminarea accentelor sau a spațiilor, sau scrierea cu mijuscule a inputurilor.",
+			correct: true
+		},
+		{
+			text: "Este o tehnică de augmentare a datelor care constă în a face textul mai normal prin eliminarea cuvintelor rare.",
+			explain: "Este incorect! Încearcă din nou."
+		},
+		{
+			text: "Acesta este ultimul pas de post-procesare în care tokenizerul adaugă tokenii speciali.",
+			explain: "Această etapă se numește pur și simplu post-procesare."
+		},
+        {
+			text: "Este atunci când embeddingurile sunt realizate cu media 0 și standard deviation 1, prin scăderea mediei și împărțirea la std.",
+			explain: "Acest proces se numește de obicei normalizare atunci când este aplicat valorilor pixelilor în computer vision, dar nu este ceea ce înseamnă normalizare în NLP."
+		}
+	]}
+/>
+
+### 7. Ce este pre-tokenizarea pentru un subword tokenizer?
+
+<Question
+	choices={[
+		{
+			text: "Acesta este pasul dinaintea tokenizării, în care se aplică augmentarea datelor (cum ar fi mascarea aleatorie).",
+			explain: "Nu, acest pas face parte din preprocesare."
+		},
+		{
+			text: "Este pasul de dinaintea tokenizării, în care operațiile de curățare dorite sunt aplicate textului.",
+			explain: "Nu, acesta este pasul de normalizare."
+		},
+		{
+			text: "Acesta este pasul dinaintea aplicării modelul de tokenizer, pentru a împărți inputul în cuvinte.",
+			explain: "Acesta este răspunsul corect!",
+			correct: true
+		},
+        {
+			text: "Acesta este pasul dinaintea aplicării modelul de  tokenizer, pentru a împărți inputul în tokenuri.",
+			explain: "Nu, împărțirea în tokenuri este sarcina modelul de tokenizer."
+		}
+	]}
+/>
+
+### 8. Selectați propozițiile care se aplică modelului de tokenizare BPE.
+
+<Question
+	choices={[
+		{
+			text: "BPE este un algoritm de tokenizare a subcuvintelor care începe cu un vocabular mic și învață reguli de merge.",
+			explain: "Acesta este într-adevăr cazul!",
+			correct: true
+		},
+		{
+			text: "BPE este un algoritm de tokenizare a subcuvintelor care începe cu un vocabular mare și elimină progresiv tokenii din acesta.",
+			explain: "Nu, aceasta este abordarea adoptată de un alt algoritm de tokenizare."
+		},
+		{
+			text: "Tokenizerele BPE învață regulile de merge prin mergeul perechii de tokeni care este cea mai frecventă.",
+			explain: "Acest lucru este corect!",
+			correct: true
+		},
+		{
+			text: "Un tokenizer BPE învață o regulă de merge prin mergeul perechii de tokeni care maximizează un scor care privilegiază perechile frecvente cu părți individuale mai puțin frecvente.",
+			explain: "Nu, aceasta este strategia aplicată de un alt algoritm de tokenizare."
+		},
+		{
+			text: "BPE tokenizează cuvintele în subcuvinte prin divizarea lor în caractere și apoi prin aplicarea regulilor de merge.",
+			explain: "Acest lucru este corect!",
+			correct: true
+		},
+		{
+			text: "BPE tokenizează cuvintele în subcuvinte prin găsirea celui mai lung subcuvânt de la început care se află în vocabular, apoi repetă procesul pentru restul textului.",
+			explain: "Nu, acesta este un alt mod de a face lucrurile al algoritmului de tokenizare."
+		},
+	]}
+/>
+
+### 9. Selectați propozițiile care se aplică modelului de tokenizare WordPiece.
+
+<Question
+	choices={[
+		{
+			text: "WordPiece este un algoritm de tokenizare a subcuvintelor care începe cu un vocabular mic și învață reguli de merge.",
+			explain: "Acesta este într-adevăr cazul!",
+			correct: true
+		},
+		{
+			text: "WordPiece este un algoritm de tokenizare a subcuvintelor care începe cu un vocabular mare și elimină progresiv tokenii din acesta.",
+			explain: "Nu, aceasta este abordarea adoptată de un alt algoritm de tokenizare."
+		},
+		{
+			text: "Tokenizerele WordPiece învață regulile de merge prin mergeul perechii de tokeni care este cea mai frecventă.",
+			explain: "Nu, aceasta este abordarea adoptată de un alt algoritm de tokenizare!",
+		},
+		{
+			text: "Un tokenizer WordPiece învață o regulă de merge prin mergeul perechii de tokeni care maximizează un scor care privilegiază perechile frecvente cu părți individuale mai puțin frecvente.",
+			explain: "Acest lucru este corect!",
+			correct: true
+		},
+		{
+			text: "WordPiece tokenizează cuvintele în subcuvinte prin găsirea celei mai probabile segmentări în tokeni, în conformitate cu modelul.",
+			explain: "Nu, acesta este modul în care funcționează un alt algoritm de tokenizare."
+		},
+		{
+			text: "WordPiece tokenizează cuvintele în subcuvinte prin găsirea celui mai lung subcuvânt de la început care se află în vocabular, apoi repetă procesul pentru restul textului.",
+			explain: "Da, acesta este modul în care WordPiece procedează pentru encoding.",
+			correct: true
+		},
+	]}
+/>
+
+### 10. Selectați propozițiile care se aplică modelului de tokenizare Unigram.
+
+<Question
+	choices={[
+		{
+			text: "Unigram este un algoritm de tokenizare a subcuvintelor care începe cu un vocabular mic și învață reguli de merge.",
+			explain: "Nu, aceasta este abordarea adoptată de un alt algoritm de tokenizare."
+		},
+		{
+			text: "Unigram este un algoritm de tokenizare a subcuvintelor care începe cu un vocabular mare și elimină progresiv tokenurile din el.",
+			explain: "Acest lucru este corect!",
+			correct: true
+		},
+		{
+			text: "Unigram își adaptează vocabularul prin minimizarea unei pierderi calculate pe întregul corpus.",
+			explain: "Acest lucru este corect!",
+			correct: true
+		},
+		{
+			text: "Unigram își adaptează vocabularul prin păstrarea celor mai frecvente subcuvinte.",
+			explain: "Nu, acest lucru este incorect."
+		},
+		{
+			text: "Unigram tokenizează cuvintele în subcuvinte prin găsirea celei mai probabile segmentări în tokenuri, conform modelului.",
+			explain: "Acest lucru este corect!",
+			correct: true
+		},
+		{
+			text: "Unigram tokenizează cuvintele în subcuvinte prin divizarea lor în caractere, apoi aplică regulile de merge.",
+			explain: "Nu, acesta este modul în care funcționează un alt algoritm de tokenizare."
+		},
+	]}
+/>
diff --git a/chapters/rum/chapter6/2.mdx b/chapters/rum/chapter6/2.mdx
new file mode 100644
index 000000000..ef36da15c
--- /dev/null
+++ b/chapters/rum/chapter6/2.mdx
@@ -0,0 +1,257 @@
+# Antrenarea unui nou tokenizer dintr-unul vechi[[training-a-new-tokenizer-from-an-old-one]]
+
+<CourseFloatingBanner chapter={6}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter6/section2.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter6/section2.ipynb"},
+]} />
+
+Dacă un model de limbaj nu este disponibil în limba dorită sau dacă corpusul tău este foarte diferit de cel pe care modelul de limbaj a fost antrenat, este probabil că veți dori să antrenați modelul de la zero, folosind un tokenizer adaptat datelor tale. Acest lucru va necesita antrenarea unui nou tokenizer pe datasetul tău. Dar ce înseamnă exact asta? Când am examinat pentru prima dată tokenizatorii în [Capitolul 2](/course/chapter2), am văzut că majoritatea modelelor Transformer folosesc un _algoritm de subword tokenization_. Pentru a identifica care subcuvinte sunt de interes și apar cel mai frecvent în corpusul respectiv, tokenizerul trebuie să examineze cu atenție toate textele din corpus - un proces pe care îl numim *antrenare*. Regulile exacte care conduc această antrenare depind de tipul de tokenizer utilizat și vom prezenta cei trei algoritmi principali mai târziu în acest capitol.
+
+<Youtube id="DJimQynXZsQ"/>
+
+<Tip warning={true}>
+
+⚠️ Antrenarea unui tokenizer nu este același lucru ca antrenarea unui model! Antrenarea modelului folosește stochastic gradient descent pentru a face pierderea puțin mai mică pentru fiecare batch. Este randomizată prin natură (ceea ce înseamnă că trebuie să setați niște seeduri pentru a obține aceleași rezultate atunci când faceți aceeași antrenare de două ori). Antrenarea unui tokenizer este un proces statistic care încearcă să identifice care subcuvinte sunt cele mai bune pentru a fi selectate pentru un anumit corpus, și regulile exacte utilizate pentru a le selecta depind de algoritmul de tokenizare. Este determinist, ceea ce înseamnă că întotdeauna obțineți aceleași rezultate atunci când antrenați cu același algoritm pe același corpus.
+
+</Tip>
+
+## Asamblarea unui corpus[[assembling-a-corpus]]
+
+Există o interfață API foarte simplă în 🤗 Transformers pe care o puteți utiliza pentru a antrena un nou tokenizer cu aceleași caracteristici ca unul existent: `AutoTokenizer.train_new_from_iterator()`. Pentru a vedea acest lucru în acțiune, să zicem că vrem să antrenăm GPT-2 de la zero, dar într-o altă limbă decât engleza. Prima noastră sarcină va fi să adunăm multe date în acea limbă într-un corpus de antrenare. Pentru a oferi exemple pe care toată lumea le poate înțelege, nu vom folosi o limbă ca rusă sau chineza aici, ci mai degrabă o limbă engleză specializată: codul Python.
+
+Biblioteca [🤗 Datasets](https://github.com/huggingface/datasets) ne poate ajuta să asamblăm un corpus de cod sursă Python. Vom folosi funcția obișnuită `load_dataset()` pentru a descărca și a păstra în cache dataseul [CodeSearchNet](https://huggingface.co/datasets/code_search_net). Acest dataset a fost creat pentru [Provocarea CodeSearchNet](https://wandb.ai/github/CodeSearchNet/benchmark) și conține milioane de funcții din biblioteci open-source de pe GitHub în mai multe limbaje de programare. Aici, vom încărca partea Python a acestui dataset:
+
+```py
+from datasets import load_dataset
+
+# Acest lucru poate dura câteva minute pentru a încărca, așa că luați o pauză și beți o ceașcă de cafea sau ceai în timp ce așteptați!
+raw_datasets = load_dataset("code_search_net", "python")
+```
+
+Putem să ne uităm la splitul de antrenare pentru a vedea la care coloane avem acces:
+
+```py
+raw_datasets["train"]
+```
+
+```python out
+Dataset({
+    features: ['repository_name', 'func_path_in_repository', 'func_name', 'whole_func_string', 'language', 
+      'func_code_string', 'func_code_tokens', 'func_documentation_string', 'func_documentation_tokens', 'split_name', 
+      'func_code_url'
+    ],
+    num_rows: 412178
+})
+```
+
+Putem vedea că dataset-ul separă docstringurile de cod și sugerează o tokenizare a ambelor. Aici, vom folosi doar coloana `whole_func_string` pentru a antrena tokenizerul nostru. Putem să ne uităm la un exemplu al unei astfel de funcții prin indexarea în splitul de antrenare:
+
+```py
+print(raw_datasets["train"][123456]["whole_func_string"])
+```
+
+care ar trebui să printeze următorul lucru:
+
+```out
+def handle_simple_responses(
+      self, timeout_ms=None, info_cb=DEFAULT_MESSAGE_CALLBACK):
+    """Accepts normal responses from the device.
+
+    Args:
+      timeout_ms: Timeout in milliseconds to wait for each response.
+      info_cb: Optional callback for text sent from the bootloader.
+
+    Returns:
+      OKAY packet's message.
+    """
+    return self._accept_responses('OKAY', info_cb, timeout_ms=timeout_ms)
+```
+
+Primul lucru pe care trebuie să-l facem este să transformăm setul de date într-un _iterator_ de liste de texte - de exemplu, o listă de liste de texte. Utilizarea listelor de texte va permite tokenizerului nostru să funcționeze mai rapid (antrenându-se pe batch-uri de texte în loc de a procesa texte individuale unul câte unul), iar acesta ar trebui să fie un iterator dacă dorim să evităm să avem tot în memoria RAM deodată. Dacă corpusul tău este uriaș, veți dori să profitați de faptul că 🤗 Datasets nu încarcă totul în memoria RAM, ci stochează elementele datasetului pe disc.
+
+Următoarea operație ar crea o listă de liste de 1.000 de texte fiecare, dar ar încărca totul în memorie:
+
+```py
+# Nu faceți uncomment următoarei linii dacă datasetul vostru este mare, ci doar dacă este mic!
+# training_corpus = [raw_datasets["train"][i: i + 1000]["whole_func_string"] for i in range(0, len(raw_datasets["train"]), 1000)]
+```
+
+Utilizând un generator Python, putem evita ca Python să încarce orice în memorie până când este realmente necesar. Pentru a crea un astfel de generator, trebuie doar să înlocuiți parantezele pătrate cu paranteze rotunde:
+
+```py
+training_corpus = (
+    raw_datasets["train"][i : i + 1000]["whole_func_string"]
+    for i in range(0, len(raw_datasets["train"]), 1000)
+)
+```
+
+Această linie de cod nu extrage niciun element al setului de date; doar creează un obiect pe care îl puteți utiliza într-un `for` loop din Python. Textele vor fi încărcate doar atunci când veți avea nevoie de ele(adică atunci când sunteți la pasul loopului `for` care le solicită), iar doar 1.000 de texte vor fi încărcate la un moment dat. Acest mod vă permite să nu epuizați memoria RAM chiar dacă prelucrați un set de date uriaș.
+
+Problema cu un obiect generator este că poate fi utilizat doar o dată, așadar, în loc să ne ofere lista primelor 10 cifre de două ori:
+
+```py
+gen = (i for i in range(10))
+print(list(gen))
+print(list(gen))
+```
+
+noi le primim o dată și apoi o listă goală:
+
+```python out
+[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
+[]
+```
+
+Din acest motive noi definim o funcție ce returnează în schimb un generator: 
+
+```py
+def get_training_corpus():
+    return (
+        raw_datasets["train"][i : i + 1000]["whole_func_string"]
+        for i in range(0, len(raw_datasets["train"]), 1000)
+    )
+
+
+training_corpus = get_training_corpus()
+```
+
+În același timp poți defini un generator înăuntrul unui `for` loop folosing statementul `yield`:
+
+```py
+def get_training_corpus():
+    dataset = raw_datasets["train"]
+    for start_idx in range(0, len(dataset), 1000):
+        samples = dataset[start_idx : start_idx + 1000]
+        yield samples["whole_func_string"]
+```
+
+ceea ce va produce același generator ca înainte, dar îți va permite să folosești o logică mai complexă decât cea pe care ai putea să o folosești într-un list comprehension.
+
+## Antrenarea unui nou tokenizer[[training-a-new-tokenizer]]
+
+Acum că avem corpusul nostru sub forma unui iterator de batch-uri de texte, suntem gata să antrenăm un nou tokenizer. Pentru a face acest lucru, trebuie mai întâi să încărcăm tokenizerul pe care dorim să-l asociem cu modelul nostru (aici, GPT-2):
+
+```py
+from transformers import AutoTokenizer
+
+old_tokenizer = AutoTokenizer.from_pretrained("gpt2")
+```
+
+Chiar dacă urmează să antrenăm un nou tokenizer, este o idee bună să facem acest lucru pentru a evita să începem să facem tot de la zero. Astfel, nu vom fi nevoiți să specificăm nimic despre algoritmul de tokenizare sau despre special tokens pe care îi vom utiliza; noul nostru tokenizer va fi exact la fel ca GPT-2, iar singur lucrul care se va schimba este vocabularul, care va fi determinat de antrenarea pe corpusul nostru.
+
+Mai întâi, hai să vedem cum ar interpreta acest tokenizer un exemplu de funcție:
+
+```py
+example = '''def add_numbers(a, b):
+    """Add the two numbers `a` and `b`."""
+    return a + b'''
+
+tokens = old_tokenizer.tokenize(example)
+tokens
+```
+
+```python out
+['def', 'Ġadd', '_', 'n', 'umbers', '(', 'a', ',', 'Ġb', '):', 'Ċ', 'Ġ', 'Ġ', 'Ġ', 'Ġ"""', 'Add', 'Ġthe', 'Ġtwo',
+ 'Ġnumbers', 'Ġ`', 'a', '`', 'Ġand', 'Ġ`', 'b', '`', '."', '""', 'Ċ', 'Ġ', 'Ġ', 'Ġ', 'Ġreturn', 'Ġa', 'Ġ+', 'Ġb']
+```
+
+Acest tokenizer are câteva simboluri speciale, cum ar fi `Ġ` și `Ċ`, care denotă spații și noi linii, respectiv. Așa cum se poate vedea, acest lucru nu este prea eficient: tokenizerul returnează tokenuri individuale pentru fiecare spațiu, când ar putea grupa împreună nivelurile de indentare (deoarece având seturi de patru sau opt spații va fi foarte comun în cod). De asemenea, a divizat numele funcției într-un mod ciudat, nefiind obișnuit să vadă cuvinte care conțin caracterele `_`.
+
+Acum hai să antrenăm un nou tokenizer și să vedem dacă rezolvă aceste probleme. Pentru aceasta, vom utiliza metoda `train_new_from_iterator()`:
+
+```py
+tokenizer = old_tokenizer.train_new_from_iterator(training_corpus, 52000)
+```
+
+Această comandă ar putea dura puțin timp dacă corpusul este foarte mare, dar pentru acest dataset de 1,6 GB de texte este extrem de rapid (1 minut și 16 secunde pe un procesor AMD Ryzen 9 3900X cu 12 nuclee).
+
+Reține că `AutoTokenizer.train_new_from_iterator()` funcționează doar dacă tokenizerul pe care îl utilizați este un tokenizer "rapid". Așa cum veți vedea în următoarea secțiune, biblioteca 🤗 Transformers conține două tipuri de tokenizeri: unii sunt scriși în pur Python, iar alții (cei rapizi) sunt susținuți de biblioteca 🤗 Tokenizers, care este scrisă în limbajul de programare Rust. Python este limbajul cel mai frecvent utilizat pentru aplicații de data science și deep learning, dar atunci când orice trebuie să fie paralelizat pentru a fi rapid, trebuie să fie scris într-un alt limbaj de programare. De exemplu, multiplicările matricelor care sunt la baza calculelor modelului sunt scrise în CUDA, o bibliotecă C optimizată pentru GPU-uri.
+
+Antrenarea unui tokenizer nou în pur  Python ar fi extrem de lent, de aceea am dezvoltat biblioteca 🤗 Tokenizers. Reține că, la fel cum nu a trebuit să învățați limbajul CUDA pentru a putea executa modelul pe un batch de inputuri pe un GPU, nu veți avea nevoie să învățați Rust pentru a utiliza un tokenizer rapid. Biblioteca 🤗 Tokenizers oferă legături Python pentru multe metode care apelează intern unele bucăți de cod în Rust; de exemplu, pentru a paraleliza antrenarea noului tokenizer sau, așa cum am văzut în [Capitolul 3](/course/chapter3), tokenizarea unui batch de inputuri.
+
+Majoritatea modelelor Transformer au un tokenizer rapid disponibil (există unele excepții pe care le puteți verifica [aici](https://huggingface.co/transformers/#supported-frameworks)), iar API-ul `AutoTokenizer` selectează întotdeauna tokenizerul rapid pentru tine dacă este disponibil. În următoarea secțiune, vom examina unele dintre celelalte caracteristici speciale ale tokenizerilor rapizi, care vor fi foarte utile pentru sarcini precum clasificarea tokenilor și răspunderea la întrebări. Înainte de a face acest lucru, totuși, să încercăm noul nostru tokenizer pe exemplul anterior:
+
+```py
+tokens = tokenizer.tokenize(example)
+tokens
+```
+
+```python out
+['def', 'Ġadd', '_', 'numbers', '(', 'a', ',', 'Ġb', '):', 'ĊĠĠĠ', 'Ġ"""', 'Add', 'Ġthe', 'Ġtwo', 'Ġnumbers', 'Ġ`',
+ 'a', '`', 'Ġand', 'Ġ`', 'b', '`."""', 'ĊĠĠĠ', 'Ġreturn', 'Ġa', 'Ġ+', 'Ġb']
+```
+
+Aici din nou vedem simboluri speciale ca `Ġ` sau `Ċ` care denotă spații sau linii noi, dar în același timp putem vedea că tokenizerul nostru a învățat câțiva tokens care sunt foarte specifici la corpusul de funcții Python: de exemplu, tokenul `ĊĠĠĠ` care reprezintă indentarea, sau tokenul `Ġ"""` care reprezintă cele trei ghilimele cu care se începe un docstring. Tokenizerul, de asemenea face split corect numelui funției pe `_`. Aceasta chiar este o reprezentare compactă: comparativ, utilizând limba tokenizerul Englez pe același exemplu ne va da o propoziție mai lungă:
+
+```py
+print(len(tokens))
+print(len(old_tokenizer.tokenize(example)))
+```
+
+```python out
+27
+36
+```
+
+Hai să ne uităm la un alt exemplu:
+
+```python
+example = """class LinearLayer():
+    def __init__(self, input_size, output_size):
+        self.weight = torch.randn(input_size, output_size)
+        self.bias = torch.zeros(output_size)
+
+    def __call__(self, x):
+        return x @ self.weights + self.bias
+    """
+tokenizer.tokenize(example)
+```
+
+```python out
+['class', 'ĠLinear', 'Layer', '():', 'ĊĠĠĠ', 'Ġdef', 'Ġ__', 'init', '__(', 'self', ',', 'Ġinput', '_', 'size', ',',
+ 'Ġoutput', '_', 'size', '):', 'ĊĠĠĠĠĠĠĠ', 'Ġself', '.', 'weight', 'Ġ=', 'Ġtorch', '.', 'randn', '(', 'input', '_',
+ 'size', ',', 'Ġoutput', '_', 'size', ')', 'ĊĠĠĠĠĠĠĠ', 'Ġself', '.', 'bias', 'Ġ=', 'Ġtorch', '.', 'zeros', '(',
+ 'output', '_', 'size', ')', 'ĊĊĠĠĠ', 'Ġdef', 'Ġ__', 'call', '__(', 'self', ',', 'Ġx', '):', 'ĊĠĠĠĠĠĠĠ',
+ 'Ġreturn', 'Ġx', 'Ġ@', 'Ġself', '.', 'weights', 'Ġ+', 'Ġself', '.', 'bias', 'ĊĠĠĠĠ']
+```
+
+În plus față de tokenul corespunzător unei indentări, aici putem vedea și un token pentru o indentare dublă: `ĊĠĠĠĠĠĠĠ`. Cuvintele speciale din Python, cum ar fi `class`, `init`, `call`, `self` și `return`, sunt tokenizate fiecare ca un singur token, și putem vedea că, pe lângă divizarea la `_` și `.`, tokenizerul divizează corect chiar și numele scrise în stil camel-case: `LinearLayer` este tokenizeat ca `["ĠLinear", "Layer"]`.
+
+## Salvarea tokenizerului[[saving-the-tokenizer]]
+
+Pentru a ne asigura că îl putem utiliza mai târziu, trebuie să salvăm noul nostru tokenizer. Asemănător salvării unui model, acest lucru se realizează cu metoda `save_pretrained()`:
+
+```py
+tokenizer.save_pretrained("code-search-net-tokenizer")
+```
+
+Acest lucru va crea un nou folder numit *code-search-net-tokenizer*, care va conține toate fișierele necesare pentru a reîncărca tokenizerul. Dacă doriți să partajați acest tokenizer cu colegii și prietenii tăi, îl puteți încărca pe Hub prin conectarea la contul tău. Dacă lucrați într-un notebook, există un convenience function pentru a vă ajuta cu acest lucru:
+
+```python
+from huggingface_hub import notebook_login
+
+notebook_login()
+```
+
+Acest lucru va afișa un widget în care puteți introduce credențialele de conectare Hugging Face. Dacă nu lucrați într-un notebook, introduceți simplu următoarea linie în terminal:
+
+```bash
+huggingface-cli login
+```
+
+După ce v-ați conectat, puteți face push tokenizerului prin executarea următoarei comenzi:
+
+```py
+tokenizer.push_to_hub("code-search-net-tokenizer")
+```
+
+Acest lucru va crea un nou repositoriu în namespacel tău cu numele `code-search-net-tokenizer`, care va conține fișierul tokenizerului. După aceea, puteți încărca tokenizerul de oriunde cu metoda `from_pretrained()`:
+
+```py
+# Înlocuiți "huggingface-course" mai jos cu namespaceul tău pentru a utiliza propriul tokenizer
+tokenizer = AutoTokenizer.from_pretrained("huggingface-course/code-search-net-tokenizer")
+```
+
+Acum sunteți gata să antrenați un model de limbaj de la zero și să îl ajustați pentru sarcina voastră! Vom face acest lucru în [Capitolul 7](/course/chapter7), dar mai întâi, în continuarea acestui capitol, vom arunca o privire mai atentă asupra tokenizerilor rapizi și vom explora în detaliu ce se întâmplă atunci când apelați metoda `train_new_from_iterator()`.
\ No newline at end of file
diff --git a/chapters/rum/chapter6/3.mdx b/chapters/rum/chapter6/3.mdx
new file mode 100644
index 000000000..6f79c5ab7
--- /dev/null
+++ b/chapters/rum/chapter6/3.mdx
@@ -0,0 +1,473 @@
+<FrameworkSwitchCourse {fw} />
+
+# Superputerile tokenizerilor rapizi[[fast-tokenizers-special-powers]]
+
+{#if fw === 'pt'}
+
+<CourseFloatingBanner chapter={6}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter6/section3_pt.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter6/section3_pt.ipynb"},
+]} />
+
+{:else}
+
+<CourseFloatingBanner chapter={6}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter6/section3_tf.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter6/section3_tf.ipynb"},
+]} />
+
+{/if}
+
+În această secțiune, vom analiza mai atent capacitățile tokenizerilor din 🤗 Transformers. Până acum, i-am folosit doar pentru tokenizarea inputurilor sau decodificarea ID-urilor înapoi în text, dar tokenizerii - în special cei susținuți de biblioteca 🤗 Tokenizers - pot face mult mai multe. Pentru a ilustra aceste funcții suplimentare, vom explora modul de reproducere a rezultatelor pipeline-urilor `token-classification` (pe care le-am numit `ner`) și `question-answering` pe care le-am întâlnit pentru prima dată în [Capitolul 1](/course/chapter1).
+
+<Youtube id="g8quOxoqhHQ"/>
+
+În discuția următoare, vom face adesea distincția între tokenizatori "lenți" și "rapizi". Tokenizerii lenți sunt cei scriși în Python în interiorul bibliotecii 🤗 Transformers, în timp ce versiunile rapide sunt cele furnizate de 🤗 Tokenizers, care sunt scrise în Rust. Dacă vă amintiți de tabelul din [Capitolul 5](/course/chapter5/3) care a raportat cât timp a durat un tokenizer rapid și unul lent pentru a tokeniza datasetul Drug Review, ar trebui să aveți o idee despre de ce îi numim lenți și rapizi:
+
+|               | Fast tokenizer | Slow tokenizer
+:--------------:|:--------------:|:-------------:
+`batched=True`  | 10,8s          | 4min41s
+`batched=False` | 59,2s          | 5min3s
+
+<Tip warning={true}>
+
+⚠️ Atunci când tokenizați o singură propoziție, nu veți vedea întotdeauna o diferență de viteză între versiunea lentă și rapidă ale aceluiași tokenizer. De fapt, versiunea rapidă poate fi chiar mai lentă! Abia atunci când tokenizați multe texte în paralel, în același timp, veți putea observa clar diferența.
+
+</Tip>
+
+## Batch encoding[[batch-encoding]]
+
+<Youtube id="3umI3tm27Vw"/>
+
+Rezultatul unui tokenizer nu este un simplu dicționar Python; ceea ce obținem este de fapt un obiect special `BatchEncoding`. Este o subclasă a unui dicționar (de aceea am putut indexa acel rezultat fără nici o problemă mai devreme), dar cu metode suplimentare care sunt utilizate în principal de către tokenizerii rapizi.
+
+Pe lângă capacitățile lor de paralelizare, funcționalitatea principală a tokenizerilor rapizi este aceea că aceștia țin întotdeauna evidența intervalului original de texte din care provin tokenii finali - o funcționalitate pe care o numim *offset mapping*. Acest lucru deblochează funcții precum mappingul fiecărui cuvânt la tokens pe care îi generează sau mappingul fiecărui caracter al textului original la tokenul în care se află și invers.
+
+Acum hai să aruncăm o privire la un exemplu:
+
+```py
+from transformers import AutoTokenizer
+
+tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
+example = "My name is Sylvain and I work at Hugging Face in Brooklyn."
+encoding = tokenizer(example)
+print(type(encoding))
+```
+
+Așa cum s-a menționat anterior, în outputul tokenizerului obținem un obiect `BatchEncoding`:
+
+```python out
+<class 'transformers.tokenization_utils_base.BatchEncoding'>
+```
+
+Deoarece clasa `AutoTokenizer` selectează un tokenizer rapid în mod implicit, putem utiliza metodele suplimentare pe care acest obiect `BatchEncoding` le oferă. Avem două metode de verificare dacă tokenizerul nostru este unul lent sau rapid. Putem verifica fie atributul `is_fast` al tokenizer-ului:
+
+```python
+tokenizer.is_fast
+```
+
+```python out
+True
+```
+
+sau același atribut al `encoding`:
+
+```python
+encoding.is_fast
+```
+
+```python out
+True
+```
+
+Hai să vedem ce ne permite un tokenizer rapid să facem. În primul rând, putem accesa tokenul fără a fi nevoie să facem convert ID-urile înapoi în tokens:
+
+```py
+encoding.tokens()
+```
+
+```python out
+['[CLS]', 'My', 'name', 'is', 'S', '##yl', '##va', '##in', 'and', 'I', 'work', 'at', 'Hu', '##gging', 'Face', 'in',
+ 'Brooklyn', '.', '[SEP]']
+```
+
+În acest caz tokenul la indexul 5 este `##yl`, ceea ce este o parte a cuvântului "Sylvain" în propoziția originală. În același timp putem folosi metoda `word_ids()` pentru a obține indexul cuvântului din care provine fiecare token:
+
+```py
+encoding.word_ids()
+```
+
+```python out
+[None, 0, 1, 2, 3, 3, 3, 3, 4, 5, 6, 7, 8, 8, 9, 10, 11, 12, None]
+
+Putem vedea că tokenizerul are tokeni speciali `[CLS]` și `[SEP]` care sunt mapped la `None`, iar apoi fiecare token este mapped la cuvântul din care provine. Acest lucru este deosebit de util pentru a determina dacă un token este la începutul unui cuvânt sau dacă două tokenuri sunt în același cuvânt. Ne-am putea baza pe prefixul `##` pentru aceasta, dar funcționează doar pentru tokenizeri de tip BERT; această metodă funcționează pentru orice tip de tokenizator, atâta timp cât este unul rapid. În capitolul următor, vom vedea cum putem utiliza această capabilitate pentru a aplica labeluri pe care le avem pentru fiecare cuvânt în mod corespunzător tokenurilor în sarcini precum named entity recognition (NER) și part-of-speech (POS). De asemenea, îl putem utiliza pentru a face mask tuturor tokenurilor care provin din același cuvânt în masked language modeling(o tehnică numită _whole word masking_).
+
+<Tip>
+
+Noțiunea de ceea ce este un cuvânt este complicată. De exemplu, "I'll" (o prescurtare a "I will") contează ca unul sau două cuvinte? Acest lucru depinde de tokenizer și de operațiunea de pre-tokenizare pe care o aplică. Unii tokenizeri se divid doar pe spații, așa că vor considera acest lucru ca un singur cuvânt. Alții folosesc punctuația pe lângă spații, deci vor considera două cuvinte.
+
+✏️ **Încercați!** Creați un tokenizer din checkpointurile `bert-base-cased` și `roberta-base` și tokenizați "81s" cu ele. Ce observați? Care sunt ID-urile cuvintelor?
+
+</Tip>
+
+În mod similar, există o metodă `sentence_ids()` pe care o putem utiliza pentru a face map unui token la propoziția din care provine (deși, în acest caz, `token_type_ids` returnate de tokenizer ne pot oferi aceeași informație).
+
+În cele din urmă, putem face map oricărui cuvânt sau token la caracterele din textul original și invers, prin intermediul metodelor `word_to_chars()` sau `token_to_chars()` și `char_to_word()` sau `char_to_token()`. De exemplu, metoda `word_ids()` ne-a spus că `##yl` face parte din cuvântul cu indicele 3, dar ce cuvânt este în propoziție? Putem afla astfel:
+
+```py
+start, end = encoding.word_to_chars(3)
+example[start:end]
+```
+
+```python out
+Sylvain
+```
+
+Așa cum am menționat anterior, toate acestea sunt posibile datorită faptului că tokenizerul rapid ține evidența spanului de text de la care provine fiecare token într-o listă de *offseturi*. Pentru a ilustra modul în care se utilizează acestea, în continuare vă vom arăta cum să replicați rezultatele pipelineului `token-classification` manual.
+
+<Tip>
+
+✏️ **Încercați!** Creați propriul exemplu de text și încercați să înțelegeți care tokenuri sunt asociate cu ID-ul cuvântului și, de asemenea, cum să extrageți spanurile pentru singur cuvânt. Pentru puncte bonus, încercați să utilizați două propoziții ca inputuri și să vedeți dacă ID-urile propozițiilor au sens pentru voi.
+
+</Tip>
+
+## În interiorul pipelineului `token-classification`[[inside-the-token-classification-pipeline]]
+
+În [Capitolul 1](/course/chapter1) am avut primul nostru contact aplicând NER - unde sarcina constă în identificarea părților textului care corespund entităților precum persoane, locații sau organizații - cu funcția `pipeline()` din 🤗 Transformers. Apoi, în [Capitolul 2](/course/chapter2), am văzut cum un pipeline grupează cele trei etape necesare pentru a obține predicțiile de la un text "raw": tokenizare, trecerea inputurilor prin model și post-procesare. Primele două etape din pipelineul `token-classification` sunt la fel ca în orice alt pipeline, dar post-procesarea este puțin mai complexă - hai să vedem cum!
+
+{#if fw === 'pt'}
+
+<Youtube id="0E7ltQB7fM8"/>
+
+{:else}
+
+<Youtube id="PrX4CjrVnNc"/>
+
+{/if}
+
+### Obținerea rezultatelor de bază cu pipelineul[[getting-the-base-results-with-the-pipeline]]
+
+În primul rând, trebuie să luăm un token classification pipeline pentru a obține câteva rezultate ca să le putem compara manual. Modelul utilizat în mod implicit este [`dbmdz/bert-large-cased-finetuned-conll03-english`](https://huggingface.co/dbmdz/bert-large-cased-finetuned-conll03-english); acesta aplică NER pe propoziții:
+
+```py
+from transformers import pipeline
+
+token_classifier = pipeline("token-classification")
+token_classifier("My name is Sylvain and I work at Hugging Face in Brooklyn.")
+```
+
+```python out
+[{'entity': 'I-PER', 'score': 0.9993828, 'index': 4, 'word': 'S', 'start': 11, 'end': 12},
+ {'entity': 'I-PER', 'score': 0.99815476, 'index': 5, 'word': '##yl', 'start': 12, 'end': 14},
+ {'entity': 'I-PER', 'score': 0.99590725, 'index': 6, 'word': '##va', 'start': 14, 'end': 16},
+ {'entity': 'I-PER', 'score': 0.9992327, 'index': 7, 'word': '##in', 'start': 16, 'end': 18},
+ {'entity': 'I-ORG', 'score': 0.97389334, 'index': 12, 'word': 'Hu', 'start': 33, 'end': 35},
+ {'entity': 'I-ORG', 'score': 0.976115, 'index': 13, 'word': '##gging', 'start': 35, 'end': 40},
+ {'entity': 'I-ORG', 'score': 0.98879766, 'index': 14, 'word': 'Face', 'start': 41, 'end': 45},
+ {'entity': 'I-LOC', 'score': 0.99321055, 'index': 16, 'word': 'Brooklyn', 'start': 49, 'end': 57}]
+```
+
+Modelul a identificat fiecare token generdat de "Sylvain" ca o persoană, fiecare token generat de "Hugging Face" ca o organizație, și fiecare token "Brooklin" ca o locație". În același timp putem întreba pipelineul să grupeze împreună tokenurile care corespund cu aceeași entitate.
+
+```py
+from transformers import pipeline
+
+token_classifier = pipeline("token-classification", aggregation_strategy="simple")
+token_classifier("My name is Sylvain and I work at Hugging Face in Brooklyn.")
+```
+
+```python out
+[{'entity_group': 'PER', 'score': 0.9981694, 'word': 'Sylvain', 'start': 11, 'end': 18},
+ {'entity_group': 'ORG', 'score': 0.97960204, 'word': 'Hugging Face', 'start': 33, 'end': 45},
+ {'entity_group': 'LOC', 'score': 0.99321055, 'word': 'Brooklyn', 'start': 49, 'end': 57}]
+```
+
+`Aggregation_strategy` aleasă va modifica scorurile calculate pentru fiecare entitate grupată. Cu `"simple"`, scorul este doar media scorurilor pentru fiecare token din entitatea dată: de exemplu, scorul pentru "Sylvain" este media scorurilor pe care le-am văzut în exemplele anterioare pentru token-urile `S`, `##yl`, `##va` și `##in`. Alte strategii disponibile sunt:
+
+- `"first"`, unde scorul fiecărei entități este scorul primului token al acelei entități (astfel, pentru "Sylvain" ar fi 0.993828, scorul token-ului `S`)
+- `"max"`, unde scorul fiecărei entități este scorul maxim al tokenilor din acea entitate (astfel, pentru "Hugging Face" ar fi 0.98879766, scorul "Face")
+- `"average"`, unde scorul fiecărei entități este media scorurilor cuvintelor care compun acea entitate (astfel, pentru "Sylvain" nu ar exista nicio diferență față de strategia `"simple"`, dar "Hugging Face" ar avea un scor de 0.9819, media scorurilor pentru "Hugging", 0.975 și "Face", 0.98879)
+
+Acum să vedem cum putem obține aceste rezultate fără a folosi funcția `pipeline()`!
+
+### De la inputuri la predicții[[from-inputs-to-predictions]]
+
+{#if fw === 'pt'}
+
+În primul rând trebuie să tokenizăm inputurile și sp le trecem prin model. Acest lucru este făcut excat ca în [Capitolul 2](/course/chapter2); noi am inițializat tokenizerul și modelul folosind clasa `AutoXxx` și apoi am folosit-o pe exemplul nostru:
+
+```py
+from transformers import AutoTokenizer, AutoModelForTokenClassification
+
+model_checkpoint = "dbmdz/bert-large-cased-finetuned-conll03-english"
+tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
+model = AutoModelForTokenClassification.from_pretrained(model_checkpoint)
+
+example = "My name is Sylvain and I work at Hugging Face in Brooklyn."
+inputs = tokenizer(example, return_tensors="pt")
+outputs = model(**inputs)
+```
+
+Deoarece aici folosim `AutoModelForTokenClassification` , noi primim un set de logits pentru fiecare token în input sequence:
+
+```py
+print(inputs["input_ids"].shape)
+print(outputs.logits.shape)
+```
+
+```python out
+torch.Size([1, 19])
+torch.Size([1, 19, 9])
+```
+
+{:else}
+
+În primul rând trebuie să tokenizăm inputurile și să le trecem prin model. Acest lucru este făcut excat ca în [Capitolul 2](/course/chapter2); noi am inițializat tokenizerul și modelul folosind clasa `TFAutoXxx` și apoi am folosit-o pe exemplul nostru:
+
+```py
+from transformers import AutoTokenizer, TFAutoModelForTokenClassification
+
+model_checkpoint = "dbmdz/bert-large-cased-finetuned-conll03-english"
+tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
+model = TFAutoModelForTokenClassification.from_pretrained(model_checkpoint)
+
+example = "My name is Sylvain and I work at Hugging Face in Brooklyn."
+inputs = tokenizer(example, return_tensors="tf")
+outputs = model(**inputs)
+```
+
+Deoarece aici folosim `TFAutoModelForTokenClassification`, noi primim un set de logits pentru fiecare token în input sequence:
+
+```py
+print(inputs["input_ids"].shape)
+print(outputs.logits.shape)
+```
+
+```python out
+(1, 19)
+(1, 19, 9)
+```
+
+{/if}
+
+Noi avem un batch cu 1 secvență din 19 tokenuri și modelul are 9 labeluri diferite, deci outputul modelului are un shape de 1 x 19 x 9. Ca și pentru text classification pipeline, noi folosim o funcție softmax pentru a face convert logiturilor în probabilități și luăm argmax pentru a obține predicții(atrage atenția asupra fatpului că putem lua argmax pe logituri deoarece softmax nu schimbă ordinea):
+
+{#if fw === 'pt'}
+
+```py
+import torch
+
+probabilities = torch.nn.functional.softmax(outputs.logits, dim=-1)[0].tolist()
+predictions = outputs.logits.argmax(dim=-1)[0].tolist()
+print(predictions)
+```
+
+{:else}
+
+```py
+import tensorflow as tf
+
+probabilities = tf.math.softmax(outputs.logits, axis=-1)[0]
+probabilities = probabilities.numpy().tolist()
+predictions = tf.math.argmax(outputs.logits, axis=-1)[0]
+predictions = predictions.numpy().tolist()
+print(predictions)
+```
+
+{/if}
+
+```python out
+[0, 0, 0, 0, 4, 4, 4, 4, 0, 0, 0, 0, 6, 6, 6, 0, 8, 0, 0]
+```
+
+Atributul `model.config.id2label` con;ine mappingul indexilor la labeluri pe care le putem folosi pentru a înțelege predicțiile:
+
+```py
+model.config.id2label
+```
+
+```python out
+{0: 'O',
+ 1: 'B-MISC',
+ 2: 'I-MISC',
+ 3: 'B-PER',
+ 4: 'I-PER',
+ 5: 'B-ORG',
+ 6: 'I-ORG',
+ 7: 'B-LOC',
+ 8: 'I-LOC'}
+```
+
+Cum am văzut mai devreme, există 9 labeluri: `O` este labelul pentru tokenurile care nu se află în nicio entitate numită(aceasta reprezintă "exteriorul"), și avem apoi două labeluri pentru fiecare tip de entitate (divers, persoană, organizație și locație). Eticheta `B-XXX` indică faptul că tokenul se află la începutul entității `XXX` și eticheta `I-XXX` indică faptul că tokenul se află în interiorul entității `XXX`. De exemplu, în exemplul curent ne-am aștepta ca modelul nostru să clasifice tokenul `S` ca `B-PER` (începutul unei entități de-tip persoană) și tokenurile `##yl`, `##va` și `##in` ca `I-PER` (în interiorul unei entități de tip persoană).
+
+S-ar putea să credeți că modelul a greșit în acest caz, deoarece a atribuit eticheta `I-PER` tuturor acestor patru tokeni, dar acesta nu este în întregime adevărat. Există, de fapt, două formate pentru labelurile `B-` și `I-`: *IOB1* și *IOB2*. Formatul IOB2 (în roz mai jos), este cel pe care l-am introdus, în timp ce formatul IOB1 (în albastru), utilizează labelurile care încep cu `B-` doar pentru a separa două entități adiacente de același tip. Modelul pe care îl utilizăm a fost fine-tuned pe un dataset care utilizează acel format, ceea ce explică de ce atribuie labelul `I-PER` tokenului `S`.
+
+<div class="flex justify-center">
+<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter6/IOB_versions.svg" alt="IOB1 vs IOB2 format"/>
+<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter6/IOB_versions-dark.svg" alt="IOB1 vs IOB2 format"/>
+</div>
+
+Cu maparea aceasta, suntem gat a să reproducem(aproape în total) rezultat primului pipeline -- noi putem lua scorul și labelul fiecărui token care nu a fost clasificat ca `O`:
+
+```py
+results = []
+tokens = inputs.tokens()
+
+for idx, pred in enumerate(predictions):
+    label = model.config.id2label[pred]
+    if label != "O":
+        results.append(
+            {"entity": label, "score": probabilities[idx][pred], "word": tokens[idx]}
+        )
+
+print(results)
+```
+
+```python out
+[{'entity': 'I-PER', 'score': 0.9993828, 'index': 4, 'word': 'S'},
+ {'entity': 'I-PER', 'score': 0.99815476, 'index': 5, 'word': '##yl'},
+ {'entity': 'I-PER', 'score': 0.99590725, 'index': 6, 'word': '##va'},
+ {'entity': 'I-PER', 'score': 0.9992327, 'index': 7, 'word': '##in'},
+ {'entity': 'I-ORG', 'score': 0.97389334, 'index': 12, 'word': 'Hu'},
+ {'entity': 'I-ORG', 'score': 0.976115, 'index': 13, 'word': '##gging'},
+ {'entity': 'I-ORG', 'score': 0.98879766, 'index': 14, 'word': 'Face'},
+ {'entity': 'I-LOC', 'score': 0.99321055, 'index': 16, 'word': 'Brooklyn'}]
+```
+
+Acest lucru este foarte similar cu ce am avut mai devreme, cu o excepție: pipelineul de asemenea ne-a oferit informație despre `start` și `end` al fiecărei entități în propoziția originală. Acum e momentul când offset mappingul nostru ne va ajuta. Pentru a obține offseturile, noi trebuie să setăm `return_offsets_mapping=True` când aplicăm tokenizerul pe inputurile noastre:
+
+```py
+inputs_with_offsets = tokenizer(example, return_offsets_mapping=True)
+inputs_with_offsets["offset_mapping"]
+```
+
+```python out
+[(0, 0), (0, 2), (3, 7), (8, 10), (11, 12), (12, 14), (14, 16), (16, 18), (19, 22), (23, 24), (25, 29), (30, 32),
+ (33, 35), (35, 40), (41, 45), (46, 48), (49, 57), (57, 58), (0, 0)]
+```
+
+Fiecare tuple este spanul de text care corespunde fiecărui token, unde `(0, 0)` este rezervat pentru tokenii speciali. Noi am văzut înainte că tokenul la indexul 5 este `##yl`, care are aici `(12, 14)` ca offsets. Dacă luăm sliceul corespunzător în exemplul nostru:
+
+```py
+example[12:14]
+```
+
+noi obținem spanul propriu de text fără `##`:
+
+```python out
+yl
+```
+
+Folosind aceasta, putem acum completa rezultatele anterioare:
+
+
+```py
+results = []
+inputs_with_offsets = tokenizer(example, return_offsets_mapping=True)
+tokens = inputs_with_offsets.tokens()
+offsets = inputs_with_offsets["offset_mapping"]
+
+for idx, pred in enumerate(predictions):
+    label = model.config.id2label[pred]
+    if label != "O":
+        start, end = offsets[idx]
+        results.append(
+            {
+                "entity": label,
+                "score": probabilities[idx][pred],
+                "word": tokens[idx],
+                "start": start,
+                "end": end,
+            }
+        )
+
+print(results)
+```
+
+```python out
+[{'entity': 'I-PER', 'score': 0.9993828, 'index': 4, 'word': 'S', 'start': 11, 'end': 12},
+ {'entity': 'I-PER', 'score': 0.99815476, 'index': 5, 'word': '##yl', 'start': 12, 'end': 14},
+ {'entity': 'I-PER', 'score': 0.99590725, 'index': 6, 'word': '##va', 'start': 14, 'end': 16},
+ {'entity': 'I-PER', 'score': 0.9992327, 'index': 7, 'word': '##in', 'start': 16, 'end': 18},
+ {'entity': 'I-ORG', 'score': 0.97389334, 'index': 12, 'word': 'Hu', 'start': 33, 'end': 35},
+ {'entity': 'I-ORG', 'score': 0.976115, 'index': 13, 'word': '##gging', 'start': 35, 'end': 40},
+ {'entity': 'I-ORG', 'score': 0.98879766, 'index': 14, 'word': 'Face', 'start': 41, 'end': 45},
+ {'entity': 'I-LOC', 'score': 0.99321055, 'index': 16, 'word': 'Brooklyn', 'start': 49, 'end': 57}]
+```
+
+Acest răspuns e același răspuns pe care l-am primit de la primul pipeline:
+
+### Gruparea entităților[[grouping-entities]]
+
+Utilizarea offseturilor pentru a determina cheile de start și de sfârșit pentru fiecare entitate este util, dar această informație nu este strict necesară. Când dorim să grupăm entitățile împreună, totuși, offseturile ne vor salva o mulțime de messy code. De exemplu, dacă am dori să grupăm împreună tokenii `Hu`, `##gging` și `Face`, am putea crea reguli speciale care să spună că primele două ar trebui să fie atașate și să înlăturăm `##`, iar `Face` ar trebui adăugat cu un spațiu, deoarece nu începe cu `##` -- dar acest lucru ar funcționa doar pentru acest tip particular de tokenizer. Ar trebui să scriem un alt set de reguli pentru un tokenizer SentencePiece sau unul Byte-Pair-Encoding (discutat mai târziu în acest capitol).
+
+Cu offseturile, tot acel cod custom dispare: pur și simplu putem lua spanul din textul original care începe cu primul token și se termină cu ultimul token. Deci, în cazul tokenurilor `Hu`, `##gging` și `Face`, ar trebui să începem la caracterul 33 (începutul lui `Hu`) și să ne oprim înainte de caracterul 45 (sfârșitul lui `Face`):
+
+```py
+example[33:45]
+```
+
+```python out
+Hugging Face
+```
+
+Pentru a scrie codul care post-procesează predicțiile în timp ce grupăm entitățile, vom grupa entitățile care sunt consecutive și labeled cu `I-XXX`, cu excepția primeia, care poate fi labeled ca `B-XXX` sau `I-XXX` (decidem să oprim gruparea unei entități atunci când întâlnim un `O`, un nou tip de entitate, sau un `B-XXX` care ne spune că o entitate de același tip începe):
+
+```py
+import numpy as np
+
+results = []
+inputs_with_offsets = tokenizer(example, return_offsets_mapping=True)
+tokens = inputs_with_offsets.tokens()
+offsets = inputs_with_offsets["offset_mapping"]
+
+idx = 0
+while idx < len(predictions):
+    pred = predictions[idx]
+    label = model.config.id2label[pred]
+    if label != "O":
+        # Remove the B- or I-
+        label = label[2:]
+        start, _ = offsets[idx]
+
+        # Grab all the tokens labeled with I-label
+        all_scores = []
+        while (
+            idx < len(predictions)
+            and model.config.id2label[predictions[idx]] == f"I-{label}"
+        ):
+            all_scores.append(probabilities[idx][pred])
+            _, end = offsets[idx]
+            idx += 1
+
+        # The score is the mean of all the scores of the tokens in that grouped entity
+        score = np.mean(all_scores).item()
+        word = example[start:end]
+        results.append(
+            {
+                "entity_group": label,
+                "score": score,
+                "word": word,
+                "start": start,
+                "end": end,
+            }
+        )
+    idx += 1
+
+print(results)
+```
+
+Și obținem aceleași răspuns ca de la pipelineul secundar!
+
+```python out
+[{'entity_group': 'PER', 'score': 0.9981694, 'word': 'Sylvain', 'start': 11, 'end': 18},
+ {'entity_group': 'ORG', 'score': 0.97960204, 'word': 'Hugging Face', 'start': 33, 'end': 45},
+ {'entity_group': 'LOC', 'score': 0.99321055, 'word': 'Brooklyn', 'start': 49, 'end': 57}]
+```
+
+Alt exemplu de sarcină unde offseturile sunt extrem de useful pentru răspunderea la întrebări. Scufundându-ne în pipelineuri, un lucru pe care îl vom face în următoarea secțiune, ne vom premite să ne uităm peste o caracteristică a tokenizerului în librăria 🤗 Transformers: vom avea de-a face cu overflowing tokens când truncăm un input de o anumită lungime.
+
diff --git a/chapters/rum/chapter6/3b.mdx b/chapters/rum/chapter6/3b.mdx
new file mode 100644
index 000000000..0a7997708
--- /dev/null
+++ b/chapters/rum/chapter6/3b.mdx
@@ -0,0 +1,643 @@
+<FrameworkSwitchCourse {fw} />
+
+# Tokenizerii rapizi în pipeline-ul de QA[[fast-tokenizers-in-the-qa-pipeline]]
+
+{#if fw === 'pt'}
+
+<CourseFloatingBanner chapter={6}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter6/section3b_pt.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter6/section3b_pt.ipynb"},
+]} />
+
+{:else}
+
+<CourseFloatingBanner chapter={6}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter6/section3b_tf.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter6/section3b_tf.ipynb"},
+]} />
+
+{/if}
+
+Acum ne vom aprofunda în pipelineul `question-answering` și să vedem cum putem valorifica offesturile pentru a primi răspunzuri la întrebări la îndemână din context, asemănător cum am făcut cu entitățile grupate în secțiunea precedentă. Pe urmă vom vedea cum vom face față contextelor foarte lungi care ajung truncate. Puteți trece peste această secțiune dacă nu sunteți interesat în întrebarea care răspunde la sarcina aceasta.
+
+{#if fw === 'pt'}
+
+<Youtube id="_wxyB3j3mk4"/>
+
+{:else}
+
+<Youtube id="b3u8RzBCX9Y"/>
+
+{/if}
+
+## Folosind `question-answering` pipeline[[using-the-question-answering-pipeline]]
+
+Cum am văzut în [Capitolul 1](/course/chapter1), noi putem folosi pipelineul `question-answering` ca acesta pentru a răspunde la o întrebare:
+
+```py
+from transformers import pipeline
+
+question_answerer = pipeline("question-answering")
+context = """
+🤗 Transformers is backed by the three most popular deep learning libraries — Jax, PyTorch, and TensorFlow — with a seamless integration
+between them. It's straightforward to train your models with one before loading them for inference with the other.
+"""
+question = "Which deep learning libraries back 🤗 Transformers?"
+question_answerer(question=question, context=context)
+```
+
+```python out
+{'score': 0.97773,
+ 'start': 78,
+ 'end': 105,
+ 'answer': 'Jax, PyTorch and TensorFlow'}
+```
+
+Spre deosebire de alte pipelineuri, care nu put trunca și face split la text care este mai lung decât lungimea maxim acceptată de model(și, prin urmare, pot pierde informații la sfârșitul unui document), accest pipeline poate face față contextelor foarte lungi și va returna răspunsul la întrebare chiar dacă aceasta se află la sfârșit:
+
+```py
+long_context = """
+🤗 Transformers: State of the Art NLP
+
+🤗 Transformers provides thousands of pretrained models to perform tasks on texts such as classification, information extraction,
+question answering, summarization, translation, text generation and more in over 100 languages.
+Its aim is to make cutting-edge NLP easier to use for everyone.
+
+🤗 Transformers provides APIs to quickly download and use those pretrained models on a given text, fine-tune them on your own datasets and
+then share them with the community on our model hub. At the same time, each python module defining an architecture is fully standalone and
+can be modified to enable quick research experiments.
+
+Why should I use transformers?
+
+1. Easy-to-use state-of-the-art models:
+  - High performance on NLU and NLG tasks.
+  - Low barrier to entry for educators and practitioners.
+  - Few user-facing abstractions with just three classes to learn.
+  - A unified API for using all our pretrained models.
+  - Lower compute costs, smaller carbon footprint:
+
+2. Researchers can share trained models instead of always retraining.
+  - Practitioners can reduce compute time and production costs.
+  - Dozens of architectures with over 10,000 pretrained models, some in more than 100 languages.
+
+3. Choose the right framework for every part of a model's lifetime:
+  - Train state-of-the-art models in 3 lines of code.
+  - Move a single model between TF2.0/PyTorch frameworks at will.
+  - Seamlessly pick the right framework for training, evaluation and production.
+
+4. Easily customize a model or an example to your needs:
+  - We provide examples for each architecture to reproduce the results published by its original authors.
+  - Model internals are exposed as consistently as possible.
+  - Model files can be used independently of the library for quick experiments.
+
+🤗 Transformers is backed by the three most popular deep learning libraries — Jax, PyTorch and TensorFlow — with a seamless integration
+between them. It's straightforward to train your models with one before loading them for inference with the other.
+"""
+question_answerer(question=question, context=long_context)
+```
+
+```python out
+{'score': 0.97149,
+ 'start': 1892,
+ 'end': 1919,
+ 'answer': 'Jax, PyTorch and TensorFlow'}
+```
+
+Hai să vedem cum el face toate astea!
+
+## Folosind un model pentru răspunderea la întrebări[[using-a-model-for-question-answering]]
+
+Ca în cazul oricărui altui pipeline, începem prin tokenizarea datelor de intrare și apoi le trimitem prin model. Checkpointul utilizat în mod implicit pentru pipelineul `question-answering` este [`distilbert-base-cased-distilled-squad`](https://huggingface.co/distilbert-base-cased-distilled-squad) ("squad" din nume provine de la datasetul pe care modelul a fost ajustat; vom vorbi mai multe despre datasetul SQuAD în [Capitolul 7](/course/chapter7/7)):
+
+{#if fw === 'pt'}
+
+```py
+from transformers import AutoTokenizer, AutoModelForQuestionAnswering
+
+model_checkpoint = "distilbert-base-cased-distilled-squad"
+tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
+model = AutoModelForQuestionAnswering.from_pretrained(model_checkpoint)
+
+inputs = tokenizer(question, context, return_tensors="pt")
+outputs = model(**inputs)
+```
+
+{:else}
+
+```py
+from transformers import AutoTokenizer, TFAutoModelForQuestionAnswering
+
+model_checkpoint = "distilbert-base-cased-distilled-squad"
+tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
+model = TFAutoModelForQuestionAnswering.from_pretrained(model_checkpoint)
+
+inputs = tokenizer(question, context, return_tensors="tf")
+outputs = model(**inputs)
+```
+
+{/if}
+
+Observați că noi tokenizăm întrebrea și contextul ca o perecehe, cu întrebarea prima.
+
+
+<div class="flex justify-center">
+<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter6/question_tokens.svg" alt="An example of tokenization of question and context"/>
+<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter6/question_tokens-dark.svg" alt="An example of tokenization of question and context"/>
+</div>
+
+Modelele create pentru răspunderea la întrebări funcționează puțin diferit de modelele pe care le-am văzut până acum. Folosind imaginea de mai sus ca exemplu, modelul a fost antrenat pentru a prezice indicele tokenului cu care începe răspunsului (aici 21) și indicele simbolului la care se termină răspunsul (aici 24). Acesta este motivul pentru care modelele respective nu returnează un singur tensor de logits, ci două: unul pentru logits-ul corespunzători tokenului cu care începe răspunsului și unul pentru logits-ul corespunzător tokenului de sfârșit al răspunsului. Deoarece în acest caz avem un singur input care conține 66 de token-uri, obținem:
+
+```py
+start_logits = outputs.start_logits
+end_logits = outputs.end_logits
+print(start_logits.shape, end_logits.shape)
+```
+
+{#if fw === 'pt'}
+
+```python out
+torch.Size([1, 66]) torch.Size([1, 66])
+```
+
+{:else}
+
+```python out
+(1, 66) (1, 66)
+```
+
+{/if}
+
+Pentru a converti acești logits în probabilități, vom aplica o funcție softmax - dar înainte de aceasta, trebuie să ne asigurăm că mascăm indicii care nu fac parte din context. Inputul nostru este `[CLS] întrebare [SEP] context [SEP]`, deci trebuie să mascăm token-urile întrebării, precum și tokenul `[SEP]`. Cu toate acestea, vom păstra simbolul `[CLS]`, deoarece unele modele îl folosesc pentru a indica faptul că răspunsul nu se află în context.
+
+Deoarece vom aplica ulterior un softmax, trebuie doar să înlocuim logiturile pe care dorim să le mascăm cu un număr negativ mare. Aici, folosim `-10000`:
+
+{#if fw === 'pt'}
+
+```py
+import torch
+
+sequence_ids = inputs.sequence_ids()
+# Mask everything apart from the tokens of the context
+mask = [i != 1 for i in sequence_ids]
+# Unmask the [CLS] token
+mask[0] = False
+mask = torch.tensor(mask)[None]
+
+start_logits[mask] = -10000
+end_logits[mask] = -10000
+```
+
+{:else}
+
+```py
+import tensorflow as tf
+
+sequence_ids = inputs.sequence_ids()
+# Mask everything apart from the tokens of the context
+mask = [i != 1 for i in sequence_ids]
+# Unmask the [CLS] token
+mask[0] = False
+mask = tf.constant(mask)[None]
+
+start_logits = tf.where(mask, -10000, start_logits)
+end_logits = tf.where(mask, -10000, end_logits)
+```
+
+{/if}
+
+Acum că am mascat în mod corespunzător logiturile corespunzătoare pozițiilor pe care nu dorim să le prezicem, putem aplica softmax:
+
+{#if fw === 'pt'}
+
+```py
+start_probabilities = torch.nn.functional.softmax(start_logits, dim=-1)[0]
+end_probabilities = torch.nn.functional.softmax(end_logits, dim=-1)[0]
+```
+
+{:else}
+
+```py
+start_probabilities = tf.math.softmax(start_logits, axis=-1)[0].numpy()
+end_probabilities = tf.math.softmax(end_logits, axis=-1)[0].numpy()
+```
+
+{/if}
+
+La acest stadiu, am putea lua argmax al probabilităților de început și de sfârșit - dar am putea ajunge la un indice de început care este mai mare decât indicele de sfârșit, deci trebuie să luăm câteva precauții suplimentare. Vom calcula probabilitățile fiecărui  `start_index` și `end_index` posibil în cazul în care `start_index <= end_index`, apoi vom lua un tuple `(start_index, end_index)` cu cea mai mare probabilitate.
+
+Presupunând că evenimentele "The answer starts at `start_index`" și "The answer ends at `end_index`" sunt independente, probabilitatea ca răspunsul să înceapă la `start_index` și să se termine la `end_index` este:
+
+$$\mathrm{start\_probabilities}[\mathrm{start\_index}] \times \mathrm{end\_probabilities}[\mathrm{end\_index}]$$ 
+
+Deci, pentru a calcula toate scorurile, trebuie doar să calculăm toate produsele \\(\mathrm{start\_probabilities}[\mathrm{start\_index}] \times \mathrm{end\_probabilities}[\mathrm{end\_index}]\\) unde `start_index <= end_index`.
+
+Mai întâi hai să calculăm toate produsele posibile:
+
+```py
+scores = start_probabilities[:, None] * end_probabilities[None, :]
+```
+
+{#if fw === 'pt'}
+
+Apoi vom masca valorile în care `start_index > end_index` prin stabilirea lor la `0` (celelalte probabilități sunt toate numere pozitive). Funcția `torch.triu()` returnează partea triunghiulară superioară a tensorului 2D trecut ca argument, deci va face această mascare pentru noi:
+
+```py
+scores = torch.triu(score)
+```
+
+{:else}
+
+Apoi vom masca valorile în care `start_index > end_index` prin stabilirea lor la `0` (celelalte probabilități sunt toate numere pozitive). Funcția `np.triu()` returnează partea triunghiulară superioară a tensorului 2D trecut ca argument, deci va face această mascare pentru noi:
+
+```py
+import numpy as np
+
+scores = np.triu(scores)
+```
+
+{/if}
+
+Acum trebuie doar să obținem indicele maximului. Deoarece PyTorch va returna indicele în tensorul aplatizat, trebuie să folosim operațiile floor division `//` și modulusul `%` pentru a obține `start_index` și `end_index`:
+
+```py
+max_index = scores.argmax().item()
+start_index = max_index // scores.shape[1]
+end_index = max_index % scores.shape[1]
+print(scores[start_index, end_index])
+```
+
+Nu am terminat încă, dar cel puțin avem deja scorul corect pentru răspuns (puteți verifica acest lucru comparându-l cu primul rezultat din secțiunea anterioară):
+
+```python out
+0.97773
+```
+
+<Tip>
+
+✏️ **Încercați!** Calculați indicii de început și de sfârșit pentru cele mai probabile cinci răspunsuri.
+
+</Tip>
+
+Avem `start_index` și `end_index` ale răspunsului în termeni de tokens, deci acum trebuie doar să convertim în character indices în context. Acesta este momentul în care offseturile vor fi foarte utile. Putem să le luăm și să le folosim așa cum am făcut în sarcina de clasificare a tokenurilor:
+
+```py
+inputs_with_offsets = tokenizer(question, context, return_offsets_mapping=True)
+offsets = inputs_with_offsets["offset_mapping"]
+
+start_char, _ = offsets[start_index]
+_, end_char = offsets[end_index]
+answer = context[start_char:end_char]
+```
+
+Acum trebuie doar să formatăm totul pentru a obține rezultatul nostru:
+
+```py
+result = {
+    "answer": answer,
+    "start": start_char,
+    "end": end_char,
+    "score": scores[start_index, end_index],
+}
+print(result)
+```
+
+```python out
+{'answer': 'Jax, PyTorch and TensorFlow',
+ 'start': 78,
+ 'end': 105,
+ 'score': 0.97773}
+```
+
+Grozav! Este la fel ca în primul nostru exemplu!
+
+<Tip>
+
+✏️ **Încercați!** Utilizați cele mai bune scoruri pe care le-ați calculat anterior pentru a afișa cele mai probabile cinci răspunsuri. Pentru a vă verifica rezultatele, întoarceți-vă la primul pipeline și introduceți `top_k=5` atunci când îl apelați.
+
+</Tip>
+
+## Gestionarea contextelor lungi[[handling-long-contexts]]
+
+Dacă încercăm să tokenizăm întrebarea și contextul lung pe care le-am folosit ca un exemplu anterior, vom obține un număr de tokenuri mai mare decât lungimea maximă utilizată în pipelineul `question-answering` (care este 384):
+
+```py
+inputs = tokenizer(question, long_context)
+print(len(inputs["input_ids"]))
+```
+
+```python out
+461
+```
+
+Prin urmare, va trebui să trunchiem inputurile la lungimea maximă. Există mai multe modalități prin care putem face acest lucru, dar nu dorim să trunchiem întrebarea, ci doar contextul. Deoarece contextul este a doua propoziție, vom utiliza strategia de trunchiere `"only_second"`. Problema care apare atunci este că răspunsul la întrebare poate să nu fie în contextul trunchiat. Aici, de exemplu, am ales o întrebare la care răspunsul se află spre sfârșitul contextului, iar atunci când îl trunchiem, răspunsul nu este prezent:
+
+```py
+inputs = tokenizer(question, long_context, max_length=384, truncation="only_second")
+print(tokenizer.decode(inputs["input_ids"]))
+```
+
+```python out
+"""
+[CLS] Which deep learning libraries back [UNK] Transformers? [SEP] [UNK] Transformers : State of the Art NLP
+
+[UNK] Transformers provides thousands of pretrained models to perform tasks on texts such as classification, information extraction,
+question answering, summarization, translation, text generation and more in over 100 languages.
+Its aim is to make cutting-edge NLP easier to use for everyone.
+
+[UNK] Transformers provides APIs to quickly download and use those pretrained models on a given text, fine-tune them on your own datasets and
+then share them with the community on our model hub. At the same time, each python module defining an architecture is fully standalone and
+can be modified to enable quick research experiments.
+
+Why should I use transformers?
+
+1. Easy-to-use state-of-the-art models:
+  - High performance on NLU and NLG tasks.
+  - Low barrier to entry for educators and practitioners.
+  - Few user-facing abstractions with just three classes to learn.
+  - A unified API for using all our pretrained models.
+  - Lower compute costs, smaller carbon footprint:
+
+2. Researchers can share trained models instead of always retraining.
+  - Practitioners can reduce compute time and production costs.
+  - Dozens of architectures with over 10,000 pretrained models, some in more than 100 languages.
+
+3. Choose the right framework for every part of a model's lifetime:
+  - Train state-of-the-art models in 3 lines of code.
+  - Move a single model between TF2.0/PyTorch frameworks at will.
+  - Seamlessly pick the right framework for training, evaluation and production.
+
+4. Easily customize a model or an example to your needs:
+  - We provide examples for each architecture to reproduce the results published by its original authors.
+  - Model internal [SEP]
+"""
+```
+
+Aceasta înseamnă că modelul va avea dificultăți în a alege răspunsul corect. Pentru a rezolva acest lucru, pipelineul `question-answering` ne permite să împărțim contextul în bucăți mai mici, specificând lungimea maximă. Pentru a ne asigura că nu împărțim contextul exact în locul nepotrivit pentru a face posibilă găsirea răspunsului, aceasta include și o anumită suprapunere între bucăți.
+
+Putem cere tokenizerului (rapid sau lent) să facă acest lucru pentru noi adăugând `return_overflowing_tokens=True`, și putem specifica suprapunerea dorită cu argumentul `stride`. Iată un exemplu, folosind o propoziție mai mică:
+
+```py
+sentence = "This sentence is not too long but we are going to split it anyway."
+inputs = tokenizer(
+    sentence, truncation=True, return_overflowing_tokens=True, max_length=6, stride=2
+)
+
+for ids in inputs["input_ids"]:
+    print(tokenizer.decode(ids))
+```
+
+```python out
+'[CLS] This sentence is not [SEP]'
+'[CLS] is not too long [SEP]'
+'[CLS] too long but we [SEP]'
+'[CLS] but we are going [SEP]'
+'[CLS] are going to split [SEP]'
+'[CLS] to split it anyway [SEP]'
+'[CLS] it anyway. [SEP]'
+```
+
+După cum putem vedea, propoziția a fost împărțită în bucăți astfel încât fiecare intrare din `inputs["input_ids"]` să aibă cel mult 6 token-uri (aici ar trebui să adăugăm padding pentru ca ultima intrare să aibă aceeași dimensiune ca celelalte) și există o suprapunere de 2 tokenuri între fiecare intrare.
+
+Să aruncăm o privire mai atentă la rezultatul tokenizării:
+
+```py
+print(inputs.keys())
+```
+
+```python out
+dict_keys(['input_ids', 'attention_mask', 'overflow_to_sample_mapping'])
+```
+
+Așa cum era de așteptat, obținem ID-uri de intrare și un attention mask. Ultima cheie, `overflow_to_sample_mapping`, este o hartă care ne spune cărei propoziții îi corespunde fiecare dintre rezultate - aici avem 7 rezultate care provin toate din (singura) propoziție pe care am transmis-o tokenizerului:
+
+```py
+print(inputs["overflow_to_sample_mapping"])
+```
+
+```python out
+[0, 0, 0, 0, 0, 0, 0]
+```
+
+Acest lucru este mai util atunci când tokenizăm mai multe propoziții împreună. De exemplu, aceasta:
+
+```py
+sentences = [
+    "This sentence is not too long but we are going to split it anyway.",
+    "This sentence is shorter but will still get split.",
+]
+inputs = tokenizer(
+    sentences, truncation=True, return_overflowing_tokens=True, max_length=6, stride=2
+)
+
+print(inputs["overflow_to_sample_mapping"])
+```
+
+gets us:
+
+```python out
+[0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1]
+```
+
+ceea ce înseamnă că prima propoziție este împărțită în 7 fragmente ca înainte, iar următoarele 4 fragmente provin din a doua propoziție.
+
+Acum să ne întoarcem la contextul nostru lung. În mod implicit, pipelineul `question-answering` utilizează o lungime maximă de 384, așa cum am menționat mai devreme, și un stride de 128, care corespund modului în care modelul a fost fine-tuned (puteți ajusta acești parametri prin trecerea argumentelor `max_seq_len` și `stride` atunci când apelați pipelineul). Astfel, vom utiliza acești parametri la tokenizare. Vom adăuga, de asemenea, padding (pentru a avea sampleuri de aceeași lungime, astfel încât să putem construi tensori), precum și pentru a solicita offsets:
+
+```py
+inputs = tokenizer(
+    question,
+    long_context,
+    stride=128,
+    max_length=384,
+    padding="longest",
+    truncation="only_second",
+    return_overflowing_tokens=True,
+    return_offsets_mapping=True,
+)
+```
+
+Aceste "inputuri" vor conține ID-urile de input și attention maskurile așteptate de model, precum și offseturile și "overflow_to_sample_mapping" despre care tocmai am vorbit. Deoarece cei doi nu sunt parametri utilizați de model, îi vom scoate din `inputs` (și nu vom stoca harta, deoarece nu este utilă aici) înainte de a-l converti într-un tensor:
+
+{#if fw === 'pt'}
+
+```py
+_ = inputs.pop("overflow_to_sample_mapping")
+offsets = inputs.pop("offset_mapping")
+
+inputs = inputs.convert_to_tensors("pt")
+print(inputs["input_ids"].shape)
+```
+
+```python out
+torch.Size([2, 384])
+```
+
+{:else}
+
+```py
+_ = inputs.pop("overflow_to_sample_mapping")
+offsets = inputs.pop("offset_mapping")
+
+inputs = inputs.convert_to_tensors("tf")
+print(inputs["input_ids"].shape)
+```
+
+```python out
+(2, 384)
+```
+
+{/if}
+
+Contextul nostru lung a fost împărțit în două, ceea ce înseamnă că, după ce trece prin modelul nostru, vom avea două seturi de logits de început și de sfârșit:
+
+```py
+outputs = model(**inputs)
+
+start_logits = outputs.start_logits
+end_logits = outputs.end_logits
+print(start_logits.shape, end_logits.shape)
+```
+
+{#if fw === 'pt'}
+
+```python out
+torch.Size([2, 384]) torch.Size([2, 384])
+```
+
+{:else}
+
+```python out
+(2, 384) (2, 384)
+```
+
+{/if}
+
+Ca și înainte, mai întâi mascăm tokenii care nu fac parte din context înainte de a lua softmax. De asemenea, mascăm toți padding tokens(marcate de attention mask):
+
+{#if fw === 'pt'}
+
+```py
+sequence_ids = inputs.sequence_ids()
+# Mask everything apart from the tokens of the context
+mask = [i != 1 for i in sequence_ids]
+# Unmask the [CLS] token
+mask[0] = False
+# Mask all the [PAD] tokens
+mask = torch.logical_or(torch.tensor(mask)[None], (inputs["attention_mask"] == 0))
+
+start_logits[mask] = -10000
+end_logits[mask] = -10000
+```
+
+{:else}
+
+```py
+sequence_ids = inputs.sequence_ids()
+# Mask everything apart from the tokens of the context
+mask = [i != 1 for i in sequence_ids]
+# Unmask the [CLS] token
+mask[0] = False
+# Mask all the [PAD] tokens
+mask = tf.math.logical_or(tf.constant(mask)[None], inputs["attention_mask"] == 0)
+
+start_logits = tf.where(mask, -10000, start_logits)
+end_logits = tf.where(mask, -10000, end_logits)
+```
+
+{/if}
+
+Then we can use the softmax to convert our logits to probabilities:
+
+{#if fw === 'pt'}
+
+```py
+start_probabilities = torch.nn.functional.softmax(start_logits, dim=-1)
+end_probabilities = torch.nn.functional.softmax(end_logits, dim=-1)
+```
+
+{:else}
+
+```py
+start_probabilities = tf.math.softmax(start_logits, axis=-1).numpy()
+end_probabilities = tf.math.softmax(end_logits, axis=-1).numpy()
+```
+
+{/if}
+
+Următorul pas este similar cu ceea ce am făcut pentru contextul mic, dar îl repetăm pentru fiecare dintre cele două chunkuri. Atribuim un scor tuturor intervalelor posibile de răspuns, apoi luăm intervalul cu cel mai bun scor:
+
+{#if fw === 'pt'}
+
+```py
+candidates = []
+for start_probs, end_probs in zip(start_probabilities, end_probabilities):
+    scores = start_probs[:, None] * end_probs[None, :]
+    idx = torch.triu(scores).argmax().item()
+
+    start_idx = idx // scores.shape[1]
+    end_idx = idx % scores.shape[1]
+    score = scores[start_idx, end_idx].item()
+    candidates.append((start_idx, end_idx, score))
+
+print(candidates)
+```
+
+{:else}
+
+```py
+candidates = []
+for start_probs, end_probs in zip(start_probabilities, end_probabilities):
+    scores = start_probs[:, None] * end_probs[None, :]
+    idx = np.triu(scores).argmax().item()
+
+    start_idx = idx // scores.shape[1]
+    end_idx = idx % scores.shape[1]
+    score = scores[start_idx, end_idx].item()
+    candidates.append((start_idx, end_idx, score))
+
+print(candidates)
+```
+
+{/if}
+
+```python out
+[(0, 18, 0.33867), (173, 184, 0.97149)]
+```
+
+Cei doi candidați corespund celor mai bune răspunsuri pe care modelul le-a putut găsi în fiecare parte. Modelul este mult mai încrezător că răspunsul corect se află în a doua parte (ceea ce este un semn bun!). Acum trebuie doar să facem map celor două intervale de tokenuri cu intervalele de caractere din context (trebuie să o punem în corespondență doar pe a doua pentru a avea răspunsul nostru, dar este interesant să vedem ce a ales modelul în prima parte).
+
+<Tip>
+
+✏️ **Încercați!** Adaptați codul de mai sus pentru a returna scorurile și spanurile intervalele pentru cele mai probabile cinci răspunsuri (în total, nu pe chunk).
+
+</Tip>
+
+`offsets`-urile pe care le-am luat mai devreme este de fapt o listă de offsets, cu o listă pentru fiecare chunk de text:
+
+```py
+for candidate, offset in zip(candidates, offsets):
+    start_token, end_token, score = candidate
+    start_char, _ = offset[start_token]
+    _, end_char = offset[end_token]
+    answer = long_context[start_char:end_char]
+    result = {"answer": answer, "start": start_char, "end": end_char, "score": score}
+    print(result)
+```
+
+```python out
+{'answer': '\n🤗 Transformers: State of the Art NLP', 'start': 0, 'end': 37, 'score': 0.33867}
+{'answer': 'Jax, PyTorch and TensorFlow', 'start': 1892, 'end': 1919, 'score': 0.97149}
+```
+
+Dacă ignorăm primul rezultat, obținem același rezultat ca și pipelineul noastru pentru acest context lung - yay!
+
+<Tip>
+
+✏️ **Încercați!** Utilizați cele mai bune scoruri pe care le-ați calculat înainte pentru a afișa cele mai probabile cinci răspunsuri (pentru întregul context, nu pentru fiecare chunk). Pentru a vă verifica rezultatele, întoarceți-vă la primul pipeline și introduceți `top_k=5` atunci când îl apelați.
+
+</Tip>
+
+Aici se încheie scufundarea noastră în capacitățile tokenizerului. Vom pune toate acestea din nou în practică în capitolul următor, când vă vom arăta cum să ajustați un model pentru o serie de sarcini NLP comune.
diff --git a/chapters/rum/chapter6/4.mdx b/chapters/rum/chapter6/4.mdx
new file mode 100644
index 000000000..d19b1777a
--- /dev/null
+++ b/chapters/rum/chapter6/4.mdx
@@ -0,0 +1,122 @@
+# Normalizare și pre-tokenizare[[normalization-and-pre-tokenization]]
+
+<CourseFloatingBanner chapter={6}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter6/section4.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter6/section4.ipynb"},
+]} />
+
+Înainte de a analiza în profunzime cei mai comuni trei algoritmi de subword tokenization utilizați cu modelele Transformer (Byte-Pair Encoding [BPE], WordPiece și Unigram), vom arunca mai întâi o privire la preprocesarea pe care fiecare tokenizer o aplică textului. Iată o prezentare generală a etapelor din pipelineul de tokenizare:
+
+<div class="flex justify-center">
+<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter6/tokenization_pipeline.svg" alt="The tokenization pipeline.">
+<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter6/tokenization_pipeline-dark.svg" alt="The tokenization pipeline.">
+</div>
+
+Înainte de a împărți un text în subtokens (în conformitate cu modelul său), tokenizerul efectuează doi pași: _normalization__ și _pre-tokenization_.
+
+## Normalization[[normalization]]
+
+<Youtube id="4IIC2jI9CaU"/>
+
+Etapa de normalizare implică o curățare generală, cum ar fi eliminarea spațiilor inutile, a le face minuscule, și/sau ștergerea accentelor. Dacă sunteți familiarizat cu [Unicode normalization](http://www.unicode.org/reports/tr15/) (cum ar fi NFC sau NFKC), acest lucru poate fi aplicat și de tokenizer.
+
+`Tokenizer`-ul 🤗 Transformers are un atribut numit `backend_tokenizer` care oferă acces la tokenizatorul de bază din biblioteca 🤗 Tokenizers:
+
+```py
+from transformers import AutoTokenizer
+
+tokenizer = AutoTokenizer.from_pretrained("bert-base-uncased")
+print(type(tokenizer.backend_tokenizer))
+```
+
+```python out
+<class 'tokenizers.Tokenizer'>
+```
+
+Atributul `normalizer` al obiectului `tokenizer` are o metodă `normalize_str()` pe care o putem folosi pentru a vedea cum se realizează normalizarea:
+
+```py
+print(tokenizer.backend_tokenizer.normalizer.normalize_str("Héllò hôw are ü?"))
+```
+
+```python out
+'hello how are u?'
+```
+
+În acest exemplu, din moment ce am ales checkpointul `bert-base-uncased`, normalizarea a aplicat scrierea cu minusculă și a eliminat accentele.
+
+<Tip>
+
+✏️ **Încercați!** Încărcați un tokenizer din checkpointul `bert-base-cased` și treceți-i același exemplu. Care sunt principalele diferențe pe care le puteți observa între versiunile cased și uncased ale tokenizerului?
+
+</Tip>
+
+## Pre-tokenization[[pre-tokenization]]
+
+<Youtube id="grlLV8AIXug"/>
+
+După cum vom vedea în secțiunile următoare, un tokenizer nu poate fi antrenat doar pe text raw. În schimb, trebuie mai întâi să împărțim textele în entități mici, cum ar fi cuvintele. Aici intervine etapa de pre-tokenizare. După cum am văzut în [Capitolul 2](/course/chapter2), un tokenizer bazat pe cuvinte poate împărți pur și simplu un text raw în cuvinte pe baza spațiului și a punctuației. Aceste cuvinte vor fi limitele subtokenurilor pe care tokenizerul le poate învăța în timpul instruirii sale.
+
+Pentru a vedea cum un tokenizator rapid efectuează pre-tokenizarea, putem utiliza metoda `pre_tokenize_str()` a atributului `pre_tokenizer` al obiectului `tokenizer`:
+
+```py
+tokenizer.backend_tokenizer.pre_tokenizer.pre_tokenize_str("Hello, how are  you?")
+```
+
+```python out
+[('Hello', (0, 5)), (',', (5, 6)), ('how', (7, 10)), ('are', (11, 14)), ('you', (16, 19)), ('?', (19, 20))]
+```
+
+Observați cum tokenizatorul ține deja evidența offseturilor, acesta fiind modul în care ne poate oferi mappingul offseturilor pe care l-am folosit în secțiunea anterioară. Aici, tokenizatorul ignoră cele două spații și le înlocuiește cu unul singur, dar offsetul sare între `are` și `you` pentru a ține cont de acest lucru.
+
+Deoarece utilizăm un tokenizer BERT, pre-tokenizarea implică separarea spațiilor și a punctuației. Alți tokenizatori pot avea reguli diferite pentru acest pas. De exemplu, dacă folosim tokenizatorul GPT-2:
+
+```py
+tokenizer = AutoTokenizer.from_pretrained("gpt2")
+tokenizer.backend_tokenizer.pre_tokenizer.pre_tokenize_str("Hello, how are  you?")
+```
+
+va despărți în spații și punctuație, dar va păstra spațiile și le va înlocui cu un simbol `Ġ`, permițându-i să recupereze spațiile originale dacă facem decode tokenilor:
+
+```python out
+[('Hello', (0, 5)), (',', (5, 6)), ('Ġhow', (6, 10)), ('Ġare', (10, 14)), ('Ġ', (14, 15)), ('Ġyou', (15, 19)),
+ ('?', (19, 20))]
+```
+
+De asemenea, rețineți că, spre deosebire de tokenizatorul BERT, acest tokenizator nu ignoră spațiul dublu.
+
+Pentru un ultim exemplu, să aruncăm o privire la tokenizerul T5, care se bazează pe algoritmul SentencePiece:
+
+```py
+tokenizer = AutoTokenizer.from_pretrained("t5-small")
+tokenizer.backend_tokenizer.pre_tokenizer.pre_tokenize_str("Hello, how are  you?")
+```
+
+```python out
+[('▁Hello,', (0, 6)), ('▁how', (7, 10)), ('▁are', (11, 14)), ('▁you?', (16, 20))]
+```
+
+Ca și tokenizatorul GPT-2, acesta păstrează spațiile și le înlocuiește cu un token specific (`_`), dar tokenizatorul T5 separă doar spațiile, nu și punctuația. De asemenea, observați că a adăugat un spațiu implicit la începutul propoziției (înainte de `Hello`) și a ignorat spațiul dublu dintre `are` și `you`.
+
+Acum că am văzut puțin din modul în care diferite tokenizere procesează textul, putem începe să explorăm algoritmii care stau la baza acestora. Vom începe cu o privire rapidă asupra SentencePiece, care se aplică pe scară largă; apoi, în următoarele trei secțiuni, vom examina modul în care funcționează cei trei algoritmi principali utilizați pentru tokenizarea subcuvintelor.
+
+## SentencePiece[[sentencepiece]]
+
+[SentencePiece](https://github.com/google/sentencepiece) este un algoritm de tokenizare pentru preprocesarea textului pe care îl puteți utiliza cu oricare dintre modelele pe care le vom vedea în următoarele trei secțiuni. Acesta consideră textul ca o secvență de caractere Unicode și înlocuiește spațiile cu un caracter special, `▁`. Folosit împreună cu algoritmul Unigram (a se vedea [secțiunea 7](/course/chapter7/7)), nu necesită nici măcar o etapă de pre-tokenizare, ceea ce este foarte util pentru limbile în care nu se folosește caracterul spațiu (cum ar fi chineza sau japoneza).
+
+Cealaltă caracteristică principală a SentencePiece este *reversible tokenization*: deoarece nu există un tratament special al spațiilor, decodarea tokenurilor se face pur și simplu prin concatenarea lor și înlocuirea `_` cu spații - acest lucru rezultă în textul normalizat. După cum am văzut mai devreme, tokenizatorul BERT elimină spațiile care se repetă, deci tokenizarea sa nu este reversibilă.
+
+## Prezentare generală a algoritmului[[algorithm-overview]]
+
+În următoarele secțiuni, vom analiza cei trei algoritmi principali de tokenizare a subcuvintelor: BPE (utilizat de GPT-2 și alții), WordPiece (utilizat de exemplu de BERT) și Unigram (utilizat de T5 și alții). Înainte de a începe, iată o scurtă prezentare generală a modului în care funcționează fiecare dintre acestea. Nu ezitați să reveniți la acest tabel după ce citiți fiecare dintre secțiunile următoare, dacă încă nu are sens pentru dumneavoastră.
+
+Model | BPE | WordPiece | Unigram
+:----:|:---:|:---------:|:------:
+Training | Pornește de la un vocabular restrâns și învață reguli de îmbinare a tokenilor |  Pornește de la un vocabular restrâns și învață reguli de îmbinare a tokenilor | Pornește de la un vocabular mare și învață regulile de eliminare a tokenilor
+Training step | Combină tokenii corespunzători celei mai comune perechi | Combină tokenii corespunzători perechii cu cel mai bun scor pe baza frecvenței perechii, privilegiind perechile în care fiecare token individual este mai puțin frecvent| Elimină toți tokenii din vocabular care vor minimiza pierderea calculată pe întregul corpus
+Learns | Reguli de combinare și un vocabular| Doar un vocabular| Un vocabular cu un anumit scor pentru fiecare token
+Encoding | Împarte un cuvânt în caractere și aplică îmbinările învățate în timpul antrenării | Găsește cel mai lung subcuvânt începând de la început care se află în vocabular, apoi face același lucru pentru restul cuvântului | Găsește cea mai probabilă împărțire în tokens, folosind scorurile învățate în timpul antrenării
+
+Acum hai să trecem la BPE!
\ No newline at end of file
diff --git a/chapters/rum/chapter6/5.mdx b/chapters/rum/chapter6/5.mdx
new file mode 100644
index 000000000..91c26b82f
--- /dev/null
+++ b/chapters/rum/chapter6/5.mdx
@@ -0,0 +1,360 @@
+# Tokenizarea Byte-Pair Encoding[[byte-pair-encoding-tokenization]]
+
+<CourseFloatingBanner chapter={6}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter6/section5.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter6/section5.ipynb"},
+]} />
+
+Byte-Pair Encoding (BPE) a fost inițial dezvoltat ca un algoritm de comprimare a textelor și apoi utilizat de OpenAI pentru tokenizare la preantrenarea modelului GPT. Acesta este utilizat de o mulțime de modele Transformers, inclusiv GPT, GPT-2, RoBERTa, BART și DeBERTa.
+
+<Youtube id="HEikzVL-lZU"/>
+
+<Tip>
+
+💡 Această secțiune acoperă BPE în profunzime, mergând până la prezentarea unei implementări complete. Puteți sări la sfârșit dacă doriți doar o prezentare generală a algoritmului de tokenizare.
+
+</Tip>
+
+## Algoritmul de antrenare[[training-algorithm]]
+
+Antrenarea BPE începe prin calcularea setului unic de cuvinte utilizate în corpus (după finalizarea etapelor de normalizare și pre-tokenizare), apoi construirea vocabularului prin preluarea tuturor simbolurilor utilizate pentru scrierea acestor cuvinte. Ca un exemplu foarte simplu, să spunem că corpusul nostru utilizează aceste cinci cuvinte:
+
+```
+"hug", "pug", "pun", "bun", "hugs"
+```
+
+Vocabularul de bază va fi atunci `["b", "g", "h", "n", "p", "s", "u"]`. Pentru cazurile din lumea reală, vocabularul de bază va conține cel puțin toate caracterele ASCII și, probabil, și unele caractere Unicode. Dacă un exemplu pe care îl tokenizați utilizează un caracter care nu se află în corpusul de antrenare, acel caracter va fi convertit într-un token necunoscut. Acesta este unul dintre motivele pentru care o mulțime de modele NLP sunt foarte proaste la analizarea conținutului cu emoji, de exemplu.
+
+<Tip>
+
+Tokenizerele GPT-2 și RoBERTa (care sunt destul de asemănătoare) au o modalitate inteligentă de a rezolva acest lucru: ele nu privesc cuvintele ca fiind scrise cu caractere Unicode, ci cu bytes. În acest fel, vocabularul de bază are o dimensiune mică (256), dar fiecare caracter la care vă puteți gândi va fi inclus și nu va ajunge să fie convertit într-un token necunoscut. Acest truc se numește *byte-level BPE*.
+
+</Tip>
+
+După obținerea acestui vocabular de bază, adăugăm noi tokeni până când se atinge dimensiunea dorită a vocabularului prin învățarea prin *merges*, care sunt reguli de merge a două elemente ale vocabularului existent într-unul nou. Astfel, la început, aceste fuziuni vor crea tokenuri cu două caractere, iar apoi, pe măsură ce antrenamentul progresează, subwords mai lungi.
+
+În orice etapă din timpul antrenării tokenizerului, algoritmul BPE va căuta cea mai frecventă pereche de tokenuri existente (prin "pereche" înțelegem aici doi tokeni consecutivi într-un cuvânt). Acea pereche cea mai frecventă este cea care va fi mergea, iar noi ștergem și repetăm pentru pasul următor.
+
+Revenind la exemplul nostru anterior, să presupunem că cuvintele au următoarele frecvențe:
+
+```
+("hug", 10), ("pug", 5), ("pun", 12), ("bun", 4), ("hugs", 5)
+```
+
+înțelegând că `"hug"` a fost prezent de 10 ori în corpus, `"pug"` de 5 ori, `"pun"` de 12 ori, `"bun"` de 4 ori, iar `"hugs"` de 5 ori. Începem antrenamentul împărțind fiecare cuvânt în caractere (cele care formează vocabularul nostru inițial), astfel încât să putem vedea fiecare cuvânt ca pe o listă de tokeni:
+
+```
+("h" "u" "g", 10), ("p" "u" "g", 5), ("p" "u" "n", 12), ("b" "u" "n", 4), ("h" "u" "g" "s", 5)
+```
+
+Apoi ne uităm la perechi. Perechea `("h", "u")` este prezentă în cuvintele `"hug"` și `"hugs"`, deci de 15 ori în total în corpus. Totuși, nu este cea mai frecventă pereche: această onoare revine perechii `("u", "g")`, care este prezentă în cuvintele `"hug"`, `"pug"` și `"hugs"`, pentru un total de 20 de ori în vocabular.
+
+Astfel, prima regulă de merge învățată de tokenizer este `("u", "g") -> "ug"`, ceea ce înseamnă că `"ug"` va fi adăugat la vocabular, iar perechea ar trebui să fie merged în toate cuvintele din corpus. La sfârșitul acestei etape, vocabularul și corpus-ul arată astfel:
+
+```
+Vocabulary: ["b", "g", "h", "n", "p", "s", "u", "ug"]
+Corpus: ("h" "ug", 10), ("p" "ug", 5), ("p" "u" "n", 12), ("b" "u" "n", 4), ("h" "ug" "s", 5)
+```
+
+Acum avem câteva perechi care rezultă într-un token mai lung de două caractere: perechea `("h", "ug")`, de exemplu (prezentă de 15 ori în corpus). Cea mai frecventă pereche în această etapă este `("u", "n")`, prezentă însă de 16 ori în corpus, astfel încât a doua regulă de îmbinare învățată este `("u", "n") -> "un"`. Adăugarea acestei reguli la vocabular și mergingul tuturor aparițiilor existente ne conduce la:
+
+```
+Vocabulary: ["b", "g", "h", "n", "p", "s", "u", "ug", "un"]
+Corpus: ("h" "ug", 10), ("p" "ug", 5), ("p" "un", 12), ("b" "un", 4), ("h" "ug" "s", 5)
+```
+
+Acum, cea mai frecventă pereche este `("h", "ug")`, așa că învățăm regula de erge `("h", "ug") -> "hug"`, care ne oferă primul nostru simbol din trei litere. După fuzionare, corpusul arată astfel:
+
+```
+Vocabulary: ["b", "g", "h", "n", "p", "s", "u", "ug", "un", "hug"]
+Corpus: ("hug", 10), ("p" "ug", 5), ("p" "un", 12), ("b" "un", 4), ("hug" "s", 5)
+```
+
+Și continuăm astfel până când ajungem la dimensiunea dorită a vocabularului.
+
+<Tip>
+
+✏️ **Acum e rândul tău!** Care crezi că va fi următoarea regulă de fuziune?
+
+</Tip>
+
+## Algoritmul de tokenizare[[tokenization-algorithm]]
+
+Tokenizarea urmează îndeaproape procesul de antrenare, în sensul că noile inputuri sunt tokenizate prin aplicarea următoarelor etape:
+
+1. Normalizare
+2. Pre-tokenizare
+3. Divizarea cuvintelor în caractere individuale
+4. Aplicarea regulilor de merge învățate în ordine asupra acestor împărțiri
+
+Să luăm exemplul pe care l-am folosit în timpul antrenamentului, cu cele trei reguli de merge învățate:
+
+```
+("u", "g") -> "ug"
+("u", "n") -> "un"
+("h", "ug") -> "hug"
+```
+
+Cuvântul `"bug"` va fi tokenizat ca `["b", "ug"]`. Cu toate acestea, cuvântul `"mug"` va fi tokenizat ca `["[UNK]", "ug"]` deoarece litera `"m"` nu a fost în vocabularul de bază. De asemenea, cuvântul `"thug"` va fi tokenizat ca `["[UNK]", "hug"]`: litera `"t"` nu se află în vocabularul de bază, iar aplicarea regulilor de merge duce mai întâi la fuzionarea lui `"u"` și `"g"` și apoi la fuzionarea lui `"h"` și `"ug"`.
+
+<Tip>
+
+✏️ **Acum e rândul tău!** Cum crezi că va fi tokenizat cuvântul `"unhug"`?
+
+</Tip>
+
+## Implementarea BPE[[implementing-bpe]]
+
+Acum să aruncăm o privire la implementarea algoritmului BPE. Aceasta nu va fi o versiune optimizată pe care o puteți utiliza pe un corpus mare; dorim doar să vă arătăm codul pentru a putea înțelege algoritmul puțin mai bine.
+
+În primul rând avem nevoie de un corpus, așa că haideți să creăm unul simplu cu câteva propoziții:
+
+```python
+corpus = [
+    "This is the Hugging Face Course.",
+    "This chapter is about tokenization.",
+    "This section shows several tokenizer algorithms.",
+    "Hopefully, you will be able to understand how they are trained and generate tokens.",
+]
+```
+
+Apoi, trebuie să pre-tokenizăm acest corpus în cuvinte. Deoarece replicăm un tokenizator BPE (precum GPT-2), vom utiliza tokenizatorul `gpt2` pentru pre-tokenizare:
+
+```python
+from transformers import AutoTokenizer
+
+tokenizer = AutoTokenizer.from_pretrained("gpt2")
+```
+
+Apoi, calculăm frecvențele fiecărui cuvânt din corpus la fel ca în cazul pre-tokenizării:
+
+```python
+from collections import defaultdict
+
+word_freqs = defaultdict(int)
+
+for text in corpus:
+    words_with_offsets = tokenizer.backend_tokenizer.pre_tokenizer.pre_tokenize_str(text)
+    new_words = [word for word, offset in words_with_offsets]
+    for word in new_words:
+        word_freqs[word] += 1
+
+print(word_freqs)
+```
+
+```python out
+defaultdict(int, {'This': 3, 'Ġis': 2, 'Ġthe': 1, 'ĠHugging': 1, 'ĠFace': 1, 'ĠCourse': 1, '.': 4, 'Ġchapter': 1,
+    'Ġabout': 1, 'Ġtokenization': 1, 'Ġsection': 1, 'Ġshows': 1, 'Ġseveral': 1, 'Ġtokenizer': 1, 'Ġalgorithms': 1,
+    'Hopefully': 1, ',': 1, 'Ġyou': 1, 'Ġwill': 1, 'Ġbe': 1, 'Ġable': 1, 'Ġto': 1, 'Ġunderstand': 1, 'Ġhow': 1,
+    'Ġthey': 1, 'Ġare': 1, 'Ġtrained': 1, 'Ġand': 1, 'Ġgenerate': 1, 'Ġtokens': 1})
+```
+
+Următorul pas este calcularea vocabularului de bază, format din toate caracterele utilizate în corpus:
+
+```python
+alphabet = []
+
+for word in word_freqs.keys():
+    for letter in word:
+        if letter not in alphabet:
+            alphabet.append(letter)
+alphabet.sort()
+
+print(alphabet)
+```
+
+```python out
+[ ',', '.', 'C', 'F', 'H', 'T', 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'k', 'l', 'm', 'n', 'o', 'p', 'r', 's',
+  't', 'u', 'v', 'w', 'y', 'z', 'Ġ']
+```
+
+De asemenea, adăugăm tokenurile speciale utilizate de model la începutul vocabularului respectiv. În cazul GPT-2, singurul simbol special este `"<|endoftext|>"`:
+
+```python
+vocab = ["<|endoftext|>"] + alphabet.copy()
+```
+
+Acum trebuie să împărțim fiecare cuvânt în caractere individuale, pentru a putea începe antrenarea:
+
+```python
+splits = {word: [c for c in word] for word in word_freqs.keys()}
+```
+
+Acum că suntem pregătiți pentru antrenare, să scriem o funcție care calculează frecvența fiecărei perechi. Va trebui să folosim această funcție la fiecare etapă a antrenare:
+
+```python
+def compute_pair_freqs(splits):
+    pair_freqs = defaultdict(int)
+    for word, freq in word_freqs.items():
+        split = splits[word]
+        if len(split) == 1:
+            continue
+        for i in range(len(split) - 1):
+            pair = (split[i], split[i + 1])
+            pair_freqs[pair] += freq
+    return pair_freqs
+```
+
+Să aruncăm o privire la o parte din acest dicționar după separările inițiale:
+
+```python
+pair_freqs = compute_pair_freqs(splits)
+
+for i, key in enumerate(pair_freqs.keys()):
+    print(f"{key}: {pair_freqs[key]}")
+    if i >= 5:
+        break
+```
+
+```python out
+('T', 'h'): 3
+('h', 'i'): 3
+('i', 's'): 5
+('Ġ', 'i'): 2
+('Ġ', 't'): 7
+('t', 'h'): 3
+```
+
+Acum, pentru a găsi cea mai frecventă pereche este nevoie doar de o loop rapid:
+
+```python
+best_pair = ""
+max_freq = None
+
+for pair, freq in pair_freqs.items():
+    if max_freq is None or max_freq < freq:
+        best_pair = pair
+        max_freq = freq
+
+print(best_pair, max_freq)
+```
+
+```python out
+('Ġ', 't') 7
+```
+
+Așadar, prima îmbinare care trebuie învățată este `('Ġ', 't') -> 'Ġt'`, și adăugăm `'Ġt'` la vocabular:
+
+```python
+merges = {("Ġ", "t"): "Ġt"}
+vocab.append("Ġt")
+```
+
+Pentru a continua, trebuie să aplicăm aceast merge în dicționarul nostru `splits`. Să scriem o altă funcție pentru acest lucru:
+
+```python
+def merge_pair(a, b, splits):
+    for word in word_freqs:
+        split = splits[word]
+        if len(split) == 1:
+            continue
+
+        i = 0
+        while i < len(split) - 1:
+            if split[i] == a and split[i + 1] == b:
+                split = split[:i] + [a + b] + split[i + 2 :]
+            else:
+                i += 1
+        splits[word] = split
+    return splits
+```
+
+Și putem arunca o privire la rezultatul primului merge:
+
+```py
+splits = merge_pair("Ġ", "t", splits)
+print(splits["Ġtrained"])
+```
+
+```python out
+['Ġt', 'r', 'a', 'i', 'n', 'e', 'd']
+```
+
+Acum avem tot ce ne trebuie pentru a face bucle până când vom învăța toate mergeu-rile dorite. Ne focusăm pe o mărime a vocabularui de 50:
+
+```python
+vocab_size = 50
+
+while len(vocab) < vocab_size:
+    pair_freqs = compute_pair_freqs(splits)
+    best_pair = ""
+    max_freq = None
+    for pair, freq in pair_freqs.items():
+        if max_freq is None or max_freq < freq:
+            best_pair = pair
+            max_freq = freq
+    splits = merge_pair(*best_pair, splits)
+    merges[best_pair] = best_pair[0] + best_pair[1]
+    vocab.append(best_pair[0] + best_pair[1])
+```
+
+Ca rezultat, am învățat 19 reguli de merge(vocabularul inițial avea o dimensiune de 31 -- 30 de caractere din alfabet, plus simbolul special):
+
+```py
+print(merges)
+```
+
+```python out
+{('Ġ', 't'): 'Ġt', ('i', 's'): 'is', ('e', 'r'): 'er', ('Ġ', 'a'): 'Ġa', ('Ġt', 'o'): 'Ġto', ('e', 'n'): 'en',
+ ('T', 'h'): 'Th', ('Th', 'is'): 'This', ('o', 'u'): 'ou', ('s', 'e'): 'se', ('Ġto', 'k'): 'Ġtok',
+ ('Ġtok', 'en'): 'Ġtoken', ('n', 'd'): 'nd', ('Ġ', 'is'): 'Ġis', ('Ġt', 'h'): 'Ġth', ('Ġth', 'e'): 'Ġthe',
+ ('i', 'n'): 'in', ('Ġa', 'b'): 'Ġab', ('Ġtoken', 'i'): 'Ġtokeni'}
+```
+
+Iar vocabularul este compus din simbolul special, alfabetul inițial și toate rezultatele merge-urilor:
+
+```py
+print(vocab)
+```
+
+```python out
+['<|endoftext|>', ',', '.', 'C', 'F', 'H', 'T', 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'k', 'l', 'm', 'n', 'o',
+ 'p', 'r', 's', 't', 'u', 'v', 'w', 'y', 'z', 'Ġ', 'Ġt', 'is', 'er', 'Ġa', 'Ġto', 'en', 'Th', 'This', 'ou', 'se',
+ 'Ġtok', 'Ġtoken', 'nd', 'Ġis', 'Ġth', 'Ġthe', 'in', 'Ġab', 'Ġtokeni']
+```
+
+<Tip>
+
+💡 Folosind `train_new_from_iterator()` pe același corpus nu va rezulta exact același vocabular. Acest lucru se datorează faptului că atunci când există o alegere a celei mai frecvente perechi, am selectat-o pe prima întâlnită, în timp ce biblioteca 🤗 Tokenizers o selectează pe prima pe baza ID-urilor sale interne.
+
+</Tip>
+
+Pentru a tokeniza un text nou, îl pre-tokenizăm, îl împărțim, apoi aplicăm toate regulile de merge învățate:
+
+```python
+def tokenize(text):
+    pre_tokenize_result = tokenizer._tokenizer.pre_tokenizer.pre_tokenize_str(text)
+    pre_tokenized_text = [word for word, offset in pre_tokenize_result]
+    splits = [[l for l in word] for word in pre_tokenized_text]
+    for pair, merge in merges.items():
+        for idx, split in enumerate(splits):
+            i = 0
+            while i < len(split) - 1:
+                if split[i] == pair[0] and split[i + 1] == pair[1]:
+                    split = split[:i] + [merge] + split[i + 2 :]
+                else:
+                    i += 1
+            splits[idx] = split
+
+    return sum(splits, [])
+```
+
+Putem încerca acest lucru pe orice text compus din caractere din alfabet:
+
+```py
+tokenize("This is not a token.")
+```
+
+```python out
+['This', 'Ġis', 'Ġ', 'n', 'o', 't', 'Ġa', 'Ġtoken', '.']
+```
+
+<Tip warning={true}>
+
+⚠️ Implementarea noastră va arunca o eroare dacă există un caracter necunoscut, deoarece nu am făcut nimic pentru a le gestiona. GPT-2 nu are de fapt un token necunoscut (este imposibil să obțineți un caracter necunoscut atunci când utilizați BPE la nivel de bytes), dar acest lucru s-ar putea întâmpla aici deoarece nu am inclus toate byte-urile posibile în vocabularul inițial. Acest aspect al BPE depășește domeniul de aplicare al acestei secțiuni, așa că am omis detaliile.
+
+</Tip>
+
+Asta e tot pentru algoritmul BPE! În continuare, ne vom uita la WordPiece.
\ No newline at end of file
diff --git a/chapters/rum/chapter6/6.mdx b/chapters/rum/chapter6/6.mdx
new file mode 100644
index 000000000..c2b0e6450
--- /dev/null
+++ b/chapters/rum/chapter6/6.mdx
@@ -0,0 +1,375 @@
+# Tokenizarea WordPiece[[wordpiece-tokenization]]
+
+<CourseFloatingBanner chapter={6}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter6/section6.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter6/section6.ipynb"},
+]} />
+
+WordPiece este algoritmul de tokenizare dezvoltat de Google pentru preantrenarea BERT. De atunci, acesta a fost reutilizat în numeroase modele Transformers bazate pe BERT, cum ar fi DistilBERT, MobileBERT, Funnel Transformers și MPNET. Este foarte similar cu BPE în ceea ce privește antrenarea, dar tokenizarea efectivă se face diferit.
+
+<Youtube id="qpv6ms_t_1A"/>
+
+<Tip>
+
+💡 Această secțiune acoperă WordPiece în profunzime, mergând până la prezentarea unei implementări complete. Puteți sări la sfârșit dacă doriți doar o prezentare generală a algoritmului de tokenizare.
+
+</Tip>
+
+## Algoritmul de antrenare[[training-algorithm]]
+
+<Tip warning={true}>
+
+⚠️ Google nu a publicat niciodată implementarea sa a algoritmului de formare a WordPiece, astfel încât ceea ce urmează este cea mai bună presupunere a noastră bazată pe literatura publicată. Este posibil să nu fie 100% exactă.
+
+</Tip>
+
+La fel ca BPE, WordPiece pornește de la un vocabular restrâns care include simbolurile speciale utilizate de model și alfabetul inițial. Deoarece identifică subcuvinte prin adăugarea unui prefix (cum ar fi `##` pentru BERT), fiecare cuvânt este inițial împărțit prin adăugarea prefixului respectiv la toate caracterele din cuvânt. Astfel, de exemplu, `"word"` este împărțit astfel:
+
+```
+w ##o ##r ##d
+```
+
+Astfel, alfabetul inițial conține toate caracterele prezente la începutul unui cuvânt și caracterele prezente în interiorul unui cuvânt cu prefixul WordPiece.
+
+Apoi, la fel ca BPE, WordPiece învață reguli de merge. Principala diferență este modul în care este selectată perechea care urmează să fie merged. În loc să selecteze cea mai frecventă pereche, WordPiece calculează un scor pentru fiecare pereche, utilizând următoarea formulă:
+
+$$\mathrm{score} = (\mathrm{freq\_of\_pair}) / (\mathrm{freq\_of\_first\_element} \times \mathrm{freq\_of\_second\_element})$$
+
+Împărțind frecvența perechii la produsul frecvențelor fiecărei părți a acesteia, algoritmul prioritizează fuzionarea perechilor în care părțile individuale sunt mai puțin frecvente în vocabular. De exemplu, nu va fuziona neapărat `("un", "##able")` chiar dacă această pereche apare foarte frecvent în vocabular, deoarece cele două perechi `"un"` și `"##able"` vor apărea probabil fiecare într-o mulțime de alte cuvinte și vor avea o frecvență ridicată. În schimb, o pereche precum `("hu", "##gging")` va fi probabil fuzionată mai repede (presupunând că cuvântul "hugging" apare frecvent în vocabular), deoarece `"hu"` și `"##gging"` sunt probabil mai puțin frecvente individual.
+
+Să ne uităm la același vocabular pe care l-am folosit în exemplul de antrenare BPE:
+
+```
+("hug", 10), ("pug", 5), ("pun", 12), ("bun", 4), ("hugs", 5)
+```
+
+Spliturile aici vor fi:
+
+```
+("h" "##u" "##g", 10), ("p" "##u" "##g", 5), ("p" "##u" "##n", 12), ("b" "##u" "##n", 4), ("h" "##u" "##g" "##s", 5)
+```
+
+deci vocabularul inițial va fi `["b", "h", "p", "##g", "##n", "##s", "##u"]` (dacă uităm deocamdată de tokenurile speciale). Cea mai frecventă pereche este `("##u", "##g")` (prezentă de 20 de ori), dar frecvența individuală a lui `"##u"` este foarte mare, astfel încât scorul său nu este cel mai mare (este 1 / 36). Toate perechile cu un `"##u"` au de fapt același scor (1 / 36), astfel încât cel mai bun scor revine perechii `("##g", "##s")` - singura fără un `"##u"` - cu 1 / 20, iar prima îmbinare învățată este `("##g", "##s") -> ("##gs")`.
+
+Rețineți că atunci când facem merge, eliminăm `##` dintre cele două tokenuri, deci adăugăm `"##gs"` la vocabular și aplicăm merge în cuvintele din corpus:
+
+```
+Vocabulary: ["b", "h", "p", "##g", "##n", "##s", "##u", "##gs"]
+Corpus: ("h" "##u" "##g", 10), ("p" "##u" "##g", 5), ("p" "##u" "##n", 12), ("b" "##u" "##n", 4), ("h" "##u" "##gs", 5)
+```
+
+În acest moment, `"##u"` se află în toate perechile posibile, deci toate au același scor. Să spunem că în acest caz, prima pereche este merged, deci `("h", "##u") -> "hu"`. Acest lucru ne duce la:
+
+```
+Vocabulary: ["b", "h", "p", "##g", "##n", "##s", "##u", "##gs", "hu"]
+Corpus: ("hu" "##g", 10), ("p" "##u" "##g", 5), ("p" "##u" "##n", 12), ("b" "##u" "##n", 4), ("hu" "##gs", 5)
+```
+
+Apoi, următorul scor cu cel mai bun rezultat este împărțit de `("hu", "##g")` și `("hu", "##gs")` (cu 1/15, comparativ cu 1/21 pentru toate celelalte perechi), astfel încât prima pereche cu cel mai mare scor este merged
+
+```
+Vocabulary: ["b", "h", "p", "##g", "##n", "##s", "##u", "##gs", "hu", "hug"]
+Corpus: ("hug", 10), ("p" "##u" "##g", 5), ("p" "##u" "##n", 12), ("b" "##u" "##n", 4), ("hu" "##gs", 5)
+```
+
+și continuăm astfel până când ajungem la dimensiunea dorită a vocabularului.
+
+<Tip>
+
+✏️ **Acum e rândul tău!** Care va fi următoarea regulă de merge?
+
+</Tip>
+
+## Algoritm de tokenizare[[tokenization-algorithm]]
+
+Tokenizarea diferă în WordPiece și BPE prin faptul că WordPiece salvează doar vocabularul final, nu și regulile de merge învățate. Pornind de la cuvântul de tokenizat, WordPiece găsește cel mai lung subcuvânt care se află în vocabular, apoi îl împarte. De exemplu, dacă folosim vocabularul învățat în exemplul de mai sus, pentru cuvântul `"hugs"` cel mai lung subcuvânt de la început care se află în vocabular este `"hug"`, așa că împărțim acolo și obținem `["hug", "##s"]`. Apoi continuăm cu `"##s"`, care se află în vocabular, deci tokenizarea lui `"hugs"` este `["hug", "##s"]`.
+
+Cu BPE, am fi aplicat mergeurile învățate în ordine și am fi tokenizat acest lucru ca `["hu", "##gs"]`, deci encodingul este diferit.
+
+Ca un alt exemplu, să vedem cum ar fi tokenizat cuvântul `"bugs"`. `"b"` este cel mai lung subcuvânt care începe de la începutul cuvântului care se află în vocabular, așa că îl împărțim acolo și obținem `["b", "##ugs"]`. Apoi, `"##u"` este cel mai lung subcuvânt care începe de la începutul cuvântului `"##ugs"` care se află în vocabular, deci îl separăm și obținem `["b", "##u, "##gs"]`. În cele din urmă, `"##gs"` se află în vocabular, deci această ultimă listă este tokenizarea lui `"bugs"`.
+
+Atunci când tokenizarea ajunge într-un stadiu în care nu este posibilă găsirea unui subcuvânt în vocabular, întregul cuvânt este tokenizat ca necunoscut - astfel, de exemplu, `"mug"` ar fi tokenizat ca `["[UNK]"]`, la fel ca `"bum"` (chiar dacă putem începe cu `"b"` și `"##u"`, `"##m"` nu face parte din vocabular, iar tokenizarea rezultată va fi `["[UNK]"]`, nu `["b", "##u", "[UNK]"]`). Aceasta este o altă diferență față de BPE, care ar clasifica doar caracterele individuale care nu se află în vocabular ca necunoscute.
+
+<Tip>
+
+✏️ **Acum e rândul tău!** Cum va fi tokenizat cuvântul `"pugs"`?
+
+</Tip>
+
+## Implementând WordPiece[[implementing-wordpiece]]
+
+Acum să aruncăm o privire la o implementare a algoritmului WordPiece. La fel ca în cazul BPE, acest lucru este doar pedagogic și nu veți putea să îl utilizați pe un corpus mare.
+
+Vom utiliza același corpus ca în exemplul BPE:
+
+```python
+corpus = [
+    "This is the Hugging Face Course.",
+    "This chapter is about tokenization.",
+    "This section shows several tokenizer algorithms.",
+    "Hopefully, you will be able to understand how they are trained and generate tokens.",
+]
+```
+
+În primul rând, trebuie să pre-tokenizăm corpusul în cuvinte. Deoarece replicăm un tokenizator WordPiece (precum BERT), vom utiliza tokenizatorul `bert-base-cased` pentru pre-tokenizare:
+
+```python
+from transformers import AutoTokenizer
+
+tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
+```
+
+Apoi, calculăm frecvențele fiecărui cuvânt din corpus la fel ca în cazul pre-tokenizării:
+
+```python
+from collections import defaultdict
+
+word_freqs = defaultdict(int)
+for text in corpus:
+    words_with_offsets = tokenizer.backend_tokenizer.pre_tokenizer.pre_tokenize_str(text)
+    new_words = [word for word, offset in words_with_offsets]
+    for word in new_words:
+        word_freqs[word] += 1
+
+word_freqs
+```
+
+```python out
+defaultdict(
+    int, {'This': 3, 'is': 2, 'the': 1, 'Hugging': 1, 'Face': 1, 'Course': 1, '.': 4, 'chapter': 1, 'about': 1,
+    'tokenization': 1, 'section': 1, 'shows': 1, 'several': 1, 'tokenizer': 1, 'algorithms': 1, 'Hopefully': 1,
+    ',': 1, 'you': 1, 'will': 1, 'be': 1, 'able': 1, 'to': 1, 'understand': 1, 'how': 1, 'they': 1, 'are': 1,
+    'trained': 1, 'and': 1, 'generate': 1, 'tokens': 1})
+```
+
+După cum am văzut mai devreme, alfabetul este setul unic compus din toate primele litere ale cuvintelor și toate celelalte litere care apar în cuvintele cu prefixul `##`:
+
+```python
+alphabet = []
+for word in word_freqs.keys():
+    if word[0] not in alphabet:
+        alphabet.append(word[0])
+    for letter in word[1:]:
+        if f"##{letter}" not in alphabet:
+            alphabet.append(f"##{letter}")
+
+alphabet.sort()
+alphabet
+
+print(alphabet)
+```
+
+```python out
+['##a', '##b', '##c', '##d', '##e', '##f', '##g', '##h', '##i', '##k', '##l', '##m', '##n', '##o', '##p', '##r', '##s',
+ '##t', '##u', '##v', '##w', '##y', '##z', ',', '.', 'C', 'F', 'H', 'T', 'a', 'b', 'c', 'g', 'h', 'i', 's', 't', 'u',
+ 'w', 'y']
+```
+
+De asemenea, adăugăm simbolurile speciale utilizate de model la începutul vocabularului respectiv. În cazul BERT, este vorba de lista `["[PAD]", "[UNK]", "[CLS]", "[SEP]", "[MASK]"]``:
+
+```python
+vocab = ["[PAD]", "[UNK]", "[CLS]", "[SEP]", "[MASK]"] + alphabet.copy()
+```
+
+Apoi trebuie să împărțim fiecare cuvânt, cu toate literele care nu sunt primele cu prefixul `##`:
+
+```python
+splits = {
+    word: [c if i == 0 else f"##{c}" for i, c in enumerate(word)]
+    for word in word_freqs.keys()
+}
+```
+
+Acum că suntem pregătiți pentru antrenare, să scriem o funcție care calculează scorul fiecărei perechi. Va trebui să folosim această funcție la fiecare etapă a antrenării:
+
+```python
+def compute_pair_scores(splits):
+    letter_freqs = defaultdict(int)
+    pair_freqs = defaultdict(int)
+    for word, freq in word_freqs.items():
+        split = splits[word]
+        if len(split) == 1:
+            letter_freqs[split[0]] += freq
+            continue
+        for i in range(len(split) - 1):
+            pair = (split[i], split[i + 1])
+            letter_freqs[split[i]] += freq
+            pair_freqs[pair] += freq
+        letter_freqs[split[-1]] += freq
+
+    scores = {
+        pair: freq / (letter_freqs[pair[0]] * letter_freqs[pair[1]])
+        for pair, freq in pair_freqs.items()
+    }
+    return scores
+```
+
+Să aruncăm o privire la o parte din acest dicționar după separările inițiale:
+
+```python
+pair_scores = compute_pair_scores(splits)
+for i, key in enumerate(pair_scores.keys()):
+    print(f"{key}: {pair_scores[key]}")
+    if i >= 5:
+        break
+```
+
+```python out
+('T', '##h'): 0.125
+('##h', '##i'): 0.03409090909090909
+('##i', '##s'): 0.02727272727272727
+('i', '##s'): 0.1
+('t', '##h'): 0.03571428571428571
+('##h', '##e'): 0.011904761904761904
+```
+
+Acum, pentru a găsi perechea cu cel mai bun scor este nevoie doar de un loop rapid:
+
+```python
+best_pair = ""
+max_score = None
+for pair, score in pair_scores.items():
+    if max_score is None or max_score < score:
+        best_pair = pair
+        max_score = score
+
+print(best_pair, max_score)
+```
+
+```python out
+('a', '##b') 0.2
+```
+
+Așadar, primul merge de învățat este `('a', '##b') -> 'ab'`, iar noi adăugăm `'ab'` la vocabular:
+
+```python
+vocab.append("ab")
+```
+
+Pentru a continua, trebuie să aplicăm aceast merge în dicționarul nostru `splits`. Să scriem o altă funcție pentru acest lucru:
+
+```python
+def merge_pair(a, b, splits):
+    for word in word_freqs:
+        split = splits[word]
+        if len(split) == 1:
+            continue
+        i = 0
+        while i < len(split) - 1:
+            if split[i] == a and split[i + 1] == b:
+                merge = a + b[2:] if b.startswith("##") else a + b
+                split = split[:i] + [merge] + split[i + 2 :]
+            else:
+                i += 1
+        splits[word] = split
+    return splits
+```
+
+Și putem arunca o privire la rezultatul primului merge:
+
+```py
+splits = merge_pair("a", "##b", splits)
+splits["about"]
+```
+
+```python out
+['ab', '##o', '##u', '##t']
+```
+
+Acum avem tot ce ne trebuie pentru a face bucle până când vom învăța toate merge-urile dorite. Să ne propunem un vocabular de mărimea 70:
+
+```python
+vocab_size = 70
+while len(vocab) < vocab_size:
+    scores = compute_pair_scores(splits)
+    best_pair, max_score = "", None
+    for pair, score in scores.items():
+        if max_score is None or max_score < score:
+            best_pair = pair
+            max_score = score
+    splits = merge_pair(*best_pair, splits)
+    new_token = (
+        best_pair[0] + best_pair[1][2:]
+        if best_pair[1].startswith("##")
+        else best_pair[0] + best_pair[1]
+    )
+    vocab.append(new_token)
+```
+
+Ne putem uita apoi la vocabularul generat:
+
+```py
+print(vocab)
+```
+
+```python out
+['[PAD]', '[UNK]', '[CLS]', '[SEP]', '[MASK]', '##a', '##b', '##c', '##d', '##e', '##f', '##g', '##h', '##i', '##k',
+ '##l', '##m', '##n', '##o', '##p', '##r', '##s', '##t', '##u', '##v', '##w', '##y', '##z', ',', '.', 'C', 'F', 'H',
+ 'T', 'a', 'b', 'c', 'g', 'h', 'i', 's', 't', 'u', 'w', 'y', 'ab', '##fu', 'Fa', 'Fac', '##ct', '##ful', '##full', '##fully',
+ 'Th', 'ch', '##hm', 'cha', 'chap', 'chapt', '##thm', 'Hu', 'Hug', 'Hugg', 'sh', 'th', 'is', '##thms', '##za', '##zat',
+ '##ut']
+```
+
+După cum putem vedea, în comparație cu BPE, acest tokenizator învață părțile din cuvinte ca tokenuri puțin mai repede.
+
+<Tip>
+
+💡 Folosind `train_new_from_iterator()` pe același corpus nu va rezulta exact același vocabular. Acest lucru se datorează faptului că biblioteca 🤗 Tokenizers nu implementează WordPiece pentru antrenare (deoarece nu suntem complet siguri cum funcționează intern), ci utilizează BPE în schimb.
+
+</Tip>
+
+Pentru a tokeniza un text nou, îl pre-tokenizăm, îl împărțim, apoi aplicăm algoritmul de tokenizare pe fiecare cuvânt. Adică, căutăm cel mai mare subcuvânt începând de la începutul primului cuvânt și îl împărțim, apoi repetăm procesul pentru a doua parte și așa mai departe pentru restul acelui cuvânt și pentru următoarele cuvinte din text:
+
+```python
+def encode_word(word):
+    tokens = []
+    while len(word) > 0:
+        i = len(word)
+        while i > 0 and word[:i] not in vocab:
+            i -= 1
+        if i == 0:
+            return ["[UNK]"]
+        tokens.append(word[:i])
+        word = word[i:]
+        if len(word) > 0:
+            word = f"##{word}"
+    return tokens
+```
+
+Haideți să-l testăm pe un cuvânt care se află în vocabular și pe altul care nu se află:
+
+
+```python
+print(encode_word("Hugging"))
+print(encode_word("HOgging"))
+```
+
+```python out
+['Hugg', '##i', '##n', '##g']
+['[UNK]']
+```
+
+Acum, scriem o funcție care tokenizează un text:
+
+```python
+def tokenize(text):
+    pre_tokenize_result = tokenizer._tokenizer.pre_tokenizer.pre_tokenize_str(text)
+    pre_tokenized_text = [word for word, offset in pre_tokenize_result]
+    encoded_words = [encode_word(word) for word in pre_tokenized_text]
+    return sum(encoded_words, [])
+```
+
+Îl putem încerca pe orice text:
+
+```python
+tokenize("This is the Hugging Face course!")
+```
+
+```python out
+['Th', '##i', '##s', 'is', 'th', '##e', 'Hugg', '##i', '##n', '##g', 'Fac', '##e', 'c', '##o', '##u', '##r', '##s',
+ '##e', '[UNK]']
+```
+
+Asta e tot pentru algoritmul WordPiece! Acum să aruncăm o privire la Unigram.
diff --git a/chapters/rum/chapter6/7.mdx b/chapters/rum/chapter6/7.mdx
new file mode 100644
index 000000000..14744a854
--- /dev/null
+++ b/chapters/rum/chapter6/7.mdx
@@ -0,0 +1,381 @@
+# Tokenizarea Unigram[[unigram-tokenization]]
+
+<CourseFloatingBanner chapter={6}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter6/section7.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter6/section7.ipynb"},
+]} />
+
+Algoritmul Unigram este adesea utilizat în SentencePiece, care este algoritmul de tokenizare utilizat de modele precum AlBERT, T5, mBART, Big Bird și XLNet.
+
+<Youtube id="TGZfZVuF9Yc"/>
+
+<Tip>
+
+💡 Această secțiune acoperă Unigram în profunzime, mergând până la prezentarea unei implementări complete. Puteți sări la sfârșit dacă doriți doar o prezentare generală a algoritmului de tokenizare.
+
+</Tip>
+
+## Algoritm de antrenare[[training-algorithm]]
+
+În comparație cu BPE și WordPiece, Unigram lucrează în cealaltă direcție: pornește de la un vocabular mare și elimină tokeni din acesta până când ajunge la dimensiunea dorită. Există mai multe opțiuni pentru a construi acel vocabular de bază: putem lua, de exemplu, cele mai comune substrings din cuvintele pre-tokenizate sau putem aplica BPE pe corpusul inițial cu o dimensiune mare a vocabularului.
+
+La fiecare etapă a antrenării, algoritmul Unigram calculează o pierdere pe corpus oferit, având în vedere vocabularul curent. Apoi, pentru fiecare simbol din vocabular, algoritmul calculează cu cât ar crește pierderea globală dacă simbolul ar fi eliminat și caută simbolurile care ar crește cel mai puțin pierderea. Aceste simboluri au cel mai redus efect asupra pierderii globale din corpus, deci, într-un fel, sunt "mai puțin necesare" și sunt cei mai buni candidați pentru eliminare.
+
+Aceasta este o operațiune foarte costisitoare, așa că nu eliminăm doar simbolul asociat cu cea mai mică creștere a pierderii, ci procentul \\(p\\) (\\(p\\) fiind un hyperparameter pe care îl poți controla, de obicei 10 sau 20) din simbolurile asociate cu cea mai mică creștere a pierderilor. Acest proces este se repetă până când vocabularul atinge dimensiunea dorită.
+
+Rețineți că nu eliminăm niciodată caracterele de bază, pentru a ne asigura că orice cuvânt poate fi tokenizat.
+
+Acum, acest lucru este încă puțin vag: partea principală a algoritmului este de a calcula o pierdere asupra corpusului și de a vedea cum se schimbă atunci când eliminăm unele tokenuri din vocabular, dar nu am explicat încă cum să facem acest lucru. Acest pas se bazează pe algoritmul de tokenizare al unui model Unigram, așa că îl vom analiza în continuare.
+
+Vom reutiliza corpusul din exemplele anterioare:
+
+```
+("hug", 10), ("pug", 5), ("pun", 12), ("bun", 4), ("hugs", 5)
+```
+
+iar pentru acest exemplu, vom lua toate substringurile stricte pentru vocabularul inițial:
+
+```
+["h", "u", "g", "hu", "ug", "p", "pu", "n", "un", "b", "bu", "s", "hug", "gs", "ugs"]
+```
+
+## Algoritm de tokenizare[[tokenization-algorithm]]
+
+Un model Unigram este un tip de model lingvistic care consideră că fiecare token este independent de tokenii anteriori. Este cel mai simplu model lingvistic, în sensul că probabilitatea simbolului X având în vedere contextul anterior este doar probabilitatea simbolului X. Astfel, dacă am utiliza un model lingvistic Unigram pentru a genera text, am prezice întotdeauna simbolul cel mai frecvent.
+
+Probabilitatea unui token dat este frecvența sa (numărul de ori în care îl găsim) în corpusul original, împărțită la suma tuturor aparițiilor tuturor tokenilor din vocabular (pentru a ne asigura că probabilitățile sunt egale cu 1). De exemplu, `"ug"` este prezent în `"hug"`, `"pug"`, și `"hugs"`, deci are o frecvență de 20 în corpus-ul nostru.
+
+Iată frecvențele tuturor subcuvintelor posibile din vocabular:
+
+```
+("h", 15) ("u", 36) ("g", 20) ("hu", 15) ("ug", 20) ("p", 17) ("pu", 17) ("n", 16)
+("un", 16) ("b", 4) ("bu", 4) ("s", 5) ("hug", 15) ("gs", 5) ("ugs", 5)
+```
+
+Astfel, suma tuturor frecvențelor este 210, iar probabilitatea subcuvântului `"ug"` este 20/210.
+
+<Tip>
+
+✏️ **Acum este rândul tău!** Scrie codul pentru a calcula frecvențele de mai sus și verifică de două ori dacă rezultatele afișate sunt corecte, precum și suma totală.
+
+</Tip>
+
+Acum, pentru a tokeniza un cuvânt dat, ne uităm la toate segmentările posibile în tokeni și calculăm probabilitatea fiecăruia în conformitate cu modelul Unigram. Deoarece toate token-urile sunt considerate independente, această probabilitate este doar produsul probabilității fiecărui token. De exemplu, tokenizarea `["p", "u", "g"]` a lui `"pug"` are probabilitatea:
+
+$$P([``p", ``u", ``g"]) = P(``p") \times P(``u") \times P(``g") = \frac{5}{210} \times \frac{36}{210} \times \frac{20}{210} = 0.000389$$
+
+Comparativ, tokenizarea `["pu", "g"]` are probabilitatea:
+
+$$P([``pu", ``g"]) = P(``pu") \times P(``g") = \frac{5}{210} \times \frac{20}{210} = 0.0022676$$
+
+astfel încât una este mult mai probabilă decât alta. În general, tokenizările cu cei mai puțini tokeni posibili vor avea cea mai mare probabilitate (din cauza acelei împărțiri la 210 repetată pentru fiecare token), ceea ce corespunde cu ceea ce dorim intuitiv: să împărțim un cuvânt în cel mai mic număr de tokenuri posibil.
+
+Tokenizarea unui cuvânt cu modelul Unigram este atunci tokenizarea cu cea mai mare probabilitate. În exemplul `"pug"`, iată probabilitățile pe care le-am obține pentru fiecare segmentare posibilă:
+
+```
+["p", "u", "g"] : 0.000389
+["p", "ug"] : 0.0022676
+["pu", "g"] : 0.0022676
+```
+
+Astfel, `"pug"` ar fi tokenizat ca `["p", "ug"]` sau `["pu", "g"]`, în funcție de care dintre aceste segmentări este întâlnită prima (rețineți că într-un corpus mai mare, cazurile de egalitate ca acesta vor fi rare).
+
+În acest caz, a fost ușor să găsim toate segmentările posibile și să le calculăm probabilitățile, dar în general va fi puțin mai greu. Există un algoritm clasic utilizat pentru acest lucru, numit *algoritmul Viterbi*. În esență, putem construi un grafic pentru a detecta segmentările posibile ale unui cuvânt dat, spunând că există o ramură de la caracterul _a_ la caracterul _b_ dacă subcuvântul de la _a_ la _b_ se află în vocabular, și atribuind ramurii respective probabilitatea subcuvântului.
+
+Pentru a găsi calea din acest grafic care va avea cel mai bun scor, algoritmul Viterbi determină, pentru fiecare poziție din cuvânt, segmentarea cu cel mai bun scor care se termină la poziția respectivă. Deoarece mergem de la început la sfârșit, cel mai bun scor poate fi găsit prin parcurgerea în buclă a tuturor subcuvintelor care se termină la poziția curentă și apoi folosind cel mai bun scor de tokenizare de la poziția la care începe acest subcuvânt. Apoi, trebuie doar să derulăm calea parcursă pentru a ajunge la sfârșit.
+
+Să aruncăm o privire la un exemplu folosind vocabularul nostru și cuvântul `"unhug"`. Pentru fiecare poziție, subcuvintele cu cele mai bune scoruri care se termină acolo sunt următoarele:
+
+```
+Character 0 (u): "u" (score 0.171429)
+Character 1 (n): "un" (score 0.076191)
+Character 2 (h): "un" "h" (score 0.005442)
+Character 3 (u): "un" "hu" (score 0.005442)
+Character 4 (g): "un" "hug" (score 0.005442)
+```
+
+Astfel, `"unhug"` ar fi tokenizat ca `["un", "hug"]`.
+
+<Tip>
+
+✏️ **Acum e rândul tău!** Determinați tokenizarea cuvântului `"huggun"` și scorul acestuia.
+
+</Tip>
+
+## Înapoi la antrenare[[back-to-training]]
+
+Acum că am văzut cum funcționează tokenizarea, putem analiza mai în profunzime pierderea utilizată în timpul antrenării. În orice etapă dată, această pierdere este calculată prin tokenizarea fiecărui cuvânt din corpus, utilizând vocabularul curent și modelul Unigram determinat de frecvențele fiecărui token din corpus (după cum am văzut mai devreme).
+
+Fiecare cuvânt din corpus are un scor, iar pierderea este negative log likelihood a acestor scoruri - adică suma pentru toate cuvintele din corpus a tuturor `-log(P(word))`.
+
+Să ne întoarcem la exemplul nostru cu următorul corpus:
+
+```
+("hug", 10), ("pug", 5), ("pun", 12), ("bun", 4), ("hugs", 5)
+```
+
+Tokenizarea fiecărui cuvânt cu scorurile lor respective este:
+
+```
+"hug": ["hug"] (score 0.071428)
+"pug": ["pu", "g"] (score 0.007710)
+"pun": ["pu", "n"] (score 0.006168)
+"bun": ["bu", "n"] (score 0.001451)
+"hugs": ["hug", "s"] (score 0.001701)
+```
+
+Deci, pierderea este:
+
+```
+10 * (-log(0.071428)) + 5 * (-log(0.007710)) + 12 * (-log(0.006168)) + 4 * (-log(0.001451)) + 5 * (-log(0.001701)) = 169.8
+```
+
+Acum trebuie să calculăm modul în care eliminarea fiecărui token afectează pierderea. Acest lucru este destul de plictisitor, așa că îl vom face doar pentru doi tokeni aici și vom păstra întregul proces pentru atunci când vom avea cod care să ne ajute. În acest caz (foarte) special, aveam două tokenizări echivalente ale tuturor cuvintelor: după cum am văzut mai devreme, de exemplu, `"pug"` ar putea fi tokenizat `["p", "ug"]` cu același scor. Astfel, eliminarea simbolului `"pu"` din vocabular va produce exact aceeași pierdere.
+
+Pe de altă parte, eliminarea lui `"hug"` va agrava pierderea, deoarece tokenizarea lui `"hug"` și `"hugs"` va deveni:
+
+```
+"hug": ["hu", "g"] (score 0.006802)
+"hugs": ["hu", "gs"] (score 0.001701)
+```
+
+Aceste modificări vor determina creșterea pierderii cu:
+
+```
+- 10 * (-log(0.071428)) + 10 * (-log(0.006802)) = 23.5
+```
+
+Prin urmare, tokenul `"pu"` va fi probabil eliminat din vocabular, dar nu și `"hug"`.
+
+## Implementarea Unigram[[implementarea-unigram]]
+
+Acum să implementăm în cod tot ceea ce am văzut până acum. Ca și în cazul BPE și WordPiece, aceasta nu este o implementare eficientă a algoritmului Unigram (dimpotrivă), dar ar trebui să vă ajute să-l înțelegeți puțin mai bine.
+
+Vom folosi ca exemplu același corpus ca și până acum:
+
+```python
+corpus = [
+    "This is the Hugging Face Course.",
+    "This chapter is about tokenization.",
+    "This section shows several tokenizer algorithms.",
+    "Hopefully, you will be able to understand how they are trained and generate tokens.",
+]
+```
+
+De data aceasta, vom folosi `xlnet-base-cased` ca modelul nostru:
+
+```python
+from transformers import AutoTokenizer
+
+tokenizer = AutoTokenizer.from_pretrained("xlnet-base-cased")
+```
+
+Ca și pentru BPE și WordPiece, începem prin a număra numărul de apariții ale fiecărui cuvânt în corpus:
+
+```python
+from collections import defaultdict
+
+word_freqs = defaultdict(int)
+for text in corpus:
+    words_with_offsets = tokenizer.backend_tokenizer.pre_tokenizer.pre_tokenize_str(text)
+    new_words = [word for word, offset in words_with_offsets]
+    for word in new_words:
+        word_freqs[word] += 1
+
+word_freqs
+```
+
+Apoi, trebuie să inițializăm vocabularul nostru la ceva mai mare decât dimensiunea vocabularului pe care o vom dori la final. Trebuie să includem toate caracterele de bază (altfel nu vom putea tokeniza fiecare cuvânt), dar pentru substringurile mai mari le vom păstra doar pe cele mai comune, așa că le vom sorta după frecvență:
+
+```python
+char_freqs = defaultdict(int)
+subwords_freqs = defaultdict(int)
+for word, freq in word_freqs.items():
+    for i in range(len(word)):
+        char_freqs[word[i]] += freq
+        # Loop through the subwords of length at least 2
+        for j in range(i + 2, len(word) + 1):
+            subwords_freqs[word[i:j]] += freq
+
+# Sortarea subcuvintelor după frecvență
+sorted_subwords = sorted(subwords_freqs.items(), key=lambda x: x[1], reverse=True)
+sorted_subwords[:10]
+```
+
+```python out
+[('▁t', 7), ('is', 5), ('er', 5), ('▁a', 5), ('▁to', 4), ('to', 4), ('en', 4), ('▁T', 3), ('▁Th', 3), ('▁Thi', 3)]
+```
+
+Grupăm caracterele cu cele mai bune subcuvinte pentru a ajunge la un vocabular inițial de dimensiunea 300:
+
+```python
+token_freqs = list(char_freqs.items()) + sorted_subwords[: 300 - len(char_freqs)]
+token_freqs = {token: freq for token, freq in token_freqs}
+```
+
+<Tip>
+
+💡 SentencePiece utilizează un algoritm mai eficient numit Enhanced Suffix Array (ESA) pentru a crea vocabularul inițial.
+
+</Tip>
+
+În continuare, calculăm suma tuturor frecvențelor, pentru a converti frecvențele în probabilități. Pentru modelul nostru, vom stoca logaritmii probabilităților, deoarece este mai stabil din punct de vedere numeric să adăugăm logaritmi decât să multiplicăm numere mici, iar acest lucru va simplifica calcularea pierderii modelului:
+
+```python
+from math import log
+
+total_sum = sum([freq for token, freq in token_freqs.items()])
+model = {token: -log(freq / total_sum) for token, freq in token_freqs.items()}
+```
+
+Acum funcția principală este cea care tokenizează cuvintele folosind algoritmul Viterbi. După cum am văzut mai devreme, acest algoritm calculează cea mai bună segmentare a fiecărui substringur din cuvânt, pe care o vom stoca într-o variabilă numită `best_segmentations`. Vom stoca un dicționar pentru fiecare poziție din cuvânt (de la 0 la lungimea totală a acestuia), cu două chei: indicele de început al ultimului token din cea mai bună segmentare și scorul celei mai bune segmentări. Cu ajutorul indicelui de început al ultimului token, vom putea extrage segmentarea completă odată ce lista este complet populată.
+
+Popularea listei se face cu doar două bucle: bucla principală trece peste fiecare poziție de început, iar a doua bucla încearcă toate subcuvintele care încep la acea poziție de început. Dacă substringul se află în vocabular, avem o nouă segmentare a cuvântului până la acea poziție finală, pe care o comparăm cu cea din `best_segmentations`.
+
+Odată ce bucla principală este terminată, pornim de la sfârșit și sărim de la o poziție de început la alta, înregistrând tokenii pe parcurs, până când ajungem la începutul cuvântului:
+
+```python
+def encode_word(word, model):
+    best_segmentations = [{"start": 0, "score": 1}] + [
+        {"start": None, "score": None} for _ in range(len(word))
+    ]
+    for start_idx in range(len(word)):
+        # This should be properly filled by the previous steps of the loop
+        best_score_at_start = best_segmentations[start_idx]["score"]
+        for end_idx in range(start_idx + 1, len(word) + 1):
+            token = word[start_idx:end_idx]
+            if token in model and best_score_at_start is not None:
+                score = model[token] + best_score_at_start
+                # If we have found a better segmentation ending at end_idx, we update
+                if (
+                    best_segmentations[end_idx]["score"] is None
+                    or best_segmentations[end_idx]["score"] > score
+                ):
+                    best_segmentations[end_idx] = {"start": start_idx, "score": score}
+
+    segmentation = best_segmentations[-1]
+    if segmentation["score"] is None:
+        # We did not find a tokenization of the word -> unknown
+        return ["<unk>"], None
+
+    score = segmentation["score"]
+    start = segmentation["start"]
+    end = len(word)
+    tokens = []
+    while start != 0:
+        tokens.insert(0, word[start:end])
+        next_start = best_segmentations[start]["start"]
+        end = start
+        start = next_start
+    tokens.insert(0, word[start:end])
+    return tokens, score
+```
+
+Putem încerca deja modelul nostru inițial pe câteva cuvinte:
+
+```python
+print(encode_word("Hopefully", model))
+print(encode_word("This", model))
+```
+
+```python out
+(['H', 'o', 'p', 'e', 'f', 'u', 'll', 'y'], 41.5157494601402)
+(['This'], 6.288267030694535)
+```
+
+Acum este ușor de calculat pierderea modelului pe corpus!
+
+```python
+def compute_loss(model):
+    loss = 0
+    for word, freq in word_freqs.items():
+        _, word_loss = encode_word(word, model)
+        loss += freq * word_loss
+    return loss
+```
+
+Putem verifica dacă funcționează pe modelul pe care îl avem:
+
+```python
+compute_loss(model)
+```
+
+```python out
+413.10377642940875
+```
+
+Nici calcularea scorurilor pentru fiecare token nu este foarte dificilă; trebuie doar să calculăm pierderea pentru modelele obținute prin ștergerea fiecărui tokeb:
+
+```python
+import copy
+
+
+def compute_scores(model):
+    scores = {}
+    model_loss = compute_loss(model)
+    for token, score in model.items():
+        # We always keep tokens of length 1
+        if len(token) == 1:
+            continue
+        model_without_token = copy.deepcopy(model)
+        _ = model_without_token.pop(token)
+        scores[token] = compute_loss(model_without_token) - model_loss
+    return scores
+```
+
+Îl putem încerca pe un token dat:
+
+```python
+scores = compute_scores(model)
+print(scores["ll"])
+print(scores["his"])
+```
+
+Deoarece `"ll"` este folosit în tokenizarea lui `"Hopefully"`, iar eliminarea lui ne va face, probabil, să folosim tokenul `"l"` de două ori în schimb, ne așteptăm să aibă o pierdere pozitivă. `"his"` este folosit doar în interiorul cuvântului `"This"`, care este tokenizat ca el însuși, deci ne așteptăm să aibă o pierdere zero. Iată rezultatele:
+
+```python out
+6.376412403623874
+0.0
+```
+
+<Tip>
+
+💡 Această abordare este foarte ineficientă, astfel încât SentencePiece utilizează o aproximare a pierderii modelului fără simbolul X: în loc să înceapă de la zero, înlocuiește simbolul X cu segmentarea sa în vocabularul rămas. În acest fel, toate scorurile pot fi calculate odată, în același timp cu pierderea modelului.
+
+</Tip>
+
+Cu toate acestea la locul lor, ultimul lucru pe care trebuie să îl facem este să adăugăm la vocabular tokeni speciali utilizate de model, apoi să facem o buclă până când am eliminat suficienți tokeni din vocabular pentru a ajunge la dimensiunea dorită:
+
+```python
+percent_to_remove = 0.1
+while len(model) > 100:
+    scores = compute_scores(model)
+    sorted_scores = sorted(scores.items(), key=lambda x: x[1])
+    # Remove percent_to_remove tokens with the lowest scores.
+    for i in range(int(len(model) * percent_to_remove)):
+        _ = token_freqs.pop(sorted_scores[i][0])
+
+    total_sum = sum([freq for token, freq in token_freqs.items()])
+    model = {token: -log(freq / total_sum) for token, freq in token_freqs.items()}
+```
+
+Apoi, pentru a tokeniza un text, trebuie doar să aplicăm pre-tokenizarea și apoi să folosim funcția `encode_word()`:
+
+```python
+def tokenize(text, model):
+    words_with_offsets = tokenizer.backend_tokenizer.pre_tokenizer.pre_tokenize_str(text)
+    pre_tokenized_text = [word for word, offset in words_with_offsets]
+    encoded_words = [encode_word(word, model)[0] for word in pre_tokenized_text]
+    return sum(encoded_words, [])
+
+
+tokenize("This is the Hugging Face course.", model)
+```
+
+```python out
+['▁This', '▁is', '▁the', '▁Hugging', '▁Face', '▁', 'c', 'ou', 'r', 's', 'e', '.']
+```
+
+Asta e tot pentru Unigram! Sperăm că până acum vă simțiți ca un expert în toate lucrurile legate de tokenizer. În secțiunea următoare, vom aprofunda elementele de bază ale bibliotecii 🤗 Tokenizers și vă vom arăta cum le puteți utiliza pentru a vă construi propriul tokenizer.
diff --git a/chapters/rum/chapter6/8.mdx b/chapters/rum/chapter6/8.mdx
new file mode 100644
index 000000000..4e41c84cb
--- /dev/null
+++ b/chapters/rum/chapter6/8.mdx
@@ -0,0 +1,566 @@
+# Construirea unui tokenizer, bloc cu bloc[[building-a-tokenizer-block-by-block]]
+
+<CourseFloatingBanner chapter={6}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter6/section8.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter6/section8.ipynb"},
+]} />
+
+După cum am văzut în secțiunile anterioare, tokenizarea cuprinde mai multe etape:
+
+- Normalizare (orice curățare a textului care este considerată necesară, cum ar fi eliminarea spațiilor sau a accentelor, normalizarea Unicode etc.)
+- Pre-tokenizarea (împărțirea inputului în cuvinte)
+- Rularea inputului prin model (utilizarea cuvintelor pre-tokenizate pentru a produce o secvență de tokeni)
+- Post-procesare (adăugarea tokenilor speciali ale tokenizerului, generarea attention maskului și a ID-urilor de tip token)
+
+Ca un reminder, iată o altă perspectivă asupra procesului general:
+
+<div class="flex justify-center">
+<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter6/tokenization_pipeline.svg" alt="The tokenization pipeline.">
+<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter6/tokenization_pipeline-dark.svg" alt="The tokenization pipeline.">
+</div>
+
+Biblioteca 🤗 Tokenizers a fost construită pentru a oferi mai multe opțiuni pentru fiecare dintre acești pași, pe care le puteți amesteca și combina împreună. În această secțiune vom vedea cum putem construi un tokenizer de la zero, spre deosebire de antrenarea unui tokenizer nou dintr-unul vechi, așa cum am făcut în [secțiunea 2](/course/chapter6/2). Veți putea apoi să construiți orice fel de tokenizer la care vă puteți gândi!
+
+<Youtube id="MR8tZm5ViWU"/>
+
+Mai exact, biblioteca este construită în jurul unei clase centrale `Tokenizer` cu building grupate în submodule:
+
+- `normalizers` conține toate tipurile posibile de `Normalizer` pe care le puteți folosi (lista completă [aici](https://huggingface.co/docs/tokenizers/api/normalizers)).
+- `pre_tokenizers` coține toate tipurile de `PreTokenizer` pe care le poți folosi(lista completă [aici](https://huggingface.co/docs/tokenizers/api/pre-tokenizers)).
+- `models` conține diferitele tipuri de `Model` pe care le puteți folosi, precum `BPE`, `WordPiece` și `Unigram` (lista completă [aici](https://huggingface.co/docs/tokenizers/api/models)).
+- `trainers` conține toate tipurile diferite de `Trainer` pe care le puteți folosi pentru a vă antrena modelul pe un corpus (unul pentru fiecare tip de model; lista completă [aici](https://huggingface.co/docs/tokenizers/api/trainers)).
+- `post_processors` conține diferitele tipuri de `PostProcessor` pe care le puteți utiliza (lista completă [aici](https://huggingface.co/docs/tokenizers/api/post-processors)).
+- `decoders` conține diferitele tipuri de `Decoder` pe care le puteți utiliza pentru a decoda rezultatele tokenizării (lista completă [aici](https://huggingface.co/docs/tokenizers/components#decoders)).
+
+Puteți găsi întreaga listă de blocuri [aici](https://huggingface.co/docs/tokenizers/components).
+
+## Obținerea unui corpus[[acquiring-a-corpus]]
+
+Pentru a antrena noul nostru tokenizer, vom utiliza un corpus mic de text (astfel încât exemplele să ruleze rapid). Pașii pentru obținerea corpusului sunt similari cu cei pe care i-am urmat la [începutul acestui capitol](/course/chapter6/2), dar de data aceasta vom utiliza datasetul [WikiText-2](https://huggingface.co/datasets/wikitext):
+
+```python
+from datasets import load_dataset
+
+dataset = load_dataset("wikitext", name="wikitext-2-raw-v1", split="train")
+
+
+def get_training_corpus():
+    for i in range(0, len(dataset), 1000):
+        yield dataset[i : i + 1000]["text"]
+```
+
+Funcția `get_training_corpus()` este un generator care va produce batch-uri de 1 000 de texte, pe care le vom utiliza pentru a antrena tokenizerul.
+
+🤗 Tokenizers pot fi, de asemenea, antrenate direct pe fișiere text. Iată cum putem genera un fișier text care să conțină toate textele/inputurile din WikiText-2 pe care le putem utiliza local:
+
+```python
+with open("wikitext-2.txt", "w", encoding="utf-8") as f:
+    for i in range(len(dataset)):
+        f.write(dataset[i]["text"] + "\n")
+```
+
+În continuare vă vom arăta cum să vă construiți propriile tokenizere BERT, GPT-2 și XLNet, bloc cu bloc. Acest lucru ne va oferi un exemplu pentru fiecare dintre cei trei algoritmi principali de tokenizare: WordPiece, BPE și Unigram. Să începem cu BERT!
+
+## Construirea unui tokenizator WordPiece de la zero[[building-a-wordpiece-tokenizer-from-scratch]]
+
+Pentru a construi un tokenizer cu biblioteca 🤗 Tokenizers, începem prin a inițializa un obiect `Tokenizer` cu un `model`, apoi îi setăm atributele `normalizer`, `pre_tokenizer`, `post_processor` și `decoder` la valorile dorite.
+
+Pentru acest exemplu, vom crea un `Tokenizer` cu un model WordPiece:
+
+```python
+from tokenizers import (
+    decoders,
+    models,
+    normalizers,
+    pre_tokenizers,
+    processors,
+    trainers,
+    Tokenizer,
+)
+
+tokenizer = Tokenizer(models.WordPiece(unk_token="[UNK]"))
+```
+
+Trebuie să specificăm `unk_token` astfel încât modelul să știe ce să returneze atunci când întâlnește caractere necunoscute. Alte argumente pe care le putem seta aici includ `vocab` al modelului nostru (vom antrena modelul, deci nu este nevoie să setăm acest lucru) și `max_input_chars_per_word`, care specifică o lungime maximă pentru fiecare cuvânt (cuvintele mai lungi decât valoarea trecută vor fi divizate).
+
+Primul pas al tokenizării este normalizarea, așa că să începem cu aceasta. Deoarece BERT este utilizat pe scară largă, există un `BertNormalizer` cu opțiunile clasice pe care le putem seta pentru BERT: `lowercase` și `strip_accents`, care se explică de la sine; `clean_text` pentru a elimina toate caracterele de control și a înlocui spațiile repetate cu unul singur; și `handle_chinese_chars`, care plasează spații în jurul caracterelor chinezești. Pentru a replica tokenizerul `bert-base-uncased`, putem seta doar acest normalizator:
+
+```python
+tokenizer.normalizer = normalizers.BertNormalizer(lowercase=True)
+```
+
+În general, atunci când construiți un nou tokenizer, nu veți avea acces la un normalizator atât de util, deja implementat în biblioteca 🤗 Tokenizers - așa că să vedem cum să creăm manual normalizatorul BERT. Biblioteca oferă un normalizator `Lowercase` și un normalizator `StripAccents` și puteți compune mai multe normalizatoare folosind un `Sequence`:
+
+```python
+tokenizer.normalizer = normalizers.Sequence(
+    [normalizers.NFD(), normalizers.Lowercase(), normalizers.StripAccents()]
+)
+```
+
+De asemenea, folosim un normalizator Unicode `NFD`, deoarece în caz contrar normalizatorul `StripAccents` nu va recunoaște corect caracterele accentuate și astfel nu le va elimina.
+
+După cum am mai văzut, putem folosi metoda `normalize_str()` a `normalizer` pentru a verifica efectele pe care le are asupra unui text dat:
+
+```python
+print(tokenizer.normalizer.normalize_str("Héllò hôw are ü?"))
+```
+
+```python out
+hello how are u?
+```
+
+<Tip>
+
+**Pentru a merge mai departe** Dacă testați cele două versiuni ale normalizatorilor anteriori pe un șir care conține caracterul Unicode `u"\u0085"` veți observa cu siguranță că acești doi normalizatori nu sunt exact echivalenți.
+Pentru a nu complica prea mult versiunea cu `normalizers.Sequence` , nu am inclus înlocuirile Regex pe care `BertNormalizer` le cere atunci când argumentul `clean_text` este setat la `True` - care este comportamentul implicit. Dar nu vă faceți griji: este posibil să obțineți exact aceeași normalizare fără a utiliza utilul `BertNormalizer` prin adăugarea a două `normalizers.Replace` la secvența normalizers.
+
+
+</Tip>
+
+Urmează etapa de pre-tokenizare. Din nou, există un `BertPreTokenizer` pre-construit pe care îl putem utiliza:
+
+```python
+tokenizer.pre_tokenizer = pre_tokenizers.BertPreTokenizer()
+```
+
+Sau îl putem construi de la zero:
+
+```python
+tokenizer.pre_tokenizer = pre_tokenizers.Whitespace()
+```
+
+Rețineți că pre-tokenizatorul `Whitespace` separă spațiul și toate caracterele care nu sunt litere, cifre sau caracterul underscore, deci tehnic separă spațiul și punctuația:
+
+```python
+tokenizer.pre_tokenizer.pre_tokenize_str("Let's test my pre-tokenizer.")
+```
+
+```python out
+[('Let', (0, 3)), ("'", (3, 4)), ('s', (4, 5)), ('test', (6, 10)), ('my', (11, 13)), ('pre', (14, 17)),
+ ('-', (17, 18)), ('tokenizer', (18, 27)), ('.', (27, 28))]
+```
+
+Dacă doriți să separați doar spațiile, ar trebui să utilizați în schimb pre-tokenizerul `WhitespaceSplit`:
+
+```python
+pre_tokenizer = pre_tokenizers.WhitespaceSplit()
+pre_tokenizer.pre_tokenize_str("Let's test my pre-tokenizer.")
+```
+
+```python out
+[("Let's", (0, 5)), ('test', (6, 10)), ('my', (11, 13)), ('pre-tokenizer.', (14, 28))]
+```
+
+Ca și în cazul normalizatorilor, puteți utiliza un `Sequence` pentru a compune mai mulți pre-tokenizeri:
+
+```python
+pre_tokenizer = pre_tokenizers.Sequence(
+    [pre_tokenizers.WhitespaceSplit(), pre_tokenizers.Punctuation()]
+)
+pre_tokenizer.pre_tokenize_str("Let's test my pre-tokenizer.")
+```
+
+```python out
+[('Let', (0, 3)), ("'", (3, 4)), ('s', (4, 5)), ('test', (6, 10)), ('my', (11, 13)), ('pre', (14, 17)),
+ ('-', (17, 18)), ('tokenizer', (18, 27)), ('.', (27, 28))]
+```
+
+Următorul pas în pipelineul de tokenizare este rularea inputurilor prin model. Am specificat deja modelul nostru în inițializare, dar mai trebuie să îl antrenăm, ceea ce va necesita un `WordPieceTrainer`. Principalul lucru de reținut atunci când inițializați un trainer în 🤗 Tokenizers este că trebuie să îi transmiteți toți tokenii speciali pe care intenționați să îi utilizați - în caz contrar, acesta nu le va adăuga la vocabular, deoarece acestea nu se află în corpusul de antrenare:
+
+```python
+special_tokens = ["[UNK]", "[PAD]", "[CLS]", "[SEP]", "[MASK]"]
+trainer = trainers.WordPieceTrainer(vocab_size=25000, special_tokens=special_tokens)
+```
+
+Pe lângă specificarea `vocab_size` și `special_tokens`, putem seta `min_frequency` (numărul de ori în care un simbol trebuie să apară pentru a fi inclus în vocabular) sau putem schimba `continuing_subword_prefix` (dacă dorim să folosim ceva diferit de `##`).
+
+Pentru a antrena modelul nostru folosind iteratorul pe care l-am definit anterior, trebuie doar să executăm această comandă:
+
+```python
+tokenizer.train_from_iterator(get_training_corpus(), trainer=trainer)
+```
+
+De asemenea, putem utiliza fișiere text pentru a ne antrena tokenizerul, care ar arăta astfel (în prealabil, reinițializăm modelul cu un `WordPiece` gol):
+
+```python
+tokenizer.model = models.WordPiece(unk_token="[UNK]")
+tokenizer.train(["wikitext-2.txt"], trainer=trainer)
+```
+
+În ambele cazuri, putem apoi testa tokenizerul pe un text prin apelarea metodei `encode()`:
+
+```python
+encoding = tokenizer.encode("Let's test this tokenizer.")
+print(encoding.tokens)
+```
+
+```python out
+['let', "'", 's', 'test', 'this', 'tok', '##eni', '##zer', '.']
+```
+
+`encoding`-ul obținut este un `Encoding`, care conține toate rezultatele necesare ale tokenizerului în diferitele sale atribute: `ids`, `type_ids`, `tokens`, `offsets`, `attention_mask`, `special_tokens_mask`, și `overflowing`.
+
+Ultimul pas în pipelineul de tokenizare este postprocesarea. Trebuie să adăugăm tokenul `[CLS]` la început și tokenul `[SEP]` la sfârșit (sau după fiecare propoziție, dacă avem o pereche de propoziții). Vom folosi un `TemplateProcessor` pentru aceasta, dar mai întâi trebuie să cunoaștem ID-urile tokenilor `[CLS]` și `[SEP]` din vocabular:
+
+```python
+cls_token_id = tokenizer.token_to_id("[CLS]")
+sep_token_id = tokenizer.token_to_id("[SEP]")
+print(cls_token_id, sep_token_id)
+```
+
+```python out
+(2, 3)
+```
+
+Pentru a scrie templateul pentru `TemplateProcessor`, trebuie să specificăm cum să tratăm o singură propoziție și o pereche de propoziții. Pentru ambele, scriem tokeni speciali pe care dorim să îi folosim; prima (sau singura) propoziție este reprezentată de `$A`, în timp ce a doua propoziție (dacă facem encoding unei perechi) este reprezentată de `$B`. Pentru fiecare dintre acestea (tokeni speciali și propoziții), specificăm și ID-ul tipului de token corespunzător după două puncte.
+
+Modelul clasic BERT este astfel definit după cum urmează:
+
+```python
+tokenizer.post_processor = processors.TemplateProcessing(
+    single=f"[CLS]:0 $A:0 [SEP]:0",
+    pair=f"[CLS]:0 $A:0 [SEP]:0 $B:1 [SEP]:1",
+    special_tokens=[("[CLS]", cls_token_id), ("[SEP]", sep_token_id)],
+)
+```
+
+Rețineți că trebuie să transmitem ID-urile tokenilor speciali, astfel încât tokenizerul să le poată converti corect în ID-urile lor.
+
+Odată ce acest lucru este adăugat, revenind la exemplul nostru anterior vom obține:
+
+```python
+encoding = tokenizer.encode("Let's test this tokenizer.")
+print(encoding.tokens)
+```
+
+```python out
+['[CLS]', 'let', "'", 's', 'test', 'this', 'tok', '##eni', '##zer', '.', '[SEP]']
+```
+
+Și pe o pereche de propoziții, obținem rezultatul corect:
+
+```python
+encoding = tokenizer.encode("Let's test this tokenizer...", "on a pair of sentences.")
+print(encoding.tokens)
+print(encoding.type_ids)
+```
+
+```python out
+['[CLS]', 'let', "'", 's', 'test', 'this', 'tok', '##eni', '##zer', '...', '[SEP]', 'on', 'a', 'pair', 'of', 'sentences', '.', '[SEP]']
+[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1]
+```
+
+Aproape am terminat de construit acest tokenizer de la zero - ultimul pas este să includem un decodor:
+
+```python
+tokenizer.decoder = decoders.WordPiece(prefix="##")
+```
+
+Haideți să-l testăm pe `encoding`-ul nostru anterior:
+
+```python
+tokenizer.decode(encoding.ids)
+```
+
+```python out
+"let's test this tokenizer... on a pair of sentences."
+```
+
+Grozav! Putem salva tokenizatorul nostru într-un singur fișier JSON, astfel:
+
+```python
+tokenizer.save("tokenizer.json")
+```
+
+Apoi putem reîncărca acel fișier într-un obiect `Tokenizer` cu metoda `from_file()`:
+
+```python
+new_tokenizer = Tokenizer.from_file("tokenizer.json")
+```
+
+Pentru a utiliza acest tokenizer în 🤗 Transformers, trebuie să îl încorporăm în `PreTrainedTokenizerFast`. Putem fie să folosim clasa generică, fie, dacă tokenizerul nostru corespunde unui model existent, să folosim clasa respectivă (aici, `BertTokenizerFast`). Dacă aplicați această lecție pentru a construi un tokenizer nou, va trebui să utilizați prima opțiune.
+
+Pentru a include tokenizatorul într-un `PreTrainedTokenizerFast`, putem fie să transmitem tokenizerul construit ca `tokenizer_object`, fie să transmitem fișierul tokenizerului salvat ca `tokenizer_file`. Cel mai important lucru de reținut este că trebuie să setăm manual toți tokenii speciali, deoarece această clasă nu poate deduce din obiectul `tokenizer` care tokne este tokenul mască, tokenul `[CLS]`, etc.:
+
+```python
+from transformers import PreTrainedTokenizerFast
+
+wrapped_tokenizer = PreTrainedTokenizerFast(
+    tokenizer_object=tokenizer,
+    # tokenizer_file="tokenizer.json", # You can load from the tokenizer file, alternatively
+    unk_token="[UNK]",
+    pad_token="[PAD]",
+    cls_token="[CLS]",
+    sep_token="[SEP]",
+    mask_token="[MASK]",
+)
+```
+
+Dacă utilizați o clasă specifică de tokenizer (cum ar fi `BertTokenizerFast`), va trebui să specificați doar tokenii speciali care sunt diferiți de cei impliciți (aici, niciunul):
+
+```python
+from transformers import BertTokenizerFast
+
+wrapped_tokenizer = BertTokenizerFast(tokenizer_object=tokenizer)
+```
+
+Apoi puteți utiliza acest tokenizer ca orice alt tokenizer 🤗 Transformers. Îl puteți salva cu metoda `save_pretrained()` sau îl puteți încărca în Hub cu metoda `push_to_hub()`.
+
+Acum că am văzut cum să construim un tokenizer WordPiece, hai să facem același lucru pentru un tokenizer BPE. Vom merge un pic mai repede, deoarece cunoașteți toți pașii, și vom evidenția doar diferențele.
+
+## Construirea unui tokenizer BPE de la zero[[building-a-bpe-tokenizer-from-scratch]]
+
+Să construim acum un tokenizer GPT-2. Ca și pentru tokenizer BERT, începem prin inițializarea unui `Tokenizer` cu un model BPE:
+
+```python
+tokenizer = Tokenizer(models.BPE())
+```
+
+De asemenea, la fel ca în cazul BERT, am putea inițializa acest model cu un vocabular, dacă am avea unul (în acest caz, ar trebui să oferim `vocab` și `merges`), dar din moment ce vom antrena de la zero, nu avem nevoie să facem acest lucru. De asemenea, nu trebuie să specificăm un `unk_token` deoarece GPT-2 utilizează BPE la nivel de bytes, care nu necesită acest lucru.
+
+GPT-2 nu utilizează un normalizator, deci sărim peste acest pas și trecem direct la pre-tokenizare:
+
+```python
+tokenizer.pre_tokenizer = pre_tokenizers.ByteLevel(add_prefix_space=False)
+```
+
+Opțiunea pe care am adăugat-o aici la `ByteLevel` nu este pentru a adăuga un spațiu unei propoziții (care este implicit în caz contrar). Putem arunca o privire la pre-tokenizarea unui text exemplu ca înainte:
+
+```python
+tokenizer.pre_tokenizer.pre_tokenize_str("Let's test pre-tokenization!")
+```
+
+```python out
+[('Let', (0, 3)), ("'s", (3, 5)), ('Ġtest', (5, 10)), ('Ġpre', (10, 14)), ('-', (14, 15)),
+ ('tokenization', (15, 27)), ('!', (27, 28))]
+```
+
+Urmează modelul, care are nevoie de antrenare. Pentru GPT-2, singurul token special este tokenul de sfârșit de text:
+
+```python
+trainer = trainers.BpeTrainer(vocab_size=25000, special_tokens=["<|endoftext|>"])
+tokenizer.train_from_iterator(get_training_corpus(), trainer=trainer)
+```
+
+Ca și în cazul `WordPieceTrainer`, precum și `vocab_size` și `special_tokens`, putem specifica `min_frequency` dacă dorim, sau dacă avem un sufix de sfârșit de cuvânt (cum ar fi `</w>`), îl putem seta cu `end_of_word_suffix`.
+
+Acest tokenizer poate fi antrenat și pe fișiere text:
+
+```python
+tokenizer.model = models.BPE()
+tokenizer.train(["wikitext-2.txt"], trainer=trainer)
+```
+
+Să aruncăm o privire la tokenizarea unui exemplu de text:
+
+```python
+encoding = tokenizer.encode("Let's test this tokenizer.")
+print(encoding.tokens)
+```
+
+```python out
+['L', 'et', "'", 's', 'Ġtest', 'Ġthis', 'Ġto', 'ken', 'izer', '.']
+```
+
+Aplicăm postprocesarea la nivel de bytes pentru tokenizerul GPT-2 după cum urmează:
+
+```python
+tokenizer.post_processor = processors.ByteLevel(trim_offsets=False)
+```
+
+Opțiunea `trim_offsets = False` indică post-procesorului că ar trebui să lăsăm offseturile tokenilor care încep cu "Ġ" așa cum sunt: în acest fel, începutul offseturilor va indica spațiul dinaintea cuvântului, nu primul caracter al cuvântului (deoarece spațiul face parte din punct de vedere tehnic din token). Să aruncăm o privire asupra rezultatului cu textul pe căruia tocmai i-am făcut encoding, unde `'Ġtest'` este tokenul de la indexul 4:
+
+```python
+sentence = "Let's test this tokenizer."
+encoding = tokenizer.encode(sentence)
+start, end = encoding.offsets[4]
+sentence[start:end]
+```
+
+```python out
+' test'
+```
+
+În cele din urmă, adăugăm un decoder la nivel de bytes:
+
+```python
+tokenizer.decoder = decoders.ByteLevel()
+```
+
+și putem verifica de două ori dacă funcționează corect:
+
+```python
+tokenizer.decode(encoding.ids)
+```
+
+```python out
+"Let's test this tokenizer."
+```
+
+Grozav! Acum că am terminat, putem salva tokenizatorul ca înainte și îl putem încorpora într-un `PreTrainedTokenizerFast` sau `GPT2TokenizerFast` dacă dorim să îl folosim în 🤗 Transformers:
+
+```python
+from transformers import PreTrainedTokenizerFast
+
+wrapped_tokenizer = PreTrainedTokenizerFast(
+    tokenizer_object=tokenizer,
+    bos_token="<|endoftext|>",
+    eos_token="<|endoftext|>",
+)
+```
+
+or:
+
+```python
+from transformers import GPT2TokenizerFast
+
+wrapped_tokenizer = GPT2TokenizerFast(tokenizer_object=tokenizer)
+```
+
+Ca un ultim exemplu, vă vom arăta cum să construiți un tokenizer Unigram de la zero.
+
+## Construirea unui tokenizer Unigram de la zero[[building-a-unigram-tokenizer-from-scratch]]
+
+Să construim acum un tokenizer XLNet. Ca și în cazul tokenizerelor anterioare, începem prin inițializarea unui `Tokenizer` cu un model Unigram:
+
+```python
+tokenizer = Tokenizer(models.Unigram())
+```
+
+Din nou, am putea inițializa acest model cu un vocabular, dacă am avea unul.
+
+Pentru normalizare, XLNet utilizează câteva înlocuiri (care provin din SentencePiece):
+
+```python
+from tokenizers import Regex
+
+tokenizer.normalizer = normalizers.Sequence(
+    [
+        normalizers.Replace("``", '"'),
+        normalizers.Replace("''", '"'),
+        normalizers.NFKD(),
+        normalizers.StripAccents(),
+        normalizers.Replace(Regex(" {2,}"), " "),
+    ]
+)
+```
+
+Acest lucru înlocuitește <code>``</code> și <code>''</code> cu <code>"</code> și orice secvență de două sau mai multe spații cu un singur spațiu, precum și ștergerea accentelor în textele ce trebuie tokenizate.
+
+Pre-tokenizerul care trebuie utilizat pentru orice tokenizer SentencePiece este `Metaspace`:
+
+```python
+tokenizer.pre_tokenizer = pre_tokenizers.Metaspace()
+```
+
+Putem arunca o privire la pre-tokenizarea unui exemplu de text ca mai înainte:
+
+```python
+tokenizer.pre_tokenizer.pre_tokenize_str("Let's test the pre-tokenizer!")
+```
+
+```python out
+[("▁Let's", (0, 5)), ('▁test', (5, 10)), ('▁the', (10, 14)), ('▁pre-tokenizer!', (14, 29))]
+```
+
+Urmează modelul, care are nevoie de antrenare. XLNet are destul de mulți tokeni speciali:
+
+```python
+special_tokens = ["<cls>", "<sep>", "<unk>", "<pad>", "<mask>", "<s>", "</s>"]
+trainer = trainers.UnigramTrainer(
+    vocab_size=25000, special_tokens=special_tokens, unk_token="<unk>"
+)
+tokenizer.train_from_iterator(get_training_corpus(), trainer=trainer)
+```
+
+Un argument foarte important care nu trebuie uitat pentru `UnigramTrainer` este `unk_token`. Putem trece și alte argumente specifice algoritmului Unigram, cum ar fi `shrinking_factor` pentru fiecare pas în care eliminăm tokeni (valoarea implicită este 0,75) sau `max_piece_length` pentru a specifica lungimea maximă a unui token dat (valoarea implicită este 16).
+
+Acest tokenizer poate fi antrenat și pe fișiere text:
+
+```python
+tokenizer.model = models.Unigram()
+tokenizer.train(["wikitext-2.txt"], trainer=trainer)
+```
+
+Să aruncăm o privire la tokenizarea unui exemplu de text:
+
+```python
+encoding = tokenizer.encode("Let's test this tokenizer.")
+print(encoding.tokens)
+```
+
+```python out
+['▁Let', "'", 's', '▁test', '▁this', '▁to', 'ken', 'izer', '.']
+```
+
+O particularitate a XLNet este că pune tokenul `<cls>` la sfârșitul propoziției, cu un ID de tip 2 (pentru a-l distinge de ceilalți tokeni). Ca urmare, este făcut padding la stânga. Putem trata toți tokenii speciali și ID-urile de tip ale tokenilor cu un template, ca în cazul BERT, dar mai întâi trebuie să obținem ID-urile tokenilor `<cls>` și `<sep>`:
+
+```python
+cls_token_id = tokenizer.token_to_id("<cls>")
+sep_token_id = tokenizer.token_to_id("<sep>")
+print(cls_token_id, sep_token_id)
+```
+
+```python out
+0 1
+```
+
+Templateul arată astfel:
+
+```python
+tokenizer.post_processor = processors.TemplateProcessing(
+    single="$A:0 <sep>:0 <cls>:2",
+    pair="$A:0 <sep>:0 $B:1 <sep>:1 <cls>:2",
+    special_tokens=[("<sep>", sep_token_id), ("<cls>", cls_token_id)],
+)
+```
+
+Și putem testa că funcționează prin codificarea unei perechi de propoziții:
+
+```python
+encoding = tokenizer.encode("Let's test this tokenizer...", "on a pair of sentences!")
+print(encoding.tokens)
+print(encoding.type_ids)
+```
+
+```python out
+['▁Let', "'", 's', '▁test', '▁this', '▁to', 'ken', 'izer', '.', '.', '.', '<sep>', '▁', 'on', '▁', 'a', '▁pair', 
+  '▁of', '▁sentence', 's', '!', '<sep>', '<cls>']
+[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2]
+```
+
+În cele din urmă, adăugăm un decoder `Metaspace`:
+
+```python
+tokenizer.decoder = decoders.Metaspace()
+```
+
+și am terminat cu acest tokenizer! Putem salva tokenizerul ca înainte și îl putem încorpora într-un `PreTrainedTokenizerFast` sau `XLNetTokenizerFast` dacă dorim să îl folosim în 🤗 Transformers. Un lucru de reținut atunci când se utilizează `PreTrainedTokenizerFast` este că, pe lângă tokenii speciali, trebuie să spunem bibliotecii 🤗 Transformers să facă padding la stânga:
+
+```python
+from transformers import PreTrainedTokenizerFast
+
+wrapped_tokenizer = PreTrainedTokenizerFast(
+    tokenizer_object=tokenizer,
+    bos_token="<s>",
+    eos_token="</s>",
+    unk_token="<unk>",
+    pad_token="<pad>",
+    cls_token="<cls>",
+    sep_token="<sep>",
+    mask_token="<mask>",
+    padding_side="left",
+)
+```
+
+Sau alternativ:
+
+```python
+from transformers import XLNetTokenizerFast
+
+wrapped_tokenizer = XLNetTokenizerFast(tokenizer_object=tokenizer)
+```
+
+Acum că ați văzut cum sunt utilizate diferitele blocuri de construcție pentru a construi tokenizeri existenți, ar trebui să puteți scrie orice tokenizer doriți cu biblioteca 🤗 Tokenizers și să îl puteți utiliza în 🤗 Transformers.
diff --git a/chapters/rum/chapter6/9.mdx b/chapters/rum/chapter6/9.mdx
new file mode 100644
index 000000000..3898e9d3a
--- /dev/null
+++ b/chapters/rum/chapter6/9.mdx
@@ -0,0 +1,16 @@
+# Tokenizeri, verificare![[tokenizers-check]]
+
+<CourseFloatingBanner
+    chapter={6}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+Bună treabă la finalizarea acestui capitol!
+
+După această scufundare adâncă în tokenizers, ar trebui să:
+
+- Să fii capabil să antrenezi un nou tokenizer folosind unul vechi ca model
+- Să înțelegi modului de utilizare a offseturilor pentru a face map tokenilor în intervalul lor original de text
+- Cunoști diferențele dintre BPE, WordPiece și Unigram
+- Fii capabil să combini blocurile furnizate de biblioteca 🤗 Tokenizers pentru a vă construi propriul tokenizer
+- Să poți folosi acest tokenizer în cadrul bibliotecii 🤗 Transformers

From d483391508d515d26150eb56a2662828d902e8bc Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Tue, 27 May 2025 21:50:49 +0300
Subject: [PATCH 124/167] fix: remove unnecessary content

---
 .codegpt/head                 |    1 -
 .gitignore                    |    2 -
 chapters/ro/_toctree.yml      |   28 -
 chapters/ro/chapter0/1.mdx    |  110 ---
 chapters/ro/chapter2/1.mdx    |   28 -
 chapters/ro/chapter2/2.mdx    |  364 ----------
 chapters/ro/chapter2/3.mdx    |  235 -------
 chapters/ro/chapter2/4.mdx    |  246 -------
 chapters/ro/chapter2/5.mdx    |  338 ---------
 chapters/ro/chapter2/6.mdx    |  164 -----
 chapters/ro/chapter2/7.mdx    |   19 -
 chapters/ro/chapter2/8.mdx    |  310 ---------
 chapters/ro/chapter3/1.mdx    |   25 -
 chapters/ro/chapter3/2.mdx    |  393 -----------
 chapters/ro/chapter3/3.mdx    |  174 -----
 chapters/ro/chapter3/3_tf.mdx |  206 ------
 chapters/ro/chapter3/4.mdx    |  361 ----------
 chapters/ro/chapter3/5.mdx    |   26 -
 chapters/ro/chapter3/6.mdx    |  301 --------
 chapters/ro/chapter4/1.mdx    |   22 -
 chapters/ro/chapter4/2.mdx    |   98 ---
 chapters/ro/chapter4/3.mdx    |  641 ------------------
 chapters/ro/chapter4/4.mdx    |   88 ---
 chapters/ro/chapter4/5.mdx    |   12 -
 chapters/ro/chapter4/6.mdx    |  233 -------
 chapters/ro/chapter6/1.mdx    |   19 -
 chapters/ro/chapter6/10.mdx   |  283 --------
 chapters/ro/chapter6/2.mdx    |  257 -------
 chapters/ro/chapter6/3.mdx    |  473 -------------
 chapters/ro/chapter6/3b.mdx   |  643 ------------------
 chapters/ro/chapter6/4.mdx    |  122 ----
 chapters/ro/chapter6/5.mdx    |  360 ----------
 chapters/ro/chapter6/6.mdx    |  375 ----------
 chapters/ro/chapter6/7.mdx    |  381 -----------
 chapters/ro/chapter6/8.mdx    |  566 ----------------
 chapters/ro/chapter6/9.mdx    |   16 -
 chapters/ro/chapter7/1.mdx    |   38 --
 chapters/ro/chapter7/2.mdx    |  983 ---------------------------
 chapters/ro/chapter7/3.mdx    | 1043 ----------------------------
 chapters/ro/chapter7/4.mdx    | 1001 ---------------------------
 chapters/ro/chapter7/5.mdx    | 1074 -----------------------------
 chapters/ro/chapter7/6.mdx    |  914 -------------------------
 chapters/ro/chapter7/7.mdx    | 1206 ---------------------------------
 chapters/ro/chapter7/8.mdx    |   22 -
 chapters/ro/chapter7/9.mdx    |  329 ---------
 45 files changed, 14530 deletions(-)
 delete mode 100644 .codegpt/head
 delete mode 100644 chapters/ro/_toctree.yml
 delete mode 100644 chapters/ro/chapter0/1.mdx
 delete mode 100644 chapters/ro/chapter2/1.mdx
 delete mode 100644 chapters/ro/chapter2/2.mdx
 delete mode 100644 chapters/ro/chapter2/3.mdx
 delete mode 100644 chapters/ro/chapter2/4.mdx
 delete mode 100644 chapters/ro/chapter2/5.mdx
 delete mode 100644 chapters/ro/chapter2/6.mdx
 delete mode 100644 chapters/ro/chapter2/7.mdx
 delete mode 100644 chapters/ro/chapter2/8.mdx
 delete mode 100644 chapters/ro/chapter3/1.mdx
 delete mode 100644 chapters/ro/chapter3/2.mdx
 delete mode 100644 chapters/ro/chapter3/3.mdx
 delete mode 100644 chapters/ro/chapter3/3_tf.mdx
 delete mode 100644 chapters/ro/chapter3/4.mdx
 delete mode 100644 chapters/ro/chapter3/5.mdx
 delete mode 100644 chapters/ro/chapter3/6.mdx
 delete mode 100644 chapters/ro/chapter4/1.mdx
 delete mode 100644 chapters/ro/chapter4/2.mdx
 delete mode 100644 chapters/ro/chapter4/3.mdx
 delete mode 100644 chapters/ro/chapter4/4.mdx
 delete mode 100644 chapters/ro/chapter4/5.mdx
 delete mode 100644 chapters/ro/chapter4/6.mdx
 delete mode 100644 chapters/ro/chapter6/1.mdx
 delete mode 100644 chapters/ro/chapter6/10.mdx
 delete mode 100644 chapters/ro/chapter6/2.mdx
 delete mode 100644 chapters/ro/chapter6/3.mdx
 delete mode 100644 chapters/ro/chapter6/3b.mdx
 delete mode 100644 chapters/ro/chapter6/4.mdx
 delete mode 100644 chapters/ro/chapter6/5.mdx
 delete mode 100644 chapters/ro/chapter6/6.mdx
 delete mode 100644 chapters/ro/chapter6/7.mdx
 delete mode 100644 chapters/ro/chapter6/8.mdx
 delete mode 100644 chapters/ro/chapter6/9.mdx
 delete mode 100644 chapters/ro/chapter7/1.mdx
 delete mode 100644 chapters/ro/chapter7/2.mdx
 delete mode 100644 chapters/ro/chapter7/3.mdx
 delete mode 100644 chapters/ro/chapter7/4.mdx
 delete mode 100644 chapters/ro/chapter7/5.mdx
 delete mode 100644 chapters/ro/chapter7/6.mdx
 delete mode 100644 chapters/ro/chapter7/7.mdx
 delete mode 100644 chapters/ro/chapter7/8.mdx
 delete mode 100644 chapters/ro/chapter7/9.mdx

diff --git a/.codegpt/head b/.codegpt/head
deleted file mode 100644
index 61e0708bd..000000000
--- a/.codegpt/head
+++ /dev/null
@@ -1 +0,0 @@
-d92002a2-d67d-44e7-9370-14bf913c3669
\ No newline at end of file
diff --git a/.gitignore b/.gitignore
index fa8e74203..a1d21056b 100644
--- a/.gitignore
+++ b/.gitignore
@@ -82,5 +82,3 @@ nbs/
 __pycache__/
 .cache/
 
-
-.codegpt
\ No newline at end of file
diff --git a/chapters/ro/_toctree.yml b/chapters/ro/_toctree.yml
deleted file mode 100644
index 25730606c..000000000
--- a/chapters/ro/_toctree.yml
+++ /dev/null
@@ -1,28 +0,0 @@
-- title: 0. Configurare
-  sections:
-  - local: chapter0/1
-    title: Introducere
-
-- title: 1. Modele Transformer
-  sections:
-  - local: chapter1/1
-    title: Introducere
-  - local: chapter1/2
-    title: Procesarea limbajului natural și modelele de limbaj mari
-  - local: chapter1/3
-    title: Transformers, ce pot face?
-  - local: chapter1/4
-    title: Cum funcționează Transformers?
-  - local: chapter1/5
-    title: Modele Encoder
-  - local: chapter1/6
-    title: Modele Decoder
-  - local: chapter1/7
-    title: Modele secvență-la-secvență
-  - local: chapter1/8
-    title: Prejudecăți și limitări
-  - local: chapter1/9
-    title: Rezumat
-  - local: chapter1/10
-    title: Quiz de final de capitol
-    quiz: 1
diff --git a/chapters/ro/chapter0/1.mdx b/chapters/ro/chapter0/1.mdx
deleted file mode 100644
index c7c072707..000000000
--- a/chapters/ro/chapter0/1.mdx
+++ /dev/null
@@ -1,110 +0,0 @@
-# Introducere[[introducere]]
-
-Bun venit la cursul Hugging Face! Această introducere te va ghida în configurarea environment-ului de lucru. Dacă abia începi cursul, îți recomandăm să arunci o privire mai întâi asupra [Capitolului 1](/course/chapter1), apoi să te întorci și să îți configurezi environment-ul pentru a putea încerca singur codul.
-
-Toate bibliotecile pe care le vom folosi în acest curs sunt disponibile ca Python packages, așa că aici îți vom arăta cum să configurezi Python environment-ul și să instalezi librăriile specifice de care ai nevoie.
-
-Vom acoperi două moduri de a-ți configura environment-ul, folosind un notebook Colab sau un Python environment. Simte-te liber să alegi pe cel care ți se potrivește cel mai bine. Pentru începători, recomandăm să începi folosind un notebook Colab.
-
-Reține că nu vom acoperi sistemul Windows. Dacă folosești Windows, îți recomandăm să urmezi pașii folosind un notebook Colab. Dacă folosești o distribuție Linux sau macOS, poți folosi oricare dintre abordările descrise aici.
-
-Majoritatea cursului se bazează pe faptul că ai un cont Hugging Face. Îți recomandăm să creezi unul acum: [crează un cont](https://huggingface.co/join).
-
-## Folosirea unui notebook Google Colab[[folosind-un-notebook-google-colab]]
-
-Folosirea unui notebook Colab este cea mai simplă configurare posibilă; deschide un notebook în browserul tău și începe imediat să scrii cod!
-
-Dacă nu ești familiarizat cu Colab, îți recomandăm să începi urmând [introducerea](https://colab.research.google.com/notebooks/intro.ipynb). Colab îți permite să folosești hardware accelerat, cum ar fi GPU-uri sau TPU-uri, și este gratuit pentru sarcini mai mici.
-
-Odată ce ești confortabil să te descurci în Colab, creează un nou notebook și începe cu configurarea:
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter0/new_colab.png" alt="Un notebook Colab gol" width="80%"/>
-</div>
-
-Următorul pas este să instalezi librăriile pe care le vom folosi în acest curs. Vom folosi `pip` pentru instalare, care este managerul de packages pentru Python. În notebook-uri, poți rula comenzi de sistem începând comanda cu caracterul `!`, așa că poți instala librăria 🤗 Transformers astfel:
-
-```
-!pip install transformers
-```
-
-Te poți asigura că pachetul a fost instalat corect importându-l în cadrul mediului tău Python:
-
-```
-import transformers
-```
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter0/install.gif" alt="O animație care arată rezultatul celor două comenzi de mai sus: instalare și importarea" width="80%"/>
-</div>
-
-Aceasta instalează o versiune foarte ușoară a 🤗 Transformers. În special, nu sunt instalate framework-uri specifice de machine learning (cum ar fi PyTorch sau TensorFlow). Deoarece vom folosi multe caracteristici diferite ale librăriei, îți recomandăm să instalezi versiunea pentru development, care vine cu toate dependențele necesare pentru cam orice caz de utilizare imaginabil:
-
-```
-!pip install transformers[sentencepiece]
-```
-
-Aceasta va dura puțin timp, dar apoi vei fi gata de drum pentru restul cursului!
-
-## Folosirea unui virtual environment Python[[folosirea-unui-virtual-environment-python]]
-
-Dacă preferi să folosești un mediu virtual Python, primul pas este să instalezi Python pe sistemul tău. Îți recomandăm să urmezi [această ghidare](https://realpython.com/installing-python/) pentru a începe.
-
-Odată ce ai Python instalat, ar trebui să poți rula comenzi Python în terminalul tău. Poți începe rulând următoarea comandă pentru a te asigura că este instalat corect înainte de a trece la pașii următori: `python --version`. Aceasta ar trebui să afișeze versiunea Python disponibilă acum pe sistemul tău.
-
-Când rulezi o comandă Python în terminalul tău, cum ar fi `python --version`, ar trebui să te gândești la programul care rulează comanda ta ca la Python-ul "principal" de pe sistemul tău. Îți recomandăm să păstrezi această instalare principală liberă de orice pachete și să o folosești pentru a crea environment-uri separate pentru fiecare aplicație pe care lucrezi — în acest fel, fiecare aplicație poate avea propriile sale dependențe și pachete, și nu va trebui să te preocupi de problemele de compatibilitate potențiale cu alte aplicații.
-
-În Python, acest lucru se face prin [*virtual environments*](https://docs.python.org/3/tutorial/venv.html), care sunt directory trees autonomi ce conțin fiecare o instalare Python cu o anumită versiune Python împreună cu toate pachetele de care are nevoie aplicația. Crearea unui astfel de mediu virtual poate fi realizată cu mai multe instrumente diferite, dar vom folosi pachetul oficial Python pentru acest scop, denumit [`venv`](https://docs.python.org/3/library/venv.html#module-venv).
-
-În primul rând, creează folder în care dorești ca aplicația ta să locuiască — de exemplu, ai putea dori să faci un nou folder numit *transformers-course* în rădăcina folderului tău personal:
-
-```
-mkdir ~/transformers-course
-cd ~/transformers-course
-```
-
-Din interiorul acestui folder, creează un virtual environment folosind modulul Python `venv`:
-
-```
-python -m venv .env
-```
-
-Acum ar trebui să ai un folder numit *.env* în folderul tău altfel gol:
-
-```
-ls -a
-```
-
-```out
-.      ..    .env
-```
-
-Poți să intri și să ieși din environment folosind comenzile `activate` și `deactivate`:
-
-```
-# Activează mediul virtual
-source .env/bin/activate
-
-# Dezactivează virtual environment-ul
-deactivate
-```
-
-Te poți asigura că environment-ul este activat rulând comanda `which python`: dacă aceasta indică către virtual environment, atunci l-ai activat cu succes!
-
-```
-which python
-```
-
-```out
-/home/<user>/transformers-course/.env/bin/python
-```
-
-### Instalarea dependențelor[[instalarea-dependențelor]]
-
-La fel ca în secțiunea anterioară despre utilizarea instanțelor Google Colab, acum va trebui să instalezi pachetele necesare pentru a continua. Din nou, poți instala versiunea pentru development a 🤗 Transformers folosind managerul de pachete `pip`:
-
-```
-pip install "transformers[sentencepiece]"
-```
-
-Acum ești gata să începi!
\ No newline at end of file
diff --git a/chapters/ro/chapter2/1.mdx b/chapters/ro/chapter2/1.mdx
deleted file mode 100644
index 75093a9f9..000000000
--- a/chapters/ro/chapter2/1.mdx
+++ /dev/null
@@ -1,28 +0,0 @@
-# Introducere[[introducere]]
-
-<CourseFloatingBanner
-    chapter={2}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-După cum ați văzut în [Capitolul 1](/course/chapter1), modelele Transformer sunt de obicei foarte voluminoase. Fiind alcătuite din milioane până la zeci de *miliarde* de parametri, instruirea și implementarea acestor modele este o sarcină complicată. În plus, cu noi modele lansate aproape zilnic și fiecare având propria sa implementare, testarea tuturor acestora nu este o sarcină ușoară.
-
-Biblioteca 🤗 Transformers a fost creată pentru a rezolva această problemă. Scopul său este de a oferi un singur API prin care orice model Transformer poate fi încărcat, instruit și salvat. Principalele caracteristici ale bibliotecii sunt:
-
-- ** Simplitate în utilizare**: Descărcarea, încărcarea și utilizarea unui model NLP de ultimă generație pentru inferență pot fi realizate în doar două linii de cod.
-- **Flexibilitate**: În esența lor, toate modelele sunt simple clase PyTorch `nn.Module` sau TensorFlow `tf.keras.Model` și pot fi manipulate ca orice alte modele în framework-urile lor respective de învățare automată (ML).
-- **Simplitate**: Aproape că nu se fac abstractizări în întreaga bibliotecă. „All in one file” este un concept de bază: trecerea înainte a unui model este definită în întregime într-un singur fișier, astfel încât codul în sine să fie ușor de înțeles și hackable.
-
-Această ultimă caracteristică face 🤗 Transformers destul de diferit de alte biblioteci ML. Modelele nu sunt construite pe module 
-care sunt partajate între fișiere; în schimb, fiecare model are propriile sale straturi. În plus, pe lângă faptul că modelele sunt mai ușor de abordat și de înțeles, acest lucru vă permite să experimentați cu ușurință pe un model fără a le afecta pe celelalte.
-
-Acest capitol va începe cu un exemplu end-to-end în care folosim împreună un model și un tokenizer pentru a replica funcția `pipeline()` introdusă în [Capitolul 1](/course/chapter1). În continuare, vom discuta despre API-ul modelului: vom analiza clasele de model și de configurare și vă vom arăta cum să încărcați un model și cum acesta procesează intrările numerice pentru a genera predicții. 
-
-Apoi vom analiza API-ul tokenizer, care este cealaltă componentă principală a funcției `pipeline()`. Tokenizerii se ocupă de prima și ultima etapă de procesare, gestionând conversia de la text la intrări numerice pentru rețeaua neuronală și conversia înapoi la text atunci când este necesar. În cele din urmă, vă vom arăta cum să vă ocupați de trimiterea mai multor propoziții printr-un model în cadrul unui lot pregătit, apoi vom încheia totul cu o examinare mai atentă a funcției  `tokenizer()`.
-
-
-<Tip>
-⚠️  
-Pentru a beneficia de toate funcțiile disponibile cu Model Hub și 🤗 Transformers, vă recomandăm <a href="https://huggingface.co/join">să vă creați un cont</a>.
-
-</Tip>
\ No newline at end of file
diff --git a/chapters/ro/chapter2/2.mdx b/chapters/ro/chapter2/2.mdx
deleted file mode 100644
index b0f1c4855..000000000
--- a/chapters/ro/chapter2/2.mdx
+++ /dev/null
@@ -1,364 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# În spatele pipeline-ului[[în-spatele-pipeline-ului]]
-
-{#if fw === 'pt'}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section2_pt.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section2_pt.ipynb"},
-]} />
-
-{:else}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section2_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section2_tf.ipynb"},
-]} />
-
-{/if}
-
-<Tip>
- 
-Aceasta este prima secțiune în care conținutul este ușor diferit în funcție de utilizarea PyTorch sau TensorFlow. Schimbați comutatorul din partea de sus a titlului pentru a selecta platforma pe care o preferați!
-</Tip>
-
-{#if fw === 'pt'}
-<Youtube id="1pedAIvTWXk"/>
-{:else}
-<Youtube id="wVN12smEvqg"/>
-{/if}
-
-Să începem cu un exemplu complet, aruncând o privire la ceea ce s-a întâmplat în spate atunci când am executat următorul cod în [Capitolul 1](/curs/capitol1):
-
-
-```python
-from transformers import pipeline
-
-classifier = pipeline("sentiment-analysis")
-classifier(
-    [
-        "I've been waiting for a HuggingFace course my whole life.",
-        "I hate this so much!",
-    ]
-)
-```
-
-și am obținut:
-
-```python out
-[{'label': 'POSITIVE', 'score': 0.9598047137260437},
- {'label': 'NEGATIVE', 'score': 0.9994558095932007}]
-```
-
-După cum am văzut în [Capitolul 1](/course/chapter1), acest pipeline grupează trei etape: preprocesarea, trecerea intrărilor prin model și postprocesarea:
-
-<div class="flex justify-center">
-<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/full_nlp_pipeline.svg" alt="The full NLP pipeline: tokenization of text, conversion to IDs, and inference through the Transformer model and the model head."/>
-<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/full_nlp_pipeline-dark.svg" alt="The full NLP pipeline: tokenization of text, conversion to IDs, and inference through the Transformer model and the model head."/>
-</div>
-
-Să trecem rapid prin fiecare dintre acestea.
-
-## Preprocesarea cu un tokenizator[[preprocesarea-cu-un-tokenizerator]]
-
-La fel ca alte rețele neuronale, modelele Transformer nu pot procesa direct text brut, astfel încât primul pas al pipeline-ului nostru este de a converti intrările de text în numere pe care modelul le poate înțelege. Pentru a face acest lucru, folosim un *tokenizer*, care va fi responsabil pentru:
-
-- Împărțirea datelor de intrare în cuvinte, părți de cuvinte sau simboluri (cum ar fi punctuația) care se numesc *tokens*
-- Maparea fiecărui token într-un număr întreg
-- Adăugarea de intrări suplimentare care pot fi utile pentru model
-
-Toată această preprocesare trebuie efectuată exact în același mod ca atunci când modelul a fost preinstruit, așa că mai întâi trebuie să descărcăm aceste informații din [Model Hub] (https://huggingface.co/models). Pentru a face acest lucru, folosim clasa `AutoTokenizer` și metoda sa `from_pretrained()`. Folosind numele checkpoint-ului modelului nostru, aceasta va prelua automat datele asociate cu tokenizer-ul modelului și le va stoca în cache (astfel încât acestea să fie descărcate doar prima dată când executați codul de mai jos).
-
-Deoarece punctul de control implicit al pipeline-ului `sentiment-analysis` este `distilbert-base-uncased-finetuned-sst-2-english` (puteți vedea fișa modelului [aici](https://huggingface.co/distilbert-base-uncased-finetuned-sst-2-english)), executăm următoarele:
-
-```python
-from transformers import AutoTokenizer
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-```
-
-Odată ce avem tokenizatorul, putem să îi transmitem direct propozițiile noastre și vom primi înapoi un dicționar care este gata să fie introdus în modelul nostru! Singurul lucru rămas de făcut este să convertim lista de ID-uri de intrare în tensori.
-
-Puteți utiliza 🤗 Transformers fără a trebui să vă faceți griji cu privire la cadrul ML utilizat ca backend; ar putea fi PyTorch sau TensorFlow, sau Flax pentru unele modele. Cu toate acestea, modelele Transformer acceptă numai *tensori * ca intrare. Dacă este prima dată când auziți despre tensori, vă puteți gândi la ei ca la matrici NumPy. Un array NumPy poate fi un scalar (0D), un vector (1D), o matrice (2D) sau poate avea mai multe dimensiuni. Este de fapt un tensor; tensorii altor cadre ML se comportă similar și sunt de obicei la fel de simplu de instanțiat ca și array-urile NumPy.
-
-Pentru a specifica tipul de tensori pe care dorim să îi primim înapoi (PyTorch, TensorFlow sau NumPy simplu), folosim argumentul `return_tensors`:
-
-
-{#if fw === 'pt'}
-```python
-raw_inputs = [
-    "I've been waiting for a HuggingFace course my whole life.",
-    "I hate this so much!",
-]
-inputs = tokenizer(raw_inputs, padding=True, truncation=True, return_tensors="pt")
-print(inputs)
-```
-{:else}
-```python
-raw_inputs = [
-    "I've been waiting for a HuggingFace course my whole life.",
-    "I hate this so much!",
-]
-inputs = tokenizer(raw_inputs, padding=True, truncation=True, return_tensors="tf")
-print(inputs)
-```
-{/if}
-
- 
-Nu vă faceți încă griji cu privire la padding și trunchiere; le vom explica mai târziu. Principalele lucruri de reținut aici sunt că puteți trece o propoziție sau o listă de propoziții, precum și specificarea tipului de tensori pe care doriți să îi primiți înapoi (dacă nu este trecut niciun tip, veți primi o listă de liste ca rezultat)
-{#if fw === 'pt'}
-
-Iată cum arată rezultatele ca tensori PyTorch:
-
-```python out
-{
-    'input_ids': tensor([
-        [  101,  1045,  1005,  2310,  2042,  3403,  2005,  1037, 17662, 12172, 2607,  2026,  2878,  2166,  1012,   102],
-        [  101,  1045,  5223,  2023,  2061,  2172,   999,   102,     0,     0,     0,     0,     0,     0,     0,     0]
-    ]), 
-    'attention_mask': tensor([
-        [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
-        [1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0]
-    ])
-}
-```
-{:else}
-
-Iată cum arată rezultatele ca tensori TensorFlow:
-
-```python out
-{
-    'input_ids': <tf.Tensor: shape=(2, 16), dtype=int32, numpy=
-        array([
-            [  101,  1045,  1005,  2310,  2042,  3403,  2005,  1037, 17662, 12172,  2607,  2026,  2878,  2166,  1012,   102],
-            [  101,  1045,  5223,  2023,  2061,  2172,   999,   102,     0,     0,     0,     0,     0,     0,     0,     0]
-        ], dtype=int32)>, 
-    'attention_mask': <tf.Tensor: shape=(2, 16), dtype=int32, numpy=
-        array([
-            [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
-            [1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0]
-        ], dtype=int32)>
-}
-```
-{/if}
-
- 
-Rezultatul în sine este un dicționar care conține două chei, `input_ids` și `attention_mask`. `input_ids` conține două rânduri de numere întregi (unul pentru fiecare propoziție) care sunt identificatorii unici ai simbolurilor din fiecare propoziție. Vom explica ce este `attention_mask` mai târziu în acest capitol. 
-
-## Parcurgerea modelului[[parcurgerea-modelului]]
-
-{#if fw === 'pt'}
-Putem descărca modelul nostru preinstruit în același mod în care am făcut-o cu tokenizatorul nostru. 🤗 Transformers oferă o clasă `AutoModel` care are și o metodă `from_pretrained()`:
-
-```python
-from transformers import AutoModel
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-model = AutoModel.from_pretrained(checkpoint)
-```
-{:else}
- 
-Putem descărca modelul nostru preinstruit în același mod în care am făcut-o cu tokenizatorul nostru. 🤗 Transformers oferă o clasă `TFAutoModel` care are și o metodă `from_pretrained`:
-
-```python
-from transformers import TFAutoModel
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-model = TFAutoModel.from_pretrained(checkpoint)
-```
-{/if}
-
- 
-În acest fragment de cod, am descărcat același checkpoint pe care l-am folosit anterior în pipeline-ul nostru (de fapt, ar fi trebuit să fie deja în cache) și am instanțiat un model cu acesta.
-
-Această arhitectură conține doar modulul Transformer de bază: având în vedere anumite intrări, acesta produce ceea ce vom numi *stări ascunse*, cunoscute și ca *caracteristici*. Pentru fiecare intrare a modelului, vom extrage un vector înalt-dimensional care reprezintă **înțelegerea contextuală a intrării respective de către modelul Transformer**.
-
-Dacă acest lucru nu are sens, nu vă faceți griji. Vom explica totul mai târziu.
-
-Deși aceste stări ascunse pot fi utile pe cont propriu, ele sunt de obicei intrări pentru o altă parte a modelului, cunoscută sub numele de *head*. În [Capitolul 1](/curs/capitol1), diferitele sarcini ar fi putut fi efectuate cu aceeași arhitectură, dar fiecăreia dintre aceste sarcini îi va fi asociat un head diferit.
-
-### Un vector multidimensional?[[un-vector-multidimensional]]
-
- 
-Vectorul emis de modulul Transformator este de obicei de dimensiuni mari. Acesta are în general trei dimensiuni:
-
-- **Dimensiunea lotului**: Numărul de secvențe prelucrate simultan (2 în exemplul nostru).
-- **Lungimea secvenței**: Lungimea reprezentării numerice a secvenței (16 în exemplul nostru).
-- **Dimensiunea ascunsă**: Dimensiunea vectorială a fiecărei intrări a modelului.
-
-Se spune că este multidimensional din cauza ultimei valori. Dimensiunea ascunsă poate fi foarte mare (768 este comună pentru modelele mai mici, iar în modelele mai mari aceasta poate ajunge la 3072 sau mai mult).
-
-Putem vedea acest lucru dacă introducem în modelul nostru intrările pe care le-am preprocesat:
-
-{#if fw === 'pt'}
-```python
-outputs = model(**inputs)
-print(outputs.last_hidden_state.shape)
-```
-
-```python out
-torch.Size([2, 16, 768])
-```
-{:else}
-```py
-outputs = model(inputs)
-print(outputs.last_hidden_state.shape)
-```
-
-```python out
-(2, 16, 768)
-```
-{/if}
-
- 
-Rețineți că ieșirile modelelor 🤗 Transformers se comportă ca `namedtuple`s sau dicționare. Puteți accesa elementele prin atribute (așa cum am făcut noi) sau prin cheie (`outputs[„last_hidden_state”]`), sau chiar prin index dacă știți exact unde se află lucrul pe care îl căutați (`outputs[0]`).
-
-### Modele de head-uri: Înțelegerea numerelor[modele-de-head-uri-înțelegerea-numerelor]]
-
-Head-urile modelelor iau ca intrare vectorul multidimensional al stărilor ascunse și le proiectează pe o altă dimensiune. Acestea sunt de obicei compuse din unul sau câteva straturi liniare:
-
-<div class="flex justify-center">
-<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/transformer_and_head.svg" alt="A Transformer network alongside its head."/>
-<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/transformer_and_head-dark.svg" alt="A Transformer network alongside its head."/>
-</div>
-
- 
-Rezultatul modelului Transformer este trimis direct la head-ul modelului pentru a fi prelucrat.
-
-În această diagramă, modelul este reprezentat de stratul său de încorporare și de straturile următoare. Stratul de încorporare convertește fiecare ID de intrare din intrarea tokenizată într-un vector care reprezintă tokenul asociat. Straturile ulterioare manipulează acești vectori folosind mecanismul de atenție pentru a produce reprezentarea finală a propozițiilor.
-
-Există multe arhitecturi diferite disponibile în 🤗 Transformers, fiecare fiind concepută în jurul abordării unei sarcini specifice. Iată o listă neexhaustivă:
-
-- `*Model` (extragerea stărilor ascunse)
-- `*ForCausalLM`
-- `*ForMaskedLM`
-- `*ForMultipleChoice`
-- `*ForQuestionAnswering`
-- `*ForSequenceClassification`
-- `*ForTokenClassification`
-- și altele 🤗
-
-{#if fw === 'pt'}
- Pentru exemplul nostru, vom avea nevoie de un model cu un head de clasificare a secvențelor (pentru a putea clasifica propozițiile ca fiind pozitive sau negative). Așadar, nu vom utiliza clasa `AutoModel`, ci `AutoModelForSequenceClassification`:
-
-```python
-from transformers import AutoModelForSequenceClassification
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
-outputs = model(**inputs)
-```
-{:else}
- Pentru exemplul nostru, vom avea nevoie de un model cu un head de clasificare a secvențelor (pentru a putea clasifica propozițiile ca fiind pozitive sau negative). Așadar, nu vom utiliza clasa `TFAutoModel`, ci `TFAutoModelForSequenceClassification`:
-
-```python
-from transformers import TFAutoModelForSequenceClassification
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint)
-outputs = model(inputs)
-```
-{/if}
- 
-Acum, dacă ne uităm la forma ieșirilor noastre, dimensiunea va fi mult mai mică: head-ul modelului ia ca intrare vectorii multidimensionali pe care i-am văzut înainte și scoate vectori care conțin două valori (una pentru fiecare etichetă):
-
-```python
-print(outputs.logits.shape)
-```
-
-{#if fw === 'pt'}
-```python out
-torch.Size([2, 2])
-```
-{:else}
-```python out
-(2, 2)
-```
-{/if}
-
- 
-Deoarece avem doar două propoziții și două etichete, rezultatul pe care îl obținem din modelul nostru este de forma 2 x 2.
-
-## Postprocesarea rezultatului[[postprocesarea-rezultatului]]
-
-Valorile pe care le obținem ca rezultat al modelului nostru nu au neapărat sens în sine. Să aruncăm o privire:
-
-```python
-print(outputs.logits)
-```
-
-{#if fw === 'pt'}
-```python out
-tensor([[-1.5607,  1.6123],
-        [ 4.1692, -3.3464]], grad_fn=<AddmmBackward>)
-```
-{:else}
-```python out
-<tf.Tensor: shape=(2, 2), dtype=float32, numpy=
-    array([[-1.5606991,  1.6122842],
-           [ 4.169231 , -3.3464472]], dtype=float32)>
-```
-{/if}
-
-Modelul nostru a prezis `[-1.5607, 1.6123]` pentru prima propoziție și `[ 4.1692, -3.3464]` pentru cea de-a doua. Acestea nu sunt probabilități, ci *logits*, scorurile brute, nenormalizate, emise de ultimul strat al modelului. Pentru a fi convertite în probabilități, acestea trebuie să treacă printr-un strat [SoftMax](https://en.wikipedia.org/wiki/Softmax_function) (toate modelele 🤗 Transformers produc logits, deoarece funcția de pierdere pentru formare va fuziona în general ultima funcție de activare, cum ar fi SoftMax, cu funcția de pierdere reală, cum ar fi entropia încrucișată):
-
-{#if fw === 'pt'}
-```py
-import torch
-
-predictions = torch.nn.functional.softmax(outputs.logits, dim=-1)
-print(predictions)
-```
-{:else}
-```py
-import tensorflow as tf
-
-predictions = tf.math.softmax(outputs.logits, axis=-1)
-print(predictions)
-```
-{/if}
-
-{#if fw === 'pt'}
-```python out
-tensor([[4.0195e-02, 9.5980e-01],
-        [9.9946e-01, 5.4418e-04]], grad_fn=<SoftmaxBackward>)
-```
-{:else}
-```python out
-tf.Tensor(
-[[4.01951671e-02 9.59804833e-01]
- [9.9945587e-01 5.4418424e-04]], shape=(2, 2), dtype=float32)
-```
-{/if}
-
- 
-Acum putem vedea că modelul a prezis `[0.0402, 0.9598]` pentru prima propoziție și `[0.9995, 0.0005]` pentru cea de-a doua. Acestea sunt scoruri de probabilitate care pot fi recunoscute.
-
-Pentru a obține etichetele corespunzătoare fiecărei poziții, putem inspecta atributul `id2label` din configurația modelului (mai multe despre acest lucru în secțiunea următoare):
-
-```python
-model.config.id2label
-```
-
-```python out
-{0: 'NEGATIVE', 1: 'POSITIVE'}
-```
-Acum putem concluziona că modelul a prezis următoarele:
- 
-- Prima propoziție: NEGATIV: 0,0402, POZITIV: 0,9598
-- A doua propoziție: NEGATIVĂ: 0,9995, POZITIVĂ: 0,0005
-
-Am reprodus cu succes cele trei etape ale pipeline-ului: preprocesarea cu tokenizere, trecerea intrărilor prin model și postprocesarea! Acum haideți să analizăm în profunzime fiecare dintre aceste etape.
-
-<Tip>
-
-✏️  
-** Încercați!** Alegeți două (sau mai multe) texte proprii și treceți-le prin conducta `sentiment-analysis`. Apoi repetați pașii pe care i-ați văzut aici și verificați dacă obțineți aceleași rezultate!
-
-</Tip>
diff --git a/chapters/ro/chapter2/3.mdx b/chapters/ro/chapter2/3.mdx
deleted file mode 100644
index e0f0758df..000000000
--- a/chapters/ro/chapter2/3.mdx
+++ /dev/null
@@ -1,235 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Modele[[modele]]
-
-{#if fw === 'pt'}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section3_pt.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section3_pt.ipynb"},
-]} />
-
-{:else}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section3_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section3_tf.ipynb"},
-]} />
-
-{/if}
-
-{#if fw === 'pt'}
-<Youtube id="AhChOFRegn4"/>
-{:else}
-<Youtube id="d3JVgghSOew"/>
-{/if}
-
-{#if fw === 'pt'}
- 
-În această secțiune vom analiza mai detaliat crearea și utilizarea unui model. Vom folosi clasa `AutoModel`, care este utilă atunci când doriți să instanțiați orice model dintr-un checkpoint.
-
-Clasa `AutoModel` și toate celelalte clase înrudite sunt, de fapt, simple wrappere ale gamei largi de modele disponibile în bibliotecă. Este un wrapper inteligent, deoarece poate ghici automat arhitectura modelului corespunzător pentru checkpoint-ul dumneavoastră și apoi instanțiază un model cu această arhitectură.
-
-{:else}
- 
-În această secțiune vom analiza mai detaliat crearea și utilizarea unui model. Vom utiliza clasa `TFAutoModel`, care este utilă atunci când doriți să instanțați un model dintr-un checkpoint.
-
-Clasa `TFAutoModel` și toate clasele înrudite cu aceasta sunt de fapt simple wrappere ale gamei largi de modele disponibile în bibliotecă. Este un wrapper inteligent, deoarece poate ghici automat arhitectura modelului corespunzător pentru checkpoint-ul dumneavoastră și apoi instanțiază un model cu această arhitectură.
-
-{/if}
-
-Cu toate acestea, dacă știți ce tip de model doriți să utilizați, puteți folosi direct clasa care definește arhitectura acestuia. Să aruncăm o privire la modul în care funcționează acest lucru cu un model BERT.
-
-## Crearea unui Transformer[[crearea-unui-transformer]]
-
-Primul lucru pe care va trebui să îl facem pentru a inițializa un model BERT este să încărcăm un obiect de configurare:
-
-{#if fw === 'pt'}
-```py
-from transformers import BertConfig, BertModel
-
-# Construirea configurației
-config = BertConfig()
-
-# Construirea modelului pornind de la configurație
-model = BertModel(config)
-```
-{:else}
-```py
-from transformers import BertConfig, TFBertModel
-
-# Construirea configurației
-config = BertConfig()
-
-#  Construirea modelului pornind de la configurație
-model = TFBertModel(config)
-```
-{/if}
-
-Configurația conține multe atribute care sunt utilizate pentru a construi modelul:
-
-```py
-print(config)
-```
-
-```python out
-BertConfig {
-  [...]
-  "hidden_size": 768,
-  "intermediate_size": 3072,
-  "max_position_embeddings": 512,
-  "num_attention_heads": 12,
-  "num_hidden_layers": 12,
-  [...]
-}
-```
-
-Deși nu ați văzut încă ce fac toate aceste atribute, ar trebui să recunoașteți unele dintre ele: atributul `hidden_size` definește dimensiunea vectorului `hidden_states`, iar `num_hidden_layers` definește numărul de straturi pe care le are modelul Transformer.
-
-### Diferite metode de încărcare[[diferite-metode-de-încărcare]]
-
-Crearea unui model din configurația implicită îl inițializează cu valori aleatorii:
-
-
-{#if fw === 'pt'}
-```py
-from transformers import BertConfig, BertModel
-
-config = BertConfig()
-model = BertModel(config)
-
-# Modelul este inițializat aleatoriu!
-```
-{:else}
-```py
-from transformers import BertConfig, TFBertModel
-
-config = BertConfig()
-model = TFBertModel(config)
-
-# Modelul este inițializat aleatoriu!
-```
-{/if}
-
-Modelul poate fi utilizat în această stare, dar va produce rezultate neclare; mai întâi trebuie să fie antrenat. Am putea antrena modelul de la zero pentru sarcina în cauză, dar, după cum ați văzut în [Capitolul 1](/course/chapter1), acest lucru ar necesita mult timp și o mulțime de date și ar avea un impact semnificativ asupra mediului. Pentru a evita efortul inutil, este esențial să puteți partaja și reutiliza modelele care au fost deja formate.
-
-Încărcarea unui model Transformer care este deja instruit este simplă - putem face acest lucru utilizând metoda `from_pr
-
-{#if fw === 'pt'}
-```py
-from transformers import BertModel
-
-model = BertModel.from_pretrained("bert-base-cased")
-```
-
-După cum ați văzut mai devreme, am putea înlocui `BertModel` cu clasa `AutoModel` echivalentă. Vom face acest lucru în continuare, deoarece acest lucru produce un cod compatibil cu checkpoint-urile; dacă codul dumneavoastră funcționează pentru un checkpoint, ar trebui să funcționeze fără probleme pentru altul. Acest lucru este valabil chiar dacă arhitectura este diferită, atât timp cât checkpoint-ul a fost instruit pentru o sarcină similară (de exemplu, o sarcină de analiză a sentimentelor).
-
-{:else}
-```py
-from transformers import TFBertModel
-
-model = TFBertModel.from_pretrained("bert-base-cased")
-```
-
-După cum ați văzut mai devreme, am putea înlocui `BertModel` cu clasa `AutoModel` echivalentă. Vom face acest lucru în continuare, deoarece acest lucru produce un cod compatibil cu checkpoint-urile; dacă codul dumneavoastră funcționează pentru un checkpoint, ar trebui să funcționeze fără probleme pentru altul. Acest lucru este valabil chiar dacă arhitectura este diferită, atât timp cât checkpoint-ul a fost instruit pentru o sarcină similară (de exemplu, o sarcină de analiză a sentimentelor).
-
-{/if}
-
-În exemplul de cod de mai sus nu am utilizat `BertConfig` și, în loc de acesta, am încărcat un model preinstruit prin intermediul identificatorului `bert-base-cased`. Acesta este un checkpoint al modelului care a fost antrenat chiar de autorii BERT; puteți găsi mai multe detalii despre acesta în [model card](https://huggingface.co/bert-base-cased).
-
-Acest model este acum inițializat cu toate weight-urile din checkpoint. Acesta poate fi utilizat direct pentru inferență pe sarcinile pe care a fost antrenat și poate fi, de asemenea, ajustat pe o sarcină nouă. Prin antrenarea cu weight-uri instruite în prealabil, putem obține rapid rezultate bune.
-
-Greutățile au fost descărcate și stocate în cache (astfel încât apelurile viitoare la metoda `from_pretrained()` nu le vor descărca din nou) în folderul cache, care are ca valoare implicită *~/.cache/huggingface/transformers*. Puteți personaliza folderul cache prin setarea variabilei de mediu `HF_HOME`.
-
-Identificatorul utilizat pentru încărcarea modelului poate fi identificatorul oricărui model de pe Model Hub, atâta timp cât acesta este compatibil cu arhitectura OARET. Lista completă a  checkpoint-urilor OARET disponibile poate fi găsită [aici](https://huggingface.co/models?filter=bert).
-
-
-### Metode de păstrare[[metode-de-păstrare]]
-
-Salvarea unui model este la fel de ușoară ca încărcarea unuia - folosim metoda `save_pretrained()`, care este analogă metodei `from_pretrained()`:
-
-```py
-model.save_pretrained("directory_on_my_computer")
-```
-
-Se salvează două fișiere pe disc:
-
-{#if fw === 'pt'}
-```
-ls directory_on_my_computer
-
-config.json pytorch_model.bin
-```
-{:else}
-```
-ls directory_on_my_computer
-
-config.json tf_model.h5
-```
-{/if}
-
-Dacă aruncați o privire la fișierul *config.json*, veți recunoaște atributele necesare pentru construirea arhitecturii modelului. Acest fișier conține, de asemenea, unele metadate, cum ar fi locul de origine al checkpoint-ului și ce versiune 🤗 Transformers ați folosit când ați salvat ultima dată checkpoint-ul.
-
-{#if fw === 'pt'}
- 
-Fișierul *pytorch_model.bin* este cunoscut sub numele de *state dictionary*; acesta conține toate weight-urile modelului dumneavoastră. Cele două fișiere merg mână în mână; configurația este necesară pentru a cunoaște arhitectura modelului, în timp ce weight-urile modelului sunt parametrii modelului.
-
-{:else}
- 
-Fișierul *tf_model.h5* este cunoscut sub numele de *state dictionary*; acesta conține toate weight-urile modelului dumneavoastră. Cele două fișiere merg mână în mână; configurația este necesară pentru a cunoaște arhitectura modelului, în timp ce weight-urile modelului sunt parametrii modelului.
-
-{/if}
-
-## Utilizarea unui model Transformer pentru inferență[[utilizarea-unui-model-transformer-pentru-inferență]]
-
-
-Acum că știți cum să încărcați și să salvați un model, să încercăm să îl folosim pentru a face câteva predicții. Modelele Transformer pot procesa doar numere - numere pe care le generează tokenizatorul. Dar înainte de a discuta despre tokenizeri, să explorăm ce intrări acceptă modelul.
-
-Tokenizerii se pot ocupa de transformarea intrărilor în tensori ai framework-ului corespunzător, dar pentru a vă ajuta să înțelegeți ce se întâmplă, vom arunca o privire rapidă la ceea ce trebuie făcut înainte de trimiterea intrărilor către model.
-
-Să spunem că avem câteva secvențe:
-
-```py
-sequences = ["Hello!", "Cool.", "Nice!"]
-```
-
-Tokenizatorul le convertește în indici de vocabular care sunt denumiți în mod obișnuit *input IDs*. Fiecare secvență este acum o listă de numere! Rezultatul este:
-
-```py no-format
-encoded_sequences = [
-    [101, 7592, 999, 102],
-    [101, 4658, 1012, 102],
-    [101, 3835, 999, 102],
-]
-```
-
-Aceasta este o listă de secvențe codificate: o listă de liste. Tensorii acceptă numai forme dreptunghiulare (gândiți-vă la matrici). Această " listă " are deja o formă dreptunghiulară, astfel încât convertirea sa într-un tensor este ușoară:
-
-{#if fw === 'pt'}
-```py
-import torch
-
-model_inputs = torch.tensor(encoded_sequences)
-```
-{:else}
-```py
-import tensorflow as tf
-
-model_inputs = tf.constant(encoded_sequences)
-```
-{/if}
-
-### Utilizarea tensorilor ca intrări în model[[utilizarea-tensorilor-ca-intrări-în-to-model]]
-
-Utilizarea tensorilor cu ajutorul modelului este extrem de simplă - trebuie doar să apelăm modelul cu intrările:
-
-```py
-output = model(model_inputs)
-```
-
-Deși modelul acceptă o mulțime de argumente diferite, doar ID-urile de intrare sunt necesare. Vom explica mai târziu ce fac celelalte argumente și când sunt necesare, 
-dar mai întâi trebuie să aruncăm o privire mai atentă la tokenizerii care construiesc intrările pe care un model Transformer le poate înțelege.
\ No newline at end of file
diff --git a/chapters/ro/chapter2/4.mdx b/chapters/ro/chapter2/4.mdx
deleted file mode 100644
index c38234e14..000000000
--- a/chapters/ro/chapter2/4.mdx
+++ /dev/null
@@ -1,246 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Tokenizere[[tokenizere]]
-
-{#if fw === 'pt'}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section4_pt.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section4_pt.ipynb"},
-]} />
-
-{:else}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section4_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section4_tf.ipynb"},
-]} />
-
-{/if}
-
-<Youtube id="VFp38yj8h3A"/>
-
-
-Tokenizoarele sunt una dintre componentele de bază ale pipeline-ului NLP. Acestea au un singur scop: să transforme textul în date care pot fi prelucrate de model. Modelele pot procesa doar numere, astfel încât tokenizerii trebuie să convertească intrările noastre de text în date numerice. În această secțiune, vom explora exact ce se întâmplă în pipeline-ul de tokenizare. 
-
-În sarcinile NLP, datele care sunt în general prelucrate sunt text brut. Iată un exemplu de astfel de text:
-
-```
-Jim Henson was a puppeteer
-
-```
-
-Cu toate acestea, modelele pot procesa doar numere, deci trebuie să găsim o modalitate de a converti textul brut în numere. Asta fac tokenizerii și există o mulțime de modalități de a face acest lucru. Scopul este de a găsi cea mai relevantă reprezentare - adică cea care are cel mai mare sens pentru model - și, dacă este posibil, cea mai mică reprezentare.
-
-Să aruncăm o privire la câteva exemple de algoritmi de tokenizare și să încercăm să răspundem la unele dintre întrebările pe care le puteți avea despre tokenizare.
-
-
-
-## Word-based[[word-based]]
-
-<Youtube id="nhJxYji1aho"/>
-
- 
-Primul tip de tokenizator care îmi vine în minte este _word-based_. În general, este foarte ușor de configurat și de utilizat, cu doar câteva reguli, și adesea produce rezultate satisfăcătoare. De exemplu, în imaginea de mai jos, obiectivul este de a împărți textul brut în cuvinte și de a găsi o reprezentare numerică pentru fiecare dintre ele:
-
-<div class="flex justify-center">
-  <img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/word_based_tokenization.svg" alt="An example of word-based tokenization."/>
-  <img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/word_based_tokenization-dark.svg" alt="An example of word-based tokenization."/>
-</div>
-
- 
-Există diferite moduri de a împărți textul. De exemplu, am putea folosi spațiu pentru a tokeniza textul în cuvinte prin aplicarea funcției `split()` din Python:
-
- 
-```py
-tokenized_text = "Jim Henson was a puppeteer".split()
-print(tokenized_text)
-```
-
-```python out
-['Jim', 'Henson', 'was', 'a', 'puppeteer']
-```
-
-Există, de asemenea, variații ale tokenizerelor de cuvinte care au reguli suplimentare pentru punctuație. Cu acest tip de tokenizator, putem ajunge la „vocabulare” destul de mari, unde un vocabular este definit de numărul total de token-uri independente pe care le avem în corpus.
-
-Fiecărui cuvânt i se atribuie un ID, începând de la 0 și mergând până la dimensiunea vocabularului. Modelul utilizează aceste ID-uri pentru a identifica fiecare cuvânt.
-
-Dacă dorim să acoperim complet o limbă cu un tokenizer bazat pe cuvinte, va trebui să avem un identificator pentru fiecare cuvânt din limbă, ceea ce va genera o cantitate uriașă de token-uri. De exemplu, există peste 500 000 de cuvinte în limba engleză, astfel încât, pentru a construi o hartă de la fiecare cuvânt la un ID de intrare, ar trebui să ținem evidența unui număr atât de mare de ID-uri. În plus, cuvinte precum „dog” sunt reprezentate diferit de cuvinte precum „dogs”, iar modelul nu va avea inițial nicio modalitate de a ști că „dog” și „dogs” sunt similare: va identifica cele două cuvinte ca neavând legătură. Același lucru este valabil și pentru alte cuvinte similare, precum „run” și „running”, pe care modelul nu le va vedea inițial ca fiind similare.
-
-În cele din urmă, avem nevoie de un token personalizat pentru a reprezenta cuvintele care nu se află în vocabularul nostru. Acesta este cunoscut sub numele de token "necunoscut", adesea reprezentat ca "[UNK]" sau "&lt;unk&gt;". În general, este un indiciu rău dacă vedeți că tokenizatorul produce o mulțime de astfel de token-uri, deoarece nu a fost capabil să recupereze reprezentarea sensibilă a unui cuvânt și veți pierde informații pe parcurs. Scopul elaborării vocabularului este de a face în așa fel încât tokenizatorul să tokenizeze cât mai puține cuvinte posibil în tokenul necunoscut.
-
-O modalitate de a reduce numărul de token-uri necunoscute este de a merge un nivel mai adânc, folosind un tokenizer _character-based_.
-
-## Character-based[[character-based]]
-
-<Youtube id="ssLq_EK2jLE"/>
-
-
-Tokenizerele character-based împart textul în caractere, și nu în cuvinte. Acest lucru are două beneficii principale:
-
-- Dimensiunea vocabularului este mult mai mică.
-- Există mult mai puține token-uri în afara vocabularului (necunoscute), deoarece fiecare cuvânt poate fi construit din caractere.
-
-Dar și aici apar unele probleme legate de spații și punctuație:
-
-
-<div class="flex justify-center">
-  <img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/character_based_tokenization.svg" alt="An example of character-based tokenization."/>
-  <img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/character_based_tokenization-dark.svg" alt="An example of character-based tokenization."/>
-</div>
-
- 
-Nici această abordare nu este perfectă. Deoarece reprezentarea se bazează acum pe caractere și nu pe cuvinte, s-ar putea spune că, din punct de vedere intuitiv, este mai puțin relevantă: fiecare caracter nu înseamnă mult în sine, în timp ce în cazul cuvintelor situația este diferită. Totuși, acest lucru variază din nou în funcție de limbă; în chineză, de exemplu, fiecare caracter conține mai multe informații decât un caracter într-o limbă latină.
-
-Un alt lucru care trebuie luat în considerare este faptul că ne vom trezi cu o cantitate foarte mare de token-uri care vor fi prelucrate de modelul nostru: în timp ce un cuvânt ar fi un singur token cu un tokenizator bazat pe cuvinte, acesta se poate transforma cu ușurință în 10 sau mai multe token-uri atunci când este convertit în caractere.
-
-Pentru a obține ce este mai bun din ambele lumi, putem utiliza o a treia tehnică care combină cele două abordări: *subword tokenization*.
-
-## Subword tokenization[[subword-tokenization]]
-
-<Youtube id="zHvTiHr506c"/>
-
-Algoritmii "Subword Tokenization " se bazează pe principiul conform căruia cuvintele utilizate frecvent nu ar trebui să fie împărțite în cuvinte secundare mai mici, dar cuvintele rare ar trebui să fie descompuse în cuvinte secundare semnificative.
-
-De exemplu, " annoyingly " ar putea fi considerat un cuvânt rar și ar putea fi descompus în " annoying " și " ly ". Este probabil ca ambele să apară mai frecvent ca subcuvinte de sine stătătoare, în timp ce, în același timp, sensul cuvântului " annoyingly " este păstrat de sensul compus al cuvintelor " annoying " și " ly ".
-
-Iată un exemplu care arată modul în care un algoritm de subword tokenization ar tokeniza secvența "Let's do tokenization!":
-
-<div class="flex justify-center">
-  <img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/bpe_subword.svg" alt="A subword tokenization algorithm."/>
-  <img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter2/bpe_subword-dark.svg" alt="A subword tokenization algorithm."/>
-</div>
-
-Aceste părți de cuvinte oferă în cele din urmă o mulțime de semnificații semantice: în exemplul de mai sus, "tokenization" a fost împărțit în "token" și "ization", două cuvinte care au o semnificație semantică, fiind în același timp eficiente din punct de vedere al spațiului (sunt necesare doar două cuvinte pentru a reprezenta un cuvânt lung). Acest lucru ne permite să avem o acoperire relativ bună cu vocabulare de dimensiuni mici și aproape fără token-uri necunoscute.
-
-Această abordare este utilă în special în limbile aglutinative, cum ar fi turca, în care se pot forma cuvinte complexe (aproape) arbitrar de lungi prin combinarea părților de cuvinte.
-
-### Și nu numai![[și-nu-numai]]
-
-Nu este surprinzător faptul că există mult mai multe tehnici. Iată câteva:
-
-- BPE la nivel de byte, utilizată în GPT-2
-- WordPiece, utilizată în BERT
-- SentencePiece sau Unigram, utilizate în mai multe modele multilingve
-
-Acum ar trebui să cunoașteți destul de bine cum funcționează tokenizerele pentru a începe să utilizați API-
-
-## Încărcarea și salvarea[[încărcarea-și-salvarea]]
-
-Încărcarea și salvarea tokenizerelor este la fel de simplă ca în cazul modelelor. De fapt, se bazează pe aceleași două metode: `from_pretrained()` și `save_pretrained()`. Aceste metode vor încărca sau salva algoritmul utilizat de tokenizator (un pic ca *arhitectura* modelului), precum și vocabularul său (un pic ca *weight-urile* modelului).
-
-Încărcarea tokenizatorului BERT antrenat cu același punct de control ca BERT se face în același mod ca și încărcarea modelului, cu excepția faptului că folosim clasa `BertTokenizer`:
-
-```py
-from transformers import BertTokenizer
-
-tokenizer = BertTokenizer.from_pretrained("bert-base-cased")
-```
-
-{#if fw === 'pt'}
-Similar cu `AutoModel`, clasa `AutoTokenizer` va prelua clasa tokenizer corespunzătoare din bibliotecă pe baza numelui checkpoint-ului și poate fi utilizată direct cu orice checkpoint:
-
-{:else}
-Similar cu `TFAutoModel`, clasa `AutoTokenizer` va prelua clasa tokenizer corespunzătoare din bibliotecă pe baza numelui checkpoint-ului și poate fi utilizată direct cu orice checkpoint:
-
-{/if}
-
-```py
-from transformers import AutoTokenizer
-
-tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
-```
-
-Acum putem utiliza tokenizatorul așa cum am arătat în secțiunea anterioară:
-
-```python
-tokenizer("Using a Transformer network is simple")
-```
-
-```python out
-{'input_ids': [101, 7993, 170, 11303, 1200, 2443, 1110, 3014, 102],
- 'token_type_ids': [0, 0, 0, 0, 0, 0, 0, 0, 0],
- 'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1, 1]}
-```
-
-Salvarea unui tokenizer este identică cu salvarea unui model:
-
-```py
-tokenizer.save_pretrained("directory_on_my_computer")
-```
-
-Vom vorbi mai mult despre `token_type_ids` în [Capitolul 3](/course/chapter3) și vom explica cheia `attention_mask` puțin mai târziu. Mai întâi, să vedem cum sunt generate `input_ids`. Pentru a face acest lucru, va trebui să ne uităm la metodele intermediare ale tokenizatorului.
-
-## Codificarea[[codificarea]]
-
-<Youtube id="Yffk5aydLzg"/>
-
-Al doilea pas este să convertim aceste token-uri în numere, astfel încât să putem construi un tensor din ele și să le introducem în model. Pentru a face acest lucru, tokenizatorul are un *vocabular*, care este partea pe care o descărcăm atunci când îl instanțiem cu metoda `from_pretrained()`. Din nou, trebuie să folosim același vocabular utilizat atunci când modelul a fost preinstruit.
-
-Pentru a înțelege mai bine cele două etape, le vom explora separat. Rețineți că vom utiliza unele metode care efectuează părți ale pipeline-ului de tokenizare separat pentru a vă arăta rezultatele intermediare ale acestor etape, dar, în practică, ar trebui să apelați tokenizatorul direct pe intrările dvs. (așa cum se arată în secțiunea 2).
-
-### Tokenizarea[[tokenizarea]]
-
-Procesul de tokenizare este realizat prin metoda `tokenize()`:
-
-```py
-from transformers import AutoTokenizer
-
-tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
-
-sequence = "Using a Transformer network is simple"
-tokens = tokenizer.tokenize(sequence)
-
-print(tokens)
-```
-
-Rezultatul acestei metode este o listă de șiruri de caractere, sau token-uri:
-
-```python out
-['Using', 'a', 'transform', '##er', 'network', 'is', 'simple']
-```
-
-Acest tokenizator este un tokenizator de părți de cuvinte: împarte cuvintele până când obține token-uri care pot fi reprezentate de vocabularul său. Acesta este cazul aici cu `transformer`, care este împărțit în două token-uri: `transform` și `##er`
-
-### De la token-uri la ID-uri de intrare[[de-la-token-uri-la-id-uri-de-intrare]]
-
-Conversia în ID-uri de intrare este gestionată de metoda de tokenizare `convert_tokens_to_ids()`:
-
-```py
-ids = tokenizer.convert_tokens_to_ids(tokens)
-
-print(ids)
-```
-
-```python out
-[7993, 170, 11303, 1200, 2443, 1110, 3014]
-```
-
-Aceste rezultate, odată convertite în tensorul framework-ului corespunzător, pot fi apoi utilizate ca intrări într-un model, așa cum am văzut mai devreme în acest capitol.
-
-<Tip>
-
-✏️ ** Încercați!** Replicați ultimii doi pași (tokenizarea și conversia în ID-uri de intrare) pe propozițiile de intrare pe care le-am folosit în secțiunea 2 ("I've been waiting for a HuggingFace course my whole life." și "I hate this so much!"). Verificați dacă obțineți aceleași ID-uri de intrare pe care le-am obținut mai devreme! 
-
-</Tip>
-
-## Decodificare[[decodificare]]
-
-*Decodificarea* este inversă: din indicii vocabularului, dorim să obținem un șir de caractere. Acest lucru poate fi realizat cu metoda `decode()` după cum urmează:
-
-```py
-decoded_string = tokenizer.decode([7993, 170, 11303, 1200, 2443, 1110, 3014])
-print(decoded_string)
-```
-
-```python out
-'Using a Transformer network is simple'
-```
-
-Rețineți că metoda `decode` nu numai că convertește indicii înapoi în token-uri, dar și grupează token-urile care fac parte din aceleași cuvinte pentru a produce o propoziție inteligibilă. Acest comportament va fi extrem de util atunci când vom utiliza modele care prezic text nou (fie text generat de un prompt, fie pentru probleme sequence-to-sequence, precum traducerea sau rezumarea).
-
-Până acum ar trebui să înțelegeți operațiunile atomice pe care le poate gestiona un tokenizator: tokenizarea, conversia în ID-uri și conversia ID-urilor înapoi într-un șir. Cu toate acestea, am atins doar vârful icebergului. În secțiunea următoare, vom aborda limitele metodei noastre și vom vedea cum să le depășim.
diff --git a/chapters/ro/chapter2/5.mdx b/chapters/ro/chapter2/5.mdx
deleted file mode 100644
index 1d71f6188..000000000
--- a/chapters/ro/chapter2/5.mdx
+++ /dev/null
@@ -1,338 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Gestionarea secvențelor multiple[[gestionarea-secvențelor-multiple]]
-
-{#if fw === 'pt'}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section5_pt.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section5_pt.ipynb"},
-]} />
-
-{:else}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section5_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section5_tf.ipynb"},
-]} />
-
-{/if}
-
-{#if fw === 'pt'}
-<Youtube id="M6adb1j2jPI"/>
-{:else}
-<Youtube id="ROxrFOEbsQE"/>
-{/if}
-
-În secțiunea anterioară, am explorat cel mai simplu caz de utilizare: realizarea de inferențe pe o singură secvență de lungime mică. Cu toate acestea, apar deja unele întrebări:
-
-- Cum gestionăm secvențe multiple?
-- Cum gestionăm secvențe multiple *de lungimi diferite*?
-- Indicii vocabularului sunt singurele intrări care permit unui model să funcționeze bine?
-- Există o secvență prea lungă?
-
-Să vedem ce tipuri de probleme prezintă aceste întrebări și cum le putem rezolva folosind API-ul 🤗 Transformers.
-
-
-## Modelele așteaptă un lot de intrări[[modelele-așteaptă-un-lot-de-intrări]]
-
-În exercițiul anterior ați văzut cum secvențele sunt transformate în liste de numere. Să convertim această listă de numere într-un tensor și să o transmitem modelului:
-
-{#if fw === 'pt'}
-```py
-import torch
-from transformers import AutoTokenizer, AutoModelForSequenceClassification
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
-
-sequence = "I've been waiting for a HuggingFace course my whole life."
-
-tokens = tokenizer.tokenize(sequence)
-ids = tokenizer.convert_tokens_to_ids(tokens)
-input_ids = torch.tensor(ids)
-# Această linie va eșua.
-model(input_ids)
-```
-
-```python out
-IndexError: Dimension out of range (expected to be in range of [-1, 0], but got 1)
-```
-{:else}
-```py
-import tensorflow as tf
-from transformers import AutoTokenizer, TFAutoModelForSequenceClassification
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint)
-
-sequence = "I've been waiting for a HuggingFace course my whole life."
-
-tokens = tokenizer.tokenize(sequence)
-ids = tokenizer.convert_tokens_to_ids(tokens)
-input_ids = tf.constant(ids)
-# This line will fail.
-model(input_ids)
-```
-
-```py out
-InvalidArgumentError: Input to reshape is a tensor with 14 values, but the requested shape has 196 [Op:Reshape]
-```
-{/if}
-
-Oh, nu! De ce a eșuat? Am urmat pașii din pipeline-ul din secțiunea 2.
-
-Problema este că am trimis o singură secvență către model, în timp ce modelele 🤗 Transformers așteaptă în mod implicit mai multe propoziții. Aici am încercat să facem tot ce a făcut tokenizatorul în fundal atunci când l-am aplicat unei `secvențe`. Dar, dacă vă uitați cu atenție, veți vedea că tokenizatorul nu a convertit doar lista de ID-uri de intrare într-un tensor, ci a adăugat și o dimensiune peste aceasta:
-
-{#if fw === 'pt'}
-```py
-tokenized_inputs = tokenizer(sequence, return_tensors="pt")
-print(tokenized_inputs["input_ids"])
-```
-
-```python out
-tensor([[  101,  1045,  1005,  2310,  2042,  3403,  2005,  1037, 17662, 12172,
-          2607,  2026,  2878,  2166,  1012,   102]])
-```
-{:else}
-```py
-tokenized_inputs = tokenizer(sequence, return_tensors="tf")
-print(tokenized_inputs["input_ids"])
-```
-
-```py out
-<tf.Tensor: shape=(1, 16), dtype=int32, numpy=
-array([[  101,  1045,  1005,  2310,  2042,  3403,  2005,  1037, 17662,
-        12172,  2607,  2026,  2878,  2166,  1012,   102]], dtype=int32)>
-```
-{/if}
-
-Să încercăm din nou și să adăugăm o nouă dimensiune:
-
-{#if fw === 'pt'}
-```py
-import torch
-from transformers import AutoTokenizer, AutoModelForSequenceClassification
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
-
-sequence = "I've been waiting for a HuggingFace course my whole life."
-
-tokens = tokenizer.tokenize(sequence)
-ids = tokenizer.convert_tokens_to_ids(tokens)
-
-input_ids = torch.tensor([ids])
-print("Input IDs:", input_ids)
-
-output = model(input_ids)
-print("Logits:", output.logits)
-```
-{:else}
-```py
-import tensorflow as tf
-from transformers import AutoTokenizer, TFAutoModelForSequenceClassification
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint)
-
-sequence = "I've been waiting for a HuggingFace course my whole life."
-
-tokens = tokenizer.tokenize(sequence)
-ids = tokenizer.convert_tokens_to_ids(tokens)
-
-input_ids = tf.constant([ids])
-print("Input IDs:", input_ids)
-
-output = model(input_ids)
-print("Logits:", output.logits)
-```
-{/if}
-
-Imprimăm ID-urile de intrare, precum și logit-urile rezultate - iată rezultatul:
-
-{#if fw === 'pt'}
-```python out
-Input IDs: [[ 1045,  1005,  2310,  2042,  3403,  2005,  1037, 17662, 12172,  2607, 2026,  2878,  2166,  1012]]
-Logits: [[-2.7276,  2.8789]]
-```
-{:else}
-```py out
-Input IDs: tf.Tensor(
-[[ 1045  1005  2310  2042  3403  2005  1037 17662 12172  2607  2026  2878
-   2166  1012]], shape=(1, 14), dtype=int32)
-Logits: tf.Tensor([[-2.7276208  2.8789377]], shape=(1, 2), dtype=float32)
-```
-{/if}
-
-Gruparea în loturi este acțiunea de a trimite mai multe propoziții prin model, toate odată. Dacă aveți o singură propoziție, puteți crea un lot cu o singură secvență: 
-
-```
-batched_ids = [ids, ids]
-```
-
-Acesta este un lot de două secvențe identice!
-
-<Tip>
-
-✏️ ** Încercați!** Convertiți această listă `batched_ids` într-un tensor și treceți-o prin modelul dumneavoastră. Verificați dacă obțineți aceleași logits ca înainte (dar de două ori)!
-
-</Tip>
-
-Gruparea în loturi permite modelului să funcționeze atunci când îi furnizați mai multe secvențe. Utilizarea mai multor secvențe este la fel de simplă ca și crearea unui lot cu o singură secvență. Există însă o a doua problemă. Atunci când încercați să combinați două (sau mai multe) propoziții, acestea pot avea lungimi diferite. Dacă ați mai lucrat vreodată cu tensori, știți că aceștia trebuie să aibă o formă dreptunghiulară, deci nu veți putea converti direct lista de ID-uri de intrare într-un tensor. Pentru a rezolva această problemă, de obicei *umplem* datele de intrare.
-
-## Umplerea datelor de intrare[[umplerea-datelor-de-intrare]]
-
-Următoarea serie de liste nu poate fi convertită într-un tensor:
-
-```py no-format
-batched_ids = [
-    [200, 200, 200],
-    [200, 200]
-]
-```
-
-Pentru a ocoli acest lucru, vom folosi *padding-ul* pentru ca tensorii noștri să aibă o formă dreptunghiulară. Padding-ul (umplerea datelor) asigură că toate propozițiile noastre au aceeași lungime prin adăugarea unui cuvânt special numit *padding token* la propozițiile cu mai puține valori. De exemplu, dacă aveți 10 propoziții cu 10 cuvinte și 1 propoziție cu 20 de cuvinte, padding-ul va asigura că toate propozițiile au 20 de cuvinte. În exemplul nostru, tensorul rezultat arată astfel:
-
-```py no-format
-padding_id = 100
-
-batched_ids = [
-    [200, 200, 200],
-    [200, 200, padding_id],
-]
-```
-
-ID-ul token-ului de umplere poate fi găsit în `tokenizer.pad_token_id`. Să-l folosim și să trimitem cele două propoziții prin model în mod separat și grupate împreună:
-
-{#if fw === 'pt'}
-```py no-format
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
-
-sequence1_ids = [[200, 200, 200]]
-sequence2_ids = [[200, 200]]
-batched_ids = [
-    [200, 200, 200],
-    [200, 200, tokenizer.pad_token_id],
-]
-
-print(model(torch.tensor(sequence1_ids)).logits)
-print(model(torch.tensor(sequence2_ids)).logits)
-print(model(torch.tensor(batched_ids)).logits)
-```
-
-```python out
-tensor([[ 1.5694, -1.3895]], grad_fn=<AddmmBackward>)
-tensor([[ 0.5803, -0.4125]], grad_fn=<AddmmBackward>)
-tensor([[ 1.5694, -1.3895],
-        [ 1.3373, -1.2163]], grad_fn=<AddmmBackward>)
-```
-{:else}
-```py no-format
-model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint)
-
-sequence1_ids = [[200, 200, 200]]
-sequence2_ids = [[200, 200]]
-batched_ids = [
-    [200, 200, 200],
-    [200, 200, tokenizer.pad_token_id],
-]
-
-print(model(tf.constant(sequence1_ids)).logits)
-print(model(tf.constant(sequence2_ids)).logits)
-print(model(tf.constant(batched_ids)).logits)
-```
-
-```py out
-tf.Tensor([[ 1.5693678 -1.3894581]], shape=(1, 2), dtype=float32)
-tf.Tensor([[ 0.5803005  -0.41252428]], shape=(1, 2), dtype=float32)
-tf.Tensor(
-[[ 1.5693681 -1.3894582]
- [ 1.3373486 -1.2163193]], shape=(2, 2), dtype=float32)
-```
-{/if}
-
-Este ceva în neregulă cu logit-urile din predicțiile noastre grupate: al doilea rând ar trebui să fie identic cu logit-urile pentru a doua propoziție, dar avem valori complet diferite!
-
-Acest lucru se datorează faptului că principala caracteristică a modelelor Transformer sunt straturile de atenție care *contextualizează* fiecare token. Acestea vor lua în considerare token-urile de umplutură, deoarece se ocupă de toate token-urile unei secvențe. Pentru a obține același rezultat atunci când trecem propoziții individuale de diferite lungimi prin model sau atunci când trecem un lot cu aceleași propoziții și același umplutură aplicată, trebuie să spunem acelor straturi de atenție să ignore token-urile de umplutură. Acest lucru se realizează prin utilizarea unei măști de atenție (attention mask).
-
-## Attention masks(măști de atenție)[[attention-masks]]
-
-*Măștile de atenție* sunt tensori cu exact aceeași formă ca tensorul ID-urilor de intrare, completate cu 0 și 1: valorile 1 indică faptul că ar trebui să se acorde atenție token-urilor corespunzătoare, iar valorile 0 indică faptul că nu ar trebui să se acorde atenție token-urilor corespunzătoare (adică acestea ar trebui ignorate de straturile de atenție ale modelului).
-
-Să completăm exemplul anterior cu o mască de atenție:
-
-{#if fw === 'pt'}
-```py no-format
-batched_ids = [
-    [200, 200, 200],
-    [200, 200, tokenizer.pad_token_id],
-]
-
-attention_mask = [
-    [1, 1, 1],
-    [1, 1, 0],
-]
-
-outputs = model(torch.tensor(batched_ids), attention_mask=torch.tensor(attention_mask))
-print(outputs.logits)
-```
-
-```python out
-tensor([[ 1.5694, -1.3895],
-        [ 0.5803, -0.4125]], grad_fn=<AddmmBackward>)
-```
-{:else}
-```py no-format
-batched_ids = [
-    [200, 200, 200],
-    [200, 200, tokenizer.pad_token_id],
-]
-
-attention_mask = [
-    [1, 1, 1],
-    [1, 1, 0],
-]
-
-outputs = model(tf.constant(batched_ids), attention_mask=tf.constant(attention_mask))
-print(outputs.logits)
-```
-
-```py out
-tf.Tensor(
-[[ 1.5693681  -1.3894582 ]
- [ 0.5803021  -0.41252586]], shape=(2, 2), dtype=float32)
-```
-{/if}
-
-Acum obținem aceeași logits pentru a doua propoziție din lot.
-
-Observăm cum ultima valoare a celei de-a doua secvențe este un ID de umplere, care este o valoare 0 în masca de atenție.
-
-<Tip>
-
-✏️ ** Încercați!** Aplicați manual tokenizarea pe cele două propoziții utilizate în secțiunea 2 ("I've been waiting for a HuggingFace course my whole life." și "I hate this so much!"). Treceți-le prin model și verificați dacă obțineți aceeași logiți ca în secțiunea 2. Acum grupați-le împreună folosind token-ul de umplere, apoi creați masca de atenție corespunzătoare. Verificați dacă obțineți aceleași rezultate atunci când parcurgeți modelul!
-
-</Tip>
-
-## Secvențe mai lungi[[secvențe-mai-lungi]]
-
-Cu modelele Transformer, există o limită a lungimii secvențelor pe care le putem transmite modelelor. Majoritatea modelelor gestionează secvențe de până la 512 sau 1024 de token-uri și se vor bloca atunci când li se cere să proceseze secvențe mai lungi. Există două soluții la această problemă:
-
-- Utilizați un model cu o lungime de secvență acceptată mai mare.
-- Trunchiați secvențele.
-
-Modelele au diferite lungimi de secvență acceptate, iar unele sunt specializate în tratarea secvențelor foarte lungi. [Longformer](https://huggingface.co/docs/transformers/model_doc/longformer) este un exemplu, iar altul este [LED](https://huggingface.co/docs/transformers/model_doc/led). Dacă lucrați la o sarcină care necesită secvențe foarte lungi, vă recomandăm să aruncați o privire la aceste modele.
-
-În caz contrar, vă recomandăm să vă trunchiați secvențele prin specificarea parametrului `max_sequence_length`:
-```py
-sequence = sequence[:max_sequence_length]
-```
diff --git a/chapters/ro/chapter2/6.mdx b/chapters/ro/chapter2/6.mdx
deleted file mode 100644
index a95a92d56..000000000
--- a/chapters/ro/chapter2/6.mdx
+++ /dev/null
@@ -1,164 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Să punem totul cap la cap[[să-punem-totul-cap-la-cap]]
-
-{#if fw === 'pt'}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section6_pt.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section6_pt.ipynb"},
-]} />
-
-{:else}
-
-<CourseFloatingBanner chapter={2}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section6_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section6_tf.ipynb"},
-]} />
-
-{/if}
-
-În ultimele secțiuni, ne-am străduit să facem cea mai mare parte a muncii manual. Am explorat modul în care funcționează tokenizerele și am analizat tokenizarea, conversia în ID-uri de intrare, padding, trunchiere și măști de atenție.
-
-Cu toate acestea, după cum am văzut în secțiunea 2, API-ul 🤗 Transformers poate gestiona toate acestea pentru noi cu o funcție de nivel înalt în care ne vom adânci aici. Atunci când apelați `tokenizer` direct pe propoziție, primiți înapoi intrări care sunt gata să treacă prin modelul dvs:
-
-```py
-from transformers import AutoTokenizer
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-
-sequence = "I've been waiting for a HuggingFace course my whole life."
-
-model_inputs = tokenizer(sequence)
-```
-
-Aici, variabila `model_inputs` conține tot ceea ce este necesar pentru ca un model să funcționeze bine. Pentru DistilBERT, aceasta include ID-urile de intrare, precum și masca de atenție. Alte modele care acceptă intrări suplimentare le vor avea, de asemenea, la ieșire prin obiectul `tokenizer`.
-
-După cum vom vedea în câteva exemple de mai jos, această metodă este foarte eficientă. În primul rând, poate tokeniza o singură secvență:
-
-```py
-sequence = "I've been waiting for a HuggingFace course my whole life."
-
-model_inputs = tokenizer(sequence)
-```
-
-De asemenea, gestionează mai multe secvențe simultan, fără nicio modificare a API-ului:
-
-```py
-sequences = ["I've been waiting for a HuggingFace course my whole life.", "So have I!"]
-
-model_inputs = tokenizer(sequences)
-```
-
-Acesta poate umple în funcție de mai multe obiective:
-
-```py
-# Va umple secvențele până la lungimea maximă a secvenței
-model_inputs = tokenizer(sequences, padding="longest")
-
-# Va umple secvențele până la lungimea maximă a modelului
-# (512 pentru BERT sau DistilBERT)
-model_inputs = tokenizer(sequences, padding="max_length")
-
-# Va umple secvențele până la lungimea maximă specificată
-model_inputs = tokenizer(sequences, padding="max_length", max_length=8)
-```
-
-De asemenea, poate trunchia secvențele:
-
-```py
-sequences = ["I've been waiting for a HuggingFace course my whole life.", "So have I!"]
-
-# Va trunchia secvențele care sunt mai lungi decât lungimea maximă a modelului
-# (512 pentru BERT sau DistilBERT)
-model_inputs = tokenizer(sequences, truncation=True)
-
-# Va trunchia secvențele care sunt mai lungi decât lungimea maximă specificată
-model_inputs = tokenizer(sequences, max_length=8, truncation=True)
-```
-
-Obiectul `tokenizer` poate gestiona conversia în tensori specifici framework-ului, care pot fi apoi trimiși direct la model. De exemplu, în următorul exemplu de cod, solicităm tokenizatorului să returneze tensori din diferite cadre - `„pt”` returnează tensori PyTorch, `„tf”` returnează tensori TensorFlow, iar `„np”` returnează matrici NumPy:
-
-```py
-sequences = ["I've been waiting for a HuggingFace course my whole life.", "So have I!"]
-
-# Returnează tensori PyTorch
-model_inputs = tokenizer(sequences, padding=True, return_tensors="pt")
-
-# Returnează tensori TensorFlow 
-model_inputs = tokenizer(sequences, padding=True, return_tensors="tf")
-
-# Returnează array-uri NumPy 
-model_inputs = tokenizer(sequences, padding=True, return_tensors="np")
-```
-
-## Token-uri speciale[[token-uri-speciale]]
-
-Dacă aruncăm o privire la ID-urile de intrare returnate de tokenizer, vom vedea că sunt puțin diferite de cele pe care le-am avut mai devreme:
-
-```py
-sequence = "I've been waiting for a HuggingFace course my whole life."
-
-model_inputs = tokenizer(sequence)
-print(model_inputs["input_ids"])
-
-tokens = tokenizer.tokenize(sequence)
-ids = tokenizer.convert_tokens_to_ids(tokens)
-print(ids)
-```
-
-```python out
-[101, 1045, 1005, 2310, 2042, 3403, 2005, 1037, 17662, 12172, 2607, 2026, 2878, 2166, 1012, 102]
-[1045, 1005, 2310, 2042, 3403, 2005, 1037, 17662, 12172, 2607, 2026, 2878, 2166, 1012]
-```
-
-Un token ID a fost adăugat la început, iar unul la sfârșit. Să decodificăm cele două secvențe de ID-uri de mai sus pentru a vedea despre ce este vorba:
-
-```py
-print(tokenizer.decode(model_inputs["input_ids"]))
-print(tokenizer.decode(ids))
-```
-
-```python out
-"[CLS] i've been waiting for a huggingface course my whole life. [SEP]"
-"i've been waiting for a huggingface course my whole life."
-```
-
-Tokenizatorul a adăugat cuvântul special `[CLS]` la început și cuvântul special `[SEP]` la sfârșit. Acest lucru se datorează faptului că modelul a fost preinstruit cu aceste cuvinte, deci pentru a obține aceleași rezultate pentru inferență trebuie să le adăugăm și pe acestea. Rețineți că unele modele nu adaugă cuvinte speciale sau adaugă cuvinte diferite; de asemenea, modelele pot adăuga aceste cuvinte speciale doar la început sau doar la sfârșit. În orice caz, tokenizatorul știe care sunt cele așteptate și se va ocupa de acest lucru pentru dumneavoastră.
-
-## Încheiere: De la tokenizer la model[[încheiere-de-la-tokenizator--model]]
-
-Acum că am văzut toți pașii individuali pe care îi utilizează obiectul `tokenizer` atunci când este aplicat pe texte, să vedem o ultimă dată cum poate gestiona secvențe multiple (padding!), secvențe foarte lungi (trunchiere!) și mai multe tipuri de tensori cu API-ul său principal:
-
-{#if fw === 'pt'}
-```py
-import torch
-from transformers import AutoTokenizer, AutoModelForSequenceClassification
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
-sequences = ["I've been waiting for a HuggingFace course my whole life.", "So have I!"]
-
-tokens = tokenizer(sequences, padding=True, truncation=True, return_tensors="pt")
-output = model(**tokens)
-```
-{:else}
-```py
-import tensorflow as tf
-from transformers import AutoTokenizer, TFAutoModelForSequenceClassification
-
-checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint)
-sequences = ["I've been waiting for a HuggingFace course my whole life.", "So have I!"]
-
-tokens = tokenizer(sequences, padding=True, truncation=True, return_tensors="tf")
-output = model(**tokens)
-```
-{/if}
diff --git a/chapters/ro/chapter2/7.mdx b/chapters/ro/chapter2/7.mdx
deleted file mode 100644
index 2e6f1175c..000000000
--- a/chapters/ro/chapter2/7.mdx
+++ /dev/null
@@ -1,19 +0,0 @@
-# Utilizarea de bază este completă![[utilizarea-de-bază-este-completă]]
-
-<CourseFloatingBanner
-    chapter={2}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
- 
-Ați făcut o treabă excelentă dacă ați urmat cursul până aici! Pentru a sintetiza, în acest capitol ați:
-
-- Ați învățat elementele de bază ale unui model Transformer.
-- Ați învățat ce formează un pipeline de tokenizare.
-- Ați văzut cum să utilizați un model Transformer în practică.
-- Ați învățat cum să folosiți un tokenizer pentru a converti textul în tensori care sunt inteligibili pentru model.
-- Am configurat împreună un tokenizer și un model pentru a ajunge de la text la predicții.
-- Am învățat limitările ID-urilor de intrare și am învățat despre attention masks(măști de atenție).
-- V-ați antrenat cu ajutorul metodelor versatile și configurabile ale tokenizatorului.
-
-De acum înainte, ar trebui să puteți naviga liber prin documentele 🤗 Transformers: vocabularul va suna familiar și ați văzut deja metodele pe care le veți utiliza în majoritatea timpului.
\ No newline at end of file
diff --git a/chapters/ro/chapter2/8.mdx b/chapters/ro/chapter2/8.mdx
deleted file mode 100644
index c41f27936..000000000
--- a/chapters/ro/chapter2/8.mdx
+++ /dev/null
@@ -1,310 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-<!-- DISABLE-FRONTMATTER-SECTIONS -->
-
-# End-of-chapter quiz[[end-of-chapter-quiz]]
-
-<CourseFloatingBanner
-    chapter={2}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-### 1. What is the order of the language modeling pipeline?
-
-<Question
-	choices={[
-		{
-			text: "First, the model, which handles text and returns raw predictions. The tokenizer then makes sense of these predictions and converts them back to text when needed.",
-			explain: "The model cannot understand text! The tokenizer must first tokenize the text and convert it to IDs so that it is understandable by the model."
-		},
-		{
-			text: "First, the tokenizer, which handles text and returns IDs. The model handles these IDs and outputs a prediction, which can be some text.",
-			explain: "The model's prediction cannot be text straight away. The tokenizer has to be used in order to convert the prediction back to text!"
-		},
-		{
-			text: "The tokenizer handles text and returns IDs. The model handles these IDs and outputs a prediction. The tokenizer can then be used once again to convert these predictions back to some text.",
-			explain: "Correct! The tokenizer can be used for both tokenizing and de-tokenizing.",
-            correct: true
-		}
-	]}
-/>
-
-### 2. How many dimensions does the tensor output by the base Transformer model have, and what are they?
-
-<Question
-	choices={[
-		{
-			text: "2: The sequence length and the batch size",
-			explain: "False! The tensor output by the model has a third dimension: hidden size."
-		},
-		{
-			text: "2: The sequence length and the hidden size",
-			explain: "False! All Transformer models handle batches, even with a single sequence; that would be a batch size of 1!"
-		},
-		{
-			text: "3: The sequence length, the batch size, and the hidden size",
-			explain: "Correct!",
-            correct: true
-		}
-	]}
-/>
-
-### 3. Which of the following is an example of subword tokenization?
-
-<Question
-	choices={[
-		{
-			text: "WordPiece",
-			explain: "Yes, that's one example of subword tokenization!",
-            correct: true
-		},
-		{
-			text: "Character-based tokenization",
-			explain: "Character-based tokenization is not a type of subword tokenization."
-		},
-		{
-			text: "Splitting on whitespace and punctuation",
-			explain: "That's a word-based tokenization scheme!"
-		},
-		{
-			text: "BPE",
-			explain: "Yes, that's one example of subword tokenization!",
-            correct: true
-        },
-		{
-			text: "Unigram",
-			explain: "Yes, that's one example of subword tokenization!",
-            correct: true
-        },
-		{
-			text: "None of the above",
-			explain: "Incorrect!"
-        }
-	]}
-/>
-
-### 4. What is a model head?
-
-<Question
-	choices={[
-		{
-			text: "A component of the base Transformer network that redirects tensors to their correct layers",
-			explain: "Incorrect! There's no such component."
-		},
-		{
-			text: "Also known as the self-attention mechanism, it adapts the representation of a token according to the other tokens of the sequence",
-			explain: "Incorrect! The self-attention layer does contain attention \"heads,\" but these are not adaptation heads."
-		},
-		{
-			text: "An additional component, usually made up of one or a few layers, to convert the transformer predictions to a task-specific output",
-			explain: "That's right. Adaptation heads, also known simply as heads, come up in different forms: language modeling heads, question answering heads, sequence classification heads... ",
-			correct: true
-		} 
-	]}
-/>
-
-{#if fw === 'pt'}
-### 5. What is an AutoModel?
-
-<Question
-	choices={[
-		{
-			text: "A model that automatically trains on your data",
-			explain: "Incorrect. Are you mistaking this with our <a href='https://huggingface.co/autotrain'>AutoTrain</a> product?"
-		},
-		{
-			text: "An object that returns the correct architecture based on the checkpoint",
-			explain: "Exactly: the <code>AutoModel</code> only needs to know the checkpoint from which to initialize to return the correct architecture.",
-			correct: true
-		},
-		{
-			text: "A model that automatically detects the language used for its inputs to load the correct weights",
-			explain: "Incorrect; while some checkpoints and models are capable of handling multiple languages, there are no built-in tools for automatic checkpoint selection according to language. You should head over to the <a href='https://huggingface.co/models'>Model Hub</a> to find the best checkpoint for your task!"
-		} 
-	]}
-/>
-
-{:else}
-### 5. What is an TFAutoModel?
-
-<Question
-	choices={[
-		{
-			text: "A model that automatically trains on your data",
-			explain: "Incorrect. Are you mistaking this with our <a href='https://huggingface.co/autotrain'>AutoTrain</a> product?"
-		},
-		{
-			text: "An object that returns the correct architecture based on the checkpoint",
-			explain: "Exactly: the <code>TFAutoModel</code> only needs to know the checkpoint from which to initialize to return the correct architecture.",
-			correct: true
-		},
-		{
-			text: "A model that automatically detects the language used for its inputs to load the correct weights",
-			explain: "Incorrect; while some checkpoints and models are capable of handling multiple languages, there are no built-in tools for automatic checkpoint selection according to language. You should head over to the <a href='https://huggingface.co/models'>Model Hub</a> to find the best checkpoint for your task!"
-		} 
-	]}
-/>
-
-{/if}
-
-### 6. What are the techniques to be aware of when batching sequences of different lengths together?
-
-<Question
-	choices={[
-		{
-			text: "Truncating",
-			explain: "Yes, truncation is a correct way of evening out sequences so that they fit in a rectangular shape. Is it the only one, though?",
-			correct: true
-		},
-		{
-			text: "Returning tensors",
-			explain: "While the other techniques allow you to return rectangular tensors, returning tensors isn't helpful when batching sequences together."
-		},
-		{
-			text: "Padding",
-			explain: "Yes, padding is a correct way of evening out sequences so that they fit in a rectangular shape. Is it the only one, though?",
-			correct: true
-		}, 
-		{
-			text: "Attention masking",
-			explain: "Absolutely! Attention masks are of prime importance when handling sequences of different lengths. That's not the only technique to be aware of, however.",
-			correct: true
-		} 
-	]}
-/>
-
-### 7. What is the point of applying a SoftMax function to the logits output by a sequence classification model?
-
-<Question
-	choices={[
-		{
-			text: "It softens the logits so that they're more reliable.",
-			explain: "No, the SoftMax function does not affect the reliability of results."
-		},
-		{
-			text: "It applies a lower and upper bound so that they're understandable.",
-			explain: "Correct! The resulting values are bound between 0 and 1. That's not the only reason we use a SoftMax function, though.",
-            correct: true
-		},
-		{
-			text: "The total sum of the output is then 1, resulting in a possible probabilistic interpretation.",
-			explain: "Correct! That's not the only reason we use a SoftMax function, though.",
-            correct: true
-		}
-	]}
-/>
-
-### 8. What method is most of the tokenizer API centered around?
-
-<Question
-	choices={[
-		{
-			text: "<code>encode</code>, as it can encode text into IDs and IDs into predictions",
-			explain: "Wrong! While the <code>encode</code> method does exist on tokenizers, it does not exist on models."
-		},
-		{
-			text: "Calling the tokenizer object directly.",
-			explain: "Exactly! The <code>__call__</code> method of the tokenizer is a very powerful method which can handle pretty much anything. It is also the method used to retrieve predictions from a model.",
-			correct: true
-		},
-		{
-			text: "<code>pad</code>",
-			explain: "Wrong! Padding is very useful, but it's just one part of the tokenizer API."
-		},
-		{
-			text: "<code>tokenize</code>",
-			explain: "The <code>tokenize</code> method is arguably one of the most useful methods, but it isn't the core of the tokenizer API."
-		}
-	]}
-/>
-
-### 9. What does the `result` variable contain in this code sample?
-
-```py
-from transformers import AutoTokenizer
-
-tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
-result = tokenizer.tokenize("Hello!")
-```
-
-<Question
-	choices={[
-		{
-			text: "A list of strings, each string being a token",
-			explain: "Absolutely! Convert this to IDs, and send them to a model!",
-            correct: true
-		},
-		{
-			text: "A list of IDs",
-			explain: "Incorrect; that's what the <code>__call__</code> or <code>convert_tokens_to_ids</code> method is for!"
-		},
-		{
-			text: "A string containing all of the tokens",
-			explain: "This would be suboptimal, as the goal is to split the string into multiple tokens."
-		}
-	]}
-/>
-
-{#if fw === 'pt'}
-### 10. Is there something wrong with the following code?
-
-```py
-from transformers import AutoTokenizer, AutoModel
-
-tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
-model = AutoModel.from_pretrained("gpt2")
-
-encoded = tokenizer("Hey!", return_tensors="pt")
-result = model(**encoded)
-```
-
-<Question
-	choices={[
-		{
-			text: "No, it seems correct.",
-			explain: "Unfortunately, coupling a model with a tokenizer that was trained with a different checkpoint is rarely a good idea. The model was not trained to make sense out of this tokenizer's output, so the model output (if it can even run!) will not make any sense."
-		},
-		{
-			text: "The tokenizer and model should always be from the same checkpoint.",
-			explain: "Right!",
-            correct: true
-		},
-		{
-			text: "It's good practice to pad and truncate with the tokenizer as every input is a batch.",
-			explain: "It's true that every model input needs to be a batch. However, truncating or padding this sequence wouldn't necessarily make sense as there is only one of it, and those are techniques to batch together a list of sentences."
-		}
-	]}
-/>
-
-{:else}
-### 10. Is there something wrong with the following code?
-
-```py
-from transformers import AutoTokenizer, TFAutoModel
-
-tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
-model = TFAutoModel.from_pretrained("gpt2")
-
-encoded = tokenizer("Hey!", return_tensors="pt")
-result = model(**encoded)
-```
-
-<Question
-	choices={[
-		{
-			text: "No, it seems correct.",
-			explain: "Unfortunately, coupling a model with a tokenizer that was trained with a different checkpoint is rarely a good idea. The model was not trained to make sense out of this tokenizer's output, so the model output (if it can even run!) will not make any sense."
-		},
-		{
-			text: "The tokenizer and model should always be from the same checkpoint.",
-			explain: "Right!",
-            correct: true
-		},
-		{
-			text: "It's good practice to pad and truncate with the tokenizer as every input is a batch.",
-			explain: "It's true that every model input needs to be a batch. However, truncating or padding this sequence wouldn't necessarily make sense as there is only one of it, and those are techniques to batch together a list of sentences."
-		}
-	]}
-/>
-
-{/if}
diff --git a/chapters/ro/chapter3/1.mdx b/chapters/ro/chapter3/1.mdx
deleted file mode 100644
index 87d1e54dd..000000000
--- a/chapters/ro/chapter3/1.mdx
+++ /dev/null
@@ -1,25 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Introduction[[introduction]]
-
-<CourseFloatingBanner
-    chapter={3}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-În [Chapter 2](/course/chapter2) am explorat cum să folosim tokenizeri și modele pretrained pentru a face predicții. Dar dacă vrei să faci fine-tune un model pre-trained pentru propriul dataset? Acesta e subiectul acestui capitol. Vei învăța:
-
-{#if fw === 'pt'}
-* Cum să pregătiți un dataset mare din Hub
-* Cum să folosiți API-ul `Trainer` pentru a face fine-tune unui model
-* Cum să creați o buclă de antrenare personalizată
-* Cum să beneficiați de biblioteca 🤗 Accelerate pentru a rula ușor această bucla de antrenare personalizare pe orice configurare distribuită.
-
-{:else}
-* Cum să pregătiți un datasetmare din Hub
-* Cum să folosiți Keras să faceți fine-tune unui model
-* Cum să folosiți Keras pentru a obține predicții
-* Cum să folosiți un indicator custom
-
-{/if}
-Pentru a încărca checkpoint-urile antrenate pe Hugging Face Hub, veți avea nevoie de un cont la huggingface.co: [creați un cont](https://huggingface.co/join)
\ No newline at end of file
diff --git a/chapters/ro/chapter3/2.mdx b/chapters/ro/chapter3/2.mdx
deleted file mode 100644
index 8d6cc6c4c..000000000
--- a/chapters/ro/chapter3/2.mdx
+++ /dev/null
@@ -1,393 +0,0 @@
-`<FrameworkSwitchCourse {fw} />`
-
-# Procesarea datelor [[processing-the-data]]
-
-{#if fw === 'pt'}
-
-<CourseFloatingBanner chapter={3}
-    classNames="absolute z-10 right-0 top-0"
-    notebooks={[
-        {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter3/section2_pt.ipynb"},
-        {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter3/section2_pt.ipynb"},
-]} />
-{:else}
-
-<CourseFloatingBanner chapter={3}
-
-classNames="absolute z-10 right-0 top-0"
-    notebooks={[
-        {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter3/section2_tf.ipynb"},
-        {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter3/section2_tf.ipynb"},
-]} />
-
-{/if}
-
-{#if fw === 'pt'}
-Continuând cu exemplul din [capitol anterior](/course/chapter2), mai jos vedeți cum putem să antrenăm un sequence classifier pe un singur batch în PyTorch:
-
-```python
-import torch
-from transformers import AdamW, AutoTokenizer, AutoModelForSequenceClassification
-
-checkpoint = "bert-base-uncased"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
-
-sequences = [
-    "Am așteptat toată viața mea pentru un curs HuggingFace.",
-    "Acest curs este fascinant!",
-]
-batch = tokenizer(sequences, padding=True, truncation=True, return_tensors="pt")
-
-# Acesta este nou
-batch["labels"] = torch.tensor([1, 1])
-
-optimizer = AdamW(model.parameters())
-loss = model(**batch).loss
-loss.backward()
-optimizer.step()
-```
-{:else}
-Continuând cu exemplul din [capitolul anterior](/course/chapter2), mai jos vedeți cum continuăm antrenarea unui sequence classifier pe un batch în TensorFlow:
-
-```python
-import tensorflow as tf
-import numpy as np
-from transformers import AutoTokenizer, TFAutoModelForSequenceClassification
-
-# Același lucru ca dinainte
-checkpoint = "bert-base-uncased"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint)
-sequences = [
-    "Am așteptat toată viața mea pentru un curs HuggingFace.",
-    "Acest curs este fascinant!",
-]
-batch = dict(tokenizer(sequence, padding=True, truncate=True, return_tensors="tf"))
-
-
-# Aceasta este nou
-model.compile(optimizer="adam", loss="sparse_categorical_crossentropy")
-etichete = tf.convert_to_tensor([1, 1])
-model.train_on_batch(batch, etichete)
-```
-
-De obicei, antrenarea modelului pe două propoziții nu va da rezultate foarte bune. Pentru a obține rezultate mai bune, veți avea nevoie să pregătiți un dataset mai mare.
-
-În această secțiune vom folosi ca exemplu datasetul MRPC (Microsoft Research Paraphrase Corpus), introdus într-un [articol](https://www.aclweb.org/anthology/I05-5002.pdf) de William B. Dolan și Chris Brockett. Datasetul constă din 5,801 perechi de propoziții, cu o etichetă care indică dacă sunt paraphraseuri sau nu (adică dacă ambele propoziții au același înțeles). Am selectat-o pentru acest capitoldeoare că este un dataset mic, așa încât să fie ușor de experimentat cu antrenarea pe el.
-
-### Încărcarea unui dataset din Hub[[loading-a-dataset-from-the-hub]]
-
-{#if fw === 'ro'}
-<Youtube id="_BZearw7f0w"/>
-{:else}
-<Youtube id="W_gMJF0xomE"/>
-{/if}
-
-Hub-ul nu conține doar modele; de asemenea, conține multiple dataseturi înm mai multe limbi. Puteți naviga prin seturile de date [aici](https://huggingface.co/datasets), și vă recomandăm să încercați să încărcați și procurați un nou dataset odată ce veți fi trecut prin această secțiune (vedeți documentația generală [aici](https://huggingface.co/docs/datasets/loading)). Dar pentru moment, să ne concentrăm pe datasetul MRPC! Este una dintre cele 10 seturi de date care compun benchmark-ul [GLUE](https://gluebenchmark.com/), care este un benchmark academic folosit pentru a măsura performanța modelelor ML în 10 diferite sarcini de clasificare a textului.
-
-Biblioteca 🤗 Datasets oferă o comandă foarte simplă pentru a descărca și a stoca un dataset din Hub. Putem să instalăm datasetul MRPC astfel:
-
-<Tip>
-⚠️ **Avertizare** Asigurați-vă că `datasets` este instalat prin rularea `pip install datasets`. Apoi, încărcați dataset-ul MRPC și printați-l pentru a vedea ce conține.
-</Tip>
-
-```py
-from datasets import load_dataset
-
-raw_datasets = load_dataset("glue", "mrpc")
-raw_datasets
-```
-
-```python out
-DatasetDict({
-    train: Dataset({
-        features: ['sentence1', 'sentence2', 'label', 'idx'],
-        num_rows: 3668
-    })
-    validation: Dataset({
-        features: ['sentence1', 'sentence2', 'label', 'idx'],
-        num_rows: 408
-    })
-    test: Dataset({
-        features: ['sentence1', 'sentence2', 'label', 'idx'],
-        num_rows: 1725
-    })
-})
-```
-
-Ai observat că am obținut un obiect `DatasetDict` care conține setul de antrenare, setul de validare și setul de testare. Fiecare dintre acestea conține câteva coloane (`sentence1`, `sentence2`, `label`, și `idx`) și o numpăr de rânduri variabil, care reprezintă numărul de elemente în fiecare set (astfel, există 3.668 perechi de fraze în setul de antrenare, 408 în setul de validare și 1.725 în setul de testare).
-
-Acest comandă descarcă și face cache datasetului, în *~/.cache/huggingface/datasets*(folderul implicit de salvare). În capitolul 2, am văzut cum putem personaliza folderul de cache stabilind variabila de mediu `HF_HOME`.
-
-Putem accesa fiecare pereche de fraze din obiectul `raw_datasets` prin indexare, asemenea unui dicționar:
-
-```py
-raw_train_dataset = raw_datasets["train"]
-raw_train_dataset[0]
-```
-
-```python
-{'idx': 0,
- 'label': 1,
- 'sentence1': 'Amrozi l-a acuzat pe fratele său, pe care l-a numit „martorul” , că distorsionează intenționat probele sale.',
- 'sentence2': 'Referindu-se la el doar sub numele de " martorul ", Amrozi l-a acuzat pe fratele său că distorsionează intenționat probele sale.'}
-```
-
-Putem vedea că labels sunt numere întregi, așadar nu vom trebui să facem nicio procesare în acest sens. Pentru a ști care număr întreg corespunde cu care label, putem inspecta variabila `features` al 'raw_train_dataset'. Acest lucru ne va spune tipul fiecărui coloană.
-
-```py
-raw_train_dataset.features
-```
-
-```python out
-{'sentence1': Value(dtype='string', id=None),
- 'sentence2': Value(dtype='string', id=None),
- 'label': ClassLabel(num_classes=2, names=['not_equivalent', 'equivalent'], names_file=None, id=None),
- 'idx': Value(dtype='int32', id=None)}
-```
-
-În spatele, `label` este obiect de tip `ClassLabel`, iar maparea numerelor întregi la numele label-ului este stocat în folderele *names*. Astfel, `0` corespunde cu `not_equivalent`, iar `1` corespunde cu `equivalent`.
-
-<Tip>
-
-✏️ **Încercați-o!** Arată elementul 15 din setul de antrenament și elementul 87 din setul de validare. Care sunt label-urile acesotra?
-
-</Tip>
-
-### Preprocessing un datset[[preprocessing-a-dataset]]
-
-{#if fw === 'pt'}
-<Youtube id="0u3ioSwev3s"/>
-{:else}
-<Youtube id="P-rZWqcB6CE"/>
-{/if}
-
-Pentru a prelucra datele, trebuie să convertim textul în numere pe care modelul le poate înțelege. Cum ai văzut în [capitol anterior](/course/chapter2), acest lucru se face cu ajutorul unui tokenizer. Putem să oferim tokenizerului o propoziție sau o listă de propoziții, așa că putem să tokenizăm direct toate primele propoziții și toate cele de-a doua propoziții ale fiecărei perechi în felul următor:
-
-```py
-from transformers import AutoTokenizer
-
-checkpoint = "bert-base-uncased"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-tokenized_sentences_1 = tokenizer(raw_datasets["train"]["sentence1"])
-tokenized_sentences_2 = tokenizer(raw_datasets["train"]["sentence2"])
-```
-
-Însă nu putem să transmitem doar două propoziții către model și să obținem o predicție dacă cele două propoziții sunt parafraze sau nu. Trebuie să controlăm cele două secvențe ca o pereche, apoi să le aplicăm preprocesarea adecvată. Norocul este că tokenizer-ul poate lua o pereche de propoziții și le poate pregăti în felul în care modelul BERT îl așteaptă: 
-
-```py
-inputs = tokenizer("Aceasta este prima propoziție.", "Aceasta este a doua.")
-inputs
-
-```
-
-```python out
-{ 
-  'input_ids': [101, 2023, 2003, 1996, 2034, 6251, 1012, 102, 2023, 2003, 1996, 2117, 2028, 1012, 102],
-  'token_type_ids': [0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1],
-  'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]
-}
-```
-
-Am discutat despre `input_ids` și `attention_mask` cheii în [Capitolul 2](/course/chapter2), dar am întârziat cu abordarea cheii `token_type_ids`. În acest exemplu, această cheie este ceea ce spune modelului care parte a inputului este prima propoziție și care este a doua.
-
-<Tip>
-✏️ **Încercați!** Luați elementul 15 din setul de antrenare și tokenizați cele două propoziții separat și ca o pereche. Care este diferența dintre rezultatele celor două? 
-</Tip>
-
-Dacă facem decode ID-urilor din `input_ids` înapoi la cuvinte:
-
-```python
-tokenizer.convert_ids_to_tokens(inputs["input_ids"])
-```
-
-Noi vom obține următorul rezultat:
-
-```python
-['[CLS]', 'acesta', 'este', 'prima', 'propoziție', '.', '[SEP]', 'acesta', 'este', 'a', 'doua', '.', '[SEP]']
-```
-
-Prin urmare, modelul așteaptă ca inputul să fie în forma `[CLS] sentence1 [SEP] sentence2 [SEP]` atunci când există două propoziții. Aliniind această informație cu `token_type_ids`, obținem:
-
-```python
-['[CLS]', 'acesta', 'este', 'prima', 'propoziție', '.', '[SEP]', 'acesta', 'este', 'a', 'doua', '.', '[SEP]']
-[      0,      0,    0,     0,       0,          0,   0,       0,      1,    1,     1,        1,     1,   1,       1]
-```
-
-Observăm,că inputul corespunzător `[CLS] sentence1 [SEP]` au toate un token type ID de `0`, în timp ce celelalte părți, corespunzătoare `sentence2 [SEP]`, au toate un token type ID de `1`.
-
-Înțelegem că dacă selectăm alt checkpoint al modelului, nu vom avea neapărat `token_type_ids` în inputurile tokenizate (de exemplu, ele nu sunt returnate dacă folosim un model DistilBERT). Acestea sunt returnate doar atunci când modelul știe ce să facă cu ele, pentru că le-a văzut în timpul pretrainingului.
-
-În acest caz, BERT este antrenat cu token type IDs și pe lângă the masked language modeling objective despre care am vorbit în [Capitolul 1](/course/chapter1), are un objective suplimentar numit _next sentence prediction_. Objectiveul este destinat modelării relației între perechi de propoziții.
-
-Cu următoare predicție a propoziției, modelului i se prezintă perechi de propoziții (cu masked tokens aleatoriu) și i se cere să prezică dacă a doua propoziție urmează primei. Pentru a face sarcina non-trivial, în jumătate dintre cazuri propizițiie urmează una pe alta în documentul original din care au fost extrase și cealaltă jumătate ele vin de la două documente diferite.
-
-În general, nu trebuie să vă faceți griji dacă există sau nu `token_type_ids` în inputurile tokenizate: atât timp cât folosiți aceelași checkpoint al modelului și a tokenizer-ului, totul va fi bine, pentru că tokenizer-ul știe ce are de oferit modelului.
-
-Acum că am văzut cum poate prelucra tokenizer-ul o pereche de propoziții, îl putem folosi acest lucru pentru a tokeniza întregul nostru dataset: exact ca în [capitolul anterior](/course/chapter2), putem să oferim tokenizer-ului o listă de perechi de propoziții oferindu-i prima listă de propoziții și apoi lista a doua. Acest lucru este compatibil cu padding-ul și truncation-ul pe care le-am văzut în [Capitolul 2](/course/chapter2). În felul acesta putem prelucra datasetul de antrenare astfel:
-
-```py
-tokenized_dataset = tokenizer(
-    raw_datasets["train"]["sentence1"],
-    raw_datasets["train"]["sentence2"],
-    padding=True,
-    truncation=True,
-)
-```
-
-Această metodă funcționează bine, dar are dezavantajul că returnează un dicționar (cu key-urile noastre, `input_ids`, `attention_mask`, și `token_type_ids` și valori care sunt liste de liste). Va funcționa doar dacă aveți destul de RAM pentru a stoca întreg dataset în tokenizării acestuia (iar dataset-urile din biblioteca 🤗 Datasets sunt fișiere [Apache Arrow](https://arrow.apache.org/) stocate pe disc, deci tu stochezi numai sample-urile pe care le ceri să se păstreaze în memorie).
-
-Acum că am înțeles modul în care tokenizer-ul nostru poate gestiona o pereche de fraze, putem folosi el pentru a tokenize întregul nostru set de date: la fel cum am făcut în [capitolul anterior](/course/chapter2), putem alimenta tokenizer-ul cu lista de prime fraze și apoi lista de fraze secunde. Această metodă este compatibilă și cu opțiunile de umplere și tăiere pe care le-am văzut în [Capitolul 2](/course/chapter2). Astfel, una dintre modalitățile prin care putem preprocesa dataset-ul de antrenare este:
-
-```py
-tokenized_dataset = tokenizer(
-    raw_datasets["train"]["sentence1"],
-    raw_datasets["train"]["sentence2"],
-    padding=True,
-    truncation=True,
-)
-```
-
-Această metodă funcționează bine, dar are dezavantajul că returnează un dicționar (cu cheile noastre, `input_ids`, `attention_mask`, și `token_type_ids`, și valori care sunt liste de liste). Va fi disponibilă doar dacă aveți suficient spațiu de memorie pentru a stoarca întregul set de date în timpul tokenizării (în timp ce dataset-urile din biblioteca 🤗 Datasets se salvează sub forma [Apache Arrow](https://arrow.apache.org/), fișiere stocate pe disch, astfel încât doar acele fragmente ale datelor pe care le cerem să fie încărcate în memorie).
-
-Pentru a păstra datele în forma de dataset, vom folosi metoda [`Dataset.map()`](https://huggingface.co/docs/datasets/package_reference/main_classes#datasets.Dataset.map). Aceasta ne permite puțin mai multă flexibilitate, dacă ne trebuie mai multă preprocesare pe lângă tokenization. Metoda `map()` aplică o funcție asupra fiecărui element al datasetului, astfel putem să definim o funcție care tokenizează input-urile noastre:
-
-```py
-def tokenize_function(example):
-    return tokenizer(example["sentence1"], example["sentence2"], truncation=True)
-```
-
-Această funcție i-a un dicționar (ca și elementele datasetului) și returnează un nou dicționar cu key-urile `input_ids`, `attention_mask`, și `token_type_ids`. Acesta va lucra chiar și dacă dicționarul "example" conține câteva sample-uri(fiecare key ca o list de propoziții), întrucât "tokenizer"-ul lucrează și cu liste cu perechi de propoziții cum am văzut mai devreme. Aceasta va permite folosirea opțiunii `batched=True` în apelul funcției `map()`, ceea ce va accelera semnificativ tokenizarea. `Tokenizer`-ul nostru este susținut de un tokenizer scris în Rust din biblioteca [🤗 Tokenizers](https://github.com/huggingface/tokenizers). Acest tokenizer poate fi extrem de rapid, dar numai dacă îi dăm multe inputuri odată.
-
-*Atenție*:Am omis argumentul `padding` din funcția noastră de tokenizare pentru moment. Acest lucru este datorat faptului că aplicarea padding-ului tuturor elementelor cu lungimea maximă nu este eficientă: în schimb, este mai bine să faceți padding elementelor atunci când creați un batch, astfel încât să vă trebuiască doar să faceți padding până la lungimea maximă doar în acest batch și nu întregului dataset. Acest lucru poate salva mult timp și resurse atunci când input-urile au lungimi foarte variabile.
-
-Aici este modul în care aplicăm funcția de tokenizare asupra tuturor dataset-urilor noastre. Folosim `batched=True` în apelul funcției `map` astfel încât funcția să fie aplicată asupra mai multor elemente ale datasetului odată. Aceasta permite preprocesarea accelerată.
-
-```py
-tokenized_datasets = raw_datasets.map(tokenize_function, batched=True)
-tokenized_datasets
-```
-
-Modul în care biblioteca 🤗 Datasets aplică această procesare este prin adăugarea de noi câmpuri la dataset-uri, unul pentru fiecare key din dicționarul returnat de funcția de preprocesare:
-
-```python out
-DatasetDict({
-    train: Dataset({
-        features: ['attention_mask', 'idx', 'input_ids', 'label', 'sentence1', 'sentence2', 'token_type_ids'],
-        num_rows: 3668
-    })
-    validation: Dataset({
-        features: ['attention_mask', 'idx', 'input_ids', 'label', 'sentence1', 'sentence2', 'token_type_ids'],
-        num_rows: 408
-    })
-    test: Dataset({
-        features: ['attention_mask', 'idx', 'input_ids', 'label', 'sentence1', 'sentence2', 'token_type_ids'],
-        num_rows: 1725
-    })
-})
-```
-
-Puteți chiar și folosi multiprocessing când aplicați funcția de preprocesare cu `map()` prin folosirea unui argument `num_proc`. Nu am făcut acest lucru aici pentru că biblioteca 🤗 Tokenizers utilizează deja mai multe thread-uri pentru a tokeniza sample-urile mai rapid, dar dacă nu folosiți un tokenizer rapid cu această bibliotecă, acest lucru v-ar putea accelera preprocesarea.
-
-Funcția `tokenize_function` returnează un dicționar cu key-urile `input_ids`, `attention_mask`, și `token_type_ids`, astfel că aceste trei câmpuri sunt adăugate tuturor split-urilor în dataset-urile noastre. Notați-vă că am putea chiar schimba câmpurile existente dacă funcția de preprocesare ar returna o nouă valoare pentru un key din dataset-ul pe care aplicăm `map()`.
-
-Ultimul lucru pe care trebuie să îl facem este să facem padding tuturor exemplelor până la lungimea celui mai mare element atunci când facem batch elementelor împreună – o tehnică pe care o denumim *dinamic padding*.
-
-### Dinamic Padding[[dynamic-padding]]
-<Youtube id="7q5NyFT8REg"/>
-{#if fw === 'pt'}
-
-Funcția care este responsabilă de a pune împreună sample-urile într-un batch se numește *collate function*. Este un argument default pe care puteți să-l transmiteți când construiți un `DataLoader`, valoarea implicită fiind o funcție care va converti sample-urile în tensors PyTorch și le va concatena (recursiv dacă elementele dumneavoastră sunt liste, tuple-uri sau dicționare). Acest lucru nu este posibil în cazul nostru deoarece input-urile noastre nu vor avea toate aceeași dimensiune. Am amânat intenționat padding-ul pentru a o aplica numai atunci când e nevoie, pe fiecare batch și să evităm astfel exemplele cu lungimi prea mari cu multe padding-uri. Acest lucru va accelera antrenarea, dar notați-vă că dacă antrenați pe un TPU, acest lucru poate cauza probleme – TPU-urile preferă forme fixe, chiar dacă aceasta înseamnă padding suplimentar.
-
-{:else}
-
-Funcția care este responsabilă de a pune împreună sample-urile într-un batch se numește *collate function*. Collator-ul default este o funcție ce va transforma sample-urile în tf. Faceți Tensor și concatenațile (recursiv dacă elementele dumneavoastră sunt liste, tuple-uri sau dicționare). Acest lucru nu este posibil în cazul nostru deoarece input-urile noastre nu vor avea toate aceeași dimensiune. Am amânat intenționat padding-ul pentru a o aplica numai atunci când e nevoie, pe fiecare batch și să evităm astfel exemplele cu lungimi prea mari cu multe padding-uri. Acest lucru va accelera antrenarea, dar notați-vă că dacă antrenați pe un TPU, acest lucru poate cauza probleme – TPU-urile preferă forme fixe, chiar dacă aceasta înseamnă padding suplimentar.
-
-{/if}
-
-Pentru a face acest lucru, trebuie să definim o funcție collate care va aplica cantitatea corectă de padding pentru elementele din dataset-ul pe care vrem să-i facem batch. Norocul este că biblioteca 🤗 Transformers ne oferă o asemenea funcție prin `DataCollatorWithPadding`. Aceasta i-a un tokenizer atunci când o inițializați(pentru a ști care padding token să folosim și dacă modelul se așteaptă ca padding-ul să fie pe stânga sau dreapta inputu-lui) și va face tot ce este nevoie:
-{#if fw === 'pt'}
-```py
-from transformers import DataCollatorWithPadding
-data_collator = DataCollatorWithPadding(tokenizer=tokenizer)
-```
-{:else}
-```py
-from transformers import DataCollatorWithPadding
-data_collator = DataCollatorWithPadding(tokenizer=tokenizer, return_tensors="tf")
-```
-{/if}
-
-Pentru a testa acest nou jucărie, să luăm câteva sample-uri din setul nostru de antrenare pe care am dori să le facem batch împreună. Aici, ștergem coloanele `idx`, `sentence1` și `sentence2` deoarece nu vor fi necesare și conțin stringuri (și nu putem crea tensore cu stringuri) și uitați-vă la lungimile fiecărui element din lotul nostru:
-
-```py
-samples = tokenized_datasets["train"][:8]
-samples = {k: v for k, v in samples.items() if k not in ["idx", "sentence1", "sentence2"]}
-[len(x) for x in samples["input_ids"]]
-```
-
-```python out
-[50, 59, 47, 67, 59, 50, 62, 32]
-```
-
-Nu e de mirare că obținem sample-uri de lungimi diferite, între 32 și 67. Dynamic padding înseamnă că sample-urilor din acest batch le-ar trebui aplicate padding cu o lungime de 67, lungimea cea mai mare din batch. Fără Dynamic padding, toate sample-urile ar fi avut padding cu maximul lungimii din întregul dataset sau maximul lungimii pe care modelul poate accepta. Să verificăm încă o dată dacă `data_collator`-ul nostru face dynamic padding pe batch:
-
-```py
-batch = data_collator(samples)
-{k: v.shape for k, v in batch.items()}
-```
-
-{#if fw === 'tf'}
-
-```python out
-{'attention_mask': TensorShape([8, 67]),
- 'input_ids': TensorShape([8, 67]),
- 'token_type_ids': TensorShape([8, 67]),
- 'labels': TensorShape([8])}
-```
-
-{:else}
-
-```python out
-{'attention_mask': torch.Size([8, 67]),
- 'input_ids': torch.Size([8, 67]),
- 'token_type_ids': torch.Size([8, 67]),
- 'labels': torch.Size([8])}
-```
-
-Looking good! Acum că am trecut de la textul raw la batch-uri pe care modelul nostru poate să le proceseze, suntem gata să îi facem fine-tune!
-
-{/if}
-
-<Tip>
-
-✏️ **Încearcă-ți norocul!** Implementează preprocesarea datelor pe dataset-ul GLUE SST-2. Acesta se diferență puțin deoarece nu conține perechi de propoziții, ci doar câte o propoziție, dar ceea ce am făcut ar trebui să rămână neschimbat. Pentru o provocare mai grea, încearcă să scrii o funcție de preprocesare care se aplică oricărui task GLUE.
-
-</Tip>
-
-{#if fw === 'tf'}
-
-Acum că avem dataset-ul nostru și un `data_collator`, este timpul să-i punem la lucru. În loc să încărcăm manual batch-urile și să le facem collate, asta însemnând prea mult lucru și, nu ar fi nici prea performantă. În schimb, există o metodă simplă care oferă o soluție performantă la acest problemă: `to_tf_dataset()`. Acest lucru va face wrap unui `tf.data.Dataset` în jurul datasetului nostru, cu o fucție opțională de collation. `tf.data.Dataset` este un format nativ TensorFlow pe care Keras-ul o poate folosi pentru `model.fit()`, astfel încât această metodă face convert unui 🤗 Dataset la un format gata să fie antrenat. Hai să-l vedem în acțiune cu datasetul nostru!
-
-```py
-tf_train_dataset = tokenized_datasets["train"].to_tf_dataset(
-    columns=["attention_mask", "input_ids", "token_type_ids"],
-    label_cols=["labels"],
-    shuffle=True,
-    collate_fn=data_collator,
-    batch_size=8,
-)
-
-tf_validation_dataset = tokenized_datasets["validation"].to_tf_dataset(
-    columns=["attention_mask", "input_ids", "token_type_ids"],
-    label_cols=["labels"],
-    shuffle=False,
-    collate_fn=data_collator,
-    batch_size=8,
-)
-```
-
-Și asta e tot! Putem lua aceste dataset-uri pentru următoarea lecție, unde antrenamentul va fi ușor după toată munca depusă pentru prelucrarea datelor.
-
-{/if}
\ No newline at end of file
diff --git a/chapters/ro/chapter3/3.mdx b/chapters/ro/chapter3/3.mdx
deleted file mode 100644
index df987c810..000000000
--- a/chapters/ro/chapter3/3.mdx
+++ /dev/null
@@ -1,174 +0,0 @@
-
-<FrameworkSwitchCourse {fw} />
-
-# Fine-tuningul unui model cu API-ul Trainer[[fine-tuning-a-model-with-the-trainer-api]]
-
-<CourseFloatingBanner chapter={3}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[ 
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter3/section3.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter3/section3.ipynb"},
-]} />
-
-<Youtube id="nvBXf7s7vTI"/>
-
-🤗 Transformers oferă o clasă `Trainer` pentru a vă ajuta să faceți fine-tune pe oricare dintre modelurile preantrenate pe care le oferă pe datasetul dvs. Odată ce ați terminat preprocesarea datelor din ultima secțiune, mai aveți doar câteva pași rămași pentru a defini `Trainerul`. Partea cea mai grea este probabil pregătirea environmentul pentru a rula `Trainer.train()`, deoarece va lua mult timp pe un CPU. Dacă nu aveți niciun GPU configurat, puteți accesa gratuit GPUuri sau TPUuri pe [Google Colab](https://colab.research.google.com/).
-
-Exemplele de cod de mai jos presupune că ați executat exemplele din secțiunea anterioară. Aici este o scurtă recapitulare despre ce aveți nevoie:
-
-```py
-from datasets import load_dataset
-from transformers import AutoTokenizer, DataCollatorWithPadding
-
-raw_datasets = load_dataset("glue", "mrpc")
-checkpoint = "bert-base-uncased"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-
-
-def tokenize_function(example):
-    return tokenizer(example["sentence1"], example["sentence2"], truncation=True)
-
-
-tokenized_datasets = raw_datasets.map(tokenize_function, batched=True)
-data_collator = DataCollatorWithPadding(tokenizer=tokenizer)
-```
-
-### Antrenarea[[training]]
-
-Înainte de a putea defini `Trainerul`, trebuie să definim o clasă `TrainingArguments` care va conține toți hyperparameters pe care `Trainer` le va folosi pentru antrenare și evaluare. Singurul argument pe care trebuie să-l oferiți este un folder în care modelul anternat va fi salvat, precum și checkpointurile de-a lungul drumului. Toate celelalte pot fi lăsate ca valori default, care ar trebui să funcționeze destul de bine pentru un fine-tune de bază.
-
-```py
-from transformers import TrainingArguments
-
-training_args = TrainingArguments("test-trainer")
-```
-
-<Tip>
-
-💡 Dacă doriți să încărcați automat modelul pe Hub în timpul antrenării, transmiteți `push_to_hub=True` în `TrainingArguments`. Ne vom întoarce la acest subiect în [Capitolul 4](/course/chapter4/3)
-
-</Tip>
-
-A doua etapă este definiția modelului nostru. Ca în capitolul anterior, vom folosi clasa `AutoModelForSequenceClassification`, cu două labeluri:
-
-```py
-from transformers import AutoModelForSequenceClassification
-
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
-```
-
-Observăm că, spre deosebire de [Capitolul 2](/course/chapter2), se emite o avertizare după crearea acestui model preantrenat. Acest lucru este datorit faptului că BERT nu a fost antrenat pentru clasificarea perechilor de propoziții, astfel încât headul modelului preantrenat a fost eliminat și un nou head adecvat pentru clasificarea secvențelor a fost adăugat în loc. Avertizările indică faptul că anumite weights nu au fost utilizate (cele care corespundeau headului eliminat) și celelalte au fost inițializate aleatoriu (cele pentru noul head). Aceasta se termină cu o recomandare de a antrena modelul, ceea ce vom face acum.
-
-Odată ce am definit modelul nostru, putem defini `Trainer` prin transmiterea tuturor obiectelor construite până acum — `model`, `training_args`, a training și validation datasets, `data_collator`, și `tokenizer`:
-
-```py
-from transformers import Trainer
-
-trainer = Trainer(
-    model,
-    training_args,
-    train_dataset=tokenized_datasets["train"],
-    eval_dataset=tokenized_datasets["validation"],
-    data_collator=data_collator,
-    tokenizer=tokenizer,
-)
-```
-
-Observăm că, dacă transmitem `tokenizer`, atunci defaultul `data_collator` folosit de `Trainer` va fi un `DataCollatorWithPadding` similar celui definit mai devreme. Din acest motiv, puteți omite linia `data_collator=data_collator` aici. A fost important să vă arătăm această parte în secțiunea 2!
-
-Pentru a face fine-tune modelului pe datasetul nostru, trebuie să apelăm metoda `train()` a `Trainerului`:
-
-```py
-trainer.train()
-```
-
-Acest lucru va începe fine-tuningul (care ar trebui să dureze câteva minute pe un GPU) și va raporta training loss la fiecare 500 de pași. Totuși, nu va raporta cât de bine sau rău se descurcă modelul. Acest lucru este datorat:
-
-1. Nu am transmis `Trainerului` să efectueze evaluarea în timpul antrenării, prin setarea `evaluation_strategy` la `"steps"` (evaluați la fiecare `eval_steps`) sau `"epoch"` (evaluați la finalul fiecărei epoch).
-2. Nu am oferit `Trainerului` o funcție `compute_metrics()` pentru a calcula metricele în timpul evaluări(altminter evalurea ar fi printat doar lossul, care nu este un număr foarte intuitiv).
-
-### Evaluare[[evaluation]]
-
-Să vedem cum putem construi o funcție `compute_metrics()` folositoare și să o utilizăm la următoarea antrenare. Funcția trebuie să primească obiectul `EvalPrediction` (un named tuple cu fieldul `predictions` și altul `label_ids`) și să returneze un dicționar ce le asociază făcând mapping valorilor string la valori float (stringurile fiind denumirile metricelor returnate, și valorile floats al acestora). Pentru a obține câteva predicții din model, putem folosi comanda `Trainer.predict()`:
-
-```py
-predictions = trainer.predict(tokenized_datasets["validation"])
-print(predictions.predictions.shape, predictions.label_ids.shape)
-```
-
-```python out
-(408, 2) (408,)
-```
-
-Outputul metodei `predict()` este un named tuple  cu trei fielduri: `predictions`, `label_ids` și `metrics`. Câmpul `metrics` va conține doar lossul asupra datasetului transmis, precum și o serie de metrice de timp (cât de mult a luat prezicerea și timpul mediu). Odată ce vom completa funcția `compute_metrics()` și îl vom oferi `Trainerului`, atunci acel field va conține și metricele returnate de `compute_metrics()`.
-
-După cum puteți vedea, `predictions` este un array bi-dimensional cu shapeul 408x2 (408 fiind numărul de elemente în datasetul folosit). Acestea sunt logiturile pentru fiecare element al datasetului pe care le-am oferit funcției `predict()` (cum ați văzut în [capitolul anterior](/course/chapter2), toate modelel Transformer returneă logituri). Pentru a le transforma în predicții pe care să le comparăm cu labelurile noastre, noi trebui să luăm indexul cu cea mai mare valoare pe axa a doua:
-
-
-```py
-import numpy as np
-
-preds = np.argmax(predictions.predictions, axis=-1)
-```
-
-Acum putem compara `preds` cu labelurile. Ca să construim funcțioa noastră `compute_metric()`, o să ne bazăm pe metricele de la librăria 🤗 [Evaluate](https://github.com/huggingface/evaluate/). Putem încărca metricele asociate cu datasetul MRPC la fel de ușor cum am încărcat datasetul, de data asta cu funcția `evaluate.load()`. Obiectul returnat are o metodă `compute()` pe care o putem folosi ca să facem calcularea metricelor:
-
-```py
-import evaluate
-
-metric = evaluate.load("glue", "mrpc")
-metric.compute(predictions=np.argmax(predictions.predictions, axis=-1), references=predictions.label_ids)
-```
-
-```python out
-{'accuracy': 0.8578431372549019, 'f1': 0.8996539792387542}
-```
-
-Rezultatele exacte pe care le veți obține pot varia, deoarece inițializarea aleatoare a headului modelului care poate schimba metricele pe care le-a atins. Aici putem vedea că modelul nostru are o precizie de 85.78% în setul de validare și un scor F1 de 89.97. Acestea sunt exact aceleași metrice folosite pentru evaluarea rezultatelor pe datasetul MRPC pentru GLUE benchmark. Tabelul din [BERT Paper](https://arxiv.org/pdf/1810.04805.pdf) a raportat un scor F1 de 88.9 pentru modelul de bază. Acela a fost un `uncased` model, dar noi utilizăm acum un `cased` model, ceea ce explică rezultatul mai bun.
-
-Pentru a reuni toate acestea într-o singură funcție `compute_metrics()`, putem scrie:
-
-```py
-def compute_metrics(eval_preds):
-    metric = evaluate.load("glue", "mrpc")
-    logits, labels = eval_preds
-    predictions = np.argmax(logits, axis=-1)
-    return metric.compute(predictions=predictions, references=labels)
-```
-
-Să vedem acum cum putem utiliza această funcție pentru a raporta metricele la sfârșitu fiecărei epoch, mai jos puteți vedea cum definim un nou `Trainer` cu funcția compute:
-
-```py
-training_args = TrainingArguments("test-trainer", evaluation_strategy="epoch")
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
-
-trainer = Trainer(
-    model,
-    training_args,
-    train_dataset=tokenized_datasets["train"],
-    eval_dataset=tokenized_datasets["validation"],
-    data_collator=data_collator,
-    tokenizer=tokenizer,
-    compute_metrics=compute_metrics,
-)
-```
-
-Observăm că am creat un nou `TrainingArguments` cu `evaluation_strategy` setat la `"epoch"` și o nouă instanță a modelului. În cazul nostru, ar fi fost suficient să continuam antrenarea prezentată anterior.
-
-Pentru a lansa o nouă antrenare, putem executa:
-
-```py
-trainer.train()
-```
-
-De data aceasta, acesta va raporta validation loss și metricele la sfârșitul fiecărui epocă pe lângă training loss. Dar acuratețea/scorul F1 pe care îl atingeți poate fi puțin diferit față de ceea ce am găsit, datorită inițializării aleatoare a headului modelului, dar ar trebui să nu difere foarte mult.
-
-`Trainerul` va funcționa în mod automat pe mai multe GPU-uri sau TPU-uri și oferă multe opțiuni, cum ar fi mixed-precision training(folosiți `fp16 = True` în argumentele de antrenare). Vom discuta despre toate opțiunile pe care le are în Capitolul 10.
-
-Cu aceasta terminăm introducerea fine-tuningului folosind API-ul `Trainer`. Un exemplu de a face acest lucru pentru majoritatea sarcinilor NLP va fi dat în [Capitolul 7](/course/chapter7), dar pentru moment să vedem cum putem face același lucru doar cu PyTorch.
-
-<Tip>
-
-✏️ **Încearcă!** Fă fine-tune unui model pe datasetul GLUE SST-2, folosind procesarea de date efectuată în secțiunea 2.
-
-</Tip>
diff --git a/chapters/ro/chapter3/3_tf.mdx b/chapters/ro/chapter3/3_tf.mdx
deleted file mode 100644
index 146a4b118..000000000
--- a/chapters/ro/chapter3/3_tf.mdx
+++ /dev/null
@@ -1,206 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Aplicarea fine-tuningului asupra unui model cu Keras[[fine-tuning-a-model-with-keras]]
-
-<CourseFloatingBanner chapter={3}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[ 
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter3/section3_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter3/section3_tf.ipynb"},
-]} />
-
-Odată ce ai finalizat toate operațiile de preprocesare a datelor din ultima secțiune, ai doar câțiva pași rămași pentru a antrena modelul. Însă, observați că `model.fit()` va rula foarte lent pe un CPU. Dacă nu aveți un GPU configurat, puteți accesa GPU-uri sau TPUs pe gratis pe [Google Colab](https://colab.research.google.com/).
-
-Exemplele de cod de mai jos presupun că ați executat deja exemplele din secțiunea precedentă. Aici este o scurtă sumarizare care recapitulează ceea ce trebuie să faceți:
-
-```py
-from datasets import load_dataset
-from transformers import AutoTokenizer, DataCollatorWithPadding
-import numpy as np
-
-raw_datasets = load_dataset("glue", "mrpc")
-checkpoint = "bert-base-uncased"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-
-
-def tokenize_function(example):
-    return tokenizer(example["sentence1"], example["sentence2"], truncation=True)
-
-
-tokenized_datasets = raw_datasets.map(tokenize_function, batched=True)
-
-data_collator = DataCollatorWithPadding(tokenizer=tokenizer, return_tensors="tf")
-
-tf_train_dataset = tokenized_datasets["train"].to_tf_dataset(
-    columns=["attention_mask", "input_ids", "token_type_ids"],
-    label_cols=["labels"],
-    shuffle=True,
-    collate_fn=data_collator,
-    batch_size=8,
-)
-
-tf_validation_dataset = tokenized_datasets["validation"].to_tf_dataset(
-    columns=["attention_mask", "input_ids", "token_type_ids"],
-    label_cols=["labels"],
-    shuffle=False,
-    collate_fn=data_collator,
-    batch_size=8,
-)
-```
-
-
-### Antrenare[[antrenare]]
-
-
-Modelele TensorFlow importate din 🤗 Transformers sunt deja modele Keras. Aici este o scurtă introducere în Keras.
-
-<Youtube id="rnTGBy2ax1c"/>
-
-
-Astfel, odată ce avem datele noastre, putem începe antrenarea lor foarte ușor.
-
-
-<Youtube id="AUozVp78dhk"/>
-
-
-În același mod ca și în [capitolul anterior](/course/chapter2), vom folosi clasa `TFAutoModelForSequenceClassification`, cu două labeluri:
-
-```py
-from transformers import TFAutoModelForSequenceClassification
-
-model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
-```
-
-Veți observa că în comparație cu [Capitolul 2](/course/chapter2), veți primi o avertizare după ce inițializați acest model preantrenat. Acest lucru se datorează faptului că BERT nu a fost antrenat pentru clasificarea perechilor de propoziții, astfel încât headul preantrenat al modelului a fost eliminat și un nou head potrivit pentru clasificarea secvențelor a fost adăugat în locul lui. Avertizările indică faptul că anumite weights nu au fost folosite (cele corespunzătoare headului de preantrenare eliminat) și că altele au fost inițializate aleatoriu (cele pentru noul capăt). Avertizarea se încheie prin încurajarea antrenării modelului, ceea ce este exact ceea ce vom face acum.
-
-
-Pentru a face fine-tune modelului pe datasetul nostru, avem de făcut `compile()` modelului și apoi să trasnmitem datele noastre spre metoda `fit()`. Acest lucru va porni procesul de fine-tuning (care ar trebui să dureze câteva minute pe un GPU) și va raporta training loss, plus validation loss la sfârșitul fiecărei epoci.
-
-<Tip>
-
-Observați că modelele 🤗 Transformers au o abilitate specială care nu este disponibilă pentru cele mai multe modele Keras - ele pot folosi automat un appropriate loss pe care le calculează intern. Ele vor utiliza această pierdere implicit dacă nu veți specifica un argument de pierdere în `compile()`. Pentru a folosi internal loss, va trebui să transmiteți labelurile ca parte din input, și nu ca nu label separat, ceea ce este modul normal de utilizare a labelurilor cu modelele Keras. Veți vedea exemple de acest tip în Partea 2 a cursului, unde definirea funcției de loss corecte poate fi dificilă. În cazul sequence classification, însă, o funcție Keras standard pentru loss se va dovedi suficient, astfel o vom folosi în acest context.
-
-</Tip>
-
-
-```py
-from tensorflow.keras.losses import SparseCategoricalCrossentropy
-
-model.compile(
-    optimizer="adam",
-    loss=SparseCategoricalCrossentropy(from_logits=True),
-    metrics=["accuracy"],
-)
-model.fit(
-    tf_train_dataset,
-    validation_data=tf_validation_dataset,
-)
-```
-
-
-<Tip warning={true}>
-
-Observați un pericol comun aici — puteți transmite doar numele pierderii ca un string în Keras, dar implicit Keras va presupune că deja ați aplicat un softmax la outputurile voastre. Multe modele, însă, produc outputurile direct înainte de aplicarea softmaxului, cunoscute și sub numele de *logit*. Trebuie să spuneți funcției loss că asta este ceea ce produce modelul tău, iar singura modalitate de a face acest lucru este de a-o chema direct, în loc de a o specifica numai cu un string.
-
-</Tip>
-
-### Îmbunătățirea performanței de antrenare
-
-<Youtube id="cpzq6ESSM5c"/>
-
-Dacă încerci codul de mai sus, sigur o să ruleze, dar vei constata că lossul scade doar lent sau doar sporadic. Principala cauză
-este *learning rateul*. Așa cum și lossul, când trimitem către Keras numele unui omptimizer ca uin string, Keras inițiază
-acel optimizer cu valori default pentru toți parametrii, inclusiv learning rateul. Din experiență, însă, știm că
-modelele transformer se bucură de un learning rate mult mai mic decât cel default pentru Adam, care este 1e-3, scris și ca 
-10 la puterea -3 sau 0.001. 5e-5 (0.00005), care este aproximativ douăzeci de ori mai mică, reprezintă o bază mult mai bună.
-
-În plus față de reducerea learning rateului, avem un al doilea truc la dispoziție: putem reduce treptat learning rateul
-pe parcursul antrenării. În documentație, vei găsi uneori această practică denumită *decaying* sau *annealing*
-learning rateul. În Keras, cel mai bun mod de a face acest lucru este să folosim un *learning rate scheduler*. O opțiune bună este
-`PolynomialDecay` — deși numele ar putea sugera altceva, cu setările default, el doar face decay liniar learning rateului din valoarea inițială
-până la valoarea finală pe parcursul antrenării; exact ceea ce ne-am dori. Pentru a utiliza corect un scheduler,
-însă, trebuie să-i spunem cât timp va dura antrenarea. Calculăm acest lucru sub forma `num_train_steps` de mai jos.
-
-```py
-from tensorflow.keras.optimizers.schedules import PolynomialDecay
-
-batch_size = 8
-num_epochs = 3
-# Numărul de pași de antrenare este numărul de sampleuri din dataset, împărțit la dimensiunea batchului și apoi înmulțit
-# cu numărul total de epoci. Observăm că `tf_train_dataset` aici este un batched tf.data.Dataset`,
-# nu datasetul original Hugging Face, astfel încât len() să fie deja num_samples // batch_size.
-num_train_steps = len(tf_train_dataset) * num_epochs
-lr_scheduler = PolynomialDecay(
-    initial_learning_rate=5e-5, end_learning_rate=0.0, decay_steps=num_train_steps
-)
-from tensorflow.keras.optimizers import Adam
-
-opt = Adam(learning_rate=lr_scheduler)
-```
-
-<Tip>
-
-Biblioteca 🤗 Transformers are funcția `create_optimizer()` care va crea un optimizer `AdamW` cu learning rate decay. Aceasta este o metodă convenabilă pe care o veți vedea în detaliu în viitoarele sec'iuni ale cursului.
-
-</Tip>
-
-Acum, avem noul nostru optimizer și putem încerca să antrenăm cu el. Începem cu reloadul modelului pentru a reseta modificările pe weighturole de la ultima rundă de antrenare ;o apoi putem face compile cu noul optimizer:
-
-```py
-import tensorflow as tf
-
-model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
-loss = tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True)
-model.compile(optimizer=opt, loss=loss, metrics=["accuracy"])
-```
-
-Acum putem face fit din nou:
-
-```py
-model.fit(tf_train_dataset, validation_data=tf_validation_dataset, epochs=3)
-```
-
-<Tip>
-
-💡 Dacă doriți să încărcați automat modelul dumneavoastră pe Hub în timpul antrenării, puteți transmite `PushToHubCallback` în metoda `model.fit()`. Mai multe despre acest lucru veți învăța în [Capitol 4](/course/chapter4/3).
-
-</Tip>
-
-### Model prediction
-
-<Youtube id="nx10eh4CoOs"/>
-
-
-Încheierea antrenării și observarea lossului scăzând este foarte frumos, dar ce se întămplă dacă doriți să obțineți efectiv outputuruke din modelul antrenat, fie pentru a calcula câteva metrice, fie pentru utilizarea modelului în producție? Pentru asta putem folosi metoda `predict()`. Aceasta va returna *logits* de la output headul al modelului, câte unul pe clasă.
-
-```py
-preds = model.predict(tf_validation_dataset)["logits"]
-```
-
-Puteți converti aceste logituri în predicțiile clasei modelului prin utilizarea `argmax` pentru a găsi logit-ul cel mai mare, care corespunde clasei celei mai probabile:
-
-```py
-class_preds = np.argmax(preds, axis=1)
-print(preds.shape, class_preds.shape)
-```
-
-```python out
-(408, 2) (408,)
-```
-
-Acum, să folosim aceste `preds` pentru a calcula câteva metrici! Puteți încărca metricele asociate cu datasetul MRPC în același mod cum am încărcat și datasetul, dar de data aceasta cu ajutorul funcției `evaluate.load()`. Obiectul returnat are o metodă de calculare `compute()` pe care o putem utiliza pentru a face metric calculation:
-
-```py
-import evaluate
-
-metric = evaluate.load("glue", "mrpc")
-metric.compute(predictions=class_preds, references=raw_datasets["validation"]["label"])
-```
-
-```python out
-{'accuracy': 0.8578431372549019, 'f1': 0.8996539792387542}
-```
-
-Rezultatele exacte pe care le veți obține pot varia, deoarece inițializarea aleatoare a headului modelului care poate schimba metricele pe care le-a atins. Aici putem vedea că modelul nostru are o precizie de 85.78% în setul de validare și un scor F1 de 89.97. Acestea sunt exact aceleași metrice folosite pentru evaluarea rezultatelor pe datasetul MRPC pentru GLUE benchmark. Tabelul din [BERT Paper](https://arxiv.org/pdf/1810.04805.pdf) a raportat un scor F1 de 88.9 pentru modelul de bază. Acela a fost un `uncased` model, dar noi utilizăm acum un `cased` model, ceea ce explică rezultatul mai bun.
-
-Acesta este punctul unde vă prezentăm introducerea la folosirea fine-tuningului cu ajutorul APIului Keras. Un exemplu bun pentru majoritatea sarcinilor NLP va fi dat în [Capitol 7](/course/chapter7). Dacă doriți să dezvoltați abilitățile dumneavoastră pe API-ul Keras, încercați să faceți fine-tune unui model pe datasetul GLUE SST-2 folosind procesarea de date din secvența 2.
\ No newline at end of file
diff --git a/chapters/ro/chapter3/4.mdx b/chapters/ro/chapter3/4.mdx
deleted file mode 100644
index bfb423625..000000000
--- a/chapters/ro/chapter3/4.mdx
+++ /dev/null
@@ -1,361 +0,0 @@
-# O antrenare completă [[a-full-training]]
-
-<CourseFloatingBanner chapter={3}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[ 
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter3/section4.ipynb"}, 
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter3/section4.ipynb"}, 
-]} />
-
-<Youtube id="Dh9CL8fyG80"/>
-
-Acum vom vedea cum putem atinge același rezultat pe care l-am obținut în secțiune anterioară fără a utiliza clasa `Trainer`. Din nou, noi presupunem că ai procesat datele în secțiunea 2. În continuare, găsiți o scurtă sinteză asupra tuturor informațiilor de care aveți nevoie:
-
-```py
-from datasets import load_dataset
-from transformers import AutoTokenizer, DataCollatorWithPadding
-
-raw_datasets = load_dataset("glue", "mrpc")
-checkpoint = "bert-base-uncased"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-
-
-def tokenize_function(example):
-    return tokenizer(example["sentence1"], example["sentence2"], truncation=True)
-
-
-tokenized_datasets = raw_datasets.map(tokenize_function, batched=True)
-data_collator = DataCollatorWithPadding(tokenizer=tokenizer)
-```
-
-### Pregătirea pentru antrenare[[prepare-for-training]]
-
-Înainte de a scrie propriul nostru loop de antrenament, vom avea nevoie să definim câteva obiecte. Primele dintre ele sunt dataloader-urile pe care le vom utiliza pentru a itera peste batch-uri. Dar înainte de a putea defini aceste datealoader-uri, trebuie să aplicăm o anumită postprocesare pe `tokenized_datasets`, pentru a avea grijă de unele lucruri care au fost automatizate de către `Trainer`. În special:
-
-- Eliminăm coloanele corespunzătoare valorilor pe care modelul nu le așteaptă (ca de exemplu, `sentence1` și `sentence2`).
-- Redenumește coloana `label` în `labels`, deoarece modelul așteaptă argumentul să fie numit `labels`.
-- Setăm formatul dataseturilor astfel încât ele să returneze tensore PyTorch în loc de liste.
-
-Metodele noastre `tokenized_datasets` au fiecare unul dintre acești pași:
-
-```py
-tokenized_datasets = tokenized_datasets.remove_columns(["sentence1", "sentence2", "idx"])
-tokenized_datasets = tokenized_datasets.rename_column("label", "labels")
-tokenized_datasets.set_format("torch")
-tokenized_datasets["train"].column_names
-```
-
-Vom verifica că rezultatul conține doar coloanele pe care vor modelul le acceptă:
-
-```python
-["attention_mask", "input_ids", "labels", "token_type_ids"]
-```
-
-Acum că am făcut asta, putem defini cu ușurință dataloader-urile noastre:
-
-```py
-from torch.utils.data import DataLoader
-
-train_dataloader = DataLoader(
-    tokenized_datasets["train"], shuffle=True, batch_size=8, collate_fn=data_collator
-)
-eval_dataloader = DataLoader(
-    tokenized_datasets["validation"], batch_size=8, collate_fn=data_collator
-)
-```
-
-Pentru a verifica rapid că nu există nici o greșeală în procesarea datelor, putem inspecta un batch-ul astfel:
-
-```py
-for batch in train_dataloader:
-    break
-{k: v.shape for k, v in batch.items()}
-```
-
-```python out
-{'attention_mask': torch.Size([8, 65]),
- 'input_ids': torch.Size([8, 65]),
- 'labels': torch.Size([8]),
- 'token_type_ids': torch.Size([8, 65])}
-```
-
-Observați că shapeurile actuale vor fi probabil ușor diferite pentru tine, deoarece am setat `shuffle=True` pentru dataloader-ul de antrenare și am făcut padding batch-urilor la lungime maximă în interiorul lor.
-
-Acum că am terminat complet procesarea datelor (un obiectiv satisfăcător, dar înșelător pentru orice specialist ML), să trecem la model. Îl inițializăm exact ca în secțiunea precedentă:
-
-```py
-from transformers import AutoModelForSequenceClassification
-
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
-```
-
-Pentru a ne asigura că totul va merge bine în timpul antrenamentului, vom transmite batch-ul nostru modelului acesta:
-
-```py
-outputs = model(**batch)
-print(outputs.loss, outputs.logits.shape)
-```
-
-```python out
-tensor(0.5441, grad_fn=<NllLossBackward>) torch.Size([8, 2])
-```
-
-Toate modelele 🤗 Transformers vor returna lossul atunci când `labels` sunt furnizate și vom primi de asemenea logiturile (două pentru fiecare input în batch-ul nostru, deci un tensor cu dimensiunea 8 x 2).
-
-Suntem aproape gata să scriem loopul nostru de antrenament! Doar că ne lipsesc două lucruri: un optimizer și learning rate scheduler. Deoarece încercăm să replicăm ceea ce a făcut `Trainer` manual, vom folosi aceleași argumente default. Optimizerul utilizat de `Trainer` este `AdamW`, care este similar cu Adam, dar cu un twist pentru weight decay regularization (vedeți ["Decoupled Weight Decay Regularization"](https://arxiv.org/abs/1711.05101) de Ilya Loshchilov și Frank Hutter):
-
-```py
-from transformers import AdamW
-
-optimizer = AdamW(model.parameters(), lr=5e-5)
-```
-
-La final, learning rate schedulerul utilizat este un linear decay de la valoarea maximă (5e-5) la 0. Pentru a-l defini cu adevărat, avem nevoie să cunoaștem numărul de pași de antrenament pe care îi vom face, care este numărul de epoci pe care dorim să le rulăm înmulțit cu numărul de batch-uri de antrenare (care este lungimea dataloader-ului de antrenare). `Trainer` folosește trei epoci ca default, deci vom continua cu asta:
-
-```py
-from transformers import get_scheduler
-
-num_epochs = 3
-num_training_steps = num_epochs * len(train_dataloader)
-lr_scheduler = get_scheduler(
-    "linear",
-    optimizer=optimizer,
-    num_warmup_steps=0,
-    num_training_steps=num_training_steps,
-)
-print(num_training_steps)
-```
-
-```python out
-1377
-```
-
-### Training Loop[[the-training-loop]]
-
-Un ultim lucru: vom dori să folosim un GPU dacă avem acces la unul (pe un CPU, instruirea poate dura câteva ore în loc de câteva minute). Pentru a face acest lucru, definim un `device` pe care vom plasa modelul și batch-urile noastre:
-
-```py
-import torch
-
-device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")
-model.to(device)
-device
-```
-
-```python out
-device(type='cuda')
-```
-
-Suntem acum gata pentru antrenare! Pentru a avea o idee când va fi finalizată antrenarea, adăugăm un progress bar peste numărul nostru de pași de antrenare, folosind biblioteca `tqdm`:
-
-```py
-from tqdm.auto import tqdm
-
-progress_bar = tqdm(range(num_training_steps))
-
-model.train()
-for epoch in range(num_epochs):
-    for batch in train_dataloader:
-        batch = {k: v.to(device) for k, v in batch.items()}
-        outputs = model(**batch)
-        loss = outputs.loss
-        loss.backward()
-
-        optimizer.step()
-        lr_scheduler.step()
-        optimizer.zero_grad()
-        progress_bar.update(1)
-```
-
-Poți să vezi că nucleul loopului de instruire are o formă similară cu cea din introducere. Nu am cerut nicio raportare, deci acest loop de antrenare nu ne va spune nimic despre cum se descurcă modelul. Trebuie să adăugăm un evaluation loop pentru a face acest lucru.
-
-
-### Evaluation Loop[[the-evaluation-loop]]
-
-La fel ca înainte, vom folosi o metrică oferită de librăria 🤗 Evaluate. Am văzut deja metoda `metric.compute()`, dar metricile pot acumula batch-urile pentru noi pe măsură ce mergem peste loopurile de  predicțoie cu metoda `add_batch()`. Când am acumulat toate batch-urile, putem să obținem rezultatul final cu `metric.compute()`. Acesta este modul în care trebuie să implementăm acest lucru într-un loop de evaluare:
-
-```py
-import evaluate
-
-metric = evaluate.load("glue", "mrpc")
-model.eval()
-for batch in eval_dataloader:
-    batch = {k: v.to(device) for k, v in batch.items()}
-    with torch.no_grad():
-        outputs = model(**batch)
-
-    logits = outputs.logits
-    predictions = torch.argmax(logits, dim=-1)
-    metric.add_batch(predictions=predictions, references=batch["labels"])
-
-metric.compute()
-```
-
-```python out
-{'accuracy': 0.8431372549019608, 'f1': 0.8907849829351535}
-```
-
-Rezultatele tale vor fi ușor diferite datorită randomizării în inițializarea headului modelului și a data shuffling, dar ele nu ar trebui să fie foart diferite.
-
-
-<Tip>
-
-✏️ **Încearcă!** Modifica loopul de antrenare dinainte pentru a face fine-tune modelul pe dataset-ul SST-2.
-
-</Tip>
-
-
-### Supercharge Training Loopul cu 🤗 Accelerate[[supercharge-your-training-loop-with-accelerate]]
-
-<Youtube id="s7dy8QRgjJ0" />
-
-Loopul de antrenare pe care l-am definit anterior funcționează bine pe un singur CPU sau GPU. Dar folosind libraria [🤗 Accelerate](https://github.com/huggingface/accelerate), cu câteva ajustări putem activa distributed training pe multiple GPU-uri sau TPU-uri. Începând de la crearea training și validation dataloaders, aceasta este este loopul manual de antrenare:
-
-```py
-from transformers import AdamW, AutoModelForSequenceClassification, get_scheduler
-
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
-optimizer = AdamW(model.parameters(), lr=3e-5)
-
-device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")
-model.to(device)
-
-num_epochs = 3
-num_training_steps = num_epochs * len(train_dataloader)
-lr_scheduler = get_scheduler(
-    "linear",
-    optimizer=optimizer,
-    num_warmup_steps=0,
-    num_training_steps=num_training_steps,
-)
-
-progress_bar = tqdm(range(num_training_steps))
-
-model.train()
-for epoch in range(num_epochs):
-    for batch in train_dataloader:
-        batch = {k: v.to(device) for k, v in batch.items()}
-        outputs = model(**batch)
-        loss = outputs.loss
-        loss.backward()
-
-        optimizer.step()
-        lr_scheduler.step()
-        optimizer.zero_grad()
-        progress_bar.update(1)
-```
-
-Și aici sunt schimbările:
-
-```diff
-+ from accelerate import Accelerator
-  from transformers import AdamW, AutoModelForSequenceClassification, get_scheduler
-
-+ accelerator = Accelerator()
-
-  model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
-  optimizer = AdamW(model.parameters(), lr=3e-5)
-
-- device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")
-- model.to(device)
-
-+ train_dataloader, eval_dataloader, model, optimizer = accelerator.prepare(
-+     train_dataloader, eval_dataloader, model, optimizer
-+ )
-
-  num_epochs = 3
-  num_training_steps = num_epochs * len(train_dataloader)
-  lr_scheduler = get_scheduler(
-      "linear",
-      optimizer=optimizer,
-      num_warmup_steps=0,
-      num_training_steps=num_training_steps
-  )
-
-  progress_bar = tqdm(range(num_training_steps))
-
-  model.train()
-  for epoch in range(num_epochs):
-      for batch in train_dataloader:
--         batch = {k: v.to(device) for k, v in batch.items()}
-          outputs = model(**batch)
-          loss = outputs.loss
--         loss.backward()
-+         accelerator.backward(loss)
-
-          optimizer.step()
-          lr_scheduler.step()
-          optimizer.zero_grad()
-          progress_bar.update(1)
-```
-
-Prima linie de adăugat este importarea librăriei. A doua linie creează un obiect `Accelerator` care va evalua environmentul și va inițializa proper distributed setup. 🤗 Accelerate gestionează automat poziționarea deviceului pentru tine, așa că poți șterge rândurile care pun modelul pe device (sau dacă preferi, poți să le schimbi cu `accelerator.device` în loc de `device`). 
-
-Partea principală a lucrului se face în linia ce trimite dataloader-urile, modelul și optimizerul la `accelerator.prepare()`. Acaeasta va face wrap acestor obiecte în containerul potrivit pentru a asigura o antrenare distribuită corespunzătoare. Ultimele schimbări sunt ștergerea linei cep une batch-ul pe device(din nou, dacă vvrei să lași acest lucru poți să le schimbi cu `accelerator.device`) și schimbarea `loss.backward()` cu `accelerator.backward(loss)`.
-
-<Tip>
-⚠️ Pentru a beneficia de viteza oferită de Cloud TPUs, recomandăm să faceți padding sampleurilor la o lungime fixă folosind argumentele `padding="max_length"` și `max_length` ale tokenizerului.
-</Tip>
-
-Dacă vrei să copiezi codul pentru a-l testa, aici este loopul complet de antrenare cu Accelerate:
-
-```py
-from accelerate import Accelerator
-from transformers import AdamW, AutoModelForSequenceClassification, get_scheduler
-
-accelerator = Accelerator()
-
-model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
-optimizer = AdamW(model.parameters(), lr=3e-5)
-
-train_dl, eval_dl, model, optimizer = accelerator.prepare(
-    train_dataloader, eval_dataloader, model, optimizer
-)
-
-num_epochs = 3
-num_training_steps = num_epochs * len(train_dl)
-lr_scheduler = get_scheduler(
-    "linear",
-    optimizer=optimizer,
-    num_warmup_steps=0,
-    num_training_steps=num_training_steps,
-)
-
-progress_bar = tqdm(range(num_training_steps))
-
-model.train()
-for epoch in range(num_epochs):
-    for batch in train_dl:
-        outputs = model(**batch)
-        loss = outputs.loss
-        accelerator.backward(loss)
-
-        optimizer.step()
-        lr_scheduler.step()
-        optimizer.zero_grad()
-        progress_bar.update(1)
-```
-
-Scriind în `train.py` aceste modificări, vor face scriptul executabil pe orice tip de distributed setup. Pentru a testa codul în mediul tău distribuit, rulează următoarea comandă:
-
-```bash
-accelerate config
-```
-
-Ceea ce îți va oferi să răspunzi la o serie de întrebări și să salvezi răspunsurile într-un fișier de configurare folosit de acest modul: 
-
-```bash
-accelerate launch train.py
-```
-
-Această comandă va lansa loopul de antrenare pe dispozitivele distribuite.
-
-Dacă doriți să încercați acest lucru într-un Jupyter Notebook (de exemplu, pentru a testa TPU-urile de pe Colab), înlocuiți codul cu următoarea funcție:
-
-```python
-from accelerate import notebook_launcher
-
-notebook_launcher(training_function)
-```
-
-Pentru mai multe exemple consultați [repo-ul 🤗 Accelerate](https://github.com/huggingface/accelerate/tree/main/examples).
\ No newline at end of file
diff --git a/chapters/ro/chapter3/5.mdx b/chapters/ro/chapter3/5.mdx
deleted file mode 100644
index 63d1f159a..000000000
--- a/chapters/ro/chapter3/5.mdx
+++ /dev/null
@@ -1,26 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Fine-tuning, Check![[fine-tuning-check]]
-
-<CourseFloatingBanner
-    chapter={3}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-
-A fost distractiv! În primele două capitole ai învățat despre modele și tokenizeri, iar acum știi cum să aplici fine-tune pentru datele proprii. Pentru a rezuma, în acest capitol tu:
-
-{#if fw === 'pt'}
-* Ai învățat despre dataseturi din [Hub](https://huggingface.co/datasets)
-* Ai învățat cum să încarci și să preprocesezi dataseturi, inclusiv folosind dynamic padding și collators
-* Ai implementat fine-tuningul și evaluarea unui model
-* Ai implementat un training loop la nivel de bază
-* Ai utilizat 🤗 Accelerate pentru a adapta ușor training loopul astfel încât să funcționeze cu mai multe GPU-uri sau TPU-uri
-
-{:else}
-* Ai învățat despre dataseturi din [Hub](https://huggingface.co/datasets)
-* Ai învățat cum să încarci și să preprocesezi dataseturi
-* Ai învățat cum să faci fine-tune și să evaluezi un model cu Keras
-* Ai implementat o metrică personalizată
-
-{/if}
\ No newline at end of file
diff --git a/chapters/ro/chapter3/6.mdx b/chapters/ro/chapter3/6.mdx
deleted file mode 100644
index 9ceeea782..000000000
--- a/chapters/ro/chapter3/6.mdx
+++ /dev/null
@@ -1,301 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-<!-- DISABLE-FRONTMATTER-SECTIONS
-
-# Quiz pentru finalizarea capitolului[[end-of-chapter-quiz]]
-
-<CourseFloatingBanner
-    chapter={3}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-Testează ce ai învățat în acest capitol!
-
-### 1. Datasetul `emotion` conține mesaje de pe Twitter cu labeluri cu emoții. Căutați-l în [Hub](https://huggingface.co/datasets) și citiți card-ul datasetului. Care dintre acestea nu este una dintre emoțiile sale de bază?
-
-<Question
-	choices={[
-		{
-			text: "Fericire",
-			explain: "Încercă din nou — emoția asta este prezentă în acest dataset!"
-		},
-		{
-			text: "Iubire",
-			explain: "Încercă din nou — emoția asta este prezentă în acest dataset!"
-		},
-		{
-			text: "Confuzie",
-			explain: "Corect! Confuzia nu este una dintre cele șase emoții de bază.",
-            correct: true
-		},
-        {
-			text: "Suprpiză",
-			explain: "Supriză! Încearcă din nou!"
-		}
-	]}
-/>
-
-### 2. Căutați datasetul `ar_sarcasm` în [Hub](https://huggingface.co/datasets). Care este sarcina pe care o sprijină?
-
-<Question
-	choices={[
-		{
-			text: "Clasificarea sentimentului",
-			explain: "Acesta este corect! Poți să știi grație etichetelor.",
-            correct: true
-		},
-		{
-			text: "Machine Translation",
-			explain: "Acesta nu este corect — încercați din nou, în funcție de cardul datasetului <a href='https://huggingface.co/datasets/ar_sarcasm'>ar_sarcasm</a>!"
-		},
-		{
-			text: "Reconstrucția entităților numite",
-			explain: "Acesta nu este corect — încercați din nou, în funcție de cardul datasetului <a href='https://huggingface.co/datasets/ar_sarcasm'>ar_sarcasm</a>!"
-		},
-        {
-			text: "Răspunsul întrebării",
-			explain: "Nesatisfăcător — încercați din nou!"
-		}
-	]}
-/>
-
-### 3. Cum se așteaptă modelul BERT ca o pereche de propoziții să fie procesate?
-
-<Question
-	choices={[
-		{
-			text: "Tokens_of_sentence_1 [SEP] Tokens_of_sentence_2",
-			explain: "Este necesară un token special <code>[SEP]</code> pentru a separa cele două propoziții, dar nu e doar asta!"
-		},
-		{
-			text: "[CLS] Tokens_of_sentence_1 Tokens_of_sentence_2",
-			explain:"Este necesară un token special <code>[CLS]</code> pentru a separa cele două propoziții, dar nu e doar asta!
-		},
-		{
-			text: "[CLS] Tokens_of_sentence_1 [SEP] Tokens_of_sentence_2 [SEP]",
-			explain: "Acesta este corect!",
-            correct: true
-		},
-        {
-			text: "[CLS] Token-urile propoziției_1 [SEP] Token-urile propoziției_2",
-			explain: "Este necesar un token special <code>[CLS]</code> la head, precum și un token special <code>[SEP]</code> pentru a separa cele două propoziții, dar nu e doar asta!"
-		}
-	]}
-/>
-
-{#if fw === 'pt'}
-### 4. Care sunt beneficiile metodei `Dataset.map()`?
-
-<Question
-	choices={[
-		{
-			text: "Rezultatele funcției sunt cached, deci nu va lua timp dacă re-executăm codul.",
-			explain: "Acest lucru este efectiv unul dintre beneficiile sale! Nu e doar asta...",
-            correct: true
-		},
-		{
-			text: "Se aplică multiprocessing pentru a merge mai rapid decât aplicarea funcției la fiecare element al datasetului.",
-			explain: "Acest lucru este efectiv o caracteristică specială a acestei metode, dar nu e doar asta...",
-            correct: true
-		},
-		{
-			text: "Nu încarcă întregul datasetul în memorie și salvează rezultatele la fiecare element procesat.",
-			explain: "Acest lucru este un avantaj al acestei metode. Există și altele...",
-            correct: true
-		},
-	]}
-/>
-
-### 5. Ce înseamnă "dynamic padding"?
-
-<Question
-	alegeri={[  
-		{
-			text: "Dynamic padding este atunci când faci padding inputurilor pentru fiecare batch la lungimea maximă din întregul dataset.",
-			explain: "Acest lucru implică paddingul, dar nu la lungimea maximă a întregului dataset."
-		},
-		{
-			text: "Dynamic padding este atunci când faci padding inputurilor pentru fiecare batch, la lungimea maximă a propozițiilor din acel batch.",
-			explain: "Este corect! Partea \"dynamic\" vine din faptul că dimensiunea fiecărui batch este determinată la momentul creării lui, iar toate batch-urile pot avea shape-uri diferite ca rezultat.",
-            correct: true
-		},
-		{
-			text: "Dynamic padding este atunci când faci padding inputurilor pentru ca fiecare propoziție să aibă același număr de tokenuri ca în precedentul dataset.",
-			explain: "Este greșit, și nu are nici un sens să ne uităm la ordinea din dataset, deoarece îl amestecăm în timpul antrenării."
-		},
-	]}
-/>
-
-### 6. Care este scopul unei funcții collate?
-
-<Question
-	alegeri={[  
-		{
-			text: "Asigură că toate secvențele din dataset au aceeași lungime.",
-			explain: "O funcție collate este implicată în gestionarea a câte unui batch, nu întregului dataset. De asemenea, vorbim despre funcții generice, nu <code>DataCollatorWithPadding</code> specific."
-		},
-		{
-			text: "Adună toate sampleurile dintr-un batch.",
-			explain: "Corect! Poți să dai ca argument o funcție collate în constructorul unui <code>DataLoader</code>. Am folosit funcția <code>DataCollatorWithPadding</code>, care face padding tuturor elementelor dintr-un batch, astfel încât ele să aibă aceeași lungime.",
-            correct: true
-		},
-		{
-			text: "Preprocesează întregul dataset.",
-			explain: "Acest lucru ar fi o funcție de preprocesare, nu una collate."
-		},
-        {
-			text: "Taie secvențele din dataset.",
-			explain: "O funcție collate este implicată în gestionarea a câte un batch, nu întregului dataset. Dacă ești interesat în tăierea acestora, poți utiliza argumentul <code>truncate</code> al unui <code>tokenizer</code>."
-		}
-	]}
-/>
-
-### 7. Ce se întâmplă când inițializezi una dintre clasele `AutoModelForXxx` cu un pretrained language model (ca <code>bert-base-uncased</code>) care corespunde unei alte sarcini decât aceea pentru care a fost antrenat?
-
-<Question
-	alegeri={[  
-		{
-			text: "Nimic, dar se afișează un warning.",
-			explain: "Se afișează un warning, dar asta nu este totul!"
-		},
-		{
-			text: "Headul modelului preantrenat al modelului este înlăturat și înlocuit cu un head nou potrivit pentru sarcină.",
-			explain: "Corect. De exemplu, atunci când am folosit <code>AutoModelForSequenceClassification</code> cu <code>bert-base-uncased</code>, am primit warningul la momentul inițializării modelului. Headul preantrenat nu este folosit pentru sarcina de clasificare a secvențelor, astfel încât el este înlăturat și înlocuit cu un head nou, cu weights aleatorii.",
-            correct: true
-		},
-		{
-			text: "Headul modelului preantrenat este înlăturat.",
-			explain: "Trebuie să se întâmple încă ceva. Încearcă din nou!"
-		},
-        {
-			text: "Nimic, deoarece modelul poate avea fine-tuning pentru o sarcina diferită.",
-			explain: "Headul preantrenat al modelului nu a fost antrenat să rezolve această sarcină, astfel încât el trebuie înlăturat."
-		}
-	]}
-/>
-
-### 8. Care este scopul la `TrainingArguments`?
-
-<Question
-	alegeri={[  
-		{
-			text: "Conține toți hyperparametrii utilizați pentru antrenare și evaluare cu <code>Trainer</code>.",
-			explain: "Corect!",
-            correct: true
-		},
-		{
-			text: "Specifică dimensiunea modelului.",
-			explain: "Dimensiunea modelului este definită de configurația modelului, nu clasa <code>TrainingArguments</code>. "
-		},
-		{
-			text: "Conține doar hyperparametrii utilizați pentru evaluare.",
-			explain: "În exemplul nostru, am specificat unde se va salva modelul și toate checkpoint-urile. Încearcă din nou!"
-		},
-        {
-			text: "Conține doar hyperparametrii utilizați pentru antrenare.",
-			explain: "În exemplul nostru, am folosit un <code>evaluation_strategy</code>, astfel încât acest lucru afectează și evaluarea. Încearcă din nou!"
-		}
-	]}
-/>
-
-### 9. De ce ar trebui să folosim biblioteca 🤗 Accelerate?
-
-<Question
-	alegeri={[  
-		{
-			text: "Ofereă acces la modele mai rapide.",
-			explain: "Nu, biblioteca 🤗 Accelerate nu oferă nici un model."
-		},
-		{
-			text: "Oferă un API de nivel înalt astfel încât să nu trebuiască să implementăm singuri un training loop.",
-			explain: "Acest lucru este ceea ce am făcut cu <code>Trainer</code>, nu biblioteca 🤗 Accelerate. Încearcă din nou!"
-		},
-		{
-			text: "Face ca loopurile de antrenare să funcționeze pe distributed strategies.",
-			explain: "Corect! Cu 🤗 Accelerate, loopurile de antrenare vor funcționa pentru multiple GPU-uri și TPU-uri.",
-            correct: true
-		},
-        {
-			text: "Oferă mai multe funcții de optimizare.",
-			explain: "Nu, biblioteca 🤗 Accelerate nu oferă nici o funcțiune de optimizare."
-		}
-	]}
-/>
-
-{:else}
-### 4. Ce se întâmplă când inițializezi una dintre clasele `TFAutoModelForXxx` cu un pretrained language model (ca <code>bert-base-uncased</code>) care corespunde unei alte sarcini decât aceea pentru care a fost antrenat?
-
-<Question
-	alegeri={[  
-		{
-			text: "Nimic, dar se afișează un warning.",
-			explain: "Se afișează un warning, dar asta nu este totul!"
-		},
-		{
-			text: "Headul preantrenat al modelului este înlăturat și înlocuit cu un head nou potrivit pentru sarcină.",
-			explain: "Corect. De exemplu, atunci când am folosit <code>TFAutoModelForSequenceClassification</code> cu <code>bert-base-uncased</code>, am primit warningul la momentul inițializării modelului. Headul preantrenat nu este folosit pentru sarcina de clasificare a secvențelor, astfel încât el este înlăturat și înlocuit cu un head nou, cu weights aleatorii.",
-            correct: true
-		},
-		{
-			text: "Headul preantrenat al modelului este înlăturat.",
-			explain: "Trebuie să se întâmple ceva mai mult. Încercă din nou!"
-		},
-        {
-			text: "Nimic, deoarece modelul poate fi reantrenat pentru o sarcina diferită.",
-			explain: "Headul prentrenat al modelului nu a fost antrenat să rezolve această sarcină, astfel încât el trebuie înlăturat."
-		}
-	]}
-/>
-
-### 5. Modelele TensorFlow din `transformers` sunt deja modele Keras. Ce beneficiu oferă acest lucru?
-
-<Question
-	alegeri={[  
-		{
-			text: "Modelele funcționează pe un TPU direct.",
-			explain: "Ești aproape, dar sunt necesare mici schimbări. De exemplu, trebuie să rulezi totul într-un <code>TPUStrategy</code> scop, inclusiv inițializarea modelului."
-		},
-		{
-			text: "Poți folosi metode existente precum <code>compile()</code>, <code>fit()</code>, și <code>predict()</code>.",
-			explain: "Corect! Odată ce ai datele, antrenarea pe acestea necesită foarte puțin lucru.",
-            correct: true
-		},
-		{
-			text: "Poți învăța și Keras precum și Transformers.",
-			explain: "Corect, dar căutăm altceva. :)",
-			correct: true
-		},
-        {
-			text: "Poți calcula ușor metrice legate de dataset.",
-			explain: "Keras ne ajută cu antrenarea și evaluarea modelului, dar nu calculează metrice legate de dataset."
-		}
-	]}
-/>
-
-### 6. Cum poți defini o metrică personalizată?
-
-<Question
-	alegeri={[  
-		{
-			text: "Prin subclassing pe <code>tf.keras.metrics.Metric</code>.",
-			explain: "Excelent!",
-			correct: true
-		},
-		{
-			text: "Folosind API-ul Keras.",
-			explain: "Încercă din nou!"
-		},
-		{
-			text: "Prin intermediul callable cu semnatura <code>metric_fn(y_true, y_pred)</code>.",
-			explain: "Corect!",
-			correct: true
-		},
-        {
-			text: "Prin căutarea pe Google.",
-			explain: "Acest lucru nu este răspunsul pe care îl căutăm, dar ar trebui să te ajute să-l găsești.",
-            correct: true
-		}
-	]}
-/>
-
-{/if}
\ No newline at end of file
diff --git a/chapters/ro/chapter4/1.mdx b/chapters/ro/chapter4/1.mdx
deleted file mode 100644
index 4ef56abf4..000000000
--- a/chapters/ro/chapter4/1.mdx
+++ /dev/null
@@ -1,22 +0,0 @@
-# Platforma Hugging Face Hub[[the-hugging-face-hub]]
-
-<CourseFloatingBanner
-    chapter={4}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-Platforma [Hugging Face Hub](https://huggingface.co/) –- site-ul nostru principal –- reprezintă o platformă care permite oricărui utilizator să descopere, utilizeze și contribuie la noi modele și dataseturi. Acesta găzduiește o varietate vastă de modele, cu peste 10.000 disponibile public. Ne vom concentra discuția asupra modelelor în acest capitol, iar pentru dataseturi vom vorbi în Capitolul 5.
-
-Modelele din Hub nu sunt limitate la 🤗 Transformers sau chiar și NLP. Există și alte modele, cum ar fi cele de la [Flair](https://github.com/flairNLP/flair) și [AllenNLP](https://github.com/allenai/allennlp) pentru NLP, [Asteroid](https://github.com/asteroid-team/asteroid) și [pyannote](https://github.com/pyannote/pyannote-audio) pentru speech, precum și cele de la [timm](https://github.com/rwightman/pytorch-image-models) pentru vision, doar să menționăm câteva.
-
-Fiecare dintre aceste modele este găzduit ca un repository Git, ceea ce permite crearea versiunilor și reproducerea acestuia. Oferirea modelului pe Hub înseamnă deschiderea sa comunității, făcându-l accesibil oricărui utilizator care dorește să îl utilizeze cu ușurință, eliminând astfel nevoia de a-și antrena propriul model și simplificând utilizarea acestora. 
-
-În plus, oferirea unui model pe Hub face deploy automat la un Inference API pentru acel model. Orice membru al comunității poate testa direct pe pagina modelului cu inputuri personalizate și widget-uri corespunzătoare.
-
-Cel mai bun lucru este că oferirea și utilizarea oricărui model public pe Hub este complet gratuit! Existează și [planuri plătite](https://huggingface.co/pricing) dacă doriți să oferiți modele în privat.
-
-Video-ul de mai jos arată modul în care puteți naviga prin Hub.
-
-<Youtube id="XvSGPZFEjDY"/>
-
-Crearea unui cont huggingface.co este necesară pentru a continua această parte, deoarece vom crea și gestiona repositorii pe Platforma Hugging Face Hub: [creați un cont](https://huggingface.co/join)
\ No newline at end of file
diff --git a/chapters/ro/chapter4/2.mdx b/chapters/ro/chapter4/2.mdx
deleted file mode 100644
index bbe94669b..000000000
--- a/chapters/ro/chapter4/2.mdx
+++ /dev/null
@@ -1,98 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Utilizarea modelelor preantrenate[[using-pretrained-models]]
-
-{#if fw === 'pt'}
- 
-<CourseFloatingBanner chapter={4}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter4/section2_pt.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter4/section2_pt.ipynb"},
-]} />
-
-{:else}
-
-<CourseFloatingBanner chapter={4}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter4/section2_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter4/section2_tf.ipynb"},
-]} />
-
-{/if}
-
-Hubul Model oferă o modalitate simplă de a selecta modelul adecvat, astfel încât utilizarea sa în orice bibliotecă downstream poate fi efectuată în câteva linii de cod. Să vedem cum se utilizează efectiv unul dintre aceste modele și cum putem contribui înapoi la comunitate.
-
-
-Să presupunem că noi căutăm un French-based model ce poate face mask filling.
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/camembert.gif" alt="Selecting the Camembert model." width="80%"/>
-</div>
-
-Alegem checkpointul „camembert-base” pentru al încerca. Identificatorul `camembert-base` este tot de ce avem nevoie pentru a începe. În capitolele precedente, am văzut cum putem inițializa modelul folosind funcția `pipeline()`:
-
-```py
-from transformers import pipeline
-
-camembert_fill_mask = pipeline("fill-mask", model="camembert-base")
-results = camembert_fill_mask("Le camembert est <mask> :)")
-```
-
-```python out
-[
-  {'sequence': 'Le camembert est délicieux :)', 'score': 0.49091005325317383, 'token': 7200, 'token_str': 'délicieux'}, 
-  {'sequence': 'Le camembert est excellent :)', 'score': 0.1055697426199913, 'token': 2183, 'token_str': 'excellent'}, 
-  {'sequence': 'Le camembert est succulent :)', 'score': 0.03453313186764717, 'token': 26202, 'token_str': 'succulent'}, 
-  {'sequence': 'Le camembert est meilleur :)', 'score': 0.0330314114689827, 'token': 528, 'token_str': 'meilleur'}, 
-  {'sequence': 'Le camembert est parfait :)', 'score': 0.03007650189101696, 'token': 1654, 'token_str': 'parfait'}
-]
-```
-
-În mod evident, încărcarea unui model într-un pipeline este extrem de simplu. Singurul lucru la care trebuie să atrageți atenția este că checkpointul ales este adecvat pentru sarcina pe care urmează să o execute. De exemplu, în momentul în care încărăm checkpoint-ul „camembert-base” în pipelineul `fill-mask`, este perfect în regulă. Dar dacă îl încărcam în pipelineul `text-classification`, rezultatele nu vor avea nici o logică, pentru că headul „camembert-base” nu este adecvat pentru această sarcină! Recomandăm utilizarea task selectorului în interfața Hugging Face în scopul selectării checkpointurilor adecvate:
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/tasks.png" alt="Selectorul de sarcini pe interfața web." width="80%"/>
-</div>
-
-Puteți inițializa checkpointul în mod direct folosind arhitectura modelului:
-
-{#if fw === 'pt'}
-```py
-from transformers import CamembertTokenizer, CamembertForMaskedLM
-
-tokenizer = CamembertTokenizer.from_pretrained("camembert-base")
-model = CamembertForMaskedLM.from_pretrained("camembert-base")
-```
-
-Însă, recomandăm utilizarea [claselor `Auto*`](https://huggingface.co/transformers/model_doc/auto?highlight=auto#auto-classes), deoarece acestea sunt proiectate să fie architecture-agnostic. În timp ce codul precedent limita utilizatorii la checkpoints loadable în CamemBERT architecture, utilizarea claselor `Auto*` face schimbarea checkpointurilor simplă:
-
-```py
-from transformers import AutoTokenizer, AutoModelForMaskedLM
-
-tokenizer = AutoTokenizer.from_pretrained("camembert-base")
-model = AutoModelForMaskedLM.from_pretrained("camembert-base")
-```
-{:else}
-```py
-from transformers import CamembertTokenizer, TFCamembertForMaskedLM
-
-tokenizer = CamembertTokenizer.from_pretrained("camembert-base")
-model = TFCamembertForMaskedLM.from_pretrained("camembert-base")
-```
-
-Însă, recomandăm utilizarea [claselor `TFAuto*`](https://huggingface.co/transformers/model_doc/auto?highlight=auto#auto-classes), deoarece acestea sunt proiectate să fie architecture-agnostic. În timp ce codul precedent limita utilizatorii la checkpoints loadable în CamemBERT architecture, utilizarea claselor `TFAuto*` face schimbarea checkpointurilor simplă:
-
-```py
-from transformers import AutoTokenizer, TFAutoModelForMaskedLM
-
-tokenizer = AutoTokenizer.from_pretrained("camembert-base")
-model = TFAutoModelForMaskedLM.from_pretrained("camembert-base")
-```
-{/if}
-
-<Tip>
-În momentul în care folosiți un model preantrenat, asigurați-vă să verificați cum a fost antrenat și pe ce date se bazează. De asemenea, trebuie să cunoasceți limitele și prejudecățile sale. Toată această informație va fi indicată pe cartea modelului.
-</Tip>
-
diff --git a/chapters/ro/chapter4/3.mdx b/chapters/ro/chapter4/3.mdx
deleted file mode 100644
index dda42f45e..000000000
--- a/chapters/ro/chapter4/3.mdx
+++ /dev/null
@@ -1,641 +0,0 @@
-
-**Capitolul 4**
-
-<FrameworkSwitchCourse {fw} />
-
-# Partajarea modelelor preantrenate [[sharing-pretrained-models]]
-
-{#if fw === 'pt'}
-
-<CourseFloatingBanner chapter={4}
-classNames="absolute z-10 right-0 top-0"
-notebooks={[ 
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter4/section3_pt.ipynb"}, 
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter4/section3_pt.ipynb"},
-]} />
-
-{:else}
-
-<CourseFloatingBanner chapter={4}
-classNames="absolute z-10 right-0 top-0"
-notebooks={[ 
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter4/section3_tf.ipynb"}, 
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter4/section3_tf.ipynb"},
-]} />
-
-{/if}
-
-În următoarele etape, vom explora modalitățile cele mai ușoare de a partaja modelele preantrenate pe 🤗 Hub. Există tooluri și utilities disponibile care fac posibilă partajarea și actualizarea modelelor direct pe Hub, despre care vom vorbi mai jos.
-
-<Youtube id="9yY3RB_GSPM"/>
-
-Recomandăm tuturor utilizatorilor care antrenează modele să contribuie prin partajarea lor cu comunitatea - partajarea modelelor, chiar și atunci când sunt antrenate pe dateseturi foarte specifice, va ajuta la economising timpul altor utilizatori și resurselor și va oferi acces la trained artifcats folositoare. În schimb, puteți beneficia de munca altora!
-
-Există trei moduri de a crea noi repositorii cu modele:
-
-- Utilizând API-ul `push_to_hub`
-- Utilizând biblioteca Python `huggingface_hub`
-- Utilizând interfața web
-
-Odată ce aveți creat un repository, puteți încărca fișiere în el folosind git și git-lfs. Vom trece împreună prin crearea model repositories și încărcarea fișierelor în el în următoarele secțiuni.
-
-## Utilizând API-ul `push_to_hub`[[using-the-pushtohub-api]]
-
-{#if fw === 'pt'}
-
-<Youtube id="Zh0FfmVrKX0"/>
-
-{:else}
-
-<Youtube id="pUh5cGmNV8Y"/>
-
-{/if}
-
-Cea mai simplă modalitate de a încărca fișiere pe Hub este utilizând API-ul `push_to_hub`.
-
-Înainte de a continua, aveți nevoie să creați un token de autentificare astfel încât API-ul `huggingface_hub` să știe cine sunteți și care sunt namespaces la care aveți acces de scriere. Asigurați-vă că sunteți într-un environment unde aveți instalat `transformers` (vedeti [Configurarea](/course/chapter0)). Dacă sunteți într-un notebook, puteți folosi următoarea funcție pentru a vă autentifica:
-
-```python
-from huggingface_hub import notebook_login
-
-notebook_login()
-```
-
-În terminal, puteți rula următoarea comandă:
-
-```bash
-huggingface-cli login
-```
-
-În ambele cazuri, veți fi rugați să introduceți numele utilizatorului și parola, care sunt aceleași cu cele folosite la autentificare pe Hub. Dacă nu aveți încă un profil pe Hub, vă rugăm să creați unul [aici](https://huggingface.co/join).
-
-Excelent! Acum aveți tokenul de autentificare stocat în folder-ul cache. Vom crea acum niște repositorii!
-
-{#if fw === 'pt'}
-
-Dacă ați lucrat cu API-ul `Trainer` pentru a antrena un model, cea mai ușoară modalitate de a o încărca pe Hub este să setați `push_to_hub=True` când definiți `TrainingArguments`:
-
-```py
-from transformers import TrainingArguments
-
-training_args = TrainingArguments(
-    "bert-finetuned-mrpc", save_strategy="epoch", push_to_hub=True
-)
-```
-
-Când chemați `trainer.train()`, `Trainer` va încărca modelul pe Hub de fiecare dată când este salvat (aici, la fiecare epocă) într-un repository namespaceul tău. Acest repository va fi numit după outpul directory-ul ales (aici `bert-finetuned-mrpc`), dar puteți alege un alt nume cu `hub_model_id = "un_nume_diferit"`.
-
-Pentru a încărca modelul într-o organizație din care faceți parte, este suficient să introduceți aceasta în `hub_model_id = "organizația_mea/numele_repositoriului"`.
-
-Odată ce antrenarea s-a terminat, trebuie să faceți `trainer.push_to_hub()` pentru a încărca ultima versiune a modelului. Acesta va genera apoi un model card cu toate informațiile relevante, inclusiv metadatele despre hyperparametrii utilizați și rezultatele evaluării! Aici este exemplul unui astfel de model card:
-
-<div class="flex justify-center">
-  <img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/model_card.png" alt="Un exemplu de un card auto-generat." width="100%"/>
-</div>
-
-{:else}
-
-Dacă utilizați Keras pentru a antrena modelul dumneavoastră, cea mai ușoară modalitate de a încărca-o pe Hub este să transmiteți un `PushToHubCallback` când chemați `model.fit()`:
-
-```py
-from transformers import PushToHubCallback
-
-callback = PushToHubCallback(
-    "bert-finetuned-mrpc", save_strategy="epoch", tokenizer=tokenizer
-)
-```
-
-Apoi, adăugați `callbacks=[callback]` în apelul la `model.fit()`. Callback-ul va încărca apoi modelul pe Hub de fiecare dată când se salvează(aici, la fiecare epocă) într-un repository din namespaceul tău. Acest repository va fi numit după output directory ales (aici `bert-finetuned-mrpc`), dar puteți alege un alt nume cu `hub_model_id = "un_nume_diferit"`.
-
-Pentru a încărca modelul într-o organizație din care faceți parte, este suficient să introduceți aceasta în `hub_model_id = "organizația_mea/numele_repositoriului"`.
-
-{/if}
-
-La un nivel inferior, accesarea Hub-ului se poate face direct pe modele, tokenizers și configurations objects prin metoda `push_to_hub()`. Această metodă se ocupă atât de crearea repositoriului cât si de încărcarea modelului și tokenizerului direct în el. Nu este nevoie de o interacțiune manuală, precum fața de API-ul pe care îl vom vedea mai jos.
-
-Pentru a înțelege cum funcționează, luați în considerare inițializarea unui model și a unui tokenizer:
-
-{#if fw === 'pt'}
-```py
-from transformers import AutoModelForMaskedLM, AutoTokenizer
-
-checkpoint = "camembert-base"
-
-model = AutoModelForMaskedLM.from_pretrained(checkpoint)
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-```
-{:else}
-```py
-from transformers import TFAutoModelForMaskedLM, AutoTokenizer
-
-checkpoint = "camembert-base"
-
-model = TFAutoModelForMaskedLM.from_pretrained(checkpoint)
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-```
-{/if}
-
-Sunteți liberi să faceți orice ați vrea cu acestea - adăugați tokens la tokenizer, antrenați modelul sau faceți fine-tune. Odată ce sunteți mulțumiți de modelul obținut, weighturile și tokenizerul acestuia , puteți folosi metoda `push_to_hub()` disponibilă direct pe obiectul `model`:
-
-```py
-model.push_to_hub("dummy-model")
-```
-Acest lucru va crea un nou repository `dummy-model` în profilul tău și o va popula cu fișierele modelului tău.
-Încercați același lucru cu tokenizerul, astfel încât toate fișierele să fie acum disponibile în acest repository:
-
-```py
-tokenizer.push_to_hub("dummy-model")
-```
-
-Dacă apartineți unei organizații, specificați doar argumentul `organization` pentru a încărca în namespaceul acestei organizații:
-
-```py
-tokenizer.push_to_hub("dummy-model", organization="huggingface")
-```
-
-Dacă doriți să utilizați un anumit token Hugging Face, sunteți liberi să specificați acest lucru metodei `push_to_hub()`:
-
-```py
-tokenizer.push_to_hub("dummy-model", organization="huggingface", use_auth_token="<TOKEN>")
-```
-
-Acum, mergeți la Model Hub pentru a găsi modelul încărcat: *https://huggingface.co/user-or-organization/dummy-model*.
-
-Apăsați pe tabul "Files and versions", iar acum ar trebui să vedeți fișierele vizibile în următorul screenshot:
-
-{#if fw === 'pt'}
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/push_to_hub_dummy_model.png" alt="Dummy model containing both the tokenizer and model files." width="80%"/>
-</div>
-{:else}
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/push_to_hub_dummy_model_tf.png" alt="Dummy model containing both the tokenizer and model files." width="80%"/>
-</div>
-{/if}
-
-<Tip>
-
-✏️ **Încercați!** Luați modelul și tokenizerul asociat cu checkpointul `bert-base-cased` și încărcați-l pe un repo în namespaceul tău folosind metoda `push_to_hub()`. Verificați că repo-ul apare  în pagina dumneavoastră înainte de a-l șterge.
-
-</Tip>
-
-Ați văzut că metoda `push_to_hub()` acceptă mai multe argumente, ceea ce permite încărcarea într-un repository specific sau namespace al unei organizații, sau utilizarea unui token API diferit. Vă recomandăm să vă uitați la specificația metodei disponibilă direct în [documentația 🤗 Transformers](https://huggingface.co/transformers/model_sharing) pentru a înțelge ceea ce este posibil.
-
-Metoda `push_to_hub()` este backed de packageul Python [`huggingface_hub`](https://github.com/huggingface/huggingface_hub), care oferă un API direct la Hub-ul Hugging Face. Acesta este integrat în 🤗 Transformers și în mai multe biblioteci pentru machine learning, ca de exemplu [`allenlp`](https://github.com/allenai/allennlp). Deși ne concentrăm pe integrarea în 🤗 Transformers în acest capitol, integrarea sa în propriul dumneavoastră cod sau bibliotecă este simplu.
-
-Întoarceți-vă la secțiune precedentă pentru a vedea cum să încărcați fișierele în noul repository-ul creat!
-
-## Utilizarea bibliotecii Python `huggingface_hub`
-
-Biblioteca Python `huggingface_hub` este un package care oferă un set de instrumente pentru model și datasets hubs. Oferă metode simple și clase pentru sarcini comune ca:
-Obținerea informațiilor despre repositorii pe hub și gestionarea lor. Ofere API-uri simple care lucrează pe lângă Git pentru a gestiona conținutul acestor repositorii și integrarea Hub-ului
-în proiectele și bibliotecile tale.
-
-Similar cu utilizarea API-ului `push_to_hub`, asta va necesita un token de autentificare salvat în cache. Pentru a face acest lucru, veți avea nevoie să folosiți comanda `login` din CLI, cum am menționat în secțiunea anterioară (din nou, asigurați-vă prefixați această comandă cu simbolul `!` dacă rulați în Google Colab):
-
-```bash
-huggingface-cli login
-```
-
-Packageul `huggingface_hub` oferă mai multe metode și clase utile pentru noi. În primul rând, există câteva metode pentru crearea, ștergerea și gestionarea repositoriilor:
-
-```python no-format
-from huggingface_hub import (
-    # Gestionarea utilizatorilor
-    login,
-    logout,
-    whoami,
-
-    # Crearea și gestionarea repositoriilor
-    create_repo,
-    delete_repo,
-    update_repo_visibility,
-
-    # Și câteva metode pentru a obține/schimba informațiile despre conținut
-    list_models,
-    list_datasets,
-    list_metrics,
-    list_repo_files,
-    upload_file,
-    delete_file,
-)
-```
-
-De asemenea, el oferă clasa `Repository` pentru gestionarea unei repository local. Vom explora aceste metode și clasa în următoarele secțiuni pentru a înțelege cum să le utilizați.
-
-Metoda `create_repo` poate fi utilizată pentru crearea unui nou repository în hub:
-
-```py
-from huggingface_hub import create_repo
-
-create_repo("dummy-model")
-```
-
-Acesta va crea repositarul `dummy-model` în namespaceul tău. Dacă doriți, puteți specifica care organizație să aparțină repositoriului folosind argumentul `organization`:
-
-```py
-from huggingface_hub import create_repo
-
-create_repo("dummy-model", organization="huggingface")
-```
-
-Acesta va crea repositoriul `dummy-model` în spațiul organizației `huggingface`, cu condiția că dumneavoastră să apartineți acestei organizații.
-Alte argumente care pot fi utile sunt:
-
-- `private`, pentru a specifica dacă repositarul trebuie să fie vizibil celorlați sau nu.
-- `token`, dacă doriți să vă înlocuiți token-ul stocat în cache cu un anumit token.
-- `repo_type`, dacă doriți să creați un `dataset` sau `space` în loc de model. Valorile acceptate sunt `"dataset"` și `"space"`.
-
-Acum, trebuie să adăugați fișierele în repository-ul dumneavoastră! Treceți la secțiunea următoare pentru a vedea cele trei moduri de a face acest lucru.
-
-## Utilizarea interfeței web
-
-Interfața web oferă instrumente pentru a gestiona repositorii direct în Hub. Cu ajutorul acestei interfețe, puteți crea ușor repositorii, adăuga fișiere (și chiar și fișiere mari!), explora modele, vizualiza diffuri, și multe altele.
-
-Pentru a crea un nou repositoriu, vizitați [huggingface.co/new](https://huggingface.co/new):
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/new_model.png" alt="Pagină care prezintă modelul utilizat pentru crearea unui nou repository." width="80%"/>
-</div>
-
-În primul rând, specificați deținătorul repositoriului: acesta puteți fi dumneavoastră, fie orice organizație cu care sunteți afiliat. Dacă alegeți o organizație, modelul va fi prezent pe pagina organizației și toți membrii acesteia vor avea posibilitatea să contribuie la repositoriu.
-
-În al doilea rând, introduceți numele modelului dumneavoastră. Acest lucru va fi și denumirea repositoriului. În final, puteți specifica dacă doriți ca modelul dumneavoastră să fie public sau privat. Modelele private nu sunt vizibile ceilorlalți.
-
-După crearea repositoriului, ar trebui să vedeți o pagină ca aceasta:
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/empty_model.png" alt="O pagină goală a modelului după crearea unui nou repository." width="80%"/>
-</div>
-
-Acesta este locul unde va fi găzduit modelul. Pentru a începe să populați acesta, puteți adăuga un fișier README direct din interfața web.
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/dummy_model.png" alt="Fișierul README care arată capacitățile Markdown." width="80%"/>
-</div>
-
-Fișierul README este scris în format Markdown - vă rugăm să fiți creativi cu el! A treia parte a acestui capitol se ocupă de crearea unui model card. Acestea sunt foarte importante pentru a aduce valoare modelului dumneavoastră, deoarece este acolo unde spuneți celorlalți ce poate face.
-
-Dacă vă uitați la secțiunea "Fișiere și versiuni", veți vedea că nu sunt prea multe fișiere acolo încă - doar *README.md* pe care l-ați creat dumneavoastră și *.gitattributes* care urmărește fișierele mari.
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/files.png" alt="Secțiunea 'Fișiere și versiuni' arată doar fișierul .gitattributes și README.md." width="80%"/>
-</div>
-
-Vom vedea mai târziu cum să adăugați câteva fișiere noi.
-
-## Încărcarea fișierelor modelului[[uploading-the-model-files]]
-
-Sistemul pentru a gestiona fișierele în Hugging Face Hub se bazează pe git pentru fișierele obișnuite, și pe git-lfs (care se descrifrează ca [Git Large File Storage](https://git-lfs.github.com/)) pentru fișierele mai mari.
-
-În secțiunea următoare, vom discuta despre trei metode diferite de încărcare a fișierelor în Hub: prin `huggingface_hub` și prin comanda git.
-
-### Metoda `upload_file`[[the-uploadfile-approach]]
-
-Prin `upload_file` nu este necesar să instalați git și git-lfs pe sistemul dumneavoastră. Acest lucru încarcă direct fișierele în 🤗 Hub folosind HTTP POST requests. O limitare a acestei metode este că ea nu se ocupă de fișiere care sunt mai mari de 5GB.
-Dacă fișierele dumneavoastră sunt mai mari decât 5 GB, vă rugăm să urmați celelalte două metode descrise mai jos.
-
-API-ul poate fi folosit astfel:
-
-```python
-from huggingface_hub import upload_file
-
-upload_file(
-    "<path_to_file>/config.json",
-    path_in_repo="config.json",
-    repo_id="<namespace>/dummy-model",
-)
-```
-
-Acest lucru va încărca fișierul `config.json` disponibil la `<path_to_file>` la rootul repositoriului ca `config.json`, în `dummy-model` repository.
-Alte argumente utile pot fi:
-
-- `token`, dacă doriți să înlocuiți tokenul stocat în cache cu un alt token.
-- `repo_type`, dacă doriți să încărcați într-un `dataset` sau într-un `space` în locul modelului. Valorile acceptate sunt `"dataset"` și `"space"`.
-
-### Clasa `Repository`[[the-repository-class]]
-
-Clasa `Repository` gestionează un repository local în-tro manieră asemănătoare gitului. Ea abstracționează majoritatea problemelor pe care le întâlniți cu git pentru a oferi toate caracteristicile necesare.
-
-Utilizarea acestei clase necesită ca dumneavoastră să aveți instalat git și git-lfs, așadar asigurați-vă că aveți instalat git-lfs (vezi [aici](https://git-lfs.github.com/) pentru instrucțiunile de instalare) și setat înainte de a începe.
-
-Pentru a vă juca cu repositoriul pe care l-am creat, puteți porni prin inițializarea lui ca un folder local printr-un clonarea repositoriului remote:
-
-```py
-from huggingface_hub import Repository
-
-repo = Repository("<path_to_dummy_folder>", clone_from="<namespace>/dummy-model")
-```
-
-Acesta a creat folderele `<path_to_dummy_folder>` în folderul de lucru. Acest folder conține doar fișierul `.gitattributes` pentru că acesta este singurul fișier creat atunci când inițializați repositoriul prin `create_repo`.
-
-Acum puteți folosi majoritatea metodelor tradiționale ale gitului:
-
-```python
-repo.git_pull()
-repo.git_add()
-repo.git_commit()
-repo.git_push()
-repo.git_tag()
-```
-
-Și altele! Vă recomandăm să vă uitați la documentația `Repository` disponibilă [aici](https://github.com/huggingface/huggingface_hub/tree/main/src/huggingface_hub#advanced-programmatic-repository-management) pentru o înțelegere generală a tuturor metodelor disponibile.
-
-Pentru moment, avem un model și un tokenizer pe care doriți să îl trimiteți în hub. Am reușit să clonăm repositoriul local, deci putem salva fișierele în acesta.
-
-În primul rând asigurați-vă că copia locală este la zi cu ultimele schimbări:
-
-```python
-repo.git_pull()
-```
-
-Odată ce am facut asta, salvați fișierele modelului și al tokenizerul:
-
-```python
-model.save_pretrained("<path_to_dummy_folder>")
-tokenizer.save_pretrained("<path_to_dummy_folder>")
-```
-
-Folder-ul `<path_to_dummy_folder>` acum conține toate fișierele modelului dumneavoastră și ale tokenizerul. Vom urma fluxul tradițional de git adăugând fișiere în zona de pregătire, făcând commit și push fișierelor în hub:
-
-```python
-repo.git_add()
-repo.git_commit("Adăugarea fișierelor modelului și ale tokenizerului")
-repo.git_push()
-```
-
-Felicitări! Ați reușit să încărcați primele fișiere în hub.
-
-### Folosirea Git[[the-git-based-approach]]
-
-Acesta este abordarea cea mai de bază pentru încărcarea fișierelor: vom face ast cu ajutorul git și git-lfs direct. Cea mai grea parte este abstractizată prin abordări anterioare, dar există câteva excepții cu metoda următoare, așadar ne vom referi la un use-case mai complicat.
-
-Pentru această clasă se cere să aveți instalate git și git-lfs, așadar asigurați-vă că aveți [git-lfs](https://git-lfs.github.com/) instalat (vedeți aici instrucțiunile de instalare) și configurat înainte să începeți.
-
-În primul rând, inițializați git-lfs:
-
-```bash
-git lfs install
-```
-
-```bash
-Updated git hooks.
-Git LFS initialized.
-```
-
-După ce ați făcut acest lucru, primul pas este să faceți o copie a repositoriului dumneavoastră:
-
-```bash
-git clone https://huggingface.co/<namespace>/<your-model-id>
-```
-
-Numele meu de utilizator este `lysandre` și am folosit numele modelului `dummy`, așadar comanda mea se termină cu următorul rezultat:
-
-```
-git clone https://huggingface.co/lysandre/dummy
-```
-
-Acum am un folder denumit *dummy* în folderul meu de lucru. Pot intra în folder cu ajutorul `cd` și pot examina conținutul:
-
-```bash
-cd dummy && ls
-```
-
-```bash
-README.md
-```
-
-Dacă ați creat repositoriul dumneavoastră folosind metodă din partea Hugging Face Hub, `create_repo` , acest folder ar trebui să conțină doar un fișier cu numele *.gitattributes*. Dacă ați urmat instrucțiunile din secțiunea anterioară pentru crearea repositoriului folosind interfața web, atunci folderul ar trebui să conțină un singur fișier *README.md* și, de asemenea, un fișier cu numele *.gitattributes*, pe care nu-l puteți vedea.
-
-Adăugarea unui fișier de mărime obișnuită, precum un fișier de configurare, un vocabulary file sau orice alt tip de fișier care au mai puțin de câțiva megabytes se realizează exact așa cum ați face în orice sistem git. Cu toate acestea, pentru a încărca fișiere mai mari, este necesară utilizarea a git-lfs pentru a le trimite spre *huggingface.co*.
-
-Să ne întoarcem la Python pentru a genera un model și tokenizer pe care am dori să le facem commit în repositoriul nostru dummy:
-
-{#if fw === 'pt'}
-```py
-from transformers import AutoModelForMaskedLM, AutoTokenizer
-
-checkpoint = "camembert-base"
-
-model = AutoModelForMaskedLM.from_pretrained(checkpoint)
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-
-# Faceți orice cu modelul, antrenați-l, aplicați fine-tuning... 
-
-model.save_pretrained("<path_to_dummy_folder>")
-tokenizer.save_pretrained("<path_to_dummy_folder>")
-```
-{:else}
-```py
-from transformers import TFAutoModelForMaskedLM, AutoTokenizer
-
-checkpoint = "camembert-base"
-
-model = TFAutoModelForMaskedLM.from_pretrained(checkpoint)
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-
-# Faceți orice cu modelul, antrenați-l, aplicați fine-tuning... 
-
-model.save_pretrained("<path_to_dummy_folder>")
-tokenizer.save_pretrained("<path_to_dummy_folder>")
-```
-{/if}
-
-Acum am salvat câteva artefacte de model și tokenizer, așadar să examinăm din nou folderul *dummy*:
-
-```bash
-ls
-```
-
-{#if fw === 'pt'}
-```bash
-config.json  pytorch_model.bin  README.md  sentencepiece.bpe.model  special_tokens_map.json tokenizer_config.json  tokenizer.json
-```
-Dacă priviți la dimensiunile fișierelor (de exemplu, folosind `ls -lh`), ar trebui să vedeți că singurul outlier este model state dict file (*pytorch_model.bin*), care are mai mult de 400 MB.
-
-{:else}
-```bash
-config.json  README.md  sentencepiece.bpe.model  special_tokens_map.json  tf_model.h5  tokenizer_config.json  tokenizer.json
-```
-Dacă priviți la dimensiunile fișierelor (de exemplu, folosind`ls -lh`), ar trebui să vedeți că singurul outlier este model state dict file (*t5_model.h5*), care are mai mult de 400 MB.
-
-{/if}
-
-<Tip>
-✏️ Dacă creați repositoriul folosind interfața web, fișierul *.gitattributes* va fi automat configurat pentru a considera anumite extensii de fișiere, precum *.bin* și *.h5*, ca fiind fișiere mari. În acest caz nu este necesară nici o setare suplimentară din partea ta, pentru că git-lfs le va urmări automat.
-</Tip>
-
-Acum putem continua procesul în felul nostru obișnuit cu repositoriurile Git tradiționale. Putem adăuga toate fișierele în mediul de stocare a Git folosind comanda `git add`:
-
-```bash
-git add .
-```
-
-Puteți verifica fișierele curente care sunt în stare de stocare utilizând următoarea comandă:
-
-```bash
-git status
-```
-
-
-{#if fw === 'pt'}
-```bash
-On branch main
-Your branch is up to date with 'origin/main'.
-
-Changes to be committed:
-  (use "git restore --staged <file>..." to unstage)
-  modified:   .gitattributes
-	new file:   config.json
-	new file:   pytorch_model.bin
-	new file:   sentencepiece.bpe.model
-	new file:   special_tokens_map.json
-	new file:   tokenizer.json
-	new file:   tokenizer_config.json
-```
-{:else}
-```bash
-On branch main
-Your branch is up to date with 'origin/main'.
-
-Changes to be committed:
-  (use "git restore --staged <file>..." to unstage)
-  modified:   .gitattributes
-  	new file:   config.json
-	new file:   sentencepiece.bpe.model
-	new file:   special_tokens_map.json
-	new file:   tf_model.h5
-	new file:   tokenizer.json
-	new file:   tokenizer_config.json
-```
-{/if}
-
-De asemenea, putem verifica dacă git-lfs monitorizează fisierele corecte folosind comanda sa `status`:
-
-```bash
-git lfs status
-```
-
-
-{#if fw === 'pt'}
-```bash
-On branch main
-Objects to be pushed to origin/main:
-
-
-Objects to be committed:
-
-	config.json (Git: bc20ff2)
-	pytorch_model.bin (LFS: 35686c2)
-	sentencepiece.bpe.model (LFS: 988bc5a)
-	special_tokens_map.json (Git: cb23931)
-	tokenizer.json (Git: 851ff3e)
-	tokenizer_config.json (Git: f0f7783)
-
-Objects not staged for commit:
-
-
-```
-
-Vom observa că toate fișierele au `Git` ca handler, cu excepția *pytorch_model.bin* și *sentencepiece.bpe.model*, care au `LFS`. Excelent!
-
-{:else}
-```bash
-On branch main
-Objects to be pushed to origin/main:
-
-
-Objects to be committed:
-
-	config.json (Git: bc20ff2)
-	sentencepiece.bpe.model (LFS: 988bc5a)
-	special_tokens_map.json (Git: cb23931)
-	tf_model.h5 (LFS: 86fce29)
-	tokenizer.json (Git: 851ff3e)
-	tokenizer_config.json (Git: f0f7783)
-
-Objects not staged for commit:
-
-
-```
-
-Observăm că toate fișierele au `Git` ca handler, cu excepția *t5_model.h5*, care are `LFS`. Excelent!
-
-{/if}
-
-Acum vom continua cu ultimii pași: commiting și pushing la repo-urile *huggingface.co*:
-
-```
-git commit -m "Prima versiune a modelului"
-```
-
-
-{#if fw === 'pt'}
-```bash
-[main b08aab1] First model version
- 7 files changed, 29027 insertions(+)
-  6 files changed, 36 insertions(+)
- create mode 100644 config.json
- create mode 100644 pytorch_model.bin
- create mode 100644 sentencepiece.bpe.model
- create mode 100644 special_tokens_map.json
- create mode 100644 tokenizer.json
- create mode 100644 tokenizer_config.json
-```
-{:else}
-```bash
-[main b08aab1] First model version
- 6 files changed, 36 insertions(+)
- create mode 100644 config.json
- create mode 100644 sentencepiece.bpe.model
- create mode 100644 special_tokens_map.json
- create mode 100644 tf_model.h5
- create mode 100644 tokenizer.json
- create mode 100644 tokenizer_config.json
-```
-{/if}
-
-Pushingul poate lua câteva minute, în funcție de viteza conexiunii tale la internet și mărimea fișierelor:
-
-```bash
-git push
-```
-
-```bash
-Uploading LFS objects: 100% (1/1), 433 MB | 1.3 MB/s, done.
-Enumerating objects: 11, done.
-Counting objects: 100% (11/11), done.
-Delta compression using up to 12 threads
-Compressing objects: 100% (9/9), done.
-Writing objects: 100% (9/9), 288.27 KiB | 6.27 MiB/s, done.
-Total 9 (delta 1), reused 0 (delta 0), pack-reused 0
-To https://huggingface.co/lysandre/dummy
-   891b41d..b08aab1  main -> main
-```
-
-{#if fw === 'pt'}
-Dacă ne uităm la repositoriul modelului când acest lucru este finalizat, putem vedea toate fișierele recent adăugate:
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/full_model.png" alt="Tabul 'Files and versions' conține acum toate fișierele recente adăugate." width="80%"/>
-</div>
-
-Interfața permite explorarea fișierelor modelului și a commiturilor și vizualizarea diferenței introduse de fiecare commit:
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/diffs.gif" alt="Diferența introdusă de ultimul commit." width="80%"/>
-</div>
-{:else}
-Dacă ne uităm la repositoriul modelului când acest lucru este finalizat, putem vedea toate fișierele recent adăugate:
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/full_model_tf.png" alt="Tabul 'Files and versions' conține acum toate fișierele recente adăugate." width="80%"/>
-</div>
-
-Interfața permite explorarea fișierelor modelului și a commiturilor și vizualizarea diferenței introduse de fiecare commit:
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/diffstf.gif" alt="Diferența introdusă de ultimul commit." width="80%"/>
-</div>
-{/if}
-```
\ No newline at end of file
diff --git a/chapters/ro/chapter4/4.mdx b/chapters/ro/chapter4/4.mdx
deleted file mode 100644
index 7cac09819..000000000
--- a/chapters/ro/chapter4/4.mdx
+++ /dev/null
@@ -1,88 +0,0 @@
-# Crearea unui model card[[building-a-model-card]]
-
-
-<CourseFloatingBanner
-    chapter={4}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-Model card este un fișier care este, probabil, la fel de important ca și fișierele de model si tokenizer dintr-o repositoriul modelului. Este definiția centrală a modelului, asigurând reutilizarea de către membrii comunității și reproducerea rezultatelor, oferind o platformă pe care alți membri pot construi artefecatele lor.
-
-Documentarea procesului de antrenare și evaluare ajută celorlați să înțeleagă la ce să aștepte de la un model - iar oferirea informațiilor suficiente referitoare la datele folosite si preprocesarea acestora (înainte și după antrenare) vor ajuta la identificarea și înțelegerea limitelor, biaseruile și contextului în care modelul este și nu este folositor.
-
-Prin urmare, crearea unui model card care definește modelul dvs. este un pas foarte important. Aici, oferim câteva sfaturi care v-ar putea ajuta în acest sens. Crearea model cardului se face prin intermediul fișierului `README.md`, pe care l-ați văzut anterior, care este un fișier Markdown.
-
-Conceptul de "model card" provine dintr-o direcție de cercetare a Google, publicată inițial în articolul ["Model Cards for Model Reporting"](https://arxiv.org/abs/1810.03993) scrisă de Margaret Mitchell et al. O parte semnificativă dintre informațiile conținute aici sunt bazate pe acest articol, iar noi vă recomandăm să verificați dacă doriți să înțelegeți de ce model cardurile sunt atât importante într-o lume care valorifică reproducerea, reutilizarea și echitatea.
-
-Model cardul începe cu o prezentare scurtă și generală a ceea ce este modelul - urmată de detalii suplimentare în secțiunile următoare:
-
-- Descrierea modelului
-- Utilizări intenționate și limitările modelului
-- Cum se utilizează
-- Limitări și bias
-- Datele de antrenare
-- Procedura de antrenare
-- Rezultatele evaluării
-
-Hai să vedem ce ar trebui să conțină fiecare dintre aceste secțiuni.
-
-### Descrierea modelului[[model-description]]
-
-Secțiunea de descriere a modelului conține detalii generale despre model. Aceasta include arhitectura, versiunea, dacă a fost introdus într-un articol științific, dacă este disponibilă o implementare originală, autorul și informații generale despre model. Orice drepturi de autor ar trebui să fie atribuite în această secțiune. Informația generală despre procedurile de antrenare, parametrii și avertismente pot fi menționate aici.
-
-### Utilizări intenționate și limitările modelului[[intended-uses-limitations]]
-
-Aici descrieți utilizările pentru care modelul este destinat - inclusiv limba și domeniile unde se poate aplica. Această secțiune din model card poate documenta și zone cunoscute ca nefiind în scopul modelului sau unde este probabil să funcționeze suboptimal.
-
-### Cum se utilizează[[how-to-use]]
-
-Acesta secțiune ar trebui să includă exemple despre cum să utilizați modelul. Acest lucru poate prezenta utilizarea funcției `pipeline()`, utilizarea claselor de model si tokenizer, și orice cod care credeți că ar putea fi util.
-
-### Datele de antrenare[[training-data]]
-
-Această secțiune trebuie să indice datasetul(urile) folosit pentru instruirea modelului. O descriere scurtă a datasetului(urilor) este binevenită.
-
-### Procedura de antrenare[[training-procedure]]
-
-Aici descrieți toate aspectele relevante ale antrenarii care sunt utile din punct de vedere al reproducerii. Acest lucru include orice preprocessing sau postprocessing efectuat pe date, precum și detalii ca numărul de epoci pe care a fost antrenat modelul, dimensiunea batch-ului, learning rateul si alte astfel de detalii.
-
-### Variabilele si metrice[[variable-and-metrics]]
-
-Aici descrieți metricile utilizate la evaluarea rezultatelor, precum și diferite aspecte pe care le măsurați. Menționați metricile folosite, pe ce dataset și care dataset split, astfel încât să fie ușor de comparat performanțele modelului cu cele ale altor modele.
-
-### Rezultatele evaluării[[evaluation-results]]
-
-În sfârșit, indicați cum s-a comportat modelul pe datasetul de evaluare. Dacă modelul foloseste un decision threshold, atunci includeți acest decision threshold în secțiunea respectivă - sau explicați că rezultatele sunt prezentate la diferite thresholduri pentru utilizările preconizate.
-
-## Exemplu[[example]]
-
-Aici puteți găsi câteva exemple ale unor Model Card:
-
-- [`bert-base-cased`](https://huggingface.co/bert-base-cased)
-- [`gpt2`](https://huggingface.co/gpt2)
-- [`distilbert`](https://huggingface.co/distilbert-base-uncased)
-
-Câteva exemple din alte organizații și companii pot fi găsite [aici](https://github.com/huggingface/model_card/blob/master/examples.md).
-
-## Notă[[note]]
-
-Model cardurile nu sunt o cerință obligatorie când se publică modelele si nu este necesar să includeți toate secțiunile descrise mai sus în Model Card. Cu toate acestea, documentarea explicită a modelului poate beneficia utilizatorilor viitori, deci vă recomandăm să completați cât mai multe dintre secțiuni.
-
-## Metadatele cardului de model[[model-card-metadata]]
-
-Dacă ați explorat puțin Hugging Face Hub atunci ar trebui să fi văzut că anumite modele aparțin anumitor categorii: puteți filtra acestea după diverse domenii. Categoriile modelului sunt identificate prin metadata adăugată în secțiunea de header a cardului.
-
-Spre exemplu, dacă vă uitați la modelul [`camembert-base`](https://huggingface.co/camembert-base/blob/main/README.md) atunci veți observa următoarea linii din headerul cardului:
-
-````
----
-language: fr
-license: mit
-datasets:
-- oscar
----
-```
-
-Metadatele acestei secțiuni sunt analizate de Hugging Face Hub, care apoi identifică acest model ca fiind un model francez, cu licență MIT și antrenat pe datasetul Oscar.
-
-[Toate specificările cardului](https://github.com/huggingface/hub-docs/blame/main/modelcard.md) permite specificarea a mai multor metadate, inclusiv limba, licența, etichetele, dataseturile folosite la antrenare și metricile evaluate.
\ No newline at end of file
diff --git a/chapters/ro/chapter4/5.mdx b/chapters/ro/chapter4/5.mdx
deleted file mode 100644
index 509673def..000000000
--- a/chapters/ro/chapter4/5.mdx
+++ /dev/null
@@ -1,12 +0,0 @@
-# Partea 1 este completată!
-
-<CourseFloatingBanner
-    chapter={4}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-Acesta este sfârșitul primei părți a cursului! Partea 2 va fi lansată pe data de 15 noiembrie, cu un mare eveniment comunitar, mai multe informații găsiți [aici](https://huggingface.co/blog/course-launch-event).
-
-Acum, sunteți capabili să faceți fine-tune unui model preantrenat pe o problemă de clasificare a textului (o singură sau perechi de propoziții) și să încarci rezultatele la Model Hub. Să fii sigur că ai învățat această primă secțiune, ar trebui să faci exact acest lucru pe o problemă care ți se pare interesantă (și nu neapărat în limba engleză dacă vorbiți altă limbă)! Puteți găsi ajutor în [forumurile Hugging Face](https://discuss.huggingface.co/) și să împărtășiți proiectul dvs. pe [acest subiect](https://discuss.huggingface.co/t/share-your-projects/6803) odată ce ați terminat.
-
-Ne așteptăm cu nerăbdare să vedem ceea ce veți construi cu aceste cunoștințe :)!
\ No newline at end of file
diff --git a/chapters/ro/chapter4/6.mdx b/chapters/ro/chapter4/6.mdx
deleted file mode 100644
index 746428f14..000000000
--- a/chapters/ro/chapter4/6.mdx
+++ /dev/null
@@ -1,233 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-<!-- DISABLE-FRONTMATTER-SECTIONS -->
-
-# Quiz pentru finalizarea capitolului[[end-of-chapter-quiz]]
-
-<CourseFloatingBanner
-    chapter={4}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-Să testăm ceea ce ai învățat în acest capitol!
-  
-### 1. La ce sunt limitate modelele din Hub?
-
-<Question
-	choices={[ 
-		{
-			text: "Modelele din biblioteca 🤗 Transformers.",
-			explicație: "Ținând cont că modelele din biblioteca 🤗 Transformers sunt disponibile pe Hugging Face Hub, ele nu sunt singurele!"
-		},
-		{
-			text: "Toate modelele cu o interfață similară cu 🤗 Transformers.",
-			explicație: "Nu există nicio cerință de interfață când se încarcă modelele pe Hugging Face Hub."
-		},
-		{
-			text: "Nu există limite.",
-			explicație: "Adevărat! Nu există nici o limită când se încarcă modele pe Hub.",
-            corect: true
-		},
-        {
-			text: "Modele care, într-o anumită măsură, sunt legate de NLP.",
-			explicație: "Nu există nicio cerință privind domeniul aplicației!"
-		}
-	] }
-/>
-
-### 2. Cum poți gestiona modelele pe Hub?
-
-<Question
-	choices={[ 
-		{
-			text: "Printr-un cont GCP.",
-			explicație: "Greșit! "
-		},
-		{
-			text: "Prin distribuția peer-to-peer.",
-			explicație: "Greșit!"
-		},
-		{
-			text: "Prin git și git-lfs.",
-			explicație: "Corect! Modelele din Hub sunt simple repositorii Git, care utilizează <code>git-lfs</code> pentru fișiere mari.",
-            corect: true
-		}
-	] }
-/>
-
-### 3. Ce poți face utilizând interfața web a Hugging Face Hub?
-
-<Question
-	choices={[ 
-		{
-			text: "Forkingul unui repositoriu existent.",
-			explicație: "Nu se poate face forking la un repositoriu pe Hugging Face Hub."
-		},
-		{
-			text: "Crearea unui nou model repository.",
-			explicație: "Corect! Dar nu este singurul lucru pe care îl poți face...",
-            corect: true
-		},
-		{
-			text: "Gestionarea și editarea fișierelor.",
-			explicație: "Corect! Dar nuu este singurul lucru pe care îl poți face..."
-            correct: true
-		},
-        {
-			text: "Încărcarea de fișiere.",
-			explicație: "Corect! Dar nu este singurul lucru..."
-            correct: true
-		},
-        {
-			text: "Vizualizarea diferențelor între versiuni.",
-			explicație: "Corect! Dar nu este singurul lucru pe care îl poți face...",
-            corect: true
-		}
-	] }
-/>
-
-### 4. Ce este un model card?
-
-<Question
-	choices={[ 
-		{
-			text: "O descriere a modelului, deci mai puțin importantă decât fișierele model și tokenizer.",
-			explicație: "Este într-adevăr o descriere a modelului, dar este un element important. Dacă descrierea nu este completă sau absentă, utilitatea modelului se reduce drastic."
-		},
-		{
-			text: "Un mod de asigurare a reproducerii, reutilizării și egalității.",
-			explicație: "Corect! Oferirea informațiilor adecvate în model card va ajuta utilizatorii să utilizeze modelul și să fie conștienți de limitele și biasurile acestuia. ",
-            corect: true
-		},
-		{
-			text: "Un fișier Python care poate fi rulat pentru a obține informații despre model.",
-			explicație: "Model cardurile sunt simple fișiere Markdown."
-		}
-	] }
-/>
-
-Chapitru 4
-
-### 5. Câte dintre obiectele bibliotecii 🤗 Transformers pot fi împărtășite direct pe Hub cu `push_to_hub()`?
-
-{#if fw === 'pt'}
-<Question
-	choices={[
-		{
-			text: "Un tokenizer",
-			explain: "Corect! Toți tokenizerii au metoda <code>push_to_hub</code>, și utilizând-o, vor împărtăși toate fișierele tokenizerului (vocabular, arhitectură tokenizerului, etc.) către un repo. Însă acesta nu este singura soluție corectă!",
-            correct: true
-		},
-		{
-			text: "O configurare a modelului",
-			explain: "Corect! Toate configurațiile modelelor au metoda <code>push_to_hub</code>, și utilizând-o, vor împărtăși configurația către un repo. Și ce altceva poți oferi?",
-            correct: true
-		},
-		{
-			text: "Un model",
-			explain: "Corect! Toate modelele au metoda <code>push_to_hub</code>, și utilizând-o, vor împărtăși ei, precum și fișierele de configurare către un repo. Și nu numai asta!",
-            correct: true
-		},
-        {
-			text: "Un Trainer",
-			explain: "Corect — <code>Trainer</code> implementează metoda <code>push_to_hub</code>, și utilizând-o, vor încărca modelul, configurarea sa, tokenizerul, precum și un draft a unui model card către un repo. Încearcă și altă opțiune!",
-            correct: true
-		}
-	]}
-/>
-
-{:else}
-<Question
-	choices={[
-		{
-			text: "Un tokenizer",
-			explain: "Corect! Toți tokenizerii au metoda <code>push_to_hub</code>, și utilizând-o, vor împărtăși toate fișierele tokenizerului (vocabular, arhitectură tokenizerului, etc.) către un repo. Însă acesta nu este singura soluție corectă!",
-            correct: true
-		},
-		{
-			text: "O configurare a modelului",
-			explain: "Corect! Toate configurațiile modelelor au metoda <code>push_to_hub</code>, și utilizând-o, vor împărtăși configurația către un repo. Și ce altceva poți oferi?",
-            correct: true
-		},
-		{
-			text: "Un model",
-			explain: "Corect! Toate modelele au metoda <code>push_to_hub</code>, și utilizând-o, vor împărtăși ei, precum și fișierele de configurare către un repo. Și nu numai asta!",
-            correct: true
-		},
-        {
-			text: "Toate cele trei cu un callback dedicat",
-			explain: "Corect — <code>PushToHubCallback</code> va trimite regular toate aceste obiecte către un repo în timpul antrenării.",
-            correct: true
-		}
-	]}
-/>
-{/if}
-
-### 6. Care este primul pas atunci când utilizați metoda `push_to_hub()` sau instrumentele CLI?
-
-<Question
-	choices={[
-		{
-			text: "Logarea pe website",
-			explain: "Acest lucru nu vă va ajuta local."
-		},
-		{
-			text: "Rulați 'huggingface-cli login' în terminal.",
-			explain: "Corect — acest lucru va descărca și va stoca tokenul personal.",
-            correct: true
-		},
-		{
-			text: "Rulați 'notebook_login()' într-un notebook",
-			explain: "Corect — acest lucru va afișa un widget pentru a vă autentifica.",
-            correct: true
-		},
-	]
-    }
-/>
-
-
-### 7. Aveți un model și un tokenizer, cum le puteți încărca pe ambele în Hub?
-
-<Question
-	choices={[
-		{
-			text: "Prin apelarea directă a metodei `push_to_hub` pe model și tokenizer",
-			explain: "Corect!",
-            correct: true
-		},
-		{
-			text: "În cadrul runtime-ului Python, prin wrappingul acestora într-un <code>huggingface_hub</code>",
-			explain: "Modelele și tokenizerii deja beneficiază de utilitățile <code>huggingface_hub</code>: nu vă trebuie nici un wrapping suplimentar!"
-		},
-		{
-			text: "Prin salvarea lor pe disc și apelarea <code>transformers-cli upload-model</code>",
-			explain: "Comanda <code>upload-model</code> nu există."
-		}
-	]}
-/>
-
-### 8. Carele operații git poți face cu clasa `Repository`?
-
-<Question
-	choices={[
-		{
-			text: "Un commit",
-			explain: "Corect, metoda <code>git_commit()</code> este acolo pentru a face commit.",
-            correct: true
-		},
-		{
-			text: "Un pull",
-			explain: "Acesta este scopul metodei <code>git_pull()</code>",
-            correct: true
-		},
-		{
-			text: "Un push",
-			explain: "Metoda <code>git_push()</code> face acest lucru.",
-            correct: true
-		},
-		{
-			text: "Un merge",
-			explain: "Nu, această operație nu va fi niciodată posibilă cu acest API."
-		}
-	]}
-/>
\ No newline at end of file
diff --git a/chapters/ro/chapter6/1.mdx b/chapters/ro/chapter6/1.mdx
deleted file mode 100644
index 9cfd151ed..000000000
--- a/chapters/ro/chapter6/1.mdx
+++ /dev/null
@@ -1,19 +0,0 @@
-# Introducere[[introducere]]
-
-<CourseFloatingBanner
-    chapter={6}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-În [Capitolul 3](/course/chapter3), am examinat cum să facem fine-tune unui model pentru o anumită sarcină. Când facem acest lucru, utilizăm același tokenizer cu care modelul a fost antrenat - dar ce facem când dorim să antrenăm un model de la zero? În așa cazuri, utilizarea unui tokenizer care a fost antrenat pe un corpus dintr-un alt domeniu sau limbă este, de obicei, suboptimal. De exemplu, un tokenizer antrenat pe un corpus în limba engleză va funcționa rău pe un corpus de texte în limba japoneză, deoarece utilizarea spațiilor și a punctuației este foarte diferită în cele două limbi.
-
-În acest capitol, veți învăța cum să antrenați un tokenizer complet nou pe un corpus de texte, astfel încât să poată fi utilizat pentru a antrena un model de limbaj. Acest lucru va fi realizat cu ajutorul bibliotecii [🤗 Tokenizers](https://github.com/huggingface/tokenizers), care oferă tokenizerii "rapizi" din biblioteca [🤗 Transformers](https://github.com/huggingface/transformers). Vom examina îndeaproape caracteristicile pe care această bibliotecă le oferă și vom explora cum tokenizatorii rapizi diferă de versiunile "lente".
-
-Subiectele pe care le vom acoperi includ:
-
-* Cum să antrenați un tokenizer nou similar celui utilizat de un anumit checkpoint pe un corpus nou de texte
-* Caracteristicile speciale ale tokenizerilor rapizi
-* Diferențele dintre cei trei algoritmi principali de subword tokenization utilizate în NLP în prezent
-* Cum să construiți un tokenizer de la zero cu biblioteca 🤗 Tokenizers și să îl antrenați pe anumite date
-
-Tehnicile prezentate în acest capitol vă vor pregăti pentru secțiunea din [Capitolul 7](/course/chapter7/6), unde vom examina crearea unui model de limbaj pentru codul sursă Python. Să începem prin a explora ce înseamnă să "antrenați" un tokenizer în primul rând.
diff --git a/chapters/ro/chapter6/10.mdx b/chapters/ro/chapter6/10.mdx
deleted file mode 100644
index f3fcf6dc7..000000000
--- a/chapters/ro/chapter6/10.mdx
+++ /dev/null
@@ -1,283 +0,0 @@
-<!-- DISABLE-FRONTMATTER-SECTIONS -->
-
-# Quiz de sfârșit de capitol[[end-of-chapter-quiz]]
-
-<CourseFloatingBanner
-    chapter={6}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-Hai să testăm ceea ce ai învățat în acest capitol!
-
-### 1. Când ar trebui să antrenezi un nou tokenizer?
-
-<Question
-	choices={[
-		{
-			text: "Când datasetul tău este similar cu cel utilizat de un model preantrenat și doriți să preantrenați un model nou",
-			explain: "În acest caz, pentru a economisi timp și resurse, o alegere mai bună ar fi să folosești același tokenizer ca și modelul preantrenat și să faceți fine-tune acelui model."
-		},
-		{
-			text: "Atunci când datasetul tău este similar cu cel utilizat de un model preantrenat existent și doriți să faceți fine-tune unui nou model utilizând acest model preantrenat",
-			explain: "Pentru a face fine-tune unui model dintr-un model preantrenat, trebuie să utilizați întotdeauna același tokenizer."
-		},
-		{
-			text: "Atunci când datasetul tău este diferit de cel utilizat de un model preantrenat existent și doriți să preantrenați un nou model",
-			explain: "Corect! În acest caz nu există niciun avantaj în a utiliza același tokenizer.",
-            correct: true
-		},
-        {
-			text: "Atunci datasetul tău este diferit de cel utilizat de un model preantrenat existent, dar doriți să faceți fine-tune unui model nou utilizând acest model preantrenat",
-			explain: "Pentru a face fine-tune unui model dintr-un model preantrenat, trebuie să utilizați întotdeauna același tokenizer."
-		}
-	]}
-/>
-
-### 2. Care este avantajul utilizării unui generator de liste de texte în comparație cu o listă de liste de texte atunci când utilizați `train_new_from_iterator()`?
-
-<Question
-	choices={[
-		{
-			text: "Acesta este singurul tip pe care metoda <code>train_new_from_iterator()</code> îl acceptă.",
-			explain: "O listă de liste de texte este un tip special de generator de liste de texte, astfel încât metoda o va accepta și pe aceasta. Încercați din nou!"
-		},
-		{
-			text: "Veți evita încărcarea întregului dataset în memorie.",
-			explain: "Corect! Fiecare batch de texte va fi eliberat din memorie atunci când iterați, iar câștigul va fi vizibil mai ales dacă utilizați 🤗 Datasets pentru a stoca textele.",
-			correct: true
-		},
-		{
-			text: "Acest lucru va permite bibliotecii 🤗 Tokenizers să utilizeze multiprocessing.",
-			explain: "Nu, oricum va folosi multiprocessing."
-		},
-        {
-			text: "Tokenizerul pe care îl vei antrena va genera texte mai bune.",
-			explain: "Tokenizerul nu generează text - îl confundați cu un model lingvistic?"
-		}
-	]}
-/>
-
-### 3. Care sunt avantajele utilizării unui tokenizer "rapid"?
-
-<Question
-	choices={[
-		{
-			text: "Acesta poate procesa inputuri mai rapid decât un tokenizator lent atunci când faci batch mai multor inputuri împreună.",
-			explain: "Corect! Datorită paralelismului implementat în Rust, acesta va fi mai rapid pe batch-uri de inputuri. La ce alt beneficiu te poți gândi?",
-			correct: true
-		},
-		{
-			text: "Tokenizerele rapide tokenizează întotdeauna mai rapid decât omologii lor lenți.",
-			explain: "Un tokenizer rapid poate fi de fapt mai lent atunci când îi dai doar unul sau foarte puține texte, deoarece nu poate utiliza paralelismul."
-		},
-		{
-			text: "Poate aplica padding și truncation.",
-			explain: "Adevărat, dar și tokenizerele lente fac asta."
-		},
-        {
-			text: "Acesta are unele caracteristici suplimentare care vă permit să asociați tokenii cu intervalul de text care le-a creat.",
-			explain: "Într-adevăr - acestea se numesc offset mappings. Totuși, acesta nu este singurul avantaj.",
-			correct: true
-		}
-	]}
-/>
-
-### 4. Cum tratează pipelineul `token-classification` entitățile care se întind pe mai mulți tokeni?
-
-<Question
-	choices={[
-		{
-			text: "Entitățile cu același label sunt merged într-o singură entitate.",
-			explain: "Explicația aceasta e prea simplă. Încearcă din nou!"
-		},
-		{
-			text: "Există un label pentru începutul unei entități și un label pentru continuarea unei entități.",
-			explain: "Corect!",
-			correct: true
-		},
-		{
-			text: "Într-un cuvânt dat, atâta timp cât primul token are labelul entității, întregul cuvânt este considerat etichetat cu entitatea respectivă.",
-			explain: "Aceasta este o strategie de gestionare a entităților. Ce alte răspunsuri se aplică aici?",
-			correct: true
-		},
-        {
-			text: "Atunci când un token are labelul unei entități date, orice alt token următor cu aceeași label este considerat parte a aceleiași entități, cu excepția cazului în care este labeled ca fiind începutul unei noi entități.",
-			explain: "Acesta este cel mai comun mod de a grupa entitățile împreună - deși nu este singurul răspuns corect.",
-			correct: true
-		}
-	]}
-/>
-
-### 5. Cum gestionează pipelineul `question-answering` contextele lungi?
-
-<Question
-	choices={[
-		{
-			text: "De fapt, nu o face, deoarece trunchiază contextul lung la lungimea maximă acceptată de model.",
-			explain: "Există un truc pe care îl poți folosi pentru a gestiona contextele lungi. Îți amintești care este acesta?"
-		},
-		{
-			text: "Acesta împarte contextul în mai multe părți și calculează media rezultatelor obținute.",
-			explain: "Nu, nu ar avea sens să se facă o medie a rezultatelor, deoarece unele părți ale contextului nu vor include răspunsul."
-		},
-		{
-			text: "Acesta împarte contextul în mai multe părți (cu suprapuneri) și găsește scorul maxim pentru un răspuns în fiecare parte.",
-			explain: "Acesta este răspunsul corect!",
-			correct: true
-		},
-        {
-			text: "Acesta împarte contextul în mai multe părți (fără suprapunere, pentru eficiență) și găsește scorul maxim pentru un răspuns în fiecare parte.",
-			explain: "Nu, acesta include o anumită suprapunere între părți pentru a evita situația în care răspunsul ar fi împărțit în două părți."
-		}
-	]}
-/>
-
-### 6. Ce este normalizarea?
-
-<Question
-	choices={[
-		{
-			text: "Este vorba de orice curățare pe care tokenizerul o efectuează asupra textelor în etapele inițiale.",
-			explain: "Corect - de exemplu, ar putea implica eliminarea accentelor sau a spațiilor, sau scrierea cu mijuscule a inputurilor.",
-			correct: true
-		},
-		{
-			text: "Este o tehnică de augmentare a datelor care constă în a face textul mai normal prin eliminarea cuvintelor rare.",
-			explain: "Este incorect! Încearcă din nou."
-		},
-		{
-			text: "Acesta este ultimul pas de post-procesare în care tokenizerul adaugă tokenii speciali.",
-			explain: "Această etapă se numește pur și simplu post-procesare."
-		},
-        {
-			text: "Este atunci când embeddingurile sunt realizate cu media 0 și standard deviation 1, prin scăderea mediei și împărțirea la std.",
-			explain: "Acest proces se numește de obicei normalizare atunci când este aplicat valorilor pixelilor în computer vision, dar nu este ceea ce înseamnă normalizare în NLP."
-		}
-	]}
-/>
-
-### 7. Ce este pre-tokenizarea pentru un subword tokenizer?
-
-<Question
-	choices={[
-		{
-			text: "Acesta este pasul dinaintea tokenizării, în care se aplică augmentarea datelor (cum ar fi mascarea aleatorie).",
-			explain: "Nu, acest pas face parte din preprocesare."
-		},
-		{
-			text: "Este pasul de dinaintea tokenizării, în care operațiile de curățare dorite sunt aplicate textului.",
-			explain: "Nu, acesta este pasul de normalizare."
-		},
-		{
-			text: "Acesta este pasul dinaintea aplicării modelul de tokenizer, pentru a împărți inputul în cuvinte.",
-			explain: "Acesta este răspunsul corect!",
-			correct: true
-		},
-        {
-			text: "Acesta este pasul dinaintea aplicării modelul de  tokenizer, pentru a împărți inputul în tokenuri.",
-			explain: "Nu, împărțirea în tokenuri este sarcina modelul de tokenizer."
-		}
-	]}
-/>
-
-### 8. Selectați propozițiile care se aplică modelului de tokenizare BPE.
-
-<Question
-	choices={[
-		{
-			text: "BPE este un algoritm de tokenizare a subcuvintelor care începe cu un vocabular mic și învață reguli de merge.",
-			explain: "Acesta este într-adevăr cazul!",
-			correct: true
-		},
-		{
-			text: "BPE este un algoritm de tokenizare a subcuvintelor care începe cu un vocabular mare și elimină progresiv tokenii din acesta.",
-			explain: "Nu, aceasta este abordarea adoptată de un alt algoritm de tokenizare."
-		},
-		{
-			text: "Tokenizerele BPE învață regulile de merge prin mergeul perechii de tokeni care este cea mai frecventă.",
-			explain: "Acest lucru este corect!",
-			correct: true
-		},
-		{
-			text: "Un tokenizer BPE învață o regulă de merge prin mergeul perechii de tokeni care maximizează un scor care privilegiază perechile frecvente cu părți individuale mai puțin frecvente.",
-			explain: "Nu, aceasta este strategia aplicată de un alt algoritm de tokenizare."
-		},
-		{
-			text: "BPE tokenizează cuvintele în subcuvinte prin divizarea lor în caractere și apoi prin aplicarea regulilor de merge.",
-			explain: "Acest lucru este corect!",
-			correct: true
-		},
-		{
-			text: "BPE tokenizează cuvintele în subcuvinte prin găsirea celui mai lung subcuvânt de la început care se află în vocabular, apoi repetă procesul pentru restul textului.",
-			explain: "Nu, acesta este un alt mod de a face lucrurile al algoritmului de tokenizare."
-		},
-	]}
-/>
-
-### 9. Selectați propozițiile care se aplică modelului de tokenizare WordPiece.
-
-<Question
-	choices={[
-		{
-			text: "WordPiece este un algoritm de tokenizare a subcuvintelor care începe cu un vocabular mic și învață reguli de merge.",
-			explain: "Acesta este într-adevăr cazul!",
-			correct: true
-		},
-		{
-			text: "WordPiece este un algoritm de tokenizare a subcuvintelor care începe cu un vocabular mare și elimină progresiv tokenii din acesta.",
-			explain: "Nu, aceasta este abordarea adoptată de un alt algoritm de tokenizare."
-		},
-		{
-			text: "Tokenizerele WordPiece învață regulile de merge prin mergeul perechii de tokeni care este cea mai frecventă.",
-			explain: "Nu, aceasta este abordarea adoptată de un alt algoritm de tokenizare!",
-		},
-		{
-			text: "Un tokenizer WordPiece învață o regulă de merge prin mergeul perechii de tokeni care maximizează un scor care privilegiază perechile frecvente cu părți individuale mai puțin frecvente.",
-			explain: "Acest lucru este corect!",
-			correct: true
-		},
-		{
-			text: "WordPiece tokenizează cuvintele în subcuvinte prin găsirea celei mai probabile segmentări în tokeni, în conformitate cu modelul.",
-			explain: "Nu, acesta este modul în care funcționează un alt algoritm de tokenizare."
-		},
-		{
-			text: "WordPiece tokenizează cuvintele în subcuvinte prin găsirea celui mai lung subcuvânt de la început care se află în vocabular, apoi repetă procesul pentru restul textului.",
-			explain: "Da, acesta este modul în care WordPiece procedează pentru encoding.",
-			correct: true
-		},
-	]}
-/>
-
-### 10. Selectați propozițiile care se aplică modelului de tokenizare Unigram.
-
-<Question
-	choices={[
-		{
-			text: "Unigram este un algoritm de tokenizare a subcuvintelor care începe cu un vocabular mic și învață reguli de merge.",
-			explain: "Nu, aceasta este abordarea adoptată de un alt algoritm de tokenizare."
-		},
-		{
-			text: "Unigram este un algoritm de tokenizare a subcuvintelor care începe cu un vocabular mare și elimină progresiv tokenurile din el.",
-			explain: "Acest lucru este corect!",
-			correct: true
-		},
-		{
-			text: "Unigram își adaptează vocabularul prin minimizarea unei pierderi calculate pe întregul corpus.",
-			explain: "Acest lucru este corect!",
-			correct: true
-		},
-		{
-			text: "Unigram își adaptează vocabularul prin păstrarea celor mai frecvente subcuvinte.",
-			explain: "Nu, acest lucru este incorect."
-		},
-		{
-			text: "Unigram tokenizează cuvintele în subcuvinte prin găsirea celei mai probabile segmentări în tokenuri, conform modelului.",
-			explain: "Acest lucru este corect!",
-			correct: true
-		},
-		{
-			text: "Unigram tokenizează cuvintele în subcuvinte prin divizarea lor în caractere, apoi aplică regulile de merge.",
-			explain: "Nu, acesta este modul în care funcționează un alt algoritm de tokenizare."
-		},
-	]}
-/>
diff --git a/chapters/ro/chapter6/2.mdx b/chapters/ro/chapter6/2.mdx
deleted file mode 100644
index ef36da15c..000000000
--- a/chapters/ro/chapter6/2.mdx
+++ /dev/null
@@ -1,257 +0,0 @@
-# Antrenarea unui nou tokenizer dintr-unul vechi[[training-a-new-tokenizer-from-an-old-one]]
-
-<CourseFloatingBanner chapter={6}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter6/section2.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter6/section2.ipynb"},
-]} />
-
-Dacă un model de limbaj nu este disponibil în limba dorită sau dacă corpusul tău este foarte diferit de cel pe care modelul de limbaj a fost antrenat, este probabil că veți dori să antrenați modelul de la zero, folosind un tokenizer adaptat datelor tale. Acest lucru va necesita antrenarea unui nou tokenizer pe datasetul tău. Dar ce înseamnă exact asta? Când am examinat pentru prima dată tokenizatorii în [Capitolul 2](/course/chapter2), am văzut că majoritatea modelelor Transformer folosesc un _algoritm de subword tokenization_. Pentru a identifica care subcuvinte sunt de interes și apar cel mai frecvent în corpusul respectiv, tokenizerul trebuie să examineze cu atenție toate textele din corpus - un proces pe care îl numim *antrenare*. Regulile exacte care conduc această antrenare depind de tipul de tokenizer utilizat și vom prezenta cei trei algoritmi principali mai târziu în acest capitol.
-
-<Youtube id="DJimQynXZsQ"/>
-
-<Tip warning={true}>
-
-⚠️ Antrenarea unui tokenizer nu este același lucru ca antrenarea unui model! Antrenarea modelului folosește stochastic gradient descent pentru a face pierderea puțin mai mică pentru fiecare batch. Este randomizată prin natură (ceea ce înseamnă că trebuie să setați niște seeduri pentru a obține aceleași rezultate atunci când faceți aceeași antrenare de două ori). Antrenarea unui tokenizer este un proces statistic care încearcă să identifice care subcuvinte sunt cele mai bune pentru a fi selectate pentru un anumit corpus, și regulile exacte utilizate pentru a le selecta depind de algoritmul de tokenizare. Este determinist, ceea ce înseamnă că întotdeauna obțineți aceleași rezultate atunci când antrenați cu același algoritm pe același corpus.
-
-</Tip>
-
-## Asamblarea unui corpus[[assembling-a-corpus]]
-
-Există o interfață API foarte simplă în 🤗 Transformers pe care o puteți utiliza pentru a antrena un nou tokenizer cu aceleași caracteristici ca unul existent: `AutoTokenizer.train_new_from_iterator()`. Pentru a vedea acest lucru în acțiune, să zicem că vrem să antrenăm GPT-2 de la zero, dar într-o altă limbă decât engleza. Prima noastră sarcină va fi să adunăm multe date în acea limbă într-un corpus de antrenare. Pentru a oferi exemple pe care toată lumea le poate înțelege, nu vom folosi o limbă ca rusă sau chineza aici, ci mai degrabă o limbă engleză specializată: codul Python.
-
-Biblioteca [🤗 Datasets](https://github.com/huggingface/datasets) ne poate ajuta să asamblăm un corpus de cod sursă Python. Vom folosi funcția obișnuită `load_dataset()` pentru a descărca și a păstra în cache dataseul [CodeSearchNet](https://huggingface.co/datasets/code_search_net). Acest dataset a fost creat pentru [Provocarea CodeSearchNet](https://wandb.ai/github/CodeSearchNet/benchmark) și conține milioane de funcții din biblioteci open-source de pe GitHub în mai multe limbaje de programare. Aici, vom încărca partea Python a acestui dataset:
-
-```py
-from datasets import load_dataset
-
-# Acest lucru poate dura câteva minute pentru a încărca, așa că luați o pauză și beți o ceașcă de cafea sau ceai în timp ce așteptați!
-raw_datasets = load_dataset("code_search_net", "python")
-```
-
-Putem să ne uităm la splitul de antrenare pentru a vedea la care coloane avem acces:
-
-```py
-raw_datasets["train"]
-```
-
-```python out
-Dataset({
-    features: ['repository_name', 'func_path_in_repository', 'func_name', 'whole_func_string', 'language', 
-      'func_code_string', 'func_code_tokens', 'func_documentation_string', 'func_documentation_tokens', 'split_name', 
-      'func_code_url'
-    ],
-    num_rows: 412178
-})
-```
-
-Putem vedea că dataset-ul separă docstringurile de cod și sugerează o tokenizare a ambelor. Aici, vom folosi doar coloana `whole_func_string` pentru a antrena tokenizerul nostru. Putem să ne uităm la un exemplu al unei astfel de funcții prin indexarea în splitul de antrenare:
-
-```py
-print(raw_datasets["train"][123456]["whole_func_string"])
-```
-
-care ar trebui să printeze următorul lucru:
-
-```out
-def handle_simple_responses(
-      self, timeout_ms=None, info_cb=DEFAULT_MESSAGE_CALLBACK):
-    """Accepts normal responses from the device.
-
-    Args:
-      timeout_ms: Timeout in milliseconds to wait for each response.
-      info_cb: Optional callback for text sent from the bootloader.
-
-    Returns:
-      OKAY packet's message.
-    """
-    return self._accept_responses('OKAY', info_cb, timeout_ms=timeout_ms)
-```
-
-Primul lucru pe care trebuie să-l facem este să transformăm setul de date într-un _iterator_ de liste de texte - de exemplu, o listă de liste de texte. Utilizarea listelor de texte va permite tokenizerului nostru să funcționeze mai rapid (antrenându-se pe batch-uri de texte în loc de a procesa texte individuale unul câte unul), iar acesta ar trebui să fie un iterator dacă dorim să evităm să avem tot în memoria RAM deodată. Dacă corpusul tău este uriaș, veți dori să profitați de faptul că 🤗 Datasets nu încarcă totul în memoria RAM, ci stochează elementele datasetului pe disc.
-
-Următoarea operație ar crea o listă de liste de 1.000 de texte fiecare, dar ar încărca totul în memorie:
-
-```py
-# Nu faceți uncomment următoarei linii dacă datasetul vostru este mare, ci doar dacă este mic!
-# training_corpus = [raw_datasets["train"][i: i + 1000]["whole_func_string"] for i in range(0, len(raw_datasets["train"]), 1000)]
-```
-
-Utilizând un generator Python, putem evita ca Python să încarce orice în memorie până când este realmente necesar. Pentru a crea un astfel de generator, trebuie doar să înlocuiți parantezele pătrate cu paranteze rotunde:
-
-```py
-training_corpus = (
-    raw_datasets["train"][i : i + 1000]["whole_func_string"]
-    for i in range(0, len(raw_datasets["train"]), 1000)
-)
-```
-
-Această linie de cod nu extrage niciun element al setului de date; doar creează un obiect pe care îl puteți utiliza într-un `for` loop din Python. Textele vor fi încărcate doar atunci când veți avea nevoie de ele(adică atunci când sunteți la pasul loopului `for` care le solicită), iar doar 1.000 de texte vor fi încărcate la un moment dat. Acest mod vă permite să nu epuizați memoria RAM chiar dacă prelucrați un set de date uriaș.
-
-Problema cu un obiect generator este că poate fi utilizat doar o dată, așadar, în loc să ne ofere lista primelor 10 cifre de două ori:
-
-```py
-gen = (i for i in range(10))
-print(list(gen))
-print(list(gen))
-```
-
-noi le primim o dată și apoi o listă goală:
-
-```python out
-[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
-[]
-```
-
-Din acest motive noi definim o funcție ce returnează în schimb un generator: 
-
-```py
-def get_training_corpus():
-    return (
-        raw_datasets["train"][i : i + 1000]["whole_func_string"]
-        for i in range(0, len(raw_datasets["train"]), 1000)
-    )
-
-
-training_corpus = get_training_corpus()
-```
-
-În același timp poți defini un generator înăuntrul unui `for` loop folosing statementul `yield`:
-
-```py
-def get_training_corpus():
-    dataset = raw_datasets["train"]
-    for start_idx in range(0, len(dataset), 1000):
-        samples = dataset[start_idx : start_idx + 1000]
-        yield samples["whole_func_string"]
-```
-
-ceea ce va produce același generator ca înainte, dar îți va permite să folosești o logică mai complexă decât cea pe care ai putea să o folosești într-un list comprehension.
-
-## Antrenarea unui nou tokenizer[[training-a-new-tokenizer]]
-
-Acum că avem corpusul nostru sub forma unui iterator de batch-uri de texte, suntem gata să antrenăm un nou tokenizer. Pentru a face acest lucru, trebuie mai întâi să încărcăm tokenizerul pe care dorim să-l asociem cu modelul nostru (aici, GPT-2):
-
-```py
-from transformers import AutoTokenizer
-
-old_tokenizer = AutoTokenizer.from_pretrained("gpt2")
-```
-
-Chiar dacă urmează să antrenăm un nou tokenizer, este o idee bună să facem acest lucru pentru a evita să începem să facem tot de la zero. Astfel, nu vom fi nevoiți să specificăm nimic despre algoritmul de tokenizare sau despre special tokens pe care îi vom utiliza; noul nostru tokenizer va fi exact la fel ca GPT-2, iar singur lucrul care se va schimba este vocabularul, care va fi determinat de antrenarea pe corpusul nostru.
-
-Mai întâi, hai să vedem cum ar interpreta acest tokenizer un exemplu de funcție:
-
-```py
-example = '''def add_numbers(a, b):
-    """Add the two numbers `a` and `b`."""
-    return a + b'''
-
-tokens = old_tokenizer.tokenize(example)
-tokens
-```
-
-```python out
-['def', 'Ġadd', '_', 'n', 'umbers', '(', 'a', ',', 'Ġb', '):', 'Ċ', 'Ġ', 'Ġ', 'Ġ', 'Ġ"""', 'Add', 'Ġthe', 'Ġtwo',
- 'Ġnumbers', 'Ġ`', 'a', '`', 'Ġand', 'Ġ`', 'b', '`', '."', '""', 'Ċ', 'Ġ', 'Ġ', 'Ġ', 'Ġreturn', 'Ġa', 'Ġ+', 'Ġb']
-```
-
-Acest tokenizer are câteva simboluri speciale, cum ar fi `Ġ` și `Ċ`, care denotă spații și noi linii, respectiv. Așa cum se poate vedea, acest lucru nu este prea eficient: tokenizerul returnează tokenuri individuale pentru fiecare spațiu, când ar putea grupa împreună nivelurile de indentare (deoarece având seturi de patru sau opt spații va fi foarte comun în cod). De asemenea, a divizat numele funcției într-un mod ciudat, nefiind obișnuit să vadă cuvinte care conțin caracterele `_`.
-
-Acum hai să antrenăm un nou tokenizer și să vedem dacă rezolvă aceste probleme. Pentru aceasta, vom utiliza metoda `train_new_from_iterator()`:
-
-```py
-tokenizer = old_tokenizer.train_new_from_iterator(training_corpus, 52000)
-```
-
-Această comandă ar putea dura puțin timp dacă corpusul este foarte mare, dar pentru acest dataset de 1,6 GB de texte este extrem de rapid (1 minut și 16 secunde pe un procesor AMD Ryzen 9 3900X cu 12 nuclee).
-
-Reține că `AutoTokenizer.train_new_from_iterator()` funcționează doar dacă tokenizerul pe care îl utilizați este un tokenizer "rapid". Așa cum veți vedea în următoarea secțiune, biblioteca 🤗 Transformers conține două tipuri de tokenizeri: unii sunt scriși în pur Python, iar alții (cei rapizi) sunt susținuți de biblioteca 🤗 Tokenizers, care este scrisă în limbajul de programare Rust. Python este limbajul cel mai frecvent utilizat pentru aplicații de data science și deep learning, dar atunci când orice trebuie să fie paralelizat pentru a fi rapid, trebuie să fie scris într-un alt limbaj de programare. De exemplu, multiplicările matricelor care sunt la baza calculelor modelului sunt scrise în CUDA, o bibliotecă C optimizată pentru GPU-uri.
-
-Antrenarea unui tokenizer nou în pur  Python ar fi extrem de lent, de aceea am dezvoltat biblioteca 🤗 Tokenizers. Reține că, la fel cum nu a trebuit să învățați limbajul CUDA pentru a putea executa modelul pe un batch de inputuri pe un GPU, nu veți avea nevoie să învățați Rust pentru a utiliza un tokenizer rapid. Biblioteca 🤗 Tokenizers oferă legături Python pentru multe metode care apelează intern unele bucăți de cod în Rust; de exemplu, pentru a paraleliza antrenarea noului tokenizer sau, așa cum am văzut în [Capitolul 3](/course/chapter3), tokenizarea unui batch de inputuri.
-
-Majoritatea modelelor Transformer au un tokenizer rapid disponibil (există unele excepții pe care le puteți verifica [aici](https://huggingface.co/transformers/#supported-frameworks)), iar API-ul `AutoTokenizer` selectează întotdeauna tokenizerul rapid pentru tine dacă este disponibil. În următoarea secțiune, vom examina unele dintre celelalte caracteristici speciale ale tokenizerilor rapizi, care vor fi foarte utile pentru sarcini precum clasificarea tokenilor și răspunderea la întrebări. Înainte de a face acest lucru, totuși, să încercăm noul nostru tokenizer pe exemplul anterior:
-
-```py
-tokens = tokenizer.tokenize(example)
-tokens
-```
-
-```python out
-['def', 'Ġadd', '_', 'numbers', '(', 'a', ',', 'Ġb', '):', 'ĊĠĠĠ', 'Ġ"""', 'Add', 'Ġthe', 'Ġtwo', 'Ġnumbers', 'Ġ`',
- 'a', '`', 'Ġand', 'Ġ`', 'b', '`."""', 'ĊĠĠĠ', 'Ġreturn', 'Ġa', 'Ġ+', 'Ġb']
-```
-
-Aici din nou vedem simboluri speciale ca `Ġ` sau `Ċ` care denotă spații sau linii noi, dar în același timp putem vedea că tokenizerul nostru a învățat câțiva tokens care sunt foarte specifici la corpusul de funcții Python: de exemplu, tokenul `ĊĠĠĠ` care reprezintă indentarea, sau tokenul `Ġ"""` care reprezintă cele trei ghilimele cu care se începe un docstring. Tokenizerul, de asemenea face split corect numelui funției pe `_`. Aceasta chiar este o reprezentare compactă: comparativ, utilizând limba tokenizerul Englez pe același exemplu ne va da o propoziție mai lungă:
-
-```py
-print(len(tokens))
-print(len(old_tokenizer.tokenize(example)))
-```
-
-```python out
-27
-36
-```
-
-Hai să ne uităm la un alt exemplu:
-
-```python
-example = """class LinearLayer():
-    def __init__(self, input_size, output_size):
-        self.weight = torch.randn(input_size, output_size)
-        self.bias = torch.zeros(output_size)
-
-    def __call__(self, x):
-        return x @ self.weights + self.bias
-    """
-tokenizer.tokenize(example)
-```
-
-```python out
-['class', 'ĠLinear', 'Layer', '():', 'ĊĠĠĠ', 'Ġdef', 'Ġ__', 'init', '__(', 'self', ',', 'Ġinput', '_', 'size', ',',
- 'Ġoutput', '_', 'size', '):', 'ĊĠĠĠĠĠĠĠ', 'Ġself', '.', 'weight', 'Ġ=', 'Ġtorch', '.', 'randn', '(', 'input', '_',
- 'size', ',', 'Ġoutput', '_', 'size', ')', 'ĊĠĠĠĠĠĠĠ', 'Ġself', '.', 'bias', 'Ġ=', 'Ġtorch', '.', 'zeros', '(',
- 'output', '_', 'size', ')', 'ĊĊĠĠĠ', 'Ġdef', 'Ġ__', 'call', '__(', 'self', ',', 'Ġx', '):', 'ĊĠĠĠĠĠĠĠ',
- 'Ġreturn', 'Ġx', 'Ġ@', 'Ġself', '.', 'weights', 'Ġ+', 'Ġself', '.', 'bias', 'ĊĠĠĠĠ']
-```
-
-În plus față de tokenul corespunzător unei indentări, aici putem vedea și un token pentru o indentare dublă: `ĊĠĠĠĠĠĠĠ`. Cuvintele speciale din Python, cum ar fi `class`, `init`, `call`, `self` și `return`, sunt tokenizate fiecare ca un singur token, și putem vedea că, pe lângă divizarea la `_` și `.`, tokenizerul divizează corect chiar și numele scrise în stil camel-case: `LinearLayer` este tokenizeat ca `["ĠLinear", "Layer"]`.
-
-## Salvarea tokenizerului[[saving-the-tokenizer]]
-
-Pentru a ne asigura că îl putem utiliza mai târziu, trebuie să salvăm noul nostru tokenizer. Asemănător salvării unui model, acest lucru se realizează cu metoda `save_pretrained()`:
-
-```py
-tokenizer.save_pretrained("code-search-net-tokenizer")
-```
-
-Acest lucru va crea un nou folder numit *code-search-net-tokenizer*, care va conține toate fișierele necesare pentru a reîncărca tokenizerul. Dacă doriți să partajați acest tokenizer cu colegii și prietenii tăi, îl puteți încărca pe Hub prin conectarea la contul tău. Dacă lucrați într-un notebook, există un convenience function pentru a vă ajuta cu acest lucru:
-
-```python
-from huggingface_hub import notebook_login
-
-notebook_login()
-```
-
-Acest lucru va afișa un widget în care puteți introduce credențialele de conectare Hugging Face. Dacă nu lucrați într-un notebook, introduceți simplu următoarea linie în terminal:
-
-```bash
-huggingface-cli login
-```
-
-După ce v-ați conectat, puteți face push tokenizerului prin executarea următoarei comenzi:
-
-```py
-tokenizer.push_to_hub("code-search-net-tokenizer")
-```
-
-Acest lucru va crea un nou repositoriu în namespacel tău cu numele `code-search-net-tokenizer`, care va conține fișierul tokenizerului. După aceea, puteți încărca tokenizerul de oriunde cu metoda `from_pretrained()`:
-
-```py
-# Înlocuiți "huggingface-course" mai jos cu namespaceul tău pentru a utiliza propriul tokenizer
-tokenizer = AutoTokenizer.from_pretrained("huggingface-course/code-search-net-tokenizer")
-```
-
-Acum sunteți gata să antrenați un model de limbaj de la zero și să îl ajustați pentru sarcina voastră! Vom face acest lucru în [Capitolul 7](/course/chapter7), dar mai întâi, în continuarea acestui capitol, vom arunca o privire mai atentă asupra tokenizerilor rapizi și vom explora în detaliu ce se întâmplă atunci când apelați metoda `train_new_from_iterator()`.
\ No newline at end of file
diff --git a/chapters/ro/chapter6/3.mdx b/chapters/ro/chapter6/3.mdx
deleted file mode 100644
index 54fa7863f..000000000
--- a/chapters/ro/chapter6/3.mdx
+++ /dev/null
@@ -1,473 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Tokenizeri rapizi' puteri speciale[[fast-tokenizers-special-powers]]
-
-{#if fw === 'pt'}
-
-<CourseFloatingBanner chapter={6}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter6/section3_pt.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter6/section3_pt.ipynb"},
-]} />
-
-{:else}
-
-<CourseFloatingBanner chapter={6}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter6/section3_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter6/section3_tf.ipynb"},
-]} />
-
-{/if}
-
-În această secțiune, vom analiza mai atent capacitățile tokenizerilor din 🤗 Transformers. Până acum, i-am folosit doar pentru tokenizarea inputurilor sau decodificarea ID-urilor înapoi în text, dar tokenizerii - în special cei susținuți de biblioteca 🤗 Tokenizers - pot face mult mai multe. Pentru a ilustra aceste funcții suplimentare, vom explora modul de reproducere a rezultatelor pipeline-urilor `token-classification` (pe care le-am numit `ner`) și `question-answering` pe care le-am întâlnit pentru prima dată în [Capitolul 1](/course/chapter1).
-
-<Youtube id="g8quOxoqhHQ"/>
-
-În discuția următoare, vom face adesea distincția între tokenizatori "lenți" și "rapizi". Tokenizerii lenți sunt cei scriși în Python în interiorul bibliotecii 🤗 Transformers, în timp ce versiunile rapide sunt cele furnizate de 🤗 Tokenizers, care sunt scrise în Rust. Dacă vă amintiți de tabelul din [Capitolul 5](/course/chapter5/3) care a raportat cât timp a durat un tokenizer rapid și unul lent pentru a tokeniza datasetul Drug Review, ar trebui să aveți o idee despre de ce îi numim lenți și rapizi:
-
-|               | Fast tokenizer | Slow tokenizer
-:--------------:|:--------------:|:-------------:
-`batched=True`  | 10,8s          | 4min41s
-`batched=False` | 59,2s          | 5min3s
-
-<Tip warning={true}>
-
-⚠️ Atunci când tokenizați o singură propoziție, nu veți vedea întotdeauna o diferență de viteză între versiunea lentă și rapidă ale aceluiași tokenizer. De fapt, versiunea rapidă poate fi chiar mai lentă! Abia atunci când tokenizați multe texte în paralel, în același timp, veți putea observa clar diferența.
-
-</Tip>
-
-## Batch encoding[[batch-encoding]]
-
-<Youtube id="3umI3tm27Vw"/>
-
-Rezultatul unui tokenizer nu este un simplu dicționar Python; ceea ce obținem este de fapt un obiect special `BatchEncoding`. Este o subclasă a unui dicționar (de aceea am putut indexa acel rezultat fără nici o problemă mai devreme), dar cu metode suplimentare care sunt utilizate în principal de către tokenizerii rapizi.
-
-Pe lângă capacitățile lor de paralelizare, funcționalitatea principală a tokenizerilor rapizi este aceea că aceștia țin întotdeauna evidența intervalului original de texte din care provin tokenii finali - o funcționalitate pe care o numim *offset mapping*. Acest lucru deblochează funcții precum mappingul fiecărui cuvânt la tokens pe care îi generează sau mappingul fiecărui caracter al textului original la tokenul în care se află și invers.
-
-Acum hai să aruncăm o privire la un exemplu:
-
-```py
-from transformers import AutoTokenizer
-
-tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
-example = "My name is Sylvain and I work at Hugging Face in Brooklyn."
-encoding = tokenizer(example)
-print(type(encoding))
-```
-
-Așa cum s-a menționat anterior, în outputul tokenizerului obținem un obiect `BatchEncoding`:
-
-```python out
-<class 'transformers.tokenization_utils_base.BatchEncoding'>
-```
-
-Deoarece clasa `AutoTokenizer` selectează un tokenizer rapid în mod implicit, putem utiliza metodele suplimentare pe care acest obiect `BatchEncoding` le oferă. Avem două metode de verificare dacă tokenizerul nostru este unul lent sau rapid. Putem verifica fie atributul `is_fast` al tokenizer-ului:
-
-```python
-tokenizer.is_fast
-```
-
-```python out
-True
-```
-
-sau același atribut al `encoding`:
-
-```python
-encoding.is_fast
-```
-
-```python out
-True
-```
-
-Hai să vedem ce ne permite un tokenizer rapid să facem. În primul rând, putem accesa tokenul fără a fi nevoie să facem convert ID-urile înapoi în tokens:
-
-```py
-encoding.tokens()
-```
-
-```python out
-['[CLS]', 'My', 'name', 'is', 'S', '##yl', '##va', '##in', 'and', 'I', 'work', 'at', 'Hu', '##gging', 'Face', 'in',
- 'Brooklyn', '.', '[SEP]']
-```
-
-În acest caz tokenul la indexul 5 este `##yl`, ceea ce este o parte a cuvântului "Sylvain" în propoziția originală. În același timp putem folosi metoda `word_ids()` pentru a obține indexul cuvântului din care provine fiecare token:
-
-```py
-encoding.word_ids()
-```
-
-```python out
-[None, 0, 1, 2, 3, 3, 3, 3, 4, 5, 6, 7, 8, 8, 9, 10, 11, 12, None]
-
-Putem vedea că tokenizerul are tokeni speciali `[CLS]` și `[SEP]` care sunt mapped la `None`, iar apoi fiecare token este mapped la cuvântul din care provine. Acest lucru este deosebit de util pentru a determina dacă un token este la începutul unui cuvânt sau dacă două tokenuri sunt în același cuvânt. Ne-am putea baza pe prefixul `##` pentru aceasta, dar funcționează doar pentru tokenizeri de tip BERT; această metodă funcționează pentru orice tip de tokenizator, atâta timp cât este unul rapid. În capitolul următor, vom vedea cum putem utiliza această capabilitate pentru a aplica labeluri pe care le avem pentru fiecare cuvânt în mod corespunzător tokenurilor în sarcini precum named entity recognition (NER) și part-of-speech (POS). De asemenea, îl putem utiliza pentru a face mask tuturor tokenurilor care provin din același cuvânt în masked language modeling(o tehnică numită _whole word masking_).
-
-<Tip>
-
-Noțiunea de ceea ce este un cuvânt este complicată. De exemplu, "I'll" (o prescurtare a "I will") contează ca unul sau două cuvinte? Acest lucru depinde de tokenizer și de operațiunea de pre-tokenizare pe care o aplică. Unii tokenizeri se divid doar pe spații, așa că vor considera acest lucru ca un singur cuvânt. Alții folosesc punctuația pe lângă spații, deci vor considera două cuvinte.
-
-✏️ **Încercați!** Creați un tokenizer din checkpointurile `bert-base-cased` și `roberta-base` și tokenizați "81s" cu ele. Ce observați? Care sunt ID-urile cuvintelor?
-
-</Tip>
-
-În mod similar, există o metodă `sentence_ids()` pe care o putem utiliza pentru a face map unui token la propoziția din care provine (deși, în acest caz, `token_type_ids` returnate de tokenizer ne pot oferi aceeași informație).
-
-În cele din urmă, putem face map oricărui cuvânt sau token la caracterele din textul original și invers, prin intermediul metodelor `word_to_chars()` sau `token_to_chars()` și `char_to_word()` sau `char_to_token()`. De exemplu, metoda `word_ids()` ne-a spus că `##yl` face parte din cuvântul cu indicele 3, dar ce cuvânt este în propoziție? Putem afla astfel:
-
-```py
-start, end = encoding.word_to_chars(3)
-example[start:end]
-```
-
-```python out
-Sylvain
-```
-
-Așa cum am menționat anterior, toate acestea sunt posibile datorită faptului că tokenizerul rapid ține evidența spanului de text de la care provine fiecare token într-o listă de *offseturi*. Pentru a ilustra modul în care se utilizează acestea, în continuare vă vom arăta cum să replicați rezultatele pipelineului `token-classification` manual.
-
-<Tip>
-
-✏️ **Încercați!** Creați propriul exemplu de text și încercați să înțelegeți care tokenuri sunt asociate cu ID-ul cuvântului și, de asemenea, cum să extrageți spanurile pentru singur cuvânt. Pentru puncte bonus, încercați să utilizați două propoziții ca inputuri și să vedeți dacă ID-urile propozițiilor au sens pentru voi.
-
-</Tip>
-
-## În interiorul pipelineului `token-classification`[[inside-the-token-classification-pipeline]]
-
-În [Capitolul 1](/course/chapter1) am avut primul nostru contact aplicând NER - unde sarcina constă în identificarea părților textului care corespund entităților precum persoane, locații sau organizații - cu funcția `pipeline()` din 🤗 Transformers. Apoi, în [Capitolul 2](/course/chapter2), am văzut cum un pipeline grupează cele trei etape necesare pentru a obține predicțiile de la un text "raw": tokenizare, trecerea inputurilor prin model și post-procesare. Primele două etape din pipelineul `token-classification` sunt la fel ca în orice alt pipeline, dar post-procesarea este puțin mai complexă - hai să vedem cum!
-
-{#if fw === 'pt'}
-
-<Youtube id="0E7ltQB7fM8"/>
-
-{:else}
-
-<Youtube id="PrX4CjrVnNc"/>
-
-{/if}
-
-### Obținerea rezultatelor de bază cu pipelineul[[getting-the-base-results-with-the-pipeline]]
-
-În primul rând, trebuie să luăm un token classification pipeline pentru a obține câteva rezultate ca să le putem compara manual. Modelul utilizat în mod implicit este [`dbmdz/bert-large-cased-finetuned-conll03-english`](https://huggingface.co/dbmdz/bert-large-cased-finetuned-conll03-english); acesta aplică NER pe propoziții:
-
-```py
-from transformers import pipeline
-
-token_classifier = pipeline("token-classification")
-token_classifier("My name is Sylvain and I work at Hugging Face in Brooklyn.")
-```
-
-```python out
-[{'entity': 'I-PER', 'score': 0.9993828, 'index': 4, 'word': 'S', 'start': 11, 'end': 12},
- {'entity': 'I-PER', 'score': 0.99815476, 'index': 5, 'word': '##yl', 'start': 12, 'end': 14},
- {'entity': 'I-PER', 'score': 0.99590725, 'index': 6, 'word': '##va', 'start': 14, 'end': 16},
- {'entity': 'I-PER', 'score': 0.9992327, 'index': 7, 'word': '##in', 'start': 16, 'end': 18},
- {'entity': 'I-ORG', 'score': 0.97389334, 'index': 12, 'word': 'Hu', 'start': 33, 'end': 35},
- {'entity': 'I-ORG', 'score': 0.976115, 'index': 13, 'word': '##gging', 'start': 35, 'end': 40},
- {'entity': 'I-ORG', 'score': 0.98879766, 'index': 14, 'word': 'Face', 'start': 41, 'end': 45},
- {'entity': 'I-LOC', 'score': 0.99321055, 'index': 16, 'word': 'Brooklyn', 'start': 49, 'end': 57}]
-```
-
-Modelul a identificat fiecare token generdat de "Sylvain" ca o persoană, fiecare token generat de "Hugging Face" ca o organizație, și fiecare token "Brooklin" ca o locație". În același timp putem întreba pipelineul să grupeze împreună tokenurile care corespund cu aceeași entitate.
-
-```py
-from transformers import pipeline
-
-token_classifier = pipeline("token-classification", aggregation_strategy="simple")
-token_classifier("My name is Sylvain and I work at Hugging Face in Brooklyn.")
-```
-
-```python out
-[{'entity_group': 'PER', 'score': 0.9981694, 'word': 'Sylvain', 'start': 11, 'end': 18},
- {'entity_group': 'ORG', 'score': 0.97960204, 'word': 'Hugging Face', 'start': 33, 'end': 45},
- {'entity_group': 'LOC', 'score': 0.99321055, 'word': 'Brooklyn', 'start': 49, 'end': 57}]
-```
-
-`Aggregation_strategy` aleasă va modifica scorurile calculate pentru fiecare entitate grupată. Cu `"simple"`, scorul este doar media scorurilor pentru fiecare token din entitatea dată: de exemplu, scorul pentru "Sylvain" este media scorurilor pe care le-am văzut în exemplele anterioare pentru token-urile `S`, `##yl`, `##va` și `##in`. Alte strategii disponibile sunt:
-
-- `"first"`, unde scorul fiecărei entități este scorul primului token al acelei entități (astfel, pentru "Sylvain" ar fi 0.993828, scorul token-ului `S`)
-- `"max"`, unde scorul fiecărei entități este scorul maxim al tokenilor din acea entitate (astfel, pentru "Hugging Face" ar fi 0.98879766, scorul "Face")
-- `"average"`, unde scorul fiecărei entități este media scorurilor cuvintelor care compun acea entitate (astfel, pentru "Sylvain" nu ar exista nicio diferență față de strategia `"simple"`, dar "Hugging Face" ar avea un scor de 0.9819, media scorurilor pentru "Hugging", 0.975 și "Face", 0.98879)
-
-Acum să vedem cum putem obține aceste rezultate fără a folosi funcția `pipeline()`!
-
-### De la inputuri la predicții[[from-inputs-to-predictions]]
-
-{#if fw === 'pt'}
-
-În primul rând trebuie să tokenizăm inputurile și sp le trecem prin model. Acest lucru este făcut excat ca în [Capitolul 2](/course/chapter2); noi am inițializat tokenizerul și modelul folosind clasa `AutoXxx` și apoi am folosit-o pe exemplul nostru:
-
-```py
-from transformers import AutoTokenizer, AutoModelForTokenClassification
-
-model_checkpoint = "dbmdz/bert-large-cased-finetuned-conll03-english"
-tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
-model = AutoModelForTokenClassification.from_pretrained(model_checkpoint)
-
-example = "My name is Sylvain and I work at Hugging Face in Brooklyn."
-inputs = tokenizer(example, return_tensors="pt")
-outputs = model(**inputs)
-```
-
-Deoarece aici folosim `AutoModelForTokenClassification` , noi primim un set de logits pentru fiecare token în input sequence:
-
-```py
-print(inputs["input_ids"].shape)
-print(outputs.logits.shape)
-```
-
-```python out
-torch.Size([1, 19])
-torch.Size([1, 19, 9])
-```
-
-{:else}
-
-În primul rând trebuie să tokenizăm inputurile și să le trecem prin model. Acest lucru este făcut excat ca în [Capitolul 2](/course/chapter2); noi am inițializat tokenizerul și modelul folosind clasa `TFAutoXxx` și apoi am folosit-o pe exemplul nostru:
-
-```py
-from transformers import AutoTokenizer, TFAutoModelForTokenClassification
-
-model_checkpoint = "dbmdz/bert-large-cased-finetuned-conll03-english"
-tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
-model = TFAutoModelForTokenClassification.from_pretrained(model_checkpoint)
-
-example = "My name is Sylvain and I work at Hugging Face in Brooklyn."
-inputs = tokenizer(example, return_tensors="tf")
-outputs = model(**inputs)
-```
-
-Deoarece aici folosim `TFAutoModelForTokenClassification`, noi primim un set de logits pentru fiecare token în input sequence:
-
-```py
-print(inputs["input_ids"].shape)
-print(outputs.logits.shape)
-```
-
-```python out
-(1, 19)
-(1, 19, 9)
-```
-
-{/if}
-
-Noi avem un batch cu 1 secvență din 19 tokenuri și modelul are 9 labeluri diferite, deci outputul modelului are un shape de 1 x 19 x 9. Ca și pentru text classification pipeline, noi folosim o funcție softmax pentru a face convert logiturilor în probabilități și luăm argmax pentru a obține predicții(atrage atenția asupra fatpului că putem lua argmax pe logituri deoarece softmax nu schimbă ordinea):
-
-{#if fw === 'pt'}
-
-```py
-import torch
-
-probabilities = torch.nn.functional.softmax(outputs.logits, dim=-1)[0].tolist()
-predictions = outputs.logits.argmax(dim=-1)[0].tolist()
-print(predictions)
-```
-
-{:else}
-
-```py
-import tensorflow as tf
-
-probabilities = tf.math.softmax(outputs.logits, axis=-1)[0]
-probabilities = probabilities.numpy().tolist()
-predictions = tf.math.argmax(outputs.logits, axis=-1)[0]
-predictions = predictions.numpy().tolist()
-print(predictions)
-```
-
-{/if}
-
-```python out
-[0, 0, 0, 0, 4, 4, 4, 4, 0, 0, 0, 0, 6, 6, 6, 0, 8, 0, 0]
-```
-
-Atributul `model.config.id2label` con;ine mappingul indexilor la labeluri pe care le putem folosi pentru a înțelege predicțiile:
-
-```py
-model.config.id2label
-```
-
-```python out
-{0: 'O',
- 1: 'B-MISC',
- 2: 'I-MISC',
- 3: 'B-PER',
- 4: 'I-PER',
- 5: 'B-ORG',
- 6: 'I-ORG',
- 7: 'B-LOC',
- 8: 'I-LOC'}
-```
-
-Cum am văzut mai devreme, există 9 labeluri: `O` este labelul pentru tokenurile care nu se află în nicio entitate numită(aceasta reprezintă "exteriorul"), și avem apoi două labeluri pentru fiecare tip de entitate (divers, persoană, organizație și locație). Eticheta `B-XXX` indică faptul că tokenul se află la începutul entității `XXX` și eticheta `I-XXX` indică faptul că tokenul se află în interiorul entității `XXX`. De exemplu, în exemplul curent ne-am aștepta ca modelul nostru să clasifice tokenul `S` ca `B-PER` (începutul unei entități de-tip persoană) și tokenurile `##yl`, `##va` și `##in` ca `I-PER` (în interiorul unei entități de tip persoană).
-
-S-ar putea să credeți că modelul a greșit în acest caz, deoarece a atribuit eticheta `I-PER` tuturor acestor patru tokeni, dar acesta nu este în întregime adevărat. Există, de fapt, două formate pentru labelurile `B-` și `I-`: *IOB1* și *IOB2*. Formatul IOB2 (în roz mai jos), este cel pe care l-am introdus, în timp ce formatul IOB1 (în albastru), utilizează labelurile care încep cu `B-` doar pentru a separa două entități adiacente de același tip. Modelul pe care îl utilizăm a fost fine-tuned pe un dataset care utilizează acel format, ceea ce explică de ce atribuie labelul `I-PER` tokenului `S`.
-
-<div class="flex justify-center">
-<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter6/IOB_versions.svg" alt="IOB1 vs IOB2 format"/>
-<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter6/IOB_versions-dark.svg" alt="IOB1 vs IOB2 format"/>
-</div>
-
-Cu maparea aceasta, suntem gat a să reproducem(aproape în total) rezultat primului pipeline -- noi putem lua scorul și labelul fiecărui token care nu a fost clasificat ca `O`:
-
-```py
-results = []
-tokens = inputs.tokens()
-
-for idx, pred in enumerate(predictions):
-    label = model.config.id2label[pred]
-    if label != "O":
-        results.append(
-            {"entity": label, "score": probabilities[idx][pred], "word": tokens[idx]}
-        )
-
-print(results)
-```
-
-```python out
-[{'entity': 'I-PER', 'score': 0.9993828, 'index': 4, 'word': 'S'},
- {'entity': 'I-PER', 'score': 0.99815476, 'index': 5, 'word': '##yl'},
- {'entity': 'I-PER', 'score': 0.99590725, 'index': 6, 'word': '##va'},
- {'entity': 'I-PER', 'score': 0.9992327, 'index': 7, 'word': '##in'},
- {'entity': 'I-ORG', 'score': 0.97389334, 'index': 12, 'word': 'Hu'},
- {'entity': 'I-ORG', 'score': 0.976115, 'index': 13, 'word': '##gging'},
- {'entity': 'I-ORG', 'score': 0.98879766, 'index': 14, 'word': 'Face'},
- {'entity': 'I-LOC', 'score': 0.99321055, 'index': 16, 'word': 'Brooklyn'}]
-```
-
-Acest lucru este foarte similar cu ce am avut mai devreme, cu o excepție: pipelineul de asemenea ne-a oferit informație despre `start` și `end` al fiecărei entități în propoziția originală. Acum e momentul când offset mappingul nostru ne va ajuta. Pentru a obține offseturile, noi trebuie să setăm `return_offsets_mapping=True` când aplicăm tokenizerul pe inputurile noastre:
-
-```py
-inputs_with_offsets = tokenizer(example, return_offsets_mapping=True)
-inputs_with_offsets["offset_mapping"]
-```
-
-```python out
-[(0, 0), (0, 2), (3, 7), (8, 10), (11, 12), (12, 14), (14, 16), (16, 18), (19, 22), (23, 24), (25, 29), (30, 32),
- (33, 35), (35, 40), (41, 45), (46, 48), (49, 57), (57, 58), (0, 0)]
-```
-
-Fiecare tuple este spanul de text care corespunde fiecărui token, unde `(0, 0)` este rezervat pentru tokenii speciali. Noi am văzut înainte că tokenul la indexul 5 este `##yl`, care are aici `(12, 14)` ca offsets. Dacă luăm sliceul corespunzător în exemplul nostru:
-
-```py
-example[12:14]
-```
-
-noi obținem spanul propriu de text fără `##`:
-
-```python out
-yl
-```
-
-Folosind aceasta, putem acum completa rezultatele anterioare:
-
-
-```py
-results = []
-inputs_with_offsets = tokenizer(example, return_offsets_mapping=True)
-tokens = inputs_with_offsets.tokens()
-offsets = inputs_with_offsets["offset_mapping"]
-
-for idx, pred in enumerate(predictions):
-    label = model.config.id2label[pred]
-    if label != "O":
-        start, end = offsets[idx]
-        results.append(
-            {
-                "entity": label,
-                "score": probabilities[idx][pred],
-                "word": tokens[idx],
-                "start": start,
-                "end": end,
-            }
-        )
-
-print(results)
-```
-
-```python out
-[{'entity': 'I-PER', 'score': 0.9993828, 'index': 4, 'word': 'S', 'start': 11, 'end': 12},
- {'entity': 'I-PER', 'score': 0.99815476, 'index': 5, 'word': '##yl', 'start': 12, 'end': 14},
- {'entity': 'I-PER', 'score': 0.99590725, 'index': 6, 'word': '##va', 'start': 14, 'end': 16},
- {'entity': 'I-PER', 'score': 0.9992327, 'index': 7, 'word': '##in', 'start': 16, 'end': 18},
- {'entity': 'I-ORG', 'score': 0.97389334, 'index': 12, 'word': 'Hu', 'start': 33, 'end': 35},
- {'entity': 'I-ORG', 'score': 0.976115, 'index': 13, 'word': '##gging', 'start': 35, 'end': 40},
- {'entity': 'I-ORG', 'score': 0.98879766, 'index': 14, 'word': 'Face', 'start': 41, 'end': 45},
- {'entity': 'I-LOC', 'score': 0.99321055, 'index': 16, 'word': 'Brooklyn', 'start': 49, 'end': 57}]
-```
-
-Acest răspuns e același răspuns pe care l-am primit de la primul pipeline:
-
-### Gruparea entităților[[grouping-entities]]
-
-Utilizarea offseturilor pentru a determina cheile de start și de sfârșit pentru fiecare entitate este util, dar această informație nu este strict necesară. Când dorim să grupăm entitățile împreună, totuși, offseturile ne vor salva o mulțime de messy code. De exemplu, dacă am dori să grupăm împreună tokenii `Hu`, `##gging` și `Face`, am putea crea reguli speciale care să spună că primele două ar trebui să fie atașate și să înlăturăm `##`, iar `Face` ar trebui adăugat cu un spațiu, deoarece nu începe cu `##` -- dar acest lucru ar funcționa doar pentru acest tip particular de tokenizer. Ar trebui să scriem un alt set de reguli pentru un tokenizer SentencePiece sau unul Byte-Pair-Encoding (discutat mai târziu în acest capitol).
-
-Cu offseturile, tot acel cod custom dispare: pur și simplu putem lua spanul din textul original care începe cu primul token și se termină cu ultimul token. Deci, în cazul tokenurilor `Hu`, `##gging` și `Face`, ar trebui să începem la caracterul 33 (începutul lui `Hu`) și să ne oprim înainte de caracterul 45 (sfârșitul lui `Face`):
-
-```py
-example[33:45]
-```
-
-```python out
-Hugging Face
-```
-
-Pentru a scrie codul care post-procesează predicțiile în timp ce grupăm entitățile, vom grupa entitățile care sunt consecutive și labeled cu `I-XXX`, cu excepția primeia, care poate fi labeled ca `B-XXX` sau `I-XXX` (decidem să oprim gruparea unei entități atunci când întâlnim un `O`, un nou tip de entitate, sau un `B-XXX` care ne spune că o entitate de același tip începe):
-
-```py
-import numpy as np
-
-results = []
-inputs_with_offsets = tokenizer(example, return_offsets_mapping=True)
-tokens = inputs_with_offsets.tokens()
-offsets = inputs_with_offsets["offset_mapping"]
-
-idx = 0
-while idx < len(predictions):
-    pred = predictions[idx]
-    label = model.config.id2label[pred]
-    if label != "O":
-        # Remove the B- or I-
-        label = label[2:]
-        start, _ = offsets[idx]
-
-        # Grab all the tokens labeled with I-label
-        all_scores = []
-        while (
-            idx < len(predictions)
-            and model.config.id2label[predictions[idx]] == f"I-{label}"
-        ):
-            all_scores.append(probabilities[idx][pred])
-            _, end = offsets[idx]
-            idx += 1
-
-        # The score is the mean of all the scores of the tokens in that grouped entity
-        score = np.mean(all_scores).item()
-        word = example[start:end]
-        results.append(
-            {
-                "entity_group": label,
-                "score": score,
-                "word": word,
-                "start": start,
-                "end": end,
-            }
-        )
-    idx += 1
-
-print(results)
-```
-
-Și obținem aceleași răspuns ca de la pipelineul secundar!
-
-```python out
-[{'entity_group': 'PER', 'score': 0.9981694, 'word': 'Sylvain', 'start': 11, 'end': 18},
- {'entity_group': 'ORG', 'score': 0.97960204, 'word': 'Hugging Face', 'start': 33, 'end': 45},
- {'entity_group': 'LOC', 'score': 0.99321055, 'word': 'Brooklyn', 'start': 49, 'end': 57}]
-```
-
-Alt exemplu de sarcină unde offseturile sunt extrem de useful pentru răspunderea la întrebări. Scufundându-ne în pipelineuri, un lucru pe care îl vom face în următoarea secțiune, ne vom premite să ne uităm peste o caracteristică a tokenizerului în librăria 🤗 Transformers: vom avea de-a face cu overflowing tokens când truncăm un input de o anumită lungime.
-
diff --git a/chapters/ro/chapter6/3b.mdx b/chapters/ro/chapter6/3b.mdx
deleted file mode 100644
index 08acea387..000000000
--- a/chapters/ro/chapter6/3b.mdx
+++ /dev/null
@@ -1,643 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Tokenizeri rapizi în pipelineul QA[[fast-tokenizers-in-the-qa-pipeline]]
-
-{#if fw === 'pt'}
-
-<CourseFloatingBanner chapter={6}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter6/section3b_pt.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter6/section3b_pt.ipynb"},
-]} />
-
-{:else}
-
-<CourseFloatingBanner chapter={6}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter6/section3b_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter6/section3b_tf.ipynb"},
-]} />
-
-{/if}
-
-Acum ne vom aprofunda în pipelineul `question-answering` și să vedem cum putem valorifica offesturile pentru a primi răspunzuri la întrebări la îndemână din context, asemănător cum am făcut cu entitățile grupate în secțiunea precedentă. Pe urmă vom vedea cum vom face față contextelor foarte lungi care ajung truncate. Puteți trece peste această secțiune dacă nu sunteți interesat în întrebarea care răspunde la sarcina aceasta.
-
-{#if fw === 'pt'}
-
-<Youtube id="_wxyB3j3mk4"/>
-
-{:else}
-
-<Youtube id="b3u8RzBCX9Y"/>
-
-{/if}
-
-## Folosind `question-answering` pipeline[[using-the-question-answering-pipeline]]
-
-Cum am văzut în [Capitolul 1](/course/chapter1), noi putem folosi pipelineul `question-answering` ca acesta pentru a răspunde la o întrebare:
-
-```py
-from transformers import pipeline
-
-question_answerer = pipeline("question-answering")
-context = """
-🤗 Transformers is backed by the three most popular deep learning libraries — Jax, PyTorch, and TensorFlow — with a seamless integration
-between them. It's straightforward to train your models with one before loading them for inference with the other.
-"""
-question = "Which deep learning libraries back 🤗 Transformers?"
-question_answerer(question=question, context=context)
-```
-
-```python out
-{'score': 0.97773,
- 'start': 78,
- 'end': 105,
- 'answer': 'Jax, PyTorch and TensorFlow'}
-```
-
-Spre deosebire de alte pipelineuri, care nu put trunca și face split la text care este mai lung decât lungimea maxim acceptată de model(și, prin urmare, pot pierde informații la sfârșitul unui document), accest pipeline poate face față contextelor foarte lungi și va returna răspunsul la întrebare chiar dacă aceasta se află la sfârșit:
-
-```py
-long_context = """
-🤗 Transformers: State of the Art NLP
-
-🤗 Transformers provides thousands of pretrained models to perform tasks on texts such as classification, information extraction,
-question answering, summarization, translation, text generation and more in over 100 languages.
-Its aim is to make cutting-edge NLP easier to use for everyone.
-
-🤗 Transformers provides APIs to quickly download and use those pretrained models on a given text, fine-tune them on your own datasets and
-then share them with the community on our model hub. At the same time, each python module defining an architecture is fully standalone and
-can be modified to enable quick research experiments.
-
-Why should I use transformers?
-
-1. Easy-to-use state-of-the-art models:
-  - High performance on NLU and NLG tasks.
-  - Low barrier to entry for educators and practitioners.
-  - Few user-facing abstractions with just three classes to learn.
-  - A unified API for using all our pretrained models.
-  - Lower compute costs, smaller carbon footprint:
-
-2. Researchers can share trained models instead of always retraining.
-  - Practitioners can reduce compute time and production costs.
-  - Dozens of architectures with over 10,000 pretrained models, some in more than 100 languages.
-
-3. Choose the right framework for every part of a model's lifetime:
-  - Train state-of-the-art models in 3 lines of code.
-  - Move a single model between TF2.0/PyTorch frameworks at will.
-  - Seamlessly pick the right framework for training, evaluation and production.
-
-4. Easily customize a model or an example to your needs:
-  - We provide examples for each architecture to reproduce the results published by its original authors.
-  - Model internals are exposed as consistently as possible.
-  - Model files can be used independently of the library for quick experiments.
-
-🤗 Transformers is backed by the three most popular deep learning libraries — Jax, PyTorch and TensorFlow — with a seamless integration
-between them. It's straightforward to train your models with one before loading them for inference with the other.
-"""
-question_answerer(question=question, context=long_context)
-```
-
-```python out
-{'score': 0.97149,
- 'start': 1892,
- 'end': 1919,
- 'answer': 'Jax, PyTorch and TensorFlow'}
-```
-
-Hai să vedem cum el face toate astea!
-
-## Folosind un model pentru răspunderea la întrebări[[using-a-model-for-question-answering]]
-
-Ca în cazul oricărui altui pipeline, începem prin tokenizarea datelor de intrare și apoi le trimitem prin model. Checkpointul utilizat în mod implicit pentru pipelineul `question-answering` este [`distilbert-base-cased-distilled-squad`](https://huggingface.co/distilbert-base-cased-distilled-squad) ("squad" din nume provine de la datasetul pe care modelul a fost ajustat; vom vorbi mai multe despre datasetul SQuAD în [Capitolul 7](/course/chapter7/7)):
-
-{#if fw === 'pt'}
-
-```py
-from transformers import AutoTokenizer, AutoModelForQuestionAnswering
-
-model_checkpoint = "distilbert-base-cased-distilled-squad"
-tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
-model = AutoModelForQuestionAnswering.from_pretrained(model_checkpoint)
-
-inputs = tokenizer(question, context, return_tensors="pt")
-outputs = model(**inputs)
-```
-
-{:else}
-
-```py
-from transformers import AutoTokenizer, TFAutoModelForQuestionAnswering
-
-model_checkpoint = "distilbert-base-cased-distilled-squad"
-tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
-model = TFAutoModelForQuestionAnswering.from_pretrained(model_checkpoint)
-
-inputs = tokenizer(question, context, return_tensors="tf")
-outputs = model(**inputs)
-```
-
-{/if}
-
-Observați că noi tokenizăm întrebrea și contextul ca o perecehe, cu întrebarea prima.
-
-
-<div class="flex justify-center">
-<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter6/question_tokens.svg" alt="An example of tokenization of question and context"/>
-<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter6/question_tokens-dark.svg" alt="An example of tokenization of question and context"/>
-</div>
-
-Modelele create pentru răspunderea la întrebări funcționează puțin diferit de modelele pe care le-am văzut până acum. Folosind imaginea de mai sus ca exemplu, modelul a fost antrenat pentru a prezice indicele tokenului cu care începe răspunsului (aici 21) și indicele simbolului la care se termină răspunsul (aici 24). Acesta este motivul pentru care modelele respective nu returnează un singur tensor de logits, ci două: unul pentru logits-ul corespunzători tokenului cu care începe răspunsului și unul pentru logits-ul corespunzător tokenului de sfârșit al răspunsului. Deoarece în acest caz avem un singur input care conține 66 de token-uri, obținem:
-
-```py
-start_logits = outputs.start_logits
-end_logits = outputs.end_logits
-print(start_logits.shape, end_logits.shape)
-```
-
-{#if fw === 'pt'}
-
-```python out
-torch.Size([1, 66]) torch.Size([1, 66])
-```
-
-{:else}
-
-```python out
-(1, 66) (1, 66)
-```
-
-{/if}
-
-Pentru a converti acești logits în probabilități, vom aplica o funcție softmax - dar înainte de aceasta, trebuie să ne asigurăm că mascăm indicii care nu fac parte din context. Inputul nostru este `[CLS] întrebare [SEP] context [SEP]`, deci trebuie să mascăm token-urile întrebării, precum și tokenul `[SEP]`. Cu toate acestea, vom păstra simbolul `[CLS]`, deoarece unele modele îl folosesc pentru a indica faptul că răspunsul nu se află în context.
-
-Deoarece vom aplica ulterior un softmax, trebuie doar să înlocuim logiturile pe care dorim să le mascăm cu un număr negativ mare. Aici, folosim `-10000`:
-
-{#if fw === 'pt'}
-
-```py
-import torch
-
-sequence_ids = inputs.sequence_ids()
-# Mask everything apart from the tokens of the context
-mask = [i != 1 for i in sequence_ids]
-# Unmask the [CLS] token
-mask[0] = False
-mask = torch.tensor(mask)[None]
-
-start_logits[mask] = -10000
-end_logits[mask] = -10000
-```
-
-{:else}
-
-```py
-import tensorflow as tf
-
-sequence_ids = inputs.sequence_ids()
-# Mask everything apart from the tokens of the context
-mask = [i != 1 for i in sequence_ids]
-# Unmask the [CLS] token
-mask[0] = False
-mask = tf.constant(mask)[None]
-
-start_logits = tf.where(mask, -10000, start_logits)
-end_logits = tf.where(mask, -10000, end_logits)
-```
-
-{/if}
-
-Acum că am mascat în mod corespunzător logiturile corespunzătoare pozițiilor pe care nu dorim să le prezicem, putem aplica softmax:
-
-{#if fw === 'pt'}
-
-```py
-start_probabilities = torch.nn.functional.softmax(start_logits, dim=-1)[0]
-end_probabilities = torch.nn.functional.softmax(end_logits, dim=-1)[0]
-```
-
-{:else}
-
-```py
-start_probabilities = tf.math.softmax(start_logits, axis=-1)[0].numpy()
-end_probabilities = tf.math.softmax(end_logits, axis=-1)[0].numpy()
-```
-
-{/if}
-
-La acest stadiu, am putea lua argmax al probabilităților de început și de sfârșit - dar am putea ajunge la un indice de început care este mai mare decât indicele de sfârșit, deci trebuie să luăm câteva precauții suplimentare. Vom calcula probabilitățile fiecărui  `start_index` și `end_index` posibil în cazul în care `start_index <= end_index`, apoi vom lua un tuple `(start_index, end_index)` cu cea mai mare probabilitate.
-
-Presupunând că evenimentele "The answer starts at `start_index`" și "The answer ends at `end_index`" sunt independente, probabilitatea ca răspunsul să înceapă la `start_index` și să se termine la `end_index` este:
-
-$$\mathrm{start\_probabilities}[\mathrm{start\_index}] \times \mathrm{end\_probabilities}[\mathrm{end\_index}]$$ 
-
-Deci, pentru a calcula toate scorurile, trebuie doar să calculăm toate produsele \\(\mathrm{start\_probabilities}[\mathrm{start\_index}] \times \mathrm{end\_probabilities}[\mathrm{end\_index}]\\) unde `start_index <= end_index`.
-
-Mai întâi hai să calculăm toate produsele posibile:
-
-```py
-scores = start_probabilities[:, None] * end_probabilities[None, :]
-```
-
-{#if fw === 'pt'}
-
-Apoi vom masca valorile în care `start_index > end_index` prin stabilirea lor la `0` (celelalte probabilități sunt toate numere pozitive). Funcția `torch.triu()` returnează partea triunghiulară superioară a tensorului 2D trecut ca argument, deci va face această mascare pentru noi:
-
-```py
-scores = torch.triu(score)
-```
-
-{:else}
-
-Apoi vom masca valorile în care `start_index > end_index` prin stabilirea lor la `0` (celelalte probabilități sunt toate numere pozitive). Funcția `np.triu()` returnează partea triunghiulară superioară a tensorului 2D trecut ca argument, deci va face această mascare pentru noi:
-
-```py
-import numpy as np
-
-scores = np.triu(scores)
-```
-
-{/if}
-
-Acum trebuie doar să obținem indicele maximului. Deoarece PyTorch va returna indicele în tensorul aplatizat, trebuie să folosim operațiile floor division `//` și modulusul `%` pentru a obține `start_index` și `end_index`:
-
-```py
-max_index = scores.argmax().item()
-start_index = max_index // scores.shape[1]
-end_index = max_index % scores.shape[1]
-print(scores[start_index, end_index])
-```
-
-Nu am terminat încă, dar cel puțin avem deja scorul corect pentru răspuns (puteți verifica acest lucru comparându-l cu primul rezultat din secțiunea anterioară):
-
-```python out
-0.97773
-```
-
-<Tip>
-
-✏️ **Încercați!** Calculați indicii de început și de sfârșit pentru cele mai probabile cinci răspunsuri.
-
-</Tip>
-
-Avem `start_index` și `end_index` ale răspunsului în termeni de tokens, deci acum trebuie doar să convertim în character indices în context. Acesta este momentul în care offseturile vor fi foarte utile. Putem să le luăm și să le folosim așa cum am făcut în sarcina de clasificare a tokenurilor:
-
-```py
-inputs_with_offsets = tokenizer(question, context, return_offsets_mapping=True)
-offsets = inputs_with_offsets["offset_mapping"]
-
-start_char, _ = offsets[start_index]
-_, end_char = offsets[end_index]
-answer = context[start_char:end_char]
-```
-
-Acum trebuie doar să formatăm totul pentru a obține rezultatul nostru:
-
-```py
-result = {
-    "answer": answer,
-    "start": start_char,
-    "end": end_char,
-    "score": scores[start_index, end_index],
-}
-print(result)
-```
-
-```python out
-{'answer': 'Jax, PyTorch and TensorFlow',
- 'start': 78,
- 'end': 105,
- 'score': 0.97773}
-```
-
-Grozav! Este la fel ca în primul nostru exemplu!
-
-<Tip>
-
-✏️ **Încercați!** Utilizați cele mai bune scoruri pe care le-ați calculat anterior pentru a afișa cele mai probabile cinci răspunsuri. Pentru a vă verifica rezultatele, întoarceți-vă la primul pipeline și introduceți `top_k=5` atunci când îl apelați.
-
-</Tip>
-
-## Gestionarea contextelor lungi[[handling-long-contexts]]
-
-Dacă încercăm să tokenizăm întrebarea și contextul lung pe care le-am folosit ca un exemplu anterior, vom obține un număr de tokenuri mai mare decât lungimea maximă utilizată în pipelineul `question-answering` (care este 384):
-
-```py
-inputs = tokenizer(question, long_context)
-print(len(inputs["input_ids"]))
-```
-
-```python out
-461
-```
-
-Prin urmare, va trebui să trunchiem inputurile la lungimea maximă. Există mai multe modalități prin care putem face acest lucru, dar nu dorim să trunchiem întrebarea, ci doar contextul. Deoarece contextul este a doua propoziție, vom utiliza strategia de trunchiere `"only_second"`. Problema care apare atunci este că răspunsul la întrebare poate să nu fie în contextul trunchiat. Aici, de exemplu, am ales o întrebare la care răspunsul se află spre sfârșitul contextului, iar atunci când îl trunchiem, răspunsul nu este prezent:
-
-```py
-inputs = tokenizer(question, long_context, max_length=384, truncation="only_second")
-print(tokenizer.decode(inputs["input_ids"]))
-```
-
-```python out
-"""
-[CLS] Which deep learning libraries back [UNK] Transformers? [SEP] [UNK] Transformers : State of the Art NLP
-
-[UNK] Transformers provides thousands of pretrained models to perform tasks on texts such as classification, information extraction,
-question answering, summarization, translation, text generation and more in over 100 languages.
-Its aim is to make cutting-edge NLP easier to use for everyone.
-
-[UNK] Transformers provides APIs to quickly download and use those pretrained models on a given text, fine-tune them on your own datasets and
-then share them with the community on our model hub. At the same time, each python module defining an architecture is fully standalone and
-can be modified to enable quick research experiments.
-
-Why should I use transformers?
-
-1. Easy-to-use state-of-the-art models:
-  - High performance on NLU and NLG tasks.
-  - Low barrier to entry for educators and practitioners.
-  - Few user-facing abstractions with just three classes to learn.
-  - A unified API for using all our pretrained models.
-  - Lower compute costs, smaller carbon footprint:
-
-2. Researchers can share trained models instead of always retraining.
-  - Practitioners can reduce compute time and production costs.
-  - Dozens of architectures with over 10,000 pretrained models, some in more than 100 languages.
-
-3. Choose the right framework for every part of a model's lifetime:
-  - Train state-of-the-art models in 3 lines of code.
-  - Move a single model between TF2.0/PyTorch frameworks at will.
-  - Seamlessly pick the right framework for training, evaluation and production.
-
-4. Easily customize a model or an example to your needs:
-  - We provide examples for each architecture to reproduce the results published by its original authors.
-  - Model internal [SEP]
-"""
-```
-
-Aceasta înseamnă că modelul va avea dificultăți în a alege răspunsul corect. Pentru a rezolva acest lucru, pipelineul `question-answering` ne permite să împărțim contextul în bucăți mai mici, specificând lungimea maximă. Pentru a ne asigura că nu împărțim contextul exact în locul nepotrivit pentru a face posibilă găsirea răspunsului, aceasta include și o anumită suprapunere între bucăți.
-
-Putem cere tokenizerului (rapid sau lent) să facă acest lucru pentru noi adăugând `return_overflowing_tokens=True`, și putem specifica suprapunerea dorită cu argumentul `stride`. Iată un exemplu, folosind o propoziție mai mică:
-
-```py
-sentence = "This sentence is not too long but we are going to split it anyway."
-inputs = tokenizer(
-    sentence, truncation=True, return_overflowing_tokens=True, max_length=6, stride=2
-)
-
-for ids in inputs["input_ids"]:
-    print(tokenizer.decode(ids))
-```
-
-```python out
-'[CLS] This sentence is not [SEP]'
-'[CLS] is not too long [SEP]'
-'[CLS] too long but we [SEP]'
-'[CLS] but we are going [SEP]'
-'[CLS] are going to split [SEP]'
-'[CLS] to split it anyway [SEP]'
-'[CLS] it anyway. [SEP]'
-```
-
-După cum putem vedea, propoziția a fost împărțită în bucăți astfel încât fiecare intrare din `inputs["input_ids"]` să aibă cel mult 6 token-uri (aici ar trebui să adăugăm padding pentru ca ultima intrare să aibă aceeași dimensiune ca celelalte) și există o suprapunere de 2 tokenuri între fiecare intrare.
-
-Să aruncăm o privire mai atentă la rezultatul tokenizării:
-
-```py
-print(inputs.keys())
-```
-
-```python out
-dict_keys(['input_ids', 'attention_mask', 'overflow_to_sample_mapping'])
-```
-
-Așa cum era de așteptat, obținem ID-uri de intrare și un attention mask. Ultima cheie, `overflow_to_sample_mapping`, este o hartă care ne spune cărei propoziții îi corespunde fiecare dintre rezultate - aici avem 7 rezultate care provin toate din (singura) propoziție pe care am transmis-o tokenizerului:
-
-```py
-print(inputs["overflow_to_sample_mapping"])
-```
-
-```python out
-[0, 0, 0, 0, 0, 0, 0]
-```
-
-Acest lucru este mai util atunci când tokenizăm mai multe propoziții împreună. De exemplu, aceasta:
-
-```py
-sentences = [
-    "This sentence is not too long but we are going to split it anyway.",
-    "This sentence is shorter but will still get split.",
-]
-inputs = tokenizer(
-    sentences, truncation=True, return_overflowing_tokens=True, max_length=6, stride=2
-)
-
-print(inputs["overflow_to_sample_mapping"])
-```
-
-gets us:
-
-```python out
-[0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1]
-```
-
-ceea ce înseamnă că prima propoziție este împărțită în 7 fragmente ca înainte, iar următoarele 4 fragmente provin din a doua propoziție.
-
-Acum să ne întoarcem la contextul nostru lung. În mod implicit, pipelineul `question-answering` utilizează o lungime maximă de 384, așa cum am menționat mai devreme, și un stride de 128, care corespund modului în care modelul a fost fine-tuned (puteți ajusta acești parametri prin trecerea argumentelor `max_seq_len` și `stride` atunci când apelați pipelineul). Astfel, vom utiliza acești parametri la tokenizare. Vom adăuga, de asemenea, padding (pentru a avea sampleuri de aceeași lungime, astfel încât să putem construi tensori), precum și pentru a solicita offsets:
-
-```py
-inputs = tokenizer(
-    question,
-    long_context,
-    stride=128,
-    max_length=384,
-    padding="longest",
-    truncation="only_second",
-    return_overflowing_tokens=True,
-    return_offsets_mapping=True,
-)
-```
-
-Aceste "inputuri" vor conține ID-urile de input și attention maskurile așteptate de model, precum și offseturile și "overflow_to_sample_mapping" despre care tocmai am vorbit. Deoarece cei doi nu sunt parametri utilizați de model, îi vom scoate din `inputs` (și nu vom stoca harta, deoarece nu este utilă aici) înainte de a-l converti într-un tensor:
-
-{#if fw === 'pt'}
-
-```py
-_ = inputs.pop("overflow_to_sample_mapping")
-offsets = inputs.pop("offset_mapping")
-
-inputs = inputs.convert_to_tensors("pt")
-print(inputs["input_ids"].shape)
-```
-
-```python out
-torch.Size([2, 384])
-```
-
-{:else}
-
-```py
-_ = inputs.pop("overflow_to_sample_mapping")
-offsets = inputs.pop("offset_mapping")
-
-inputs = inputs.convert_to_tensors("tf")
-print(inputs["input_ids"].shape)
-```
-
-```python out
-(2, 384)
-```
-
-{/if}
-
-Contextul nostru lung a fost împărțit în două, ceea ce înseamnă că, după ce trece prin modelul nostru, vom avea două seturi de logits de început și de sfârșit:
-
-```py
-outputs = model(**inputs)
-
-start_logits = outputs.start_logits
-end_logits = outputs.end_logits
-print(start_logits.shape, end_logits.shape)
-```
-
-{#if fw === 'pt'}
-
-```python out
-torch.Size([2, 384]) torch.Size([2, 384])
-```
-
-{:else}
-
-```python out
-(2, 384) (2, 384)
-```
-
-{/if}
-
-Ca și înainte, mai întâi mascăm tokenii care nu fac parte din context înainte de a lua softmax. De asemenea, mascăm toți padding tokens(marcate de attention mask):
-
-{#if fw === 'pt'}
-
-```py
-sequence_ids = inputs.sequence_ids()
-# Mask everything apart from the tokens of the context
-mask = [i != 1 for i in sequence_ids]
-# Unmask the [CLS] token
-mask[0] = False
-# Mask all the [PAD] tokens
-mask = torch.logical_or(torch.tensor(mask)[None], (inputs["attention_mask"] == 0))
-
-start_logits[mask] = -10000
-end_logits[mask] = -10000
-```
-
-{:else}
-
-```py
-sequence_ids = inputs.sequence_ids()
-# Mask everything apart from the tokens of the context
-mask = [i != 1 for i in sequence_ids]
-# Unmask the [CLS] token
-mask[0] = False
-# Mask all the [PAD] tokens
-mask = tf.math.logical_or(tf.constant(mask)[None], inputs["attention_mask"] == 0)
-
-start_logits = tf.where(mask, -10000, start_logits)
-end_logits = tf.where(mask, -10000, end_logits)
-```
-
-{/if}
-
-Then we can use the softmax to convert our logits to probabilities:
-
-{#if fw === 'pt'}
-
-```py
-start_probabilities = torch.nn.functional.softmax(start_logits, dim=-1)
-end_probabilities = torch.nn.functional.softmax(end_logits, dim=-1)
-```
-
-{:else}
-
-```py
-start_probabilities = tf.math.softmax(start_logits, axis=-1).numpy()
-end_probabilities = tf.math.softmax(end_logits, axis=-1).numpy()
-```
-
-{/if}
-
-Următorul pas este similar cu ceea ce am făcut pentru contextul mic, dar îl repetăm pentru fiecare dintre cele două chunkuri. Atribuim un scor tuturor intervalelor posibile de răspuns, apoi luăm intervalul cu cel mai bun scor:
-
-{#if fw === 'pt'}
-
-```py
-candidates = []
-for start_probs, end_probs in zip(start_probabilities, end_probabilities):
-    scores = start_probs[:, None] * end_probs[None, :]
-    idx = torch.triu(scores).argmax().item()
-
-    start_idx = idx // scores.shape[1]
-    end_idx = idx % scores.shape[1]
-    score = scores[start_idx, end_idx].item()
-    candidates.append((start_idx, end_idx, score))
-
-print(candidates)
-```
-
-{:else}
-
-```py
-candidates = []
-for start_probs, end_probs in zip(start_probabilities, end_probabilities):
-    scores = start_probs[:, None] * end_probs[None, :]
-    idx = np.triu(scores).argmax().item()
-
-    start_idx = idx // scores.shape[1]
-    end_idx = idx % scores.shape[1]
-    score = scores[start_idx, end_idx].item()
-    candidates.append((start_idx, end_idx, score))
-
-print(candidates)
-```
-
-{/if}
-
-```python out
-[(0, 18, 0.33867), (173, 184, 0.97149)]
-```
-
-Cei doi candidați corespund celor mai bune răspunsuri pe care modelul le-a putut găsi în fiecare parte. Modelul este mult mai încrezător că răspunsul corect se află în a doua parte (ceea ce este un semn bun!). Acum trebuie doar să facem map celor două intervale de tokenuri cu intervalele de caractere din context (trebuie să o punem în corespondență doar pe a doua pentru a avea răspunsul nostru, dar este interesant să vedem ce a ales modelul în prima parte).
-
-<Tip>
-
-✏️ **Încercați!** Adaptați codul de mai sus pentru a returna scorurile și spanurile intervalele pentru cele mai probabile cinci răspunsuri (în total, nu pe chunk).
-
-</Tip>
-
-`offsets`-urile pe care le-am luat mai devreme este de fapt o listă de offsets, cu o listă pentru fiecare chunk de text:
-
-```py
-for candidate, offset in zip(candidates, offsets):
-    start_token, end_token, score = candidate
-    start_char, _ = offset[start_token]
-    _, end_char = offset[end_token]
-    answer = long_context[start_char:end_char]
-    result = {"answer": answer, "start": start_char, "end": end_char, "score": score}
-    print(result)
-```
-
-```python out
-{'answer': '\n🤗 Transformers: State of the Art NLP', 'start': 0, 'end': 37, 'score': 0.33867}
-{'answer': 'Jax, PyTorch and TensorFlow', 'start': 1892, 'end': 1919, 'score': 0.97149}
-```
-
-Dacă ignorăm primul rezultat, obținem același rezultat ca și pipelineul noastru pentru acest context lung - yay!
-
-<Tip>
-
-✏️ **Încercați!** Utilizați cele mai bune scoruri pe care le-ați calculat înainte pentru a afișa cele mai probabile cinci răspunsuri (pentru întregul context, nu pentru fiecare chunk). Pentru a vă verifica rezultatele, întoarceți-vă la primul pipeline și introduceți `top_k=5` atunci când îl apelați.
-
-</Tip>
-
-Aici se încheie scufundarea noastră în capacitățile tokenizerului. Vom pune toate acestea din nou în practică în capitolul următor, când vă vom arăta cum să ajustați un model pentru o serie de sarcini NLP comune.
diff --git a/chapters/ro/chapter6/4.mdx b/chapters/ro/chapter6/4.mdx
deleted file mode 100644
index e87d27c57..000000000
--- a/chapters/ro/chapter6/4.mdx
+++ /dev/null
@@ -1,122 +0,0 @@
-# Normalization and pre-tokenization[[normalization-and-pre-tokenization]]
-
-<CourseFloatingBanner chapter={6}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter6/section4.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter6/section4.ipynb"},
-]} />
-
-Înainte de a analiza în profunzime cei mai comuni trei algoritmi de subword tokenization utilizați cu modelele Transformer (Byte-Pair Encoding [BPE], WordPiece și Unigram), vom arunca mai întâi o privire la preprocesarea pe care fiecare tokenizer o aplică textului. Iată o prezentare generală a etapelor din pipelineul de tokenizare:
-
-<div class="flex justify-center">
-<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter6/tokenization_pipeline.svg" alt="The tokenization pipeline.">
-<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter6/tokenization_pipeline-dark.svg" alt="The tokenization pipeline.">
-</div>
-
-Înainte de a împărți un text în subtokens (în conformitate cu modelul său), tokenizerul efectuează doi pași: _normalization__ și _pre-tokenization_.
-
-## Normalization[[normalization]]
-
-<Youtube id="4IIC2jI9CaU"/>
-
-Etapa de normalizare implică o curățare generală, cum ar fi eliminarea spațiilor inutile, a le face minuscule, și/sau ștergerea accentelor. Dacă sunteți familiarizat cu [Unicode normalization](http://www.unicode.org/reports/tr15/) (cum ar fi NFC sau NFKC), acest lucru poate fi aplicat și de tokenizer.
-
-`Tokenizer`-ul 🤗 Transformers are un atribut numit `backend_tokenizer` care oferă acces la tokenizatorul de bază din biblioteca 🤗 Tokenizers:
-
-```py
-from transformers import AutoTokenizer
-
-tokenizer = AutoTokenizer.from_pretrained("bert-base-uncased")
-print(type(tokenizer.backend_tokenizer))
-```
-
-```python out
-<class 'tokenizers.Tokenizer'>
-```
-
-Atributul `normalizer` al obiectului `tokenizer` are o metodă `normalize_str()` pe care o putem folosi pentru a vedea cum se realizează normalizarea:
-
-```py
-print(tokenizer.backend_tokenizer.normalizer.normalize_str("Héllò hôw are ü?"))
-```
-
-```python out
-'hello how are u?'
-```
-
-În acest exemplu, din moment ce am ales checkpointul `bert-base-uncased`, normalizarea a aplicat scrierea cu minusculă și a eliminat accentele.
-
-<Tip>
-
-✏️ **Încercați!** Încărcați un tokenizer din checkpointul `bert-base-cased` și treceți-i același exemplu. Care sunt principalele diferențe pe care le puteți observa între versiunile cased și uncased ale tokenizerului?
-
-</Tip>
-
-## Pre-tokenization[[pre-tokenization]]
-
-<Youtube id="grlLV8AIXug"/>
-
-După cum vom vedea în secțiunile următoare, un tokenizer nu poate fi antrenat doar pe text raw. În schimb, trebuie mai întâi să împărțim textele în entități mici, cum ar fi cuvintele. Aici intervine etapa de pre-tokenizare. După cum am văzut în [Capitolul 2](/course/chapter2), un tokenizer bazat pe cuvinte poate împărți pur și simplu un text raw în cuvinte pe baza spațiului și a punctuației. Aceste cuvinte vor fi limitele subtokenurilor pe care tokenizerul le poate învăța în timpul instruirii sale.
-
-Pentru a vedea cum un tokenizator rapid efectuează pre-tokenizarea, putem utiliza metoda `pre_tokenize_str()` a atributului `pre_tokenizer` al obiectului `tokenizer`:
-
-```py
-tokenizer.backend_tokenizer.pre_tokenizer.pre_tokenize_str("Hello, how are  you?")
-```
-
-```python out
-[('Hello', (0, 5)), (',', (5, 6)), ('how', (7, 10)), ('are', (11, 14)), ('you', (16, 19)), ('?', (19, 20))]
-```
-
-Observați cum tokenizatorul ține deja evidența offseturilor, acesta fiind modul în care ne poate oferi mappingul offseturilor pe care l-am folosit în secțiunea anterioară. Aici, tokenizatorul ignoră cele două spații și le înlocuiește cu unul singur, dar offsetul sare între `are` și `you` pentru a ține cont de acest lucru.
-
-Deoarece utilizăm un tokenizer BERT, pre-tokenizarea implică separarea spațiilor și a punctuației. Alți tokenizatori pot avea reguli diferite pentru acest pas. De exemplu, dacă folosim tokenizatorul GPT-2:
-
-```py
-tokenizer = AutoTokenizer.from_pretrained("gpt2")
-tokenizer.backend_tokenizer.pre_tokenizer.pre_tokenize_str("Hello, how are  you?")
-```
-
-va despărți în spații și punctuație, dar va păstra spațiile și le va înlocui cu un simbol `Ġ`, permițându-i să recupereze spațiile originale dacă facem decode tokenilor:
-
-```python out
-[('Hello', (0, 5)), (',', (5, 6)), ('Ġhow', (6, 10)), ('Ġare', (10, 14)), ('Ġ', (14, 15)), ('Ġyou', (15, 19)),
- ('?', (19, 20))]
-```
-
-De asemenea, rețineți că, spre deosebire de tokenizatorul BERT, acest tokenizator nu ignoră spațiul dublu.
-
-Pentru un ultim exemplu, să aruncăm o privire la tokenizerul T5, care se bazează pe algoritmul SentencePiece:
-
-```py
-tokenizer = AutoTokenizer.from_pretrained("t5-small")
-tokenizer.backend_tokenizer.pre_tokenizer.pre_tokenize_str("Hello, how are  you?")
-```
-
-```python out
-[('▁Hello,', (0, 6)), ('▁how', (7, 10)), ('▁are', (11, 14)), ('▁you?', (16, 20))]
-```
-
-Ca și tokenizatorul GPT-2, acesta păstrează spațiile și le înlocuiește cu un token specific (`_`), dar tokenizatorul T5 separă doar spațiile, nu și punctuația. De asemenea, observați că a adăugat un spațiu implicit la începutul propoziției (înainte de `Hello`) și a ignorat spațiul dublu dintre `are` și `you`.
-
-Acum că am văzut puțin din modul în care diferite tokenizere procesează textul, putem începe să explorăm algoritmii care stau la baza acestora. Vom începe cu o privire rapidă asupra SentencePiece, care se aplică pe scară largă; apoi, în următoarele trei secțiuni, vom examina modul în care funcționează cei trei algoritmi principali utilizați pentru tokenizarea subcuvintelor.
-
-## SentencePiece[[sentencepiece]]
-
-[SentencePiece](https://github.com/google/sentencepiece) este un algoritm de tokenizare pentru preprocesarea textului pe care îl puteți utiliza cu oricare dintre modelele pe care le vom vedea în următoarele trei secțiuni. Acesta consideră textul ca o secvență de caractere Unicode și înlocuiește spațiile cu un caracter special, `▁`. Folosit împreună cu algoritmul Unigram (a se vedea [secțiunea 7](/course/chapter7/7)), nu necesită nici măcar o etapă de pre-tokenizare, ceea ce este foarte util pentru limbile în care nu se folosește caracterul spațiu (cum ar fi chineza sau japoneza).
-
-Cealaltă caracteristică principală a SentencePiece este *reversible tokenization*: deoarece nu există un tratament special al spațiilor, decodarea tokenurilor se face pur și simplu prin concatenarea lor și înlocuirea `_` cu spații - acest lucru rezultă în textul normalizat. După cum am văzut mai devreme, tokenizatorul BERT elimină spațiile care se repetă, deci tokenizarea sa nu este reversibilă.
-
-## Prezentare generală a algoritmului[[algorithm-overview]]
-
-În următoarele secțiuni, vom analiza cei trei algoritmi principali de tokenizare a subcuvintelor: BPE (utilizat de GPT-2 și alții), WordPiece (utilizat de exemplu de BERT) și Unigram (utilizat de T5 și alții). Înainte de a începe, iată o scurtă prezentare generală a modului în care funcționează fiecare dintre acestea. Nu ezitați să reveniți la acest tabel după ce citiți fiecare dintre secțiunile următoare, dacă încă nu are sens pentru dumneavoastră.
-
-Model | BPE | WordPiece | Unigram
-:----:|:---:|:---------:|:------:
-Training | Pornește de la un vocabular restrâns și învață reguli de îmbinare a tokenilor |  Pornește de la un vocabular restrâns și învață reguli de îmbinare a tokenilor | Pornește de la un vocabular mare și învață regulile de eliminare a tokenilor
-Training step | Combină tokenii corespunzători celei mai comune perechi | Combină tokenii corespunzători perechii cu cel mai bun scor pe baza frecvenței perechii, privilegiind perechile în care fiecare token individual este mai puțin frecvent| Elimină toți tokenii din vocabular care vor minimiza pierderea calculată pe întregul corpus
-Learns | Reguli de combinare și un vocabular| Doar un vocabular| Un vocabular cu un anumit scor pentru fiecare token
-Encoding | Împarte un cuvânt în caractere și aplică îmbinările învățate în timpul antrenării | Găsește cel mai lung subcuvânt începând de la început care se află în vocabular, apoi face același lucru pentru restul cuvântului | Găsește cea mai probabilă împărțire în tokens, folosind scorurile învățate în timpul antrenării
-
-Acum hai să trecem la BPE!
\ No newline at end of file
diff --git a/chapters/ro/chapter6/5.mdx b/chapters/ro/chapter6/5.mdx
deleted file mode 100644
index 91c26b82f..000000000
--- a/chapters/ro/chapter6/5.mdx
+++ /dev/null
@@ -1,360 +0,0 @@
-# Tokenizarea Byte-Pair Encoding[[byte-pair-encoding-tokenization]]
-
-<CourseFloatingBanner chapter={6}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter6/section5.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter6/section5.ipynb"},
-]} />
-
-Byte-Pair Encoding (BPE) a fost inițial dezvoltat ca un algoritm de comprimare a textelor și apoi utilizat de OpenAI pentru tokenizare la preantrenarea modelului GPT. Acesta este utilizat de o mulțime de modele Transformers, inclusiv GPT, GPT-2, RoBERTa, BART și DeBERTa.
-
-<Youtube id="HEikzVL-lZU"/>
-
-<Tip>
-
-💡 Această secțiune acoperă BPE în profunzime, mergând până la prezentarea unei implementări complete. Puteți sări la sfârșit dacă doriți doar o prezentare generală a algoritmului de tokenizare.
-
-</Tip>
-
-## Algoritmul de antrenare[[training-algorithm]]
-
-Antrenarea BPE începe prin calcularea setului unic de cuvinte utilizate în corpus (după finalizarea etapelor de normalizare și pre-tokenizare), apoi construirea vocabularului prin preluarea tuturor simbolurilor utilizate pentru scrierea acestor cuvinte. Ca un exemplu foarte simplu, să spunem că corpusul nostru utilizează aceste cinci cuvinte:
-
-```
-"hug", "pug", "pun", "bun", "hugs"
-```
-
-Vocabularul de bază va fi atunci `["b", "g", "h", "n", "p", "s", "u"]`. Pentru cazurile din lumea reală, vocabularul de bază va conține cel puțin toate caracterele ASCII și, probabil, și unele caractere Unicode. Dacă un exemplu pe care îl tokenizați utilizează un caracter care nu se află în corpusul de antrenare, acel caracter va fi convertit într-un token necunoscut. Acesta este unul dintre motivele pentru care o mulțime de modele NLP sunt foarte proaste la analizarea conținutului cu emoji, de exemplu.
-
-<Tip>
-
-Tokenizerele GPT-2 și RoBERTa (care sunt destul de asemănătoare) au o modalitate inteligentă de a rezolva acest lucru: ele nu privesc cuvintele ca fiind scrise cu caractere Unicode, ci cu bytes. În acest fel, vocabularul de bază are o dimensiune mică (256), dar fiecare caracter la care vă puteți gândi va fi inclus și nu va ajunge să fie convertit într-un token necunoscut. Acest truc se numește *byte-level BPE*.
-
-</Tip>
-
-După obținerea acestui vocabular de bază, adăugăm noi tokeni până când se atinge dimensiunea dorită a vocabularului prin învățarea prin *merges*, care sunt reguli de merge a două elemente ale vocabularului existent într-unul nou. Astfel, la început, aceste fuziuni vor crea tokenuri cu două caractere, iar apoi, pe măsură ce antrenamentul progresează, subwords mai lungi.
-
-În orice etapă din timpul antrenării tokenizerului, algoritmul BPE va căuta cea mai frecventă pereche de tokenuri existente (prin "pereche" înțelegem aici doi tokeni consecutivi într-un cuvânt). Acea pereche cea mai frecventă este cea care va fi mergea, iar noi ștergem și repetăm pentru pasul următor.
-
-Revenind la exemplul nostru anterior, să presupunem că cuvintele au următoarele frecvențe:
-
-```
-("hug", 10), ("pug", 5), ("pun", 12), ("bun", 4), ("hugs", 5)
-```
-
-înțelegând că `"hug"` a fost prezent de 10 ori în corpus, `"pug"` de 5 ori, `"pun"` de 12 ori, `"bun"` de 4 ori, iar `"hugs"` de 5 ori. Începem antrenamentul împărțind fiecare cuvânt în caractere (cele care formează vocabularul nostru inițial), astfel încât să putem vedea fiecare cuvânt ca pe o listă de tokeni:
-
-```
-("h" "u" "g", 10), ("p" "u" "g", 5), ("p" "u" "n", 12), ("b" "u" "n", 4), ("h" "u" "g" "s", 5)
-```
-
-Apoi ne uităm la perechi. Perechea `("h", "u")` este prezentă în cuvintele `"hug"` și `"hugs"`, deci de 15 ori în total în corpus. Totuși, nu este cea mai frecventă pereche: această onoare revine perechii `("u", "g")`, care este prezentă în cuvintele `"hug"`, `"pug"` și `"hugs"`, pentru un total de 20 de ori în vocabular.
-
-Astfel, prima regulă de merge învățată de tokenizer este `("u", "g") -> "ug"`, ceea ce înseamnă că `"ug"` va fi adăugat la vocabular, iar perechea ar trebui să fie merged în toate cuvintele din corpus. La sfârșitul acestei etape, vocabularul și corpus-ul arată astfel:
-
-```
-Vocabulary: ["b", "g", "h", "n", "p", "s", "u", "ug"]
-Corpus: ("h" "ug", 10), ("p" "ug", 5), ("p" "u" "n", 12), ("b" "u" "n", 4), ("h" "ug" "s", 5)
-```
-
-Acum avem câteva perechi care rezultă într-un token mai lung de două caractere: perechea `("h", "ug")`, de exemplu (prezentă de 15 ori în corpus). Cea mai frecventă pereche în această etapă este `("u", "n")`, prezentă însă de 16 ori în corpus, astfel încât a doua regulă de îmbinare învățată este `("u", "n") -> "un"`. Adăugarea acestei reguli la vocabular și mergingul tuturor aparițiilor existente ne conduce la:
-
-```
-Vocabulary: ["b", "g", "h", "n", "p", "s", "u", "ug", "un"]
-Corpus: ("h" "ug", 10), ("p" "ug", 5), ("p" "un", 12), ("b" "un", 4), ("h" "ug" "s", 5)
-```
-
-Acum, cea mai frecventă pereche este `("h", "ug")`, așa că învățăm regula de erge `("h", "ug") -> "hug"`, care ne oferă primul nostru simbol din trei litere. După fuzionare, corpusul arată astfel:
-
-```
-Vocabulary: ["b", "g", "h", "n", "p", "s", "u", "ug", "un", "hug"]
-Corpus: ("hug", 10), ("p" "ug", 5), ("p" "un", 12), ("b" "un", 4), ("hug" "s", 5)
-```
-
-Și continuăm astfel până când ajungem la dimensiunea dorită a vocabularului.
-
-<Tip>
-
-✏️ **Acum e rândul tău!** Care crezi că va fi următoarea regulă de fuziune?
-
-</Tip>
-
-## Algoritmul de tokenizare[[tokenization-algorithm]]
-
-Tokenizarea urmează îndeaproape procesul de antrenare, în sensul că noile inputuri sunt tokenizate prin aplicarea următoarelor etape:
-
-1. Normalizare
-2. Pre-tokenizare
-3. Divizarea cuvintelor în caractere individuale
-4. Aplicarea regulilor de merge învățate în ordine asupra acestor împărțiri
-
-Să luăm exemplul pe care l-am folosit în timpul antrenamentului, cu cele trei reguli de merge învățate:
-
-```
-("u", "g") -> "ug"
-("u", "n") -> "un"
-("h", "ug") -> "hug"
-```
-
-Cuvântul `"bug"` va fi tokenizat ca `["b", "ug"]`. Cu toate acestea, cuvântul `"mug"` va fi tokenizat ca `["[UNK]", "ug"]` deoarece litera `"m"` nu a fost în vocabularul de bază. De asemenea, cuvântul `"thug"` va fi tokenizat ca `["[UNK]", "hug"]`: litera `"t"` nu se află în vocabularul de bază, iar aplicarea regulilor de merge duce mai întâi la fuzionarea lui `"u"` și `"g"` și apoi la fuzionarea lui `"h"` și `"ug"`.
-
-<Tip>
-
-✏️ **Acum e rândul tău!** Cum crezi că va fi tokenizat cuvântul `"unhug"`?
-
-</Tip>
-
-## Implementarea BPE[[implementing-bpe]]
-
-Acum să aruncăm o privire la implementarea algoritmului BPE. Aceasta nu va fi o versiune optimizată pe care o puteți utiliza pe un corpus mare; dorim doar să vă arătăm codul pentru a putea înțelege algoritmul puțin mai bine.
-
-În primul rând avem nevoie de un corpus, așa că haideți să creăm unul simplu cu câteva propoziții:
-
-```python
-corpus = [
-    "This is the Hugging Face Course.",
-    "This chapter is about tokenization.",
-    "This section shows several tokenizer algorithms.",
-    "Hopefully, you will be able to understand how they are trained and generate tokens.",
-]
-```
-
-Apoi, trebuie să pre-tokenizăm acest corpus în cuvinte. Deoarece replicăm un tokenizator BPE (precum GPT-2), vom utiliza tokenizatorul `gpt2` pentru pre-tokenizare:
-
-```python
-from transformers import AutoTokenizer
-
-tokenizer = AutoTokenizer.from_pretrained("gpt2")
-```
-
-Apoi, calculăm frecvențele fiecărui cuvânt din corpus la fel ca în cazul pre-tokenizării:
-
-```python
-from collections import defaultdict
-
-word_freqs = defaultdict(int)
-
-for text in corpus:
-    words_with_offsets = tokenizer.backend_tokenizer.pre_tokenizer.pre_tokenize_str(text)
-    new_words = [word for word, offset in words_with_offsets]
-    for word in new_words:
-        word_freqs[word] += 1
-
-print(word_freqs)
-```
-
-```python out
-defaultdict(int, {'This': 3, 'Ġis': 2, 'Ġthe': 1, 'ĠHugging': 1, 'ĠFace': 1, 'ĠCourse': 1, '.': 4, 'Ġchapter': 1,
-    'Ġabout': 1, 'Ġtokenization': 1, 'Ġsection': 1, 'Ġshows': 1, 'Ġseveral': 1, 'Ġtokenizer': 1, 'Ġalgorithms': 1,
-    'Hopefully': 1, ',': 1, 'Ġyou': 1, 'Ġwill': 1, 'Ġbe': 1, 'Ġable': 1, 'Ġto': 1, 'Ġunderstand': 1, 'Ġhow': 1,
-    'Ġthey': 1, 'Ġare': 1, 'Ġtrained': 1, 'Ġand': 1, 'Ġgenerate': 1, 'Ġtokens': 1})
-```
-
-Următorul pas este calcularea vocabularului de bază, format din toate caracterele utilizate în corpus:
-
-```python
-alphabet = []
-
-for word in word_freqs.keys():
-    for letter in word:
-        if letter not in alphabet:
-            alphabet.append(letter)
-alphabet.sort()
-
-print(alphabet)
-```
-
-```python out
-[ ',', '.', 'C', 'F', 'H', 'T', 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'k', 'l', 'm', 'n', 'o', 'p', 'r', 's',
-  't', 'u', 'v', 'w', 'y', 'z', 'Ġ']
-```
-
-De asemenea, adăugăm tokenurile speciale utilizate de model la începutul vocabularului respectiv. În cazul GPT-2, singurul simbol special este `"<|endoftext|>"`:
-
-```python
-vocab = ["<|endoftext|>"] + alphabet.copy()
-```
-
-Acum trebuie să împărțim fiecare cuvânt în caractere individuale, pentru a putea începe antrenarea:
-
-```python
-splits = {word: [c for c in word] for word in word_freqs.keys()}
-```
-
-Acum că suntem pregătiți pentru antrenare, să scriem o funcție care calculează frecvența fiecărei perechi. Va trebui să folosim această funcție la fiecare etapă a antrenare:
-
-```python
-def compute_pair_freqs(splits):
-    pair_freqs = defaultdict(int)
-    for word, freq in word_freqs.items():
-        split = splits[word]
-        if len(split) == 1:
-            continue
-        for i in range(len(split) - 1):
-            pair = (split[i], split[i + 1])
-            pair_freqs[pair] += freq
-    return pair_freqs
-```
-
-Să aruncăm o privire la o parte din acest dicționar după separările inițiale:
-
-```python
-pair_freqs = compute_pair_freqs(splits)
-
-for i, key in enumerate(pair_freqs.keys()):
-    print(f"{key}: {pair_freqs[key]}")
-    if i >= 5:
-        break
-```
-
-```python out
-('T', 'h'): 3
-('h', 'i'): 3
-('i', 's'): 5
-('Ġ', 'i'): 2
-('Ġ', 't'): 7
-('t', 'h'): 3
-```
-
-Acum, pentru a găsi cea mai frecventă pereche este nevoie doar de o loop rapid:
-
-```python
-best_pair = ""
-max_freq = None
-
-for pair, freq in pair_freqs.items():
-    if max_freq is None or max_freq < freq:
-        best_pair = pair
-        max_freq = freq
-
-print(best_pair, max_freq)
-```
-
-```python out
-('Ġ', 't') 7
-```
-
-Așadar, prima îmbinare care trebuie învățată este `('Ġ', 't') -> 'Ġt'`, și adăugăm `'Ġt'` la vocabular:
-
-```python
-merges = {("Ġ", "t"): "Ġt"}
-vocab.append("Ġt")
-```
-
-Pentru a continua, trebuie să aplicăm aceast merge în dicționarul nostru `splits`. Să scriem o altă funcție pentru acest lucru:
-
-```python
-def merge_pair(a, b, splits):
-    for word in word_freqs:
-        split = splits[word]
-        if len(split) == 1:
-            continue
-
-        i = 0
-        while i < len(split) - 1:
-            if split[i] == a and split[i + 1] == b:
-                split = split[:i] + [a + b] + split[i + 2 :]
-            else:
-                i += 1
-        splits[word] = split
-    return splits
-```
-
-Și putem arunca o privire la rezultatul primului merge:
-
-```py
-splits = merge_pair("Ġ", "t", splits)
-print(splits["Ġtrained"])
-```
-
-```python out
-['Ġt', 'r', 'a', 'i', 'n', 'e', 'd']
-```
-
-Acum avem tot ce ne trebuie pentru a face bucle până când vom învăța toate mergeu-rile dorite. Ne focusăm pe o mărime a vocabularui de 50:
-
-```python
-vocab_size = 50
-
-while len(vocab) < vocab_size:
-    pair_freqs = compute_pair_freqs(splits)
-    best_pair = ""
-    max_freq = None
-    for pair, freq in pair_freqs.items():
-        if max_freq is None or max_freq < freq:
-            best_pair = pair
-            max_freq = freq
-    splits = merge_pair(*best_pair, splits)
-    merges[best_pair] = best_pair[0] + best_pair[1]
-    vocab.append(best_pair[0] + best_pair[1])
-```
-
-Ca rezultat, am învățat 19 reguli de merge(vocabularul inițial avea o dimensiune de 31 -- 30 de caractere din alfabet, plus simbolul special):
-
-```py
-print(merges)
-```
-
-```python out
-{('Ġ', 't'): 'Ġt', ('i', 's'): 'is', ('e', 'r'): 'er', ('Ġ', 'a'): 'Ġa', ('Ġt', 'o'): 'Ġto', ('e', 'n'): 'en',
- ('T', 'h'): 'Th', ('Th', 'is'): 'This', ('o', 'u'): 'ou', ('s', 'e'): 'se', ('Ġto', 'k'): 'Ġtok',
- ('Ġtok', 'en'): 'Ġtoken', ('n', 'd'): 'nd', ('Ġ', 'is'): 'Ġis', ('Ġt', 'h'): 'Ġth', ('Ġth', 'e'): 'Ġthe',
- ('i', 'n'): 'in', ('Ġa', 'b'): 'Ġab', ('Ġtoken', 'i'): 'Ġtokeni'}
-```
-
-Iar vocabularul este compus din simbolul special, alfabetul inițial și toate rezultatele merge-urilor:
-
-```py
-print(vocab)
-```
-
-```python out
-['<|endoftext|>', ',', '.', 'C', 'F', 'H', 'T', 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'k', 'l', 'm', 'n', 'o',
- 'p', 'r', 's', 't', 'u', 'v', 'w', 'y', 'z', 'Ġ', 'Ġt', 'is', 'er', 'Ġa', 'Ġto', 'en', 'Th', 'This', 'ou', 'se',
- 'Ġtok', 'Ġtoken', 'nd', 'Ġis', 'Ġth', 'Ġthe', 'in', 'Ġab', 'Ġtokeni']
-```
-
-<Tip>
-
-💡 Folosind `train_new_from_iterator()` pe același corpus nu va rezulta exact același vocabular. Acest lucru se datorează faptului că atunci când există o alegere a celei mai frecvente perechi, am selectat-o pe prima întâlnită, în timp ce biblioteca 🤗 Tokenizers o selectează pe prima pe baza ID-urilor sale interne.
-
-</Tip>
-
-Pentru a tokeniza un text nou, îl pre-tokenizăm, îl împărțim, apoi aplicăm toate regulile de merge învățate:
-
-```python
-def tokenize(text):
-    pre_tokenize_result = tokenizer._tokenizer.pre_tokenizer.pre_tokenize_str(text)
-    pre_tokenized_text = [word for word, offset in pre_tokenize_result]
-    splits = [[l for l in word] for word in pre_tokenized_text]
-    for pair, merge in merges.items():
-        for idx, split in enumerate(splits):
-            i = 0
-            while i < len(split) - 1:
-                if split[i] == pair[0] and split[i + 1] == pair[1]:
-                    split = split[:i] + [merge] + split[i + 2 :]
-                else:
-                    i += 1
-            splits[idx] = split
-
-    return sum(splits, [])
-```
-
-Putem încerca acest lucru pe orice text compus din caractere din alfabet:
-
-```py
-tokenize("This is not a token.")
-```
-
-```python out
-['This', 'Ġis', 'Ġ', 'n', 'o', 't', 'Ġa', 'Ġtoken', '.']
-```
-
-<Tip warning={true}>
-
-⚠️ Implementarea noastră va arunca o eroare dacă există un caracter necunoscut, deoarece nu am făcut nimic pentru a le gestiona. GPT-2 nu are de fapt un token necunoscut (este imposibil să obțineți un caracter necunoscut atunci când utilizați BPE la nivel de bytes), dar acest lucru s-ar putea întâmpla aici deoarece nu am inclus toate byte-urile posibile în vocabularul inițial. Acest aspect al BPE depășește domeniul de aplicare al acestei secțiuni, așa că am omis detaliile.
-
-</Tip>
-
-Asta e tot pentru algoritmul BPE! În continuare, ne vom uita la WordPiece.
\ No newline at end of file
diff --git a/chapters/ro/chapter6/6.mdx b/chapters/ro/chapter6/6.mdx
deleted file mode 100644
index c2b0e6450..000000000
--- a/chapters/ro/chapter6/6.mdx
+++ /dev/null
@@ -1,375 +0,0 @@
-# Tokenizarea WordPiece[[wordpiece-tokenization]]
-
-<CourseFloatingBanner chapter={6}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter6/section6.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter6/section6.ipynb"},
-]} />
-
-WordPiece este algoritmul de tokenizare dezvoltat de Google pentru preantrenarea BERT. De atunci, acesta a fost reutilizat în numeroase modele Transformers bazate pe BERT, cum ar fi DistilBERT, MobileBERT, Funnel Transformers și MPNET. Este foarte similar cu BPE în ceea ce privește antrenarea, dar tokenizarea efectivă se face diferit.
-
-<Youtube id="qpv6ms_t_1A"/>
-
-<Tip>
-
-💡 Această secțiune acoperă WordPiece în profunzime, mergând până la prezentarea unei implementări complete. Puteți sări la sfârșit dacă doriți doar o prezentare generală a algoritmului de tokenizare.
-
-</Tip>
-
-## Algoritmul de antrenare[[training-algorithm]]
-
-<Tip warning={true}>
-
-⚠️ Google nu a publicat niciodată implementarea sa a algoritmului de formare a WordPiece, astfel încât ceea ce urmează este cea mai bună presupunere a noastră bazată pe literatura publicată. Este posibil să nu fie 100% exactă.
-
-</Tip>
-
-La fel ca BPE, WordPiece pornește de la un vocabular restrâns care include simbolurile speciale utilizate de model și alfabetul inițial. Deoarece identifică subcuvinte prin adăugarea unui prefix (cum ar fi `##` pentru BERT), fiecare cuvânt este inițial împărțit prin adăugarea prefixului respectiv la toate caracterele din cuvânt. Astfel, de exemplu, `"word"` este împărțit astfel:
-
-```
-w ##o ##r ##d
-```
-
-Astfel, alfabetul inițial conține toate caracterele prezente la începutul unui cuvânt și caracterele prezente în interiorul unui cuvânt cu prefixul WordPiece.
-
-Apoi, la fel ca BPE, WordPiece învață reguli de merge. Principala diferență este modul în care este selectată perechea care urmează să fie merged. În loc să selecteze cea mai frecventă pereche, WordPiece calculează un scor pentru fiecare pereche, utilizând următoarea formulă:
-
-$$\mathrm{score} = (\mathrm{freq\_of\_pair}) / (\mathrm{freq\_of\_first\_element} \times \mathrm{freq\_of\_second\_element})$$
-
-Împărțind frecvența perechii la produsul frecvențelor fiecărei părți a acesteia, algoritmul prioritizează fuzionarea perechilor în care părțile individuale sunt mai puțin frecvente în vocabular. De exemplu, nu va fuziona neapărat `("un", "##able")` chiar dacă această pereche apare foarte frecvent în vocabular, deoarece cele două perechi `"un"` și `"##able"` vor apărea probabil fiecare într-o mulțime de alte cuvinte și vor avea o frecvență ridicată. În schimb, o pereche precum `("hu", "##gging")` va fi probabil fuzionată mai repede (presupunând că cuvântul "hugging" apare frecvent în vocabular), deoarece `"hu"` și `"##gging"` sunt probabil mai puțin frecvente individual.
-
-Să ne uităm la același vocabular pe care l-am folosit în exemplul de antrenare BPE:
-
-```
-("hug", 10), ("pug", 5), ("pun", 12), ("bun", 4), ("hugs", 5)
-```
-
-Spliturile aici vor fi:
-
-```
-("h" "##u" "##g", 10), ("p" "##u" "##g", 5), ("p" "##u" "##n", 12), ("b" "##u" "##n", 4), ("h" "##u" "##g" "##s", 5)
-```
-
-deci vocabularul inițial va fi `["b", "h", "p", "##g", "##n", "##s", "##u"]` (dacă uităm deocamdată de tokenurile speciale). Cea mai frecventă pereche este `("##u", "##g")` (prezentă de 20 de ori), dar frecvența individuală a lui `"##u"` este foarte mare, astfel încât scorul său nu este cel mai mare (este 1 / 36). Toate perechile cu un `"##u"` au de fapt același scor (1 / 36), astfel încât cel mai bun scor revine perechii `("##g", "##s")` - singura fără un `"##u"` - cu 1 / 20, iar prima îmbinare învățată este `("##g", "##s") -> ("##gs")`.
-
-Rețineți că atunci când facem merge, eliminăm `##` dintre cele două tokenuri, deci adăugăm `"##gs"` la vocabular și aplicăm merge în cuvintele din corpus:
-
-```
-Vocabulary: ["b", "h", "p", "##g", "##n", "##s", "##u", "##gs"]
-Corpus: ("h" "##u" "##g", 10), ("p" "##u" "##g", 5), ("p" "##u" "##n", 12), ("b" "##u" "##n", 4), ("h" "##u" "##gs", 5)
-```
-
-În acest moment, `"##u"` se află în toate perechile posibile, deci toate au același scor. Să spunem că în acest caz, prima pereche este merged, deci `("h", "##u") -> "hu"`. Acest lucru ne duce la:
-
-```
-Vocabulary: ["b", "h", "p", "##g", "##n", "##s", "##u", "##gs", "hu"]
-Corpus: ("hu" "##g", 10), ("p" "##u" "##g", 5), ("p" "##u" "##n", 12), ("b" "##u" "##n", 4), ("hu" "##gs", 5)
-```
-
-Apoi, următorul scor cu cel mai bun rezultat este împărțit de `("hu", "##g")` și `("hu", "##gs")` (cu 1/15, comparativ cu 1/21 pentru toate celelalte perechi), astfel încât prima pereche cu cel mai mare scor este merged
-
-```
-Vocabulary: ["b", "h", "p", "##g", "##n", "##s", "##u", "##gs", "hu", "hug"]
-Corpus: ("hug", 10), ("p" "##u" "##g", 5), ("p" "##u" "##n", 12), ("b" "##u" "##n", 4), ("hu" "##gs", 5)
-```
-
-și continuăm astfel până când ajungem la dimensiunea dorită a vocabularului.
-
-<Tip>
-
-✏️ **Acum e rândul tău!** Care va fi următoarea regulă de merge?
-
-</Tip>
-
-## Algoritm de tokenizare[[tokenization-algorithm]]
-
-Tokenizarea diferă în WordPiece și BPE prin faptul că WordPiece salvează doar vocabularul final, nu și regulile de merge învățate. Pornind de la cuvântul de tokenizat, WordPiece găsește cel mai lung subcuvânt care se află în vocabular, apoi îl împarte. De exemplu, dacă folosim vocabularul învățat în exemplul de mai sus, pentru cuvântul `"hugs"` cel mai lung subcuvânt de la început care se află în vocabular este `"hug"`, așa că împărțim acolo și obținem `["hug", "##s"]`. Apoi continuăm cu `"##s"`, care se află în vocabular, deci tokenizarea lui `"hugs"` este `["hug", "##s"]`.
-
-Cu BPE, am fi aplicat mergeurile învățate în ordine și am fi tokenizat acest lucru ca `["hu", "##gs"]`, deci encodingul este diferit.
-
-Ca un alt exemplu, să vedem cum ar fi tokenizat cuvântul `"bugs"`. `"b"` este cel mai lung subcuvânt care începe de la începutul cuvântului care se află în vocabular, așa că îl împărțim acolo și obținem `["b", "##ugs"]`. Apoi, `"##u"` este cel mai lung subcuvânt care începe de la începutul cuvântului `"##ugs"` care se află în vocabular, deci îl separăm și obținem `["b", "##u, "##gs"]`. În cele din urmă, `"##gs"` se află în vocabular, deci această ultimă listă este tokenizarea lui `"bugs"`.
-
-Atunci când tokenizarea ajunge într-un stadiu în care nu este posibilă găsirea unui subcuvânt în vocabular, întregul cuvânt este tokenizat ca necunoscut - astfel, de exemplu, `"mug"` ar fi tokenizat ca `["[UNK]"]`, la fel ca `"bum"` (chiar dacă putem începe cu `"b"` și `"##u"`, `"##m"` nu face parte din vocabular, iar tokenizarea rezultată va fi `["[UNK]"]`, nu `["b", "##u", "[UNK]"]`). Aceasta este o altă diferență față de BPE, care ar clasifica doar caracterele individuale care nu se află în vocabular ca necunoscute.
-
-<Tip>
-
-✏️ **Acum e rândul tău!** Cum va fi tokenizat cuvântul `"pugs"`?
-
-</Tip>
-
-## Implementând WordPiece[[implementing-wordpiece]]
-
-Acum să aruncăm o privire la o implementare a algoritmului WordPiece. La fel ca în cazul BPE, acest lucru este doar pedagogic și nu veți putea să îl utilizați pe un corpus mare.
-
-Vom utiliza același corpus ca în exemplul BPE:
-
-```python
-corpus = [
-    "This is the Hugging Face Course.",
-    "This chapter is about tokenization.",
-    "This section shows several tokenizer algorithms.",
-    "Hopefully, you will be able to understand how they are trained and generate tokens.",
-]
-```
-
-În primul rând, trebuie să pre-tokenizăm corpusul în cuvinte. Deoarece replicăm un tokenizator WordPiece (precum BERT), vom utiliza tokenizatorul `bert-base-cased` pentru pre-tokenizare:
-
-```python
-from transformers import AutoTokenizer
-
-tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
-```
-
-Apoi, calculăm frecvențele fiecărui cuvânt din corpus la fel ca în cazul pre-tokenizării:
-
-```python
-from collections import defaultdict
-
-word_freqs = defaultdict(int)
-for text in corpus:
-    words_with_offsets = tokenizer.backend_tokenizer.pre_tokenizer.pre_tokenize_str(text)
-    new_words = [word for word, offset in words_with_offsets]
-    for word in new_words:
-        word_freqs[word] += 1
-
-word_freqs
-```
-
-```python out
-defaultdict(
-    int, {'This': 3, 'is': 2, 'the': 1, 'Hugging': 1, 'Face': 1, 'Course': 1, '.': 4, 'chapter': 1, 'about': 1,
-    'tokenization': 1, 'section': 1, 'shows': 1, 'several': 1, 'tokenizer': 1, 'algorithms': 1, 'Hopefully': 1,
-    ',': 1, 'you': 1, 'will': 1, 'be': 1, 'able': 1, 'to': 1, 'understand': 1, 'how': 1, 'they': 1, 'are': 1,
-    'trained': 1, 'and': 1, 'generate': 1, 'tokens': 1})
-```
-
-După cum am văzut mai devreme, alfabetul este setul unic compus din toate primele litere ale cuvintelor și toate celelalte litere care apar în cuvintele cu prefixul `##`:
-
-```python
-alphabet = []
-for word in word_freqs.keys():
-    if word[0] not in alphabet:
-        alphabet.append(word[0])
-    for letter in word[1:]:
-        if f"##{letter}" not in alphabet:
-            alphabet.append(f"##{letter}")
-
-alphabet.sort()
-alphabet
-
-print(alphabet)
-```
-
-```python out
-['##a', '##b', '##c', '##d', '##e', '##f', '##g', '##h', '##i', '##k', '##l', '##m', '##n', '##o', '##p', '##r', '##s',
- '##t', '##u', '##v', '##w', '##y', '##z', ',', '.', 'C', 'F', 'H', 'T', 'a', 'b', 'c', 'g', 'h', 'i', 's', 't', 'u',
- 'w', 'y']
-```
-
-De asemenea, adăugăm simbolurile speciale utilizate de model la începutul vocabularului respectiv. În cazul BERT, este vorba de lista `["[PAD]", "[UNK]", "[CLS]", "[SEP]", "[MASK]"]``:
-
-```python
-vocab = ["[PAD]", "[UNK]", "[CLS]", "[SEP]", "[MASK]"] + alphabet.copy()
-```
-
-Apoi trebuie să împărțim fiecare cuvânt, cu toate literele care nu sunt primele cu prefixul `##`:
-
-```python
-splits = {
-    word: [c if i == 0 else f"##{c}" for i, c in enumerate(word)]
-    for word in word_freqs.keys()
-}
-```
-
-Acum că suntem pregătiți pentru antrenare, să scriem o funcție care calculează scorul fiecărei perechi. Va trebui să folosim această funcție la fiecare etapă a antrenării:
-
-```python
-def compute_pair_scores(splits):
-    letter_freqs = defaultdict(int)
-    pair_freqs = defaultdict(int)
-    for word, freq in word_freqs.items():
-        split = splits[word]
-        if len(split) == 1:
-            letter_freqs[split[0]] += freq
-            continue
-        for i in range(len(split) - 1):
-            pair = (split[i], split[i + 1])
-            letter_freqs[split[i]] += freq
-            pair_freqs[pair] += freq
-        letter_freqs[split[-1]] += freq
-
-    scores = {
-        pair: freq / (letter_freqs[pair[0]] * letter_freqs[pair[1]])
-        for pair, freq in pair_freqs.items()
-    }
-    return scores
-```
-
-Să aruncăm o privire la o parte din acest dicționar după separările inițiale:
-
-```python
-pair_scores = compute_pair_scores(splits)
-for i, key in enumerate(pair_scores.keys()):
-    print(f"{key}: {pair_scores[key]}")
-    if i >= 5:
-        break
-```
-
-```python out
-('T', '##h'): 0.125
-('##h', '##i'): 0.03409090909090909
-('##i', '##s'): 0.02727272727272727
-('i', '##s'): 0.1
-('t', '##h'): 0.03571428571428571
-('##h', '##e'): 0.011904761904761904
-```
-
-Acum, pentru a găsi perechea cu cel mai bun scor este nevoie doar de un loop rapid:
-
-```python
-best_pair = ""
-max_score = None
-for pair, score in pair_scores.items():
-    if max_score is None or max_score < score:
-        best_pair = pair
-        max_score = score
-
-print(best_pair, max_score)
-```
-
-```python out
-('a', '##b') 0.2
-```
-
-Așadar, primul merge de învățat este `('a', '##b') -> 'ab'`, iar noi adăugăm `'ab'` la vocabular:
-
-```python
-vocab.append("ab")
-```
-
-Pentru a continua, trebuie să aplicăm aceast merge în dicționarul nostru `splits`. Să scriem o altă funcție pentru acest lucru:
-
-```python
-def merge_pair(a, b, splits):
-    for word in word_freqs:
-        split = splits[word]
-        if len(split) == 1:
-            continue
-        i = 0
-        while i < len(split) - 1:
-            if split[i] == a and split[i + 1] == b:
-                merge = a + b[2:] if b.startswith("##") else a + b
-                split = split[:i] + [merge] + split[i + 2 :]
-            else:
-                i += 1
-        splits[word] = split
-    return splits
-```
-
-Și putem arunca o privire la rezultatul primului merge:
-
-```py
-splits = merge_pair("a", "##b", splits)
-splits["about"]
-```
-
-```python out
-['ab', '##o', '##u', '##t']
-```
-
-Acum avem tot ce ne trebuie pentru a face bucle până când vom învăța toate merge-urile dorite. Să ne propunem un vocabular de mărimea 70:
-
-```python
-vocab_size = 70
-while len(vocab) < vocab_size:
-    scores = compute_pair_scores(splits)
-    best_pair, max_score = "", None
-    for pair, score in scores.items():
-        if max_score is None or max_score < score:
-            best_pair = pair
-            max_score = score
-    splits = merge_pair(*best_pair, splits)
-    new_token = (
-        best_pair[0] + best_pair[1][2:]
-        if best_pair[1].startswith("##")
-        else best_pair[0] + best_pair[1]
-    )
-    vocab.append(new_token)
-```
-
-Ne putem uita apoi la vocabularul generat:
-
-```py
-print(vocab)
-```
-
-```python out
-['[PAD]', '[UNK]', '[CLS]', '[SEP]', '[MASK]', '##a', '##b', '##c', '##d', '##e', '##f', '##g', '##h', '##i', '##k',
- '##l', '##m', '##n', '##o', '##p', '##r', '##s', '##t', '##u', '##v', '##w', '##y', '##z', ',', '.', 'C', 'F', 'H',
- 'T', 'a', 'b', 'c', 'g', 'h', 'i', 's', 't', 'u', 'w', 'y', 'ab', '##fu', 'Fa', 'Fac', '##ct', '##ful', '##full', '##fully',
- 'Th', 'ch', '##hm', 'cha', 'chap', 'chapt', '##thm', 'Hu', 'Hug', 'Hugg', 'sh', 'th', 'is', '##thms', '##za', '##zat',
- '##ut']
-```
-
-După cum putem vedea, în comparație cu BPE, acest tokenizator învață părțile din cuvinte ca tokenuri puțin mai repede.
-
-<Tip>
-
-💡 Folosind `train_new_from_iterator()` pe același corpus nu va rezulta exact același vocabular. Acest lucru se datorează faptului că biblioteca 🤗 Tokenizers nu implementează WordPiece pentru antrenare (deoarece nu suntem complet siguri cum funcționează intern), ci utilizează BPE în schimb.
-
-</Tip>
-
-Pentru a tokeniza un text nou, îl pre-tokenizăm, îl împărțim, apoi aplicăm algoritmul de tokenizare pe fiecare cuvânt. Adică, căutăm cel mai mare subcuvânt începând de la începutul primului cuvânt și îl împărțim, apoi repetăm procesul pentru a doua parte și așa mai departe pentru restul acelui cuvânt și pentru următoarele cuvinte din text:
-
-```python
-def encode_word(word):
-    tokens = []
-    while len(word) > 0:
-        i = len(word)
-        while i > 0 and word[:i] not in vocab:
-            i -= 1
-        if i == 0:
-            return ["[UNK]"]
-        tokens.append(word[:i])
-        word = word[i:]
-        if len(word) > 0:
-            word = f"##{word}"
-    return tokens
-```
-
-Haideți să-l testăm pe un cuvânt care se află în vocabular și pe altul care nu se află:
-
-
-```python
-print(encode_word("Hugging"))
-print(encode_word("HOgging"))
-```
-
-```python out
-['Hugg', '##i', '##n', '##g']
-['[UNK]']
-```
-
-Acum, scriem o funcție care tokenizează un text:
-
-```python
-def tokenize(text):
-    pre_tokenize_result = tokenizer._tokenizer.pre_tokenizer.pre_tokenize_str(text)
-    pre_tokenized_text = [word for word, offset in pre_tokenize_result]
-    encoded_words = [encode_word(word) for word in pre_tokenized_text]
-    return sum(encoded_words, [])
-```
-
-Îl putem încerca pe orice text:
-
-```python
-tokenize("This is the Hugging Face course!")
-```
-
-```python out
-['Th', '##i', '##s', 'is', 'th', '##e', 'Hugg', '##i', '##n', '##g', 'Fac', '##e', 'c', '##o', '##u', '##r', '##s',
- '##e', '[UNK]']
-```
-
-Asta e tot pentru algoritmul WordPiece! Acum să aruncăm o privire la Unigram.
diff --git a/chapters/ro/chapter6/7.mdx b/chapters/ro/chapter6/7.mdx
deleted file mode 100644
index 14744a854..000000000
--- a/chapters/ro/chapter6/7.mdx
+++ /dev/null
@@ -1,381 +0,0 @@
-# Tokenizarea Unigram[[unigram-tokenization]]
-
-<CourseFloatingBanner chapter={6}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter6/section7.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter6/section7.ipynb"},
-]} />
-
-Algoritmul Unigram este adesea utilizat în SentencePiece, care este algoritmul de tokenizare utilizat de modele precum AlBERT, T5, mBART, Big Bird și XLNet.
-
-<Youtube id="TGZfZVuF9Yc"/>
-
-<Tip>
-
-💡 Această secțiune acoperă Unigram în profunzime, mergând până la prezentarea unei implementări complete. Puteți sări la sfârșit dacă doriți doar o prezentare generală a algoritmului de tokenizare.
-
-</Tip>
-
-## Algoritm de antrenare[[training-algorithm]]
-
-În comparație cu BPE și WordPiece, Unigram lucrează în cealaltă direcție: pornește de la un vocabular mare și elimină tokeni din acesta până când ajunge la dimensiunea dorită. Există mai multe opțiuni pentru a construi acel vocabular de bază: putem lua, de exemplu, cele mai comune substrings din cuvintele pre-tokenizate sau putem aplica BPE pe corpusul inițial cu o dimensiune mare a vocabularului.
-
-La fiecare etapă a antrenării, algoritmul Unigram calculează o pierdere pe corpus oferit, având în vedere vocabularul curent. Apoi, pentru fiecare simbol din vocabular, algoritmul calculează cu cât ar crește pierderea globală dacă simbolul ar fi eliminat și caută simbolurile care ar crește cel mai puțin pierderea. Aceste simboluri au cel mai redus efect asupra pierderii globale din corpus, deci, într-un fel, sunt "mai puțin necesare" și sunt cei mai buni candidați pentru eliminare.
-
-Aceasta este o operațiune foarte costisitoare, așa că nu eliminăm doar simbolul asociat cu cea mai mică creștere a pierderii, ci procentul \\(p\\) (\\(p\\) fiind un hyperparameter pe care îl poți controla, de obicei 10 sau 20) din simbolurile asociate cu cea mai mică creștere a pierderilor. Acest proces este se repetă până când vocabularul atinge dimensiunea dorită.
-
-Rețineți că nu eliminăm niciodată caracterele de bază, pentru a ne asigura că orice cuvânt poate fi tokenizat.
-
-Acum, acest lucru este încă puțin vag: partea principală a algoritmului este de a calcula o pierdere asupra corpusului și de a vedea cum se schimbă atunci când eliminăm unele tokenuri din vocabular, dar nu am explicat încă cum să facem acest lucru. Acest pas se bazează pe algoritmul de tokenizare al unui model Unigram, așa că îl vom analiza în continuare.
-
-Vom reutiliza corpusul din exemplele anterioare:
-
-```
-("hug", 10), ("pug", 5), ("pun", 12), ("bun", 4), ("hugs", 5)
-```
-
-iar pentru acest exemplu, vom lua toate substringurile stricte pentru vocabularul inițial:
-
-```
-["h", "u", "g", "hu", "ug", "p", "pu", "n", "un", "b", "bu", "s", "hug", "gs", "ugs"]
-```
-
-## Algoritm de tokenizare[[tokenization-algorithm]]
-
-Un model Unigram este un tip de model lingvistic care consideră că fiecare token este independent de tokenii anteriori. Este cel mai simplu model lingvistic, în sensul că probabilitatea simbolului X având în vedere contextul anterior este doar probabilitatea simbolului X. Astfel, dacă am utiliza un model lingvistic Unigram pentru a genera text, am prezice întotdeauna simbolul cel mai frecvent.
-
-Probabilitatea unui token dat este frecvența sa (numărul de ori în care îl găsim) în corpusul original, împărțită la suma tuturor aparițiilor tuturor tokenilor din vocabular (pentru a ne asigura că probabilitățile sunt egale cu 1). De exemplu, `"ug"` este prezent în `"hug"`, `"pug"`, și `"hugs"`, deci are o frecvență de 20 în corpus-ul nostru.
-
-Iată frecvențele tuturor subcuvintelor posibile din vocabular:
-
-```
-("h", 15) ("u", 36) ("g", 20) ("hu", 15) ("ug", 20) ("p", 17) ("pu", 17) ("n", 16)
-("un", 16) ("b", 4) ("bu", 4) ("s", 5) ("hug", 15) ("gs", 5) ("ugs", 5)
-```
-
-Astfel, suma tuturor frecvențelor este 210, iar probabilitatea subcuvântului `"ug"` este 20/210.
-
-<Tip>
-
-✏️ **Acum este rândul tău!** Scrie codul pentru a calcula frecvențele de mai sus și verifică de două ori dacă rezultatele afișate sunt corecte, precum și suma totală.
-
-</Tip>
-
-Acum, pentru a tokeniza un cuvânt dat, ne uităm la toate segmentările posibile în tokeni și calculăm probabilitatea fiecăruia în conformitate cu modelul Unigram. Deoarece toate token-urile sunt considerate independente, această probabilitate este doar produsul probabilității fiecărui token. De exemplu, tokenizarea `["p", "u", "g"]` a lui `"pug"` are probabilitatea:
-
-$$P([``p", ``u", ``g"]) = P(``p") \times P(``u") \times P(``g") = \frac{5}{210} \times \frac{36}{210} \times \frac{20}{210} = 0.000389$$
-
-Comparativ, tokenizarea `["pu", "g"]` are probabilitatea:
-
-$$P([``pu", ``g"]) = P(``pu") \times P(``g") = \frac{5}{210} \times \frac{20}{210} = 0.0022676$$
-
-astfel încât una este mult mai probabilă decât alta. În general, tokenizările cu cei mai puțini tokeni posibili vor avea cea mai mare probabilitate (din cauza acelei împărțiri la 210 repetată pentru fiecare token), ceea ce corespunde cu ceea ce dorim intuitiv: să împărțim un cuvânt în cel mai mic număr de tokenuri posibil.
-
-Tokenizarea unui cuvânt cu modelul Unigram este atunci tokenizarea cu cea mai mare probabilitate. În exemplul `"pug"`, iată probabilitățile pe care le-am obține pentru fiecare segmentare posibilă:
-
-```
-["p", "u", "g"] : 0.000389
-["p", "ug"] : 0.0022676
-["pu", "g"] : 0.0022676
-```
-
-Astfel, `"pug"` ar fi tokenizat ca `["p", "ug"]` sau `["pu", "g"]`, în funcție de care dintre aceste segmentări este întâlnită prima (rețineți că într-un corpus mai mare, cazurile de egalitate ca acesta vor fi rare).
-
-În acest caz, a fost ușor să găsim toate segmentările posibile și să le calculăm probabilitățile, dar în general va fi puțin mai greu. Există un algoritm clasic utilizat pentru acest lucru, numit *algoritmul Viterbi*. În esență, putem construi un grafic pentru a detecta segmentările posibile ale unui cuvânt dat, spunând că există o ramură de la caracterul _a_ la caracterul _b_ dacă subcuvântul de la _a_ la _b_ se află în vocabular, și atribuind ramurii respective probabilitatea subcuvântului.
-
-Pentru a găsi calea din acest grafic care va avea cel mai bun scor, algoritmul Viterbi determină, pentru fiecare poziție din cuvânt, segmentarea cu cel mai bun scor care se termină la poziția respectivă. Deoarece mergem de la început la sfârșit, cel mai bun scor poate fi găsit prin parcurgerea în buclă a tuturor subcuvintelor care se termină la poziția curentă și apoi folosind cel mai bun scor de tokenizare de la poziția la care începe acest subcuvânt. Apoi, trebuie doar să derulăm calea parcursă pentru a ajunge la sfârșit.
-
-Să aruncăm o privire la un exemplu folosind vocabularul nostru și cuvântul `"unhug"`. Pentru fiecare poziție, subcuvintele cu cele mai bune scoruri care se termină acolo sunt următoarele:
-
-```
-Character 0 (u): "u" (score 0.171429)
-Character 1 (n): "un" (score 0.076191)
-Character 2 (h): "un" "h" (score 0.005442)
-Character 3 (u): "un" "hu" (score 0.005442)
-Character 4 (g): "un" "hug" (score 0.005442)
-```
-
-Astfel, `"unhug"` ar fi tokenizat ca `["un", "hug"]`.
-
-<Tip>
-
-✏️ **Acum e rândul tău!** Determinați tokenizarea cuvântului `"huggun"` și scorul acestuia.
-
-</Tip>
-
-## Înapoi la antrenare[[back-to-training]]
-
-Acum că am văzut cum funcționează tokenizarea, putem analiza mai în profunzime pierderea utilizată în timpul antrenării. În orice etapă dată, această pierdere este calculată prin tokenizarea fiecărui cuvânt din corpus, utilizând vocabularul curent și modelul Unigram determinat de frecvențele fiecărui token din corpus (după cum am văzut mai devreme).
-
-Fiecare cuvânt din corpus are un scor, iar pierderea este negative log likelihood a acestor scoruri - adică suma pentru toate cuvintele din corpus a tuturor `-log(P(word))`.
-
-Să ne întoarcem la exemplul nostru cu următorul corpus:
-
-```
-("hug", 10), ("pug", 5), ("pun", 12), ("bun", 4), ("hugs", 5)
-```
-
-Tokenizarea fiecărui cuvânt cu scorurile lor respective este:
-
-```
-"hug": ["hug"] (score 0.071428)
-"pug": ["pu", "g"] (score 0.007710)
-"pun": ["pu", "n"] (score 0.006168)
-"bun": ["bu", "n"] (score 0.001451)
-"hugs": ["hug", "s"] (score 0.001701)
-```
-
-Deci, pierderea este:
-
-```
-10 * (-log(0.071428)) + 5 * (-log(0.007710)) + 12 * (-log(0.006168)) + 4 * (-log(0.001451)) + 5 * (-log(0.001701)) = 169.8
-```
-
-Acum trebuie să calculăm modul în care eliminarea fiecărui token afectează pierderea. Acest lucru este destul de plictisitor, așa că îl vom face doar pentru doi tokeni aici și vom păstra întregul proces pentru atunci când vom avea cod care să ne ajute. În acest caz (foarte) special, aveam două tokenizări echivalente ale tuturor cuvintelor: după cum am văzut mai devreme, de exemplu, `"pug"` ar putea fi tokenizat `["p", "ug"]` cu același scor. Astfel, eliminarea simbolului `"pu"` din vocabular va produce exact aceeași pierdere.
-
-Pe de altă parte, eliminarea lui `"hug"` va agrava pierderea, deoarece tokenizarea lui `"hug"` și `"hugs"` va deveni:
-
-```
-"hug": ["hu", "g"] (score 0.006802)
-"hugs": ["hu", "gs"] (score 0.001701)
-```
-
-Aceste modificări vor determina creșterea pierderii cu:
-
-```
-- 10 * (-log(0.071428)) + 10 * (-log(0.006802)) = 23.5
-```
-
-Prin urmare, tokenul `"pu"` va fi probabil eliminat din vocabular, dar nu și `"hug"`.
-
-## Implementarea Unigram[[implementarea-unigram]]
-
-Acum să implementăm în cod tot ceea ce am văzut până acum. Ca și în cazul BPE și WordPiece, aceasta nu este o implementare eficientă a algoritmului Unigram (dimpotrivă), dar ar trebui să vă ajute să-l înțelegeți puțin mai bine.
-
-Vom folosi ca exemplu același corpus ca și până acum:
-
-```python
-corpus = [
-    "This is the Hugging Face Course.",
-    "This chapter is about tokenization.",
-    "This section shows several tokenizer algorithms.",
-    "Hopefully, you will be able to understand how they are trained and generate tokens.",
-]
-```
-
-De data aceasta, vom folosi `xlnet-base-cased` ca modelul nostru:
-
-```python
-from transformers import AutoTokenizer
-
-tokenizer = AutoTokenizer.from_pretrained("xlnet-base-cased")
-```
-
-Ca și pentru BPE și WordPiece, începem prin a număra numărul de apariții ale fiecărui cuvânt în corpus:
-
-```python
-from collections import defaultdict
-
-word_freqs = defaultdict(int)
-for text in corpus:
-    words_with_offsets = tokenizer.backend_tokenizer.pre_tokenizer.pre_tokenize_str(text)
-    new_words = [word for word, offset in words_with_offsets]
-    for word in new_words:
-        word_freqs[word] += 1
-
-word_freqs
-```
-
-Apoi, trebuie să inițializăm vocabularul nostru la ceva mai mare decât dimensiunea vocabularului pe care o vom dori la final. Trebuie să includem toate caracterele de bază (altfel nu vom putea tokeniza fiecare cuvânt), dar pentru substringurile mai mari le vom păstra doar pe cele mai comune, așa că le vom sorta după frecvență:
-
-```python
-char_freqs = defaultdict(int)
-subwords_freqs = defaultdict(int)
-for word, freq in word_freqs.items():
-    for i in range(len(word)):
-        char_freqs[word[i]] += freq
-        # Loop through the subwords of length at least 2
-        for j in range(i + 2, len(word) + 1):
-            subwords_freqs[word[i:j]] += freq
-
-# Sortarea subcuvintelor după frecvență
-sorted_subwords = sorted(subwords_freqs.items(), key=lambda x: x[1], reverse=True)
-sorted_subwords[:10]
-```
-
-```python out
-[('▁t', 7), ('is', 5), ('er', 5), ('▁a', 5), ('▁to', 4), ('to', 4), ('en', 4), ('▁T', 3), ('▁Th', 3), ('▁Thi', 3)]
-```
-
-Grupăm caracterele cu cele mai bune subcuvinte pentru a ajunge la un vocabular inițial de dimensiunea 300:
-
-```python
-token_freqs = list(char_freqs.items()) + sorted_subwords[: 300 - len(char_freqs)]
-token_freqs = {token: freq for token, freq in token_freqs}
-```
-
-<Tip>
-
-💡 SentencePiece utilizează un algoritm mai eficient numit Enhanced Suffix Array (ESA) pentru a crea vocabularul inițial.
-
-</Tip>
-
-În continuare, calculăm suma tuturor frecvențelor, pentru a converti frecvențele în probabilități. Pentru modelul nostru, vom stoca logaritmii probabilităților, deoarece este mai stabil din punct de vedere numeric să adăugăm logaritmi decât să multiplicăm numere mici, iar acest lucru va simplifica calcularea pierderii modelului:
-
-```python
-from math import log
-
-total_sum = sum([freq for token, freq in token_freqs.items()])
-model = {token: -log(freq / total_sum) for token, freq in token_freqs.items()}
-```
-
-Acum funcția principală este cea care tokenizează cuvintele folosind algoritmul Viterbi. După cum am văzut mai devreme, acest algoritm calculează cea mai bună segmentare a fiecărui substringur din cuvânt, pe care o vom stoca într-o variabilă numită `best_segmentations`. Vom stoca un dicționar pentru fiecare poziție din cuvânt (de la 0 la lungimea totală a acestuia), cu două chei: indicele de început al ultimului token din cea mai bună segmentare și scorul celei mai bune segmentări. Cu ajutorul indicelui de început al ultimului token, vom putea extrage segmentarea completă odată ce lista este complet populată.
-
-Popularea listei se face cu doar două bucle: bucla principală trece peste fiecare poziție de început, iar a doua bucla încearcă toate subcuvintele care încep la acea poziție de început. Dacă substringul se află în vocabular, avem o nouă segmentare a cuvântului până la acea poziție finală, pe care o comparăm cu cea din `best_segmentations`.
-
-Odată ce bucla principală este terminată, pornim de la sfârșit și sărim de la o poziție de început la alta, înregistrând tokenii pe parcurs, până când ajungem la începutul cuvântului:
-
-```python
-def encode_word(word, model):
-    best_segmentations = [{"start": 0, "score": 1}] + [
-        {"start": None, "score": None} for _ in range(len(word))
-    ]
-    for start_idx in range(len(word)):
-        # This should be properly filled by the previous steps of the loop
-        best_score_at_start = best_segmentations[start_idx]["score"]
-        for end_idx in range(start_idx + 1, len(word) + 1):
-            token = word[start_idx:end_idx]
-            if token in model and best_score_at_start is not None:
-                score = model[token] + best_score_at_start
-                # If we have found a better segmentation ending at end_idx, we update
-                if (
-                    best_segmentations[end_idx]["score"] is None
-                    or best_segmentations[end_idx]["score"] > score
-                ):
-                    best_segmentations[end_idx] = {"start": start_idx, "score": score}
-
-    segmentation = best_segmentations[-1]
-    if segmentation["score"] is None:
-        # We did not find a tokenization of the word -> unknown
-        return ["<unk>"], None
-
-    score = segmentation["score"]
-    start = segmentation["start"]
-    end = len(word)
-    tokens = []
-    while start != 0:
-        tokens.insert(0, word[start:end])
-        next_start = best_segmentations[start]["start"]
-        end = start
-        start = next_start
-    tokens.insert(0, word[start:end])
-    return tokens, score
-```
-
-Putem încerca deja modelul nostru inițial pe câteva cuvinte:
-
-```python
-print(encode_word("Hopefully", model))
-print(encode_word("This", model))
-```
-
-```python out
-(['H', 'o', 'p', 'e', 'f', 'u', 'll', 'y'], 41.5157494601402)
-(['This'], 6.288267030694535)
-```
-
-Acum este ușor de calculat pierderea modelului pe corpus!
-
-```python
-def compute_loss(model):
-    loss = 0
-    for word, freq in word_freqs.items():
-        _, word_loss = encode_word(word, model)
-        loss += freq * word_loss
-    return loss
-```
-
-Putem verifica dacă funcționează pe modelul pe care îl avem:
-
-```python
-compute_loss(model)
-```
-
-```python out
-413.10377642940875
-```
-
-Nici calcularea scorurilor pentru fiecare token nu este foarte dificilă; trebuie doar să calculăm pierderea pentru modelele obținute prin ștergerea fiecărui tokeb:
-
-```python
-import copy
-
-
-def compute_scores(model):
-    scores = {}
-    model_loss = compute_loss(model)
-    for token, score in model.items():
-        # We always keep tokens of length 1
-        if len(token) == 1:
-            continue
-        model_without_token = copy.deepcopy(model)
-        _ = model_without_token.pop(token)
-        scores[token] = compute_loss(model_without_token) - model_loss
-    return scores
-```
-
-Îl putem încerca pe un token dat:
-
-```python
-scores = compute_scores(model)
-print(scores["ll"])
-print(scores["his"])
-```
-
-Deoarece `"ll"` este folosit în tokenizarea lui `"Hopefully"`, iar eliminarea lui ne va face, probabil, să folosim tokenul `"l"` de două ori în schimb, ne așteptăm să aibă o pierdere pozitivă. `"his"` este folosit doar în interiorul cuvântului `"This"`, care este tokenizat ca el însuși, deci ne așteptăm să aibă o pierdere zero. Iată rezultatele:
-
-```python out
-6.376412403623874
-0.0
-```
-
-<Tip>
-
-💡 Această abordare este foarte ineficientă, astfel încât SentencePiece utilizează o aproximare a pierderii modelului fără simbolul X: în loc să înceapă de la zero, înlocuiește simbolul X cu segmentarea sa în vocabularul rămas. În acest fel, toate scorurile pot fi calculate odată, în același timp cu pierderea modelului.
-
-</Tip>
-
-Cu toate acestea la locul lor, ultimul lucru pe care trebuie să îl facem este să adăugăm la vocabular tokeni speciali utilizate de model, apoi să facem o buclă până când am eliminat suficienți tokeni din vocabular pentru a ajunge la dimensiunea dorită:
-
-```python
-percent_to_remove = 0.1
-while len(model) > 100:
-    scores = compute_scores(model)
-    sorted_scores = sorted(scores.items(), key=lambda x: x[1])
-    # Remove percent_to_remove tokens with the lowest scores.
-    for i in range(int(len(model) * percent_to_remove)):
-        _ = token_freqs.pop(sorted_scores[i][0])
-
-    total_sum = sum([freq for token, freq in token_freqs.items()])
-    model = {token: -log(freq / total_sum) for token, freq in token_freqs.items()}
-```
-
-Apoi, pentru a tokeniza un text, trebuie doar să aplicăm pre-tokenizarea și apoi să folosim funcția `encode_word()`:
-
-```python
-def tokenize(text, model):
-    words_with_offsets = tokenizer.backend_tokenizer.pre_tokenizer.pre_tokenize_str(text)
-    pre_tokenized_text = [word for word, offset in words_with_offsets]
-    encoded_words = [encode_word(word, model)[0] for word in pre_tokenized_text]
-    return sum(encoded_words, [])
-
-
-tokenize("This is the Hugging Face course.", model)
-```
-
-```python out
-['▁This', '▁is', '▁the', '▁Hugging', '▁Face', '▁', 'c', 'ou', 'r', 's', 'e', '.']
-```
-
-Asta e tot pentru Unigram! Sperăm că până acum vă simțiți ca un expert în toate lucrurile legate de tokenizer. În secțiunea următoare, vom aprofunda elementele de bază ale bibliotecii 🤗 Tokenizers și vă vom arăta cum le puteți utiliza pentru a vă construi propriul tokenizer.
diff --git a/chapters/ro/chapter6/8.mdx b/chapters/ro/chapter6/8.mdx
deleted file mode 100644
index 4e41c84cb..000000000
--- a/chapters/ro/chapter6/8.mdx
+++ /dev/null
@@ -1,566 +0,0 @@
-# Construirea unui tokenizer, bloc cu bloc[[building-a-tokenizer-block-by-block]]
-
-<CourseFloatingBanner chapter={6}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter6/section8.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter6/section8.ipynb"},
-]} />
-
-După cum am văzut în secțiunile anterioare, tokenizarea cuprinde mai multe etape:
-
-- Normalizare (orice curățare a textului care este considerată necesară, cum ar fi eliminarea spațiilor sau a accentelor, normalizarea Unicode etc.)
-- Pre-tokenizarea (împărțirea inputului în cuvinte)
-- Rularea inputului prin model (utilizarea cuvintelor pre-tokenizate pentru a produce o secvență de tokeni)
-- Post-procesare (adăugarea tokenilor speciali ale tokenizerului, generarea attention maskului și a ID-urilor de tip token)
-
-Ca un reminder, iată o altă perspectivă asupra procesului general:
-
-<div class="flex justify-center">
-<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter6/tokenization_pipeline.svg" alt="The tokenization pipeline.">
-<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter6/tokenization_pipeline-dark.svg" alt="The tokenization pipeline.">
-</div>
-
-Biblioteca 🤗 Tokenizers a fost construită pentru a oferi mai multe opțiuni pentru fiecare dintre acești pași, pe care le puteți amesteca și combina împreună. În această secțiune vom vedea cum putem construi un tokenizer de la zero, spre deosebire de antrenarea unui tokenizer nou dintr-unul vechi, așa cum am făcut în [secțiunea 2](/course/chapter6/2). Veți putea apoi să construiți orice fel de tokenizer la care vă puteți gândi!
-
-<Youtube id="MR8tZm5ViWU"/>
-
-Mai exact, biblioteca este construită în jurul unei clase centrale `Tokenizer` cu building grupate în submodule:
-
-- `normalizers` conține toate tipurile posibile de `Normalizer` pe care le puteți folosi (lista completă [aici](https://huggingface.co/docs/tokenizers/api/normalizers)).
-- `pre_tokenizers` coține toate tipurile de `PreTokenizer` pe care le poți folosi(lista completă [aici](https://huggingface.co/docs/tokenizers/api/pre-tokenizers)).
-- `models` conține diferitele tipuri de `Model` pe care le puteți folosi, precum `BPE`, `WordPiece` și `Unigram` (lista completă [aici](https://huggingface.co/docs/tokenizers/api/models)).
-- `trainers` conține toate tipurile diferite de `Trainer` pe care le puteți folosi pentru a vă antrena modelul pe un corpus (unul pentru fiecare tip de model; lista completă [aici](https://huggingface.co/docs/tokenizers/api/trainers)).
-- `post_processors` conține diferitele tipuri de `PostProcessor` pe care le puteți utiliza (lista completă [aici](https://huggingface.co/docs/tokenizers/api/post-processors)).
-- `decoders` conține diferitele tipuri de `Decoder` pe care le puteți utiliza pentru a decoda rezultatele tokenizării (lista completă [aici](https://huggingface.co/docs/tokenizers/components#decoders)).
-
-Puteți găsi întreaga listă de blocuri [aici](https://huggingface.co/docs/tokenizers/components).
-
-## Obținerea unui corpus[[acquiring-a-corpus]]
-
-Pentru a antrena noul nostru tokenizer, vom utiliza un corpus mic de text (astfel încât exemplele să ruleze rapid). Pașii pentru obținerea corpusului sunt similari cu cei pe care i-am urmat la [începutul acestui capitol](/course/chapter6/2), dar de data aceasta vom utiliza datasetul [WikiText-2](https://huggingface.co/datasets/wikitext):
-
-```python
-from datasets import load_dataset
-
-dataset = load_dataset("wikitext", name="wikitext-2-raw-v1", split="train")
-
-
-def get_training_corpus():
-    for i in range(0, len(dataset), 1000):
-        yield dataset[i : i + 1000]["text"]
-```
-
-Funcția `get_training_corpus()` este un generator care va produce batch-uri de 1 000 de texte, pe care le vom utiliza pentru a antrena tokenizerul.
-
-🤗 Tokenizers pot fi, de asemenea, antrenate direct pe fișiere text. Iată cum putem genera un fișier text care să conțină toate textele/inputurile din WikiText-2 pe care le putem utiliza local:
-
-```python
-with open("wikitext-2.txt", "w", encoding="utf-8") as f:
-    for i in range(len(dataset)):
-        f.write(dataset[i]["text"] + "\n")
-```
-
-În continuare vă vom arăta cum să vă construiți propriile tokenizere BERT, GPT-2 și XLNet, bloc cu bloc. Acest lucru ne va oferi un exemplu pentru fiecare dintre cei trei algoritmi principali de tokenizare: WordPiece, BPE și Unigram. Să începem cu BERT!
-
-## Construirea unui tokenizator WordPiece de la zero[[building-a-wordpiece-tokenizer-from-scratch]]
-
-Pentru a construi un tokenizer cu biblioteca 🤗 Tokenizers, începem prin a inițializa un obiect `Tokenizer` cu un `model`, apoi îi setăm atributele `normalizer`, `pre_tokenizer`, `post_processor` și `decoder` la valorile dorite.
-
-Pentru acest exemplu, vom crea un `Tokenizer` cu un model WordPiece:
-
-```python
-from tokenizers import (
-    decoders,
-    models,
-    normalizers,
-    pre_tokenizers,
-    processors,
-    trainers,
-    Tokenizer,
-)
-
-tokenizer = Tokenizer(models.WordPiece(unk_token="[UNK]"))
-```
-
-Trebuie să specificăm `unk_token` astfel încât modelul să știe ce să returneze atunci când întâlnește caractere necunoscute. Alte argumente pe care le putem seta aici includ `vocab` al modelului nostru (vom antrena modelul, deci nu este nevoie să setăm acest lucru) și `max_input_chars_per_word`, care specifică o lungime maximă pentru fiecare cuvânt (cuvintele mai lungi decât valoarea trecută vor fi divizate).
-
-Primul pas al tokenizării este normalizarea, așa că să începem cu aceasta. Deoarece BERT este utilizat pe scară largă, există un `BertNormalizer` cu opțiunile clasice pe care le putem seta pentru BERT: `lowercase` și `strip_accents`, care se explică de la sine; `clean_text` pentru a elimina toate caracterele de control și a înlocui spațiile repetate cu unul singur; și `handle_chinese_chars`, care plasează spații în jurul caracterelor chinezești. Pentru a replica tokenizerul `bert-base-uncased`, putem seta doar acest normalizator:
-
-```python
-tokenizer.normalizer = normalizers.BertNormalizer(lowercase=True)
-```
-
-În general, atunci când construiți un nou tokenizer, nu veți avea acces la un normalizator atât de util, deja implementat în biblioteca 🤗 Tokenizers - așa că să vedem cum să creăm manual normalizatorul BERT. Biblioteca oferă un normalizator `Lowercase` și un normalizator `StripAccents` și puteți compune mai multe normalizatoare folosind un `Sequence`:
-
-```python
-tokenizer.normalizer = normalizers.Sequence(
-    [normalizers.NFD(), normalizers.Lowercase(), normalizers.StripAccents()]
-)
-```
-
-De asemenea, folosim un normalizator Unicode `NFD`, deoarece în caz contrar normalizatorul `StripAccents` nu va recunoaște corect caracterele accentuate și astfel nu le va elimina.
-
-După cum am mai văzut, putem folosi metoda `normalize_str()` a `normalizer` pentru a verifica efectele pe care le are asupra unui text dat:
-
-```python
-print(tokenizer.normalizer.normalize_str("Héllò hôw are ü?"))
-```
-
-```python out
-hello how are u?
-```
-
-<Tip>
-
-**Pentru a merge mai departe** Dacă testați cele două versiuni ale normalizatorilor anteriori pe un șir care conține caracterul Unicode `u"\u0085"` veți observa cu siguranță că acești doi normalizatori nu sunt exact echivalenți.
-Pentru a nu complica prea mult versiunea cu `normalizers.Sequence` , nu am inclus înlocuirile Regex pe care `BertNormalizer` le cere atunci când argumentul `clean_text` este setat la `True` - care este comportamentul implicit. Dar nu vă faceți griji: este posibil să obțineți exact aceeași normalizare fără a utiliza utilul `BertNormalizer` prin adăugarea a două `normalizers.Replace` la secvența normalizers.
-
-
-</Tip>
-
-Urmează etapa de pre-tokenizare. Din nou, există un `BertPreTokenizer` pre-construit pe care îl putem utiliza:
-
-```python
-tokenizer.pre_tokenizer = pre_tokenizers.BertPreTokenizer()
-```
-
-Sau îl putem construi de la zero:
-
-```python
-tokenizer.pre_tokenizer = pre_tokenizers.Whitespace()
-```
-
-Rețineți că pre-tokenizatorul `Whitespace` separă spațiul și toate caracterele care nu sunt litere, cifre sau caracterul underscore, deci tehnic separă spațiul și punctuația:
-
-```python
-tokenizer.pre_tokenizer.pre_tokenize_str("Let's test my pre-tokenizer.")
-```
-
-```python out
-[('Let', (0, 3)), ("'", (3, 4)), ('s', (4, 5)), ('test', (6, 10)), ('my', (11, 13)), ('pre', (14, 17)),
- ('-', (17, 18)), ('tokenizer', (18, 27)), ('.', (27, 28))]
-```
-
-Dacă doriți să separați doar spațiile, ar trebui să utilizați în schimb pre-tokenizerul `WhitespaceSplit`:
-
-```python
-pre_tokenizer = pre_tokenizers.WhitespaceSplit()
-pre_tokenizer.pre_tokenize_str("Let's test my pre-tokenizer.")
-```
-
-```python out
-[("Let's", (0, 5)), ('test', (6, 10)), ('my', (11, 13)), ('pre-tokenizer.', (14, 28))]
-```
-
-Ca și în cazul normalizatorilor, puteți utiliza un `Sequence` pentru a compune mai mulți pre-tokenizeri:
-
-```python
-pre_tokenizer = pre_tokenizers.Sequence(
-    [pre_tokenizers.WhitespaceSplit(), pre_tokenizers.Punctuation()]
-)
-pre_tokenizer.pre_tokenize_str("Let's test my pre-tokenizer.")
-```
-
-```python out
-[('Let', (0, 3)), ("'", (3, 4)), ('s', (4, 5)), ('test', (6, 10)), ('my', (11, 13)), ('pre', (14, 17)),
- ('-', (17, 18)), ('tokenizer', (18, 27)), ('.', (27, 28))]
-```
-
-Următorul pas în pipelineul de tokenizare este rularea inputurilor prin model. Am specificat deja modelul nostru în inițializare, dar mai trebuie să îl antrenăm, ceea ce va necesita un `WordPieceTrainer`. Principalul lucru de reținut atunci când inițializați un trainer în 🤗 Tokenizers este că trebuie să îi transmiteți toți tokenii speciali pe care intenționați să îi utilizați - în caz contrar, acesta nu le va adăuga la vocabular, deoarece acestea nu se află în corpusul de antrenare:
-
-```python
-special_tokens = ["[UNK]", "[PAD]", "[CLS]", "[SEP]", "[MASK]"]
-trainer = trainers.WordPieceTrainer(vocab_size=25000, special_tokens=special_tokens)
-```
-
-Pe lângă specificarea `vocab_size` și `special_tokens`, putem seta `min_frequency` (numărul de ori în care un simbol trebuie să apară pentru a fi inclus în vocabular) sau putem schimba `continuing_subword_prefix` (dacă dorim să folosim ceva diferit de `##`).
-
-Pentru a antrena modelul nostru folosind iteratorul pe care l-am definit anterior, trebuie doar să executăm această comandă:
-
-```python
-tokenizer.train_from_iterator(get_training_corpus(), trainer=trainer)
-```
-
-De asemenea, putem utiliza fișiere text pentru a ne antrena tokenizerul, care ar arăta astfel (în prealabil, reinițializăm modelul cu un `WordPiece` gol):
-
-```python
-tokenizer.model = models.WordPiece(unk_token="[UNK]")
-tokenizer.train(["wikitext-2.txt"], trainer=trainer)
-```
-
-În ambele cazuri, putem apoi testa tokenizerul pe un text prin apelarea metodei `encode()`:
-
-```python
-encoding = tokenizer.encode("Let's test this tokenizer.")
-print(encoding.tokens)
-```
-
-```python out
-['let', "'", 's', 'test', 'this', 'tok', '##eni', '##zer', '.']
-```
-
-`encoding`-ul obținut este un `Encoding`, care conține toate rezultatele necesare ale tokenizerului în diferitele sale atribute: `ids`, `type_ids`, `tokens`, `offsets`, `attention_mask`, `special_tokens_mask`, și `overflowing`.
-
-Ultimul pas în pipelineul de tokenizare este postprocesarea. Trebuie să adăugăm tokenul `[CLS]` la început și tokenul `[SEP]` la sfârșit (sau după fiecare propoziție, dacă avem o pereche de propoziții). Vom folosi un `TemplateProcessor` pentru aceasta, dar mai întâi trebuie să cunoaștem ID-urile tokenilor `[CLS]` și `[SEP]` din vocabular:
-
-```python
-cls_token_id = tokenizer.token_to_id("[CLS]")
-sep_token_id = tokenizer.token_to_id("[SEP]")
-print(cls_token_id, sep_token_id)
-```
-
-```python out
-(2, 3)
-```
-
-Pentru a scrie templateul pentru `TemplateProcessor`, trebuie să specificăm cum să tratăm o singură propoziție și o pereche de propoziții. Pentru ambele, scriem tokeni speciali pe care dorim să îi folosim; prima (sau singura) propoziție este reprezentată de `$A`, în timp ce a doua propoziție (dacă facem encoding unei perechi) este reprezentată de `$B`. Pentru fiecare dintre acestea (tokeni speciali și propoziții), specificăm și ID-ul tipului de token corespunzător după două puncte.
-
-Modelul clasic BERT este astfel definit după cum urmează:
-
-```python
-tokenizer.post_processor = processors.TemplateProcessing(
-    single=f"[CLS]:0 $A:0 [SEP]:0",
-    pair=f"[CLS]:0 $A:0 [SEP]:0 $B:1 [SEP]:1",
-    special_tokens=[("[CLS]", cls_token_id), ("[SEP]", sep_token_id)],
-)
-```
-
-Rețineți că trebuie să transmitem ID-urile tokenilor speciali, astfel încât tokenizerul să le poată converti corect în ID-urile lor.
-
-Odată ce acest lucru este adăugat, revenind la exemplul nostru anterior vom obține:
-
-```python
-encoding = tokenizer.encode("Let's test this tokenizer.")
-print(encoding.tokens)
-```
-
-```python out
-['[CLS]', 'let', "'", 's', 'test', 'this', 'tok', '##eni', '##zer', '.', '[SEP]']
-```
-
-Și pe o pereche de propoziții, obținem rezultatul corect:
-
-```python
-encoding = tokenizer.encode("Let's test this tokenizer...", "on a pair of sentences.")
-print(encoding.tokens)
-print(encoding.type_ids)
-```
-
-```python out
-['[CLS]', 'let', "'", 's', 'test', 'this', 'tok', '##eni', '##zer', '...', '[SEP]', 'on', 'a', 'pair', 'of', 'sentences', '.', '[SEP]']
-[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1]
-```
-
-Aproape am terminat de construit acest tokenizer de la zero - ultimul pas este să includem un decodor:
-
-```python
-tokenizer.decoder = decoders.WordPiece(prefix="##")
-```
-
-Haideți să-l testăm pe `encoding`-ul nostru anterior:
-
-```python
-tokenizer.decode(encoding.ids)
-```
-
-```python out
-"let's test this tokenizer... on a pair of sentences."
-```
-
-Grozav! Putem salva tokenizatorul nostru într-un singur fișier JSON, astfel:
-
-```python
-tokenizer.save("tokenizer.json")
-```
-
-Apoi putem reîncărca acel fișier într-un obiect `Tokenizer` cu metoda `from_file()`:
-
-```python
-new_tokenizer = Tokenizer.from_file("tokenizer.json")
-```
-
-Pentru a utiliza acest tokenizer în 🤗 Transformers, trebuie să îl încorporăm în `PreTrainedTokenizerFast`. Putem fie să folosim clasa generică, fie, dacă tokenizerul nostru corespunde unui model existent, să folosim clasa respectivă (aici, `BertTokenizerFast`). Dacă aplicați această lecție pentru a construi un tokenizer nou, va trebui să utilizați prima opțiune.
-
-Pentru a include tokenizatorul într-un `PreTrainedTokenizerFast`, putem fie să transmitem tokenizerul construit ca `tokenizer_object`, fie să transmitem fișierul tokenizerului salvat ca `tokenizer_file`. Cel mai important lucru de reținut este că trebuie să setăm manual toți tokenii speciali, deoarece această clasă nu poate deduce din obiectul `tokenizer` care tokne este tokenul mască, tokenul `[CLS]`, etc.:
-
-```python
-from transformers import PreTrainedTokenizerFast
-
-wrapped_tokenizer = PreTrainedTokenizerFast(
-    tokenizer_object=tokenizer,
-    # tokenizer_file="tokenizer.json", # You can load from the tokenizer file, alternatively
-    unk_token="[UNK]",
-    pad_token="[PAD]",
-    cls_token="[CLS]",
-    sep_token="[SEP]",
-    mask_token="[MASK]",
-)
-```
-
-Dacă utilizați o clasă specifică de tokenizer (cum ar fi `BertTokenizerFast`), va trebui să specificați doar tokenii speciali care sunt diferiți de cei impliciți (aici, niciunul):
-
-```python
-from transformers import BertTokenizerFast
-
-wrapped_tokenizer = BertTokenizerFast(tokenizer_object=tokenizer)
-```
-
-Apoi puteți utiliza acest tokenizer ca orice alt tokenizer 🤗 Transformers. Îl puteți salva cu metoda `save_pretrained()` sau îl puteți încărca în Hub cu metoda `push_to_hub()`.
-
-Acum că am văzut cum să construim un tokenizer WordPiece, hai să facem același lucru pentru un tokenizer BPE. Vom merge un pic mai repede, deoarece cunoașteți toți pașii, și vom evidenția doar diferențele.
-
-## Construirea unui tokenizer BPE de la zero[[building-a-bpe-tokenizer-from-scratch]]
-
-Să construim acum un tokenizer GPT-2. Ca și pentru tokenizer BERT, începem prin inițializarea unui `Tokenizer` cu un model BPE:
-
-```python
-tokenizer = Tokenizer(models.BPE())
-```
-
-De asemenea, la fel ca în cazul BERT, am putea inițializa acest model cu un vocabular, dacă am avea unul (în acest caz, ar trebui să oferim `vocab` și `merges`), dar din moment ce vom antrena de la zero, nu avem nevoie să facem acest lucru. De asemenea, nu trebuie să specificăm un `unk_token` deoarece GPT-2 utilizează BPE la nivel de bytes, care nu necesită acest lucru.
-
-GPT-2 nu utilizează un normalizator, deci sărim peste acest pas și trecem direct la pre-tokenizare:
-
-```python
-tokenizer.pre_tokenizer = pre_tokenizers.ByteLevel(add_prefix_space=False)
-```
-
-Opțiunea pe care am adăugat-o aici la `ByteLevel` nu este pentru a adăuga un spațiu unei propoziții (care este implicit în caz contrar). Putem arunca o privire la pre-tokenizarea unui text exemplu ca înainte:
-
-```python
-tokenizer.pre_tokenizer.pre_tokenize_str("Let's test pre-tokenization!")
-```
-
-```python out
-[('Let', (0, 3)), ("'s", (3, 5)), ('Ġtest', (5, 10)), ('Ġpre', (10, 14)), ('-', (14, 15)),
- ('tokenization', (15, 27)), ('!', (27, 28))]
-```
-
-Urmează modelul, care are nevoie de antrenare. Pentru GPT-2, singurul token special este tokenul de sfârșit de text:
-
-```python
-trainer = trainers.BpeTrainer(vocab_size=25000, special_tokens=["<|endoftext|>"])
-tokenizer.train_from_iterator(get_training_corpus(), trainer=trainer)
-```
-
-Ca și în cazul `WordPieceTrainer`, precum și `vocab_size` și `special_tokens`, putem specifica `min_frequency` dacă dorim, sau dacă avem un sufix de sfârșit de cuvânt (cum ar fi `</w>`), îl putem seta cu `end_of_word_suffix`.
-
-Acest tokenizer poate fi antrenat și pe fișiere text:
-
-```python
-tokenizer.model = models.BPE()
-tokenizer.train(["wikitext-2.txt"], trainer=trainer)
-```
-
-Să aruncăm o privire la tokenizarea unui exemplu de text:
-
-```python
-encoding = tokenizer.encode("Let's test this tokenizer.")
-print(encoding.tokens)
-```
-
-```python out
-['L', 'et', "'", 's', 'Ġtest', 'Ġthis', 'Ġto', 'ken', 'izer', '.']
-```
-
-Aplicăm postprocesarea la nivel de bytes pentru tokenizerul GPT-2 după cum urmează:
-
-```python
-tokenizer.post_processor = processors.ByteLevel(trim_offsets=False)
-```
-
-Opțiunea `trim_offsets = False` indică post-procesorului că ar trebui să lăsăm offseturile tokenilor care încep cu "Ġ" așa cum sunt: în acest fel, începutul offseturilor va indica spațiul dinaintea cuvântului, nu primul caracter al cuvântului (deoarece spațiul face parte din punct de vedere tehnic din token). Să aruncăm o privire asupra rezultatului cu textul pe căruia tocmai i-am făcut encoding, unde `'Ġtest'` este tokenul de la indexul 4:
-
-```python
-sentence = "Let's test this tokenizer."
-encoding = tokenizer.encode(sentence)
-start, end = encoding.offsets[4]
-sentence[start:end]
-```
-
-```python out
-' test'
-```
-
-În cele din urmă, adăugăm un decoder la nivel de bytes:
-
-```python
-tokenizer.decoder = decoders.ByteLevel()
-```
-
-și putem verifica de două ori dacă funcționează corect:
-
-```python
-tokenizer.decode(encoding.ids)
-```
-
-```python out
-"Let's test this tokenizer."
-```
-
-Grozav! Acum că am terminat, putem salva tokenizatorul ca înainte și îl putem încorpora într-un `PreTrainedTokenizerFast` sau `GPT2TokenizerFast` dacă dorim să îl folosim în 🤗 Transformers:
-
-```python
-from transformers import PreTrainedTokenizerFast
-
-wrapped_tokenizer = PreTrainedTokenizerFast(
-    tokenizer_object=tokenizer,
-    bos_token="<|endoftext|>",
-    eos_token="<|endoftext|>",
-)
-```
-
-or:
-
-```python
-from transformers import GPT2TokenizerFast
-
-wrapped_tokenizer = GPT2TokenizerFast(tokenizer_object=tokenizer)
-```
-
-Ca un ultim exemplu, vă vom arăta cum să construiți un tokenizer Unigram de la zero.
-
-## Construirea unui tokenizer Unigram de la zero[[building-a-unigram-tokenizer-from-scratch]]
-
-Să construim acum un tokenizer XLNet. Ca și în cazul tokenizerelor anterioare, începem prin inițializarea unui `Tokenizer` cu un model Unigram:
-
-```python
-tokenizer = Tokenizer(models.Unigram())
-```
-
-Din nou, am putea inițializa acest model cu un vocabular, dacă am avea unul.
-
-Pentru normalizare, XLNet utilizează câteva înlocuiri (care provin din SentencePiece):
-
-```python
-from tokenizers import Regex
-
-tokenizer.normalizer = normalizers.Sequence(
-    [
-        normalizers.Replace("``", '"'),
-        normalizers.Replace("''", '"'),
-        normalizers.NFKD(),
-        normalizers.StripAccents(),
-        normalizers.Replace(Regex(" {2,}"), " "),
-    ]
-)
-```
-
-Acest lucru înlocuitește <code>``</code> și <code>''</code> cu <code>"</code> și orice secvență de două sau mai multe spații cu un singur spațiu, precum și ștergerea accentelor în textele ce trebuie tokenizate.
-
-Pre-tokenizerul care trebuie utilizat pentru orice tokenizer SentencePiece este `Metaspace`:
-
-```python
-tokenizer.pre_tokenizer = pre_tokenizers.Metaspace()
-```
-
-Putem arunca o privire la pre-tokenizarea unui exemplu de text ca mai înainte:
-
-```python
-tokenizer.pre_tokenizer.pre_tokenize_str("Let's test the pre-tokenizer!")
-```
-
-```python out
-[("▁Let's", (0, 5)), ('▁test', (5, 10)), ('▁the', (10, 14)), ('▁pre-tokenizer!', (14, 29))]
-```
-
-Urmează modelul, care are nevoie de antrenare. XLNet are destul de mulți tokeni speciali:
-
-```python
-special_tokens = ["<cls>", "<sep>", "<unk>", "<pad>", "<mask>", "<s>", "</s>"]
-trainer = trainers.UnigramTrainer(
-    vocab_size=25000, special_tokens=special_tokens, unk_token="<unk>"
-)
-tokenizer.train_from_iterator(get_training_corpus(), trainer=trainer)
-```
-
-Un argument foarte important care nu trebuie uitat pentru `UnigramTrainer` este `unk_token`. Putem trece și alte argumente specifice algoritmului Unigram, cum ar fi `shrinking_factor` pentru fiecare pas în care eliminăm tokeni (valoarea implicită este 0,75) sau `max_piece_length` pentru a specifica lungimea maximă a unui token dat (valoarea implicită este 16).
-
-Acest tokenizer poate fi antrenat și pe fișiere text:
-
-```python
-tokenizer.model = models.Unigram()
-tokenizer.train(["wikitext-2.txt"], trainer=trainer)
-```
-
-Să aruncăm o privire la tokenizarea unui exemplu de text:
-
-```python
-encoding = tokenizer.encode("Let's test this tokenizer.")
-print(encoding.tokens)
-```
-
-```python out
-['▁Let', "'", 's', '▁test', '▁this', '▁to', 'ken', 'izer', '.']
-```
-
-O particularitate a XLNet este că pune tokenul `<cls>` la sfârșitul propoziției, cu un ID de tip 2 (pentru a-l distinge de ceilalți tokeni). Ca urmare, este făcut padding la stânga. Putem trata toți tokenii speciali și ID-urile de tip ale tokenilor cu un template, ca în cazul BERT, dar mai întâi trebuie să obținem ID-urile tokenilor `<cls>` și `<sep>`:
-
-```python
-cls_token_id = tokenizer.token_to_id("<cls>")
-sep_token_id = tokenizer.token_to_id("<sep>")
-print(cls_token_id, sep_token_id)
-```
-
-```python out
-0 1
-```
-
-Templateul arată astfel:
-
-```python
-tokenizer.post_processor = processors.TemplateProcessing(
-    single="$A:0 <sep>:0 <cls>:2",
-    pair="$A:0 <sep>:0 $B:1 <sep>:1 <cls>:2",
-    special_tokens=[("<sep>", sep_token_id), ("<cls>", cls_token_id)],
-)
-```
-
-Și putem testa că funcționează prin codificarea unei perechi de propoziții:
-
-```python
-encoding = tokenizer.encode("Let's test this tokenizer...", "on a pair of sentences!")
-print(encoding.tokens)
-print(encoding.type_ids)
-```
-
-```python out
-['▁Let', "'", 's', '▁test', '▁this', '▁to', 'ken', 'izer', '.', '.', '.', '<sep>', '▁', 'on', '▁', 'a', '▁pair', 
-  '▁of', '▁sentence', 's', '!', '<sep>', '<cls>']
-[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2]
-```
-
-În cele din urmă, adăugăm un decoder `Metaspace`:
-
-```python
-tokenizer.decoder = decoders.Metaspace()
-```
-
-și am terminat cu acest tokenizer! Putem salva tokenizerul ca înainte și îl putem încorpora într-un `PreTrainedTokenizerFast` sau `XLNetTokenizerFast` dacă dorim să îl folosim în 🤗 Transformers. Un lucru de reținut atunci când se utilizează `PreTrainedTokenizerFast` este că, pe lângă tokenii speciali, trebuie să spunem bibliotecii 🤗 Transformers să facă padding la stânga:
-
-```python
-from transformers import PreTrainedTokenizerFast
-
-wrapped_tokenizer = PreTrainedTokenizerFast(
-    tokenizer_object=tokenizer,
-    bos_token="<s>",
-    eos_token="</s>",
-    unk_token="<unk>",
-    pad_token="<pad>",
-    cls_token="<cls>",
-    sep_token="<sep>",
-    mask_token="<mask>",
-    padding_side="left",
-)
-```
-
-Sau alternativ:
-
-```python
-from transformers import XLNetTokenizerFast
-
-wrapped_tokenizer = XLNetTokenizerFast(tokenizer_object=tokenizer)
-```
-
-Acum că ați văzut cum sunt utilizate diferitele blocuri de construcție pentru a construi tokenizeri existenți, ar trebui să puteți scrie orice tokenizer doriți cu biblioteca 🤗 Tokenizers și să îl puteți utiliza în 🤗 Transformers.
diff --git a/chapters/ro/chapter6/9.mdx b/chapters/ro/chapter6/9.mdx
deleted file mode 100644
index 8fc71f8ea..000000000
--- a/chapters/ro/chapter6/9.mdx
+++ /dev/null
@@ -1,16 +0,0 @@
-# Tokenizers, verificați![[tokenizers-check]]
-
-<CourseFloatingBanner
-    chapter={6}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-Bună treabă la finalizarea acestui capitol!
-
-După această scufundare adâncă în tokenizers, ar trebui să:
-
-- Să fii capabil să antrenezi un nou tokenizer folosind unul vechi ca model
-- Să înțelegi modului de utilizare a offseturilor pentru a face map tokenilor în intervalul lor original de text
-- Cunoști diferențele dintre BPE, WordPiece și Unigram
-- Fii capabil să combini blocurile furnizate de biblioteca 🤗 Tokenizers pentru a vă construi propriul tokenizer
-- Să poți folosi acest tokenizer în cadrul bibliotecii 🤗 Transformers
diff --git a/chapters/ro/chapter7/1.mdx b/chapters/ro/chapter7/1.mdx
deleted file mode 100644
index 82f8c9611..000000000
--- a/chapters/ro/chapter7/1.mdx
+++ /dev/null
@@ -1,38 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Introduction[[introduction]]
-
-<CourseFloatingBanner
-    chapter={7}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-În [Capitolul 3](/course/chapter3), ați văzut cum să faceți fine-tune unui model pentru clasificarea textului. În acest capitol, vom aborda următoarele sarcini NLP:
-
-- Clasificarea tokenilor
-- Masked language modeling (precum BERT)
-- Sumarizare
-- Traducere
-- Preantrenare pentru causal language modeling (precum GPT-2)
-- Răspunderea la întrebări
-
-{#if fw === 'pt'}
-
-Pentru a face acest lucru, va trebui să valorificați tot ceea ce ați învățat despre API-ul `Trainer` și biblioteca 🤗 Accelerate în [Capitolul 3](/course/chapter3), biblioteca 🤗 Datasets în [Capitolul 5](/course/chapter5) și biblioteca 🤗 Tokenizers în [Capitolul 6](/course/chapter6). De asemenea, vom încărca rezultatele noastre în Model Hub, așa cum am făcut în [Capitolul 4](/course/chapter4), astfel încât acesta este cu adevărat capitolul în care totul se unește!
-
-Fiecare secțiune poate fi citită independent și vă va arăta cum să antrenați un model cu API-ul `Trainer` sau cu propria buclă de antrenament, utilizând 🤗 Accelerate. Nu ezitați să săriți peste oricare dintre cele două părți și să vă concentrați pe cea care vă interesează cel mai mult: API-ul `Trainer` este excelent pentru fine-tuning sau antrenarea modelului vostru fără a vă face griji cu privire la ceea ce se întâmplă în spatele scenei, în timp ce bucla de antrenament cu `Accelerate` vă va permite să personalizați mai ușor orice parte doriți.
-
-{:else}
-
-Pentru a face acest lucru, va trebui să valorificați tot ceea ce ați învățat despre API-ul `Trainer` și biblioteca 🤗 Accelerate în [Capitolul 3](/course/chapter3), biblioteca 🤗 Datasets în [Capitolul 5](/course/chapter5) și biblioteca 🤗 Tokenizers în [Capitolul 6](/course/chapter6). De asemenea, vom încărca rezultatele noastre în Model Hub, așa cum am făcut în [Capitolul 4](/course/chapter4), astfel încât acesta este cu adevărat capitolul în care totul se unește!
-
-Fiecare secțiune poate fi citită independent.
-
-{/if}
-
-
-<Tip>
-
-Dacă citiți secțiunile în succesiune, veți observa că acestea au destul de mult cod și proză în comun. Repetarea este intenționată, pentru a vă permite să intrați (sau să reveniți mai târziu) la orice sarcină care vă interesează și să găsiți un exemplu.
-
-</Tip>
diff --git a/chapters/ro/chapter7/2.mdx b/chapters/ro/chapter7/2.mdx
deleted file mode 100644
index 108806a81..000000000
--- a/chapters/ro/chapter7/2.mdx
+++ /dev/null
@@ -1,983 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Clasificarea tokenilor[[token-classification]]
-
-{#if fw === 'pt'}
-
-<CourseFloatingBanner chapter={7}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter7/section2_pt.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter7/section2_pt.ipynb"},
-]} />
-
-{:else}
-
-<CourseFloatingBanner chapter={7}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter7/section2_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter7/section2_tf.ipynb"},
-]} />
-
-{/if}
-
-Prima aplicație pe care o vom explora este clasificarea tokenilor. Această sarcină generică cuprinde orice problemă care poate fi formulată ca "atribuirea unui label fiecărui token dintr-o propoziție", cum ar fi:
-
-- **Named entity recognition(NER)**: Găsirea entităților (cum ar fi persoane, locații sau organizații) într-o propoziție. Acest lucru poate fi formulat ca atribuirea unui label fiecărui token, având o clasă pentru fiecare entitate și o clasă pentru "nicio entitate".
-- **Part-of-speech tagging (POS)**: Marchează fiecare cuvânt dintr-o propoziție ca corespunzând unei anumite părți de vorbire (cum ar fi substantiv, verb, adjectiv etc.).
-- **Chunking**: Găsirea tokenilor care aparțin aceleiași entități. Această sarcină (care poate fi combinată cu POS sau NER) poate fi formulată ca atribuirea unui label (de obicei `B-`) tuturor tokenilor care se află la începutul unui chunk, a unui alt label (de obicei `I-`) la tokeni care se află în interiorul unui chunk și a unui al treilea label (de obicei `O`) la tokeni care nu aparțin niciunui chunk.
-
-<Youtube id="wVHdVlPScxA"/>
-
-Desigur, există multe alte tipuri de probleme de clasificare a tokenilor; acestea sunt doar câteva exemple reprezentative. În această secțiune, vom pune la punct un model (BERT) pe o sarcină NER, care va fi apoi capabil să calculeze predicții precum aceasta:
-
-<iframe src="https://course-demos-bert-finetuned-ner.hf.space" frameBorder="0" height="350" title="Gradio app" class="block dark:hidden container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
-
-<a class="flex justify-center" href="/huggingface-course/bert-finetuned-ner">
-<img class="block dark:hidden lg:w-3/5" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/model-eval-bert-finetuned-ner.png" alt="One-hot encoding labels pentru răspunderea la întrebări."/>
-<img class="hidden dark:block lg:w-3/5" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/model-eval-bert-finetuned-ner-dark.png" alt="One-hot encoded labels pentru răspunderea la întrebări."/>
-</a>
-
-Puteți găsi modelul pe care îl vom antrena și încărca în Hub și puteți verifica de două ori predicțiile sale [aici](https://huggingface.co/huggingface-course/bert-finetuned-ner?text=My+name+is+Sylvain+and+I+work+at+Hugging+Face+in+Brooklyn).
-
-## Pregătirea datelor[[preparing-the-data]]
-
-În primul rând, avem nevoie de un dataset adecvat pentru clasificarea simbolurilor. În această secțiune vom utiliza [datasetul CoNLL-2003] (https://huggingface.co/datasets/conll2003), care conține știri de la Reuters.
-
-<Tip>
-
-💡 Atât timp cât datasetul vostru constă în texte împărțite în cuvinte cu labelurile corespunzătoare, veți putea adapta procedurile de preprocesare a datelor descrise aici la propriul dataset. Consultați [Capitolul 5](/course/chapter5) dacă aveți nevoie de o recapitulare a modului de încărcare a propriilor date personalizate într-un `Dataset`.
-
-</Tip>
-
-### Datasetul CoNLL-2003 [[the-conll-2003-dataset]]
-
-Pentru a încărca dataetul CoNLL-2003, folosim metoda `load_dataset()` din biblioteca 🤗 Datasets:
-
-```py
-from datasets import load_dataset
-
-raw_datasets = load_dataset("conll2003")
-```
-
-Acest lucru va descărca și va stoca în cache datasetul, așa cum am văzut în [Capitolul 3](/course/chapter3) pentru setul de date GLUE MRPC. Inspectarea acestui obiect ne arată coloanele prezente și împărțirea între seturile de antrenare, validare și testare:
-
-```py
-raw_datasets
-```
-
-```python out
-DatasetDict({
-    train: Dataset({
-        features: ['chunk_tags', 'id', 'ner_tags', 'pos_tags', 'tokens'],
-        num_rows: 14041
-    })
-    validation: Dataset({
-        features: ['chunk_tags', 'id', 'ner_tags', 'pos_tags', 'tokens'],
-        num_rows: 3250
-    })
-    test: Dataset({
-        features: ['chunk_tags', 'id', 'ner_tags', 'pos_tags', 'tokens'],
-        num_rows: 3453
-    })
-})
-```
-
-În special, putem vedea că datasetul conține labeluri pentru cele trei sarcini pe care le-am menționat mai devreme: NER, POS și Chunking. O mare diferență față de alte datseturi este că textele de intrare nu sunt prezentate ca propoziții sau documente, ci ca liste de cuvinte (ultima coloană se numește `tokens`, dar conține cuvinte în sensul că acestea sunt inputuri pre-tokenizate care mai trebuie să treacă prin tokenizer pentru tokenizarea subcuvintelor).
-
-Să aruncăm o privire la primul element al setului de formare:
-
-```py
-raw_datasets["train"][0]["tokens"]
-```
-
-```python out
-['EU', 'rejects', 'German', 'call', 'to', 'boycott', 'British', 'lamb', '.']
-```
-
-Deoarece dorim să efectuăm named entity recognition, ne vom uita la etichetele NER:
-
-```py
-raw_datasets["train"][0]["ner_tags"]
-```
-
-```python out
-[3, 0, 7, 0, 0, 0, 7, 0, 0]
-```
-
-Acestea sunt labelurile ca numere întregi pregătite pentru antrenare, dar nu sunt neapărat utile atunci când dorim să inspectăm datele. La fel ca în cazul clasificării textului, putem accesa corespondența dintre aceste numere întregi și numele labelurilor consultând atributul `features` al datasetului nostru:
-
-```py
-ner_feature = raw_datasets["train"].features["ner_tags"]
-ner_feature
-```
-
-```python out
-Sequence(feature=ClassLabel(num_classes=9, names=['O', 'B-PER', 'I-PER', 'B-ORG', 'I-ORG', 'B-LOC', 'I-LOC', 'B-MISC', 'I-MISC'], names_file=None, id=None), length=-1, id=None)
-```
-
-Deci, această coloană conține elemente care sunt secvențe a `ClassLabel`. Tipul elementelor din secvență se află în atributul `feature` al acestei `ner_feature`, iar noi putem accesa lista de nume consultând atributul `names` al acelei `feature`:
-
-```py
-label_names = ner_feature.feature.names
-label_names
-```
-
-```python out
-['O', 'B-PER', 'I-PER', 'B-ORG', 'I-ORG', 'B-LOC', 'I-LOC', 'B-MISC', 'I-MISC']
-```
-
-Am văzut deja aceste labeluri atunci când am cercetat pipelineul `token-classification` în [Capitolul 6](/course/chapter6/3), dar pentru o reîmprospătare rapidă:
-
-- `O` înseamnă că cuvântul nu corespunde niciunei entități.
-- `B-PER`/`I-PER` înseamnă că cuvântul corespunde începutului/este în interiorul unei entități de tip *persoană*.
-- `B-ORG`/`I-ORG` înseamnă că cuvântul corespunde începutului/este în interiorul unei entități de tip *organizaționale*.
-- `B-LOC`/`I-LOC` înseamnă că cuvântul corespunde începutului/este în interiorul unei entități de tip  *locație*.
-- `B-MISC`/`I-MISC` înseamnă că cuvântul corespunde începutului/este în interiorul unei entități de tip *miscellaneous.
-
-Acum, decodificarea labelurilor pe care le-am văzut mai devreme ne dă următorul rezultat:
-
-```python
-words = raw_datasets["train"][0]["tokens"]
-labels = raw_datasets["train"][0]["ner_tags"]
-line1 = ""
-line2 = ""
-for word, label in zip(words, labels):
-    full_label = label_names[label]
-    max_length = max(len(word), len(full_label))
-    line1 += word + " " * (max_length - len(word) + 1)
-    line2 += full_label + " " * (max_length - len(full_label) + 1)
-
-print(line1)
-print(line2)
-```
-
-```python out
-'EU    rejects German call to boycott British lamb .'
-'B-ORG O       B-MISC O    O  O       B-MISC  O    O'
-```
-
-Și pentru un exemplu de amestecare a labelurilor `B-` și `I-`, iată ce ne oferă același cod pentru elementul din setul de antrenare de la indexul 4:
-
-```python out
-'Germany \'s representative to the European Union \'s veterinary committee Werner Zwingmann said on Wednesday consumers should buy sheepmeat from countries other than Britain until the scientific advice was clearer .'
-'B-LOC   O  O              O  O   B-ORG    I-ORG O  O          O         B-PER  I-PER     O    O  O         O         O      O   O         O    O         O     O    B-LOC   O     O   O          O      O   O       O'
-```
-
-După cum putem vedea, entităților care cuprind două cuvinte, precum "Uniunea Europeană" și "Werner Zwingmann", li se atribuie un label `B-` pentru primul cuvânt și un label `I-` pentru al doilea.
-
-<Tip>
-
-✏️ **E rândul tău!** Afișați aceleași două propoziții cu labelurile POS sau chunking.
-
-</Tip>
-
-### Procesarea datelor[[processing-the-data]]
-
-<Youtube id="iY2AZYdZAr0"/>
-
-Ca de obicei, textele noastre trebuie să fie convertite în ID-uri token înainte ca modelul să le poată înțelege. După cum am văzut în [Capitolul 6](/course/chapter6/), o mare diferență în cazul sarcinilor de clasificare a tokenilor este că avem inputuri pre-tokenizate. Din fericire, API-ul tokenizerului poate face față acestei situații destul de ușor; trebuie doar să avertizăm `tokenizerul` cu un indicator special.
-
-Pentru început, hai să creăm obiectul `tokenizer`. După cum am mai spus, vom utiliza un model BERT preantrenat, deci vom începe prin a descărca și a stoca în cache tokenizerul asociat:
-
-```python
-from transformers import AutoTokenizer
-
-model_checkpoint = "bert-base-cased"
-tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
-```
-
-Puteți înlocui `model_checkpoint` cu orice alt model preferat din [Hub](https://huggingface.co/models) sau cu un folder local în care ați salvat un model preantreant și un tokenizer. Singura constrângere este că tokenizerul trebuie să fie susținut de biblioteca 🤗 Tokenizers, pentru ca să existe o versiune "rapidă" disponibilă. Puteți vedea toate arhitecturile care vin cu o versiune rapidă în [acest tabel mare] (https://huggingface.co/transformers/#supported-frameworks), iar pentru a verifica dacă obiectul `tokenizer` pe care îl utilizați este într-adevăr susținut de 🤗 Tokenizers, vă puteți uita la atributul său `is_fast`:
-
-```py
-tokenizer.is_fast
-```
-
-```python out
-True
-```
-
-Pentru a tokeniza un input pre-tokenizat, putem utiliza `tokenizer` ca de obicei și să adăugăm `is_split_into_words=True`:
-
-```py
-inputs = tokenizer(raw_datasets["train"][0]["tokens"], is_split_into_words=True)
-inputs.tokens()
-```
-
-```python out
-['[CLS]', 'EU', 'rejects', 'German', 'call', 'to', 'boycott', 'British', 'la', '##mb', '.', '[SEP]']
-```
-
-După cum putem vedea, tokenizerul a adăugat tokenii speciali utilizați de model (`[CLS]` la început și `[SEP]` la sfârșit) și a lăsat majoritatea cuvintelor neatinse. Cu toate acestea, cuvântul `lamb` a fost tokenizat în două subcuvinte, `la` și `##mb`. Acest lucru introduce o neconcordanță între inputurile noastre și labeluri: lista de labeluri are doar 9 elemente, în timp ce inputurile noastre au acum 12 tokeni. Să luăm în considerare tokenii speciali este ușor (știm că sunt la început și la sfârșit), dar trebuie să ne asigurăm că aliniem toate labelurile cu cuvintele corespunzătoare.
-
-Din fericire, pentru că folosim un tokenizer rapid, avem acces la superputerile 🤗 Tokenizers, ceea ce înseamnă că putem mapa cu ușurință fiecare token la cuvântul corespunzător (după cum se vede în [Capitolul 6](/course/chapter6/3)):
-
-```py
-inputs.word_ids()
-```
-
-```python out
-[None, 0, 1, 2, 3, 4, 5, 6, 7, 7, 8, None]
-```
-
-Cu puțină muncă, putem apoi extinde lista de labeluri pentru a se potrivi cu tokenii. Prima regulă pe care o vom aplica este că tokenii special primesc un label `-100`. Acest lucru se datorează faptului că în mod implicit `-100` este un indice care este ignorat în funcția de pierdere pe care o vom utiliza (cross entropy). Apoi, fiecare token primește același label ca și tokenul care a inițiat cuvântul în care se află, deoarece fac parte din aceeași entitate. Pentru tokenii din interiorul unui cuvânt, dar care nu se află la început, înlocuim `B-` cu `I-` (deoarece tokenul nu începe entitatea):
-
-
-```python
-def align_labels_with_tokens(labels, word_ids):
-    new_labels = []
-    current_word = None
-    for word_id in word_ids:
-        if word_id != current_word:
-            # Start of a new word!
-            current_word = word_id
-            label = -100 if word_id is None else labels[word_id]
-            new_labels.append(label)
-        elif word_id is None:
-            # Special token
-            new_labels.append(-100)
-        else:
-            # Same word as previous token
-            label = labels[word_id]
-            # If the label is B-XXX we change it to I-XXX
-            if label % 2 == 1:
-                label += 1
-            new_labels.append(label)
-
-    return new_labels
-```
-
-Hai să îl încercăm cu prima noastră propoziție:
-
-```py
-labels = raw_datasets["train"][0]["ner_tags"]
-word_ids = inputs.word_ids()
-print(labels)
-print(align_labels_with_tokens(labels, word_ids))
-```
-
-```python out
-[3, 0, 7, 0, 0, 0, 7, 0, 0]
-[-100, 3, 0, 7, 0, 0, 0, 7, 0, 0, 0, -100]
-```
-
-După cum putem vedea, funcția noastră a adăugat `-100` pentru cei doi tokeni speciali de la început și de la sfârșit, și un nou `0` pentru cuvântul nostru care a fost împărțit în doi tokeni.
-
-<Tip>
-
-✏️ ** Rândul tău!** Unii cercetători preferă să atribuie un singur label pe cuvânt și să atribuie `-100` celorlalți subtokeni dintr-un cuvânt dat. Aceasta are loc pentru a evita ca cuvintele lungi care se împart în mai mulți subtokeni să contribuie puternic la pierdere. Modificați funcția anterioară pentru a alinia labelurile cu ID-urile de input urmând această regulă.
-
-</Tip>
-
-Pentru a preprocesa întregul nostru dataset, trebuie să tokenizăm toate inputurile și să aplicăm `align_labels_with_tokens()` pe toate labelurile. Pentru a profita de viteza tokenizerului nostru rapid, este mai bine să tokenizăm multe texte în același timp, așa că vom scrie o funcție care procesează o listă de exemple și vom folosi metoda `Dataset.map()` cu opțiunea `batched=True`. Singurul lucru diferit față de exemplul nostru anterior este că funcția `word_ids()` trebuie să obțină indexul exemplului din care dorim ID-urile cuvintelor atunci când inputurile către tokenizer sunt liste de texte (sau, în cazul nostru, liste de liste de cuvinte), așa că adăugăm și acest lucru:
-
-```py
-def tokenize_and_align_labels(examples):
-    tokenized_inputs = tokenizer(
-        examples["tokens"], truncation=True, is_split_into_words=True
-    )
-    all_labels = examples["ner_tags"]
-    new_labels = []
-    for i, labels in enumerate(all_labels):
-        word_ids = tokenized_inputs.word_ids(i)
-        new_labels.append(align_labels_with_tokens(labels, word_ids))
-
-    tokenized_inputs["labels"] = new_labels
-    return tokenized_inputs
-```
-
-Rețineți că nu am completat încă inputurile; vom face acest lucru mai târziu, atunci când vom crea batchurile cu un data collator.
-
-Acum putem aplica toate aceste preprocesări dintr-o dată celorlalte fracțiuni ale datasetului nostru:
-
-```py
-tokenized_datasets = raw_datasets.map(
-    tokenize_and_align_labels,
-    batched=True,
-    remove_columns=raw_datasets["train"].column_names,
-)
-```
-
-Am făcut partea cea mai grea! Acum, că datele au fost preprocesate, antrenarea efectivă va semăna mult cu ceea ce am făcut în [Capitolul 3](/course/chapter3).
-
-{#if fw === 'pt'}
-
-## Fine-tuningul modelului cu `Trainer` API[[fine-tuning-the-model-with-the-trainer-api]]
-
-Codul real care utilizează `Trainer` va fi același ca înainte; singurele modificări sunt modul în care datele sunt collated într-un batch și metric computation function.
-
-{:else}
-
-## Fine-tuningul modelului cu Keras[[fine-tuning-the-model-with-keras]]
-
-Codul real care utilizează `Keras` va fi același ca înainte; singurele modificări sunt modul în care datele sunt collated într-un batch și metric computation function.
-
-{/if}
-
-
-### Data collation[[data-collation]]
-
-Nu putem folosi doar un `DataCollatorWithPadding` ca în [Capitolul 3](/course/chapter3) deoarece acesta doar adaugă padding inputurilor(input IDs, attention mask, and token type IDs). Aici labelurile noastre ar trebui să fie padded exact în același mod ca și inputurile, astfel încât să rămână de aceeași dimensiune, folosind `-100` ca valoare, astfel încât predicțiile corespunzătoare să fie ignorate în calculul pierderilor.
-
-Toate acestea sunt realizate de un [`DataCollatorForTokenClassification`](https://huggingface.co/transformers/main_classes/data_collator.html#datacollatorfortokenclassification). La fel ca `DataCollatorWithPadding`, acesta ia `tokenizer`-ul folosit pentru preprocesarea inputurilor:
-
-{#if fw === 'pt'}
-
-```py
-from transformers import DataCollatorForTokenClassification
-
-data_collator = DataCollatorForTokenClassification(tokenizer=tokenizer)
-```
-
-{:else}
-
-```py
-from transformers import DataCollatorForTokenClassification
-
-data_collator = DataCollatorForTokenClassification(
-    tokenizer=tokenizer, return_tensors="tf"
-)
-```
-
-{/if}
-
-Pentru a testa acest lucru pe câteva sampleuri, îl putem apela doar pe o listă de exemple din setul nostru de antrenat tokenizat:
-
-```py
-batch = data_collator([tokenized_datasets["train"][i] for i in range(2)])
-batch["labels"]
-```
-
-```python out
-tensor([[-100,    3,    0,    7,    0,    0,    0,    7,    0,    0,    0, -100],
-        [-100,    1,    2, -100, -100, -100, -100, -100, -100, -100, -100, -100]])
-```
-
-Hai să comparăm acest lucru cu labelurile pentru primul și al doilea element din datasetul nostru:
-
-```py
-for i in range(2):
-    print(tokenized_datasets["train"][i]["labels"])
-```
-
-```python out
-[-100, 3, 0, 7, 0, 0, 0, 7, 0, 0, 0, -100]
-[-100, 1, 2, -100]
-```
-
-{#if fw === 'pt'}
-
-După cum se poate observa, al doilea set de labeluri a fost padded la lungimea primului folosind `-100`.
-
-{:else}
-
-Data collatorul nostru de date este gata de utilizare! Acum să îl folosim pentru a crea un `tf.data.Dataset` cu metoda `to_tf_dataset()`. De asemenea, puteți utiliza `model.prepare_tf_dataset()` pentru a face acest lucru cu un pic mai puțin cod repetitiv - veți vedea acest lucru în unele dintre celelalte secțiuni ale acestui capitol.
-
-```py
-tf_train_dataset = tokenized_datasets["train"].to_tf_dataset(
-    columns=["attention_mask", "input_ids", "labels", "token_type_ids"],
-    collate_fn=data_collator,
-    shuffle=True,
-    batch_size=16,
-)
-
-tf_eval_dataset = tokenized_datasets["validation"].to_tf_dataset(
-    columns=["attention_mask", "input_ids", "labels", "token_type_ids"],
-    collate_fn=data_collator,
-    shuffle=False,
-    batch_size=16,
-)
-```
-
-
-Următoarea oprire: modelul în sine.
-
-{/if}
-
-{#if fw === 'tf'}
-
-### Definirea modelului[[defining-the-model]]
-
-Deoarece lucrăm la o problemă de clasificare a tokenilor, vom utiliza clasa `TFAutoModelForTokenClassification`. Principalul lucru de care trebuie să ne amintim atunci când definim acest model este să transmitem informații privind numărul de labeluri pe care le avem. Cel mai simplu mod de a face acest lucru este să transmiteți acest număr cu argumentul `num_labels`, dar dacă dorim un inference widget frumos care să funcționeze ca cel pe care l-am văzut la începutul acestei secțiuni, este mai bine să setați în schimb corespondențele corecte ale labelurilor.
-
-Acestea ar trebui să fie stabilite de două dicționare, `id2label` și `label2id`, care conțin corespondența de la ID la label și viceversa:
-
-```py
-id2label = {i: label for i, label in enumerate(label_names)}
-label2id = {v: k for k, v in id2label.items()}
-``` 
-
-Acum putem să le transmitem metodei `TFAutoModelForTokenClassification.from_pretrained()`, iar acestea vor fi setate în configurația modelului, apoi salvate corespunzător și încărcate în Hub:
-
-```py
-from transformers import TFAutoModelForTokenClassification
-
-model = TFAutoModelForTokenClassification.from_pretrained(
-    model_checkpoint,
-    id2label=id2label,
-    label2id=label2id,
-)
-```
-
-La fel ca atunci când am definit `TFAutoModelForSequenceClassification` în [Capitolul 3](/course/chapter3), crearea modelului emite un avertisment că unele weights nu au fost utilizate (cele din headul de preantrenare) și că alte weights sunt inițializate aleatoriu (cele din headul de clasificare a tokenilor noi) și că acest model ar trebui să fie antrenat. Vom face acest lucru într-un minut, dar mai întâi să verificăm de două ori că modelul nostru are numărul corect de labeluri:
-
-```python
-model.config.num_labels
-```
-
-```python out
-9
-```
-
-<Tip warning={true}>
-
-⚠️ Dacă aveți un model cu un număr greșit de labeluri, veți primi o eroare obscură atunci când apelați `model.fit()` mai târziu. Acest lucru poate fi enervant pentru debbuging, așa că asigurați-vă că faceți această verificare pentru a confirma că aveți numărul așteptat de labeluri.
-
-</Tip>
-
-### Fine-tuningul modelului[[fine-tuning-the-model]]
-
-Acum suntem gata să ne antrenăm modelul! Totuși, mai avem doar câteva lucruri de făcut mai întâi: ar trebui să ne conectăm la Hugging Face și să definim hiperparametrii noștri de antrenare. Dacă lucrați într-un notebook, există o funcție convenabilă pentru a vă ajuta cu acest lucru:
-
-```python
-from huggingface_hub import notebook_login
-
-notebook_login()
-```
-
-Aceasta va afișa un widget în care puteți introduce datele tale de autentificare Hugging Face.
-
-Dacă nu lucrați într-un notebook, tastați următoarea linie în terminal:
-
-```bash
-huggingface-cli login
-```
-
-După autentificare, putem pregăti tot ce avem nevoie pentru a compila modelul nostru. 🤗 Transformers oferă o funcție convenabilă `create_optimizer()` care vă va oferi un optimizator `AdamW` cu setări adecvate pentru weight decay și learning rate decay, ambele îmbunătățind performanța modelului vsotru în comparație cu optimizatorul `Adam` încorporat:
-
-```python
-from transformers import create_optimizer
-import tensorflow as tf
-
-# Antrenarea în mixed-precision float16
-# Comentați această linie dacă utilizați un GPU care nu va beneficia de acest lucru
-tf.keras.mixed_precision.set_global_policy("mixed_float16")
-
-# Numărul de etape de antrenare este numărul de sampleuri din dataset, împărțit la dimensiunea batch-ului, apoi multiplicat
-# cu numărul total de epoci. Rețineți că tf_train_dataset de aici este un batched tf.data.Dataset,
-# nu este originalul Hugging Face Dataset, deci len() este deja num_samples // batch_size.
-num_epochs = 3
-num_train_steps = len(tf_train_dataset) * num_epochs
-
-optimizer, schedule = create_optimizer(
-    init_lr=2e-5,
-    num_warmup_steps=0,
-    num_train_steps=num_train_steps,
-    weight_decay_rate=0.01,
-)
-model.compile(optimizer=optimizer)
-```
-
-Rețineți, de asemenea, că nu furnizăm un argument `loss` la `compile()`. Acest lucru se datorează faptului că modelele pot calcula de fapt pierderea intern - dacă compilați fără o pierdere și furnizați labelurile în dicționarul de intrare (așa cum facem în dataseturile noastre), atunci modelul se va antrena folosind acea pierdere internă, care va fi adecvată pentru sarcina și tipul de model pe care le-ați ales.
-
-În continuare, definim un `PushToHubCallback` pentru a încărca modelul nostru în Hub în timpul antrenării și pentru a potrivi modelul cu acel callback:
-
-```python
-from transformers.keras_callbacks import PushToHubCallback
-
-callback = PushToHubCallback(output_dir="bert-finetuned-ner", tokenizer=tokenizer)
-
-model.fit(
-    tf_train_dataset,
-    validation_data=tf_eval_dataset,
-    callbacks=[callback],
-    epochs=num_epochs,
-)
-```
-
-Puteți specifica numele complet al repositoriului către care doriți să efectuați push cu argumentul `hub_model_id` (în special, va trebui să utilizați acest argument pentru a efectua push către o organizație). De exemplu, atunci când am trimis modelul către organizația [`huggingface-course`](https://huggingface.co/huggingface-course), am adăugat `hub_model_id="huggingface-course/bert-finetuned-ner"`. În mod implicit, repositoriul utilizat va fi în namespace-ul denumit după directory output pe care l-ați stabilit, de exemplu `"cool_huggingface_user/bert-finetuned-ner"`.
-
-<Tip>
-
-💡 Dacă directory output pe care îl utilizați există deja, acesta trebuie să fie o clonă locală a repositoriului către care doriți să faceți push. Dacă nu este, veți primi o eroare atunci când apelați `model.fit()` și va trebui să setați un nume nou.
-
-</Tip>
-
-Rețineți că, în timpul antrenamentului, de fiecare dată când modelul este salvat (aici, la fiecare epocă), acesta este încărcat pe Hub în fundal. În acest fel, veți putea să reluați formarea pe o altă mașină, dacă este necesar.
-
-În acest stadiu, puteți utiliza inference widget de pe Model Hub pentru a testa modelul vostru și pentru a-l partaja cu prietenii. Ați făcut fine-tune cu succes unui model pentru o sarcină de clasificare a tokenilor - felicitări! Dar cât de bun este modelul nostru, de fapt? Ar trebui să evaluăm anumiți parametri pentru a afla.
-
-{/if}
-
-
-### Metrici[[metrics]]
-
-{#if fw === 'pt'}
-
-Pentru ca `Trainer` să calculeze o metrică în fiecare epocă, va trebui să definim o funcție `compute_metrics()` care primește matricele de predicții și labelurile și returnează un dicționar cu numele și valorile metricilor.
-
-Frameworkul tradițional utilizat pentru a evalua predicția clasificării a tokenilor este [*seqeval*](https://github.com/chakki-works/seqeval). Pentru a utiliza această metrică, trebuie mai întâi să instalăm biblioteca *seqeval*:
-
-```py
-!pip install seqeval
-```
-
-Apoi îl putem încărca prin intermediul funcției `evaluate.load()` așa cum am făcut în [Capitolul 3](/course/chapter3):
-
-{:else}
-
-Frameworkul tradițional utilizat pentru a evalua predicția clasificării tokenilor este [*seqeval*](https://github.com/chakki-works/seqeval). Pentru a utiliza această metrică, trebuie mai întâi să instalăm biblioteca *seqeval*:
-
-```py
-!pip install seqeval
-```
-
-Apoi îl putem încărca prin intermediul funcției `evaluate.load()` așa cum am făcut în [Capitolul 3](/course/chapter3):
-
-{/if}
-
-```py
-import evaluate
-
-metric = evaluate.load("seqeval")
-```
-
-Această metrică nu se comportă ca precizia standard: de fapt, va lua listele de labeluri ca șiruri de caractere, nu ca numere întregi, deci va trebui să decodificăm complet predicțiile și labelurile înainte de a le trece în metrice. Să vedem cum funcționează. În primul rând, vom obține labelurile pentru primul nostru exemplu de antrenare:
-
-```py
-labels = raw_datasets["train"][0]["ner_tags"]
-labels = [label_names[i] for i in labels]
-labels
-```
-
-```python out
-['B-ORG', 'O', 'B-MISC', 'O', 'O', 'O', 'B-MISC', 'O', 'O']
-```
-
-Putem apoi crea predicții false pentru acestea prin simpla schimbare a valorii la indexul 2:
-
-```py
-predictions = labels.copy()
-predictions[2] = "O"
-metric.compute(predictions=[predictions], references=[labels])
-```
-
-Rețineți că metrica ia o listă de predicții (nu doar una) și o listă de labels. Iată rezultatul:
-
-```python out
-{'MISC': {'precision': 1.0, 'recall': 0.5, 'f1': 0.67, 'number': 2},
- 'ORG': {'precision': 1.0, 'recall': 1.0, 'f1': 1.0, 'number': 1},
- 'overall_precision': 1.0,
- 'overall_recall': 0.67,
- 'overall_f1': 0.8,
- 'overall_accuracy': 0.89}
-```
-
-{#if fw === 'pt'}
-
-Acesta trimite înapoi o mulțime de informații! Noi obținem precizia, recallul și scorul F1 pentru fiecare entitate în parte, precum și scorul general. Pentru calculul nostru metric, vom păstra doar scorul global, dar nu ezitați să modificați funcția `compute_metrics()` pentru a returna toate metricile pe care doriți să le raportați.
-
-Această funcție `compute_metrics()` ia mai întâi argmaxul logiturilor pentru a le converti în predicții (ca de obicei, logiturile și probabilitățile sunt în aceeași ordine, deci nu trebuie să aplicăm softmaxul). Apoi trebuie să convertim atât labelurile, cât și predicțiile din numere întregi în șiruri de caractere. Eliminăm toate valorile în care labelul este `-100`, apoi transmitem rezultatele metodei `metric.compute()`:
-
-```py
-import numpy as np
-
-
-def compute_metrics(eval_preds):
-    logits, labels = eval_preds
-    predictions = np.argmax(logits, axis=-1)
-
-    # Remove ignored index (special tokens) and convert to labels
-    true_labels = [[label_names[l] for l in label if l != -100] for label in labels]
-    true_predictions = [
-        [label_names[p] for (p, l) in zip(prediction, label) if l != -100]
-        for prediction, label in zip(predictions, labels)
-    ]
-    all_metrics = metric.compute(predictions=true_predictions, references=true_labels)
-    return {
-        "precision": all_metrics["overall_precision"],
-        "recall": all_metrics["overall_recall"],
-        "f1": all_metrics["overall_f1"],
-        "accuracy": all_metrics["overall_accuracy"],
-    }
-```
-
-Acum că acest lucru este făcut, suntem aproape gata să definim `Trainer`-ul nostru. Avem nevoie doar de un `model` pentru a face fine-tune!
-
-{:else}
-
-Aceasta trimite înapoi o mulțime de informații! Obținem precizia, recallul și scorul F1 pentru fiecare entitate în parte, precum și în ansamblu. Acum să vedem ce se întâmplă dacă încercăm să folosim predicțiile modelului nostru real pentru a calcula niște scoruri reale.
-
-TensorFlow nu apreciază concatenarea predicțiilor noastre, deoarece acestea au lungimi de secvențe variabile. Aceasta înseamnă că nu putem folosi pur și simplu `model.predict()` - dar asta nu ne va opri. Vom obține unele predicții pe rând și le vom concatena într-o singură listă mare și lungă, eliminând simbolurile `-100` care indică mascarea/paddingul, apoi vom calcula metrici pe lista de la sfârșit:
-
-```py
-import numpy as np
-
-all_predictions = []
-all_labels = []
-for batch in tf_eval_dataset:
-    logits = model.predict_on_batch(batch)["logits"]
-    labels = batch["labels"]
-    predictions = np.argmax(logits, axis=-1)
-    for prediction, label in zip(predictions, labels):
-        for predicted_idx, label_idx in zip(prediction, label):
-            if label_idx == -100:
-                continue
-            all_predictions.append(label_names[predicted_idx])
-            all_labels.append(label_names[label_idx])
-metric.compute(predictions=[all_predictions], references=[all_labels])
-```
-
-
-```python out
-{'LOC': {'precision': 0.91, 'recall': 0.92, 'f1': 0.91, 'number': 1668},
- 'MISC': {'precision': 0.70, 'recall': 0.79, 'f1': 0.74, 'number': 702},
- 'ORG': {'precision': 0.85, 'recall': 0.90, 'f1': 0.88, 'number': 1661},
- 'PER': {'precision': 0.95, 'recall': 0.95, 'f1': 0.95, 'number': 1617},
- 'overall_precision': 0.87,
- 'overall_recall': 0.91,
- 'overall_f1': 0.89,
- 'overall_accuracy': 0.97}
-```
-
-Cum s-a descurcat modelul tău, comparativ cu al nostru? Dacă ați obținut cifre similare, antrenarea a fost un succes!
-
-{/if}
-
-{#if fw === 'pt'}
-
-### Definirea modelului[[defining-the-model]]
-
-Deoarece lucrăm la o problemă de clasificare a tokenilor, vom utiliza clasa `AutoModelForTokenClassification`. Principalul lucru de care trebuie să ne amintim atunci când definim acest model este să transmitem informații privind numărul de labeluri pe care le avem. Cel mai simplu mod de a face acest lucru este să transmiteți acest număr cu argumentul `num_labels`, dar dacă dorim un inferencea widget frumos care să funcționeze ca cel pe care l-am văzut la începutul acestei secțiuni, este mai bine să setați în schimb corespondențele corecte ale labelurilor.
-
-Acestea ar trebui să fie stabilite de două dicționare, `id2label` și `label2id`, care conțin corespondențele de la ID la labeluri și viceversa:
-
-```py
-id2label = {i: label for i, label in enumerate(label_names)}
-label2id = {v: k for k, v in id2label.items()}
-```
-
-Acum putem doar să le transmitem metodei `AutoModelForTokenClassification.from_pretrained()`, iar acestea vor fi setate în configurația modelului și apoi salvate și încărcate corespunzător în Hub:
-
-```py
-from transformers import AutoModelForTokenClassification
-
-model = AutoModelForTokenClassification.from_pretrained(
-    model_checkpoint,
-    id2label=id2label,
-    label2id=label2id,
-)
-```
-
-La fel ca atunci când am definit `AutoModelForSequenceClassification` în [Capitolul 3](/course/chapter3), crearea modelului emite un avertisment că unele weights nu au fost utilizate (cele din headul de antrenare) și alte weights sunt inițializate aleatoriu (cele din headul de clasificare a tokenilor noi) și că acest model ar trebui să fie format. Vom face acest lucru într-un minut, dar mai întâi să verificăm de două ori că modelul nostru are numărul corect de labeluri:
-
-```python
-model.config.num_labels
-```
-
-```python out
-9
-```
-
-<Tip warning={true}>
-
-⚠️ Dacă aveți un model cu un număr greșit de labeluri, veți primi o eroare obscură atunci când apelați metoda `Trainer.train()` mai târziu (ceva de genul "CUDA error: device-side assert triggered"). Aceasta este cauza numărul unu a erorilor raportate de utilizatori pentru astfel de erori, așa că asigurați-vă că faceți această verificare pentru a confirma că aveți numărul de labeluri așteptat.
-
-</Tip>
-
-### Fine-tuningul modelului[[fine-tuning-the-model]]
-
-Acum suntem gata să ne antrenăm modelul! Trebuie doar să facem ultimele două lucruri înainte de a defini modelul nostru `Trainer`: să ne conectăm la Hugging Face și să definim argumentele de antrenare. Dacă lucrați într-un notebook, există o funcție convenabilă pentru a vă ajuta cu acest lucru:
-
-```python
-from huggingface_hub import notebook_login
-
-notebook_login()
-```
-
-Aceasta va afișa un widget în care puteți introduce datele tale de autentificare Hugging Face.
-
-Dacă nu lucrați într-un notebook, tastați următoarea linie în terminal:
-
-```bash
-huggingface-cli login
-```
-
-Odată făcut acest lucru, putem defini`TrainingArguments`:
-
-```python
-from transformers import TrainingArguments
-
-args = TrainingArguments(
-    "bert-finetuned-ner",
-    evaluation_strategy="epoch",
-    save_strategy="epoch",
-    learning_rate=2e-5,
-    num_train_epochs=3,
-    weight_decay=0.01,
-    push_to_hub=True,
-)
-```
-
-Ați mai văzut cele mai multe dintre acestea: stabilim niște hiperparametri (cum ar fi learning rate, numărul de epoci pentru care să ne antrenăm și weights decay) și specificăm `push_to_hub=True` pentru a indica faptul că dorim să salvăm modelul și să îl evaluăm la sfârșitul fiecărei epoci și că dorim să încărcăm rezultatele noastre în Model Hub. Rețineți că puteți specifica numele repositoriului către care doriți să faceți push cu argumentul `hub_model_id` (în special, va trebui să utilizați acest argument pentru a face push către o organizație). De exemplu, atunci când am trimis modelul către organizația [`huggingface-course`](https://huggingface.co/huggingface-course), am adăugat `hub_model_id="huggingface-course/bert-finetuned-ner"` la `TrainingArguments`. În mod implicit, repositoriul utilizat va fi în namespaceul tău și denumit după output directory-ul pe care l-ați setat, deci în cazul nostru va fi `"sgugger/bert-finetuned-ner"`.
-
-<Tip>
-
-💡 Dacă output directory-ul pe care îl utilizați există deja, acesta trebuie să fie o clonă locală a repositoriul către care doriți să faceți push. Dacă nu este așa, veți primi o eroare la definirea `Trainer` și va trebui să setați un nume nou.
-
-</Tip>
-
-În final, transmitem totul către `Trainer` și lansăm antrenarea:
-
-```python
-from transformers import Trainer
-
-trainer = Trainer(
-    model=model,
-    args=args,
-    train_dataset=tokenized_datasets["train"],
-    eval_dataset=tokenized_datasets["validation"],
-    data_collator=data_collator,
-    compute_metrics=compute_metrics,
-    tokenizer=tokenizer,
-)
-trainer.train()
-```
-
-Rețineți că, în timpul antrenării, de fiecare dată când modelul este salvat (aici, la fiecare epocă), acesta este încărcat pe Hub în fundal. În acest fel, veți putea să reluați antrenareape o altă mașină, dacă este necesar.
-
-Odată ce antrenamentul este complet, folosim metoda `push_to_hub()` pentru a ne asigura că încărcăm cea mai recentă versiune a modelului:
-
-```py
-trainer.push_to_hub(commit_message="Training complete")
-```
-
-Această comandă returnează URL-ul comitului pe care tocmai l-ai făcut, dacă doriți să o inspectați:
-
-```python out
-'https://huggingface.co/sgugger/bert-finetuned-ner/commit/26ab21e5b1568f9afeccdaed2d8715f571d786ed'
-```
-
-De asemenea, `Trainer` redactează un model card cu toate rezultatele evaluării și o încarcă. În acest stadiu, puteți utiliza inference widgetul de pe Model Hub pentru a testa modelul și a-l partaja cu prietenii. Ați făcut fine-tune cu succes un model pentru o sarcină de clasificare a tokenilor - felicitări!
-
-Dacă doriți să vă scufundați puțin mai profund în bucla de antrenare, vă vom arăta acum cum să faceți același lucru utilizând 🤗 Accelerate.
-
-## Un training loop personalizat[[a-custom-training-loop]]
-
-Să aruncăm acum o privire la training loopul complet, astfel încât să puteți personaliza cu ușurință părțile de care aveți nevoie. Va semăna foarte mult cu ceea ce am făcut în [Capitolul 3](/course/chapter3/4), cu câteva modificări pentru evaluare.
-
-### Pregătiți totul pentru antrenare[[preparing-everything-for-training]]
-
-Mai întâi trebuie să construim `DataLoader`s din dataseturile noastre. Vom reutiliza `data_collator` ca un `collate_fn` și vom amesteca setul de antrenare, dar nu și setul de validare:
-
-```py
-from torch.utils.data import DataLoader
-
-train_dataloader = DataLoader(
-    tokenized_datasets["train"],
-    shuffle=True,
-    collate_fn=data_collator,
-    batch_size=8,
-)
-eval_dataloader = DataLoader(
-    tokenized_datasets["validation"], collate_fn=data_collator, batch_size=8
-)
-```
-
-În continuare, reinstanțiem modelul, pentru a ne asigura că nu continuăm fine-tuningul de dinainte, ci pornim din nou de la modelul preantrenat BERT:
-
-```py
-model = AutoModelForTokenClassification.from_pretrained(
-    model_checkpoint,
-    id2label=id2label,
-    label2id=label2id,
-)
-```
-
-Atunci vom avea nevoie de un optimizator. Vom folosi clasicul `AdamW`, care este ca `Adam`, dar cu o corecție în modul în care se aplică weight decay-ul:
-
-```py
-from torch.optim import AdamW
-
-optimizer = AdamW(model.parameters(), lr=2e-5)
-```
-
-Odată ce avem toate aceste obiecte, le putem trimite la metoda `accelerator.prepare()`:
-
-```py
-from accelerate import Accelerator
-
-accelerator = Accelerator()
-model, optimizer, train_dataloader, eval_dataloader = accelerator.prepare(
-    model, optimizer, train_dataloader, eval_dataloader
-)
-```
-
-<Tip>
-
-🚨 Dacă vă antrenați pe un TPU, va trebui să mutați tot codul începând de la celula de mai sus într-o funcție de antrenament dedicată. Consultați [Capitolul 3](/course/chapter3) pentru mai multe detalii.
-
-</Tip>
-
-Acum că am trimis `train_dataloader` la `accelerator.prepare()`, putem utiliza lungimea acestuia pentru a calcula numărul de pași de antrenare. Rețineți că ar trebui să facem întotdeauna acest lucru după ce pregătim dataloaderul, deoarece această metodă îi va modifica lungimea. Utilizăm un classic liner schedule de la rata de învățare la 0:
-
-```py
-from transformers import get_scheduler
-
-num_train_epochs = 3
-num_update_steps_per_epoch = len(train_dataloader)
-num_training_steps = num_train_epochs * num_update_steps_per_epoch
-
-lr_scheduler = get_scheduler(
-    "linear",
-    optimizer=optimizer,
-    num_warmup_steps=0,
-    num_training_steps=num_training_steps,
-)
-```
-
-În cele din urmă, pentru a trimite modelul nostru către Hub, va trebui să creăm un obiect `Repository` într-un folder de lucru. În primul rând, conectați-vă la Hugging Face, dacă nu sunteți deja conectat. Vom determina numele repositoriului pornind de la ID-ul modelului pe care dorim să îl dăm modelului nostru (nu ezitați să înlocuiți `repo_name` cu propriul nume; trebuie doar să conțină numele vostru de utilizator, ceea ce face funcția `get_full_repo_name()`):
-
-```py
-from huggingface_hub import Repository, get_full_repo_name
-
-model_name = "bert-finetuned-ner-accelerate"
-repo_name = get_full_repo_name(model_name)
-repo_name
-```
-
-```python out
-'sgugger/bert-finetuned-ner-accelerate'
-```
-
-Apoi putem clona acel repositoriu într-un folder local. Dacă există deja, acest folder local ar trebui să fie o clonă existentă a repositoriului cu care lucrăm:
-
-```py
-output_dir = "bert-finetuned-ner-accelerate"
-repo = Repository(output_dir, clone_from=repo_name)
-```
-
-Acum putem încărca orice salvăm în `output_dir` prin apelarea metodei `repo.push_to_hub()`. Acest lucru ne va ajuta să încărcăm modelele intermediare la sfârșitul fiecărei epoci.
-
-### Loopul de antrenare[[training-loop]]
-
-Acum suntem pregătiți să scriem bucla de antrenare completă. Pentru a simplifica partea sa de evaluare, definim funcția `postprocess()` care preia predicțiile și labelurile și le convertește în liste de șiruri de caractere, așa cum se așteaptă obiectul nostru `metric`:
-
-```py
-def postprocess(predictions, labels):
-    predictions = predictions.detach().cpu().clone().numpy()
-    labels = labels.detach().cpu().clone().numpy()
-
-    # Remove ignored index (special tokens) and convert to labels
-    true_labels = [[label_names[l] for l in label if l != -100] for label in labels]
-    true_predictions = [
-        [label_names[p] for (p, l) in zip(prediction, label) if l != -100]
-        for prediction, label in zip(predictions, labels)
-    ]
-    return true_labels, true_predictions
-```
-
-Apoi putem scrie bucla de antrenare. După definirea unei bare de progres pentru a urmări modul în care decurge antrenarea, bucla are trei părți:
-
-- Antrenarea în sine, care este iterația clasică peste `train_dataloader`, trecerea înainte prin model, apoi trecerea înapoi și pasul optimizatorului.
-- Evaluarea, în care există o noutate după obținerea outputurilor modelului nostru pe un batch: din moment ce două procese pot ar fi putut face padding inputurilor și labelurile la forme diferite, trebuie să folosim `accelerator.pad_across_processes()` pentru a face predicțiile și labelurile să aibă aceeași formă înainte de a apela metoda `gather()`. Dacă nu facem acest lucru, evaluarea va da eroare sau se va bloca pentru totdeauna. Apoi trimitem rezultatele la `metric.add_batch()` și apelăm `metric.compute()` odată ce bucla de evaluare s-a încheiat.
-- Salvarea și încărcarea, unde mai întâi salvăm modelul și tokenizerul, apoi apelăm `repo.push_to_hub()`. Observați că folosim argumentul `blocking=False` pentru a spune bibliotecii 🤗 Hub să efectueze push-ul într-un proces asincron. În acest fel, antrenamentul continuă normal, iar această instrucțiune (lungă) este executată în fundal.
-
-Iată codul complet pentru bucla de antrenare:
-
-```py
-from tqdm.auto import tqdm
-import torch
-
-progress_bar = tqdm(range(num_training_steps))
-
-for epoch in range(num_train_epochs):
-    # Training
-    model.train()
-    for batch in train_dataloader:
-        outputs = model(**batch)
-        loss = outputs.loss
-        accelerator.backward(loss)
-
-        optimizer.step()
-        lr_scheduler.step()
-        optimizer.zero_grad()
-        progress_bar.update(1)
-
-    # Evaluation
-    model.eval()
-    for batch in eval_dataloader:
-        with torch.no_grad():
-            outputs = model(**batch)
-
-        predictions = outputs.logits.argmax(dim=-1)
-        labels = batch["labels"]
-
-        # Necessary to pad predictions and labels for being gathered
-        predictions = accelerator.pad_across_processes(predictions, dim=1, pad_index=-100)
-        labels = accelerator.pad_across_processes(labels, dim=1, pad_index=-100)
-
-        predictions_gathered = accelerator.gather(predictions)
-        labels_gathered = accelerator.gather(labels)
-
-        true_predictions, true_labels = postprocess(predictions_gathered, labels_gathered)
-        metric.add_batch(predictions=true_predictions, references=true_labels)
-
-    results = metric.compute()
-    print(
-        f"epoch {epoch}:",
-        {
-            key: results[f"overall_{key}"]
-            for key in ["precision", "recall", "f1", "accuracy"]
-        },
-    )
-
-    # Save and upload
-    accelerator.wait_for_everyone()
-    unwrapped_model = accelerator.unwrap_model(model)
-    unwrapped_model.save_pretrained(output_dir, save_function=accelerator.save)
-    if accelerator.is_main_process:
-        tokenizer.save_pretrained(output_dir)
-        repo.push_to_hub(
-            commit_message=f"Training in progress epoch {epoch}", blocking=False
-        )
-```
-
-În cazul în care este prima dată când vedeți un model salvat cu 🤗 Accelerate, să ne oprim puțin pentru a inspecta cele trei linii de cod care îl însoțesc:
-
-```py
-accelerator.wait_for_everyone()
-unwrapped_model = accelerator.unwrap_model(model)
-unwrapped_model.save_pretrained(output_dir, save_function=accelerator.save)
-```
-
-Prima linie se explică de la sine: aceasta spune tuturor proceselor să aștepte până când toată lumea se află în etapa respectivă înainte de a continua. Acest lucru are rolul de a ne asigura că avem același model în fiecare proces înainte de a salva. Apoi luăm `unwrapped_model`, care este modelul de bază pe care l-am definit. Metoda `accelerator.prepare()` modifică modelul pentru a funcționa în antrenarea distribuită, deci nu va mai avea metoda `save_pretrained()`; metoda `accelerator.unwrap_model()` anulează acest pas. În cele din urmă, apelăm metoda `save_pretrained()`, dar îi spunem să folosească metoda `accelerator.save()` în loc de `torch.save()`.
-
-Odată făcut acest lucru, ar trebui să aveți un model care produce rezultate destul de asemănătoare cu cel antrenat cu `Trainer`. Puteți verifica modelul pe care l-am antrenat folosind acest cod la [*huggingface-course/bert-finetuned-ner-accelerate*] (https://huggingface.co/huggingface-course/bert-finetuned-ner-accelerate). Și dacă doriți să testați orice modificări ale buclei de antrenare, le puteți implementa direct prin editarea codului prezentat mai sus!
-
-
-{/if}
-
-## Utilizarea model fine-tuned[[using-the-fine-tuned-model]]
-
-V-am arătat deja cum puteți utiliza modelul pe care l-am ajustat pe Model Hub cu inference widget. Pentru a-l utiliza la nivel local într-un `pipeline`, trebuie doar să specificați identificatorul de model corespunzător:
-
-```py
-from transformers import pipeline
-
-# Replace this with your own checkpoint
-model_checkpoint = "huggingface-course/bert-finetuned-ner"
-token_classifier = pipeline(
-    "token-classification", model=model_checkpoint, aggregation_strategy="simple"
-)
-token_classifier("My name is Sylvain and I work at Hugging Face in Brooklyn.")
-```
-
-```python out
-[{'entity_group': 'PER', 'score': 0.9988506, 'word': 'Sylvain', 'start': 11, 'end': 18},
- {'entity_group': 'ORG', 'score': 0.9647625, 'word': 'Hugging Face', 'start': 33, 'end': 45},
- {'entity_group': 'LOC', 'score': 0.9986118, 'word': 'Brooklyn', 'start': 49, 'end': 57}]
-```
-
-Grozav! Modelul nostru funcționează la fel de bine ca cel implicit pentru aceast pipeline!
\ No newline at end of file
diff --git a/chapters/ro/chapter7/3.mdx b/chapters/ro/chapter7/3.mdx
deleted file mode 100644
index 9c33524f7..000000000
--- a/chapters/ro/chapter7/3.mdx
+++ /dev/null
@@ -1,1043 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Fine-tuningul unui masked language model[[fine-tuning-a-masked-language-model]]
-
-{#if fw === 'pt'}
-
-<CourseFloatingBanner chapter={7}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter7/section3_pt.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter7/section3_pt.ipynb"},
-]} />
-
-{:else}
-
-<CourseFloatingBanner chapter={7}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter7/section3_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter7/section3_tf.ipynb"},
-]} />
-
-{/if}
-
-Pentru multe aplicații NLP care implică modele Transformer, puteți lua pur și simplu un model preantrenat de pe Hugging Face Hub și să îl faceți fine-tune direct pe datele voastre pentru sarcina dată. Cu condiția că corpusul utilizat pentru preantrenare să nu fie prea diferit de corpusul utilizat pentru fine-tuning, învățarea prin transfer va produce de obicei rezultate bune.
-
-Cu toate acestea, există câteva cazuri în care veți dori să faceți fine-tune mai întâi modelelor lingvistice pe datele voastre, înainte de a antrena un head specific sarcinii. De exemplu, dacă datasetul vostru conține contracte juridice sau articole științifice, un model Transformer obișnuit, precum BERT, va trata de obicei cuvintele specifice domeniului din corpus ca pe niște tokeni rari, iar performanța rezultată poate fi mai puțin satisfăcătoare. Prin fine-tuningul  modelului lingvistic pe baza datelor din domeniu, puteți crește performanța multor sarcini, ceea ce înseamnă că, de obicei, trebuie să efectuați acest pas o singură dată!
-
-Acest proces de fine-tuning a unui model lingvistic preantrenat pe date din domeniu se numește de obicei _adaptare la domeniu_. Acesta a fost popularizat în 2018 de [ULMFiT](https://arxiv.org/abs/1801.06146), care a fost una dintre primele arhitecturi neuronale (bazate pe LSTM-uri) care a făcut ca învățarea prin transfer să funcționeze cu adevărat pentru NLP. Un exemplu de adaptare la domeniu cu ULMFiT este prezentat în imaginea de mai jos; în această secțiune vom face ceva similar, dar cu un Transformer în loc de un LSTM!
-
-<div class="flex justify-center">
-<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/ulmfit.svg" alt="ULMFiT."/>
-<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/ulmfit-dark.svg" alt="ULMFiT."/>
-</div>
-
-Până la sfârșitul acestei secțiuni, veți avea un [model de limbaj mascat](https://huggingface.co/huggingface-course/distilbert-base-uncased-finetuned-imdb?text=This+is+a+great+%5BMASK%5D.) pe Hub, care poate completa automat propoziții, după cum se poate vedea mai jos:
-
-<iframe src="https://course-demos-distilbert-base-uncased-finetuned-imdb.hf.space" frameBorder="0" height="300" title="Gradio app" class="block dark:hidden container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
-
-Hai să începem!
-
-<Youtube id="mqElG5QJWUg"/>
-
-<Tip>
-
-🙋 Dacă termenii "masked language modeling" și "pretrained model" nu vă sună familiar, mergeți să verificați [Capitolul 1](/course/chapter1), unde vă explicăm toate aceste concepte de bază, cu videoclipuri!
-
-</Tip>
-
-## Alegerea unui model preantrenat pentru masked language modeling[[picking-a-pretrained-model-for-masked-language-modeling]]
-
-Pentru a începe, să alegem un model preantrenat adecvat pentru modelarea limbajului mascat. După cum se vede în următoarea captură de ecran, puteți găsi o listă de candidați prin aplicarea filtrului "Fill-Mask" pe [Hugging Face Hub](https://huggingface.co/models?pipeline_tag=fill-mask&sort=downloads):
-
-<div class="flex justify-center">
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/mlm-models.png" alt="Hub models." width="80%"/>
-</div>
-
-Deși modelele din familia BERT și RoBERTa sunt cele mai descărcate, vom utiliza un model numit [DistilBERT](https://huggingface.co/distilbert-base-uncased)
-care poate fi antrenat mult mai rapid, cu o pierdere mică sau nulă a performanței în aval. Acest model a fost antrenat folosind o tehnică specială numită [_knowledge distillation_](https://en.wikipedia.org/wiki/Knowledge_distillation), în care un "model profesor" mare, precum BERT, este folosit pentru a ghida antrenarea unui "model elev" care are mult mai puțini parametrii. O explicație a detaliilor privind distilarea cunoștințelor ne-ar duce prea departe în această secțiune, dar dacă ești interesat, poți citi totul despre aceasta în [_Natural Language Processing with Transformers_](https://www.oreilly.com/library/view/natural-language-processing/9781098136789/) (cunoscut sub numele colocvial de Transformers textbooks).
-
-{#if fw === 'pt'}
-
-Să continuăm și să descărcăm modelul DistilBERT folosind clasa `AutoModelForMaskedLM`:
-
-```python
-from transformers import AutoModelForMaskedLM
-
-model_checkpoint = "distilbert-base-uncased"
-model = AutoModelForMaskedLM.from_pretrained(model_checkpoint)
-```
-
-Putem vedea câți parametri are acest model prin apelarea metodei `num_parameters()`:
-
-```python
-distilbert_num_parameters = model.num_parameters() / 1_000_000
-print(f"'>>> DistilBERT number of parameters: {round(distilbert_num_parameters)}M'")
-print(f"'>>> BERT number of parameters: 110M'")
-```
-
-```python out
-'>>> DistilBERT number of parameters: 67M'
-'>>> BERT number of parameters: 110M'
-```
-
-{:else}
-
-Să continuăm și să descărcăm modelul DistilBERT folosind clasa `TFAutoModelForMaskedLM`:
-
-```python
-from transformers import TFAutoModelForMaskedLM
-
-model_checkpoint = "distilbert-base-uncased"
-model = TFAutoModelForMaskedLM.from_pretrained(model_checkpoint)
-```
-
-Putem vedea câți parametri are acest model prin apelarea metodei `summary()`:
-
-```python
-model.summary()
-```
-
-```python out
-Model: "tf_distil_bert_for_masked_lm"
-_________________________________________________________________
-Layer (type)                 Output Shape              Param #   
-=================================================================
-distilbert (TFDistilBertMain multiple                  66362880  
-_________________________________________________________________
-vocab_transform (Dense)      multiple                  590592    
-_________________________________________________________________
-vocab_layer_norm (LayerNorma multiple                  1536      
-_________________________________________________________________
-vocab_projector (TFDistilBer multiple                  23866170  
-=================================================================
-Total params: 66,985,530
-Trainable params: 66,985,530
-Non-trainable params: 0
-_________________________________________________________________
-```
-
-{/if}
-
-Cu aproximativ 67 de milioane de parametri, DistilBERT este de aproximativ două ori mai mic decât modelul de bază BERT, ceea ce se traduce aproximativ printr-o creștere de două ori a vitezei de antrenare - super! Să vedem acum ce tipuri de tokeni prezice acest model ca fiind cele mai probabile completări ale unui mic sample de text:
-
-```python
-text = "This is a great [MASK]."
-```
-
-Ca oameni, ne putem imagina multe posibilități pentru tokenul `[MASK]`, cum ar fi "day", "ride" sau "painting". Pentru modelele preantrenate, predicțiile depind de corpusul pe care modelul a fost antrenat, deoarece acesta învață să detecteze tiparele statistice prezente în date. La fel ca BERT, DistilBERT a fost preantrenat pe dataseturile [English Wikipedia](https://huggingface.co/datasets/wikipedia) și [BookCorpus](https://huggingface.co/datasets/bookcorpus), astfel încât ne așteptăm ca predicțiile pentru `[MASK]` să reflecte aceste domenii. Pentru a prezice masca, avem nevoie de tokenizerul DistilBERT pentru a produce inputurile pentru model, deci hai să-l descărcăm și pe acesta din Hub:
-
-```python
-from transformers import AutoTokenizer
-
-tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
-```
-
-Cu un tokenizer și un model, putem acum să transmitem exemplul nostru de text modelului, să extragem logiturile și să tipărim primii 5 candidați:
-
-{#if fw === 'pt'}
-
-```python
-import torch
-
-inputs = tokenizer(text, return_tensors="pt")
-token_logits = model(**inputs).logits
-# Find the location of [MASK] and extract its logits
-mask_token_index = torch.where(inputs["input_ids"] == tokenizer.mask_token_id)[1]
-mask_token_logits = token_logits[0, mask_token_index, :]
-# Pick the [MASK] candidates with the highest logits
-top_5_tokens = torch.topk(mask_token_logits, 5, dim=1).indices[0].tolist()
-
-for token in top_5_tokens:
-    print(f"'>>> {text.replace(tokenizer.mask_token, tokenizer.decode([token]))}'")
-```
-
-{:else}
-
-```python
-import numpy as np
-import tensorflow as tf
-
-inputs = tokenizer(text, return_tensors="np")
-token_logits = model(**inputs).logits
-# Find the location of [MASK] and extract its logits
-mask_token_index = np.argwhere(inputs["input_ids"] == tokenizer.mask_token_id)[0, 1]
-mask_token_logits = token_logits[0, mask_token_index, :]
-# Pick the [MASK] candidates with the highest logits
-# We negate the array before argsort to get the largest, not the smallest, logits
-top_5_tokens = np.argsort(-mask_token_logits)[:5].tolist()
-
-for token in top_5_tokens:
-    print(f">>> {text.replace(tokenizer.mask_token, tokenizer.decode([token]))}")
-```
-
-{/if}
-
-```python out
-'>>> This is a great deal.'
-'>>> This is a great success.'
-'>>> This is a great adventure.'
-'>>> This is a great idea.'
-'>>> This is a great feat.'
-```
-Putem vedea din rezultate că predicțiile modelului se referă la termeni din viața de zi cu zi, ceea ce poate că nu este surprinzător având în vedere fundamentul Wikipedia în limba engleză. Să vedem cum putem schimba acest domeniu în ceva puțin mai nișat - recenzii de filme foarte polarizate!
-
-
-## Datasetul[[the-dataset]]
-
-Pentru a prezenta adaptarea la domeniu, vom utiliza faimosul [Large Movie Review Dataset] (https://huggingface.co/datasets/imdb) (sau IMDb pe scurt), care este un corpus de recenzii de filme care este adesea utilizat pentru a evalua modelele de analiză a sentimentelor. Prin fine-tuningul aplicat asupra DistilBERT pe acest corpus, ne așteptăm ca modelul de limbaj să își adapteze vocabularul de la datele factuale din Wikipedia pe care a fost antrenat în prealabil la elementele mai subiective ale recenziilor de film. Putem obține datele din Hugging Face Hub cu funcția `load_dataset()` din 🤗 Datasets:
-
-```python
-from datasets import load_dataset
-
-imdb_dataset = load_dataset("imdb")
-imdb_dataset
-```
-
-```python out
-DatasetDict({
-    train: Dataset({
-        features: ['text', 'label'],
-        num_rows: 25000
-    })
-    test: Dataset({
-        features: ['text', 'label'],
-        num_rows: 25000
-    })
-    unsupervised: Dataset({
-        features: ['text', 'label'],
-        num_rows: 50000
-    })
-})
-```
-
-Putem vedea că segmentele `train` și `test` conțin fiecare 25.000 de recenzii, în timp ce există un segment fără label numită `unsupervised` care conține 50.000 de recenzii. Să aruncăm o privire la câteva sampleuri pentru a ne face o idee despre tipul de text cu care avem de-a face. Așa cum am făcut în capitolele anterioare ale cursului, vom combina funcțiile `Dataset.shuffle()` și `Dataset.select()` pentru a crea un sample aleatoriu:
-
-```python
-sample = imdb_dataset["train"].shuffle(seed=42).select(range(3))
-
-for row in sample:
-    print(f"\n'>>> Review: {row['text']}'")
-    print(f"'>>> Label: {row['label']}'")
-```
-
-```python out
-
-'>>> Review: This is your typical Priyadarshan movie--a bunch of loony characters out on some silly mission. His signature climax has the entire cast of the film coming together and fighting each other in some crazy moshpit over hidden money. Whether it is a winning lottery ticket in Malamaal Weekly, black money in Hera Pheri, "kodokoo" in Phir Hera Pheri, etc., etc., the director is becoming ridiculously predictable. Don\'t get me wrong; as clichéd and preposterous his movies may be, I usually end up enjoying the comedy. However, in most his previous movies there has actually been some good humor, (Hungama and Hera Pheri being noteworthy ones). Now, the hilarity of his films is fading as he is using the same formula over and over again.<br /><br />Songs are good. Tanushree Datta looks awesome. Rajpal Yadav is irritating, and Tusshar is not a whole lot better. Kunal Khemu is OK, and Sharman Joshi is the best.'
-'>>> Label: 0'
-
-'>>> Review: Okay, the story makes no sense, the characters lack any dimensionally, the best dialogue is ad-libs about the low quality of movie, the cinematography is dismal, and only editing saves a bit of the muddle, but Sam" Peckinpah directed the film. Somehow, his direction is not enough. For those who appreciate Peckinpah and his great work, this movie is a disappointment. Even a great cast cannot redeem the time the viewer wastes with this minimal effort.<br /><br />The proper response to the movie is the contempt that the director San Peckinpah, James Caan, Robert Duvall, Burt Young, Bo Hopkins, Arthur Hill, and even Gig Young bring to their work. Watch the great Peckinpah films. Skip this mess.'
-'>>> Label: 0'
-
-'>>> Review: I saw this movie at the theaters when I was about 6 or 7 years old. I loved it then, and have recently come to own a VHS version. <br /><br />My 4 and 6 year old children love this movie and have been asking again and again to watch it. <br /><br />I have enjoyed watching it again too. Though I have to admit it is not as good on a little TV.<br /><br />I do not have older children so I do not know what they would think of it. <br /><br />The songs are very cute. My daughter keeps singing them over and over.<br /><br />Hope this helps.'
-'>>> Label: 1'
-```
-
-Da, acestea sunt cu siguranță recenzii de film și, dacă sunteți suficient de bătrâni, ați putea chiar înțelege comentariul din ultima recenzie despre deținerea unei versiuni VHS 😜! Deși nu vom avea nevoie de labeluri pentru modelarea limbajului, putem vedea deja că un `0` denotă o recenzie negativă, în timp ce un `1` corespunde uneia pozitive.
-
-<Tip>
-
-✏️ **Încearcă!** Creați un sample aleatoriu din segmentul `unsupervised` și verificați că labelurile nu sunt nici `0`, nici `1`. În același timp, ați putea verifica și dacă labelurile din segmentele `train` și `test` sunt într-adevăr `0` sau `1` - aceasta este o verificare utilă pe care orice practicant NLP ar trebui să o efectueze la începutul unui nou proiect!
-
-</Tip>
-
-Acum că am aruncat o privire rapidă asupra datelor, să ne apucăm să le pregătim pentru modelarea limbajului mascat. După cum vom vedea, există câteva etape suplimentare pe care trebuie să le parcurgem în comparație cu sarcinile de clasificare a secvențelor pe care le-am văzut în [Capitolul 3](/course/chapter3). Să începem!
-
-## Preprocesarea datelor[[preprocessing-the-data]]
-
-<Youtube id="8PmhEIXhBvI"/>
-
-Atât pentru auto-regressive cât și pentru masked language modeling, un pas comun de preprocesare este concatenarea tuturor exemplelor și apoi împărțirea întregului corpus în bucăți de dimensiuni egale. Acest lucru este destul de diferit de abordarea noastră obișnuită, în care pur și simplu tokenizăm exemplele individuale. De ce să concatenăm totul împreună? Motivul este că exemplele individuale ar putea fi trunchiate dacă sunt prea lungi, ceea ce ar duce la pierderea de informații care ar putea fi utile pentru sarcina de modelare a limbajului!
-
-Deci, pentru a începe, vom tokeniza mai întâi corpusul nostru ca de obicei, dar _fără_ a seta opțiunea `truncation=True` în tokenizerul nostru. De asemenea, vom prelua ID-urile cuvintelor dacă acestea sunt disponibile (ceea ce va fi cazul dacă folosim un tokenizer rapid, așa cum este descris în [Capitolul 6](/course/chapter6/3)), deoarece vom avea nevoie de ele mai târziu pentru a face mascarea întregului cuvânt. Vom include acest lucru într-o funcție simplă și, în același timp, vom elimina coloanele `text` și `label`, deoarece nu mai avem nevoie de ele:
-
-```python
-def tokenize_function(examples):
-    result = tokenizer(examples["text"])
-    if tokenizer.is_fast:
-        result["word_ids"] = [result.word_ids(i) for i in range(len(result["input_ids"]))]
-    return result
-
-
-# Utilizați batched=True pentru a activa multithreadingul!
-tokenized_datasets = imdb_dataset.map(
-    tokenize_function, batched=True, remove_columns=["text", "label"]
-)
-tokenized_datasets
-```
-
-```python out
-DatasetDict({
-    train: Dataset({
-        features: ['attention_mask', 'input_ids', 'word_ids'],
-        num_rows: 25000
-    })
-    test: Dataset({
-        features: ['attention_mask', 'input_ids', 'word_ids'],
-        num_rows: 25000
-    })
-    unsupervised: Dataset({
-        features: ['attention_mask', 'input_ids', 'word_ids'],
-        num_rows: 50000
-    })
-})
-```
-
-Deoarece DistilBERT este un model de tip BERT, putem vedea că textele codate constau din `input_ids` și `attention_mask` pe care le-am văzut în alte capitole, precum și din `word_ids` pe care le-am adăugat.
-
-Acum că am tokenizat recenziile de filme, următorul pas este să le grupăm pe toate și să împărțim rezultatul în chunkuri. Dar cât de mari ar trebui să fie aceste chunkuri? Acest lucru va fi determinat în cele din urmă de cantitatea de memorie GPU pe care o aveți disponibilă, dar un bun punct de plecare este să vedeți care este dimensiunea maximă a contextului modelului. Aceasta poate fi dedusă prin inspectarea atributului `model_max_length` al tokenizerului:
-
-```python
-tokenizer.model_max_length
-```
-
-```python out
-512
-```
-
-Această valoare este derivată din fișierul *tokenizer_config.json* asociat cu un checkpoint; în acest caz putem vedea că dimensiunea contextului este de 512 tokeni, la fel ca în cazul BERT.
-
-<Tip>
-
-✏️ **Încearcă!** Unele modele Transformer, precum [BigBird](https://huggingface.co/google/bigbird-roberta-base) și [Longformer](hf.co/allenai/longformer-base-4096), au o lungime de context mult mai mare decât BERT și alte modele Transformer mai vechi. Inițializați tokenizerul pentru unul dintre aceste checkpointuri și verificați dacă `model_max_length` este în concordanță cu ceea ce este menționat pe model card.
-
-</Tip>
-
-Prin urmare, pentru a derula experimentele pe GPU-uri precum cele de pe Google Colab, vom alege ceva mai mic care să încapă în memorie:
-
-```python
-chunk_size = 128
-```
-
-<Tip warning={true}>
-
-Rețineți că utilizarea unei dimensiuni mici a chunkurilor poate fi dăunător în scenariile din lumea reală, astfel încât ar trebui să utilizați o dimensiune care corespunde cazului de utilizare la care veți aplica modelul.
-
-</Tip>
-
-Acum vine partea distractivă. Pentru a arăta cum funcționează concatenarea, să luăm câteva recenzii din setul nostru de antrenare tokenizat și să imprimăm numărul de tokeni per recenzie:
-
-```python
-# Slicingul produce o listă de liste pentru fiecare caracteristică
-tokenized_samples = tokenized_datasets["train"][:3]
-
-for idx, sample in enumerate(tokenized_samples["input_ids"]):
-    print(f"'>>> Review {idx} length: {len(sample)}'")
-```
-
-```python out
-'>>> Review 0 length: 200'
-'>>> Review 1 length: 559'
-'>>> Review 2 length: 192'
-```
-
-Putem apoi concatena toate aceste exemple cu un dictionary comprehension, după cum urmează:
-
-```python
-concatenated_examples = {
-    k: sum(tokenized_samples[k], []) for k in tokenized_samples.keys()
-}
-total_length = len(concatenated_examples["input_ids"])
-print(f"'>>> Concatenated reviews length: {total_length}'")
-```
-
-```python out
-'>>> Concatenated reviews length: 951'
-```
-
-Minunat, lungimea totală se verifică - așa că acum să împărțim recenziile concatenate în chunkuri de dimensiunea dată de `chunk_size`. Pentru a face acest lucru, iterăm peste caracteristicile din `concatenated_examples` și folosim un list comprehension pentru a crea slice-uri ale fiecărei caracteristici. Rezultatul este un dicționar de chunkuri pentru fiecare caracteristică:
-
-```python
-chunks = {
-    k: [t[i : i + chunk_size] for i in range(0, total_length, chunk_size)]
-    for k, t in concatenated_examples.items()
-}
-
-for chunk in chunks["input_ids"]:
-    print(f"'>>> Chunk length: {len(chunk)}'")
-```
-
-```python out
-'>>> Chunk length: 128'
-'>>> Chunk length: 128'
-'>>> Chunk length: 128'
-'>>> Chunk length: 128'
-'>>> Chunk length: 128'
-'>>> Chunk length: 128'
-'>>> Chunk length: 128'
-'>>> Chunk length: 55'
-```
-
-După cum puteți vedea în acest exemplu, ultimul fragment va fi în general mai mic decât dimensiunea maximă a fragmentului. Există două strategii principale pentru a face față acestei situații:
-
-* Aruncați ultimul chunk dacă este mai mic decât `chunk_size`.
-* Faceți padding ultimului chunk până când lungimea sa este egală cu `chunk_size`.
-
-Vom adopta prima abordare aici, așa că hai să încorporăm toată logica de mai sus într-o singură funcție pe care o putem aplica dataseturilor tokenizate:
-
-```python
-def group_texts(examples):
-    # Concatenarea tuturor textelor
-    concatenated_examples = {k: sum(examples[k], []) for k in examples.keys()}
-    # Calcularea lungimii textelor concatenate
-    total_length = len(concatenated_examples[list(examples.keys())[0]])
-    # Renunțăm la ultimul chunk dacă este mai mic decât chunk_size
-    total_length = (total_length // chunk_size) * chunk_size
-    # Împărțiți pe bucăți de max_len
-    result = {
-        k: [t[i : i + chunk_size] for i in range(0, total_length, chunk_size)]
-        for k, t in concatenated_examples.items()
-    }
-    # Creați o nouă coloană de labeluri
-    result["labels"] = result["input_ids"].copy()
-    return result
-```
-
-Observați că în ultimul pas al `group_texts()` creăm o nouă coloană `labels` care este o copie a coloanei `input_ids`. După cum vom vedea în curând, acest lucru se datorează faptului că în modelarea limbajului mascat obiectivul este de a prezice tokeni mascați aleatoriu în input batch, iar prin crearea unei coloane `labels` furnizăm adevărul de bază din care modelul nostru de limbaj poate să învețe.
-
-Să aplicăm acum funcția `group_texts()` dataseturilor tokenizate folosind funcția noastră de încredere `Dataset.map()`:
-
-```python
-lm_datasets = tokenized_datasets.map(group_texts, batched=True)
-lm_datasets
-```
-
-```python out
-DatasetDict({
-    train: Dataset({
-        features: ['attention_mask', 'input_ids', 'labels', 'word_ids'],
-        num_rows: 61289
-    })
-    test: Dataset({
-        features: ['attention_mask', 'input_ids', 'labels', 'word_ids'],
-        num_rows: 59905
-    })
-    unsupervised: Dataset({
-        features: ['attention_mask', 'input_ids', 'labels', 'word_ids'],
-        num_rows: 122963
-    })
-})
-```
-
-Puteți vedea că gruparea și apoi fragmentarea textelor a produs mult mai multe exemple decât cele 25.000 inițiale pentru spliturile `train` și `test`. Acest lucru se datorează faptului că acum avem exemple care implică _contigous tokens_ care se întind pe mai multe exemple din corpusul original. Puteți vedea acest lucru în mod explicit căutând tokenii speciali `[SEP]` și `[CLS]` într-unul dintre chunkuri:
-
-```python
-tokenizer.decode(lm_datasets["train"][1]["input_ids"])
-```
-
-```python out
-".... at.......... high. a classic line : inspector : i'm here to sack one of your teachers. student : welcome to bromwell high. i expect that many adults of my age think that bromwell high is far fetched. what a pity that it isn't! [SEP] [CLS] homelessness ( or houselessness as george carlin stated ) has been an issue for years but never a plan to help those on the street that were once considered human who did everything from going to school, work, or vote for the matter. most people think of the homeless"
-```
-
-În acest exemplu puteți vedea două recenzii de film care se suprapun, una despre un film de liceu și cealaltă despre persoanele fără adăpost. Să verificăm, de asemenea, cum arată labelurile pentru modelarea limbajului mascat:
-
-```python out
-tokenizer.decode(lm_datasets["train"][1]["labels"])
-```
-
-```python out
-".... at.......... high. a classic line : inspector : i'm here to sack one of your teachers. student : welcome to bromwell high. i expect that many adults of my age think that bromwell high is far fetched. what a pity that it isn't! [SEP] [CLS] homelessness ( or houselessness as george carlin stated ) has been an issue for years but never a plan to help those on the street that were once considered human who did everything from going to school, work, or vote for the matter. most people think of the homeless"
-```
-
-Așa cum era de așteptat de la funcția noastră `group_texts()` de mai sus, acest lucru pare identic cu `input_ids` decodificat - dar atunci cum poate modelul nostru să învețe ceva? Ne lipsește un pas cheie: inserarea tokenilor `[MASK]` în poziții aleatorii în inputuri! Să vedem cum putem face acest lucru din mers, în timpul fine-tuningului, folosind un data collator special.
-
-## Fine-tuningul asupra DistilBERT cu API-ul `Trainer`[[fine-tuning-distilbert-with-the-trainer-api]]
-
-Fine-tuningul unui model lingvistic mascat este aproape identic cu fine-tuningul a unui model de clasificare a secvențelor, așa cum am făcut în [Capitolul 3](/course/chapter3). Singura diferență este că avem nevoie de un data collator care poate masca aleatoriu o parte dintre tokeni din fiecare batch de texte. Din fericire, 🤗 Transformers vine pregătit cu un `DataCollatorForLanguageModeling` dedicat tocmai pentru această sarcină. Trebuie doar să îi transmitem tokenizerul și un argument `mlm_probability` care specifică ce fracțiune din tokeni trebuie mascată. Vom alege 15%, care este cantitatea utilizată pentru BERT și o alegere comună în literatura de specialitate:
-
-```python
-from transformers import DataCollatorForLanguageModeling
-
-data_collator = DataCollatorForLanguageModeling(tokenizer=tokenizer, mlm_probability=0.15)
-```
-
-Pentru a vedea cum funcționează mascarea aleatorie, să introducem câteva exemple în data collator. Deoarece se așteaptă la o listă de "dict"-uri, în care fiecare "dict" reprezintă un singur chunk de text continuu, mai întâi iterăm peste dataset înainte de a trimite batchul către data collator. Eliminăm cheia `"word_ids"` pentru acest data collator, deoarece acesta nu o așteaptă:
-
-```python
-samples = [lm_datasets["train"][i] for i in range(2)]
-for sample in samples:
-    _ = sample.pop("word_ids")
-
-for chunk in data_collator(samples)["input_ids"]:
-    print(f"\n'>>> {tokenizer.decode(chunk)}'")
-```
-
-```python output
-'>>> [CLS] bromwell [MASK] is a cartoon comedy. it ran at the same [MASK] as some other [MASK] about school life, [MASK] as " teachers ". [MASK] [MASK] [MASK] in the teaching [MASK] lead [MASK] to believe that bromwell high\'[MASK] satire is much closer to reality than is " teachers ". the scramble [MASK] [MASK] financially, the [MASK]ful students whogn [MASK] right through [MASK] pathetic teachers\'pomp, the pettiness of the whole situation, distinction remind me of the schools i knew and their students. when i saw [MASK] episode in [MASK] a student repeatedly tried to burn down the school, [MASK] immediately recalled. [MASK]...'
-
-'>>> .... at.. [MASK]... [MASK]... high. a classic line plucked inspector : i\'[MASK] here to [MASK] one of your [MASK]. student : welcome to bromwell [MASK]. i expect that many adults of my age think that [MASK]mwell [MASK] is [MASK] fetched. what a pity that it isn\'t! [SEP] [CLS] [MASK]ness ( or [MASK]lessness as george 宇in stated )公 been an issue for years but never [MASK] plan to help those on the street that were once considered human [MASK] did everything from going to school, [MASK], [MASK] vote for the matter. most people think [MASK] the homeless'
-```
-
-Frumos, a funcționat! Putem vedea că tokenul `[MASK]` a fost inserat aleatoriu în diferite locuri din textul nostru. Acestea vor fi tokenii pe care modelul nostru va trebui să le prezică în timpul antrenamentului - iar frumusețea data collatorului este că va introduce aleatoriu tokenul `[MASK]` cu fiecare batch!
-
-<Tip>
-
-✏️ **Încercați!** Rulați fragmentul de cod de mai sus de mai multe ori pentru a vedea cum se întâmplă mascarea aleatorie în fața ochilor voștri! De asemenea, înlocuiți metoda `tokenizer.decode()` cu `tokenizer.convert_ids_to_tokens()` pentru a vedea că uneori un singur token dintr-un cuvânt dat este mascat, și nu celelalte.
-
-</Tip>
-
-{#if fw === 'pt'}
-
-Un efect secundar al mascării aleatorii este faptul că metricile noastre de evaluare nu vor fi deterministe atunci când folosim `Trainer`, deoarece folosim același data collator pentru seturile de antrenare și testare. Vom vedea mai târziu, când ne vom uita la aplicarea fine-tuningului cu 🤗 Accelerate, cum putem folosi flexibilitatea unei bucle de evaluare personalizate pentru a îngheța caracterul aleatoriu.
-
-{/if}
-
-La antrenarea modelelor pentru modelarea limbajului mascat, o tehnică care poate fi utilizată este mascarea cuvintelor întregi împreună, nu doar a tokenilor individuali. Această abordare se numește _whole word masking_. Dacă dorim să utilizăm mascarea întregului cuvânt, va trebui să construim noi înșine un data collator. Un data collator este doar o funcție care preia o listă de sampleuri și le convertește într-un batch, așa că hai să facem asta acum! Vom utiliza ID-urile cuvintelor calculate mai devreme pentru a realiza o hartă între indicii cuvintelor și tokenii corespunzători, apoi vom decide aleatoriu ce cuvinte să mascăm și vom aplica masca respectivă asupra inputurilor. Rețineți că labelurile sunt toate `-100`, cu excepția celor care corespund cuvintelor mascate.
-
-{#if fw === 'pt'}
-
-```py
-import collections
-import numpy as np
-
-from transformers import default_data_collator
-
-wwm_probability = 0.2
-
-
-def whole_word_masking_data_collator(features):
-    for feature in features:
-        word_ids = feature.pop("word_ids")
-
-        # Create a map between words and corresponding token indices
-        mapping = collections.defaultdict(list)
-        current_word_index = -1
-        current_word = None
-        for idx, word_id in enumerate(word_ids):
-            if word_id is not None:
-                if word_id != current_word:
-                    current_word = word_id
-                    current_word_index += 1
-                mapping[current_word_index].append(idx)
-
-        # Randomly mask words
-        mask = np.random.binomial(1, wwm_probability, (len(mapping),))
-        input_ids = feature["input_ids"]
-        labels = feature["labels"]
-        new_labels = [-100] * len(labels)
-        for word_id in np.where(mask)[0]:
-            word_id = word_id.item()
-            for idx in mapping[word_id]:
-                new_labels[idx] = labels[idx]
-                input_ids[idx] = tokenizer.mask_token_id
-        feature["labels"] = new_labels
-
-    return default_data_collator(features)
-```
-
-{:else}
-
-```py
-import collections
-import numpy as np
-
-from transformers.data.data_collator import tf_default_data_collator
-
-wwm_probability = 0.2
-
-
-def whole_word_masking_data_collator(features):
-    for feature in features:
-        word_ids = feature.pop("word_ids")
-
-        # Create a map between words and corresponding token indices
-        mapping = collections.defaultdict(list)
-        current_word_index = -1
-        current_word = None
-        for idx, word_id in enumerate(word_ids):
-            if word_id is not None:
-                if word_id != current_word:
-                    current_word = word_id
-                    current_word_index += 1
-                mapping[current_word_index].append(idx)
-
-        # Randomly mask words
-        mask = np.random.binomial(1, wwm_probability, (len(mapping),))
-        input_ids = feature["input_ids"]
-        labels = feature["labels"]
-        new_labels = [-100] * len(labels)
-        for word_id in np.where(mask)[0]:
-            word_id = word_id.item()
-            for idx in mapping[word_id]:
-                new_labels[idx] = labels[idx]
-                input_ids[idx] = tokenizer.mask_token_id
-        feature["labels"] = new_labels
-
-    return tf_default_data_collator(features)
-```
-
-{/if}
-
-În continuare, îl putem încerca pe aceleași sampleuri ca înainte:
-
-```py
-samples = [lm_datasets["train"][i] for i in range(2)]
-batch = whole_word_masking_data_collator(samples)
-
-for chunk in batch["input_ids"]:
-    print(f"\n'>>> {tokenizer.decode(chunk)}'")
-```
-
-```python out
-'>>> [CLS] bromwell high is a cartoon comedy [MASK] it ran at the same time as some other programs about school life, such as " teachers ". my 35 years in the teaching profession lead me to believe that bromwell high\'s satire is much closer to reality than is " teachers ". the scramble to survive financially, the insightful students who can see right through their pathetic teachers\'pomp, the pettiness of the whole situation, all remind me of the schools i knew and their students. when i saw the episode in which a student repeatedly tried to burn down the school, i immediately recalled.....'
-
-'>>> .... [MASK] [MASK] [MASK] [MASK]....... high. a classic line : inspector : i\'m here to sack one of your teachers. student : welcome to bromwell high. i expect that many adults of my age think that bromwell high is far fetched. what a pity that it isn\'t! [SEP] [CLS] homelessness ( or houselessness as george carlin stated ) has been an issue for years but never a plan to help those on the street that were once considered human who did everything from going to school, work, or vote for the matter. most people think of the homeless'
-```
-
-<Tip>
-
-✏️ **Încercați!** Rulați fragmentul de cod de mai sus de mai multe ori pentru a vedea cum se întâmplă mascarea aleatorie în fața ochilor voștri! De asemenea, înlocuiți metoda `tokenizer.decode()` cu `tokenizer.convert_ids_to_tokens()` pentru a vedea că tokenii dintr-un cuvânt dat sunt întotdeauna mascați împreună.
-
-</Tip>
-
-Acum, că avem două data collators, restul pașilor fine-tuning sunt standard. Pregătirea poate dura ceva timp pe Google Colab dacă nu sunteți suficient de norocos să obțineți un GPU P100 mitic 😭, așa că vom reduce mai întâi dimensiunea setului de antrenare la câteva mii de exemple. Nu vă faceți griji, vom obține în continuare un model lingvistic destul de decent! O modalitate rapidă de a reduce sampleurile unui dataset în 🤗 Datasets este prin intermediul funcției `Dataset.train_test_split()` pe care am văzut-o în [Capitolul 5](/course/chapter5):
-
-```python
-train_size = 10_000
-test_size = int(0.1 * train_size)
-
-downsampled_dataset = lm_datasets["train"].train_test_split(
-    train_size=train_size, test_size=test_size, seed=42
-)
-downsampled_dataset
-```
-
-```python out
-DatasetDict({
-    train: Dataset({
-        features: ['attention_mask', 'input_ids', 'labels', 'word_ids'],
-        num_rows: 10000
-    })
-    test: Dataset({
-        features: ['attention_mask', 'input_ids', 'labels', 'word_ids'],
-        num_rows: 1000
-    })
-})
-```
-
-Acest lucru a creat în mod automat noi splituri de `train` și `test`, cu dimensiunea setului de antrenare setată la 10.000 de exemple și a setului de validare la 10% din aceasta - nu ezitați să măriți această valoare dacă aveți un GPU puternic! Următorul lucru pe care trebuie să îl facem este să ne conectăm la Hugging Face Hub. Dacă executați acest cod într-un notebook, puteți face acest lucru cu următoarea funcție utilitară:
-
-```python
-from huggingface_hub import notebook_login
-
-notebook_login()
-```
-
-care va afișa un widget în care vă puteți introduce credențialele. Alternativ, puteți rula:
-
-```
-huggingface-cli login
-```
-
-in your favorite terminal and log in there. 
-
-{#if fw === 'tf'}
-
-Odată ce ne-am conectat, putem crea dataseturile `tf.data`. Pentru a face acest lucru, vom utiliza metoda `prepare_tf_dataset()`, care utilizează modelul nostru pentru a deduce automat ce coloane ar trebui să intre în dataset. Dacă doriți să controlați exact ce coloane să utilizați, puteți folosi în schimb metoda `Dataset.to_tf_dataset()`. Pentru a simplifica lucrurile, vom utiliza aici doar data collatorul standard, dar puteți încerca și whole word masking collator și puteți compara rezultatele ca un exercițiu:
-
-```python
-tf_train_dataset = model.prepare_tf_dataset(
-    downsampled_dataset["train"],
-    collate_fn=data_collator,
-    shuffle=True,
-    batch_size=32,
-)
-
-tf_eval_dataset = model.prepare_tf_dataset(
-    downsampled_dataset["test"],
-    collate_fn=data_collator,
-    shuffle=False,
-    batch_size=32,
-)
-```
-
-În continuare, setăm hiperparametrii de antrenare și compilăm modelul nostru. Utilizăm funcția `create_optimizer()` din biblioteca 🤗 Transformers, care ne oferă un optimizator `AdamW` cu o scădere liniară a ratei de învățare. Utilizăm, de asemenea, pierderea încorporată în model, care este cea implicită atunci când nu este specificată nicio pierdere ca argument pentru `compile()`, și setăm precizia de antrenare la `"mixed_float16"`. Rețineți că, dacă utilizați un GPU Colab sau alt GPU care nu are suport accelerat pentru float16, ar trebui probabil să comentați această linie.
-
-În plus, am configurat un `PushToHubCallback` care va salva modelul în Hub după fiecare epocă. Puteți specifica numele repositoriului către care doriți să faceți push cu argumentul `hub_model_id` (în special, va trebui să utilizați acest argument pentru a face push către o organizație). De exemplu, pentru a trimite modelul către organizația [`huggingface-course`](https://huggingface.co/huggingface-course), am adăugat `hub_model_id="huggingface-course/distilbert-finetuned-imdb"`. În mod implicit, repositoriul utilizat va fi în namespaceul vostru și numit după output directory-ul pe care l-ați stabilit, deci în cazul nostru va fi `"lewtun/distilbert-finetuned-imdb"`.
-
-```python
-from transformers import create_optimizer
-from transformers.keras_callbacks import PushToHubCallback
-import tensorflow as tf
-
-num_train_steps = len(tf_train_dataset)
-optimizer, schedule = create_optimizer(
-    init_lr=2e-5,
-    num_warmup_steps=1_000,
-    num_train_steps=num_train_steps,
-    weight_decay_rate=0.01,
-)
-model.compile(optimizer=optimizer)
-
-# Train in mixed-precision float16
-tf.keras.mixed_precision.set_global_policy("mixed_float16")
-
-model_name = model_checkpoint.split("/")[-1]
-callback = PushToHubCallback(
-    output_dir=f"{model_name}-finetuned-imdb", tokenizer=tokenizer
-)
-```
-
-Acum suntem gata să executăm `model.fit()` - dar înainte de a face acest lucru, să ne uităm pe scurt la _perplexitate_, care este o metrică comună pentru a evalua performanța modelelor de limbaj.
-
-{:else}
-
-Odată ce suntem conectați, putem specifica argumentele pentru `Trainer`:
-
-```python
-from transformers import TrainingArguments
-
-batch_size = 64
-# Show the training loss with every epoch
-logging_steps = len(downsampled_dataset["train"]) // batch_size
-model_name = model_checkpoint.split("/")[-1]
-
-training_args = TrainingArguments(
-    output_dir=f"{model_name}-finetuned-imdb",
-    overwrite_output_dir=True,
-    evaluation_strategy="epoch",
-    learning_rate=2e-5,
-    weight_decay=0.01,
-    per_device_train_batch_size=batch_size,
-    per_device_eval_batch_size=batch_size,
-    push_to_hub=True,
-    fp16=True,
-    logging_steps=logging_steps,
-)
-```
-
-Aici am modificat câteva dintre opțiunile implicite, inclusiv `logging_steps` pentru a ne asigura că urmărim pierderea de antrenare cu fiecare epocă. De asemenea, am folosit `fp16=True` pentru a activa antrenarea cu precizie mixtă, ceea ce ne oferă un alt impuls vitezei. În mod implicit, `Trainer` va elimina toate coloanele care nu fac parte din metoda `forward()` a modelului. Aceasta înseamnă că, dacă utilizați whole word masking collator, va trebui să setați și `remove_unused_columns=False` pentru a vă asigura că nu pierdem coloana `word_ids` în timpul antrenamentului.
-
-Rețineți că puteți specifica numele repositoriului către care doriți să faceți push cu argumentul `hub_model_id` (în special, va trebui să utilizați acest argument pentru a face push către o organizație). De exemplu, atunci când am făcut push modelului către organizația [`huggingface-course`](https://huggingface.co/huggingface-course), am adăugat `hub_model_id="huggingface-course/distilbert-finetuned-imdb"` la `TrainingArguments`. În mod implicit, repositoriul utilizat va fi în namespaceul vostru și denumit după output directory-ul pe care l-ați stabilit, deci în cazul nostru va fi `"lewtun/distilbert-finetuned-imdb"`.
-
-Acum avem toate ingredientele pentru inițializarea `Trainer`. Aici folosim doar `data_collator` standard, dar puteți încerca whole word masking collator și să comparați rezultatele ca un exercițiu:
-
-```python
-from transformers import Trainer
-
-trainer = Trainer(
-    model=model,
-    args=training_args,
-    train_dataset=downsampled_dataset["train"],
-    eval_dataset=downsampled_dataset["test"],
-    data_collator=data_collator,
-    tokenizer=tokenizer,
-)
-```
-
-Acum suntem gata să rulăm `trainer.train()` - dar înainte de a face acest lucru, să analizăm pe scurt _perplexitatea_, care este o metrică comună de evaluare a performanței modelelor de limbaj.
-
-{/if}
-
-### Perplexity pentru language models[[perplexity-for-language-models]]
-
-<Youtube id="NURcDHhYe98"/>
-
-Spre deosebire de alte sarcini, cum ar fi clasificarea textului sau răspunderea la întrebări, unde ni se oferă un corpus labeled pe care să antrenăm, cu modelarea limbajului nu avem labeluri explicite. Așadar, cum determinăm ce face un model lingvistic bun? La fel ca în cazul funcției de autocorectare din telefon, un model lingvistic bun este unul care atribuie probabilități ridicate propozițiilor corecte din punct de vedere gramatical și probabilități scăzute propozițiilor fără sens. Pentru a vă face o idee mai bună despre cum arată acest lucru, puteți găsi online seturi întregi de "autocorrect fails", în care modelul din telefonul unei persoane a produs niște completări destul de amuzante (și adesea nepotrivite)!
-
-{#if fw === 'pt'}
-
-Presupunând că setul nostru de testare constă în cea mai mare parte din propoziții corecte din punct de vedere gramatical, atunci o modalitate de a măsura calitatea modelului nostru lingvistic este de a calcula probabilitățile pe care le atribuie următorului cuvânt în toate propozițiile din setul de testare. Probabilitatea ridicată indică faptul că modelul nu este "surprins" sau "perplex" de exemplele nevăzute și sugerează că a învățat tiparele gramaticale de bază ale limbii. Există diverse definiții matematice ale perplexității, dar cea pe care o vom utiliza o definește ca the exponential of the cross-entropy loss. Astfel, putem calcula perplexitatea modelului nostru preantrenat utilizând funcția `Trainer.evaluate()` pentru a calcula pierderea de cross-entropy pe setul de testare și apoi luând exponențiala rezultatului:
-
-```python
-import math
-
-eval_results = trainer.evaluate()
-print(f">>> Perplexity: {math.exp(eval_results['eval_loss']):.2f}")
-```
-
-{:else}
-
-Presupunând că setul nostru de testare constă în cea mai mare parte din propoziții corecte din punct de vedere gramatical, atunci o modalitate de a măsura calitatea modelului nostru lingvistic este de a calcula probabilitățile pe care le atribuie următorului cuvânt în toate propozițiile din setul de testare. Probabilitățile ridicate indică faptul că modelul indică faptul că modelul nu este "surprins" sau "perplex" de exemplele nevăzute și sugerează că a învățat modelele de bază ale gramaticii limbii. Există diverse definiții matematice ale perplexității, dar cea pe care o vom folosi o definește ca the exponential of the cross-entropy loss. Astfel, putem calcula perplexitatea modelului nostru preantrenat folosind metoda `model.evaluate()` pentru a calcula pierderea de entropie încrucișată pe setul de testare și apoi luând exponențiala rezultatului:
-
-```python
-import math
-
-eval_loss = model.evaluate(tf_eval_dataset)
-print(f"Perplexity: {math.exp(eval_loss):.2f}")
-```
-
-{/if}
-
-```python out
->>> Perplexity: 21.75
-```
-
-Un scor de perplexitate mai mic înseamnă un model lingvistic mai bun, iar aici putem vedea că modelul nostru inițial are o valoare oarecum mare. Să vedem dacă o putem reduce prin fine-tuning! Pentru a face acest lucru, vom rula mai întâi bucla de antrenare:
-
-{#if fw === 'pt'}
-
-```python
-trainer.train()
-```
-
-{:else}
-
-```python
-model.fit(tf_train_dataset, validation_data=tf_eval_dataset, callbacks=[callback])
-```
-
-{/if}
-
-și apoi calculați perplexitatea rezultată pe setul de testare ca înainte:
-
-{#if fw === 'pt'}
-
-```python
-eval_results = trainer.evaluate()
-print(f">>> Perplexity: {math.exp(eval_results['eval_loss']):.2f}")
-```
-
-{:else}
-
-```python
-eval_loss = model.evaluate(tf_eval_dataset)
-print(f"Perplexity: {math.exp(eval_loss):.2f}")
-```
-
-{/if}
-
-```python out
->>> Perplexity: 11.32
-```
-
-Grozav - aceasta este o reducere destul de mare a perplexității, ceea ce ne spune că modelul a învățat ceva despre domeniul recenziilor de filme!
-
-{#if fw === 'pt'}
-
-Odată ce antrenarea este finalizată, putem trimite cardul modelului cu informațiile de antrenare către Hub (checkpointurile sunt salvate în timpul antrenare):
-
-```python
-trainer.push_to_hub()
-```
-
-{/if}
-
-<Tip>
-
-✏️ **Rândul tău!** Rulați antrenamentul de mai sus după schimbarea data collatorului cu whole word masking collator. Obțineți rezultate mai bune?
-
-</Tip>
-
-{#if fw === 'pt'} 
-
-În cazul nostru de utilizare, nu a fost nevoie să facem nimic special cu bucla de antrenare, dar în unele cazuri s-ar putea să fie nevoie să implementați o logică personalizată. Pentru aceste aplicații, puteți utiliza 🤗 Accelerate -- să aruncăm o privire!
-
-## Fine-tuningul DistilBERT cu 🤗 Accelerate[[fine-tuning-distilbert-with-accelerate]]
-
-Așa cum am văzut cu `Trainer`, fine-tuningul unui model de limbaj mascat este foarte asemănător cu exemplul de clasificare a textului din [Capitolul 3](/course/chapter3). De fapt, singura subtilitate este utilizarea unui data collator special, pe care l-am abordat mai devreme în această secțiune!
-
-Cu toate acestea, am văzut că `DataCollatorForLanguageModeling` aplică, de asemenea, o mascare aleatorie cu fiecare evaluare, astfel încât vom vedea unele fluctuații în scorurile noastre de perplexitate cu fiecare rulare de antrenament. O modalitate de a elimina această sursă de dezordine este de a aplica mascarea _o singură dată_ pe întregul set de teste și apoi de a utiliza data collatorul implicit din 🤗 Transformers pentru a colecta batch-urile în timpul evaluării. Pentru a vedea cum funcționează acest lucru, să implementăm o funcție simplă care aplică mascarea pe un batch, similară cu prima noastră întâlnire cu `DataCollatorForLanguageModeling`:
-
-```python
-def insert_random_mask(batch):
-    features = [dict(zip(batch, t)) for t in zip(*batch.values())]
-    masked_inputs = data_collator(features)
-    # Create a new "masked" column for each column in the dataset
-    return {"masked_" + k: v.numpy() for k, v in masked_inputs.items()}
-```
-
-În continuare, vom aplica această funcție setului nostru de testare și vom elimina coloanele nemascate pentru a le putea înlocui cu cele mascate. Puteți utiliza whole word masking prin înlocuirea `data_collator` de mai sus cu cel corespunzător, caz în care trebuie să eliminați prima linie de aici:
-
-```py
-downsampled_dataset = downsampled_dataset.remove_columns(["word_ids"])
-eval_dataset = downsampled_dataset["test"].map(
-    insert_random_mask,
-    batched=True,
-    remove_columns=downsampled_dataset["test"].column_names,
-)
-eval_dataset = eval_dataset.rename_columns(
-    {
-        "masked_input_ids": "input_ids",
-        "masked_attention_mask": "attention_mask",
-        "masked_labels": "labels",
-    }
-)
-```
-
-Putem configura apoi dataloaderele ca de obicei, dar vom folosi `default_data_collator` de la 🤗 Transformers pentru setul de evaluare:
-
-```python
-from torch.utils.data import DataLoader
-from transformers import default_data_collator
-
-batch_size = 64
-train_dataloader = DataLoader(
-    downsampled_dataset["train"],
-    shuffle=True,
-    batch_size=batch_size,
-    collate_fn=data_collator,
-)
-eval_dataloader = DataLoader(
-    eval_dataset, batch_size=batch_size, collate_fn=default_data_collator
-)
-```
-
-De aici, vom urma pașii standard cu 🤗 Accelerate. În primul rând, se încarcă o versiune nouă a modelului antrenat:
-
-```
-model = AutoModelForMaskedLM.from_pretrained(model_checkpoint)
-```
-
-Apoi trebuie să specificăm optimizatorul; vom folosi standardul `AdamW`:
-
-```python
-from torch.optim import AdamW
-
-optimizer = AdamW(model.parameters(), lr=5e-5)
-```
-
-Cu aceste obiecte, acum putem pregăti totul pentru antrenare cu obiectul `Accelerator`:
-
-```python
-from accelerate import Accelerator
-
-accelerator = Accelerator()
-model, optimizer, train_dataloader, eval_dataloader = accelerator.prepare(
-    model, optimizer, train_dataloader, eval_dataloader
-)
-```
-
-Acum că modelul, optimizatorul și dataloaderul sunt configurate, putem specifica learning rate schedulerul cum urmează:
-
-```python
-from transformers import get_scheduler
-
-num_train_epochs = 3
-num_update_steps_per_epoch = len(train_dataloader)
-num_training_steps = num_train_epochs * num_update_steps_per_epoch
-
-lr_scheduler = get_scheduler(
-    "linear",
-    optimizer=optimizer,
-    num_warmup_steps=0,
-    num_training_steps=num_training_steps,
-)
-```
-
-Mai este un singur lucru de făcut înainte de antrenare: creați un repositoriu de modele pe Hugging Face Hub! Putem utiliza biblioteca 🤗 Hub pentru a genera mai întâi numele complet al repositoriul nostru:
-
-```python
-from huggingface_hub import get_full_repo_name
-
-model_name = "distilbert-base-uncased-finetuned-imdb-accelerate"
-repo_name = get_full_repo_name(model_name)
-repo_name
-```
-
-```python out
-'lewtun/distilbert-base-uncased-finetuned-imdb-accelerate'
-```
-
-apoi creați și clonați repositoriul folosind clasa `Repository` din 🤗 Hub:
-
-```python
-from huggingface_hub import Repository
-
-output_dir = model_name
-repo = Repository(output_dir, clone_from=repo_name)
-```
-
-Odată făcut acest lucru, este doar o chestiune simplă de scriere a ciclului complet de antrenare și evaluare:
-
-```python
-from tqdm.auto import tqdm
-import torch
-import math
-
-progress_bar = tqdm(range(num_training_steps))
-
-for epoch in range(num_train_epochs):
-    # Training
-    model.train()
-    for batch in train_dataloader:
-        outputs = model(**batch)
-        loss = outputs.loss
-        accelerator.backward(loss)
-
-        optimizer.step()
-        lr_scheduler.step()
-        optimizer.zero_grad()
-        progress_bar.update(1)
-
-    # Evaluation
-    model.eval()
-    losses = []
-    for step, batch in enumerate(eval_dataloader):
-        with torch.no_grad():
-            outputs = model(**batch)
-
-        loss = outputs.loss
-        losses.append(accelerator.gather(loss.repeat(batch_size)))
-
-    losses = torch.cat(losses)
-    losses = losses[: len(eval_dataset)]
-    try:
-        perplexity = math.exp(torch.mean(losses))
-    except OverflowError:
-        perplexity = float("inf")
-
-    print(f">>> Epoch {epoch}: Perplexity: {perplexity}")
-
-    # Save and upload
-    accelerator.wait_for_everyone()
-    unwrapped_model = accelerator.unwrap_model(model)
-    unwrapped_model.save_pretrained(output_dir, save_function=accelerator.save)
-    if accelerator.is_main_process:
-        tokenizer.save_pretrained(output_dir)
-        repo.push_to_hub(
-            commit_message=f"Training in progress epoch {epoch}", blocking=False
-        )
-```
-
-```python out
->>> Epoch 0: Perplexity: 11.397545307900472
->>> Epoch 1: Perplexity: 10.904909330983092
->>> Epoch 2: Perplexity: 10.729503505340409
-```
-
-Mișto, am reușit să evaluăm perplexitatea cu fiecare epocă și să ne asigurăm că mai multe runde de antrenament sunt reproductibile!
-
-{/if}
-
-## Utilizarea modelului fine-tuned[[using-our-fine-tuned-model]]
-
-Puteți interacționa cu modelul vostru fine-tuned utilizând widgetul său de pe Hub, fie local cu `pipeline` din 🤗 Transformers. Să folosim aceasta din urmă pentru a descărca modelul nostru folosind pipelineuul `fill-mask`:
-
-```python
-from transformers import pipeline
-
-mask_filler = pipeline(
-    "fill-mask", model="huggingface-course/distilbert-base-uncased-finetuned-imdb"
-)
-```
-
-Putem apoi să alimentăm pipelineul cu exemplul nostru de text "This is a hrea [MASK]" și să vedem care sunt primele 5 predicții:
-
-```python
-preds = mask_filler(text)
-
-for pred in preds:
-    print(f">>> {pred['sequence']}")
-```
-
-```python out
-'>>> this is a great movie.'
-'>>> this is a great film.'
-'>>> this is a great story.'
-'>>> this is a great movies.'
-'>>> this is a great character.'
-```
-
-Frumos - modelul nostru și-a adaptat în mod clar weighturile pentru a prezice cuvintele care sunt asociate mai puternic cu filmele!
-
-<Youtube id="0Oxphw4Q9fo"/>
-
-Acest lucru încheie primul nostru experiment de antrenare a unui model lingvistic. În [secțiunea 6](/course/ro/chapter7/6) veți învăța cum să antrenați de la zero un model auto-regressive precum GPT-2; mergeți acolo dacă doriți să vedeți cum vă puteți preantrena propriul model Transformer!
-
-<Tip>
-
-✏️ **Încercați!** Pentru a cuantifica beneficiile adaptării domeniului, faceți fine-tune unui clasificator pe labelurile IMDb atât pentru checkpointurile DistilBERT preantrenate, cât și pentru cele fine-tuned. Dacă aveți nevoie de o recapitulare a clasificării textului, consultați [Capitolul 3](/course/chapter3).
-
-</Tip>
diff --git a/chapters/ro/chapter7/4.mdx b/chapters/ro/chapter7/4.mdx
deleted file mode 100644
index ae1098e58..000000000
--- a/chapters/ro/chapter7/4.mdx
+++ /dev/null
@@ -1,1001 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Traducere[[translation]]
-
-{#if fw === 'pt'}
-
-<CourseFloatingBanner chapter={7}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter7/section4_pt.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter7/section4_pt.ipynb"},
-]} />
-
-{:else}
-
-<CourseFloatingBanner chapter={7}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter7/section4_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter7/section4_tf.ipynb"},
-]} />
-
-{/if}
-
-Să trecem acum la traducere. Aceasta este o altă [sarcină de sequence-to-sequence](/course/chapter1/7), ceea ce înseamnă că este o problemă care poate fi formulată ca trecerea de la o secvență la alta. În acest sens, problema este destul de apropiată de [sumarizare](/course/chapter7/6) și ați putea adapta ceea ce vom vedea aici la alte probleme de la sequence-to-sequence, cum ar fi:
-
-- **Style transfer**: Crearea unui model care *traduce* texte scrise într-un anumit stil în altul (de exemplu, din formal în casual sau din engleza Shakespeariană în engleza modernă)
-- **Generative question answering**: Crearea unui model care generează răspunsuri la întrebări, fiind dat un context
-
-<Youtube id="1JvfrvZgi6c"/>
-
-Dacă aveți un corpus suficient de mare de texte în două (sau mai multe) limbi, puteți antrena un nou model de traducere de la zero, așa cum vom face în secțiunea despre [causal language modeling] (/course/chapter7/6). Cu toate acestea, va fi mai rapid să faceți fine-tune unui model de traducere existent, fie că este vorba de un model multilingv precum mT5 sau mBART, pe care doriți să îi faceți fine-tune pentru o anumită pereche de limbi, sau chiar un model specializat pentru traducerea dintr-o limbă în alta, pe care doriți să îl perfecționați pentru corpusul vostru specific.
-
-În această secțiune, vom pune face fine-tune unui model Marian preantrenat pentru a traduce din engleză în franceză (deoarece mulți dintre angajații Hugging Face vorbesc ambele limbi) pe [datasetul KDE4](https://huggingface.co/datasets/kde4), care este un set de fișiere localizate pentru [KDE apps](https://apps.kde.org/). Modelul pe care îl vom utiliza a fost preantrenat pe un corpus mare de texte în franceză și engleză preluate din [datasetul Opus](https://opus.nlpl.eu/), care conține de fapt datasetul KDE4. Dar chiar dacă modelul preantrenat pe care îl folosim a văzut aceste date în timpul preantrenării sale, vom vedea că putem obține o versiune mai bună a acestuia după fine-tuning.
-
-Odată ce am terminat, vom avea un model capabil să facă predicții ca acesta:
-
-<iframe src="https://course-demos-marian-finetuned-kde4-en-to-fr.hf.space" frameBorder="0" height="350" title="Gradio app" class="block dark:hidden container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
-
-<a class="flex justify-center" href="/huggingface-course/marian-finetuned-kde4-en-to-fr">
-<img class="block dark:hidden lg:w-3/5" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/modeleval-marian-finetuned-kde4-en-to-fr.png" alt="One-hot encoded labels pentru răspunderea la întrebări."/>
-<img class="hidden dark:block lg:w-3/5" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/modeleval-marian-finetuned-kde4-en-to-fr-dark.png" alt="One-hot encoded labels răspunderea la întrebări."/>
-</a>
-
-Ca și în secțiunile anterioare, puteți găsi modelul pe care îl vom antrena și încărca în Hub utilizând codul de mai jos și puteți verifica predicțiile acestuia [aici](https://huggingface.co/huggingface-course/marian-finetuned-kde4-en-to-fr?text=This+plugin+allows+you+to+automatically+translate+web+pages+between+several+languages.).
-
-## Pregătirea datelor[[preparing-the-data]]
-
-Pentru a face fine-tune sau a antrena un model de traducere de la zero, vom avea nevoie de un dataset adecvat pentru această sarcină. După cum am menționat anterior, vom utiliza [datasetul KDE4](https://huggingface.co/datasets/kde4) în această secțiune, dar puteți adapta codul pentru a utiliza propriile date destul de ușor, atâta timp cât aveți perechi de propoziții în cele două limbi din și în care doriți să traduceți. Consultați [Capitolul 5](/course/chapter5) dacă aveți nevoie de o reamintire a modului de încărcare a datelor personalizate într-un `Dataset`.
-
-### Datasetul KDE4[[the-kde4-dataset]]
-
-Ca de obicei, descărcăm datasetul nostru folosind funcția `load_dataset()`:
-
-```py
-from datasets import load_dataset
-
-raw_datasets = load_dataset("kde4", lang1="en", lang2="fr")
-```
-
-Dacă doriți să lucrați cu o pereche de limbi diferită, le puteți specifica prin codurile lor. Un total de 92 de limbi sunt disponibile pentru acest dataset; le puteți vedea pe toate prin extinderea labelurilor de limbă pe [dataset cardul acesteia](https://huggingface.co/datasets/kde4).
-
-<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/language_tags.png" alt="Limba disponibilă pentru datasetul KDE4." width="100%">
-
-Să aruncăm o privire la dataset:
-
-```py
-raw_datasets
-```
-
-```python out
-DatasetDict({
-    train: Dataset({
-        features: ['id', 'translation'],
-        num_rows: 210173
-    })
-})
-```
-
-Avem 210 173 de perechi de propoziții, dar într-o singură împărțire, deci va trebui să ne creăm propriul set de validare. Așa cum am văzut în [Capitolul 5](/course/chapter5), un `Dataset` are o metodă `train_test_split()` care ne poate ajuta. Vom furniza un seed pentru reproductibilitate:
-
-```py
-split_datasets = raw_datasets["train"].train_test_split(train_size=0.9, seed=20)
-split_datasets
-```
-
-```python out
-DatasetDict({
-    train: Dataset({
-        features: ['id', 'translation'],
-        num_rows: 189155
-    })
-    test: Dataset({
-        features: ['id', 'translation'],
-        num_rows: 21018
-    })
-})
-```
-
-Putem redenumi cheia `"test"` în `"validation"` astfel:
-
-```py
-split_datasets["validation"] = split_datasets.pop("test")
-```
-
-Acum să aruncăm o privire la un element al datasetului:
-
-```py
-split_datasets["train"][1]["translation"]
-```
-
-```python out
-{'en': 'Default to expanded threads',
- 'fr': 'Par défaut, développer les fils de discussion'}
-```
-
-Obținem un dicționar cu două propoziții în perechea de limbi solicitate. O particularitate a acestui dataset plin de termeni tehnici din domeniul informaticii este că toate sunt traduse integral în franceză. Cu toate acestea, inginerii francezi lasă majoritatea cuvintelor specifice informaticii în engleză atunci când vorbesc. Aici, de exemplu, cuvântul "threads" ar putea foarte bine să apară într-o propoziție în limba franceză, în special într-o conversație tehnică; dar în acest dataset a fost tradus în "fils de discussion". Modelul preantrenat pe care îl folosim, care a fost preantrenat pe un corpus mai mare de propoziții în franceză și engleză, alege opțiunea mai ușoară de a lăsa cuvântul așa cum este:
-
-```py
-from transformers import pipeline
-
-model_checkpoint = "Helsinki-NLP/opus-mt-en-fr"
-translator = pipeline("translation", model=model_checkpoint)
-translator("Default to expanded threads")
-```
-
-```python out
-[{'translation_text': 'Par défaut pour les threads élargis'}]
-```
-
-Un alt exemplu al acestui comportament poate fi văzut cu cuvântul "plugin", care nu este oficial un cuvânt francez, dar pe care majoritatea vorbitorilor nativi îl vor înțelege și nu se vor obosi să îl traducă.
-În datasetul KDE4, acest cuvânt a fost tradus în franceză în termenul puțin mai oficial "module d'extension":
-
-```py
-split_datasets["train"][172]["translation"]
-```
-
-```python out
-{'en': 'Unable to import %1 using the OFX importer plugin. This file is not the correct format.',
- 'fr': "Impossible d'importer %1 en utilisant le module d'extension d'importation OFX. Ce fichier n'a pas un format correct."}
-```
-
-Modelul nostru preantrenat, cu toate acestea, rămâne la cuvântul englez compact și familiar:
-
-```py
-translator(
-    "Unable to import %1 using the OFX importer plugin. This file is not the correct format."
-)
-```
-
-```python out
-[{'translation_text': "Impossible d'importer %1 en utilisant le plugin d'importateur OFX. Ce fichier n'est pas le bon format."}]
-```
-
-Va fi interesant de văzut dacă modelul nostru fine-tuned reține aceste particularități ale datasetului(spoiler alert: va reține).
-
-<Youtube id="0Oxphw4Q9fo"/>
-
-<Tip>
-
-✏️ **Rândul tău!** Un alt cuvânt englezesc care este adesea folosit în franceză este "email". Găsiți primul sample din datasetul de antrenare care utilizează acest cuvânt. Cum este tradus? Cum traduce modelul preantrenat aceeași propoziție în limba engleză?
-
-</Tip>
-
-### Procesarea datelor[[processing-the-data]]
-
-<Youtube id="XAR8jnZZuUs"/>
-
-Ar trebui să știți deja cum stă treaba: toate textele trebuie convertite în seturi de ID-uri token, astfel încât modelul să le poată înțelege. Pentru această sarcină, va trebui să tokenizăm atât inputurile, cât și targeturile. Prima noastră sarcină este să creăm obiectul `tokenizer`. După cum am menționat mai devreme, vom utiliza un model Marian preantrenat din engleză în franceză. Dacă încercați acest cod cu o altă pereche de limbi, asigurați-vă că adaptați checkpointul modelului. Organizația [Helsinki-NLP](https://huggingface.co/Helsinki-NLP) oferă mai mult de o mie de modele în mai multe limbi.
-
-```python
-from transformers import AutoTokenizer
-
-model_checkpoint = "Helsinki-NLP/opus-mt-en-fr"
-tokenizer = AutoTokenizer.from_pretrained(model_checkpoint, return_tensors="pt")
-```
-
-De asemenea, puteți înlocui `model_checkpoint` cu orice alt model preferat din [Hub](https://huggingface.co/models) sau cu un folder local în care ați salvat un model preantrenat și un tokenizer.
-
-<Tip>
-
-💡 Dacă utilizați un tokenizer multilingv, cum ar fi mBART, mBART-50 sau M2M100, va trebui să setați codurile de limbă ale inputurilor și targeturilor în tokenizer prin setarea `tokenizer.src_lang` și `tokenizer.tgt_lang` la valorile corecte.
-
-</Tip>
-
-Pregătirea datelor noastre este destul de simplă. Trebuie să rețineți un singur lucru; trebuie să vă asigurați că tokenizerul procesează targeturile în limba de ieșire (aici, franceză). Puteți face acest lucru trecând targeturile la argumentul `text_targets` al metodei `__call__` a tokenizerului.
-
-Pentru a vedea cum funcționează acest lucru, să procesăm un sample din fiecare limbă din setul de antrenare:
-
-```python
-en_sentence = split_datasets["train"][1]["translation"]["en"]
-fr_sentence = split_datasets["train"][1]["translation"]["fr"]
-
-inputs = tokenizer(en_sentence, text_target=fr_sentence)
-inputs
-```
-
-```python out
-{'input_ids': [47591, 12, 9842, 19634, 9, 0], 'attention_mask': [1, 1, 1, 1, 1, 1], 'labels': [577, 5891, 2, 3184, 16, 2542, 5, 1710, 0]}
-```
-
-După cum putem vedea, rezultatul conține ID-urile de input asociate cu propoziția în limba engleză, în timp ce ID-urile asociate cu cea în limba franceză sunt stocate în câmpul `labels`. Dacă uitați să indicați că tokenizați labelurile, acestea vor fi tokenizate de către tokenizerul de input, ceea ce în cazul unui model Marian nu va merge deloc bine:
-
-```python
-wrong_targets = tokenizer(fr_sentence)
-print(tokenizer.convert_ids_to_tokens(wrong_targets["input_ids"]))
-print(tokenizer.convert_ids_to_tokens(inputs["labels"]))
-```
-
-```python out
-['▁Par', '▁dé', 'f', 'aut', ',', '▁dé', 've', 'lop', 'per', '▁les', '▁fil', 's', '▁de', '▁discussion', '</s>']
-['▁Par', '▁défaut', ',', '▁développer', '▁les', '▁fils', '▁de', '▁discussion', '</s>']
-```
-
-După cum se poate observa, utilizarea tokenizerului englez pentru preprocesarea unei propoziții franceze are ca rezultat mult mai mulți tokeni, deoarece tokenizerul nu cunoaște niciun cuvânt francez (cu excepția celor care apar și în limba engleză, precum "discussion").
-
-Deoarece `inputs` este un dicționar cu cheile noastre obișnuite (ID-uri de input, attention mask etc.), ultimul pas este să definim funcția de preprocesare pe care o vom aplica dataseturilor:
-
-```python
-max_length = 128
-
-
-def preprocess_function(examples):
-    inputs = [ex["en"] for ex in examples["translation"]]
-    targets = [ex["fr"] for ex in examples["translation"]]
-    model_inputs = tokenizer(
-        inputs, text_target=targets, max_length=max_length, truncation=True
-    )
-    return model_inputs
-```
-
-Rețineți că am stabilit aceeași lungime maximă pentru inputurile și outputurile noastre. Deoarece textele cu care avem de-a face par destul de scurte, vom folosi 128.
-
-<Tip>
-
-💡 Dacă utilizați un model T5 (mai precis, unul dintre checkpointurile `t5-xxx`), modelul se va aștepta ca inputurile text să aibă un prefix care să indice sarcina în cauză, cum ar fi `translate: din engleză în franceză:`.
-
-</Tip>
-
-<Tip warning={true}>
-
-⚠️ Nu acordăm atenție attention maskului a targeturilor, deoarece modelul nu se va aștepta la aceasta. În schimb, labelurile corespunzătoare unui padding token trebuie setate la `-100`, astfel încât acestea să fie ignorate în calculul pierderilor. Acest lucru va fi făcut mai târziu de data collatorul nostru, deoarece aplicăm padding dinamic, dar dacă utilizați padding aici, ar trebui să adaptați funcția de preprocesare pentru a seta toate labelurile care corespund simbolului de padding la `-100`.
-
-</Tip>
-
-Acum putem aplica această preprocesare dintr-o singură dată pe toate diviziunile datasetului nostru:
-
-```py
-tokenized_datasets = split_datasets.map(
-    preprocess_function,
-    batched=True,
-    remove_columns=split_datasets["train"].column_names,
-)
-```
-
-Acum că datele au fost preprocesate, suntem pregătiți să facem fine-tune modelul nostru preantrenat!
-
-{#if fw === 'pt'}
-
-## Fine-tuningul modelului cu API-ul `Trainer`[[fine-tuning-the-model-with-the-trainer-api]]
-
-Codul real care utilizează `Trainer` va fi același ca înainte, cu o singură mică schimbare: folosim aici un [`Seq2SeqTrainer`](https://huggingface.co/transformers/main_classes/trainer.html#seq2seqtrainer), care este o subclasă a `Trainer` care ne va permite să ne ocupăm în mod corespunzător de evaluare, folosind metoda `generate()` pentru a prezice rezultatele din inputuri. Vom analiza acest aspect mai în detaliu atunci când vom vorbi despre calculul metricelor.
-
-În primul rând, avem nevoie de un model pe care să îl aplicăm fine-tuningul. Vom utiliza API-ul obișnuit `AutoModel`:
-
-```py
-from transformers import AutoModelForSeq2SeqLM
-
-model = AutoModelForSeq2SeqLM.from_pretrained(model_checkpoint)
-```
-
-{:else}
-
-## Fine-tuningul modelului cu Keras[[fine-tuning-the-model-with-keras]]
-
-În primul rând, avem nevoie de un model pe care să îl aplicăm fine-tuningul. Vom folosi API-ul obișnuit `AutoModel`:
-
-```py
-from transformers import TFAutoModelForSeq2SeqLM
-
-model = TFAutoModelForSeq2SeqLM.from_pretrained(model_checkpoint, from_pt=True)
-```
-
-<Tip warning={false}>
-
-💡 Checkpointul `Helsinki-NLP/opus-mt-en-fr` are doar weighturi PyTorch, deci
-veți primi o eroare dacă încercați să încărcați modelul fără a utiliza argumentul
-`from_pt=True` în metoda `from_pretrained()`. Atunci când specificați
-`from_pt=True`, biblioteca va descărca și va converti automat
-weighturile PyTorch pentru voi. După cum puteți vedea, este foarte simplu să vă schimbați între
-frameworkuri în 🤗 Transformers!
-
-</Tip>
-
-{/if}
-
-Rețineți că de data aceasta folosim un model care a fost antrenat pe o sarcină de traducere și care poate fi utilizat deja, astfel încât nu există niciun avertisment cu privire la weighturile lipsă sau la cele nou inițializate.
-
-### Data collation[[data-collation]]
-
-Vom avea nevoie de un data collator care să se ocupe de paddingul pentru batching-ul dinamic. Nu putem folosi un `DataCollatorWithPadding` ca în [Capitolul 3](/course/chapter3) în acest caz, pentru că acesta doar face padding inputurilor (input Is, attention mask și token type IDs). Labelurile noastre ar trebui, de asemenea, să fie padded la lungimea maximă întâlnită în labeluri. Și, așa cum am menționat anterior, valoarea de padding utilizată pentru a face padding labelurilor ar trebui să fie `-100` și nu padding tokenul tokenizerului, pentru a ne asigura că aceste valori de padding sunt ignorate în calculul pierderilor.
-
-Toate acestea sunt realizate de un [`DataCollatorForSeq2Seq`](https://huggingface.co/transformers/main_classes/data_collator.html#datacollatorforseq2seq). Ca și `DataCollatorWithPadding`, acesta preia `tokenizer` utilizat pentru preprocesarea inputurilor, dar preia și `modelul`. Acest lucru se datorează faptului că acest data collator va fi, de asemenea, responsabil de pregătirea ID-urilor de input ale decoderului, care sunt versiuni schimbate ale labelurilor cu un token special la început. Deoarece această schimbare se face ușor diferit pentru diferite arhitecturi, `DataCollatorForSeq2Seq` trebuie să cunoască obiectul `model`:
-
-{#if fw === 'pt'}
-
-```py
-from transformers import DataCollatorForSeq2Seq
-
-data_collator = DataCollatorForSeq2Seq(tokenizer, model=model)
-```
-
-{:else}
-
-```py
-from transformers import DataCollatorForSeq2Seq
-
-data_collator = DataCollatorForSeq2Seq(tokenizer, model=model, return_tensors="tf")
-```
-
-{/if}
-
-Pentru a testa acest lucru pe câteva sampleuri, îl apelăm doar pe o listă de sampleuri din setul nostru de antrenare tokenizat:
-
-```py
-batch = data_collator([tokenized_datasets["train"][i] for i in range(1, 3)])
-batch.keys()
-```
-
-```python out
-dict_keys(['attention_mask', 'input_ids', 'labels', 'decoder_input_ids'])
-```
-
-Putem verifica dacă labelurile noastre au fost padded la lungimea maximă a batchului, folosind `-100`:
-
-```py
-batch["labels"]
-```
-
-```python out
-tensor([[  577,  5891,     2,  3184,    16,  2542,     5,  1710,     0,  -100,
-          -100,  -100,  -100,  -100,  -100,  -100],
-        [ 1211,     3,    49,  9409,  1211,     3, 29140,   817,  3124,   817,
-           550,  7032,  5821,  7907, 12649,     0]])
-```
-
-De asemenea, putem arunca o privire la ID-urile de input ale decoderului, pentru a vedea că acestea sunt versiuni schimbate ale labelurilor:
-
-```py
-batch["decoder_input_ids"]
-```
-
-```python out
-tensor([[59513,   577,  5891,     2,  3184,    16,  2542,     5,  1710,     0,
-         59513, 59513, 59513, 59513, 59513, 59513],
-        [59513,  1211,     3,    49,  9409,  1211,     3, 29140,   817,  3124,
-           817,   550,  7032,  5821,  7907, 12649]])
-```
-
-Iată labelurile pentru primul și al doilea element din datasetul nostru:
-
-```py
-for i in range(1, 3):
-    print(tokenized_datasets["train"][i]["labels"])
-```
-
-```python out
-[577, 5891, 2, 3184, 16, 2542, 5, 1710, 0]
-[1211, 3, 49, 9409, 1211, 3, 29140, 817, 3124, 817, 550, 7032, 5821, 7907, 12649, 0]
-```
-
-{#if fw === 'pt'}
-
-Vom transmite acest `data_collator` către `Seq2SeqTrainer`. În continuare, să aruncăm o privire la metrice.
-
-{:else}
-
-Acum putem folosi acest `data_collator` pentru a converti fiecare dintre dataseturile într-un `tf.data.Dataset`, gata pentru antrenare:
-
-```python
-tf_train_dataset = model.prepare_tf_dataset(
-    tokenized_datasets["train"],
-    collate_fn=data_collator,
-    shuffle=True,
-    batch_size=32,
-)
-tf_eval_dataset = model.prepare_tf_dataset(
-    tokenized_datasets["validation"],
-    collate_fn=data_collator,
-    shuffle=False,
-    batch_size=16,
-)
-```
-
-{/if}
-
-
-### Metrice[[metrics]]
-
-<Youtube id="M05L1DhFqcw"/>
-
-{#if fw === 'pt'}
-
-Caracteristica pe care `Seq2SeqTrainer` o adaugă superclasei sale `Trainer` este capacitatea de a utiliza metoda `generate()` în timpul evaluării sau predicției. În timpul antrenării, modelul va utiliza `decoder_input_ids` cu un attention mask care asigură că nu utilizează tokenii de după tokenul pe care încearcă să îl prezică, pentru a accelera antrenarea. În timpul inferenței, nu le vom putea utiliza deoarece nu vom avea labeluri, deci este o idee bună să ne evaluăm modelul cu aceeași configurație.
-
-După cum am văzut în [Capitolul 1](/course/chapter1/6), decoderul realizează inferența prin prezicerea tokenilor unul câte unul - lucru care este implementat behind the scenes în 🤗 Transformers prin metoda `generate()`. `Seq2SeqTrainer` ne va permite să folosim această metodă pentru evaluare dacă setăm `predict_with_generate=True`.
-
-{/if}
-
-Metricele tradiționale utilizate pentru traducere sunt [scorul BLEU](https://en.wikipedia.org/wiki/BLEU), introdus în [un articol din 2002](https://aclanthology.org/P02-1040.pdf) de Kishore Papineni et al. Scorul BLEU evaluează cât de apropiate sunt traducerile de labelurile lor. Acesta nu măsoară inteligibilitatea sau corectitudinea gramaticală a rezultatelor generate de model, ci utilizează reguli statistice pentru a se asigura că toate cuvintele din rezultatele generate apar și în targets. În plus, există reguli care penalizează repetițiile acelorași cuvinte dacă acestea nu sunt repetate și în targets(pentru a evita ca modelul să producă propoziții de tipul `"the the the the the the"`) și să producă propoziții care sunt mai scurte decât cele din targets(pentru a evita ca modelul să producă propoziții de tipul `"the"`).
-
-Un punct slab al BLEU este că se așteaptă ca textul să fie deja tokenizat, ceea ce face dificilă compararea scorurilor între modele care utilizează tokenizere diferite. În schimb, cea mai frecvent utilizată măsură pentru evaluarea comparativă a modelelor de traducere este [SacreBLEU](https://github.com/mjpost/sacrebleu), care abordează acest punct slab (și altele) prin standardizarea etapei de tokenizare. Pentru a utiliza această metrică, trebuie mai întâi să instalăm biblioteca SacreBLEU:
-
-```py
-!pip install sacrebleu
-```
-
-Îl putem încărca apoi prin `evaluate.load()` așa cum am făcut în [Capitolul 3](/course/chapter3):
-
-```py
-import evaluate
-
-metric = evaluate.load("sacrebleu")
-```
-
-Această metrică va lua texte ca inputuri și targeturi. Este conceput pentru a lua mai multe obiective acceptabile, deoarece există adesea mai multe traduceri acceptabile ale aceleiași propoziții - datasetul pe care îl folosim oferă doar una, dar nu este neobișnuit în NLP să găsim dataseturi care oferă mai multe propoziții ca labeluri. Deci, predicțiile ar trebui să fie o listă de propoziții, dar referințele ar trebui să fie o listă de liste de propoziții.
-
-Hai să încercăm acest exemplu:
-
-```py
-predictions = [
-    "This plugin lets you translate web pages between several languages automatically."
-]
-references = [
-    [
-        "This plugin allows you to automatically translate web pages between several languages."
-    ]
-]
-metric.compute(predictions=predictions, references=references)
-```
-
-```python out
-{'score': 46.750469682990165,
- 'counts': [11, 6, 4, 3],
- 'totals': [12, 11, 10, 9],
- 'precisions': [91.67, 54.54, 40.0, 33.33],
- 'bp': 0.9200444146293233,
- 'sys_len': 12,
- 'ref_len': 13}
-```
-
-Se obține un scor BLEU de 46,75, ceea ce este destul de bine - ca referință, modelul original Transformer din lucrarea ["Attention Is All You Need"](https://arxiv.org/pdf/1706.03762.pdf) a obținut un scor BLEU de 41,8 la o sarcină similară de traducere între engleză și franceză! (Pentru mai multe informații despre parametrii individuali, precum `counts` și `bp`, consultați [repositoriul SacreBLEU](https://github.com/mjpost/sacrebleu/blob/078c440168c6adc89ba75fe6d63f0d922d42bcfe/sacrebleu/metrics/bleu.py#L74).) Pe de altă parte, dacă încercăm cu cele două tipuri de predicții proaste (multe repetări sau prea scurte) care rezultă adesea din modelele de traducere, vom obține scoruri BLEU destul de proaste:
-
-```py
-predictions = ["This This This This"]
-references = [
-    [
-        "This plugin allows you to automatically translate web pages between several languages."
-    ]
-]
-metric.compute(predictions=predictions, references=references)
-```
-
-```python out
-{'score': 1.683602693167689,
- 'counts': [1, 0, 0, 0],
- 'totals': [4, 3, 2, 1],
- 'precisions': [25.0, 16.67, 12.5, 12.5],
- 'bp': 0.10539922456186433,
- 'sys_len': 4,
- 'ref_len': 13}
-```
-
-```py
-predictions = ["This plugin"]
-references = [
-    [
-        "This plugin allows you to automatically translate web pages between several languages."
-    ]
-]
-metric.compute(predictions=predictions, references=references)
-```
-
-```python out
-{'score': 0.0,
- 'counts': [2, 1, 0, 0],
- 'totals': [2, 1, 0, 0],
- 'precisions': [100.0, 100.0, 0.0, 0.0],
- 'bp': 0.004086771438464067,
- 'sys_len': 2,
- 'ref_len': 13}
-```
-
-Scorul poate varia de la 0 la 100, iar mai mare înseamnă un scor mai bun.
-
-{#if fw === 'tf'}
-
-Pentru a trece de la rezultatele modelului la texte pe care metricele le pot utiliza, vom utiliza metoda `tokenizer.batch_decode()`. Trebuie doar să curățăm toate `-100` din labeluri; tokenizerul va face automat același lucru pentru padding token. Să definim o funcție care să preia modelul nostru și un dataset și să calculeze metrici pe acesta. De asemenea, vom utiliza un truc care crește dramatic performanța - compilarea codului nostru de generare cu [XLA](https://www.tensorflow.org/xla), compilatorul accelerat de algebră liniară al TensorFlow. XLA aplică diverse optimizări graficului de calcul al modelului și are ca rezultat îmbunătățiri semnificative ale vitezei și utilizării memoriei. După cum se descrie în [blogul](https://huggingface.co/blog/tf-xla-generate) Hugging Face, XLA funcționează cel mai bine atunci când shaperulire noastre de input nu variază prea mult. Pentru a face față acestui lucru, vom aplica padding inputurilor cu multipli ai 128 și vom crea un nou dataset cu padding collatorul, iar apoi vom aplica decoratorul `@tf.function(jit_compile=True)` funcției noastre de generare, care marchează întreaga funcție pentru compilare cu XLA.
-
-```py
-import numpy as np
-import tensorflow as tf
-from tqdm import tqdm
-
-generation_data_collator = DataCollatorForSeq2Seq(
-    tokenizer, model=model, return_tensors="tf", pad_to_multiple_of=128
-)
-
-tf_generate_dataset = model.prepare_tf_dataset(
-    tokenized_datasets["validation"],
-    collate_fn=generation_data_collator,
-    shuffle=False,
-    batch_size=8,
-)
-
-
-@tf.function(jit_compile=True)
-def generate_with_xla(batch):
-    return model.generate(
-        input_ids=batch["input_ids"],
-        attention_mask=batch["attention_mask"],
-        max_new_tokens=128,
-    )
-
-
-def compute_metrics():
-    all_preds = []
-    all_labels = []
-
-    for batch, labels in tqdm(tf_generate_dataset):
-        predictions = generate_with_xla(batch)
-        decoded_preds = tokenizer.batch_decode(predictions, skip_special_tokens=True)
-        labels = labels.numpy()
-        labels = np.where(labels != -100, labels, tokenizer.pad_token_id)
-        decoded_labels = tokenizer.batch_decode(labels, skip_special_tokens=True)
-        decoded_preds = [pred.strip() for pred in decoded_preds]
-        decoded_labels = [[label.strip()] for label in decoded_labels]
-        all_preds.extend(decoded_preds)
-        all_labels.extend(decoded_labels)
-
-    result = metric.compute(predictions=all_preds, references=all_labels)
-    return {"bleu": result["score"]}
-```
-
-{:else}
-
-Pentru a trece de la rezultatele modelului la textele pe care metricele le pot utiliza, vom utiliza metoda `tokenizer.batch_decode()`. Trebuie doar să curățăm toate `-100` din labeluri(tokenizerul va face automat același lucru pentru padding token):
-
-```py
-import numpy as np
-
-
-def compute_metrics(eval_preds):
-    preds, labels = eval_preds
-    # In case the model returns more than the prediction logits
-    if isinstance(preds, tuple):
-        preds = preds[0]
-
-    decoded_preds = tokenizer.batch_decode(preds, skip_special_tokens=True)
-
-    # Replace -100s in the labels as we can't decode them
-    labels = np.where(labels != -100, labels, tokenizer.pad_token_id)
-    decoded_labels = tokenizer.batch_decode(labels, skip_special_tokens=True)
-
-    # Some simple post-processing
-    decoded_preds = [pred.strip() for pred in decoded_preds]
-    decoded_labels = [[label.strip()] for label in decoded_labels]
-
-    result = metric.compute(predictions=decoded_preds, references=decoded_labels)
-    return {"bleu": result["score"]}
-```
-
-{/if}
-
-Acum că am făcut acest lucru, suntem gata să facem fine-tune modelului!
-
-
-### Fine-tuningul modelului[[fine-tuning-the-model]]
-
-Primul pas pe care trebuie să îl faceți este să vă conectați la Hugging Face, astfel încât să vă puteți încărca rezultatele în Model Hub. Există o funcție convenabilă care vă ajuta cu acest lucru într-un notebook:
-
-```python
-from huggingface_hub import notebook_login
-
-notebook_login()
-```
-
-Aceasta va afișa un widget în care puteți introduce datele voastre de autentificare Hugging Face.
-
-Dacă nu lucrați într-un notebook, tastați următoarea linie în terminal:
-
-```bash
-huggingface-cli login
-```
-
-{#if fw === 'tf'}
-
-Înainte de a începe, să vedem ce fel de rezultate obținem de la modelul nostru fără niciun antrenament:
-
-```py
-print(compute_metrics())
-```
-
-```
-{'bleu': 33.26983701454733}
-```
-
-Odată făcut acest lucru, putem pregăti tot ce avem nevoie pentru a compila și antrena modelul nostru. Observați utilizarea `tf.keras.mixed_precision.set_global_policy("mixed_float16")` -- aceasta îi va spune lui Keras să se antreneze folosind float16, ceea ce poate oferi o creștere semnificativă a vitezei pe GPU-urile care o acceptă (Nvidia 20xx/V100 sau mai noi).
-
-```python
-from transformers import create_optimizer
-from transformers.keras_callbacks import PushToHubCallback
-import tensorflow as tf
-
-# Numărul etapelor de antrenare este numărul de sampleuri din dataset, împărțit la dimensiunea batchului, apoi înmulțit
-# cu numărul total de epoci. Rețineți că datasetul tf_train_dataset de aici este un dataset tf.data.Dataset în batchuri,
-# nu datasetul original Hugging Face, deci len() este deja num_samples // batch_size.
-num_epochs = 3
-num_train_steps = len(tf_train_dataset) * num_epochs
-
-optimizer, schedule = create_optimizer(
-    init_lr=5e-5,
-    num_warmup_steps=0,
-    num_train_steps=num_train_steps,
-    weight_decay_rate=0.01,
-)
-model.compile(optimizer=optimizer)
-
-# Antrenarea în float16 cu precizie mixtă
-tf.keras.mixed_precision.set_global_policy("mixed_float16")
-```
-
-În continuare, definim un `PushToHubCallback` pentru a încărca modelul nostru în Hub în timpul antrenamentului, așa cum am văzut în [secțiunea 2]((/course/chapter7/2)), iar apoi pur și simplu facem fit modelului cu acel callback:
-
-```python
-from transformers.keras_callbacks import PushToHubCallback
-
-callback = PushToHubCallback(
-    output_dir="marian-finetuned-kde4-en-to-fr", tokenizer=tokenizer
-)
-
-model.fit(
-    tf_train_dataset,
-    validation_data=tf_eval_dataset,
-    callbacks=[callback],
-    epochs=num_epochs,
-)
-```
-
-Rețineți că puteți specifica numele repositoriului către care doriți să faceți push cu argumentul `hub_model_id` (în special, va trebui să utilizați acest argument pentru a face push către o organizație). De exemplu, atunci când am trimis modelul către organizația [`huggingface-course`](https://huggingface.co/huggingface-course), am adăugat `hub_model_id="huggingface-course/marian-finetuned-kde4-en-to-fr"` la `Seq2SeqTrainingArguments`. În mod implicit, repositoriul utilizat va fi în namespaceul vostru și denumit după output directory-ul pe care l-ați stabilit, deci aici va fi `"sgugger/marian-finetuned-kde4-en-to-fr"` (care este modelul la care am făcut legătura la începutul acestei secțiuni).
-
-<Tip>
-
-💡 Dacă output directory-ul pe care îl utilizați există deja, acesta trebuie să fie o clonă locală a repositoriului către care doriți să faceți push. Dacă nu este, veți primi o eroare atunci când apelați `model.fit()` și va trebui să setați un nume nou.
-
-</Tip>
-
-În cele din urmă, hai să vedem cum arată metricele noastre acum că antrenarea s-a încheiat:
-
-```py
-print(compute_metrics())
-```
-
-```
-{'bleu': 57.334066271545865}
-```
-
-În acest moment, puteți utiliza widgetul de inferență de pe Model Hub pentru a testa modelul și pentru a-l partaja cu prietenii voștrii. Ați făcut fine-tune cu succes unui model pentru o sarcină de traducere - felicitări!
-
-{:else}
-
-Odată făcut acest lucru, putem defini `Seq2SeqTrainingArguments`. Ca și pentru `Trainer`, folosim o subclasă a `TrainingArguments` care conține câteva câmpuri suplimentare:
-
-```python
-from transformers import Seq2SeqTrainingArguments
-
-args = Seq2SeqTrainingArguments(
-    f"marian-finetuned-kde4-en-to-fr",
-    evaluation_strategy="no",
-    save_strategy="epoch",
-    learning_rate=2e-5,
-    per_device_train_batch_size=32,
-    per_device_eval_batch_size=64,
-    weight_decay=0.01,
-    save_total_limit=3,
-    num_train_epochs=3,
-    predict_with_generate=True,
-    fp16=True,
-    push_to_hub=True,
-)
-```
-
-În afară de hiperparametrii obișnuiți (cum ar fi rata de învățare, numărul de epoci, dimensiunea batch-ului și o anumită scădere a weighturilor), aici sunt câteva schimbări în comparație cu ceea ce am văzut în secțiunile anterioare:
-
-- Nu setăm nicio evaluare periodică, deoarece evaluarea durează; ne vom evalua modelul doar o dată înainte și după antrenare.
-- Setăm `fp16=True`, care accelerează antrenarea pe GPU-urile moderne.
-- Setăm `predict_with_generate=True`, așa cum am discutat mai sus.
-- Utilizăm `push_to_hub=True` pentru a încărca modelul în Hub la sfârșitul fiecărei epoci.
-
-Rețineți că puteți specifica numele complet al repositoriului către care doriți să faceți push cu argumentul `hub_model_id` (în special, va trebui să utilizați acest argument pentru a face push către o organizație). De exemplu, atunci când am trimis modelul către organizația [`huggingface-course`](https://huggingface.co/huggingface-course), am adăugat `hub_model_id="huggingface-course/marian-finetuned-kde4-en-to-fr"` la `Seq2SeqTrainingArguments`. În mod implicit, repositoriul utilizat va fi în namespaceul vostru și denumit după output directory-ul pe care l-ați stabilit, deci în cazul nostru va fi `"sgugger/marian-finetuned-kde4-en-to-fr"` (care este modelul la care am făcut legătura la începutul acestei secțiuni).
-
-<Tip>
-
-💡 Dacă output directory-ul pe care îl utilizați există deja, acesta trebuie să fie o clonă locală a repositoriului către care doriți să faceți push. În caz contrar, veți primi o eroare atunci când vă definiți `Seq2SeqTrainer` și va trebui să stabiliți un nume nou.
-
-</Tip>
-
-În final, transmitem totul către `Seq2SeqTrainer`:
-
-```python
-from transformers import Seq2SeqTrainer
-
-trainer = Seq2SeqTrainer(
-    model,
-    args,
-    train_dataset=tokenized_datasets["train"],
-    eval_dataset=tokenized_datasets["validation"],
-    data_collator=data_collator,
-    tokenizer=tokenizer,
-    compute_metrics=compute_metrics,
-)
-```
-
-Înainte de antrenare, ne vom uita mai întâi la scorul obținut de modelul nostru, pentru a verifica dacă nu înrăutățim lucrurile prin fine-tuning. Această comandă va dura ceva timp, așa că puteți lua o cafea sau două în timp ce se execută:
-
-```python
-trainer.evaluate(max_length=max_length)
-```
-
-```python out
-{'eval_loss': 1.6964408159255981,
- 'eval_bleu': 39.26865061007616,
- 'eval_runtime': 965.8884,
- 'eval_samples_per_second': 21.76,
- 'eval_steps_per_second': 0.341}
-```
-
-Un scor BLEU de 39 nu este prea rău, ceea ce reflectă faptul că modelul nostru este deja bun la traducerea propozițiilor din engleză în franceză.
-
-Urmează antrenarea, care va necesita, de asemenea, puțin timp:
-
-```python
-trainer.train()
-```
-
-Rețineți că, în timpul antrenamentului, de fiecare dată când modelul este salvat (aici, la fiecare epocă), acesta este încărcat în Hub în fundal. În acest fel, veți putea să reluați antrenarea pe o altă mașină, dacă este necesar.
-
-Odată ce formarea este terminată, evaluăm din nou modelul nostru - sperăm că vom vedea o îmbunătățire a scorului BLEU!
-
-```py
-trainer.evaluate(max_length=max_length)
-```
-
-```python out
-{'eval_loss': 0.8558505773544312,
- 'eval_bleu': 52.94161337775576,
- 'eval_runtime': 714.2576,
- 'eval_samples_per_second': 29.426,
- 'eval_steps_per_second': 0.461,
- 'epoch': 3.0}
-```
-
-Aceasta este o îmbunătățire de aproape 14 puncte, ceea ce este minunat.
-
-În final, folosim metoda `push_to_hub()` pentru a ne asigura că încărcăm cea mai recentă versiune a modelului. De asemenea, `Trainer` redactează un model card cu toate rezultatele evaluării și o încarcă. Acest model card conține metadate care ajută Model Hub să aleagă widgetul pentru demonstrația de inferență. De obicei, nu este nevoie să se menționeze nimic, deoarece poate deduce widgetul potrivit din clasa modelului, dar în acest caz, aceeași clasă de model poate fi utilizată pentru toate tipurile de probleme de tip sequence-to-sequence, așa că specificăm că este un model de traducere:
-
-```py
-trainer.push_to_hub(tags="translation", commit_message="Training complete")
-```
-
-Această comandă returnează URL-ul comitului pe care tocmai l-am făcut, dacă doriți să îl inspectați:
-
-```python out
-'https://huggingface.co/sgugger/marian-finetuned-kde4-en-to-fr/commit/3601d621e3baae2bc63d3311452535f8f58f6ef3'
-```
-
-În această etapă, puteți utiliza widget-ul de inferență de pe Model Hub pentru a vă testa modelul și pentru a-l partaja cu prietenii. Ați făcut fine-tune cu succes un model pentru o sarcină de traducere - felicitări!
-
-Dacă doriți să pătrundeți puțin mai adânc în bucla de antrenare, vă vom arăta acum să faceți același lucru folosind 🤗 Accelerate.
-
-{/if}
-
-{#if fw === 'pt'}
-
-## O buclă de antrenare personalizată[[a-custom-training-loop]]
-
-Să aruncăm acum o privire la bucla de antrenare completă, astfel încât să puteți personaliza cu ușurință părțile de care aveți nevoie. Va arăta foarte asemănător cu ceea ce am făcut în [secțiunea 2](/course/chapter7/2) și [capitolul 3](/course/chapter7/4).
-
-### Pregătirea tuturor lucrulilor pentru antrenare[[preparing-everything-for-training]]
-
-Ați văzut toate acestea de câteva ori până acum, așa că vom trece prin cod destul de repede. Mai întâi vom construi `DataLoader`s din dataseturile noastre, după ce vom seta dataseturile în formatul `"torch"` astfel încât să obținem tensori PyTorch:
-
-```py
-from torch.utils.data import DataLoader
-
-tokenized_datasets.set_format("torch")
-train_dataloader = DataLoader(
-    tokenized_datasets["train"],
-    shuffle=True,
-    collate_fn=data_collator,
-    batch_size=8,
-)
-eval_dataloader = DataLoader(
-    tokenized_datasets["validation"], collate_fn=data_collator, batch_size=8
-)
-```
-
-În continuare, reinițializăm modelul, pentru a ne asigura că nu continuăm fine-tuningul de dinainte, ci pornim din nou de la modelul preantrenat:
-
-```py
-model = AutoModelForSeq2SeqLM.from_pretrained(model_checkpoint)
-```
-
-Pe urmă vom avea nevoie de un optimizator:
-
-```py
-from transformers import AdamW
-
-optimizer = AdamW(model.parameters(), lr=2e-5)
-```
-
-Odată ce avem toate aceste obiecte, le putem trimite la metoda `accelerator.prepare()`. Amintiți-vă că, dacă doriți să vă antrenați pe un TPU într-un notebook Colab, va trebui să mutați tot acest cod într-o funcție de antrenare, care nu ar trebui să execute nicio celulă care inițializează un `Accelerator`.
-
-```py
-from accelerate import Accelerator
-
-accelerator = Accelerator()
-model, optimizer, train_dataloader, eval_dataloader = accelerator.prepare(
-    model, optimizer, train_dataloader, eval_dataloader
-)
-```
-
-Acum că am trimis `train_dataloader` la `accelerator.prepare()`, putem utiliza lungimea acestuia pentru a calcula numărul de pași de antrenare. Amintiți-vă că trebuie să facem acest lucru întotdeauna după pregătirea data loaderului, deoarece metoda respectivă va modifica lungimea `DataLoader`. Utilizăm un program liniar clasic de la rata de învățare la 0:
-
-```py
-from transformers import get_scheduler
-
-num_train_epochs = 3
-num_update_steps_per_epoch = len(train_dataloader)
-num_training_steps = num_train_epochs * num_update_steps_per_epoch
-
-lr_scheduler = get_scheduler(
-    "linear",
-    optimizer=optimizer,
-    num_warmup_steps=0,
-    num_training_steps=num_training_steps,
-)
-```
-
-În cele din urmă, pentru a trimite modelul nostru către Hub, va trebui să creăm un obiect `Repository` într-un folder de lucru. În primul rând, conectați-vă la Hugging Face Hub, dacă nu sunteți deja conectat. Vom determina numele repositoriului pornind de la ID-ul modelului pe care dorim să îl atribuim modelului nostru (nu ezitați să înlocuiți `repo_name` cu propria alegere; acesta trebuie doar să conțină numele vostru de utilizator, ceea ce face funcția `get_full_repo_name()`):
-
-```py
-from huggingface_hub import Repository, get_full_repo_name
-
-model_name = "marian-finetuned-kde4-en-to-fr-accelerate"
-repo_name = get_full_repo_name(model_name)
-repo_name
-```
-
-```python out
-'sgugger/marian-finetuned-kde4-en-to-fr-accelerate'
-```
-
-Apoi putem clona acel repositoriu într-un folder local. Dacă există deja, acest folder local ar trebui să fie o clonă a repositoriului cu care lucrăm:
-
-```py
-output_dir = "marian-finetuned-kde4-en-to-fr-accelerate"
-repo = Repository(output_dir, clone_from=repo_name)
-```
-
-Acum putem încărca orice salvăm în `output_dir` prin apelarea metodei `repo.push_to_hub()`. Acest lucru ne va ajuta să încărcăm modelele intermediare la sfârșitul fiecărei epoci.
-
-### Bucla de antrenare[[training-loop]]
-
-Acum suntem pregătiți să scriem bucla de antrenare completă. Pentru a simplifica partea de evaluare, definim această funcție `postprocess()` care preia predicțiile și labelurile și le convertește în liste de stringuri pe care obiectul nostru `metric` le va aștepta:
-
-```py
-def postprocess(predictions, labels):
-    predictions = predictions.cpu().numpy()
-    labels = labels.cpu().numpy()
-
-    decoded_preds = tokenizer.batch_decode(predictions, skip_special_tokens=True)
-
-    # Replace -100 in the labels as we can't decode them.
-    labels = np.where(labels != -100, labels, tokenizer.pad_token_id)
-    decoded_labels = tokenizer.batch_decode(labels, skip_special_tokens=True)
-
-    # Some simple post-processing
-    decoded_preds = [pred.strip() for pred in decoded_preds]
-    decoded_labels = [[label.strip()] for label in decoded_labels]
-    return decoded_preds, decoded_labels
-```
-
-Bucla de antrenare seamănă foarte mult cu cele din [secțiunea 2](/course/chapter7/2) și [capitolul 3](/course/chapter3), cu câteva diferențe în partea de evaluare - așa că hai să ne concentrăm pe asta!
-
-Primul lucru pe care îl putem remarca este că folosim metoda `generate()` pentru a calcula predicțiile, dar aceasta este o metodă a modelul nostru de bază, nu pe modelul wrapped 🤗 Accelerate creat în metoda `prepare()`. De aceea, mai întâi facem unwrap modelului, apoi apelăm această metodă.
-
-Al doilea lucru este că, la fel ca în cazul [token classification](/course/chapter7/2), este posibil ca două procese să fi făcut padding inputurilor și labelurilor cu forme diferite, așa că folosim `accelerator.pad_across_processes()` pentru a face predicțiile și labelurile de aceeași formă înainte de a apela metoda `gather()`. Dacă nu facem acest lucru, evaluarea va da o eroare sau se va bloca pentru totdeauna.
-
-```py
-from tqdm.auto import tqdm
-import torch
-
-progress_bar = tqdm(range(num_training_steps))
-
-for epoch in range(num_train_epochs):
-    # Training
-    model.train()
-    for batch in train_dataloader:
-        outputs = model(**batch)
-        loss = outputs.loss
-        accelerator.backward(loss)
-
-        optimizer.step()
-        lr_scheduler.step()
-        optimizer.zero_grad()
-        progress_bar.update(1)
-
-    # Evaluation
-    model.eval()
-    for batch in tqdm(eval_dataloader):
-        with torch.no_grad():
-            generated_tokens = accelerator.unwrap_model(model).generate(
-                batch["input_ids"],
-                attention_mask=batch["attention_mask"],
-                max_length=128,
-            )
-        labels = batch["labels"]
-
-        # Necessary to pad predictions and labels for being gathered
-        generated_tokens = accelerator.pad_across_processes(
-            generated_tokens, dim=1, pad_index=tokenizer.pad_token_id
-        )
-        labels = accelerator.pad_across_processes(labels, dim=1, pad_index=-100)
-
-        predictions_gathered = accelerator.gather(generated_tokens)
-        labels_gathered = accelerator.gather(labels)
-
-        decoded_preds, decoded_labels = postprocess(predictions_gathered, labels_gathered)
-        metric.add_batch(predictions=decoded_preds, references=decoded_labels)
-
-    results = metric.compute()
-    print(f"epoch {epoch}, BLEU score: {results['score']:.2f}")
-
-    # Save and upload
-    accelerator.wait_for_everyone()
-    unwrapped_model = accelerator.unwrap_model(model)
-    unwrapped_model.save_pretrained(output_dir, save_function=accelerator.save)
-    if accelerator.is_main_process:
-        tokenizer.save_pretrained(output_dir)
-        repo.push_to_hub(
-            commit_message=f"Training in progress epoch {epoch}", blocking=False
-        )
-```
-
-```python out
-epoch 0, BLEU score: 53.47
-epoch 1, BLEU score: 54.24
-epoch 2, BLEU score: 54.44
-```
-
-Odată făcut acest lucru, ar trebui să aveți un model care are rezultate destul de asemănătoare cu cel antrenat cu `Seq2SeqTrainer`. Îl puteți verifica pe cel pe care l-am antrenat folosind acest cod la [*huggingface-course/marian-finetuned-kde4-en-to-fr-accelerate*] (https://huggingface.co/huggingface-course/marian-finetuned-kde4-en-to-fr-accelerate). Și dacă doriți să testați orice modificări ale buclei de antrenare, le puteți implementa direct prin editarea codului prezentat mai sus!
-
-{/if}
-
-## Utilizarea modelului fine-tuned[[using-the-fine-tuned-model]]
-
-V-am arătat deja cum puteți utiliza modelul pe căruia i-am aplicat fine-tune pe Model Hub cu widgetul de inferență. Pentru a-l utiliza la nivel local într-un `pipeline`, trebuie doar să specificăm identificatorul de model corespunzător:
-
-```py
-from transformers import pipeline
-
-# Replace this with your own checkpoint
-model_checkpoint = "huggingface-course/marian-finetuned-kde4-en-to-fr"
-translator = pipeline("translation", model=model_checkpoint)
-translator("Default to expanded threads")
-```
-
-```python out
-[{'translation_text': 'Par défaut, développer les fils de discussion'}]
-```
-
-Așa cum era de așteptat, modelul nostru preantrenat și-a adaptat cunoștințele la corpusul pe care i-am făcut fine-tune și, în loc să lase cuvântul englezesc "threads", acum îl traduce în versiunea oficială franceză. Același lucru este valabil și pentru "plugin":
-
-```py
-translator(
-    "Unable to import %1 using the OFX importer plugin. This file is not the correct format."
-)
-```
-
-```python out
-[{'translation_text': "Impossible d'importer %1 en utilisant le module externe d'importation OFX. Ce fichier n'est pas le bon format."}]
-```
-
-Un alt exemplu excelent de adaptare a domeniului!
-
-<Tip>
-
-✏️ **E rândul tău!** Care este rezultatul modelului pentru sampleul cuvântul "email" pe care l-ai identificat mai devreme?
-
-</Tip>
diff --git a/chapters/ro/chapter7/5.mdx b/chapters/ro/chapter7/5.mdx
deleted file mode 100644
index 84157cc3f..000000000
--- a/chapters/ro/chapter7/5.mdx
+++ /dev/null
@@ -1,1074 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Sumarizare[[summarization]]
-
-{#if fw === 'pt'}
-
-<CourseFloatingBanner chapter={7}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter7/section5_pt.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter7/section5_pt.ipynb"},
-]} />
-
-{:else}
-
-<CourseFloatingBanner chapter={7}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter7/section5_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter7/section5_tf.ipynb"},
-]} />
-
-{/if}
-
-
-În această secțiune vom analiza modul în care modelele Transformer pot fi utilizate pentru a condensa documente lungi în rezumate, o sarcină cunoscută sub numele de _text summarization_. Aceasta este una dintre cele mai dificile sarcini NLP, deoarece necesită o gamă largă de abilități, cum ar fi înțelegerea pasajelor lungi și generarea unui text coerent care integrează principalele subiecte dintr-un document. Cu toate acestea, atunci când este bine realizată, rezumarea textului este un instrument puternic care poate accelera diverse procese de business prin scutirea experților într-u anumit domeniu de a citi documente lungi în detaliu.
-
-<Youtube id="yHnr5Dk2zCI"/>
-
-Deși există deja diverse modele bine puse la punct pentru sumarizare pe [Hugging Face Hub] (https://huggingface.co/models?pipeline_tag=summarization&sort=downloads), aproape toate acestea sunt potrivite numai pentru documentele în limba engleză. Prin urmare, pentru a adăuga o întorsătură în această secțiune, vom antrena un model bilingv pentru engleză și spaniolă. Până la sfârșitul acestei secțiuni, veți avea un [model](https://huggingface.co/huggingface-course/mt5-small-finetuned-amazon-en-es) care poate rezuma recenziile clienților precum cel prezentat aici:
-
-
-<iframe src="https://course-demos-mt5-small-finetuned-amazon-en-es.hf.space" frameBorder="0" height="400" title="Gradio app" class="block dark:hidden container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
-
-După cum vom vedea, aceste rezumate sunt concise deoarece sunt învățate din titlurile pe care clienții le furnizează în recenziile lor despre produse. Să începem prin alcătuirea unui corpus bilingv adecvat pentru această sarcină.
-
-## Pregătirea unui corpus multilingv[[preparing-a-multilingual-corpus]]
-
-Vom utiliza [Multilingual Amazon Reviews Corpus] (https://huggingface.co/datasets/amazon_reviews_multi) pentru a crea bilingv summarizerul nostru. Acest corpus este format din recenzii ale produselor Amazon în șase limbi și este utilizat de obicei pentru a evalua clasificatoarele multilingve. Cu toate acestea, deoarece fiecare recenzie este însoțită de un titlu scurt, putem folosi titlurile ca rezumate țintă din care modelul nostru să învețe! Pentru a începe, să descărcăm subseturile în engleză și spaniolă de la Hugging Face Hub:
-
-```python
-from datasets import load_dataset
-
-spanish_dataset = load_dataset("amazon_reviews_multi", "es")
-english_dataset = load_dataset("amazon_reviews_multi", "en")
-english_dataset
-```
-
-```python out
-DatasetDict({
-    train: Dataset({
-        features: ['review_id', 'product_id', 'reviewer_id', 'stars', 'review_body', 'review_title', 'language', 'product_category'],
-        num_rows: 200000
-    })
-    validation: Dataset({
-        features: ['review_id', 'product_id', 'reviewer_id', 'stars', 'review_body', 'review_title', 'language', 'product_category'],
-        num_rows: 5000
-    })
-    test: Dataset({
-        features: ['review_id', 'product_id', 'reviewer_id', 'stars', 'review_body', 'review_title', 'language', 'product_category'],
-        num_rows: 5000
-    })
-})
-```
-
-După cum puteți vedea, pentru fiecare limbă există 200.000 de recenzii pentru splitul `train` și 5.000 de recenzii pentru fiecare dintre spliturile `validation` și `test`. Informațiile despre recenzii care ne interesează sunt conținute în coloanele `review_body` și `review_title`. Să analizăm câteva exemple prin crearea unei funcții simple care preia un sample aleatoriu din setul de antrenare cu ajutorul tehnicilor învățate în [Capitolul 5](/course/chapter5):
-
-```python
-def show_samples(dataset, num_samples=3, seed=42):
-    sample = dataset["train"].shuffle(seed=seed).select(range(num_samples))
-    for example in sample:
-        print(f"\n'>> Title: {example['review_title']}'")
-        print(f"'>> Review: {example['review_body']}'")
-
-
-show_samples(english_dataset)
-```
-
-```python out
-'>> Title: Worked in front position, not rear'
-'>> Review: 3 stars because these are not rear brakes as stated in the item description. At least the mount adapter only worked on the front fork of the bike that I got it for.'
-
-'>> Title: meh'
-'>> Review: Does it’s job and it’s gorgeous but mine is falling apart, I had to basically put it together again with hot glue'
-
-'>> Title: Can\'t beat these for the money'
-'>> Review: Bought this for handling miscellaneous aircraft parts and hanger "stuff" that I needed to organize; it really fit the bill. The unit arrived quickly, was well packaged and arrived intact (always a good sign). There are five wall mounts-- three on the top and two on the bottom. I wanted to mount it on the wall, so all I had to do was to remove the top two layers of plastic drawers, as well as the bottom corner drawers, place it when I wanted and mark it; I then used some of the new plastic screw in wall anchors (the 50 pound variety) and it easily mounted to the wall. Some have remarked that they wanted dividers for the drawers, and that they made those. Good idea. My application was that I needed something that I can see the contents at about eye level, so I wanted the fuller-sized drawers. I also like that these are the new plastic that doesn\'t get brittle and split like my older plastic drawers did. I like the all-plastic construction. It\'s heavy duty enough to hold metal parts, but being made of plastic it\'s not as heavy as a metal frame, so you can easily mount it to the wall and still load it up with heavy stuff, or light stuff. No problem there. For the money, you can\'t beat it. Best one of these I\'ve bought to date-- and I\'ve been using some version of these for over forty years.'
-```
-
-<Tip>
-
-✏️ **Încercați!** Schimbați seedul aleatoriu în comanda `Dataset.shuffle()` pentru a explora alte recenzii din corpus. Dacă sunteți vorbitor de spaniolă, aruncați o privire la unele dintre recenziile din `spanish_dataset` pentru a vedea dacă și titlurile par a fi rezumate rezonabil.
-
-</Tip>
-
-Acest sample arată diversitatea recenziilor pe care le găsim de obicei online, variind de la pozitive la negative (și totul între ele!). Deși exemplul cu titlul "meh" nu este foarte informativ, celelalte titluri par a fi rezumate decente ale recenziilor în sine. Antrenarea unui model de rezumare pe toate cele 400 000 de recenzii ar dura mult prea mult pe un singur GPU, așa că ne vom concentra pe generarea de rezumate pentru un singur domeniu de produse. Pentru a avea o idee despre domeniile din care putem alege, să convertim `english_dataset` într-un `pandas.DataFrame` și să calculăm numărul de recenzii per categorie de produse:
-
-```python
-english_dataset.set_format("pandas")
-english_df = english_dataset["train"][:]
-# Show counts for top 20 products
-english_df["product_category"].value_counts()[:20]
-```
-
-```python out
-home                      17679
-apparel                   15951
-wireless                  15717
-other                     13418
-beauty                    12091
-drugstore                 11730
-kitchen                   10382
-toy                        8745
-sports                     8277
-automotive                 7506
-lawn_and_garden            7327
-home_improvement           7136
-pet_products               7082
-digital_ebook_purchase     6749
-pc                         6401
-electronics                6186
-office_product             5521
-shoes                      5197
-grocery                    4730
-book                       3756
-Name: product_category, dtype: int64
-```
-
-Cele mai populare produse din datasetul în limba engleză sunt despre articole de uz casnic, îmbrăcăminte și electronice fără fir. Cu toate acestea, pentru a rămâne la Amazontheme, să ne concentrăm pe rezumatul recenziilor de cărți - la urma urmei, acesta este motivul pentru care compania a fost fondată! Putem vedea două categorii de produse care se potrivesc (`book` și `digital_ebook_purchase`), deci să filtrăm dataseturile în ambele limbi doar pentru aceste produse. După cum am văzut în [Capitolul 5](/course/chapter5), funcția `Dataset.filter()` ne permite să tăiem un datasetfoarte eficient, deci putem defini o funcție simplă pentru a face acest lucru:
-
-```python
-def filter_books(example):
-    return (
-        example["product_category"] == "book"
-        or example["product_category"] == "digital_ebook_purchase"
-    )
-```
-
-Acum, când aplicăm această funcție la `english_dataset` și `spanish_dataset`, rezultatul va conține doar acele rânduri care implică categoriile de cărți. Înainte de a aplica filtrul, să schimbăm formatul din `english_dataset` din `"pandas"` înapoi în `"arrow"`:
-
-```python
-english_dataset.reset_format()
-```
-
-Putem aplica apoi funcția de filtrare și, ca o verificare a corectitudinii, să inspectăm un sample de recenzii pentru a vedea dacă acestea sunt într-adevăr despre cărți:
-
-```python
-spanish_books = spanish_dataset.filter(filter_books)
-english_books = english_dataset.filter(filter_books)
-show_samples(english_books)
-```
-
-```python out
-'>> Title: I\'m dissapointed.'
-'>> Review: I guess I had higher expectations for this book from the reviews. I really thought I\'d at least like it. The plot idea was great. I loved Ash but, it just didnt go anywhere. Most of the book was about their radio show and talking to callers. I wanted the author to dig deeper so we could really get to know the characters. All we know about Grace is that she is attractive looking, Latino and is kind of a brat. I\'m dissapointed.'
-
-'>> Title: Good art, good price, poor design'
-'>> Review: I had gotten the DC Vintage calendar the past two years, but it was on backorder forever this year and I saw they had shrunk the dimensions for no good reason. This one has good art choices but the design has the fold going through the picture, so it\'s less aesthetically pleasing, especially if you want to keep a picture to hang. For the price, a good calendar'
-
-'>> Title: Helpful'
-'>> Review: Nearly all the tips useful and. I consider myself an intermediate to advanced user of OneNote. I would highly recommend.'
-```
-
-Bine, putem vedea că recenziile nu sunt strict despre cărți și se pot referi la lucruri precum calendare și aplicații electronice precum OneNote. Cu toate acestea, domeniul pare potrivit pentru a antrena un model de sumarizare. Înainte de a analiza diferitele modele care sunt potrivite pentru această sarcină, trebuie să mai pregătim puțin datele: să combinăm recenziile în engleză și spaniolă ca un singur obiect `DatasetDict`. 🤗 Datasets oferă o funcție utilă `concatenate_datasets()` care (după cum sugerează și numele) va concatena două obiecte `Dataset` unul peste celălalt. Așadar, pentru a crea datasetul nostru bilingv, vom parcurge în buclă fiecare împărțire, vom concatena dataseturile pentru acel split și vom amesteca rezultatul pentru a ne asigura că modelul nostru nu se adaptează excesiv la o singură limbă:
-
-```python
-from datasets import concatenate_datasets, DatasetDict
-
-books_dataset = DatasetDict()
-
-for split in english_books.keys():
-    books_dataset[split] = concatenate_datasets(
-        [english_books[split], spanish_books[split]]
-    )
-    books_dataset[split] = books_dataset[split].shuffle(seed=42)
-
-# Peek at a few examples
-show_samples(books_dataset)
-```
-
-```python out
-'>> Title: Easy to follow!!!!'
-'>> Review: I loved The dash diet weight loss Solution. Never hungry. I would recommend this diet. Also the menus are well rounded. Try it. Has lots of the information need thanks.'
-
-'>> Title: PARCIALMENTE DAÑADO'
-'>> Review: Me llegó el día que tocaba, junto a otros libros que pedí, pero la caja llegó en mal estado lo cual dañó las esquinas de los libros porque venían sin protección (forro).'
-
-'>> Title: no lo he podido descargar'
-'>> Review: igual que el anterior'
-```
-
-Acest lucru arată cu siguranță ca un amestec de recenzii în engleză și spaniolă! Acum că avem un corpus de antrenament, un ultim lucru de verificat este distribuția cuvintelor în recenzii și în titlurile acestora. Acest lucru este deosebit de important pentru sarcinile de sumarizare, în cazul în care rezumatele scurte de referință din date pot influența modelul să producă doar unul sau două cuvinte în rezumatele generate. Graficele de mai jos arată distribuția cuvintelor și putem observa că titlurile sunt puternic înclinate spre 1-2 cuvinte:
-
-<div class="flex justify-center">
-<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/review-lengths.svg" alt="Distribuția numărului de cuvinte pentru titlurile și textele recenziei."/>
-<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/review-lengths-dark.svg" alt="Distribuția numărului de cuvinte pentru titlurile și textele recenziei."/>
-</div>
-
-Pentru a rezolva acest lucru, vom filtra exemplele cu titluri foarte scurte, astfel încât modelul nostru să poată produce rezumate mai interesante. Deoarece avem de-a face cu texte în engleză și spaniolă, putem folosi rough heuristic pentru a face split titlurilor pe baza spațiului alb și apoi să folosim metoda noastră de încredere `Dataset.filter()` după cum urmează:
-
-```python
-books_dataset = books_dataset.filter(lambda x: len(x["review_title"].split()) > 2)
-```
-
-Now that we've prepared our corpus, let's take a look at a few possible Transformer models that one might fine-tune on it!
-
-## Modele pentru sumarizarea textului[[models-for-text-summarization]]
-
-Dacă vă gândiți bine, rezumarea textului este o sarcină similară cu machine translation: avem un corp de text, cum ar fi o recenzie, pe care am dori să o "traducem" într-o versiune mai scurtă care să capteze caracteristicile principale ale datelor de intrare. În consecință, majoritatea modelelor Transformer pentru rezumare adoptă arhitectura codificator-decodificator pe care am întâlnit-o pentru prima dată în [Capitolul 1](/course/chapter1), deși există unele excepții, cum ar fi familia de modele GPT, care poate fi, de asemenea, utilizată pentru rezumare în few-shot settings. Tabelul de mai jos enumeră câteva modele preantrenate populare care pot fi ajustate pentru sumarizare.
-
-| Transformer model | Description                                                                                                                                                                                                    | Multilingual? |
-| :---------: | -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | :-----------: |
-|    [GPT-2](https://huggingface.co/gpt2-xl)    | Deși este antrenat ca un model lingvistic autoregresiv, puteți face GPT-2 să genereze rezumate prin adăugarea "TL;DR" la sfârșitul textului de intrare.                                                                          |      ❌       |
-|   [PEGASUS](https://huggingface.co/google/pegasus-large)   | Utilizează un obiectiv de preantrenare pentru a prezice propoziții mascate în texte cu mai multe propoziții. Acest obiectiv de preantrenare este mai apropiat de rezumare decât de vanilla language modeling și obține scoruri ridicate la standardele populare. |      ❌       |
-|     [T5](https://huggingface.co/t5-base)      | O arhitectură Transformer universală care formulează toate sarcinile într-un framework text-text; de exemplu, formatul de intrare pentru modelul de rezumare a unui document este `summarize: ARTICOL`.                              |      ❌       |
-|     [mT5](https://huggingface.co/google/mt5-base)     | O versiune multilingvă a T5, preantrenată pe corpusul multilingv Common Crawl (mC4), care acoperă 101 limbi.                                                                                                |      ✅       |
-|    [BART](https://huggingface.co/facebook/bart-base)     | O nouă arhitectură Transformer cu un encoder și un stack de decodere antrenate pentru a reconstrui intrarea coruptă care combină schemele de preantrenare ale BERT și GPT-2.                                   |      ❌       |
-|  [mBART-50](https://huggingface.co/facebook/mbart-large-50)   | O versiune multilingvă a BART, preantrenată pe 50 de limbi.                                                                                                                                                     |      ✅       |
-
-După cum puteți vedea din acest tabel, majoritatea modelelor Transformer pentru rezumare (și, într-adevăr, majoritatea sarcinilor NLP) sunt monolingve. Acest lucru este grozav dacă sarcina voastrăeste într-o limbă cu  multe resurse precum engleza sau germana, dar mai puțin pentru miile de alte limbi utilizate în întreaga lume. Din fericire, există o clasă de modele Transformer multilingve, precum mT5 și mBART, care vin în ajutor. Aceste modele sunt preantrenate folosind modelarea limbajului, dar cu o întorsătură: în loc să fie antrenate pe un corpus dintr-o singură limbă, ele sunt antrenate împreună pe texte în peste 50 de limbi deodată!
-
-Ne vom concentra asupra mT5, o arhitectură interesantă bazată pe T5, care a fost preantrenată într-un cadru text-to-text. În T5, fiecare sarcină NLP este formulată în termenii unui prompt prefix precum `summarize:` care condiționează modelul să adapteze textul generat la prompt. După cum se arată în figura de mai jos, acest lucru face T5 extrem de versatil, deoarece puteți rezolva multe sarcini cu un singur model!
-
-<div class="flex justify-center">
-<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/t5.svg" alt="Diferite sarcini îndeplinite de arhitectura T5."/>
-<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/t5-dark.svg" alt="Diferite sarcini îndeplinite de arhitectura T5."/>
-</div>
-
-mT5 nu utilizează prefixe, dar împărtășește o mare parte din versatilitatea T5 și are avantajul de a fi multilingv. Acum că am ales un model, să aruncăm o privire la pregătirea datelor noastre pentru antrenare.
-
-
-<Tip>
-
-✏️ **Încercați!** După ce ați parcurs această secțiune, vedeți cât de bine se compară mT5 cu mBART prin aplicarea fine-tuningului acestuia din urmă cu aceleași tehnici. Pentru puncte bonus, puteți încerca, de asemenea, fine-tuningul a T5 doar pe recenziile în limba engleză. Deoarece T5 are un prefix prompt special, va trebui să adăugați `summarize:` la exemplele de intrare în pașii de preprocesare de mai jos.
-
-</Tip>
-
-## Preprocessing the data[[preprocessing-the-data]]
-
-<Youtube id="1m7BerpSq8A"/>
-
-Următoarea noastră sarcină este să tokenizăm și să codificăm recenziile și titlurile acestora. Ca de obicei, începem prin încărcarea tokenizelui asociat cu checkpointul modelului preantrenat. Vom folosi `mt5-small` ca checkpoint, astfel încât să putem face fine-tune modelului într-un timp rezonabil:
-
-```python
-from transformers import AutoTokenizer
-
-model_checkpoint = "google/mt5-small"
-tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
-```
-
-<Tip>
-
-💡 În stadiile inițiale ale proiectelor NLP, o bună practică este de a antrena o clasă de modele "mici" pe un sample mic de date. Acest lucru vă permite să faceți debug și să iterați mai rapid către un flux de lucru end-to-end. Odată ce sunteți încrezător în rezultate, puteți oricând să măriți modelul prin simpla schimbare a checkpointului modelului!
-
-</Tip>
-
-Să testăm tokenizerul mT5 pe un mic exemplu:
-
-```python
-inputs = tokenizer("I loved reading the Hunger Games!")
-inputs
-```
-
-```python out
-{'input_ids': [336, 259, 28387, 11807, 287, 62893, 295, 12507, 1], 'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1, 1]}
-```
-
-Aici putem vedea binecunoscutele `input_ids` și `attention_mask` pe care le-am întâlnit în primele noastre experimente de fine-tuning în [Capitolul 3](/course/chapter3). Să decodificăm aceste ID-uri de intrare cu funcția `convert_ids_to_tokens()` a tokenizerului pentru a vedea cu ce fel de tokenizer avem de-a face:
-
-```python
-tokenizer.convert_ids_to_tokens(inputs.input_ids)
-```
-
-```python out
-['▁I', '▁', 'loved', '▁reading', '▁the', '▁Hung', 'er', '▁Games', '</s>']
-```
-
-Caracterul Unicode special `▁` și tokenul de sfârșit de secvență `</s>` indică faptul că avem de-a face cu tokenizeerul SentencePiece, care se bazează pe algoritmul de segmentare Unigram discutat în [Capitolul 6](/course/chapter6). Unigram este deosebit de util pentru corpusurile multilingve, deoarece permite SentencePiece să fie agnostic în ceea ce privește accentele, punctuația și faptul că multe limbi, precum japoneza, nu au caractere de spațiu alb.
-
-Pentru a tokeniza corpusul nostru, trebuie să ne ocupăm de o subtilitate asociată cu rezumarea: deoarece labelurile noastre sunt, de asemenea, text, este posibil ca acestea să depășească dimensiunea maximă a contextului modelului. Acest lucru înseamnă că trebuie să aplicăm trunchierea atât a recenziilor, cât și a titlurilor acestora, pentru a ne asigura că nu trecem inputuri excesiv de lungi modelului nostru. Tokenizerele din 🤗 Transformers oferă un argument ingenios, `text_target`,  care vă permite să tokenizați labelurile în paralel cu inputurile. Iată un exemplu al modului în care inputurile și targeturile sunt procesate pentru mT5:
-
-```python
-max_input_length = 512
-max_target_length = 30
-
-
-def preprocess_function(examples):
-    model_inputs = tokenizer(
-        examples["review_body"],
-        max_length=max_input_length,
-        truncation=True,
-    )
-    labels = tokenizer(
-        examples["review_title"], max_length=max_target_length, truncation=True
-    )
-    model_inputs["labels"] = labels["input_ids"]
-    return model_inputs
-```
-
-Să parcurgem acest cod pentru a înțelege ce se întâmplă. Primul lucru pe care l-am făcut a fost să definim valorile pentru `max_input_length` și `max_target_length`, care stabilesc limitele superioare pentru cât de lungi pot fi recenziile și titlurile noastre. Deoarece corpul recenziei este de obicei mult mai mare decât titlul, am mărit aceste valori în consecință.
-
-Cu ajutorul funcției `preprocess_function()`, este simplu să tokenizăm întregul corpus cu ajutorul funcției practice `Dataset.map()` pe care am folosit-o la greu pe parcursul acestui curs:
-
-```python
-tokenized_datasets = books_dataset.map(preprocess_function, batched=True)
-```
-
-Acum că corpusul a fost preprocesat, să aruncăm o privire asupra unor metrici care sunt utilizate în mod obișnuit pentru sumarizare. După cum vom vedea, nu există un glonț de argint atunci când vine vorba de măsurarea calității textului generat de calculator.
-
-<Tip>
-
-💡 Poate ați observat că am folosit `batched=True` în funcția noastră `Dataset.map()` de mai sus. Aceasta codifică exemplele în batchuri de 1.000 (implicit) și vă permite să utilizați capacitățile multithreading ale tokenizerilor rapizi din 🤗 Transformers. Atunci când este posibil, încercați să utilizați `batched=True` pentru a profita la maximum de preprocesare!
-
-</Tip>
-
-
-## Metrice pentru sumarizare[[metrics-for-text-summarization]]
-
-<Youtube id="TMshhnrEXlg"/>
-
-În comparație cu majoritatea celorlalte sarcini pe care le-am abordat în acest curs, măsurarea performanței sarcinilor de generare a textului, precum sumarizare sau traducerea, nu este la fel de simplă. De exemplu, având în vedere o recenzie precum "Mi-a plăcut să citesc Hunger Games", există mai multe rezumate valide, precum "Mi-a plăcut Hunger Games" sau "Hunger Games este o lectură excelentă". În mod clar, aplicarea unui exact match între rezumatul generat și label nu este o soluție bună - chiar și oamenii s-ar descurca prost cu un astfel de metric, deoarece toți avem propriul nostru stil de scriere.
-
-Pentru rezumare, una dintre cele mai frecvent utilizate metrici este [ROUGE score](https://en.wikipedia.org/wiki/ROUGE_(metric)) (prescurtarea de la Recall-Oriented Understudy for Gisting Evaluation). Ideea de bază din spatele acestei metrici este de a compara un rezumat generat cu un set de rezumate de referință care sunt de obicei create de oameni. Pentru a face acest lucru mai precis, să presupunem că dorim să comparăm următoarele două rezumate:
-
-```python
-generated_summary = "I absolutely loved reading the Hunger Games"
-reference_summary = "I loved reading the Hunger Games"
-```
-
-O modalitate de a le compara ar fi să numărați numărul de cuvinte care se suprapun, care în acest caz ar fi 6. Cu toate acestea, acest lucru este un pic crud, astfel încât, în schimb, ROUGE se bazează pe calcularea scorurilor _preicision_ și _recall_ pentru suprapunere.
-
-<Tip>
-
-🙋 Nu vă faceți griji dacă aceasta este prima dată când auziți de precision și recall - vom trece împreună prin câteva exemple explicite pentru a clarifica totul. Aceste metrici sunt de obicei întâlnite în sarcinile de clasificare, deci dacă doriți să înțelegeți cum sunt definite precizia și recallul în acest context, vă recomandăm să consultați [ghidurile `scikit-learn`] (https://scikit-learn.org/stable/auto_examples/model_selection/plot_precision_recall.html).
-
-</Tip>
-
-Pentru ROUGE, recall măsoară cât de mult din rezumatul de referință este capturat de cel generat. Dacă comparăm doar cuvinte, recall poate fi calculată conform următoarei formule:
-
-$$ \mathrm{Recall} = \frac{\mathrm{Number\,of\,overlapping\, words}}{\mathrm{Total\, number\, of\, words\, in\, reference\, summary}} $$
-
-Pentru exemplul nostru simplu de mai sus, această formulă oferă un recall perfect de 6/6 = 1; adică, toate cuvintele din rezumatul de referință au fost produse de model. Acest lucru poate părea grozav, dar imaginați-vă dacă rezumatul nostru generat ar fi fost "Mi-a plăcut foarte mult să citesc Jocurile Foamei toată noaptea". Aceasta ar avea, de asemenea, o reamintire perfectă, dar este, fără îndoială, un rezumat mai prost, deoarece are mai multe cuvinte. Pentru a face față acestor scenarii, calculăm și precizia, care, în contextul ROUGE, măsoară cât de mult din rezumatul generat a fost relevant:
-
-
-$$ \mathrm{Precision} = \frac{\mathrm{Number\,of\,overlapping\, words}}{\mathrm{Total\, number\, of\, words\, in\, generated\, summary}} $$
-
-Aplicând acest lucru la rezumatul nostru cu mai multe cuvinte, se obține o precizie de 6/10 = 0,6, ceea ce este considerabil mai rău decât precizia de 6/7 = 0,86 obținută de rezumatul nostru mai scurt. În practică, se calculează de obicei atât precision, cât și recallul, iar apoi se raportează scorul F1 (media armonică a precision și recall). Putem face acest lucru cu ușurință în 🤗 Datasets instalând mai întâi biblioteca `rouge_score`:
-
-```py
-!pip install rouge_score
-```
-
-și apoi încărcând metrica ROUGE după cum urmează:
-
-```python
-import evaluate
-
-rouge_score = evaluate.load("rouge")
-```
-
-Apoi, putem utiliza funcția `rouge_score.compute()` pentru a calcula toate metricile odată:
-
-```python
-scores = rouge_score.compute(
-    predictions=[generated_summary], references=[reference_summary]
-)
-scores
-```
-
-```python out
-{'rouge1': AggregateScore(low=Score(precision=0.86, recall=1.0, fmeasure=0.92), mid=Score(precision=0.86, recall=1.0, fmeasure=0.92), high=Score(precision=0.86, recall=1.0, fmeasure=0.92)),
- 'rouge2': AggregateScore(low=Score(precision=0.67, recall=0.8, fmeasure=0.73), mid=Score(precision=0.67, recall=0.8, fmeasure=0.73), high=Score(precision=0.67, recall=0.8, fmeasure=0.73)),
- 'rougeL': AggregateScore(low=Score(precision=0.86, recall=1.0, fmeasure=0.92), mid=Score(precision=0.86, recall=1.0, fmeasure=0.92), high=Score(precision=0.86, recall=1.0, fmeasure=0.92)),
- 'rougeLsum': AggregateScore(low=Score(precision=0.86, recall=1.0, fmeasure=0.92), mid=Score(precision=0.86, recall=1.0, fmeasure=0.92), high=Score(precision=0.86, recall=1.0, fmeasure=0.92))}
-```
-
-Whoa, există o mulțime de informații în aceast output - ce înseamnă toate acestea? În primul rând, 🤗 Datasets calculează de fapt confidence intervalurile pentru precision, recall și scorul F1; acestea sunt atributele `low`, `mid` și `high` pe care le puteți vedea aici. În plus, 🤗 Datasets calculează o varietate de scoruri ROUGE care se bazează pe diferite tipuri de granularitate a textului atunci când compară rezumatele generate și de referință. Varianta `rouge1` este suprapunerea unigramelor - acesta este doar un mod elegant de a spune suprapunerea cuvintelor și este exact metrica pe care am discutat-o mai sus. Pentru a verifica acest lucru, să extragem valoarea `mid` a scorurilor noastre:
-
-```python
-scores["rouge1"].mid
-```
-
-```python out
-Score(precision=0.86, recall=1.0, fmeasure=0.92)
-```
-
-Grozav, numerele de precision și de recall se potrivesc! Acum ce se întâmplă cu celelalte scoruri ROUGE? `rouge2` măsoară suprapunerea dintre bigrame (suprapunerea perechilor de cuvinte), în timp ce `rougeL` și `rougeLsum` măsoară cele mai lungi secvențe de cuvinte care se potrivesc, căutând cele mai lungi substraturi comune în rezumatele generate și de referință. Termenul "sum" din `rougeLsum` se referă la faptul că această metrică este calculată pentru un rezumat întreg, în timp ce `rougeL` este calculată ca medie a propozițiilor individuale.
-
-<Tip>
-
-✏️ **Încercați!** Creați propriul exemplu de rezumat generat și de referință și vedeți dacă scorurile ROUGE rezultate sunt în concordanță cu un calcul manual bazat pe formulele de precision și recall. Pentru puncte bonus, împărțiți textul în bigrame și comparați precizia și recallul pentru metrica `rouge2`.
-
-</Tip>
-
-Vom folosi aceste scoruri ROUGE pentru a urmări performanța modelului nostru, dar înainte de a face acest lucru, să facem ceva ce orice bun practician NLP ar trebui să facă: să creăm un baseline puternic, dar simplu!
-
-### Crearea unui baseline bun[[creating-a-strong-baseline]]
-
-un baseline obișnuit pentru rezumarea textului este de a lua pur și simplu primele trei propoziții ale unui articol, adesea numit _lead-3_ baseline. Am putea folosi puncte de oprire pentru a urmări limitele propoziției, dar acest lucru va eșua în cazul acronimelor precum "U.S." sau "U.N." - așa că vom folosi în schimb biblioteca `nltk`, care include un algoritm mai bun pentru a gestiona aceste cazuri. Puteți instala pachetul folosind `pip` după cum urmează:
-
-```python
-!pip install nltk
-```
-
-și apoi descărcați regulile de punctuație:
-
-```python
-import nltk
-
-nltk.download("punkt")
-```
-
-În continuare, importăm tokenizerul de propoziții din `nltk` și creăm o funcție simplă pentru a extrage primele trei propoziții dintr-o recenzie. Convenția în rezumarea textului este de a separa fiecare rezumat cu o linie nouă, deci să includem și aceasta și să o testăm pe un exemplu de antrenare:
-
-```python
-from nltk.tokenize import sent_tokenize
-
-
-def three_sentence_summary(text):
-    return "\n".join(sent_tokenize(text)[:3])
-
-
-print(three_sentence_summary(books_dataset["train"][1]["review_body"]))
-```
-
-```python out
-'I grew up reading Koontz, and years ago, I stopped,convinced i had "outgrown" him.'
-'Still,when a friend was looking for something suspenseful too read, I suggested Koontz.'
-'She found Strangers.'
-```
-
-Acest lucru pare să funcționeze, deci să implementăm acum o funcție care extrage aceste "rezumate" dintr-un dataset și calculează scorurile ROUGE pentru baseline:
-
-```python
-def evaluate_baseline(dataset, metric):
-    summaries = [three_sentence_summary(text) for text in dataset["review_body"]]
-    return metric.compute(predictions=summaries, references=dataset["review_title"])
-```
-
-Putem folosi apoi această funcție pentru a calcula scorurile ROUGE pe setul de validare și pentru a le înfrumuseța puțin folosind Pandas:
-
-```python
-import pandas as pd
-
-score = evaluate_baseline(books_dataset["validation"], rouge_score)
-rouge_names = ["rouge1", "rouge2", "rougeL", "rougeLsum"]
-rouge_dict = dict((rn, round(score[rn].mid.fmeasure * 100, 2)) for rn in rouge_names)
-rouge_dict
-```
-
-```python out
-{'rouge1': 16.74, 'rouge2': 8.83, 'rougeL': 15.6, 'rougeLsum': 15.96}
-```
-
-Putem vedea că scorul `rouge2` este semnificativ mai mic decât restul; acest lucru reflectă probabil faptul că titlurile recenziilor sunt de obicei concise și, prin urmare, baselineul lead-3 are prea multe cuvinte. Acum, că avem un baseline bun de lucru, să ne îndreptăm atenția către fine-tuningul mT5!
-
-{#if fw === 'pt'}
-
-## Fine-tuningul mT5 cu API-ul `Trainer`[[fine-tuning-mt5-with-the-trainer-api]]
-
-Fine-tuningul unui model pentru rezumare este foarte asemănător cu celelalte sarcini pe care le-am acoperit în acest capitol. Primul lucru pe care trebuie să îl facem este să încărcăm modelul preantrenat din checkpointul `mt5-small`. Deoarece sumarizarea este o sarcină de la secvență la secvență, putem încărca modelul cu clasa `AutoModelForSeq2SeqLM`, care va descărca automat și va stoca în cache weighturile:
-
-```python
-from transformers import AutoModelForSeq2SeqLM
-
-model = AutoModelForSeq2SeqLM.from_pretrained(model_checkpoint)
-```
-
-{:else}
-
-## Fine-tuningul mT5 cu Keras[[fine-tuning-mt5-with-keras]]
-
-Fine-tuningul unui model pentru sumarizare este foarte asemănătoare cu celelalte sarcini pe care le-am acoperit în acest capitol. Primul lucru pe care trebuie să îl facem este să încărcăm modelul preantrenat din punctul de control `mt5-small`. Deoarece rezumarea este o sarcină de la secvență la secvență, putem încărca modelul cu clasa `TFAutoModelForSeq2SeqLM`, care va descărca și va stoca în cache weighturile:
-
-```python
-from transformers import TFAutoModelForSeq2SeqLM
-
-model = TFAutoModelForSeq2SeqLM.from_pretrained(model_checkpoint)
-```
-
-{/if}
-
-<Tip>
-
-💡 Dacă vă întrebați de ce nu vedeți niciun avertisment cu privire la fine-tuningul modelului pe un downstream task, acest lucru se datorează faptului că pentru sarcinile secvență-la-secvență păstrăm toate weighturile rețelei. Comparați acest lucru cu modelul nostru de clasificare a textului din [Capitolul 3](/course/chapter3), unde headul modelului preantrenat a fost înlocuit cu o rețea inițializată aleatoriu.
-
-</Tip>
-
-Următorul lucru pe care trebuie să îl facem este să ne conectăm la Hugging Face Hub. Dacă executați acest cod într-un notebook, puteți face acest lucru cu următoarea funcție:
-
-```python
-from huggingface_hub import notebook_login
-
-notebook_login()
-```
-
-care va afișa un widget în care puteți introduce credențialele. Alternativ, puteți rula această comandă în terminal și să vă conectați acolo:
-
-```
-huggingface-cli login
-```
-
-{#if fw === 'pt'}
-
-Va trebui să generăm rezumate pentru a calcula scorurile ROUGE în timpul antrenării. Din fericire, 🤗 Transformers oferă clase dedicate `Seq2SeqTrainingArguments` și `Seq2SeqTrainer` care pot face acest lucru pentru noi în mod automat! Pentru a vedea cum funcționează acest lucru, să definim mai întâi hiperparametrii și alte argumente pentru experimentele noastre:
-
-```python
-from transformers import Seq2SeqTrainingArguments
-
-batch_size = 8
-num_train_epochs = 8
-# Show the training loss with every epoch
-logging_steps = len(tokenized_datasets["train"]) // batch_size
-model_name = model_checkpoint.split("/")[-1]
-
-args = Seq2SeqTrainingArguments(
-    output_dir=f"{model_name}-finetuned-amazon-en-es",
-    evaluation_strategy="epoch",
-    learning_rate=5.6e-5,
-    per_device_train_batch_size=batch_size,
-    per_device_eval_batch_size=batch_size,
-    weight_decay=0.01,
-    save_total_limit=3,
-    num_train_epochs=num_train_epochs,
-    predict_with_generate=True,
-    logging_steps=logging_steps,
-    push_to_hub=True,
-)
-```
-
-Aici, argumentul `predict_with_generate` a fost setat pentru a indica faptul că ar trebui să generăm rezumate în timpul evaluării, astfel încât să putem calcula scorurile ROUGE pentru fiecare epocă. După cum s-a discutat în [Capitolul 1](/course/chapter1), decodificatorul realizează inference-ul prin prezicerea tokenilor unul câte unul, iar acest lucru este implementat de metoda `generate()` a modelului. Setarea `predict_with_generate=True` îi spune lui `Seq2SeqTrainer` să utilizeze această metodă pentru evaluare. Am ajustat, de asemenea, unii dintre hiperparametrii impliciți, cum ar fi rata de învățare, numărul de epoci și scăderea weighturilor și am setat opțiunea `save_total_limit` pentru a salva numai până la 3 checkpointuri în timpul antrenamentului - acest lucru se datorează faptului că chiar și versiunea "mică" a mT5 utilizează aproximativ 1 GB de spațiu pe hard disk și putem economisi puțin spațiu prin limitarea numărului de copii salvate.
-
-Argumentul `push_to_hub=True` ne va permite să trimitem modelul în Hub după antrenare; veți găsi repositoriul în profilul vostru de utilizator, în locația definită de `output_dir`. Rețineți că puteți specifica numele repositoriului către care doriți să trimiteți modelul cu argumentul `hub_model_id` (în special, va trebui să utilizați acest argument pentru a trimite modelul către o organizație). De exemplu, atunci când am trimis modelul către organizația [`huggingface-course`](https://huggingface.co/huggingface-course), am adăugat `hub_model_id="huggingface-course/mt5-finetuned-amazon-en-es"` la `Seq2SeqTrainingArguments`.
-
-Următorul lucru pe care trebuie să îl facem este să oferim trainerului o funcție `compute_metrics()`, astfel încât să ne putem evalua modelul în timpul antrenării. Pentru sumarizare, acest lucru este un pic mai complicat decât simpla apelare a funcției `rouge_score.compute()` pentru predicțiile modelului, deoarece trebuie să _decodăm_ rezultatele și labelurile din text înainte de a putea calcula scorurile ROUGE. Următoarea funcție face exact acest lucru și, de asemenea, utilizează funcția `sent_tokenize()` din `nltk` pentru a separa propozițiile rezumate cu linii noi:
-
-```python
-import numpy as np
-
-
-def compute_metrics(eval_pred):
-    predictions, labels = eval_pred
-    # Decode generated summaries into text
-    decoded_preds = tokenizer.batch_decode(predictions, skip_special_tokens=True)
-    # Replace -100 in the labels as we can't decode them
-    labels = np.where(labels != -100, labels, tokenizer.pad_token_id)
-    # Decode reference summaries into text
-    decoded_labels = tokenizer.batch_decode(labels, skip_special_tokens=True)
-    # ROUGE expects a newline after each sentence
-    decoded_preds = ["\n".join(sent_tokenize(pred.strip())) for pred in decoded_preds]
-    decoded_labels = ["\n".join(sent_tokenize(label.strip())) for label in decoded_labels]
-    # Compute ROUGE scores
-    result = rouge_score.compute(
-        predictions=decoded_preds, references=decoded_labels, use_stemmer=True
-    )
-    # Extract the median scores
-    result = {key: value.mid.fmeasure * 100 for key, value in result.items()}
-    return {k: round(v, 4) for k, v in result.items()}
-```
-
-{/if}
-
-În continuare, trebuie să definim un data collator pentru sarcina noastră secvență-la-secvență. Deoarece mT5 este un transformer model encoder-decoder, o subtilitate a pregătirii batch-urilor noastre este că, în timpul decodificării, trebuie să deplasăm labelurile la dreapta cu una. Acest lucru este necesar pentru a ne asigura că decodificatorul vede doar labelurile anterioare ale adevărului de bază și nu pe cele actuale sau viitoare, care ar fi ușor de memorat de către model. Acest lucru este similar cu modul în care masked self-attention este aplicată inputurilor într-o sarcină precum [causal language modeling](/course/chapter7/6).
-
-Din fericire, 🤗 Transformers oferă un collator `DataCollatorForSeq2Seq` care va face padding dinamic inputurilor și labelurilor pentru noi. Pentru a inițializa acest collator, trebuie doar să furnizăm `tokenizer` și `model`:
-
-{#if fw === 'pt'}
-
-```python
-from transformers import DataCollatorForSeq2Seq
-
-data_collator = DataCollatorForSeq2Seq(tokenizer, model=model)
-```
-
-{:else}
-
-```python
-from transformers import DataCollatorForSeq2Seq
-
-data_collator = DataCollatorForSeq2Seq(tokenizer, model=model, return_tensors="tf")
-```
-
-{/if}
-
-Să vedem ce produce acest collator atunci când este alimentat cu un mic batch de exemple. În primul rând, trebuie să eliminăm coloanele cu șiruri de caractere, deoarece collatorul nu va ști cum să completeze aceste elemente:
-
-```python
-tokenized_datasets = tokenized_datasets.remove_columns(
-    books_dataset["train"].column_names
-)
-```
-
-Deoarece collatorul așteaptă o listă de `dict`, unde fiecare `dict` reprezintă un singur exemplu din dataset, trebuie să transformăm datele în formatul așteptat înainte de a le transmite data collatorului:
-
-```python
-features = [tokenized_datasets["train"][i] for i in range(2)]
-data_collator(features)
-```
-
-```python out
-{'attention_mask': tensor([[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
-         1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0],
-        [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
-         1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]]), 'input_ids': tensor([[  1494,    259,   8622,    390,    259,    262,   2316,   3435,    955,
-            772,    281,    772,   1617,    263,    305,  14701,    260,   1385,
-           3031,    259,  24146,    332,   1037,    259,  43906,    305,    336,
-            260,      1,      0,      0,      0,      0,      0,      0],
-        [   259,  27531,  13483,    259,   7505,    260, 112240,  15192,    305,
-          53198,    276,    259,  74060,    263,    260,    459,  25640,    776,
-           2119,    336,    259,   2220,    259,  18896,    288,   4906,    288,
-           1037,   3931,    260,   7083, 101476,   1143,    260,      1]]), 'labels': tensor([[ 7483,   259,  2364, 15695,     1,  -100],
-        [  259, 27531, 13483,   259,  7505,     1]]), 'decoder_input_ids': tensor([[    0,  7483,   259,  2364, 15695,     1],
-        [    0,   259, 27531, 13483,   259,  7505]])}
-```
-
-Principalul lucru care trebuie observat aici este că primul exemplu este mai lung decât al doilea, astfel încât `input_ids` și `attention_mask` din al doilea exemplu au primit padding în dreapta cu un simbol `[PAD]` (al cărui ID este `0`). În mod similar, putem vedea că `labels` au primit padding cu `-100`, pentru a ne asigura că tokenii de padding sunt ignorați de funcția de pierdere. În sfârșit, putem vedea un nou `decoder_input_ids` care a deplasat labelurile spre dreapta prin inserarea unui simbol `[PAD]` în prima intrare.
-
-{#if fw === 'pt'}
-
-Avem în sfârșit toate ingredientele de care avem nevoie pentru a antrenare! Acum trebuie doar să inițializăm trainerul cu argumentele standard:
-
-```python
-from transformers import Seq2SeqTrainer
-
-trainer = Seq2SeqTrainer(
-    model,
-    args,
-    train_dataset=tokenized_datasets["train"],
-    eval_dataset=tokenized_datasets["validation"],
-    data_collator=data_collator,
-    tokenizer=tokenizer,
-    compute_metrics=compute_metrics,
-)
-```
-
-și să lansăm cursa noastră de antrenare:
-
-```python
-trainer.train()
-```
-
-În timpul antrenamentului, ar trebui să vedeți cum training loss scade și scorurile ROUGE cresc cu fiecare epocă. După ce antrenamentul este complet, puteți vedea scorurile ROUGE finale executând `Trainer.evaluate()`:
-
-```python
-trainer.evaluate()
-```
-
-```python out
-{'eval_loss': 3.028524398803711,
- 'eval_rouge1': 16.9728,
- 'eval_rouge2': 8.2969,
- 'eval_rougeL': 16.8366,
- 'eval_rougeLsum': 16.851,
- 'eval_gen_len': 10.1597,
- 'eval_runtime': 6.1054,
- 'eval_samples_per_second': 38.982,
- 'eval_steps_per_second': 4.914}
-```
-
-Din scorurile obținute, putem vedea că modelul nostru a depășit cu mult modelul nostru de bază lead-3 - frumos! Ultimul lucru de făcut este să introducem weighturile modelului în Hub, după cum urmează:
-
-```
-trainer.push_to_hub(commit_message="Training complete", tags="summarization")
-```
-
-```python out
-'https://huggingface.co/huggingface-course/mt5-finetuned-amazon-en-es/commit/aa0536b829b28e73e1e4b94b8a5aacec420d40e0'
-```
-
-Acest lucru va salva checkpointul și fișierele de configurare în `output_dir`, înainte de a încărca toate fișierele în Hub. Specificând argumentul `tags`, ne asigurăm, de asemenea, că widgetul de pe Hub va fi unul pentru un pipeline de rezumare în locul celui implicit de generare de text asociat arhitecturii mT5 (pentru mai multe informații despre labelurile modelului, consultați [🤗Documentația Hub](https://huggingface.co/docs/hub/main#how-is-a-models-type-of-inference-api-and-widget-determined)). Rezultatul din `trainer.push_to_hub()` este o adresă URL către hash-ul Git commit, astfel încât să puteți vedea cu ușurință modificările care au fost făcute în repositoriul modelului!
-
-Pentru a încheia această secțiune, să aruncăm o privire la modul în care putem, de asemenea, să facem fine-tune la mT5 folosind featururile de nivel scăzut oferite de 🤗 Accelerate.
-
-{:else}
-
-Suntem aproape gata de antrenament! Trebuie doar să convertim dataseturile în `tf.data.Dataset`s folosind data collatorul pe care l-am definit mai sus, iar apoi aplicarea `compil()` și `fit()` modelul. Mai întâi, dataseturile:
-
-```python
-tf_train_dataset = model.prepare_tf_dataset(
-    tokenized_datasets["train"],
-    collate_fn=data_collator,
-    shuffle=True,
-    batch_size=8,
-)
-tf_eval_dataset = model.prepare_tf_dataset(
-    tokenized_datasets["validation"],
-    collate_fn=data_collator,
-    shuffle=False,
-    batch_size=8,
-)
-```
-
-Acum, ne definim hiperparametrii de antrenare și compilare:
-
-```python
-from transformers import create_optimizer
-import tensorflow as tf
-
-# The number of training steps is the number of samples in the dataset, divided by the batch size then multiplied
-# by the total number of epochs. Note that the tf_train_dataset here is a batched tf.data.Dataset,
-# not the original Hugging Face Dataset, so its len() is already num_samples // batch_size.
-num_train_epochs = 8
-num_train_steps = len(tf_train_dataset) * num_train_epochs
-model_name = model_checkpoint.split("/")[-1]
-
-optimizer, schedule = create_optimizer(
-    init_lr=5.6e-5,
-    num_warmup_steps=0,
-    num_train_steps=num_train_steps,
-    weight_decay_rate=0.01,
-)
-
-model.compile(optimizer=optimizer)
-
-# Train in mixed-precision float16
-tf.keras.mixed_precision.set_global_policy("mixed_float16")
-```
-
-În cele din urmă, facem fit modelului modelului. Folosim un `PushToHubCallback` pentru a salva modelul în Hub după fiecare epocă, ceea ce ne va permite să îl folosim ulterior pentru inference:
-
-```python
-from transformers.keras_callbacks import PushToHubCallback
-
-callback = PushToHubCallback(
-    output_dir=f"{model_name}-finetuned-amazon-en-es", tokenizer=tokenizer
-)
-
-model.fit(
-    tf_train_dataset, validation_data=tf_eval_dataset, callbacks=[callback], epochs=8
-)
-```
-
-Am obținut unele valori ale pierderilor în timpul antrenării, dar am dori să vedem metricile ROUGE pe care le-am calculat mai devreme. Pentru a obține aceste metrici, va trebui să generăm outputuri din model și să le convertim în șiruri de caractere. Să construim câteva liste de labels și predicții pentru a compara metrica ROUGE (rețineți că, dacă obțineți erori de import pentru această secțiune, este posibil să fie necesar să faceți `!pip install tqdm`). De asemenea, vom utiliza un truc care crește dramatic performanța - compilarea codului nostru de generare cu [XLA](https://www.tensorflow.org/xla), compilatorul accelerat de algebră liniară al TensorFlow. XLA aplică diverse optimizări graficului de calcul al modelului și are ca rezultat îmbunătățiri semnificative ale vitezei și utilizării memoriei. După cum se descrie în [blogul Hugging Face](https://huggingface.co/blog/tf-xla-generate), XLA funcționează cel mai bine atunci când formele noastre de input nu variază prea mult. Pentru a face față acestui lucru, vom face padding inputurilor la multipli a 128 și vom crea un nou dataset cu padding collatorul, iar apoi vom aplica decoratorul `@tf.function(jit_compile=True)` funcției noastre de generare, care marchează întreaga funcție pentru compilare cu XLA.
-
-```python
-from tqdm import tqdm
-import numpy as np
-
-generation_data_collator = DataCollatorForSeq2Seq(
-    tokenizer, model=model, return_tensors="tf", pad_to_multiple_of=320
-)
-
-tf_generate_dataset = model.prepare_tf_dataset(
-    tokenized_datasets["validation"],
-    collate_fn=generation_data_collator,
-    shuffle=False,
-    batch_size=8,
-    drop_remainder=True,
-)
-
-
-@tf.function(jit_compile=True)
-def generate_with_xla(batch):
-    return model.generate(
-        input_ids=batch["input_ids"],
-        attention_mask=batch["attention_mask"],
-        max_new_tokens=32,
-    )
-
-
-all_preds = []
-all_labels = []
-for batch, labels in tqdm(tf_generate_dataset):
-    predictions = generate_with_xla(batch)
-    decoded_preds = tokenizer.batch_decode(predictions, skip_special_tokens=True)
-    labels = labels.numpy()
-    labels = np.where(labels != -100, labels, tokenizer.pad_token_id)
-    decoded_labels = tokenizer.batch_decode(labels, skip_special_tokens=True)
-    decoded_preds = ["\n".join(sent_tokenize(pred.strip())) for pred in decoded_preds]
-    decoded_labels = ["\n".join(sent_tokenize(label.strip())) for label in decoded_labels]
-    all_preds.extend(decoded_preds)
-    all_labels.extend(decoded_labels)
-```
-
-Odată ce avem listele noastre de labeluri și de șiruri de predicție, calcularea scorului ROUGE este ușoară:
-
-```python
-result = rouge_score.compute(
-    predictions=decoded_preds, references=decoded_labels, use_stemmer=True
-)
-result = {key: value.mid.fmeasure * 100 for key, value in result.items()}
-{k: round(v, 4) for k, v in result.items()}
-```
-
-```
-{'rouge1': 31.4815, 'rouge2': 25.4386, 'rougeL': 31.4815, 'rougeLsum': 31.4815}
-```
-
-
-{/if}
-
-{#if fw === 'pt'}
-
-## Fine-tuningul mT5 cu 🤗 Accelerate[[fine-tuning-mt5-with-accelerate]]
-
-Fine-tuningul nostru cu 🤗 Accelerate este foarte asemănător cu exemplul de clasificare a textului pe care l-am întâlnit în [Capitolul 3](/course/chapter3). Principalele diferențe vor fi necesitatea de a genera în mod explicit rezumatele noastre în timpul antrenării și de a defini modul în care calculăm scorurile ROUGE (reamintim că `Seq2SeqTrainer` a avut grijă de generare pentru noi). Să aruncăm o privire la modul în care putem implementa aceste două cerințe în cadrul 🤗 Accelerate!
-
-### Pregătirea pentru antrenare[[preparing-everything-for-training]]
-
-Primul lucru pe care trebuie să-l facem este să creăm un `DataLoader` pentru fiecare dintre spliturile noastre. Deoarece dataloaders PyTorch așteaptă batchuri de tensori, trebuie să setăm formatul la `"torch"` în dataseturile noastre:
-
-```python
-tokenized_datasets.set_format("torch")
-```
-
-Acum că avem dataseturi formate doar din tensori, următorul lucru este inițializarea `DataCollatorForSeq2Seq`. Pentru aceasta trebuie să furnizăm o versiune nouă a modelului, așa că hai să îl încărcăm din nou din cache:
-
-```python
-model = AutoModelForSeq2SeqLM.from_pretrained(model_checkpoint)
-```
-
-Putem apoi să instanțiem data collatorul și să îl folosim pentru a ne defini dataloaders:
-
-```python
-from torch.utils.data import DataLoader
-
-batch_size = 8
-train_dataloader = DataLoader(
-    tokenized_datasets["train"],
-    shuffle=True,
-    collate_fn=data_collator,
-    batch_size=batch_size,
-)
-eval_dataloader = DataLoader(
-    tokenized_datasets["validation"], collate_fn=data_collator, batch_size=batch_size
-)
-```
-
-Următorul lucru este definirea optimizatorului pe care dorim să îl utilizăm. Ca și în celelalte exemple, vom folosi `AdamW`, care funcționează bine pentru majoritatea problemelor:
-
-```python
-from torch.optim import AdamW
-
-optimizer = AdamW(model.parameters(), lr=2e-5)
-```
-
-În cele din urmă, introducem modelul, optimizatorul și dataloaders în metoda `accelerator.prepare()`:
-
-```python
-from accelerate import Accelerator
-
-accelerator = Accelerator()
-model, optimizer, train_dataloader, eval_dataloader = accelerator.prepare(
-    model, optimizer, train_dataloader, eval_dataloader
-)
-```
-
-<Tip>
-
-🚨 Dacă faceți antrenarea pe un TPU, va trebui să mutați tot codul de mai sus într-o funcție de antrenare aparte. Consultați [Capitolul 3](/course/chapter3) pentru mai multe detalii.
-
-</Tip>
-
-Acum că ne-am pregătit obiectele, mai avem trei lucruri de făcut:
-
-* Definirea learning rate schedule.
-* Implementarea unei funcții de post-procesare a rezumatelor pentru evaluare.
-* Crearea unui repositoriu pe Hub în care să putem trimite modelul nostru.
-
-Pentru learning rate schedule, îl vom utiliza pe cel liniar standard din secțiunile anterioare:
-
-```python
-from transformers import get_scheduler
-
-num_train_epochs = 10
-num_update_steps_per_epoch = len(train_dataloader)
-num_training_steps = num_train_epochs * num_update_steps_per_epoch
-
-lr_scheduler = get_scheduler(
-    "linear",
-    optimizer=optimizer,
-    num_warmup_steps=0,
-    num_training_steps=num_training_steps,
-)
-```
-
-Pentru post-procesare, avem nevoie de o funcție care să împartă rezumatele generate în propoziții separate prin linii noi. Acesta este formatul pe care îl așteaptă metrica ROUGE, iar noi putem realiza acest lucru cu următorul fragment de cod:
-
-```python
-def postprocess_text(preds, labels):
-    preds = [pred.strip() for pred in preds]
-    labels = [label.strip() for label in labels]
-
-    # ROUGE expects a newline after each sentence
-    preds = ["\n".join(nltk.sent_tokenize(pred)) for pred in preds]
-    labels = ["\n".join(nltk.sent_tokenize(label)) for label in labels]
-
-    return preds, labels
-```
-
-Acest lucru ar trebui să vă pară familiar dacă vă amintiți cum am definit funcția `compute_metrics()` a `Seq2SeqTrainer`.
-
-În cele din urmă, trebuie să creăm un repositoriu de modele pe Hugging Face Hub. Pentru aceasta, putem utiliza biblioteca 🤗 Hub intitulată corespunzător . Trebuie doar să definim un nume pentru repositoriul nostru, iar biblioteca are o funcție utilitară pentru a combina ID-ul repositoriul cu profilul utilizatorului:
-
-```python
-from huggingface_hub import get_full_repo_name
-
-model_name = "test-bert-finetuned-squad-accelerate"
-repo_name = get_full_repo_name(model_name)
-repo_name
-```
-
-```python out
-'lewtun/mt5-finetuned-amazon-en-es-accelerate'
-```
-
-Acum putem folosi numele repositoriului pentru a clona o versiune locală în folderul nostru cu rezultate care va stoca artefactele de antrenare:
-
-```python
-from huggingface_hub import Repository
-
-output_dir = "results-mt5-finetuned-squad-accelerate"
-repo = Repository(output_dir, clone_from=repo_name)
-```
-
-Acest lucru ne va permite să trimitem artefactele înapoi la Hub prin apelarea metodei `repo.push_to_hub()` în timpul antrenării! Să încheiem acum analiza noastră prin scrierea buclei de antrenare.
-
-### Bucla de antrenare[[training-loop]]
-
-Bucla de formare pentru sumarizare este destul de asemănătoare cu celelalte exemple 🤗 Accelerate pe care le-am întâlnit și este împărțită aproximativ în patru etape principale:
-
-1. Antrenarea modelului prin iterarea peste toate exemplele din `train_dataloader` pentru fiecare epocă.
-2. Generarea rezumatelor modelului la sfârșitul fiecărei epoci, mai întâi prin generarea token-urilor și apoi prin decodarea lor (și a rezumatelor de referință) în text.
-3. Calcularea scorurilor ROUGE folosind aceleași tehnici pe care le-am văzut mai devreme.
-4. Salvați checkpointurile și încărcați totul pe Hub. Aici ne bazăm pe argumentul `blocking=False` al obiectului `Repository` astfel încât să putem împinge checkointurile pentru fiecare epocă _asincron_. Acest lucru ne permite să continuăm antrenamentul fără a fi nevoiți să așteptăm încărcarea oarecum lentă asociată cu un model de dimensiunea unui GB!
-
-Acești pași pot fi observați în următorul bloc de cod:
-
-```python
-from tqdm.auto import tqdm
-import torch
-import numpy as np
-
-progress_bar = tqdm(range(num_training_steps))
-
-for epoch in range(num_train_epochs):
-    # Training
-    model.train()
-    for step, batch in enumerate(train_dataloader):
-        outputs = model(**batch)
-        loss = outputs.loss
-        accelerator.backward(loss)
-
-        optimizer.step()
-        lr_scheduler.step()
-        optimizer.zero_grad()
-        progress_bar.update(1)
-
-    # Evaluation
-    model.eval()
-    for step, batch in enumerate(eval_dataloader):
-        with torch.no_grad():
-            generated_tokens = accelerator.unwrap_model(model).generate(
-                batch["input_ids"],
-                attention_mask=batch["attention_mask"],
-            )
-
-            generated_tokens = accelerator.pad_across_processes(
-                generated_tokens, dim=1, pad_index=tokenizer.pad_token_id
-            )
-            labels = batch["labels"]
-
-            # If we did not pad to max length, we need to pad the labels too
-            labels = accelerator.pad_across_processes(
-                batch["labels"], dim=1, pad_index=tokenizer.pad_token_id
-            )
-
-            generated_tokens = accelerator.gather(generated_tokens).cpu().numpy()
-            labels = accelerator.gather(labels).cpu().numpy()
-
-            # Replace -100 in the labels as we can't decode them
-            labels = np.where(labels != -100, labels, tokenizer.pad_token_id)
-            if isinstance(generated_tokens, tuple):
-                generated_tokens = generated_tokens[0]
-            decoded_preds = tokenizer.batch_decode(
-                generated_tokens, skip_special_tokens=True
-            )
-            decoded_labels = tokenizer.batch_decode(labels, skip_special_tokens=True)
-
-            decoded_preds, decoded_labels = postprocess_text(
-                decoded_preds, decoded_labels
-            )
-
-            rouge_score.add_batch(predictions=decoded_preds, references=decoded_labels)
-
-    # Compute metrics
-    result = rouge_score.compute()
-    # Extract the median ROUGE scores
-    result = {key: value.mid.fmeasure * 100 for key, value in result.items()}
-    result = {k: round(v, 4) for k, v in result.items()}
-    print(f"Epoch {epoch}:", result)
-
-    # Save and upload
-    accelerator.wait_for_everyone()
-    unwrapped_model = accelerator.unwrap_model(model)
-    unwrapped_model.save_pretrained(output_dir, save_function=accelerator.save)
-    if accelerator.is_main_process:
-        tokenizer.save_pretrained(output_dir)
-        repo.push_to_hub(
-            commit_message=f"Training in progress epoch {epoch}", blocking=False
-        )
-```
-
-```python out
-Epoch 0: {'rouge1': 5.6351, 'rouge2': 1.1625, 'rougeL': 5.4866, 'rougeLsum': 5.5005}
-Epoch 1: {'rouge1': 9.8646, 'rouge2': 3.4106, 'rougeL': 9.9439, 'rougeLsum': 9.9306}
-Epoch 2: {'rouge1': 11.0872, 'rouge2': 3.3273, 'rougeL': 11.0508, 'rougeLsum': 10.9468}
-Epoch 3: {'rouge1': 11.8587, 'rouge2': 4.8167, 'rougeL': 11.7986, 'rougeLsum': 11.7518}
-Epoch 4: {'rouge1': 12.9842, 'rouge2': 5.5887, 'rougeL': 12.7546, 'rougeLsum': 12.7029}
-Epoch 5: {'rouge1': 13.4628, 'rouge2': 6.4598, 'rougeL': 13.312, 'rougeLsum': 13.2913}
-Epoch 6: {'rouge1': 12.9131, 'rouge2': 5.8914, 'rougeL': 12.6896, 'rougeLsum': 12.5701}
-Epoch 7: {'rouge1': 13.3079, 'rouge2': 6.2994, 'rougeL': 13.1536, 'rougeLsum': 13.1194}
-Epoch 8: {'rouge1': 13.96, 'rouge2': 6.5998, 'rougeL': 13.9123, 'rougeLsum': 13.7744}
-Epoch 9: {'rouge1': 14.1192, 'rouge2': 7.0059, 'rougeL': 14.1172, 'rougeLsum': 13.9509}
-```
-
-Și asta e tot! După ce executați acest lucru, veți avea un model și rezultate care sunt destul de asemănătoare cu cele obținute cu `Trainer`.
-
-{/if}
-
-## Utilizarea modelului fine-tuned[[using-your-fine-tuned-model]]
-
-Odată ce ați încărcat modelul în Hub, vă puteți juca cu el prin widgetul de inference, fie cu un obiect `pipeline`, după cum urmează:
-
-```python
-from transformers import pipeline
-
-hub_model_id = "huggingface-course/mt5-small-finetuned-amazon-en-es"
-summarizer = pipeline("summarization", model=hub_model_id)
-```
-
-Putem introduce câteva exemple din setul de testare (pe care modelul nu le-a văzut) în pipelineul noastru pentru a avea o idee despre calitatea rezumatelor. Mai întâi, să implementăm o funcție simplă pentru a afișa împreună recenzia, titlul și rezumatul generat:
-
-```python
-def print_summary(idx):
-    review = books_dataset["test"][idx]["review_body"]
-    title = books_dataset["test"][idx]["review_title"]
-    summary = summarizer(books_dataset["test"][idx]["review_body"])[0]["summary_text"]
-    print(f"'>>> Review: {review}'")
-    print(f"\n'>>> Title: {title}'")
-    print(f"\n'>>> Summary: {summary}'")
-```
-
-Să aruncăm o privire la unul dintre exemplele englezești pe care le primim:
-
-```python
-print_summary(100)
-```
-
-```python out
-'>>> Review: Nothing special at all about this product... the book is too small and stiff and hard to write in. The huge sticker on the back doesn’t come off and looks super tacky. I would not purchase this again. I could have just bought a journal from the dollar store and it would be basically the same thing. It’s also really expensive for what it is.'
-
-'>>> Title: Not impressed at all... buy something else'
-
-'>>> Summary: Nothing special at all about this product'
-```
-
-This is not too bad! We can see that our model has actually been able to perform _abstractive_ summarization by augmenting parts of the review with new words. And perhaps the coolest aspect of our model is that it is bilingual, so we can also generate summaries of Spanish reviews:
-
-```python
-print_summary(0)
-```
-
-```python out
-'>>> Review: Es una trilogia que se hace muy facil de leer. Me ha gustado, no me esperaba el final para nada'
-
-'>>> Title: Buena literatura para adolescentes'
-
-'>>> Summary: Muy facil de leer'
-```
-
-Rezumatul se traduce prin "Very easy to read" în limba engleză, ceea ce putem vedea că în acest caz a fost extras direct din recenzie. Cu toate acestea, acest lucru arată versatilitatea modelului mT5 și v-a dat o idee despre cum este să aveți de-a face cu un corpus multilingv!
-
-În continuare, ne vom îndrepta atenția către o sarcină puțin mai complexă: antrenarea unui model lingvistic de la zero.
\ No newline at end of file
diff --git a/chapters/ro/chapter7/6.mdx b/chapters/ro/chapter7/6.mdx
deleted file mode 100644
index decbcf3eb..000000000
--- a/chapters/ro/chapter7/6.mdx
+++ /dev/null
@@ -1,914 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Antrenarea unui model de limbaj cauzal de la zero[[training-a-causal-language-model-from-scratch]]
-
-{#if fw === 'pt'}
-
-<CourseFloatingBanner chapter={7}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter7/section6_pt.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter7/section6_pt.ipynb"},
-]} />
-
-{:else}
-
-<CourseFloatingBanner chapter={7}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter7/section6_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter7/section6_tf.ipynb"},
-]} />
-
-{/if}
-
-Până acum, am folosit în principal modele preantrenate și le-am făcut fine-tuning pentru noi cazuri de utilizare prin reutilizarea weighturilor din preantrenare. După cum am văzut în [Capitolul 1](/course/chapter1), acest lucru este denumit în mod obișnuit _învățare prin transfer_ și este o strategie foarte reușită pentru aplicarea modelelor Transformer la majoritatea cazurilor de utilizare din lumea reală în care datele etichetate sunt puține. În acest capitol, vom adopta o abordare diferită și vom antrena un model complet nou de la zero. Aceasta este o abordare bună dacă aveți multe date și este foarte diferită de datele de preantrenare utilizate pentru modelele disponibile. Cu toate acestea, preantrenarea unui model lingvistic necesită, de asemenea, mult mai multe resurse de calcul decât fine-tuningul unui model existent. Printre exemplele în care poate fi utilă antrenarea unui nou model se numără dataseturile formate din note muzicale, secvențe moleculare precum ADN sau limbaje de programare. Acestea din urmă au câștigat recent teren datorită unor instrumente precum TabNine și Copilot de la GitHub, alimentate de modelul Codex al OpenAI, care pot genera secvențe lungi de cod. Această sarcină de generare a textului este cel mai bine abordată cu modele de limbaj autoregresive sau cauzale, cum ar fi GPT-2.
-
-În această secțiune vom construi o versiune la scară redusă a unui model de generare a codului: ne vom concentra pe completări de o linie în loc de funcții sau clase complete, folosind un subset de cod Python. Atunci când lucrați cu date în Python, sunteți în contact frecvent Python data science stack, formată din bibliotecile `matplotlib`, `seaborn`, `pandas` și `scikit-learn`. Atunci când se utilizează aceste cadre, este frecvent să fie nevoie să se caute comenzi specifice, astfel încât ar fi bine dacă am putea utiliza un model care să efectueze aceste apeluri pentru noi.
-
-<Youtube id="Vpjb1lu0MDk"/>
-
-În [Capitolul 6](/course/chapter6) am creat un tokenizer eficient pentru a procesa codul sursă Python, dar avem nevoie de un dataset la scară largă pe care să preantrenăm un model. Aici, vom aplica tokenizerul nostru la un corpus de cod Python derivat din repositoriile GitHub. Vom utiliza apoi API-ul `Trainer` și 🤗 Accelerate pentru a antrena modelul. Să trecem la treabă!
-
-<iframe src="https://course-demos-codeparrot-ds.hf.space" frameBorder="0" height="300" title="Gradio app" class="block dark:hidden container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
-
-Aceasta este de fapt o prezentare a modelului care a fost antrenat și încărcat în Hub folosind codul prezentat în această secțiune. Îl puteți găsi [aici](https://huggingface.co/huggingface-course/codeparrot-ds?text=plt.imshow%28). Rețineți că, deoarece are loc o anumită randomizare în generarea textului, veți obține probabil un rezultat ușor diferit.
- 
-## Colectarea datelor[[gathering-the-data]]
-
-Codul Python este disponibil din abundență în repositorii de cod, cum ar fi GitHub, pe care le putem utiliza pentru a crea un dataset prin scraping pentru fiecare repositoriu Python. Aceasta a fost abordarea adoptată în [Transformers textbook](https://learning.oreilly.com/library/view/natural-language-processing/9781098136789/) pentru a preantrena un model GPT-2. Folosind o descărcare GitHub de aproximativ 180 GB care conține aproximativ 20 de milioane de fișiere Python numită `codeparrot`, autorii au construit un dataset pe care l-au oferit apoi pe [Hugging Face Hub](https://huggingface.co/datasets/transformersbook/codeparrot).
-
-Cu toate acestea, antrenarea pe întregul corpus consumă timp și puterea calculatorului, iar noi avem nevoie doar de subsetul datasetului referitor la Python data science stack. Așadar, să începem prin filtrarea datasetului `codeparrot` pentru toate fișierele care includ oricare dintre bibliotecile din aceast stack. Din cauza dimensiunii datasetului, dorim să evităm descărcarea acestuia; în schimb, vom utiliza funcția de streaming pentru a-l filtra din mers. Pentru a ne ajuta să filtrăm exemplele de cod care utilizează bibliotecile pe care le-am menționat mai devreme, vom utiliza următoarea funcție:
-
-```py
-def any_keyword_in_string(string, keywords):
-    for keyword in keywords:
-        if keyword in string:
-            return True
-    return False
-```
-
-Să-l testăm pe două exemple:
-
-```py
-filters = ["pandas", "sklearn", "matplotlib", "seaborn"]
-example_1 = "import numpy as np"
-example_2 = "import pandas as pd"
-
-print(
-    any_keyword_in_string(example_1, filters), any_keyword_in_string(example_2, filters)
-)
-```
-
-```python out
-False True
-```
-
-Putem folosi acest lucru pentru a crea o funcție care va transmite în flux datasetul și va filtra elementele dorite:
-
-```py
-from collections import defaultdict
-from tqdm import tqdm
-from datasets import Dataset
-
-
-def filter_streaming_dataset(dataset, filters):
-    filtered_dict = defaultdict(list)
-    total = 0
-    for sample in tqdm(iter(dataset)):
-        total += 1
-        if any_keyword_in_string(sample["content"], filters):
-            for k, v in sample.items():
-                filtered_dict[k].append(v)
-    print(f"{len(filtered_dict['content'])/total:.2%} of data after filtering.")
-    return Dataset.from_dict(filtered_dict)
-```
-
-Apoi, putem aplica pur și simplu această funcție pe datasetului din flux:
-
-```py
-# This cell will take a very long time to execute, so you should skip it and go to
-# the next one!
-from datasets import load_dataset
-
-split = "train"  # "valid"
-filters = ["pandas", "sklearn", "matplotlib", "seaborn"]
-
-data = load_dataset(f"transformersbook/codeparrot-{split}", split=split, streaming=True)
-filtered_data = filter_streaming_dataset(data, filters)
-```
-
-```python out
-3.26% of data after filtering.
-```
-
-Acest lucru ne lasă cu aproximativ 3% din setul de date original, care este încă destul de mare - datasetul rezultat este de 6 GB și constă din 600.000 de scripturi Python!
-
-Filtrarea datasetului complet poate dura 2-3 ore, în funcție de calculator și de bandwidth. Dacă nu doriți să parcurgeți singur acest proces îndelungat, vă punem la dispoziție datasetul filtrat pe Hub pentru a-l descărca:
-
-```py
-from datasets import load_dataset, DatasetDict
-
-ds_train = load_dataset("huggingface-course/codeparrot-ds-train", split="train")
-ds_valid = load_dataset("huggingface-course/codeparrot-ds-valid", split="validation")
-
-raw_datasets = DatasetDict(
-    {
-        "train": ds_train,  # .shuffle().select(range(50000)),
-        "valid": ds_valid,  # .shuffle().select(range(500))
-    }
-)
-
-raw_datasets
-```
-
-```python out
-DatasetDict({
-    train: Dataset({
-        features: ['repo_name', 'path', 'copies', 'size', 'content', 'license'],
-        num_rows: 606720
-    })
-    valid: Dataset({
-        features: ['repo_name', 'path', 'copies', 'size', 'content', 'license'],
-        num_rows: 3322
-    })
-})
-```
-
-<Tip>
-
-Preantrenarea modelului de limbaj va dura ceva timp. Vă sugerăm să rulați mai întâi bucla de antrenare pe un sample de date prin decomentarea celor două linii parțiale de mai sus și să vă asigurați că antrenarea se finalizează cu succes și că modelele sunt stocate. Nimic nu este mai frustrant decât o rulare de antrenare care eșuează la ultimul pas pentru că ați uitat să creați un folder sau pentru că există o greșeală de tipar la sfârșitul buclei de antrenare!
-
-</Tip>
-
-Să ne uităm la un exemplu din dataset. Vom arăta doar primele 200 de caractere din fiecare câmp:
-
-```py
-for key in raw_datasets["train"][0]:
-    print(f"{key.upper()}: {raw_datasets['train'][0][key][:200]}")
-```
-
-```python out
-'REPO_NAME: kmike/scikit-learn'
-'PATH: sklearn/utils/__init__.py'
-'COPIES: 3'
-'SIZE: 10094'
-'''CONTENT: """
-The :mod:`sklearn.utils` module includes various utilites.
-"""
-
-from collections import Sequence
-
-import numpy as np
-from scipy.sparse import issparse
-import warnings
-
-from .murmurhash import murm
-LICENSE: bsd-3-clause'''
-```
-
-Putem vedea căci câmpul `content` conține codul pe care dorim ca modelul nostru să se antreneze. Acum că avem un dataset, trebuie să pregătim textele astfel încât acestea să fie într-un format adecvat pentru preantrenare.
-
-## Pregătirea datasetului[[preparing-the-dataset]]
-
-<Youtube id="ma1TrR7gE7I"/>
-
-Primul pas va fi tokenizarea datelor, astfel încât să le putem utiliza pentru antrenare. Deoarece obiectivul nostru este de a autocompleta în principal apeluri scurte de funcții, putem păstra dimensiunea contextului relativ mică. Acest lucru are avantajul că putem antrena modelul mult mai rapid și că necesită semnificativ mai puțină memorie. Dacă este important pentru aplicația voastră să aveți mai mult context (de exemplu, dacă doriți ca modelul să scrie teste unitare pe baza unui fișier cu definiția funcției), asigurați-vă că măriți acest număr, dar rețineți, de asemenea, că acest lucru vine cu utilizare mai mare de memorie GPU. Pentru moment, să fixăm dimensiunea contextului la 128 de tokeni, spre deosebire de 1 024 sau 2 048 utilizate în GPT-2 sau respectiv GPT-3.
-
-Majoritatea documentelor conțin mult mai mult de 128 de cuvinte, astfel încât trunchierea simplă a inputurilor la lungimea maximă ar elimina o mare parte din datasetul nostru. În schimb, vom utiliza opțiunea `return_overflowing_tokens` pentru a tokeniza întreagul input și a o împărți în mai multe bucăți, așa cum am făcut în [Capitolul 6](/course/chapter6/4). De asemenea, vom utiliza opțiunea `return_length` pentru a returna automat lungimea fiecărui fragment creat. Adesea, ultimul fragment va fi mai mic decât dimensiunea contextului, iar noi vom scăpa de aceste bucăți pentru a evita problemele de padding; nu avem nevoie de ele, deoarece oricum avem o mulțime de date.
-
-<div class="flex justify-center">
-<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/chunking_texts.svg" alt="Fragmentarea unui text mare în mai multe bucăți."/>
-<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/chunking_texts-dark.svg" alt="Fragmentarea unui text mare în mai multe bucăți."/>
-</div>
-
-Să vedem exact cum funcționează acest lucru analizând primele două exemple:
-
-```py
-from transformers import AutoTokenizer
-
-context_length = 128
-tokenizer = AutoTokenizer.from_pretrained("huggingface-course/code-search-net-tokenizer")
-
-outputs = tokenizer(
-    raw_datasets["train"][:2]["content"],
-    truncation=True,
-    max_length=context_length,
-    return_overflowing_tokens=True,
-    return_length=True,
-)
-
-print(f"Input IDs length: {len(outputs['input_ids'])}")
-print(f"Input chunk lengths: {(outputs['length'])}")
-print(f"Chunk mapping: {outputs['overflow_to_sample_mapping']}")
-```
-
-```python out
-Input IDs length: 34
-Input chunk lengths: [128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 117, 128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 41]
-Chunk mapping: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]
-```
-
-Putem vedea că obținem 34 de segmente în total din aceste două exemple. Uitându-ne la lungimea segmentelor, putem vedea că segmentele de la sfârșitul ambelor documente au mai puțin de 128 de token-uri (117 și, respectiv, 41). Acestea reprezintă doar o mică parte din totalul segmentelor pe care le avem, așa că le putem șterge în siguranță. Cu ajutorul câmpului `overflow_to_sample_mapping`, putem, de asemenea, să reconstituim care segmente au aparținut căror probe de intrare.
-
-Cu această operațiune folosim o caracteristică utilă a funcției `Dataset.map()` din 🤗 Datasets, și anume că nu necesită one-to-one maps; așa cum am văzut în [secțiunea 3](/course/chaptero7/3), putem crea batch-uri cu mai multe sau mai puține elemente decât batch-ul de intrare. Acest lucru este util atunci când efectuăm operațiuni precum augmentarea sau filtrarea datelor care modifică numărul de elemente. În cazul nostru, atunci când tokenizăm fiecare element în segmente de dimensiunea contextului specificat, creăm multe probe din fiecare document. Trebuie doar să ne asigurăm că ștergem coloanele existente, deoarece acestea au o dimensiune conflictuală. Dacă am dori să le păstrăm, am putea să le repetăm în mod corespunzător și să le returnăm în cadrul apelului `Dataset.map()`:
-
-```py
-def tokenize(element):
-    outputs = tokenizer(
-        element["content"],
-        truncation=True,
-        max_length=context_length,
-        return_overflowing_tokens=True,
-        return_length=True,
-    )
-    input_batch = []
-    for length, input_ids in zip(outputs["length"], outputs["input_ids"]):
-        if length == context_length:
-            input_batch.append(input_ids)
-    return {"input_ids": input_batch}
-
-
-tokenized_datasets = raw_datasets.map(
-    tokenize, batched=True, remove_columns=raw_datasets["train"].column_names
-)
-tokenized_datasets
-```
-
-```python out
-DatasetDict({
-    train: Dataset({
-        features: ['input_ids'],
-        num_rows: 16702061
-    })
-    valid: Dataset({
-        features: ['input_ids'],
-        num_rows: 93164
-    })
-})
-```
-
-Avem acum 16,7 milioane de exemple cu 128 de tokenii fiecare, ceea ce corespunde unui total de aproximativ 2,1 miliarde de tokeni. Ca referință, modelele GPT-3 și Codex ale OpenAI sunt antrenate pe 300 și, respectiv, 100 de miliarde de tokeni, unde modelele Codex sunt inițializate din checkpointurile GPT-3. Scopul nostru în această secțiune nu este de a concura cu aceste modele, care pot genera texte lungi și coerente, ci de a crea o versiune la scară redusă care să ofere o funcție rapidă de autocompletare pentru data scientists.
-
-Acum că avem datasetul gata, hai să configurăm modelul!
-
-<Tip>
-
-✏️ **Încercați!** Eliminarea tuturor bucăților care sunt mai mici decât dimensiunea contextului nu a fost o problemă majoră aici, deoarece folosim ferestre de context mici. Pe măsură ce creșteți dimensiunea contextului (sau dacă aveți un corpus de documente scurte), fracțiunea de segmente care sunt aruncate va crește și ea. O modalitate mai eficientă de a pregăti datele este de a uni toate sampleurile tokenizate într-un batch cu un token `eos_token_id` între ele, iar apoi de a efectua chunkingul pe secvențele concatenate. Ca exercițiu, modificați funcția `tokenize()` pentru a utiliza această abordare. Rețineți că veți dori să setați `truncation=False` și să eliminați celelalte argumente din tokenizer pentru a obține secvența completă de token IDs.
-
-</Tip>
-
-
-## Inițializarea unui nou model[[initializing-a-new-model]]
-
-Primul nostru pas este să inițializăm un model GPT-2. Vom utiliza aceeași configurație pentru modelul nostru ca și pentru modelul GPT-2 mic, deci încărcăm configurația preantrenată, ne asigurăm că dimensiunea tokenizerlui corespunde cu dimensiunea vocabularului modelului și transmitem ID-urile tokenilor `bos` și `eos` (începutul și sfârșitul secvenței):
-
-{#if fw === 'pt'}
-
-```py
-from transformers import AutoTokenizer, GPT2LMHeadModel, AutoConfig
-
-config = AutoConfig.from_pretrained(
-    "gpt2",
-    vocab_size=len(tokenizer),
-    n_ctx=context_length,
-    bos_token_id=tokenizer.bos_token_id,
-    eos_token_id=tokenizer.eos_token_id,
-)
-```
-
-Cu această configurație, putem încărca un nou model. Rețineți că aceasta este prima dată când nu folosim funcția `from_pretrained()`, deoarece inițializăm noi înșine un model:
-
-```py
-model = GPT2LMHeadModel(config)
-model_size = sum(t.numel() for t in model.parameters())
-print(f"GPT-2 size: {model_size/1000**2:.1f}M parameters")
-```
-
-```python out
-GPT-2 size: 124.2M parameters
-```
-
-{:else}
-
-```py
-from transformers import AutoTokenizer, TFGPT2LMHeadModel, AutoConfig
-
-config = AutoConfig.from_pretrained(
-    "gpt2",
-    vocab_size=len(tokenizer),
-    n_ctx=context_length,
-    bos_token_id=tokenizer.bos_token_id,
-    eos_token_id=tokenizer.eos_token_id,
-)
-```
-
-Cu această configurație, putem încărca un nou model. Rețineți că aceasta este prima dată când nu folosim funcția `from_pretrained()`, deoarece inițializăm noi înșine un model:
-
-```py
-model = TFGPT2LMHeadModel(config)
-model(model.dummy_inputs)  # Builds the model
-model.summary()
-```
-
-```python out
-_________________________________________________________________
-Layer (type)                 Output Shape              Param #   
-=================================================================
-transformer (TFGPT2MainLayer multiple                  124242432 
-=================================================================
-Total params: 124,242,432
-Trainable params: 124,242,432
-Non-trainable params: 0
-_________________________________________________________________
-```
-
-{/if}
-
-Modelul nostru are 124 milioane de parametri pe care va trebui să le facem tune. Înainte de a începe antrenarea, trebuie să configurăm un data collator care se va ocupa de crearea batch-urilor. Putem utiliza colatorul `DataCollatorForLanguageModeling`, care este conceput special pentru modelarea limbajului (după cum sugerează subtil numele). Pe lângă stacking și paddingul batchurilor, acesta se ocupă și de crearea labelurilor modelului lingvistic - în modelarea cauzală a limbajului, inputurile servesc și ca labels (doar că sunt decalate cu un element), iar acest data collator le creează din mers în timpul antrenării, astfel încât să nu fie nevoie să duplicăm `input_ids`.
-
-Rețineți că `DataCollatorForLanguageModeling` acceptă atât masked language masking (MLM), cât și causal language modeling(CLM). În mod implicit, acesta pregătește datele pentru MLM, dar putem trece la CLM prin setarea argumentului `mlm=False`:
-
-{#if fw === 'pt'}
-
-```py
-from transformers import DataCollatorForLanguageModeling
-
-tokenizer.pad_token = tokenizer.eos_token
-data_collator = DataCollatorForLanguageModeling(tokenizer, mlm=False)
-```
-
-{:else}
-
-```py
-from transformers import DataCollatorForLanguageModeling
-
-tokenizer.pad_token = tokenizer.eos_token
-data_collator = DataCollatorForLanguageModeling(tokenizer, mlm=False, return_tensors="tf")
-```
-
-{/if}
-
-Să aruncăm o privire la un exemplu:
-
-```py
-out = data_collator([tokenized_datasets["train"][i] for i in range(5)])
-for key in out:
-    print(f"{key} shape: {out[key].shape}")
-```
-
-{#if fw === 'pt'}
-
-```python out
-input_ids shape: torch.Size([5, 128])
-attention_mask shape: torch.Size([5, 128])
-labels shape: torch.Size([5, 128])
-```
-
-{:else}
-
-```python out
-input_ids shape: (5, 128)
-attention_mask shape: (5, 128)
-labels shape: (5, 128)
-```
-
-{/if}
-
-Putem vedea că exemplele sunt stacked și că toți tensorii au aceeași formă.
-
-{#if fw === 'tf'}
-
-Acum putem utiliza metoda `prepare_tf_dataset()` pentru a converti dataseturile noastre în dataseturi TensorFlow cu ajutorul data collatorului pe care l-am creat mai sus:
-
-```python
-tf_train_dataset = model.prepare_tf_dataset(
-    tokenized_datasets["train"],
-    collate_fn=data_collator,
-    shuffle=True,
-    batch_size=32,
-)
-tf_eval_dataset = model.prepare_tf_dataset(
-    tokenized_datasets["valid"],
-    collate_fn=data_collator,
-    shuffle=False,
-    batch_size=32,
-)
-```
-
-{/if}
-
-<Tip warning={true}>
-
-⚠️ Schimbarea inputurilor și a labelurilor pentru a le alinia are loc în interiorul modelului, astfel încât data collatorului doar copiază inputurile pentru a crea labeluri.
-
-</Tip>
-
-
-Acum avem totul pregătit pentru a ne antrena modelul - până la urmă nu a fost atât de greu! Înainte de a începe antrenamentul, trebuie să ne conectăm la Hugging Face. Dacă lucrați într-un notebook, puteți face acest lucru cu următoarea funcție de utilitate:
-
-```python
-from huggingface_hub import notebook_login
-
-notebook_login()
-```
-
-Aceasta va afișa un widget în care puteți introduce datele voastre de autentificare Hugging Face.
-
-Dacă nu lucrați într-un notebook, tastați următoarea linie în terminal:
-
-```bash
-huggingface-cli login
-```
-
-{#if fw === 'pt'}
-
-Tot ce a mai rămas de făcut este să configurăm argumentele de antrenare și să pornim `Trainer`-ul. Vom utiliza un cosine learning rate schedule cu un warmup și o dimensiune efectivă a batch-ului de 256 (`per_device_train_batch_size` * `gradient_accumulation_steps`). Acumularea gradientului este utilizată atunci când un singur batch nu încape în memorie și construiește treptat gradientul prin mai multe treceri înainte/înapoi. Vom vedea acest lucru în acțiune atunci când vom crea bucla de antrenare cu 🤗 Accelerate.
-
-```py
-from transformers import Trainer, TrainingArguments
-
-args = TrainingArguments(
-    output_dir="codeparrot-ds",
-    per_device_train_batch_size=32,
-    per_device_eval_batch_size=32,
-    evaluation_strategy="steps",
-    eval_steps=5_000,
-    logging_steps=5_000,
-    gradient_accumulation_steps=8,
-    num_train_epochs=1,
-    weight_decay=0.1,
-    warmup_steps=1_000,
-    lr_scheduler_type="cosine",
-    learning_rate=5e-4,
-    save_steps=5_000,
-    fp16=True,
-    push_to_hub=True,
-)
-
-trainer = Trainer(
-    model=model,
-    tokenizer=tokenizer,
-    args=args,
-    data_collator=data_collator,
-    train_dataset=tokenized_datasets["train"],
-    eval_dataset=tokenized_datasets["valid"],
-)
-```
-
-Acum putem doar să pornim `Trainer`-ul și să așteptăm ca antrenamentul să se termine. În funcție de executarea antrenării pe întregul set de antrenarea sau pe un subset al acestuia, va dura 20 minute, sau respectiv 2 ore, așa că luați câteva cafeluțe și o carte bună de citit!
-
-```py
-trainer.train()
-```
-
-După finalizarea antrenării, putem trimite modelul și tokenizerul către Hub:
-
-```py
-trainer.push_to_hub()
-```
-
-{:else}
-
-Tot ce rămâne de făcut este să configurați hiperparametrii de antrenament și să apelați `compile()` și `fit()`. Vom utiliza un program al learning rate cu un anumit warmup pentru a îmbunătăți stabilitatea antrenării:
-
-```py
-from transformers import create_optimizer
-import tensorflow as tf
-
-num_train_steps = len(tf_train_dataset)
-optimizer, schedule = create_optimizer(
-    init_lr=5e-5,
-    num_warmup_steps=1_000,
-    num_train_steps=num_train_steps,
-    weight_decay_rate=0.01,
-)
-model.compile(optimizer=optimizer)
-
-# Train in mixed-precision float16
-tf.keras.mixed_precision.set_global_policy("mixed_float16")
-```
-
-Acum putem apela `model.fit()` și să așteptăm ca antrenarea să se încheie. În funcție de executarea antrenării pe întregul set de antrenarea sau pe un subset al acestuia, va dura 20 minute, sau respectiv 2 ore, așa că luați câteva cafeluțe și o carte bună de citit!
-
-```py
-from transformers.keras_callbacks import PushToHubCallback
-
-callback = PushToHubCallback(output_dir="codeparrot-ds", tokenizer=tokenizer)
-
-model.fit(tf_train_dataset, validation_data=tf_eval_dataset, callbacks=[callback])
-```
-
-{/if}
-
-<Tip>
-
-✏️ **Try it out!** Ne-a luat doar aproximativ 30 de linii de cod în plus față de `TrainingArguments` pentru a ajunge de la texte brute la antrenarea GPT-2. Încercați antrenarea cu propriul dataset și vedeți dacă puteți obține rezultate bune!
-
-</Tip>
-
-<Tip>
-
-{#if fw === 'pt'}
-
-💡 Dacă aveți acces la un calculator cu mai multe GPU-uri, încercați să rulați codul acolo. `Trainer` gestionează automat mai multe calculatoare, iar acest lucru poate accelera foarte mult antrenamentul.
-
-{:else}
-
-💡 Dacă aveți acces la un calculator cu mai multe GPU-uri, puteți încerca să utilizați un context `MirroredStrategy` pentru a accelera substanțial antrenarea. Va trebui să creați un obiect `tf.distribute.MirroredStrategy` și să vă asigurați că toate metodele `to_tf_dataset()` sau `prepare_tf_dataset()`, precum și crearea modelului și apelul la `fit()` sunt rulate în contextul său `scope()`. Puteți vedea documentația despre acest lucru [aici] (https://www.tensorflow.org/guide/distributed_training#use_tfdistributestrategy_with_keras_modelfit).
-
-{/if}
-
-</Tip>
-
-## Generarea codului cu un pipeline[[code-generation-with-a-pipeline]]
-
-Acum este momentul adevărului: să vedem cât de bine funcționează de fapt modelul antrenat! Putem vedea în loguri că pierderea a scăzut în mod constant, dar pentru a testa modelul, hai să vedem cât de bine funcționează la câteva încerări. Pentru a face acest lucru, vom încorpora modelul într-un `pipeline` de generare a textului și îl vom pune pe un GPU pentru generații rapide, dacă există unul disponibil:
-
-{#if fw === 'pt'}
-
-```py
-import torch
-from transformers import pipeline
-
-device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")
-pipe = pipeline(
-    "text-generation", model="huggingface-course/codeparrot-ds", device=device
-)
-```
-
-{:else}
-
-```py
-from transformers import pipeline
-
-course_model = TFGPT2LMHeadModel.from_pretrained("huggingface-course/codeparrot-ds")
-course_tokenizer = AutoTokenizer.from_pretrained("huggingface-course/codeparrot-ds")
-pipe = pipeline(
-    "text-generation", model=course_model, tokenizer=course_tokenizer, device=0
-)
-```
-
-{/if}
-
-Să începem cu sarcina simplă de a crea un scatter plot:
-
-```py
-txt = """\
-# create some data
-x = np.random.randn(100)
-y = np.random.randn(100)
-
-# crearea unui scatter plot cu x, y
-"""
-print(pipe(txt, num_return_sequences=1)[0]["generated_text"])
-```
-
-```python out
-# crearea unor date
-x = np.random.randn(100)
-y = np.random.randn(100)
-
-# crearea scatter plot cu x, y
-plt.scatter(x, y)
-
-# crearea scatter
-```
-
-Rezultatul pare corect. Funcționează și pentru o operație `pandas`? Să vedem dacă putem crea un `DataFrame` din două array-uri:
-
-```py
-txt = """\
-# create some data
-x = np.random.randn(100)
-y = np.random.randn(100)
-
-# creați dataframeul din x și y
-"""
-print(pipe(txt, num_return_sequences=1)[0]["generated_text"])
-```
-
-```python out
-# create some data
-x = np.random.randn(100)
-y = np.random.randn(100)
-
-# crează un dataframe din x și y
-df = pd.DataFrame({'x': x, 'y': y})
-df.insert(0,'x', x)
-for
-```
-
-Excelent, acesta este răspunsul corect - deși apoi introduce din nou coloana `x`. Deoarece numărul de tokeni generate este limitat, următoarea buclă `for` este întreruptă. Să vedem dacă putem face ceva un pic mai complex și dacă modelul ne ajută să folosim operația `groupby`:
-
-```py
-txt = """\
-# dataframe with profession, income and name
-df = pd.DataFrame({'profession': x, 'income':y, 'name': z})
-
-# calculați venitul mediu pe profesie
-"""
-print(pipe(txt, num_return_sequences=1)[0]["generated_text"])
-```
-
-```python out
-# dataframe with profession, income and name
-df = pd.DataFrame({'profession': x, 'income':y, 'name': z})
-
-# calculeză venitul mediu pe profesie
-profession = df.groupby(['profession']).mean()
-
-# calculează
-```
-
-Nu este rău; acesta este modul corect de a face acest lucru. În cele din urmă, să vedem dacă îl putem folosi și pentru `scikit-learn` și să configurăm un model Random Forest:
-
-```py
-txt = """
-# import random forest regressor from scikit-learn
-from sklearn.ensemble import RandomForestRegressor
-
-# ajustați modelul Random Forest cu 300 de estimatori pe X, y:
-"""
-print(pipe(txt, num_return_sequences=1)[0]["generated_text"])
-```
-
-```python out
-# import random forest regressor from scikit-learn
-from sklearn.ensemble import RandomForestRegressor
-
-# ajustați modelul Random Forest cu 300 de estimatori pe X, y:
-rf = RandomForestRegressor(n_estimators=300, random_state=random_state, max_depth=3)
-rf.fit(X, y)
-rf
-```
-
-{#if fw === 'tf'}
-
-Privind la aceste câteva exemple, se pare că modelul a învățat o parte din sintaxa Python data science stack. Desigur, ar trebui să evaluăm modelul mai amănunțit înainte de a-l implementa în lumea reală, totuși acesta este un prototip impresionant.
-
-{:else}
-
-Privind aceste câteva exemple, se pare că modelul a învățat o parte din sintaxa Python data science stack(desigur, ar trebui să o evaluăm mai bine înainte de a implementa modelul în lumea reală). Cu toate acestea, uneori este nevoie de o mai mare personalizare a antrenării modelului pentru a obține performanța necesară pentru un anumit caz de utilizare. De exemplu, dacă am dori să actualizăm dinamic dimensiunea batch-ului sau să avem o buclă de antrenare condiționată care trece peste exemplele proaste din mers? O opțiune ar fi să facem subclass la `Trainer` și să adăugăm modificările necesare, dar uneori este mai simplu să scriem bucla de antrenare de la zero. Aici intervine 🤗 Accelerate.
-
-{/if}
-
-{#if fw === 'pt'}
-
-## Antrenarea cu 🤗 Accelerate[[training-with-accelerate]]
-
-Am văzut cum să antrenăm un model cu `Trainer`, care poate permite o anumită personalizare. Cu toate acestea, uneori dorim control deplin asupra buclei de antrenare sau dorim să facem unele schimbări exotice. În acest caz, 🤗 Accelerate este o alegere excelentă, iar în această secțiune vom parcurge pașii de utilizare a acestuia pentru a ne antrena modelul. Pentru a face lucrurile mai interesante, vom adăuga și un twist buclei de antrenare.
-
-<Youtube id="Hm8_PgVTFuc"/>
-
-Deoarece suntem interesați în principal de o autocompletare sensibilă pentru bibliotecile din domeniul data science, este logic să acordăm mai multă importanță exemplelor de antrenare care utilizează mai mult aceste biblioteci. Putem identifica cu ușurință aceste exemple prin utilizarea unor cuvinte-cheie precum `plt`, `pd`, `sk`, `fit` și `predict`, care sunt cele mai frecvente nume de import pentru `matplotlib.pyplot`, `pandas` și `sklearn`, precum și modelul fit/predict al acestora din urmă. Dacă acestea sunt reprezentate fiecare ca un singur simbol, putem verifica cu ușurință dacă apar în secvența de input. Tokenii pot avea un prefix de spațiu, deci vom verifica și aceste versiuni în vocabularul tokenizerului. Pentru a verifica dacă funcționează, vom adăuga un token de test care ar trebui să fie împărțit în mai mulți tokeni:
-
-```py
-keytoken_ids = []
-for keyword in [
-    "plt",
-    "pd",
-    "sk",
-    "fit",
-    "predict",
-    " plt",
-    " pd",
-    " sk",
-    " fit",
-    " predict",
-    "testtest",
-]:
-    ids = tokenizer([keyword]).input_ids[0]
-    if len(ids) == 1:
-        keytoken_ids.append(ids[0])
-    else:
-        print(f"Keyword has not single token: {keyword}")
-```
-
-```python out
-'Keyword has not single token: testtest'
-```
-
-Grozav, se pare că funcționează bine! Acum putem scrie o funcție de pierdere personalizată care ia ca secvența de input, logurile și tokenii cheie pe care tocmai le-am selectat. În primul rând, trebuie să aliniem logurile și inputurile: secvența de intrare deplasată cu o unitate la dreapta formează labeluri, deoarece următorul tokenul este labelul pentru tokenul curent. Putem realiza acest lucru începând cu labelurile de la al doilea token al secvenței de intrare, deoarece modelul nu face o predicție pentru primul token în orice caz. Apoi tăiem ultimul logit, deoarece nu avem un label pentru tokenul care urmează secvenței complete de intrare. Astfel, putem calcula pierderea per sample și putem număra aparițiile tuturor cuvintelor-cheie în fiecare sample. În cele din urmă, calculăm media weighturilor pe fiecare sample folosind aparițiile ca weighturi. Deoarece nu dorim să eliminăm toate sampleurile care nu au cuvinte-cheie, adăugăm 1 la weighturi:
-
-```py
-from torch.nn import CrossEntropyLoss
-import torch
-
-
-def keytoken_weighted_loss(inputs, logits, keytoken_ids, alpha=1.0):
-    # Shift so that tokens < n predict n
-    shift_labels = inputs[..., 1:].contiguous()
-    shift_logits = logits[..., :-1, :].contiguous()
-    # Calculate per-token loss
-    loss_fct = CrossEntropyLoss(reduce=False)
-    loss = loss_fct(shift_logits.view(-1, shift_logits.size(-1)), shift_labels.view(-1))
-    # Resize and average loss per sample
-    loss_per_sample = loss.view(shift_logits.size(0), shift_logits.size(1)).mean(axis=1)
-    # Calculate and scale weighting
-    weights = torch.stack([(inputs == kt).float() for kt in keytoken_ids]).sum(
-        axis=[0, 2]
-    )
-    weights = alpha * (1.0 + weights)
-    # Calculate weighted average
-    weighted_loss = (loss_per_sample * weights).mean()
-    return weighted_loss
-```
-
-Înainte de a începe antrenamentul cu această nouă funcție de pierdere minunată, trebuie să pregătim câteva lucruri:
-
-- Avem nevoie de dataloaders pentru a încărca datele în batch-uri.
-- Trebuie să configurăm parametrii de scădere a weighturilor.
-- Din când în când, dorim să evaluăm, astfel încât este logic să includem codul de evaluare într-o funcție.
-
-Să începem cu dataloaders. Trebuie doar să setăm formatul datasetului la `"torch"`, iar apoi îl putem trece la un `DataLoader` PyTorch cu dimensiunea corespunzătoare a batch-lui:
-
-```py
-from torch.utils.data.dataloader import DataLoader
-
-tokenized_datasets.set_format("torch")
-train_dataloader = DataLoader(tokenized_datasets["train"], batch_size=32, shuffle=True)
-eval_dataloader = DataLoader(tokenized_datasets["valid"], batch_size=32)
-```
-
-În continuare, grupăm parametrii astfel încât optimizatorul să știe care dintre aceștia vor primi o scădere suplimentară a weighturilor. De obicei, toți termenii weighturilor bias și LayerNorm sunt scutiți de acest lucru; iată cum putem face acest lucru:
-
-```py
-weight_decay = 0.1
-
-
-def get_grouped_params(model, no_decay=["bias", "LayerNorm.weight"]):
-    params_with_wd, params_without_wd = [], []
-    for n, p in model.named_parameters():
-        if any(nd in n for nd in no_decay):
-            params_without_wd.append(p)
-        else:
-            params_with_wd.append(p)
-    return [
-        {"params": params_with_wd, "weight_decay": weight_decay},
-        {"params": params_without_wd, "weight_decay": 0.0},
-    ]
-```
-
-Deoarece dorim să evaluăm modelul în mod regulat pe setul de validare în timpul antrenării, trebuie să scriem o funcție și pentru acest lucru. Aceasta rulează pur și simplu prin dataloaderul de evaluare și adună toate pierderile în cadrul proceselor:
-
-```py
-def evaluate():
-    model.eval()
-    losses = []
-    for step, batch in enumerate(eval_dataloader):
-        with torch.no_grad():
-            outputs = model(batch["input_ids"], labels=batch["input_ids"])
-
-        losses.append(accelerator.gather(outputs.loss))
-    loss = torch.mean(torch.cat(losses))
-    try:
-        perplexity = torch.exp(loss)
-    except OverflowError:
-        perplexity = float("inf")
-    return loss.item(), perplexity.item()
-```
-
-Cu funcția `evaluate()` putem raporta pierderile și [perplexitatea](/course/chapter7/3) la intervale regulate. În continuare, redefinim modelul nostru pentru a ne asigura că antrenăm din nou de la zero:
-
-```py
-model = GPT2LMHeadModel(config)
-```
-
-Apoi putem defini optimizatorul nostru, folosind funcția de mai devreme pentru a împărți parametrii pentru scăderea weighturilor:
-
-```py
-from torch.optim import AdamW
-
-optimizer = AdamW(get_grouped_params(model), lr=5e-4)
-```
-
-Acum să pregătim modelul, optimizatorul și dataloaderurile, astfel încât să putem începe antrenamentul:
-
-```py
-from accelerate import Accelerator
-
-accelerator = Accelerator(fp16=True)
-
-model, optimizer, train_dataloader, eval_dataloader = accelerator.prepare(
-    model, optimizer, train_dataloader, eval_dataloader
-)
-```
-
-<Tip>
-
-🚨 Dacă antrenați pe un TPU, va trebui să mutați tot codul începând cu celula de mai sus într-o funcție de antrenare dedicată. Consultați [Capitolul 3](/course/chapter3) pentru mai multe detalii.
-
-</Tip>
-
-Acum că am trimis `train_dataloader` la `accelerator.prepare()`, putem utiliza lungimea acestuia pentru a calcula numărul de pași de antrenare. Rețineți că ar trebui să facem acest lucru întotdeauna după ce pregătim dataloaderurile, deoarece această metodă îi va modifica lungimea. Utilizăm un program liniar clasic de la rata de învățare la 0:
-
-```py
-from transformers import get_scheduler
-
-num_train_epochs = 1
-num_update_steps_per_epoch = len(train_dataloader)
-num_training_steps = num_train_epochs * num_update_steps_per_epoch
-
-lr_scheduler = get_scheduler(
-    name="linear",
-    optimizer=optimizer,
-    num_warmup_steps=1_000,
-    num_training_steps=num_training_steps,
-)
-```
-
-În cele din urmă, pentru a trimite modelul nostru către Hub, va trebui să creăm un obiect `Repository` într-un folder de lucru. În primul rând, conectați-vă la Hugging Face Hub, dacă nu sunteți deja conectat. Vom determina numele repositoriului pornind de la ID-ul modelului pe care dorim să îl atribuim modelului nostru (nu ezitați să înlocuiți `repo_name` cu propria alegere; acesta trebuie doar să conțină numele vostru de utilizator, ceea ce face funcția `get_full_repo_name()`):
-
-```py
-from huggingface_hub import Repository, get_full_repo_name
-
-model_name = "codeparrot-ds-accelerate"
-repo_name = get_full_repo_name(model_name)
-repo_name
-```
-
-```python out
-'sgugger/codeparrot-ds-accelerate'
-```
-
-Apoi putem clona acel repositoriu într-un folder local. Dacă există deja, acest folder local ar trebui să fie o clonă existentă a repositoriul cu care lucrăm:
-
-```py
-output_dir = "codeparrot-ds-accelerate"
-repo = Repository(output_dir, clone_from=repo_name)
-```
-
-Acum putem încărca orice salvăm în `output_dir` prin apelarea metodei `repo.push_to_hub()`. Acest lucru ne va ajuta să încărcăm modelele intermediare la sfârșitul fiecărei epoci.
-
-Înainte de antrenament, să efectuăm un test rapid pentru a vedea dacă funcția de evaluare funcționează corect:
-
-```py
-evaluate()
-```
-
-```python out
-(10.934126853942871, 56057.14453125)
-```
-
-Acestea sunt valori foarte ridicate pentru pierdere și perplexitate, dar acest lucru nu este surprinzător, deoarece nu am antrenat încă modelul. Astfel, avem totul pregătit pentru a scrie partea principală a scriptului de antrenare: bucla de antrenare. În bucla de antrenare, iterăm peste dataloader și transmitem batch-urile către model. Cu logurile, putem apoi evalua funcția noastră de pierdere personalizată. Redimensionăm pierderea în funcție de numărul de etape de acumulare a gradientului pentru a nu crea pierderi mai mari atunci când agregăm mai multe etape. Înainte de a optimiza, comprimăm, de asemenea, gradienții pentru o mai bună convergență. În cele din urmă, la fiecare câțiva pași, evaluăm modelul pe setul de evaluare cu noua noastră funcție `evaluate()`:
-
-```py
-from tqdm.notebook import tqdm
-
-gradient_accumulation_steps = 8
-eval_steps = 5_000
-
-model.train()
-completed_steps = 0
-for epoch in range(num_train_epochs):
-    for step, batch in tqdm(
-        enumerate(train_dataloader, start=1), total=num_training_steps
-    ):
-        logits = model(batch["input_ids"]).logits
-        loss = keytoken_weighted_loss(batch["input_ids"], logits, keytoken_ids)
-        if step % 100 == 0:
-            accelerator.print(
-                {
-                    "samples": step * samples_per_step,
-                    "steps": completed_steps,
-                    "loss/train": loss.item() * gradient_accumulation_steps,
-                }
-            )
-        loss = loss / gradient_accumulation_steps
-        accelerator.backward(loss)
-        if step % gradient_accumulation_steps == 0:
-            accelerator.clip_grad_norm_(model.parameters(), 1.0)
-            optimizer.step()
-            lr_scheduler.step()
-            optimizer.zero_grad()
-            completed_steps += 1
-        if (step % (eval_steps * gradient_accumulation_steps)) == 0:
-            eval_loss, perplexity = evaluate()
-            accelerator.print({"loss/eval": eval_loss, "perplexity": perplexity})
-            model.train()
-            accelerator.wait_for_everyone()
-            unwrapped_model = accelerator.unwrap_model(model)
-            unwrapped_model.save_pretrained(output_dir, save_function=accelerator.save)
-            if accelerator.is_main_process:
-                tokenizer.save_pretrained(output_dir)
-                repo.push_to_hub(
-                    commit_message=f"Training in progress step {step}", blocking=False
-                )
-```
-
-Și asta e tot - acum aveți propria buclă de antrenare personalizată pentru modele de limbaj cauzal, cum ar fi GPT-2, pe care o puteți personaliza în continuare în funcție de nevoile voastre.
-
-<Tip>
-
-✏️ **încercați!** Fie vă creați propria funcție de pierdere personalizată, adaptată la cazul vostru de utilizare, fie adăugați un alt pas personalizat în bucla de antrenare.
-
-</Tip>
-
-<Tip>
-
-✏️ **încercați!** Atunci când efectuați experimente de antrenare de lungă durată, este o idee bună să înregistrați parametrii importanți utilizând instrumente precum TensorBoard sau Weights & Biases. Adăugați o logare adecvată la bucla de antrenare, astfel încât să puteți verifica întotdeauna cum decurge antrenarea.
-
-</Tip>
-
-{/if}
diff --git a/chapters/ro/chapter7/7.mdx b/chapters/ro/chapter7/7.mdx
deleted file mode 100644
index 87c0b1924..000000000
--- a/chapters/ro/chapter7/7.mdx
+++ /dev/null
@@ -1,1206 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Răspunderea la întrebări[[question-answering]]
-
-{#if fw === 'pt'}
-
-<CourseFloatingBanner chapter={7}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter7/section7_pt.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter7/section7_pt.ipynb"},
-]} />
-
-{:else}
-
-<CourseFloatingBanner chapter={7}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter7/section7_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter7/section7_tf.ipynb"},
-]} />
-
-{/if}
-
-Este timpul să analizăm răspunsul la întrebări! Această sarcină are mai multe variante, dar cea pe care ne vom concentra în această secțiune se numește răspuns *extractiv* la întrebări. Aceasta presupune formularea de întrebări cu privire la un document și identificarea răspunsurilor ca _intervale de text_ în documentul în sine.
-
-<Youtube id="ajPx5LwJD-I"/>
-
-Vom face fine-tuning unuimodel BERT pe [datasetul SQuAD] (https://rajpurkar.github.io/SQuAD-explorer/), care constă din întrebări adresate de mulțimea de lucrători pe un set de articole Wikipedia. Acest lucru ne va oferi un model capabil să calculeze predicții precum aceasta:
-
-<iframe src="https://course-demos-bert-finetuned-squad.hf.space" frameBorder="0" height="450" title="Gradio app" class="block dark:hidden container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
-
-Aceasta este de fapt o prezentare a modelului care a fost antrenat și încărcat în Hub folosind codul prezentat în această secțiune. Puteți să-l găsiți și să verificați predicțiile [aici](https://huggingface.co/huggingface-course/bert-finetuned-squad?context=%F0%9F%A4%97+Transformers+is+backed+by+the+three+most+popular+deep+learning+libraries+%E2%80%94+Jax%2C+PyTorch+and+TensorFlow+%E2%80%94+with+a+seamless+integration+between+them.+It%27s+straightforward+to+train+your+models+with+one+before+loading+them+for+inference+with+the+other.&question=Which+deep+learning+libraries+back+%F0%9F%A4%97+Transformers%3F).
-
-<Tip>
-
-💡 Modelele bazate doar pe encoding, cum ar fi BERT, tind să fie foarte bune la extragerea răspunsurilor la întrebări de tip factoid, cum ar fi "Cine a inventat arhitectura Transformer?", dar nu se descurcă prea bine atunci când primesc întrebări deschise, cum ar fi "De ce este cerul albastru?" În aceste cazuri mai dificile, modelele encoder-decoder precum T5 și BART sunt utilizate de obicei pentru a sintetiza informațiile într-un mod destul de similar cu [rezumarea textului](/course/chapter7/5). Dacă sunteți interesat de acest tip de răspuns *generativ* la întrebări, vă recomandăm să consultați [demo-ul](https://yjernite.github.io/lfqa.html) nostru bazat pe [datasetul ELI5](https://huggingface.co/datasets/eli5).
-
-</Tip>
-
-## Pregătirea datelor[[preparing-the-data]]
-
-Datasetul care este cel mai utilizat ca referință academică pentru răspunderea extractivă la întrebări este [SQuAD](https://rajpurkar.github.io/SQuAD-explorer/), deci acesta este cel pe care îl vom utiliza aici. Există, de asemenea, un benchmark mai dificil [SQuAD v2](https://huggingface.co/datasets/squad_v2), care include întrebări care nu au un răspuns. Atât timp cât propriul dataset conține o coloană pentru contexte, o coloană pentru întrebări și o coloană pentru răspunsuri, ar trebui să puteți adapta pașii de mai jos.
-
-### Datasetul SQuD[[the-squad-dataset]]
-
-Ca de obicei, putem descărca și stoca în cache datasetul într-un singur pas datorită funcției `load_dataset()`:
-
-```py
-from datasets import load_dataset
-
-raw_datasets = load_dataset("squad")
-```
-
-Ne putem uita apoi la acest obiect pentru a afla mai multe despre datasetul SQuAD:
-
-```py
-raw_datasets
-```
-
-```python out
-DatasetDict({
-    train: Dataset({
-        features: ['id', 'title', 'context', 'question', 'answers'],
-        num_rows: 87599
-    })
-    validation: Dataset({
-        features: ['id', 'title', 'context', 'question', 'answers'],
-        num_rows: 10570
-    })
-})
-```
-
-Se pare că avem tot ce ne trebuie cu câmpurile `context`, `question` și `answers`, așa că să le afișăm pentru primul element al datasetului nostru de antrenare:
-
-```py
-print("Context: ", raw_datasets["train"][0]["context"])
-print("Question: ", raw_datasets["train"][0]["question"])
-print("Answer: ", raw_datasets["train"][0]["answers"])
-```
-
-```python out
-Context: 'Architecturally, the school has a Catholic character. Atop the Main Building\'s gold dome is a golden statue of the Virgin Mary. Immediately in front of the Main Building and facing it, is a copper statue of Christ with arms upraised with the legend "Venite Ad Me Omnes". Next to the Main Building is the Basilica of the Sacred Heart. Immediately behind the basilica is the Grotto, a Marian place of prayer and reflection. It is a replica of the grotto at Lourdes, France where the Virgin Mary reputedly appeared to Saint Bernadette Soubirous in 1858. At the end of the main drive (and in a direct line that connects through 3 statues and the Gold Dome), is a simple, modern stone statue of Mary.'
-Question: 'To whom did the Virgin Mary allegedly appear in 1858 in Lourdes France?'
-Answer: {'text': ['Saint Bernadette Soubirous'], 'answer_start': [515]}
-```
-
-Câmpurile `context` și `question` sunt foarte simplu de utilizat. Câmpul `answers` este un pic mai complicat, deoarece conține un dicționar cu două câmpuri care sunt ambele liste. Acesta este formatul care va fi așteptat de metrica `squad` în timpul evaluării; dacă utilizați propriile date, nu trebuie neapărat să vă faceți griji cu privire la plasarea răspunsurilor în același format. Câmpul `text` este destul de evident, iar câmpul `answer_start` conține indicele caracterului de început al fiecărui răspuns din context.
-
-În timpul antrenamentului, există un singur răspuns posibil. Putem verifica acest lucru folosind metoda `Dataset.filter()`:
-
-```py
-raw_datasets["train"].filter(lambda x: len(x["answers"]["text"]) != 1)
-```
-
-```python out
-Dataset({
-    features: ['id', 'title', 'context', 'question', 'answers'],
-    num_rows: 0
-})
-```
-
-Cu toate acestea, pentru evaluare, există mai multe răspunsuri posibile pentru fiecare sample, care pot fi identice sau diferite:
-
-```py
-print(raw_datasets["validation"][0]["answers"])
-print(raw_datasets["validation"][2]["answers"])
-```
-
-```python out
-{'text': ['Denver Broncos', 'Denver Broncos', 'Denver Broncos'], 'answer_start': [177, 177, 177]}
-{'text': ['Santa Clara, California', "Levi's Stadium", "Levi's Stadium in the San Francisco Bay Area at Santa Clara, California."], 'answer_start': [403, 355, 355]}
-```
-
-Nu ne vom aprofunda în scriptul de evaluare, deoarece totul va fi încorporat de o metrică 🤗 Datasets pentru noi, dar versiunea scurtă este că unele dintre întrebări au mai multe răspunsuri posibile, iar acest script va compara un răspuns prezis cu toate răspunsurile acceptabile și va lua cel mai bun scor. Dacă ne uităm la sampleul de la indexul 2, de exemplu:
-
-```py
-print(raw_datasets["validation"][2]["context"])
-print(raw_datasets["validation"][2]["question"])
-```
-
-```python out
-'Super Bowl 50 was an American football game to determine the champion of the National Football League (NFL) for the 2015 season. The American Football Conference (AFC) champion Denver Broncos defeated the National Football Conference (NFC) champion Carolina Panthers 24–10 to earn their third Super Bowl title. The game was played on February 7, 2016, at Levi\'s Stadium in the San Francisco Bay Area at Santa Clara, California. As this was the 50th Super Bowl, the league emphasized the "golden anniversary" with various gold-themed initiatives, as well as temporarily suspending the tradition of naming each Super Bowl game with Roman numerals (under which the game would have been known as "Super Bowl L"), so that the logo could prominently feature the Arabic numerals 50.'
-'Where did Super Bowl 50 take place?'
-```
-
-putem vedea că răspunsul poate fi într-adevăr una dintre cele trei posibilități pe care le-am văzut anterior.
-
-### Procesarea datelor de antrenare[[processing-the-training-data]]
-
-<Youtube id="qgaM0weJHpA"/>
-
-Să începem cu preprocesarea datelor de antrenare. Partea dificilă va fi generarea labelurilor pentru răspunsul la întrebare, care vor fi pozițiile de început și de sfârșit ale tokenilor corespunzătoare răspunsului în context.
-
-Dar să nu ne grăbim. În primul rând, trebuie să convertim textul din datele de intrare în ID-uri pe care modelul să le poată înțelege, utilizând un tokenizer:
-
-```py
-from transformers import AutoTokenizer
-
-model_checkpoint = "bert-base-cased"
-tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
-```
-
-După cum am menționat anterior, vom face fine-tune unui model BERT, dar puteți utiliza orice alt tip de model, atâta timp cât are implementat un tokenizer rapid. Puteți vedea toate arhitecturile care vin cu o versiune rapidă în [acest tabel mare] (https://huggingface.co/transformers/#supported-frameworks), iar pentru a verifica dacă obiectul `tokenizer` pe care îl utilizați este într-adevăr susținut de 🤗 Tokenizers, vă puteți uita la atributul său `is_fast`:
-
-```py
-tokenizer.is_fast
-```
-
-```python out
-True
-```
-
-Putem transmite împreună întrebarea și contextul către tokenizerul nostru, iar acesta va introduce în mod corespunzător tokenii speciali pentru a forma o propoziție ca aceasta:
-
-```
-[CLS] question [SEP] context [SEP]
-```
-
-Hai să verificăm de două ori:
-
-```py
-context = raw_datasets["train"][0]["context"]
-question = raw_datasets["train"][0]["question"]
-
-inputs = tokenizer(question, context)
-tokenizer.decode(inputs["input_ids"])
-```
-
-```python out
-'[CLS] To whom did the Virgin Mary allegedly appear in 1858 in Lourdes France? [SEP] Architecturally, '
-'the school has a Catholic character. Atop the Main Building\'s gold dome is a golden statue of the Virgin '
-'Mary. Immediately in front of the Main Building and facing it, is a copper statue of Christ with arms '
-'upraised with the legend " Venite Ad Me Omnes ". Next to the Main Building is the Basilica of the Sacred '
-'Heart. Immediately behind the basilica is the Grotto, a Marian place of prayer and reflection. It is a '
-'replica of the grotto at Lourdes, France where the Virgin Mary reputedly appeared to Saint Bernadette '
-'Soubirous in 1858. At the end of the main drive ( and in a direct line that connects through 3 statues '
-'and the Gold Dome ), is a simple, modern stone statue of Mary. [SEP]'
-```
-
-Labelurile vor fi apoi indexul tokenilor care încep și termină răspunsul, iar modelul va fi însărcinat să prezică un logit de început și de sfârșit pentru fiecare token din intrare, labelurile teoretice fiind următoarele:
-
-<div class="flex justify-center">
-<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/qa_labels.svg" alt="One-hot encoded label pentru răspunderea la întrebări."/>
-<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/qa_labels-dark.svg" alt=One-hot encoded label pentru răspunderea la întrebări."/>
-</div>
-
-În acest caz, contextul nu este prea lung, dar unele dintre exemplele din dataset au contexte foarte lungi care vor depăși lungimea maximă pe care am stabilit-o (care este de 384 în acest caz). După cum am văzut în [Capitolul 6](/course/chapter6/4) când am explorat elementele interne ale pipelineului `question-answering`, vom trata contextele lungi prin crearea mai multor caracteristici de antrenare dintr-un sample din datasetul nostru, cu un sliding window între ele.
-
-Pentru a vedea cum funcționează acest lucru folosind exemplul curent, putem limita lungimea la 100 și putem utiliza un sliding window de 50 de tokeni. Vă reamintim că folosim:
-
-- `max_length` pentru a stabili lungimea maximă (aici 100)
-- `truncation="only_second"` pentru a trunchia contextul (care este în poziția a doua) atunci când întrebarea cu contextul său este prea lungă
-- `stride` pentru a seta numărul de tokeni care se suprapun între două bucăți succesive (aici 50)
-- `return_overflowing_tokens=True` pentru ca tokenizerul să știe că dorim tokenii care se suprapun
-
-```py
-inputs = tokenizer(
-    question,
-    context,
-    max_length=100,
-    truncation="only_second",
-    stride=50,
-    return_overflowing_tokens=True,
-)
-
-for ids in inputs["input_ids"]:
-    print(tokenizer.decode(ids))
-```
-
-```python out
-'[CLS] To whom did the Virgin Mary allegedly appear in 1858 in Lourdes France? [SEP] Architecturally, the school has a Catholic character. Atop the Main Building\'s gold dome is a golden statue of the Virgin Mary. Immediately in front of the Main Building and facing it, is a copper statue of Christ with arms upraised with the legend " Venite Ad Me Omnes ". Next to the Main Building is the Basilica of the Sacred Heart. Immediately behind the basi [SEP]'
-'[CLS] To whom did the Virgin Mary allegedly appear in 1858 in Lourdes France? [SEP] the Main Building and facing it, is a copper statue of Christ with arms upraised with the legend " Venite Ad Me Omnes ". Next to the Main Building is the Basilica of the Sacred Heart. Immediately behind the basilica is the Grotto, a Marian place of prayer and reflection. It is a replica of the grotto at Lourdes, France where the Virgin [SEP]'
-'[CLS] To whom did the Virgin Mary allegedly appear in 1858 in Lourdes France? [SEP] Next to the Main Building is the Basilica of the Sacred Heart. Immediately behind the basilica is the Grotto, a Marian place of prayer and reflection. It is a replica of the grotto at Lourdes, France where the Virgin Mary reputedly appeared to Saint Bernadette Soubirous in 1858. At the end of the main drive ( and in a direct line that connects through 3 [SEP]'
-'[CLS] To whom did the Virgin Mary allegedly appear in 1858 in Lourdes France? [SEP]. It is a replica of the grotto at Lourdes, France where the Virgin Mary reputedly appeared to Saint Bernadette Soubirous in 1858. At the end of the main drive ( and in a direct line that connects through 3 statues and the Gold Dome ), is a simple, modern stone statue of Mary. [SEP]'
-```
-
-După cum se poate observa, exemplul nostru a fost împărțit în patru inputuri, fiecare dintre acestea conținând întrebarea și o parte din context. Rețineți că răspunsul la întrebare ("Bernadette Soubirous") apare doar în al treilea și ultimul input, astfel încât, prin tratarea contextelor lungi în acest mod, vom crea câteva exemple de antrenament în care răspunsul nu este inclus în context. Pentru aceste exemple, labelurile vor fi `start_position = end_position = 0` (deci vom prezice tokenul `[CLS]`). Vom seta aceste labeluri și în cazul nefericit în care răspunsul a fost trunchiat, astfel încât avem doar începutul (sau sfârșitul) acestuia. Pentru exemplele în care răspunsul este complet în context, labelurile vor fi indicele tokenului în care începe răspunsul și indicele tokenului în care se termină răspunsul.
-
-Datasetul ne oferă caracterul de început al răspunsului în context, iar prin adăugarea lungimii răspunsului, putem găsi caracterul de sfârșit în context. Pentru a le corela cu indicii tokenilor, va trebui să folosim offset mapping pe care le-am studiat în [Capitolul 6](/course/chapter6/4). Putem face ca tokenizatorul nostru să le returneze trecând `return_offsets_mapping=True`:
-
-```py
-inputs = tokenizer(
-    question,
-    context,
-    max_length=100,
-    truncation="only_second",
-    stride=50,
-    return_overflowing_tokens=True,
-    return_offsets_mapping=True,
-)
-inputs.keys()
-```
-
-```python out
-dict_keys(['input_ids', 'token_type_ids', 'attention_mask', 'offset_mapping', 'overflow_to_sample_mapping'])
-```
-
-După cum putem vedea, primim înapoi ID-urile obișnuite de intrare, ID-urile tipului de token și attention maskul, precum și offset mapping necesar și o cheie suplimentară, `overflow_to_sample_mapping`. Valoarea corespunzătoare ne va fi de folos atunci când vom tokeniza mai multe texte în același timp (ceea ce ar trebui să facem pentru a beneficia de faptul că tokenizerul nostru este susținut de Rust). Deoarece un sample poate oferi mai multe caracteristici, aceasta mapează fiecare caracteristică la exemplul din care provine. Deoarece aici am tokenizat un singur exemplu, obținem o listă de `0`:
-
-```py
-inputs["overflow_to_sample_mapping"]
-```
-
-```python out
-[0, 0, 0, 0]
-```
-
-Dar dacă vom tokeniza mai multe exemple, acest lucru va deveni mai util:
-
-```py
-inputs = tokenizer(
-    raw_datasets["train"][2:6]["question"],
-    raw_datasets["train"][2:6]["context"],
-    max_length=100,
-    truncation="only_second",
-    stride=50,
-    return_overflowing_tokens=True,
-    return_offsets_mapping=True,
-)
-
-print(f"The 4 examples gave {len(inputs['input_ids'])} features.")
-print(f"Here is where each comes from: {inputs['overflow_to_sample_mapping']}.")
-```
-
-```python out
-'The 4 examples gave 19 features.'
-'Here is where each comes from: [0, 0, 0, 0, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3].'
-```
-
-După cum se poate observa, primele trei exemple (la indicii 2, 3 și 4 din setul de antrenare) au dat fiecare câte patru caracteristici, iar ultimul exemplu (la indicele 5 din setul de antrenare) a dat 7 caracteristici.
-
-Aceste informații vor fi utile pentru a corela fiecare caracteristică obținută cu labeul corespunzător. După cum am menționat anterior, aceste labelurile sunt:
-
-- `(0, 0)` dacă răspunsul nu se află în intervalul corespunzător al contextului
-- `(start_position, end_position)` dacă răspunsul se află în intervalul corespunzător al contextului, cu `start_position` fiind indicele tokenului (în ID-urile de intrare) la începutul răspunsului și `end_position` fiind indicele tokenului (în ID-urile de intrare) unde se termină răspunsul
-
-Pentru a determina care dintre acestea este cazul și, dacă este relevant, pozițiile tokenilor, vom găsi mai întâi indicii care încep și termină contextul în ID-urile de intrare. Am putea folosi ID-urile tipului de token pentru a face acest lucru, dar deoarece acestea nu există neapărat pentru toate modelele (DistilBERT nu le solicită, de exemplu), vom folosi în schimb metoda `sequence_ids()` a `BatchEncoding` pe care tokenizerul nostru o returnează.
-
-Odată ce avem indicii tokenilor, ne uităm la offseturile corespunzătoare, care sunt tupeluri de două numere întregi reprezentând intervalul de caractere din contextul original. Astfel, putem detecta dacă bucățica de context din această caracteristică începe după răspuns sau se termină înainte de începerea răspunsului (caz în care eticheta este `(0, 0)`). Dacă nu este cazul, facem o buclă pentru a găsi primul și ultimul token al răspunsului:
-
-```py
-answers = raw_datasets["train"][2:6]["answers"]
-start_positions = []
-end_positions = []
-
-for i, offset in enumerate(inputs["offset_mapping"]):
-    sample_idx = inputs["overflow_to_sample_mapping"][i]
-    answer = answers[sample_idx]
-    start_char = answer["answer_start"][0]
-    end_char = answer["answer_start"][0] + len(answer["text"][0])
-    sequence_ids = inputs.sequence_ids(i)
-
-    # Find the start and end of the context
-    idx = 0
-    while sequence_ids[idx] != 1:
-        idx += 1
-    context_start = idx
-    while sequence_ids[idx] == 1:
-        idx += 1
-    context_end = idx - 1
-
-    # If the answer is not fully inside the context, label is (0, 0)
-    if offset[context_start][0] > start_char or offset[context_end][1] < end_char:
-        start_positions.append(0)
-        end_positions.append(0)
-    else:
-        # Otherwise it's the start and end token positions
-        idx = context_start
-        while idx <= context_end and offset[idx][0] <= start_char:
-            idx += 1
-        start_positions.append(idx - 1)
-
-        idx = context_end
-        while idx >= context_start and offset[idx][1] >= end_char:
-            idx -= 1
-        end_positions.append(idx + 1)
-
-start_positions, end_positions
-```
-
-```python out
-([83, 51, 19, 0, 0, 64, 27, 0, 34, 0, 0, 0, 67, 34, 0, 0, 0, 0, 0],
- [85, 53, 21, 0, 0, 70, 33, 0, 40, 0, 0, 0, 68, 35, 0, 0, 0, 0, 0])
-```
-
-Să aruncăm o privire la câteva rezultate pentru a verifica dacă abordarea noastră este corectă. Pentru prima caracteristică găsim `(83, 85)` ca labeluri, așa că comparăm răspunsul teoretic cu intervalul decodat de tokeni de la 83 la 85 (inclusiv):
-
-```py
-idx = 0
-sample_idx = inputs["overflow_to_sample_mapping"][idx]
-answer = answers[sample_idx]["text"][0]
-
-start = start_positions[idx]
-end = end_positions[idx]
-labeled_answer = tokenizer.decode(inputs["input_ids"][idx][start : end + 1])
-
-print(f"Theoretical answer: {answer}, labels give: {labeled_answer}")
-```
-
-```python out
-'Theoretical answer: the Main Building, labels give: the Main Building'
-```
-
-Deci, asta e o potrivire! Acum să verificăm indexul 4, unde am setat labelurile la `(0, 0)`, ceea ce înseamnă că răspunsul nu se află în chunkul de context al acelei caracteristici:
-
-```py
-idx = 4
-sample_idx = inputs["overflow_to_sample_mapping"][idx]
-answer = answers[sample_idx]["text"][0]
-
-decoded_example = tokenizer.decode(inputs["input_ids"][idx])
-print(f"Theoretical answer: {answer}, decoded example: {decoded_example}")
-```
-
-```python out
-'Theoretical answer: a Marian place of prayer and reflection, decoded example: [CLS] What is the Grotto at Notre Dame? [SEP] Architecturally, the school has a Catholic character. Atop the Main Building\'s gold dome is a golden statue of the Virgin Mary. Immediately in front of the Main Building and facing it, is a copper statue of Christ with arms upraised with the legend " Venite Ad Me Omnes ". Next to the Main Building is the Basilica of the Sacred Heart. Immediately behind the basilica is the Grot [SEP]'
-```
-
-Într-adevăr, nu vedem răspunsul în interiorul contextului.
-
-<Tip>
-
-✏️ **E rândul tău!** Atunci când se utilizează arhitectura XLNet, paddingul este aplicat la stânga, iar întrebarea și contextul sunt schimbate. Adaptați tot codul pe care tocmai l-am văzut la arhitectura XLNet (și adăugați `padding=True`). Fiți conștienți de faptul că tokenul `[CLS]` ar putea să nu se afle la poziția 0 în cazul aplicării paddingului.
-
-</Tip>
-
-Acum că am văzut pas cu pas cum să preprocesăm datele de antrenare, le putem grupa într-o funcție pe care o vom aplica întregului dataset de antrenare. Vom umple fiecare caracteristică la lungimea maximă pe care am stabilit-o, deoarece majoritatea contextelor vor fi lungi (iar sampleurile corespunzătoare vor fi împărțite în mai multe caracteristici), astfel încât nu există niciun beneficiu real pentru aplicarea paddingului dinamic aici:
-
-```py
-max_length = 384
-stride = 128
-
-
-def preprocess_training_examples(examples):
-    questions = [q.strip() for q in examples["question"]]
-    inputs = tokenizer(
-        questions,
-        examples["context"],
-        max_length=max_length,
-        truncation="only_second",
-        stride=stride,
-        return_overflowing_tokens=True,
-        return_offsets_mapping=True,
-        padding="max_length",
-    )
-
-    offset_mapping = inputs.pop("offset_mapping")
-    sample_map = inputs.pop("overflow_to_sample_mapping")
-    answers = examples["answers"]
-    start_positions = []
-    end_positions = []
-
-    for i, offset in enumerate(offset_mapping):
-        sample_idx = sample_map[i]
-        answer = answers[sample_idx]
-        start_char = answer["answer_start"][0]
-        end_char = answer["answer_start"][0] + len(answer["text"][0])
-        sequence_ids = inputs.sequence_ids(i)
-
-        # Find the start and end of the context
-        idx = 0
-        while sequence_ids[idx] != 1:
-            idx += 1
-        context_start = idx
-        while sequence_ids[idx] == 1:
-            idx += 1
-        context_end = idx - 1
-
-        # If the answer is not fully inside the context, label is (0, 0)
-        if offset[context_start][0] > start_char or offset[context_end][1] < end_char:
-            start_positions.append(0)
-            end_positions.append(0)
-        else:
-            # Otherwise it's the start and end token positions
-            idx = context_start
-            while idx <= context_end and offset[idx][0] <= start_char:
-                idx += 1
-            start_positions.append(idx - 1)
-
-            idx = context_end
-            while idx >= context_start and offset[idx][1] >= end_char:
-                idx -= 1
-            end_positions.append(idx + 1)
-
-    inputs["start_positions"] = start_positions
-    inputs["end_positions"] = end_positions
-    return inputs
-```
-
-Rețineți că am definit două constante pentru a determina lungimea maximă utilizată, precum și lungimea al sliding window, și că am adăugat o mică curățare înainte de tokenizare: unele dintre întrebările din datasetul SQuAD au spații suplimentare la început și la sfârșit care nu adaugă nimic (și ocupă spațiu atunci când sunt tokenizate dacă utilizați un model precum RoBERTa), așa că am eliminat aceste spații suplimentare.
-
-Pentru a aplica această funcție întregului set de antrenare, folosim metoda `Dataset.map()` cu flagul `batched=True`. Acesta este necesar aici, deoarece modificăm lungimea datasetului (deoarece un exemplu poate oferi mai multe caracteristici de antrenare):
-
-```py
-train_dataset = raw_datasets["train"].map(
-    preprocess_training_examples,
-    batched=True,
-    remove_columns=raw_datasets["train"].column_names,
-)
-len(raw_datasets["train"]), len(train_dataset)
-```
-
-```python out
-(87599, 88729)
-```
-
-După cum putem vedea, preprocesarea a adăugat aproximativ 1.000 de caracteristici. Setul nostru de antrenare este acum gata de utilizare - să trecem la preprocesarea setului de validare!
-
-### Procesarea datelor de validare[[processing-the-validation-data]]
-
-Preprocesarea datelor de validare va fi puțin mai ușoară, deoarece nu trebuie să generăm labeluri (cu excepția cazului în care dorim să calculăm o pierdere de validare, dar acest număr nu ne va ajuta să înțelegem cât de bun este modelul). Adevărata bucurie va fi să interpretăm predicțiile modelului în intervale ale contextului original. Pentru aceasta, va trebui doar să stocăm atât offset mappings, cât și o modalitate de a corela fiecare caracteristică creată cu exemplul original din care provine. Deoarece există o coloană ID în datasetul original, vom utiliza acel ID.
-
-Singurul lucru pe care îl vom adăuga aici este o mică curățare a offset mappings. Acestea vor conține offseturi pentru întrebare și context, dar odată ajunși în etapa de postprocesare nu vom avea nicio modalitate de a ști care parte a ID-urilor de intrare corespunde contextului și care parte este întrebarea (metoda `sequence_ids()` pe care am folosit-o este disponibilă doar pentru ieșirea tokenizerului). Prin urmare, vom seta offseturile corespunzătoare întrebării la `None`:
-
-
-```py
-def preprocess_validation_examples(examples):
-    questions = [q.strip() for q in examples["question"]]
-    inputs = tokenizer(
-        questions,
-        examples["context"],
-        max_length=max_length,
-        truncation="only_second",
-        stride=stride,
-        return_overflowing_tokens=True,
-        return_offsets_mapping=True,
-        padding="max_length",
-    )
-
-    sample_map = inputs.pop("overflow_to_sample_mapping")
-    example_ids = []
-
-    for i in range(len(inputs["input_ids"])):
-        sample_idx = sample_map[i]
-        example_ids.append(examples["id"][sample_idx])
-
-        sequence_ids = inputs.sequence_ids(i)
-        offset = inputs["offset_mapping"][i]
-        inputs["offset_mapping"][i] = [
-            o if sequence_ids[k] == 1 else None for k, o in enumerate(offset)
-        ]
-
-    inputs["example_id"] = example_ids
-    return inputs
-```
-
-Putem aplica această funcție pe întregul dataset de validare, ca și înainte:
-
-```py
-validation_dataset = raw_datasets["validation"].map(
-    preprocess_validation_examples,
-    batched=True,
-    remove_columns=raw_datasets["validation"].column_names,
-)
-len(raw_datasets["validation"]), len(validation_dataset)
-```
-
-```python out
-(10570, 10822)
-```
-
-În acest caz, am adăugat doar câteva sute de sampleuri, astfel încât se pare că contextele din datasetul de validare sunt un pic mai scurte.
-
-Acum că am preprocesat toate datele, putem trece la antrenare.
-
-{#if fw === 'pt'}
-
-## Fine-tuningul modelului cu API-ul `Trainer`[[fine-tuning-the-model-with-the-trainer-api]]
-
-Codul de antrenare pentru acest exemplu va semăna foarte mult cu codul din secțiunile anterioare - cel mai greu lucru va fi să scriem funcția `compute_metrics()`. Deoarece am făcut padding tuturor sampleurilor la lungimea maximă pe care am stabilit-o, nu trebuie definit niciun data collator, astfel încât acest calcul al metricii este singurul lucru de care trebuie să ne facem griji. Partea dificilă va fi să postprocesăm predicțiile modelului în intervale de text în exemplele originale; odată ce am făcut acest lucru, metrica din biblioteca 🤗 Datasets va face cea mai mare parte a muncii pentru noi.
-
-{:else}
-
-## Fine-tuningul unui model cu Keras[[fine-tuning-the-model-with-keras]]
-
-Codul de antrenare pentru acest exemplu va semăna foarte mult cu codul din secțiunile anterioare, dar calcularea metricilor va fi o provocare unică. Din moment ce am făcut padding tuturor sampleurilor la lungimea maximă pe care am stabilit-o, nu există niciun data collator care să fie definit, astfel încât acest calcul al metricii este singurul lucru de care trebuie să ne facem griji. Partea dificilă va fi să postprocesăm predicțiile modelului în intervale de text în exemplele originale; odată ce am făcut acest lucru, metrica din biblioteca 🤗 Datasets va face cea mai mare parte a muncii pentru noi.
-
-{/if}
-
-### Post-procesare[[post-processing]]
-
-{#if fw === 'pt'}
-
-<Youtube id="BNy08iIWVJM"/>
-
-{:else}
-
-<Youtube id="VN67ZpN33Ss"/>
-
-{/if}
-
-Modelul va produce logits pentru pozițiile de început și de sfârșit ale răspunsului în ID-urile de intrare, așa cum am văzut în timpul explorării [`question-answering` pipeline](/course/chapter6/3b). Etapa de post-procesare va fi similară cu ceea ce am făcut acolo, așa că iată vă reamintim ce acțiuni am luat:
-
-- Am mascat logiturile de început și de sfârșit corespunzătoare tokenilor din afara contextului.
-- Am convertit apoi logiturile de început și de sfârșit în probabilități utilizând un softmax.
-- Am atribuit un scor fiecărei perechi `(start_token, end_token)` prin calcularea produsului celor două probabilități corespunzătoare.
-- Am căutat perechea cu scorul maxim care a dat un răspuns valid (de exemplu, `start_token` mai mic decât `end_token`).
-
-Aici vom schimba ușor acest proces, deoarece nu trebuie să calculăm scorurile reale (doar răspunsul prezis). Aceasta înseamnă că putem sări peste etapa softmax. De asemenea, pentru a merge mai repede, nu vom puncta toate perechile posibile `(start_token, end_token)`, ci doar pe cele care corespund celor mai mari `n_best` logits (cu `n_best=20`). Deoarece vom trece peste softmax, aceste scoruri vor fi scoruri logit și vor fi obținute prin însumarea logiturilor de început și de sfârșit (în loc de produs, datorită regulii \\(\log(ab) = \log(a) + \log(b)\\\)).
-
-Pentru a demonstra toate acestea, vom avea nevoie de un fel de predicții. Deoarece nu ne-am antrenat încă modelul, vom utiliza modelul implicit pentru pipelineuri QA pentru a genera unele predicții pe o mică parte a setului de validare. Putem utiliza aceeași funcție de procesare ca înainte; deoarece se bazează pe constanta globală `tokenizer`, trebuie doar să schimbăm acest obiect cu tokenizerul modelului pe care dorim să îl utilizăm temporar:
-
-```python
-small_eval_set = raw_datasets["validation"].select(range(100))
-trained_checkpoint = "distilbert-base-cased-distilled-squad"
-
-tokenizer = AutoTokenizer.from_pretrained(trained_checkpoint)
-eval_set = small_eval_set.map(
-    preprocess_validation_examples,
-    batched=True,
-    remove_columns=raw_datasets["validation"].column_names,
-)
-```
-
-Acum că preprocesarea este terminată, schimbăm tokenizerul înapoi la cel pe care l-am ales inițial:
-
-```python
-tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
-```
-
-Apoi eliminăm coloanele din `eval_set` care nu sunt așteptate de model, construim un batch cu întregul set de validare și îl trecem prin model. Dacă este disponibil un GPU, îl folosim pentru a merge mai repede:
-
-{#if fw === 'pt'}
-
-```python
-import torch
-from transformers import AutoModelForQuestionAnswering
-
-eval_set_for_model = eval_set.remove_columns(["example_id", "offset_mapping"])
-eval_set_for_model.set_format("torch")
-
-device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")
-batch = {k: eval_set_for_model[k].to(device) for k in eval_set_for_model.column_names}
-trained_model = AutoModelForQuestionAnswering.from_pretrained(trained_checkpoint).to(
-    device
-)
-
-with torch.no_grad():
-    outputs = trained_model(**batch)
-```
-
-Deoarece `Trainer` ne va oferi predicții sub formă de matrici NumPy, preluăm logiturile de început și de sfârșit și le convertim în acest format:
-
-```python
-start_logits = outputs.start_logits.cpu().numpy()
-end_logits = outputs.end_logits.cpu().numpy()
-```
-
-{:else}
-
-```python
-import tensorflow as tf
-from transformers import TFAutoModelForQuestionAnswering
-
-eval_set_for_model = eval_set.remove_columns(["example_id", "offset_mapping"])
-eval_set_for_model.set_format("numpy")
-
-batch = {k: eval_set_for_model[k] for k in eval_set_for_model.column_names}
-trained_model = TFAutoModelForQuestionAnswering.from_pretrained(trained_checkpoint)
-
-outputs = trained_model(**batch)
-```
-
-Pentru ușurința experimentelor, să convertim aceste rezultate în array-uri NumPy:
-
-```python
-start_logits = outputs.start_logits.numpy()
-end_logits = outputs.end_logits.numpy()
-```
-
-{/if}
-
-Acum, trebuie să găsim răspunsul prezis pentru fiecare exemplu din `small_eval_set`. Este posibil ca un exemplu să fi fost împărțit în mai multe caracteristici în `eval_set`, astfel încât primul pas constă în maparea fiecărui exemplu din `small_eval_set` la caracteristicile corespunzătoare din `eval_set`:
-
-```python
-import collections
-
-example_to_features = collections.defaultdict(list)
-for idx, feature in enumerate(eval_set):
-    example_to_features[feature["example_id"]].append(idx)
-```
-
-Cu acest lucru în mână, ne putem apuca de treabă trecând prin toate exemplele și, pentru fiecare exemplu, prin toate caracteristicile asociate. Așa cum am spus mai devreme, ne vom uita la scorurile logit pentru `n_cele mai bune` logits de început și de sfârșit, excluzând pozițiile care dau:
-
-- Un răspuns care nu ar fi în interiorul contextului
-- Un răspuns cu lungime negativă
-- Un răspuns care este prea lung (limităm posibilitățile la `max_answer_length=30`)
-
-Odată ce avem toate răspunsurile posibile scored pentru un exemplu, îl alegem pe cel cu cel mai bun scor logit:
-
-```python
-import numpy as np
-
-n_best = 20
-max_answer_length = 30
-predicted_answers = []
-
-for example in small_eval_set:
-    example_id = example["id"]
-    context = example["context"]
-    answers = []
-
-    for feature_index in example_to_features[example_id]:
-        start_logit = start_logits[feature_index]
-        end_logit = end_logits[feature_index]
-        offsets = eval_set["offset_mapping"][feature_index]
-
-        start_indexes = np.argsort(start_logit)[-1 : -n_best - 1 : -1].tolist()
-        end_indexes = np.argsort(end_logit)[-1 : -n_best - 1 : -1].tolist()
-        for start_index in start_indexes:
-            for end_index in end_indexes:
-                # Skip answers that are not fully in the context
-                if offsets[start_index] is None or offsets[end_index] is None:
-                    continue
-                # Skip answers with a length that is either < 0 or > max_answer_length.
-                if (
-                    end_index < start_index
-                    or end_index - start_index + 1 > max_answer_length
-                ):
-                    continue
-
-                answers.append(
-                    {
-                        "text": context[offsets[start_index][0] : offsets[end_index][1]],
-                        "logit_score": start_logit[start_index] + end_logit[end_index],
-                    }
-                )
-
-    best_answer = max(answers, key=lambda x: x["logit_score"])
-    predicted_answers.append({"id": example_id, "prediction_text": best_answer["text"]})
-```
-
-Formatul final al răspunsurilor prezise este cel care va fi așteptat de metrica pe care o vom utiliza. Ca de obicei, o putem încărca cu ajutorul bibliotecii 🤗 Evaluate:
-
-```python
-import evaluate
-
-metric = evaluate.load("squad")
-```
-
-Această metrică așteaptă răspunsurile prezise în formatul pe care l-am văzut mai sus (o listă de dicționare cu o cheie pentru ID-ul exemplului și o cheie pentru textul prezis) și răspunsurile teoretice în formatul de mai jos (o listă de dicționare cu o cheie pentru ID-ul exemplului și o cheie pentru răspunsurile posibile):
-
-```python
-theoretical_answers = [
-    {"id": ex["id"], "answers": ex["answers"]} for ex in small_eval_set
-]
-```
-
-Acum putem verifica dacă obținem rezultate rezonabile analizând primul element din ambele liste:
-
-```python
-print(predicted_answers[0])
-print(theoretical_answers[0])
-```
-
-```python out
-{'id': '56be4db0acb8001400a502ec', 'prediction_text': 'Denver Broncos'}
-{'id': '56be4db0acb8001400a502ec', 'answers': {'text': ['Denver Broncos', 'Denver Broncos', 'Denver Broncos'], 'answer_start': [177, 177, 177]}}
-```
-
-Nu-i deloc rău! Acum putem arunca o privire la scorul pe care ni-l oferă metrica:
-
-```python
-metric.compute(predictions=predicted_answers, references=theoretical_answers)
-```
-
-```python out
-{'exact_match': 83.0, 'f1': 88.25}
-```
-
-Din nou, acest lucru este destul de bun, având în vedere că, în conformitate cu [documentul acestuia] (https://arxiv.org/abs/1910.01108v2), DistilBERT fine-tuned pe SQuAD obține 79,1 și 86,9 pentru aceste scoruri pe întregul dataset.
-
-{#if fw === 'pt'}
-
-Acum să punem tot ce am făcut într-o funcție `compute_metrics()` pe care o vom folosi în `Trainer`. În mod normal, această funcție `compute_metrics()` primește doar un tuple `eval_preds` cu logiți și labels. Aici vom avea nevoie de ceva mai mult, deoarece trebuie să căutăm în dataset de caracteristici pentru offset și în datasetul de exemple pentru contextele originale, astfel încât nu vom putea utiliza această funcție pentru a obține rezultate de evaluare regulate în timpul antrenării. O vom utiliza doar la sfârșitul antrenamentului pentru a verifica rezultatele.
-
-Funcția `compute_metrics()` grupează aceiași pași ca înainte; adăugăm doar o mică verificare în cazul în care nu obținem niciun răspuns valid (caz în care prezicem un șir gol).
-
-{:else}
-
-Acum să punem tot ce tocmai am făcut într-o funcție `compute_metrics()` pe care o vom folosi după antrenarea modelului nostru. Va trebui să transmitem puțin mai mult decât output logits, deoarece trebuie să căutăm în datasetul de caracteristici pentru offset și în datasetul de exemple pentru contextele originale:
-
-{/if}
-
-```python
-from tqdm.auto import tqdm
-
-
-def compute_metrics(start_logits, end_logits, features, examples):
-    example_to_features = collections.defaultdict(list)
-    for idx, feature in enumerate(features):
-        example_to_features[feature["example_id"]].append(idx)
-
-    predicted_answers = []
-    for example in tqdm(examples):
-        example_id = example["id"]
-        context = example["context"]
-        answers = []
-
-        # Loop through all features associated with that example
-        for feature_index in example_to_features[example_id]:
-            start_logit = start_logits[feature_index]
-            end_logit = end_logits[feature_index]
-            offsets = features[feature_index]["offset_mapping"]
-
-            start_indexes = np.argsort(start_logit)[-1 : -n_best - 1 : -1].tolist()
-            end_indexes = np.argsort(end_logit)[-1 : -n_best - 1 : -1].tolist()
-            for start_index in start_indexes:
-                for end_index in end_indexes:
-                    # Skip answers that are not fully in the context
-                    if offsets[start_index] is None or offsets[end_index] is None:
-                        continue
-                    # Skip answers with a length that is either < 0 or > max_answer_length
-                    if (
-                        end_index < start_index
-                        or end_index - start_index + 1 > max_answer_length
-                    ):
-                        continue
-
-                    answer = {
-                        "text": context[offsets[start_index][0] : offsets[end_index][1]],
-                        "logit_score": start_logit[start_index] + end_logit[end_index],
-                    }
-                    answers.append(answer)
-
-        # Select the answer with the best score
-        if len(answers) > 0:
-            best_answer = max(answers, key=lambda x: x["logit_score"])
-            predicted_answers.append(
-                {"id": example_id, "prediction_text": best_answer["text"]}
-            )
-        else:
-            predicted_answers.append({"id": example_id, "prediction_text": ""})
-
-    theoretical_answers = [{"id": ex["id"], "answers": ex["answers"]} for ex in examples]
-    return metric.compute(predictions=predicted_answers, references=theoretical_answers)
-```
-
-Putem verifica dacă funcționează pe baza predicțiilor noastre:
-
-```python
-compute_metrics(start_logits, end_logits, eval_set, small_eval_set)
-```
-
-```python out
-{'exact_match': 83.0, 'f1': 88.25}
-```
-
-Arată bine! Acum să folosim acest lucru pentru a face fine-tune modelului nostru.
-
-### Fine-tuningul modelului[[fine-tuning-the-model]]
-
-{#if fw === 'pt'}
-
-Acum suntem gata să antrenăm modelul. Să-l creăm mai întâi, folosind clasa `AutoModelForQuestionAnswering` ca și înainte:
-
-```python
-model = AutoModelForQuestionAnswering.from_pretrained(model_checkpoint)
-```
-
-{:else}
-
-Acum suntem gata să antrenăm modelul. Să-l creăm mai întâi, folosind clasa `TFAutoModelForQuestionAnswering` ca mai înainte:
-
-```python
-model = TFAutoModelForQuestionAnswering.from_pretrained(model_checkpoint)
-```
-
-{/if}
-
-Ca de obicei, primim un avertisment că unele weighturi nu sunt utilizate (cele din headul de preantrenare), iar altele sunt inițializate aleatoriu (cele pentru headul pentru răspuns la întrebări). Ar trebui să fiți obișnuiți cu acest lucru până acum, dar înseamnă că acest model nu este încă pregătit pentru a fi utilizat și trebuie să fie fine-tuned - bine că suntem pe cale să facem asta!
-
-Pentru a putea trimite modelul nostru către Hub, va trebui să ne conectăm la Hugging Face. Dacă executați acest cod într-un notebook, puteți face acest lucru cu următoarea funcție utilitară, care afișează un widget în care puteți introduce datele voastre de autentificare:
-
-
-```python
-from huggingface_hub import notebook_login
-
-notebook_login()
-```
-
-Dacă nu lucrați într-un notebook, tastați următoarea linie în terminal:
-
-```bash
-huggingface-cli login
-```
-
-{#if fw === 'pt'}
-
-Odată făcut acest lucru, ne putem defini `TrainingArguments`. Așa cum am spus atunci când am definit funcția noastră pentru a calcula metrica, nu vom putea avea o buclă de evaluare obișnuită din cauza parametrilor funcției `compute_metrics()`. Am putea scrie propria noastră subclasă a `Trainer` pentru a face acest lucru (o abordare pe care o puteți găsi în [scriptul exemplu pentru răspunderea la întrebări](https://github.com/huggingface/transformers/blob/master/examples/pytorch/question-answering/trainer_qa.py)), dar este un pic prea lung pentru această secțiune. În schimb, aici vom evalua modelul doar la sfârșitul antrenării și vă vom arăta cum să efectuați o evaluare obișnuită în secțiunea "O buclă de antrenare personalizată" de mai jos.
-
-Acesta este într-adevăr locul în care API-ul `Trainer` își arată limitele și biblioteca 🤗 Accelerate strălucește: personalizarea clasei pentru un caz de utilizare specific poate fi greu de implementat, dar modificarea unei bucle de antrenare complet expuse este ușoară.
-
-Să aruncăm o privire la `TrainingArguments`:
-
-```python
-from transformers import TrainingArguments
-
-args = TrainingArguments(
-    "bert-finetuned-squad",
-    evaluation_strategy="no",
-    save_strategy="epoch",
-    learning_rate=2e-5,
-    num_train_epochs=3,
-    weight_decay=0.01,
-    fp16=True,
-    push_to_hub=True,
-)
-```
-
-Am mai văzut cele mai multe dintre acestea: stabilim niște hiperparametrii (cum ar fi learning rate, numărul de epoci pentru antrenament și o anumită scădere a weighturilor) și indicăm că dorim să salvăm modelul la sfârșitul fiecărei epoci, să sărim peste evaluare și să încărcăm rezultatele noastre în Model Hub. De asemenea, activăm antrenarea cu precizie mixtă cu `fp16=True`, deoarece aceasta poate accelera foarte mult antrenarea pe un GPU recent.
-
-{:else}
-
-Acum, putem crea dataseturile TF. De data aceasta, putem utiliza data collatorul de bază:
-
-```python
-from transformers import DefaultDataCollator
-
-data_collator = DefaultDataCollator(return_tensors="tf")
-```
-
-Și acum creăm dataseturile ca de obicei.
-
-```python
-tf_train_dataset = model.prepare_tf_dataset(
-    train_dataset,
-    collate_fn=data_collator,
-    shuffle=True,
-    batch_size=16,
-)
-tf_eval_dataset = model.prepare_tf_dataset(
-    validation_dataset,
-    collate_fn=data_collator,
-    shuffle=False,
-    batch_size=16,
-)
-```
-
-În continuare, stabilim hiperparametrii de antrenament și compilăm modelul nostru:
-
-```python
-from transformers import create_optimizer
-from transformers.keras_callbacks import PushToHubCallback
-import tensorflow as tf
-
-# Numărul etapelor de antrenare este numărul de sampleuri din dataset, împărțit la dimensiunea batch-ului, apoi înmulțit
-# cu numărul total de epoci. Rețineți că datasetul tf_train_dataset de aici este un batched tf.data.Dataset,
-# nu datasetul original Hugging Face, deci len() este deja num_samples // batch_size.
-num_train_epochs = 3
-num_train_steps = len(tf_train_dataset) * num_train_epochs
-optimizer, schedule = create_optimizer(
-    init_lr=2e-5,
-    num_warmup_steps=0,
-    num_train_steps=num_train_steps,
-    weight_decay_rate=0.01,
-)
-model.compile(optimizer=optimizer)
-
-# Antrenarea în mixed-precision float16
-tf.keras.mixed_precision.set_global_policy("mixed_float16")
-```
-
-În cele din urmă, suntem gata să ne antrenăm cu `model.fit()`. Folosim un `PushToHubCallback` pentru a încărca modelul în Hub după fiecare epocă.
-
-{/if}
-
-În mod implicit, repositoriul utilizat va fi în namespaceul vostru și numit după foldrul de ieșire pe care l-ați stabilit, deci în cazul nostru va fi în `"sgugger/bert-finetuned-squad"`. Putem trece peste acest lucru prin trecerea unui `hub_model_id`; de exemplu, pentru a încărca modelul în organizația `huggingface_course`, am folosit `hub_model_id="huggingface_course/bert-finetuned-squad"` (care este modelul la care am făcut legătura la începutul acestei secțiuni).
-
-
-{#if fw === 'pt'}
-
-<Tip>
-
-💡 Dacă folderul de ieșire pe care îl utilizați există, acesta trebuie să fie o clonă locală a repositoriul în care doriți să faceți push (deci setați un nume nou dacă primiți o eroare la definirea `Trainer`).
-
-</Tip>
-
-În cele din urmă, trecem totul în clasa `Trainer` și lansăm antrenarea:
-
-```python
-from transformers import Trainer
-
-trainer = Trainer(
-    model=model,
-    args=args,
-    train_dataset=train_dataset,
-    eval_dataset=validation_dataset,
-    tokenizer=tokenizer,
-)
-trainer.train()
-```
-
-{:else}
-
-```python
-from transformers.keras_callbacks import PushToHubCallback
-
-callback = PushToHubCallback(output_dir="bert-finetuned-squad", tokenizer=tokenizer)
-
-# Vom face validarea după aceea, deci nu vom face o validare în timpul antrenării
-model.fit(tf_train_dataset, callbacks=[callback], epochs=num_train_epochs)
-```
-
-{/if}
-
-Rețineți că, în timpul antrenamentului, de fiecare dată când modelul este salvat (aici, la fiecare epocă), acesta este încărcat în Hub pe fundal. În acest fel, veți putea să reluați antrenarea pe un alt device, dacă este necesar. Întreaga pregătire durează ceva timp (puțin peste o oră pe un Titan RTX), așa că puteți să vă luați o cafea sau să recitiți unele dintre părțile cursului care vi s-au părut mai dificile în timp ce se desfășoară. De asemenea, rețineți că, de îndată ce se termină prima epocă, veți vedea câteva weighturu încărcate în Hub și puteți începe să vă jucați cu modelul vostru pe pagina acestuia.
-
-{#if fw === 'pt'}
-
-Odată ce antrenamentul este complet, putem în cele din urmă să evaluăm modelul (și să ne rugăm să nu fi petrecut tot timpul de calcul degeaba). Metoda `predict()` a `Trainer` va returna un tuple în care primele elemente vor fi predicțiile modelului (aici o pereche cu logiturile de început și de sfârșit). Trimitem acest rezultat funcției noastre `compute_metrics()`:
-
-```python
-predictions, _, _ = trainer.predict(validation_dataset)
-start_logits, end_logits = predictions
-compute_metrics(start_logits, end_logits, validation_dataset, raw_datasets["validation"])
-```
-
-{:else}
-
-Odată ce antrenamentul este complet, putem în sfârșit să ne evaluăm modelul (și să ne rugăm să nu fi cheltuit tot timpul de calcul degeaba). Metoda `predict()` a modelului nostru `model` se va ocupa de obținerea predicțiilor și, deoarece am făcut toată munca grea de definire a unei funcții `compute_metrics()` mai devreme, putem obține rezultatele noastre într-o singură linie:
-
-```python
-predictions = model.predict(tf_eval_dataset)
-compute_metrics(
-    predictions["start_logits"],
-    predictions["end_logits"],
-    validation_dataset,
-    raw_datasets["validation"],
-)
-```
-
-{/if}
-
-```python out
-{'exact_match': 81.18259224219489, 'f1': 88.67381321905516}
-```
-
-Super! Ca o comparație, scorurile de bază raportate în articolul BERT pentru acest model sunt 80,8 și 88,5, deci suntem exact unde ar trebui să fim.
-
-{#if fw === 'pt'}
-
-În final, folosim metoda `push_to_hub()` pentru a ne asigura că încărcăm cea mai recentă versiune a modelului:
-
-```py
-trainer.push_to_hub(commit_message="Training complete")
-```
-
-Aceasta returnează URL-ul commit-ului pe care tocmai l-a făcut, dacă doriți să îl inspectați:
-
-```python out
-'https://huggingface.co/sgugger/bert-finetuned-squad/commit/9dcee1fbc25946a6ed4bb32efb1bd71d5fa90b68'
-```
-
-De asemenea, `Trainer` redactează un model card cu toate rezultatele evaluării și o încarcă.
-
-{/if}
-
-În această etapă, puteți utiliza widgetul de inferență de pe Model Hub pentru a testa modelul și pentru a-l oferi prietenilor, familia și animalele de companie preferate. Ați făcut fine-tune cu succes unui model pentru o sarcină de răspundere a unei întrebari - felicitări!
-
-<Tip>
-
-✏️ **E rândul tău!** Încearcă un alt model de arhitectură pentru a vedea dacă are performanțe mai bune la această sarcină!
-
-</Tip>
-
-{#if fw === 'pt'}
-
-Dacă doriți să pătrundeți puțin mai adânc în bucla de antrenare, vă vom arăta acum cum să faceți același lucru folosind 🤗 Accelerate.
-
-## O buclă de antrenare personalizată[[a-custom-training-loop]]
-
-Să aruncăm acum o privire la bucla de antrenare completă, astfel încât să puteți personaliza cu ușurință părțile de care aveți nevoie. Aceasta va semăna foarte mult cu bucla de antrenare din [Capitolul 3](/course/chapter3/4), cu excepția buclei de evaluare. Vom putea evalua modelul în mod regulat, deoarece nu mai suntem constrânși de clasa `Trainer`.
-
-### Pregătirea pentru antrenament[[preparing-everything-for-training]]
-
-Mai întâi trebuie să construim `DataLoader`s din dataseturile noastre. Am setat formatul acestor dataseturi la `"torch"` și am eliminat coloanele din setul de validare care nu sunt utilizate de model. Apoi, putem utiliza `default_data_collator` furnizat de Transformers ca un `collate_fn` și să amestecăm setul de antrenare, dar nu și setul de validare:
-
-```py
-from torch.utils.data import DataLoader
-from transformers import default_data_collator
-
-train_dataset.set_format("torch")
-validation_set = validation_dataset.remove_columns(["example_id", "offset_mapping"])
-validation_set.set_format("torch")
-
-train_dataloader = DataLoader(
-    train_dataset,
-    shuffle=True,
-    collate_fn=default_data_collator,
-    batch_size=8,
-)
-eval_dataloader = DataLoader(
-    validation_set, collate_fn=default_data_collator, batch_size=8
-)
-```
-
-În continuare, reinițializăm modelul, pentru a ne asigura că nu continuăm fine-tuningul de dinainte, ci pornim din nou de la modelul preantrenat BERT:
-
-```py
-model = AutoModelForQuestionAnswering.from_pretrained(model_checkpoint)
-```
-
-Atunci vom avea nevoie de un optimizator. Ca de obicei, folosim clasicul `AdamW`, care este ca Adam, dar cu o corecție în modul în care se aplică scăderea weighturilor:
-
-```py
-from torch.optim import AdamW
-
-optimizer = AdamW(model.parameters(), lr=2e-5)
-```
-
-Odată ce avem toate aceste obiecte, le putem trimite metodei `accelerator.prepare()`. Amintiți-vă că, dacă doriți să vă antrenați pe un TPU într-un notebook Colab, va trebui să mutați tot acest cod într-o funcție de antrenament, care nu ar trebui să execute nicio celulă care inițializează un `Accelerator`. Putem forța antrenarea cu precizie mixtă trecând `fp16=True` la `Accelerator` (sau, dacă executați codul ca un script, asigurați-vă că completați `config` în 🤗 Accelerate în mod corespunzător).
-
-```py
-from accelerate import Accelerator
-
-accelerator = Accelerator(fp16=True)
-model, optimizer, train_dataloader, eval_dataloader = accelerator.prepare(
-    model, optimizer, train_dataloader, eval_dataloader
-)
-```
-
-După cum ar trebui să știți din secțiunile anterioare, putem utiliza lungimea `train_dataloader` pentru a calcula numărul de pași de antrenare numai după ce a trecut prin metoda `accelerator.prepare()`. Utilizăm același program liniar ca în secțiunile anterioare:
-
-```py
-from transformers import get_scheduler
-
-num_train_epochs = 3
-num_update_steps_per_epoch = len(train_dataloader)
-num_training_steps = num_train_epochs * num_update_steps_per_epoch
-
-lr_scheduler = get_scheduler(
-    "linear",
-    optimizer=optimizer,
-    num_warmup_steps=0,
-    num_training_steps=num_training_steps,
-)
-```
-
-Pentru a trimite modelul nostru către Hub, va trebui să creăm un obiect `Repository` într-un folder de lucru. În primul rând, conectați-vă la Hugging Face Hub, dacă nu sunteți deja conectat. Vom determina numele repositoriul pornind de la ID-ul modelului pe care dorim să îl atribuim modelului nostru (nu ezitați să înlocuiți `repo_name` cu propria alegere; acesta trebuie doar să conțină numele vostru de utilizator, ceea ce face funcția `get_full_repo_name()`):
-
-```py
-from huggingface_hub import Repository, get_full_repo_name
-
-model_name = "bert-finetuned-squad-accelerate"
-repo_name = get_full_repo_name(model_name)
-repo_name
-```
-
-```python out
-'sgugger/bert-finetuned-squad-accelerate'
-```
-
-Apoi putem clona acel repositoriu într-un folder local. Dacă există deja, acest folder local ar trebui să fie o clonă a repositoriului cu care lucrăm:
-
-```py
-output_dir = "bert-finetuned-squad-accelerate"
-repo = Repository(output_dir, clone_from=repo_name)
-```
-
-Acum putem încărca orice salvăm în `output_dir` prin apelarea metodei `repo.push_to_hub()`. Acest lucru ne va ajuta să încărcăm modelele intermediare la sfârșitul fiecărei epoci.
-
-## Bucla de antrenare[[training-loop]]
-
-Acum suntem pregătiți să scriem bucla de antrenare completă. După definirea unei bare de progres pentru a urmări modul în care decurge antrenamentul, bucla are trei părți:
-
-- Pregătirea în sine, care este iterația clasică peste `train_dataloader`, trecerea înainte prin model, apoi trecerea înapoi și pasul optimizatorului.
-- Evaluarea, în care adunăm toate valorile pentru `start_logits` și `end_logits` înainte de a le converti în matrici NumPy. Odată ce bucla de evaluare este terminată, concatenăm toate rezultatele. Rețineți că trebuie să truncăm deoarece `Accelerator` ar fi putut adăuga câteva exemple la sfârșit pentru a ne asigura că avem același număr de exemple în fiecare proces.
-- Salvarea și încărcarea, unde mai întâi salvăm modelul și tokenizatorul, apoi apelăm `repo.push_to_hub()`. Ca și înainte, folosim argumentul `blocking=False` pentru a spune bibliotecii 🤗 Hub să efectueze push-ul într-un proces asincron. În acest fel, antrenamentul continuă normal, iar această instrucțiune (lungă) este executată pe fundal.
-
-Iată codul complet pentru bucla de antrenare:
-
-```py
-from tqdm.auto import tqdm
-import torch
-
-progress_bar = tqdm(range(num_training_steps))
-
-for epoch in range(num_train_epochs):
-    # Training
-    model.train()
-    for step, batch in enumerate(train_dataloader):
-        outputs = model(**batch)
-        loss = outputs.loss
-        accelerator.backward(loss)
-
-        optimizer.step()
-        lr_scheduler.step()
-        optimizer.zero_grad()
-        progress_bar.update(1)
-
-    # Evaluation
-    model.eval()
-    start_logits = []
-    end_logits = []
-    accelerator.print("Evaluation!")
-    for batch in tqdm(eval_dataloader):
-        with torch.no_grad():
-            outputs = model(**batch)
-
-        start_logits.append(accelerator.gather(outputs.start_logits).cpu().numpy())
-        end_logits.append(accelerator.gather(outputs.end_logits).cpu().numpy())
-
-    start_logits = np.concatenate(start_logits)
-    end_logits = np.concatenate(end_logits)
-    start_logits = start_logits[: len(validation_dataset)]
-    end_logits = end_logits[: len(validation_dataset)]
-
-    metrics = compute_metrics(
-        start_logits, end_logits, validation_dataset, raw_datasets["validation"]
-    )
-    print(f"epoch {epoch}:", metrics)
-
-    # Save and upload
-    accelerator.wait_for_everyone()
-    unwrapped_model = accelerator.unwrap_model(model)
-    unwrapped_model.save_pretrained(output_dir, save_function=accelerator.save)
-    if accelerator.is_main_process:
-        tokenizer.save_pretrained(output_dir)
-        repo.push_to_hub(
-            commit_message=f"Training in progress epoch {epoch}", blocking=False
-        )
-```
-
-În cazul în care este prima dată când vedeți un model salvat cu 🤗 Accelerate, să ne oprim puțin pentru a inspecta cele trei linii de cod care îl însoțesc:
-
-```py
-accelerator.wait_for_everyone()
-unwrapped_model = accelerator.unwrap_model(model)
-unwrapped_model.save_pretrained(output_dir, save_function=accelerator.save)
-```
-
-Prima linie se explică de la sine: aceasta spune tuturor proceselor să aștepte până când toată lumea se află în etapa respectivă înainte de a continua. Acest lucru are rolul de a ne asigura că avem același model în fiecare proces înainte de salvare. Apoi luăm `unwrapped_model`, care este modelul de bază pe care l-am definit. Metoda `accelerator.prepare()` modifică modelul pentru a funcționa în antrenarea distribuită, deci nu va mai avea metoda `save_pretrained()`; metoda `accelerator.unwrap_model()` anulează acest pas. În cele din urmă, apelăm metoda `save_pretrained()`, dar îi spunem să folosească metoda `accelerator.save()` în loc de `torch.save()`.
-
-Odată făcut acest lucru, ar trebui să aveți un model care produce rezultate destul de asemănătoare cu cel antrenat cu `Trainer`. Puteți verifica modelul pe care l-am antrenat folosind acest cod pe [*huggingface-course/bert-finetuned-squad-accelerate*] (https://huggingface.co/huggingface-course/bert-finetuned-squad-accelerate). Și dacă doriți să testați orice modificări ale buclei de antrenare, le puteți implementa direct prin editarea codului prezentat mai sus!
-
-{/if}
-
-## Utilizarea modelului fine-tuned[[using-the-fine-tuned-model]]
-
-V-am arătat deja cum puteți utiliza modelul căruia i-am făcut fine-tune pe Model Hub cu widgetul de inferență. Pentru a-l utiliza local într-un `pipeline`, trebuie doar să specificați identificatorul modelului:
-
-```py
-from transformers import pipeline
-
-# Înlocuiți acest checkpoint cu propriul checkpoint
-model_checkpoint = "huggingface-course/bert-finetuned-squad"
-question_answerer = pipeline("question-answering", model=model_checkpoint)
-
-context = """
-🤗 Transformers is backed by the three most popular deep learning libraries — Jax, PyTorch and TensorFlow — with a seamless integration
-between them. It's straightforward to train your models with one before loading them for inference with the other.
-"""
-question = "Which deep learning libraries back 🤗 Transformers?"
-question_answerer(question=question, context=context)
-```
-
-```python out
-{'score': 0.9979003071784973,
- 'start': 78,
- 'end': 105,
- 'answer': 'Jax, PyTorch and TensorFlow'}
-```
-
-Grozav! Modelul nostru funcționează la fel de bine ca cel implicit pentru aceast pipeline!
diff --git a/chapters/ro/chapter7/8.mdx b/chapters/ro/chapter7/8.mdx
deleted file mode 100644
index 71652433d..000000000
--- a/chapters/ro/chapter7/8.mdx
+++ /dev/null
@@ -1,22 +0,0 @@
-# Înțelegerea NLP[[mastering-nlp]]
-
-<CourseFloatingBanner
-    chapter={7}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-Dacă ați ajuns până aici în curs, felicitări - acum aveți toate cunoștințele și instrumentele necesare pentru a aborda (aproape) orice sarcină NLP cu 🤗 Transformers și ecosistemul Hugging Face!
-
-Am văzut o mulțime de data collators, așa că am făcut acest mic videoclip pentru a vă ajuta să găsiți cel pe care să îl utilizați pentru fiecare sarcină:
-
-<Youtube id="-RPeakdlHYo"/>
-
-După finalizarea acestui tur fulger prin sarcinile de bază ale NLP, ar trebui să:
-
-* Știți care arhitecturi (codificator, decodificator sau codificator-decodificator) sunt cele mai potrivite pentru fiecare sarcină
-* Înțelegeți diferența dintre preantrenare și fine-tuningul a unui model lingvistic
-* Știți cum să antrenați modele Transformer utilizând API-ul `Trainer` și caracteristicile de antrenare distribuită ale 🤗 Accelerate sau TensorFlow și Keras, în funcție de calea pe care ați urmat-o
-* Înțelegeți semnificația și limitele metricilor precum ROUGE și BLEU pentru sarcinile de generare a textului
-* Știți cum să interacționați cu modelele dvs. ajustate, atât pe Hub, cât și utilizând `pipeline` din 🤗 Transformers
-
-În ciuda tuturor acestor cunoștințe, va veni un moment în care fie veți întâlni un bug dificil în codul vostru fie veți avea o întrebare despre cum să rezolvați o anumită problemă NLP. Din fericire, comunitatea Hugging Face este aici pentru a vă ajuta! În ultimul capitol al acestei părți a cursului, vom explora modul în care vă puteți face debugging modelelor Transformer și solicita ajutor în mod eficient.
\ No newline at end of file
diff --git a/chapters/ro/chapter7/9.mdx b/chapters/ro/chapter7/9.mdx
deleted file mode 100644
index 38e4ee0a0..000000000
--- a/chapters/ro/chapter7/9.mdx
+++ /dev/null
@@ -1,329 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-<!-- DISABLE-FRONTMATTER-SECTIONS -->
-
-# Quiz de sfârșit de capitol[[end-of-chapter-quiz]]
-
-<CourseFloatingBanner
-    chapter={7}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-Să testăm ce ați învățat în acest capitol!
-
-### 1. Care dintre următoarele sarcini pot fi încadrate ca o problemă de clasificare a tokenilor?
-
-<Question
-	choices={[
-		{
-			text: "Găsirea componentelor gramaticale ale unei propoziții.",
-			explain: "Corect! Apoi putem eticheta fiecare cuvânt ca substantiv, verb etc.",
-			correct: true
-		},
-		{
-			text: "Verificarea dacă o propoziție este corectă gramatical sau nu.",
-			explain: "Nu, aceasta este o problemă de clasificare a secvențelor."
-		},
-		{
-			text: "Găsirea persoanelor menționate într-o propoziție.",
-			explain: "Corect! Putem eticheta fiecare cuvânt ca persoană sau nu ca o persoană.",
-            correct: true
-		},
-        {
-			text: "Găsirea grupul de cuvinte dintr-o propoziție care răspunde la o întrebare.",
-			explain: "Nu, aceasta ar fi o problemă de răspundere a unei întrebări."
-		}
-	]}
-/>
-
-### 2. Ce parte a preprocesării pentru clasificarea tokenilor diferă de celelalte pipelineuri de preprocesare?
-
-<Question
-	choices={[
-		{
-			text: "Nu este nevoie să faceți nimic; textele sunt deja tokenizate.",
-			explain: "Textele sunt într-adevăr date ca cuvinte separate, dar tot trebuie să aplicăm modelul de tokenizare a sub-cuvintelor."
-		},
-		{
-			text: "Textele sunt date sub formă de cuvinte, astfel încât trebuie să aplicăm doar tokenizarea sub-cuvintelor.",
-			explain: "Corect! Acest lucru este diferit de preprocesarea obișnuită, în care trebuie să aplicăm întregul proces de tokenizare. Vă puteți gândi la o altă diferență?",
-			correct: true
-		},
-		{
-			text: "Folosim <code>-100</code> pentru a eticheta tokenii speciali.",
-			explain: "Acest lucru nu este specific clasificării tokenilor - folosim întotdeauna <code>-100</code> ca label pentru tokenii pe care dorim să îi ignorăm în pierdere."
-		},
-		{
-			text: "Trebuie să ne asigurăm că labelurile sunt trunchiate sau padded la aceeași dimensiune ca și inputurile, atunci când aplicăm trunchierea/paddingul.",
-			explain: "Într-adevăr! Totuși, aceasta nu este singura diferență.",
-			correct: true
-		}
-	]}
-/>
-
-### 3. Ce problemă apare atunci când tokenizăm cuvintele într-o problemă de clasificare a tokenilor și dorim să etichetăm tokenii?
-
-<Question
-	choices={[
-		{
-			text: "Tokenizatorul adaugă tokeni speciali și nu avem labeluri pentru ele.",
-			explain: "Le etichetăm pe acestea cu <code>-100</code>, astfel încât acestea să fie ignorate în pierdere."
-		},
-		{
-			text: "Fiecare cuvânt poate produce mai mulți tokeni, astfel încât ajungem să avem mai multe tokeni decât labeluri.",
-			explain: "Aceasta este problema principală, iar noi trebuie să aliniem labelurile originale cu tokenii.",
-			correct: true
-		},
-		{
-			text: "Tokenii adăugați nu au etichete, deci nu există nicio problemă.",
-			explain: "Incorect; avem nevoie de atâtea etichete câțo tokeni avem, altfel modelele noastre vor da erori."
-		}
-	]}
-/>
-
-### 4. Ce înseamnă "domain adaptation"??
-
-<Question
-	choices={[
-		{
-			text: "Este atunci când rulăm un model pe un dataset și obținem predicțiile pentru fiecare sample din acel dataset.",
-			explain: "Nu, aceasta este doar o inferență."
-		},
-		{
-			text: "Este atunci când antrenăm un model pe un dataset.",
-			explain: "Nu, acesta este antrenarea unui model; nu există nicio adaptare aici."
-		},
-		{
-			text: "Este atunci când facem fine-tune unui model preantrenat pe un nou dataset, iar acesta oferă predicții care sunt mai bine adaptate la datasetul respectiv",
-			explain: "Corect! Modelul și-a adaptat cunoștințele la noul dataset.",
-            correct: true
-		},
-        {
-			text: "Este atunci când adăugăm sampleuri neclasificate la un dataset pentru a face modelul nostru mai robust.",
-			explain: "Cu siguranță este ceva ce ar trebui să faceți dacă vă reantrenați modelul în mod regulat, dar nu este o adaptare la domeniu."
-		}
-	]}
-/>
-
-### 5. Ce sunt labelurile într-o problemă de modelare a limbajului mascat?
-
-<Question
-	choices={[
-		{
-			text: "Unii dintre tokenii din propoziția de intrare sunt mascate aleatoriu, iar labelurile sunt tokenii de input originali.",
-			explain: "Corect!",
-            correct: true
-		},
-		{
-			text: "Unii dintre tokenii din propoziția de intrare sunt mascate aleatoriu, iar labelurile sunt tokenii de input originali, deplasate spre stânga.",
-			explain: "Nu, deplasarea labelurilor spre stânga corespunde prezicerii următorului cuvânt, ceea ce este modelarea cauzală a limbajului."
-		},
-		{
-			text: "Unele dintre tokenii din propoziția de intrare sunt mascate aleatoriu, iar labelul este dacă propoziția este pozitivă sau negativă.",
-			explain: "Aceasta este o problemă de clasificare a secvențelor cu o anumită creștere a datelor, nu de modelare a limbajului mascat."
-		},
-        {
-			text: "Unii dintre tokenii din cele două propoziții de intrare sunt mascate aleatoriu, iar labelul este dacă cele două propoziții sunt similare sau nu.",
-			explain: "Aceasta este o problemă de clasificare a secvențelor cu o anumită creștere a datelor, nu de modelare a limbajului mascat."
-		}
-	]}
-/>
-
-### 6. Care dintre aceste sarcini poate fi văzută ca o problemă de sequence-to-sequence?
-
-<Question
-	choices={[
-		{
-			text: "Scrierea de recenzii scurte ale documentelor lungi",
-			explain: "Da, aceasta este o problemă de sumarizare. Încercați un alt răspuns!",
-            correct: true
-		},
-		{
-			text: "Răspunderea întrebărilor despre un document",
-			explain: "Acest lucru poate fi încadrat ca o problemă de sequence-to-sequence. Totuși, acesta nu este singurul răspuns corect.",
-            correct: true
-		},
-		{
-			text: "Traducerea unui text din chineză în engleză",
-			explain: "Aceasta este cu siguranță o problemă de sequence-to-sequence. Mai puteți găsi alta?",
-            correct: true
-		},
-        {
-			text: "Corectarea mesajelor trimise de nepotul/prietenul meu pentru ca acestea să fie în limba engleză, scrise gramatical",
-			explain: "Aceasta este un fel de problemă de traducere, deci cu siguranță o sarcină de la sequence-to-sequence. Totuși, acesta nu este singurul răspuns corect!",
-			correct: true
-		}
-	]}
-/>
-
-### 7. Care este modalitatea corectă de preprocesare a datelor pentru o problemă de sequence-to-sequence?
-
-<Question
-	choices={[
-		{
-			text: "Inputurile și targeturile trebuie trimise împreună la tokenizer cu <code>inputs=...</code> și <code>targets=...</code>.",
-			explain: "Acesta ar putea fi un API pe care îl vom adăuga în viitor, dar nu este disponibil acum."
-		},
-		{
-			text: "Inputurile și targturile trebuie preprocesate, în două apeluri separate către tokenizer.",
-			explain: "Acest lucru este adevărat, dar incomplet. Trebuie să faceți ceva pentru a vă asigura că tokenizerul le procesează pe ambele în mod corespunzător."
-		},
-		{
-			text: "Ca de obicei, trebuie doar să tokenizăm inputurile.",
-			explain: "Nu într-o problemă de clasificare a secvențelor; targeturile sunt de asemenea texte pe care trebuie să le convertim în numere!"
-		},
-        {
-			text: "Inputurile trebuie să fie trimise către tokenizer, la fel și targeturile, dar în cadrul unui manager de context special.",
-			explain: "Corect, tokenizerul trebuie să fie pus în target mode de către acel context manager.",
-			correct: true
-		}
-	]}
-/>
-
-{#if fw === 'pt'}
-
-### 8. De ce există o subclasă specifică a `Trainer` pentru problemele sequence-to-sequence?
-
-<Question
-	choices={[
-		{
-			text: "Deoarece problemele de sequence-to-sequence utilizează o pierdere personalizată, pentru a ignora labelurile setate la <code>-100</code>",
-			explain: "Aceasta nu este deloc o pierdere personalizată, ci modul în care pierderea este întotdeauna calculată."
-		},
-		{
-			text: "Deoarece problemele de sequence-to-sequence la secvență necesită o buclă de evaluare specială",
-			explain: "Acest lucru este corect. Predicțiile modelelor sequence-to-sequence sunt de obicei rulate cu metoda <code>generate()</code>.",
-			correct: true
-		},
-		{
-			text: "Deoarece targeturile sunt texte în probleme sequence-to-sequence",
-			explain: "<code>Trainer</code>-ului nu prea îi pasă de asta, deoarece acestea au fost preprocesate înainte."
-		},
-        {
-			text: "Deoarece folosim două modele în problemele sequence-to-sequence",
-			explain: "Într-un fel, folosim două modele, un codificator și un decodificator, dar acestea sunt grupate într-un singur model."
-		}
-	]}
-/>
-
-{:else}
-
-### 9. De ce este adesea inutil să se specifice o pierdere atunci când se apelează `compile()` pe un model Transformer?
-
-<Question
-	choices={[
-		{
-			text: "Deoarece modelele Transformer sunt antrenate cu unsupervised learning",
-			explain: "Nu chiar - chiar și unsupervised learning are nevoie de o funcție de pierdere!"
-		},
-		{
-			text: "Deoarece, în mod prestabilit, se utilizează valoarea pierderilor interne ale modelului",
-			explain: "Corect!",
-			correct: true
-		},
-		{
-			text: "Deoarece calculăm metricele după antrenare",
-			explain: "Facem adesea acest lucru, dar nu explică de unde obținem valoarea pierderii pe care o optimizăm în formare."
-		},
-        {
-			text: "Deoarece pierderea este specificată în `model.fit()`",
-			explain: "Nu, funcția de pierdere este întotdeauna fixată odată ce rulați `model.compile()`, și nu poate fi modificată în `model.fit()`."
-		}
-	]}
-/>
-
-{/if}
-
-### 10. Când ar trebui să preantrenați un model nou?
-
-<Question
-	choices={[
-		{
-			text: "Atunci când nu există un model preantrenat disponibil pentru limba dorită.",
-			explain: "Corect.",
-			correct: true
-		},
-		{
-			text: "Atunci când aveți o mulțime de date disponibile, chiar dacă există un model preantrenat care ar putea funcționa pe ele",
-			explain: "În acest caz, ar trebui, probabil, să utilizați modelul preantrenat și să îi faceți fine-tune pe datele voastre, pentru a evita costurile uriașe de calcul."
-		},
-		{
-			text: "Atunci când aveți îndoieli cu privire la biasul modelului preantrenat pe care îl utilizați",
-			explain: "Este adevărat, dar trebuie să vă asigurați că datele pe care le veți utiliza pentru antrenare sunt cu adevărat mai bune.",
-			correct: true
-		},
-        {
-			text: "Atunci când modelele preantrenate disponibile nu sunt suficient de bune",
-			explain: "Sunteți sigur că ați făcut debbuging în mod corespunzător antrenării?"
-		}
-	]}
-/>
-
-### 11. De ce este ușor să preantrenăm un model lingvistic pe o mulțime de texte?
-
-<Question
-	choices={[
-		{
-			text: "Deoarece există o mulțime de texte disponibile pe internet",
-			explain: "Deși este adevărat, acest lucru nu răspunde cu adevărat la întrebare. Încercați din nou!"
-		},
-		{
-			text: "Deoarece obiectivul de preantrenare nu necesită ca oamenii să eticheteze datele",
-			explain: "Acest lucru este corect, modelarea limbajului este o problemă autosupravegheată.",
-			correct: true
-		},
-		{
-			text: "Deoarece biblioteca 🤗 Transformers necesită doar câteva linii de cod pentru a începe antrenarea",
-			explain: "Deși adevărat, acest lucru nu răspunde cu adevărat la întrebarea pusă. Încercați un alt răspuns!"
-		}
-	]}
-/>
-
-### 12. Care sunt principalele provocări la preprocesarea datelor pentru o sarcină de răspundere a întrebărilor?
-
-<Question
-	choices={[
-		{
-			text: "Trebuie să tokenizați inputurile.",
-			explain: "Este corect, dar este cu adevărat o provocare principală?"
-		},
-		{
-			text: "Trebuie să aveți de-a face cu contexte foarte lungi, care oferă mai multe caracteristici de antrenare care pot sau nu să conțină răspunsul.",
-			explain: "Aceasta este cu siguranță una dintre provocări.",
-			correct: true
-		},
-		{
-			text: "Trebuie să tokenizați răspunsurile la întrebări, precum și inputurile.",
-			explain: "Nu, cu excepția cazului în care vă încadrați problema de răspundere a întrebărilor ca o sarcină de sequence-to-sequence."
-		},
-       {
-			text: "Din intervalul răspunsului din text, trebuie să găsiți tokenul de început și de sfârșit în inputul tokenizat.",
-			explain: "Aceasta este una dintre părțile dificile!",
-			correct: true
-		}
-	]}
-/>
-
-### 13. Cum se face de obicei post-procesarea în răspunderea la întrebări?
-
-<Question
-	choices={[
-		{
-			text: "Modelul vă oferă pozițiile de început și de sfârșit ale răspunsului, iar voi trebuie doar să decodificați intervalul corespunzător de tokeni.",
-			explain: "Acesta ar putea fi un mod de a face acest lucru, dar este un pic prea simplist."
-		},
-		{
-			text: "Modelul vă oferă pozițiile de început și de sfârșit ale răspunsului pentru fiecare caracteristică creată de un exemplu, iar voi trebuie doar să decodificați intervalul corespunzător de tokeni în cel care are cel mai bun scor.",
-			explain: "Acest lucru este apropiat de post-procesarea pe care am studiat-o, dar nu este complet corect."
-		},
-		{
-			text: "Modelul vă oferă pozițiile de început și de sfârșit ale răspunsului pentru fiecare caracteristică creată de un exemplu, iar voi trebuie doar să le potriviți cu intervalul din context pentru cel care are cel mai bun scor.",
-			explain: "Asta e corect!",
-			correct: true
-		},
-        {
-			text: "Modelul generează un răspuns, iar tu trebuie doar să îl decodifici.",
-			explain: "Nu, cu excepția cazului în care vă încadrați problema de răspundere a întrebării ca o sarcină de sequence-to-sequence."
-		}
-	]}
-/>

From c4efd993a4986d16383fd31c9c10b37be22b826d Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Tue, 27 May 2025 22:14:55 +0300
Subject: [PATCH 125/167] feat: add content for chapter7

---
 chapters/rum/_toctree.yml   |   50 ++
 chapters/rum/chapter0/1.mdx |  110 ++++
 chapters/rum/chapter7/1.mdx |   38 ++
 chapters/rum/chapter7/2.mdx |  983 ++++++++++++++++++++++++++++
 chapters/rum/chapter7/3.mdx | 1043 ++++++++++++++++++++++++++++++
 chapters/rum/chapter7/4.mdx | 1001 +++++++++++++++++++++++++++++
 chapters/rum/chapter7/5.mdx | 1074 +++++++++++++++++++++++++++++++
 chapters/rum/chapter7/6.mdx |  914 ++++++++++++++++++++++++++
 chapters/rum/chapter7/7.mdx | 1206 +++++++++++++++++++++++++++++++++++
 chapters/rum/chapter7/8.mdx |   34 +
 chapters/rum/chapter7/9.mdx |  329 ++++++++++
 11 files changed, 6782 insertions(+)
 create mode 100644 chapters/rum/_toctree.yml
 create mode 100644 chapters/rum/chapter0/1.mdx
 create mode 100644 chapters/rum/chapter7/1.mdx
 create mode 100644 chapters/rum/chapter7/2.mdx
 create mode 100644 chapters/rum/chapter7/3.mdx
 create mode 100644 chapters/rum/chapter7/4.mdx
 create mode 100644 chapters/rum/chapter7/5.mdx
 create mode 100644 chapters/rum/chapter7/6.mdx
 create mode 100644 chapters/rum/chapter7/7.mdx
 create mode 100644 chapters/rum/chapter7/8.mdx
 create mode 100644 chapters/rum/chapter7/9.mdx

diff --git a/chapters/rum/_toctree.yml b/chapters/rum/_toctree.yml
new file mode 100644
index 000000000..b7af9af65
--- /dev/null
+++ b/chapters/rum/_toctree.yml
@@ -0,0 +1,50 @@
+- title: 0. Configurare
+  sections:
+  - local: chapter0/1
+    title: Introducere
+
+- title: 1. Modele Transformer
+  sections:
+  - local: chapter1/1
+    title: Introducere
+  - local: chapter1/2
+    title: Procesarea limbajului natural și modelele de limbaj mari
+  - local: chapter1/3
+    title: Transformers, ce pot face?
+  - local: chapter1/4
+    title: Cum funcționează Transformers?
+  - local: chapter1/5
+    title: Modele Encoder
+  - local: chapter1/6
+    title: Modele Decoder
+  - local: chapter1/7
+    title: Modele secvență-la-secvență
+  - local: chapter1/8
+    title: Prejudecăți și limitări
+  - local: chapter1/9
+    title: Rezumat
+  - local: chapter1/10
+    title: Quiz de final de capitol
+    quiz: 1
+
+- title: 7. Sarcini clasice NLP
+  sections:
+  - local: chapter7/1
+    title: Introducere
+  - local: chapter7/2
+    title: Clasificarea tokenilor
+  - local: chapter7/3
+    title: Fine-tuningul la un model de limbaj mascat
+  - local: chapter7/4
+    title: Traducere
+  - local: chapter7/5
+    title: Sumarizare
+  - local: chapter7/6
+    title: Antrenarea de la zero a unui model de limbaj cauzal
+  - local: chapter7/7
+    title: Răspuns la întrebări
+  - local: chapter7/8
+    title: Înțelegerea LLM-urilor
+  - local: chapter7/9
+    title: Quiz de sfârșit de capitol
+    quiz: 7
\ No newline at end of file
diff --git a/chapters/rum/chapter0/1.mdx b/chapters/rum/chapter0/1.mdx
new file mode 100644
index 000000000..c7c072707
--- /dev/null
+++ b/chapters/rum/chapter0/1.mdx
@@ -0,0 +1,110 @@
+# Introducere[[introducere]]
+
+Bun venit la cursul Hugging Face! Această introducere te va ghida în configurarea environment-ului de lucru. Dacă abia începi cursul, îți recomandăm să arunci o privire mai întâi asupra [Capitolului 1](/course/chapter1), apoi să te întorci și să îți configurezi environment-ul pentru a putea încerca singur codul.
+
+Toate bibliotecile pe care le vom folosi în acest curs sunt disponibile ca Python packages, așa că aici îți vom arăta cum să configurezi Python environment-ul și să instalezi librăriile specifice de care ai nevoie.
+
+Vom acoperi două moduri de a-ți configura environment-ul, folosind un notebook Colab sau un Python environment. Simte-te liber să alegi pe cel care ți se potrivește cel mai bine. Pentru începători, recomandăm să începi folosind un notebook Colab.
+
+Reține că nu vom acoperi sistemul Windows. Dacă folosești Windows, îți recomandăm să urmezi pașii folosind un notebook Colab. Dacă folosești o distribuție Linux sau macOS, poți folosi oricare dintre abordările descrise aici.
+
+Majoritatea cursului se bazează pe faptul că ai un cont Hugging Face. Îți recomandăm să creezi unul acum: [crează un cont](https://huggingface.co/join).
+
+## Folosirea unui notebook Google Colab[[folosind-un-notebook-google-colab]]
+
+Folosirea unui notebook Colab este cea mai simplă configurare posibilă; deschide un notebook în browserul tău și începe imediat să scrii cod!
+
+Dacă nu ești familiarizat cu Colab, îți recomandăm să începi urmând [introducerea](https://colab.research.google.com/notebooks/intro.ipynb). Colab îți permite să folosești hardware accelerat, cum ar fi GPU-uri sau TPU-uri, și este gratuit pentru sarcini mai mici.
+
+Odată ce ești confortabil să te descurci în Colab, creează un nou notebook și începe cu configurarea:
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter0/new_colab.png" alt="Un notebook Colab gol" width="80%"/>
+</div>
+
+Următorul pas este să instalezi librăriile pe care le vom folosi în acest curs. Vom folosi `pip` pentru instalare, care este managerul de packages pentru Python. În notebook-uri, poți rula comenzi de sistem începând comanda cu caracterul `!`, așa că poți instala librăria 🤗 Transformers astfel:
+
+```
+!pip install transformers
+```
+
+Te poți asigura că pachetul a fost instalat corect importându-l în cadrul mediului tău Python:
+
+```
+import transformers
+```
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter0/install.gif" alt="O animație care arată rezultatul celor două comenzi de mai sus: instalare și importarea" width="80%"/>
+</div>
+
+Aceasta instalează o versiune foarte ușoară a 🤗 Transformers. În special, nu sunt instalate framework-uri specifice de machine learning (cum ar fi PyTorch sau TensorFlow). Deoarece vom folosi multe caracteristici diferite ale librăriei, îți recomandăm să instalezi versiunea pentru development, care vine cu toate dependențele necesare pentru cam orice caz de utilizare imaginabil:
+
+```
+!pip install transformers[sentencepiece]
+```
+
+Aceasta va dura puțin timp, dar apoi vei fi gata de drum pentru restul cursului!
+
+## Folosirea unui virtual environment Python[[folosirea-unui-virtual-environment-python]]
+
+Dacă preferi să folosești un mediu virtual Python, primul pas este să instalezi Python pe sistemul tău. Îți recomandăm să urmezi [această ghidare](https://realpython.com/installing-python/) pentru a începe.
+
+Odată ce ai Python instalat, ar trebui să poți rula comenzi Python în terminalul tău. Poți începe rulând următoarea comandă pentru a te asigura că este instalat corect înainte de a trece la pașii următori: `python --version`. Aceasta ar trebui să afișeze versiunea Python disponibilă acum pe sistemul tău.
+
+Când rulezi o comandă Python în terminalul tău, cum ar fi `python --version`, ar trebui să te gândești la programul care rulează comanda ta ca la Python-ul "principal" de pe sistemul tău. Îți recomandăm să păstrezi această instalare principală liberă de orice pachete și să o folosești pentru a crea environment-uri separate pentru fiecare aplicație pe care lucrezi — în acest fel, fiecare aplicație poate avea propriile sale dependențe și pachete, și nu va trebui să te preocupi de problemele de compatibilitate potențiale cu alte aplicații.
+
+În Python, acest lucru se face prin [*virtual environments*](https://docs.python.org/3/tutorial/venv.html), care sunt directory trees autonomi ce conțin fiecare o instalare Python cu o anumită versiune Python împreună cu toate pachetele de care are nevoie aplicația. Crearea unui astfel de mediu virtual poate fi realizată cu mai multe instrumente diferite, dar vom folosi pachetul oficial Python pentru acest scop, denumit [`venv`](https://docs.python.org/3/library/venv.html#module-venv).
+
+În primul rând, creează folder în care dorești ca aplicația ta să locuiască — de exemplu, ai putea dori să faci un nou folder numit *transformers-course* în rădăcina folderului tău personal:
+
+```
+mkdir ~/transformers-course
+cd ~/transformers-course
+```
+
+Din interiorul acestui folder, creează un virtual environment folosind modulul Python `venv`:
+
+```
+python -m venv .env
+```
+
+Acum ar trebui să ai un folder numit *.env* în folderul tău altfel gol:
+
+```
+ls -a
+```
+
+```out
+.      ..    .env
+```
+
+Poți să intri și să ieși din environment folosind comenzile `activate` și `deactivate`:
+
+```
+# Activează mediul virtual
+source .env/bin/activate
+
+# Dezactivează virtual environment-ul
+deactivate
+```
+
+Te poți asigura că environment-ul este activat rulând comanda `which python`: dacă aceasta indică către virtual environment, atunci l-ai activat cu succes!
+
+```
+which python
+```
+
+```out
+/home/<user>/transformers-course/.env/bin/python
+```
+
+### Instalarea dependențelor[[instalarea-dependențelor]]
+
+La fel ca în secțiunea anterioară despre utilizarea instanțelor Google Colab, acum va trebui să instalezi pachetele necesare pentru a continua. Din nou, poți instala versiunea pentru development a 🤗 Transformers folosind managerul de pachete `pip`:
+
+```
+pip install "transformers[sentencepiece]"
+```
+
+Acum ești gata să începi!
\ No newline at end of file
diff --git a/chapters/rum/chapter7/1.mdx b/chapters/rum/chapter7/1.mdx
new file mode 100644
index 000000000..f55a782ab
--- /dev/null
+++ b/chapters/rum/chapter7/1.mdx
@@ -0,0 +1,38 @@
+<FrameworkSwitchCourse {fw} />
+
+# Introducere[[introduction]]
+
+<CourseFloatingBanner
+    chapter={7}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+În [Capitolul 3](/course/chapter3), ați văzut cum să faceți fine-tune unui model pentru clasificarea textului. În acest capitol, vom aborda următoarele sarcini NLP:
+
+- Clasificarea tokenilor
+- Masked language modeling (precum BERT)
+- Sumarizare
+- Traducere
+- Preantrenare pentru causal language modeling (precum GPT-2)
+- Răspunderea la întrebări
+
+{#if fw === 'pt'}
+
+Pentru a face acest lucru, va trebui să valorificați tot ceea ce ați învățat despre API-ul `Trainer` și biblioteca 🤗 Accelerate în [Capitolul 3](/course/chapter3), biblioteca 🤗 Datasets în [Capitolul 5](/course/chapter5) și biblioteca 🤗 Tokenizers în [Capitolul 6](/course/chapter6). De asemenea, vom încărca rezultatele noastre în Model Hub, așa cum am făcut în [Capitolul 4](/course/chapter4), astfel încât acesta este cu adevărat capitolul în care totul se unește!
+
+Fiecare secțiune poate fi citită independent și vă va arăta cum să antrenați un model cu API-ul `Trainer` sau cu propria buclă de antrenament, utilizând 🤗 Accelerate. Nu ezitați să săriți peste oricare dintre cele două părți și să vă concentrați pe cea care vă interesează cel mai mult: API-ul `Trainer` este excelent pentru fine-tuning sau antrenarea modelului vostru fără a vă face griji cu privire la ceea ce se întâmplă în spatele scenei, în timp ce bucla de antrenament cu `Accelerate` vă va permite să personalizați mai ușor orice parte doriți.
+
+{:else}
+
+Pentru a face acest lucru, va trebui să valorificați tot ceea ce ați învățat despre API-ul `Trainer` și biblioteca 🤗 Accelerate în [Capitolul 3](/course/chapter3), biblioteca 🤗 Datasets în [Capitolul 5](/course/chapter5) și biblioteca 🤗 Tokenizers în [Capitolul 6](/course/chapter6). De asemenea, vom încărca rezultatele noastre în Model Hub, așa cum am făcut în [Capitolul 4](/course/chapter4), astfel încât acesta este cu adevărat capitolul în care totul se unește!
+
+Fiecare secțiune poate fi citită independent.
+
+{/if}
+
+
+<Tip>
+
+Dacă citiți secțiunile în succesiune, veți observa că acestea au destul de mult cod și proză în comun. Repetarea este intenționată, pentru a vă permite să intrați (sau să reveniți mai târziu) la orice sarcină care vă interesează și să găsiți un exemplu.
+
+</Tip>
diff --git a/chapters/rum/chapter7/2.mdx b/chapters/rum/chapter7/2.mdx
new file mode 100644
index 000000000..108806a81
--- /dev/null
+++ b/chapters/rum/chapter7/2.mdx
@@ -0,0 +1,983 @@
+<FrameworkSwitchCourse {fw} />
+
+# Clasificarea tokenilor[[token-classification]]
+
+{#if fw === 'pt'}
+
+<CourseFloatingBanner chapter={7}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter7/section2_pt.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter7/section2_pt.ipynb"},
+]} />
+
+{:else}
+
+<CourseFloatingBanner chapter={7}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter7/section2_tf.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter7/section2_tf.ipynb"},
+]} />
+
+{/if}
+
+Prima aplicație pe care o vom explora este clasificarea tokenilor. Această sarcină generică cuprinde orice problemă care poate fi formulată ca "atribuirea unui label fiecărui token dintr-o propoziție", cum ar fi:
+
+- **Named entity recognition(NER)**: Găsirea entităților (cum ar fi persoane, locații sau organizații) într-o propoziție. Acest lucru poate fi formulat ca atribuirea unui label fiecărui token, având o clasă pentru fiecare entitate și o clasă pentru "nicio entitate".
+- **Part-of-speech tagging (POS)**: Marchează fiecare cuvânt dintr-o propoziție ca corespunzând unei anumite părți de vorbire (cum ar fi substantiv, verb, adjectiv etc.).
+- **Chunking**: Găsirea tokenilor care aparțin aceleiași entități. Această sarcină (care poate fi combinată cu POS sau NER) poate fi formulată ca atribuirea unui label (de obicei `B-`) tuturor tokenilor care se află la începutul unui chunk, a unui alt label (de obicei `I-`) la tokeni care se află în interiorul unui chunk și a unui al treilea label (de obicei `O`) la tokeni care nu aparțin niciunui chunk.
+
+<Youtube id="wVHdVlPScxA"/>
+
+Desigur, există multe alte tipuri de probleme de clasificare a tokenilor; acestea sunt doar câteva exemple reprezentative. În această secțiune, vom pune la punct un model (BERT) pe o sarcină NER, care va fi apoi capabil să calculeze predicții precum aceasta:
+
+<iframe src="https://course-demos-bert-finetuned-ner.hf.space" frameBorder="0" height="350" title="Gradio app" class="block dark:hidden container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
+
+<a class="flex justify-center" href="/huggingface-course/bert-finetuned-ner">
+<img class="block dark:hidden lg:w-3/5" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/model-eval-bert-finetuned-ner.png" alt="One-hot encoding labels pentru răspunderea la întrebări."/>
+<img class="hidden dark:block lg:w-3/5" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/model-eval-bert-finetuned-ner-dark.png" alt="One-hot encoded labels pentru răspunderea la întrebări."/>
+</a>
+
+Puteți găsi modelul pe care îl vom antrena și încărca în Hub și puteți verifica de două ori predicțiile sale [aici](https://huggingface.co/huggingface-course/bert-finetuned-ner?text=My+name+is+Sylvain+and+I+work+at+Hugging+Face+in+Brooklyn).
+
+## Pregătirea datelor[[preparing-the-data]]
+
+În primul rând, avem nevoie de un dataset adecvat pentru clasificarea simbolurilor. În această secțiune vom utiliza [datasetul CoNLL-2003] (https://huggingface.co/datasets/conll2003), care conține știri de la Reuters.
+
+<Tip>
+
+💡 Atât timp cât datasetul vostru constă în texte împărțite în cuvinte cu labelurile corespunzătoare, veți putea adapta procedurile de preprocesare a datelor descrise aici la propriul dataset. Consultați [Capitolul 5](/course/chapter5) dacă aveți nevoie de o recapitulare a modului de încărcare a propriilor date personalizate într-un `Dataset`.
+
+</Tip>
+
+### Datasetul CoNLL-2003 [[the-conll-2003-dataset]]
+
+Pentru a încărca dataetul CoNLL-2003, folosim metoda `load_dataset()` din biblioteca 🤗 Datasets:
+
+```py
+from datasets import load_dataset
+
+raw_datasets = load_dataset("conll2003")
+```
+
+Acest lucru va descărca și va stoca în cache datasetul, așa cum am văzut în [Capitolul 3](/course/chapter3) pentru setul de date GLUE MRPC. Inspectarea acestui obiect ne arată coloanele prezente și împărțirea între seturile de antrenare, validare și testare:
+
+```py
+raw_datasets
+```
+
+```python out
+DatasetDict({
+    train: Dataset({
+        features: ['chunk_tags', 'id', 'ner_tags', 'pos_tags', 'tokens'],
+        num_rows: 14041
+    })
+    validation: Dataset({
+        features: ['chunk_tags', 'id', 'ner_tags', 'pos_tags', 'tokens'],
+        num_rows: 3250
+    })
+    test: Dataset({
+        features: ['chunk_tags', 'id', 'ner_tags', 'pos_tags', 'tokens'],
+        num_rows: 3453
+    })
+})
+```
+
+În special, putem vedea că datasetul conține labeluri pentru cele trei sarcini pe care le-am menționat mai devreme: NER, POS și Chunking. O mare diferență față de alte datseturi este că textele de intrare nu sunt prezentate ca propoziții sau documente, ci ca liste de cuvinte (ultima coloană se numește `tokens`, dar conține cuvinte în sensul că acestea sunt inputuri pre-tokenizate care mai trebuie să treacă prin tokenizer pentru tokenizarea subcuvintelor).
+
+Să aruncăm o privire la primul element al setului de formare:
+
+```py
+raw_datasets["train"][0]["tokens"]
+```
+
+```python out
+['EU', 'rejects', 'German', 'call', 'to', 'boycott', 'British', 'lamb', '.']
+```
+
+Deoarece dorim să efectuăm named entity recognition, ne vom uita la etichetele NER:
+
+```py
+raw_datasets["train"][0]["ner_tags"]
+```
+
+```python out
+[3, 0, 7, 0, 0, 0, 7, 0, 0]
+```
+
+Acestea sunt labelurile ca numere întregi pregătite pentru antrenare, dar nu sunt neapărat utile atunci când dorim să inspectăm datele. La fel ca în cazul clasificării textului, putem accesa corespondența dintre aceste numere întregi și numele labelurilor consultând atributul `features` al datasetului nostru:
+
+```py
+ner_feature = raw_datasets["train"].features["ner_tags"]
+ner_feature
+```
+
+```python out
+Sequence(feature=ClassLabel(num_classes=9, names=['O', 'B-PER', 'I-PER', 'B-ORG', 'I-ORG', 'B-LOC', 'I-LOC', 'B-MISC', 'I-MISC'], names_file=None, id=None), length=-1, id=None)
+```
+
+Deci, această coloană conține elemente care sunt secvențe a `ClassLabel`. Tipul elementelor din secvență se află în atributul `feature` al acestei `ner_feature`, iar noi putem accesa lista de nume consultând atributul `names` al acelei `feature`:
+
+```py
+label_names = ner_feature.feature.names
+label_names
+```
+
+```python out
+['O', 'B-PER', 'I-PER', 'B-ORG', 'I-ORG', 'B-LOC', 'I-LOC', 'B-MISC', 'I-MISC']
+```
+
+Am văzut deja aceste labeluri atunci când am cercetat pipelineul `token-classification` în [Capitolul 6](/course/chapter6/3), dar pentru o reîmprospătare rapidă:
+
+- `O` înseamnă că cuvântul nu corespunde niciunei entități.
+- `B-PER`/`I-PER` înseamnă că cuvântul corespunde începutului/este în interiorul unei entități de tip *persoană*.
+- `B-ORG`/`I-ORG` înseamnă că cuvântul corespunde începutului/este în interiorul unei entități de tip *organizaționale*.
+- `B-LOC`/`I-LOC` înseamnă că cuvântul corespunde începutului/este în interiorul unei entități de tip  *locație*.
+- `B-MISC`/`I-MISC` înseamnă că cuvântul corespunde începutului/este în interiorul unei entități de tip *miscellaneous.
+
+Acum, decodificarea labelurilor pe care le-am văzut mai devreme ne dă următorul rezultat:
+
+```python
+words = raw_datasets["train"][0]["tokens"]
+labels = raw_datasets["train"][0]["ner_tags"]
+line1 = ""
+line2 = ""
+for word, label in zip(words, labels):
+    full_label = label_names[label]
+    max_length = max(len(word), len(full_label))
+    line1 += word + " " * (max_length - len(word) + 1)
+    line2 += full_label + " " * (max_length - len(full_label) + 1)
+
+print(line1)
+print(line2)
+```
+
+```python out
+'EU    rejects German call to boycott British lamb .'
+'B-ORG O       B-MISC O    O  O       B-MISC  O    O'
+```
+
+Și pentru un exemplu de amestecare a labelurilor `B-` și `I-`, iată ce ne oferă același cod pentru elementul din setul de antrenare de la indexul 4:
+
+```python out
+'Germany \'s representative to the European Union \'s veterinary committee Werner Zwingmann said on Wednesday consumers should buy sheepmeat from countries other than Britain until the scientific advice was clearer .'
+'B-LOC   O  O              O  O   B-ORG    I-ORG O  O          O         B-PER  I-PER     O    O  O         O         O      O   O         O    O         O     O    B-LOC   O     O   O          O      O   O       O'
+```
+
+După cum putem vedea, entităților care cuprind două cuvinte, precum "Uniunea Europeană" și "Werner Zwingmann", li se atribuie un label `B-` pentru primul cuvânt și un label `I-` pentru al doilea.
+
+<Tip>
+
+✏️ **E rândul tău!** Afișați aceleași două propoziții cu labelurile POS sau chunking.
+
+</Tip>
+
+### Procesarea datelor[[processing-the-data]]
+
+<Youtube id="iY2AZYdZAr0"/>
+
+Ca de obicei, textele noastre trebuie să fie convertite în ID-uri token înainte ca modelul să le poată înțelege. După cum am văzut în [Capitolul 6](/course/chapter6/), o mare diferență în cazul sarcinilor de clasificare a tokenilor este că avem inputuri pre-tokenizate. Din fericire, API-ul tokenizerului poate face față acestei situații destul de ușor; trebuie doar să avertizăm `tokenizerul` cu un indicator special.
+
+Pentru început, hai să creăm obiectul `tokenizer`. După cum am mai spus, vom utiliza un model BERT preantrenat, deci vom începe prin a descărca și a stoca în cache tokenizerul asociat:
+
+```python
+from transformers import AutoTokenizer
+
+model_checkpoint = "bert-base-cased"
+tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
+```
+
+Puteți înlocui `model_checkpoint` cu orice alt model preferat din [Hub](https://huggingface.co/models) sau cu un folder local în care ați salvat un model preantreant și un tokenizer. Singura constrângere este că tokenizerul trebuie să fie susținut de biblioteca 🤗 Tokenizers, pentru ca să existe o versiune "rapidă" disponibilă. Puteți vedea toate arhitecturile care vin cu o versiune rapidă în [acest tabel mare] (https://huggingface.co/transformers/#supported-frameworks), iar pentru a verifica dacă obiectul `tokenizer` pe care îl utilizați este într-adevăr susținut de 🤗 Tokenizers, vă puteți uita la atributul său `is_fast`:
+
+```py
+tokenizer.is_fast
+```
+
+```python out
+True
+```
+
+Pentru a tokeniza un input pre-tokenizat, putem utiliza `tokenizer` ca de obicei și să adăugăm `is_split_into_words=True`:
+
+```py
+inputs = tokenizer(raw_datasets["train"][0]["tokens"], is_split_into_words=True)
+inputs.tokens()
+```
+
+```python out
+['[CLS]', 'EU', 'rejects', 'German', 'call', 'to', 'boycott', 'British', 'la', '##mb', '.', '[SEP]']
+```
+
+După cum putem vedea, tokenizerul a adăugat tokenii speciali utilizați de model (`[CLS]` la început și `[SEP]` la sfârșit) și a lăsat majoritatea cuvintelor neatinse. Cu toate acestea, cuvântul `lamb` a fost tokenizat în două subcuvinte, `la` și `##mb`. Acest lucru introduce o neconcordanță între inputurile noastre și labeluri: lista de labeluri are doar 9 elemente, în timp ce inputurile noastre au acum 12 tokeni. Să luăm în considerare tokenii speciali este ușor (știm că sunt la început și la sfârșit), dar trebuie să ne asigurăm că aliniem toate labelurile cu cuvintele corespunzătoare.
+
+Din fericire, pentru că folosim un tokenizer rapid, avem acces la superputerile 🤗 Tokenizers, ceea ce înseamnă că putem mapa cu ușurință fiecare token la cuvântul corespunzător (după cum se vede în [Capitolul 6](/course/chapter6/3)):
+
+```py
+inputs.word_ids()
+```
+
+```python out
+[None, 0, 1, 2, 3, 4, 5, 6, 7, 7, 8, None]
+```
+
+Cu puțină muncă, putem apoi extinde lista de labeluri pentru a se potrivi cu tokenii. Prima regulă pe care o vom aplica este că tokenii special primesc un label `-100`. Acest lucru se datorează faptului că în mod implicit `-100` este un indice care este ignorat în funcția de pierdere pe care o vom utiliza (cross entropy). Apoi, fiecare token primește același label ca și tokenul care a inițiat cuvântul în care se află, deoarece fac parte din aceeași entitate. Pentru tokenii din interiorul unui cuvânt, dar care nu se află la început, înlocuim `B-` cu `I-` (deoarece tokenul nu începe entitatea):
+
+
+```python
+def align_labels_with_tokens(labels, word_ids):
+    new_labels = []
+    current_word = None
+    for word_id in word_ids:
+        if word_id != current_word:
+            # Start of a new word!
+            current_word = word_id
+            label = -100 if word_id is None else labels[word_id]
+            new_labels.append(label)
+        elif word_id is None:
+            # Special token
+            new_labels.append(-100)
+        else:
+            # Same word as previous token
+            label = labels[word_id]
+            # If the label is B-XXX we change it to I-XXX
+            if label % 2 == 1:
+                label += 1
+            new_labels.append(label)
+
+    return new_labels
+```
+
+Hai să îl încercăm cu prima noastră propoziție:
+
+```py
+labels = raw_datasets["train"][0]["ner_tags"]
+word_ids = inputs.word_ids()
+print(labels)
+print(align_labels_with_tokens(labels, word_ids))
+```
+
+```python out
+[3, 0, 7, 0, 0, 0, 7, 0, 0]
+[-100, 3, 0, 7, 0, 0, 0, 7, 0, 0, 0, -100]
+```
+
+După cum putem vedea, funcția noastră a adăugat `-100` pentru cei doi tokeni speciali de la început și de la sfârșit, și un nou `0` pentru cuvântul nostru care a fost împărțit în doi tokeni.
+
+<Tip>
+
+✏️ ** Rândul tău!** Unii cercetători preferă să atribuie un singur label pe cuvânt și să atribuie `-100` celorlalți subtokeni dintr-un cuvânt dat. Aceasta are loc pentru a evita ca cuvintele lungi care se împart în mai mulți subtokeni să contribuie puternic la pierdere. Modificați funcția anterioară pentru a alinia labelurile cu ID-urile de input urmând această regulă.
+
+</Tip>
+
+Pentru a preprocesa întregul nostru dataset, trebuie să tokenizăm toate inputurile și să aplicăm `align_labels_with_tokens()` pe toate labelurile. Pentru a profita de viteza tokenizerului nostru rapid, este mai bine să tokenizăm multe texte în același timp, așa că vom scrie o funcție care procesează o listă de exemple și vom folosi metoda `Dataset.map()` cu opțiunea `batched=True`. Singurul lucru diferit față de exemplul nostru anterior este că funcția `word_ids()` trebuie să obțină indexul exemplului din care dorim ID-urile cuvintelor atunci când inputurile către tokenizer sunt liste de texte (sau, în cazul nostru, liste de liste de cuvinte), așa că adăugăm și acest lucru:
+
+```py
+def tokenize_and_align_labels(examples):
+    tokenized_inputs = tokenizer(
+        examples["tokens"], truncation=True, is_split_into_words=True
+    )
+    all_labels = examples["ner_tags"]
+    new_labels = []
+    for i, labels in enumerate(all_labels):
+        word_ids = tokenized_inputs.word_ids(i)
+        new_labels.append(align_labels_with_tokens(labels, word_ids))
+
+    tokenized_inputs["labels"] = new_labels
+    return tokenized_inputs
+```
+
+Rețineți că nu am completat încă inputurile; vom face acest lucru mai târziu, atunci când vom crea batchurile cu un data collator.
+
+Acum putem aplica toate aceste preprocesări dintr-o dată celorlalte fracțiuni ale datasetului nostru:
+
+```py
+tokenized_datasets = raw_datasets.map(
+    tokenize_and_align_labels,
+    batched=True,
+    remove_columns=raw_datasets["train"].column_names,
+)
+```
+
+Am făcut partea cea mai grea! Acum, că datele au fost preprocesate, antrenarea efectivă va semăna mult cu ceea ce am făcut în [Capitolul 3](/course/chapter3).
+
+{#if fw === 'pt'}
+
+## Fine-tuningul modelului cu `Trainer` API[[fine-tuning-the-model-with-the-trainer-api]]
+
+Codul real care utilizează `Trainer` va fi același ca înainte; singurele modificări sunt modul în care datele sunt collated într-un batch și metric computation function.
+
+{:else}
+
+## Fine-tuningul modelului cu Keras[[fine-tuning-the-model-with-keras]]
+
+Codul real care utilizează `Keras` va fi același ca înainte; singurele modificări sunt modul în care datele sunt collated într-un batch și metric computation function.
+
+{/if}
+
+
+### Data collation[[data-collation]]
+
+Nu putem folosi doar un `DataCollatorWithPadding` ca în [Capitolul 3](/course/chapter3) deoarece acesta doar adaugă padding inputurilor(input IDs, attention mask, and token type IDs). Aici labelurile noastre ar trebui să fie padded exact în același mod ca și inputurile, astfel încât să rămână de aceeași dimensiune, folosind `-100` ca valoare, astfel încât predicțiile corespunzătoare să fie ignorate în calculul pierderilor.
+
+Toate acestea sunt realizate de un [`DataCollatorForTokenClassification`](https://huggingface.co/transformers/main_classes/data_collator.html#datacollatorfortokenclassification). La fel ca `DataCollatorWithPadding`, acesta ia `tokenizer`-ul folosit pentru preprocesarea inputurilor:
+
+{#if fw === 'pt'}
+
+```py
+from transformers import DataCollatorForTokenClassification
+
+data_collator = DataCollatorForTokenClassification(tokenizer=tokenizer)
+```
+
+{:else}
+
+```py
+from transformers import DataCollatorForTokenClassification
+
+data_collator = DataCollatorForTokenClassification(
+    tokenizer=tokenizer, return_tensors="tf"
+)
+```
+
+{/if}
+
+Pentru a testa acest lucru pe câteva sampleuri, îl putem apela doar pe o listă de exemple din setul nostru de antrenat tokenizat:
+
+```py
+batch = data_collator([tokenized_datasets["train"][i] for i in range(2)])
+batch["labels"]
+```
+
+```python out
+tensor([[-100,    3,    0,    7,    0,    0,    0,    7,    0,    0,    0, -100],
+        [-100,    1,    2, -100, -100, -100, -100, -100, -100, -100, -100, -100]])
+```
+
+Hai să comparăm acest lucru cu labelurile pentru primul și al doilea element din datasetul nostru:
+
+```py
+for i in range(2):
+    print(tokenized_datasets["train"][i]["labels"])
+```
+
+```python out
+[-100, 3, 0, 7, 0, 0, 0, 7, 0, 0, 0, -100]
+[-100, 1, 2, -100]
+```
+
+{#if fw === 'pt'}
+
+După cum se poate observa, al doilea set de labeluri a fost padded la lungimea primului folosind `-100`.
+
+{:else}
+
+Data collatorul nostru de date este gata de utilizare! Acum să îl folosim pentru a crea un `tf.data.Dataset` cu metoda `to_tf_dataset()`. De asemenea, puteți utiliza `model.prepare_tf_dataset()` pentru a face acest lucru cu un pic mai puțin cod repetitiv - veți vedea acest lucru în unele dintre celelalte secțiuni ale acestui capitol.
+
+```py
+tf_train_dataset = tokenized_datasets["train"].to_tf_dataset(
+    columns=["attention_mask", "input_ids", "labels", "token_type_ids"],
+    collate_fn=data_collator,
+    shuffle=True,
+    batch_size=16,
+)
+
+tf_eval_dataset = tokenized_datasets["validation"].to_tf_dataset(
+    columns=["attention_mask", "input_ids", "labels", "token_type_ids"],
+    collate_fn=data_collator,
+    shuffle=False,
+    batch_size=16,
+)
+```
+
+
+Următoarea oprire: modelul în sine.
+
+{/if}
+
+{#if fw === 'tf'}
+
+### Definirea modelului[[defining-the-model]]
+
+Deoarece lucrăm la o problemă de clasificare a tokenilor, vom utiliza clasa `TFAutoModelForTokenClassification`. Principalul lucru de care trebuie să ne amintim atunci când definim acest model este să transmitem informații privind numărul de labeluri pe care le avem. Cel mai simplu mod de a face acest lucru este să transmiteți acest număr cu argumentul `num_labels`, dar dacă dorim un inference widget frumos care să funcționeze ca cel pe care l-am văzut la începutul acestei secțiuni, este mai bine să setați în schimb corespondențele corecte ale labelurilor.
+
+Acestea ar trebui să fie stabilite de două dicționare, `id2label` și `label2id`, care conțin corespondența de la ID la label și viceversa:
+
+```py
+id2label = {i: label for i, label in enumerate(label_names)}
+label2id = {v: k for k, v in id2label.items()}
+``` 
+
+Acum putem să le transmitem metodei `TFAutoModelForTokenClassification.from_pretrained()`, iar acestea vor fi setate în configurația modelului, apoi salvate corespunzător și încărcate în Hub:
+
+```py
+from transformers import TFAutoModelForTokenClassification
+
+model = TFAutoModelForTokenClassification.from_pretrained(
+    model_checkpoint,
+    id2label=id2label,
+    label2id=label2id,
+)
+```
+
+La fel ca atunci când am definit `TFAutoModelForSequenceClassification` în [Capitolul 3](/course/chapter3), crearea modelului emite un avertisment că unele weights nu au fost utilizate (cele din headul de preantrenare) și că alte weights sunt inițializate aleatoriu (cele din headul de clasificare a tokenilor noi) și că acest model ar trebui să fie antrenat. Vom face acest lucru într-un minut, dar mai întâi să verificăm de două ori că modelul nostru are numărul corect de labeluri:
+
+```python
+model.config.num_labels
+```
+
+```python out
+9
+```
+
+<Tip warning={true}>
+
+⚠️ Dacă aveți un model cu un număr greșit de labeluri, veți primi o eroare obscură atunci când apelați `model.fit()` mai târziu. Acest lucru poate fi enervant pentru debbuging, așa că asigurați-vă că faceți această verificare pentru a confirma că aveți numărul așteptat de labeluri.
+
+</Tip>
+
+### Fine-tuningul modelului[[fine-tuning-the-model]]
+
+Acum suntem gata să ne antrenăm modelul! Totuși, mai avem doar câteva lucruri de făcut mai întâi: ar trebui să ne conectăm la Hugging Face și să definim hiperparametrii noștri de antrenare. Dacă lucrați într-un notebook, există o funcție convenabilă pentru a vă ajuta cu acest lucru:
+
+```python
+from huggingface_hub import notebook_login
+
+notebook_login()
+```
+
+Aceasta va afișa un widget în care puteți introduce datele tale de autentificare Hugging Face.
+
+Dacă nu lucrați într-un notebook, tastați următoarea linie în terminal:
+
+```bash
+huggingface-cli login
+```
+
+După autentificare, putem pregăti tot ce avem nevoie pentru a compila modelul nostru. 🤗 Transformers oferă o funcție convenabilă `create_optimizer()` care vă va oferi un optimizator `AdamW` cu setări adecvate pentru weight decay și learning rate decay, ambele îmbunătățind performanța modelului vsotru în comparație cu optimizatorul `Adam` încorporat:
+
+```python
+from transformers import create_optimizer
+import tensorflow as tf
+
+# Antrenarea în mixed-precision float16
+# Comentați această linie dacă utilizați un GPU care nu va beneficia de acest lucru
+tf.keras.mixed_precision.set_global_policy("mixed_float16")
+
+# Numărul de etape de antrenare este numărul de sampleuri din dataset, împărțit la dimensiunea batch-ului, apoi multiplicat
+# cu numărul total de epoci. Rețineți că tf_train_dataset de aici este un batched tf.data.Dataset,
+# nu este originalul Hugging Face Dataset, deci len() este deja num_samples // batch_size.
+num_epochs = 3
+num_train_steps = len(tf_train_dataset) * num_epochs
+
+optimizer, schedule = create_optimizer(
+    init_lr=2e-5,
+    num_warmup_steps=0,
+    num_train_steps=num_train_steps,
+    weight_decay_rate=0.01,
+)
+model.compile(optimizer=optimizer)
+```
+
+Rețineți, de asemenea, că nu furnizăm un argument `loss` la `compile()`. Acest lucru se datorează faptului că modelele pot calcula de fapt pierderea intern - dacă compilați fără o pierdere și furnizați labelurile în dicționarul de intrare (așa cum facem în dataseturile noastre), atunci modelul se va antrena folosind acea pierdere internă, care va fi adecvată pentru sarcina și tipul de model pe care le-ați ales.
+
+În continuare, definim un `PushToHubCallback` pentru a încărca modelul nostru în Hub în timpul antrenării și pentru a potrivi modelul cu acel callback:
+
+```python
+from transformers.keras_callbacks import PushToHubCallback
+
+callback = PushToHubCallback(output_dir="bert-finetuned-ner", tokenizer=tokenizer)
+
+model.fit(
+    tf_train_dataset,
+    validation_data=tf_eval_dataset,
+    callbacks=[callback],
+    epochs=num_epochs,
+)
+```
+
+Puteți specifica numele complet al repositoriului către care doriți să efectuați push cu argumentul `hub_model_id` (în special, va trebui să utilizați acest argument pentru a efectua push către o organizație). De exemplu, atunci când am trimis modelul către organizația [`huggingface-course`](https://huggingface.co/huggingface-course), am adăugat `hub_model_id="huggingface-course/bert-finetuned-ner"`. În mod implicit, repositoriul utilizat va fi în namespace-ul denumit după directory output pe care l-ați stabilit, de exemplu `"cool_huggingface_user/bert-finetuned-ner"`.
+
+<Tip>
+
+💡 Dacă directory output pe care îl utilizați există deja, acesta trebuie să fie o clonă locală a repositoriului către care doriți să faceți push. Dacă nu este, veți primi o eroare atunci când apelați `model.fit()` și va trebui să setați un nume nou.
+
+</Tip>
+
+Rețineți că, în timpul antrenamentului, de fiecare dată când modelul este salvat (aici, la fiecare epocă), acesta este încărcat pe Hub în fundal. În acest fel, veți putea să reluați formarea pe o altă mașină, dacă este necesar.
+
+În acest stadiu, puteți utiliza inference widget de pe Model Hub pentru a testa modelul vostru și pentru a-l partaja cu prietenii. Ați făcut fine-tune cu succes unui model pentru o sarcină de clasificare a tokenilor - felicitări! Dar cât de bun este modelul nostru, de fapt? Ar trebui să evaluăm anumiți parametri pentru a afla.
+
+{/if}
+
+
+### Metrici[[metrics]]
+
+{#if fw === 'pt'}
+
+Pentru ca `Trainer` să calculeze o metrică în fiecare epocă, va trebui să definim o funcție `compute_metrics()` care primește matricele de predicții și labelurile și returnează un dicționar cu numele și valorile metricilor.
+
+Frameworkul tradițional utilizat pentru a evalua predicția clasificării a tokenilor este [*seqeval*](https://github.com/chakki-works/seqeval). Pentru a utiliza această metrică, trebuie mai întâi să instalăm biblioteca *seqeval*:
+
+```py
+!pip install seqeval
+```
+
+Apoi îl putem încărca prin intermediul funcției `evaluate.load()` așa cum am făcut în [Capitolul 3](/course/chapter3):
+
+{:else}
+
+Frameworkul tradițional utilizat pentru a evalua predicția clasificării tokenilor este [*seqeval*](https://github.com/chakki-works/seqeval). Pentru a utiliza această metrică, trebuie mai întâi să instalăm biblioteca *seqeval*:
+
+```py
+!pip install seqeval
+```
+
+Apoi îl putem încărca prin intermediul funcției `evaluate.load()` așa cum am făcut în [Capitolul 3](/course/chapter3):
+
+{/if}
+
+```py
+import evaluate
+
+metric = evaluate.load("seqeval")
+```
+
+Această metrică nu se comportă ca precizia standard: de fapt, va lua listele de labeluri ca șiruri de caractere, nu ca numere întregi, deci va trebui să decodificăm complet predicțiile și labelurile înainte de a le trece în metrice. Să vedem cum funcționează. În primul rând, vom obține labelurile pentru primul nostru exemplu de antrenare:
+
+```py
+labels = raw_datasets["train"][0]["ner_tags"]
+labels = [label_names[i] for i in labels]
+labels
+```
+
+```python out
+['B-ORG', 'O', 'B-MISC', 'O', 'O', 'O', 'B-MISC', 'O', 'O']
+```
+
+Putem apoi crea predicții false pentru acestea prin simpla schimbare a valorii la indexul 2:
+
+```py
+predictions = labels.copy()
+predictions[2] = "O"
+metric.compute(predictions=[predictions], references=[labels])
+```
+
+Rețineți că metrica ia o listă de predicții (nu doar una) și o listă de labels. Iată rezultatul:
+
+```python out
+{'MISC': {'precision': 1.0, 'recall': 0.5, 'f1': 0.67, 'number': 2},
+ 'ORG': {'precision': 1.0, 'recall': 1.0, 'f1': 1.0, 'number': 1},
+ 'overall_precision': 1.0,
+ 'overall_recall': 0.67,
+ 'overall_f1': 0.8,
+ 'overall_accuracy': 0.89}
+```
+
+{#if fw === 'pt'}
+
+Acesta trimite înapoi o mulțime de informații! Noi obținem precizia, recallul și scorul F1 pentru fiecare entitate în parte, precum și scorul general. Pentru calculul nostru metric, vom păstra doar scorul global, dar nu ezitați să modificați funcția `compute_metrics()` pentru a returna toate metricile pe care doriți să le raportați.
+
+Această funcție `compute_metrics()` ia mai întâi argmaxul logiturilor pentru a le converti în predicții (ca de obicei, logiturile și probabilitățile sunt în aceeași ordine, deci nu trebuie să aplicăm softmaxul). Apoi trebuie să convertim atât labelurile, cât și predicțiile din numere întregi în șiruri de caractere. Eliminăm toate valorile în care labelul este `-100`, apoi transmitem rezultatele metodei `metric.compute()`:
+
+```py
+import numpy as np
+
+
+def compute_metrics(eval_preds):
+    logits, labels = eval_preds
+    predictions = np.argmax(logits, axis=-1)
+
+    # Remove ignored index (special tokens) and convert to labels
+    true_labels = [[label_names[l] for l in label if l != -100] for label in labels]
+    true_predictions = [
+        [label_names[p] for (p, l) in zip(prediction, label) if l != -100]
+        for prediction, label in zip(predictions, labels)
+    ]
+    all_metrics = metric.compute(predictions=true_predictions, references=true_labels)
+    return {
+        "precision": all_metrics["overall_precision"],
+        "recall": all_metrics["overall_recall"],
+        "f1": all_metrics["overall_f1"],
+        "accuracy": all_metrics["overall_accuracy"],
+    }
+```
+
+Acum că acest lucru este făcut, suntem aproape gata să definim `Trainer`-ul nostru. Avem nevoie doar de un `model` pentru a face fine-tune!
+
+{:else}
+
+Aceasta trimite înapoi o mulțime de informații! Obținem precizia, recallul și scorul F1 pentru fiecare entitate în parte, precum și în ansamblu. Acum să vedem ce se întâmplă dacă încercăm să folosim predicțiile modelului nostru real pentru a calcula niște scoruri reale.
+
+TensorFlow nu apreciază concatenarea predicțiilor noastre, deoarece acestea au lungimi de secvențe variabile. Aceasta înseamnă că nu putem folosi pur și simplu `model.predict()` - dar asta nu ne va opri. Vom obține unele predicții pe rând și le vom concatena într-o singură listă mare și lungă, eliminând simbolurile `-100` care indică mascarea/paddingul, apoi vom calcula metrici pe lista de la sfârșit:
+
+```py
+import numpy as np
+
+all_predictions = []
+all_labels = []
+for batch in tf_eval_dataset:
+    logits = model.predict_on_batch(batch)["logits"]
+    labels = batch["labels"]
+    predictions = np.argmax(logits, axis=-1)
+    for prediction, label in zip(predictions, labels):
+        for predicted_idx, label_idx in zip(prediction, label):
+            if label_idx == -100:
+                continue
+            all_predictions.append(label_names[predicted_idx])
+            all_labels.append(label_names[label_idx])
+metric.compute(predictions=[all_predictions], references=[all_labels])
+```
+
+
+```python out
+{'LOC': {'precision': 0.91, 'recall': 0.92, 'f1': 0.91, 'number': 1668},
+ 'MISC': {'precision': 0.70, 'recall': 0.79, 'f1': 0.74, 'number': 702},
+ 'ORG': {'precision': 0.85, 'recall': 0.90, 'f1': 0.88, 'number': 1661},
+ 'PER': {'precision': 0.95, 'recall': 0.95, 'f1': 0.95, 'number': 1617},
+ 'overall_precision': 0.87,
+ 'overall_recall': 0.91,
+ 'overall_f1': 0.89,
+ 'overall_accuracy': 0.97}
+```
+
+Cum s-a descurcat modelul tău, comparativ cu al nostru? Dacă ați obținut cifre similare, antrenarea a fost un succes!
+
+{/if}
+
+{#if fw === 'pt'}
+
+### Definirea modelului[[defining-the-model]]
+
+Deoarece lucrăm la o problemă de clasificare a tokenilor, vom utiliza clasa `AutoModelForTokenClassification`. Principalul lucru de care trebuie să ne amintim atunci când definim acest model este să transmitem informații privind numărul de labeluri pe care le avem. Cel mai simplu mod de a face acest lucru este să transmiteți acest număr cu argumentul `num_labels`, dar dacă dorim un inferencea widget frumos care să funcționeze ca cel pe care l-am văzut la începutul acestei secțiuni, este mai bine să setați în schimb corespondențele corecte ale labelurilor.
+
+Acestea ar trebui să fie stabilite de două dicționare, `id2label` și `label2id`, care conțin corespondențele de la ID la labeluri și viceversa:
+
+```py
+id2label = {i: label for i, label in enumerate(label_names)}
+label2id = {v: k for k, v in id2label.items()}
+```
+
+Acum putem doar să le transmitem metodei `AutoModelForTokenClassification.from_pretrained()`, iar acestea vor fi setate în configurația modelului și apoi salvate și încărcate corespunzător în Hub:
+
+```py
+from transformers import AutoModelForTokenClassification
+
+model = AutoModelForTokenClassification.from_pretrained(
+    model_checkpoint,
+    id2label=id2label,
+    label2id=label2id,
+)
+```
+
+La fel ca atunci când am definit `AutoModelForSequenceClassification` în [Capitolul 3](/course/chapter3), crearea modelului emite un avertisment că unele weights nu au fost utilizate (cele din headul de antrenare) și alte weights sunt inițializate aleatoriu (cele din headul de clasificare a tokenilor noi) și că acest model ar trebui să fie format. Vom face acest lucru într-un minut, dar mai întâi să verificăm de două ori că modelul nostru are numărul corect de labeluri:
+
+```python
+model.config.num_labels
+```
+
+```python out
+9
+```
+
+<Tip warning={true}>
+
+⚠️ Dacă aveți un model cu un număr greșit de labeluri, veți primi o eroare obscură atunci când apelați metoda `Trainer.train()` mai târziu (ceva de genul "CUDA error: device-side assert triggered"). Aceasta este cauza numărul unu a erorilor raportate de utilizatori pentru astfel de erori, așa că asigurați-vă că faceți această verificare pentru a confirma că aveți numărul de labeluri așteptat.
+
+</Tip>
+
+### Fine-tuningul modelului[[fine-tuning-the-model]]
+
+Acum suntem gata să ne antrenăm modelul! Trebuie doar să facem ultimele două lucruri înainte de a defini modelul nostru `Trainer`: să ne conectăm la Hugging Face și să definim argumentele de antrenare. Dacă lucrați într-un notebook, există o funcție convenabilă pentru a vă ajuta cu acest lucru:
+
+```python
+from huggingface_hub import notebook_login
+
+notebook_login()
+```
+
+Aceasta va afișa un widget în care puteți introduce datele tale de autentificare Hugging Face.
+
+Dacă nu lucrați într-un notebook, tastați următoarea linie în terminal:
+
+```bash
+huggingface-cli login
+```
+
+Odată făcut acest lucru, putem defini`TrainingArguments`:
+
+```python
+from transformers import TrainingArguments
+
+args = TrainingArguments(
+    "bert-finetuned-ner",
+    evaluation_strategy="epoch",
+    save_strategy="epoch",
+    learning_rate=2e-5,
+    num_train_epochs=3,
+    weight_decay=0.01,
+    push_to_hub=True,
+)
+```
+
+Ați mai văzut cele mai multe dintre acestea: stabilim niște hiperparametri (cum ar fi learning rate, numărul de epoci pentru care să ne antrenăm și weights decay) și specificăm `push_to_hub=True` pentru a indica faptul că dorim să salvăm modelul și să îl evaluăm la sfârșitul fiecărei epoci și că dorim să încărcăm rezultatele noastre în Model Hub. Rețineți că puteți specifica numele repositoriului către care doriți să faceți push cu argumentul `hub_model_id` (în special, va trebui să utilizați acest argument pentru a face push către o organizație). De exemplu, atunci când am trimis modelul către organizația [`huggingface-course`](https://huggingface.co/huggingface-course), am adăugat `hub_model_id="huggingface-course/bert-finetuned-ner"` la `TrainingArguments`. În mod implicit, repositoriul utilizat va fi în namespaceul tău și denumit după output directory-ul pe care l-ați setat, deci în cazul nostru va fi `"sgugger/bert-finetuned-ner"`.
+
+<Tip>
+
+💡 Dacă output directory-ul pe care îl utilizați există deja, acesta trebuie să fie o clonă locală a repositoriul către care doriți să faceți push. Dacă nu este așa, veți primi o eroare la definirea `Trainer` și va trebui să setați un nume nou.
+
+</Tip>
+
+În final, transmitem totul către `Trainer` și lansăm antrenarea:
+
+```python
+from transformers import Trainer
+
+trainer = Trainer(
+    model=model,
+    args=args,
+    train_dataset=tokenized_datasets["train"],
+    eval_dataset=tokenized_datasets["validation"],
+    data_collator=data_collator,
+    compute_metrics=compute_metrics,
+    tokenizer=tokenizer,
+)
+trainer.train()
+```
+
+Rețineți că, în timpul antrenării, de fiecare dată când modelul este salvat (aici, la fiecare epocă), acesta este încărcat pe Hub în fundal. În acest fel, veți putea să reluați antrenareape o altă mașină, dacă este necesar.
+
+Odată ce antrenamentul este complet, folosim metoda `push_to_hub()` pentru a ne asigura că încărcăm cea mai recentă versiune a modelului:
+
+```py
+trainer.push_to_hub(commit_message="Training complete")
+```
+
+Această comandă returnează URL-ul comitului pe care tocmai l-ai făcut, dacă doriți să o inspectați:
+
+```python out
+'https://huggingface.co/sgugger/bert-finetuned-ner/commit/26ab21e5b1568f9afeccdaed2d8715f571d786ed'
+```
+
+De asemenea, `Trainer` redactează un model card cu toate rezultatele evaluării și o încarcă. În acest stadiu, puteți utiliza inference widgetul de pe Model Hub pentru a testa modelul și a-l partaja cu prietenii. Ați făcut fine-tune cu succes un model pentru o sarcină de clasificare a tokenilor - felicitări!
+
+Dacă doriți să vă scufundați puțin mai profund în bucla de antrenare, vă vom arăta acum cum să faceți același lucru utilizând 🤗 Accelerate.
+
+## Un training loop personalizat[[a-custom-training-loop]]
+
+Să aruncăm acum o privire la training loopul complet, astfel încât să puteți personaliza cu ușurință părțile de care aveți nevoie. Va semăna foarte mult cu ceea ce am făcut în [Capitolul 3](/course/chapter3/4), cu câteva modificări pentru evaluare.
+
+### Pregătiți totul pentru antrenare[[preparing-everything-for-training]]
+
+Mai întâi trebuie să construim `DataLoader`s din dataseturile noastre. Vom reutiliza `data_collator` ca un `collate_fn` și vom amesteca setul de antrenare, dar nu și setul de validare:
+
+```py
+from torch.utils.data import DataLoader
+
+train_dataloader = DataLoader(
+    tokenized_datasets["train"],
+    shuffle=True,
+    collate_fn=data_collator,
+    batch_size=8,
+)
+eval_dataloader = DataLoader(
+    tokenized_datasets["validation"], collate_fn=data_collator, batch_size=8
+)
+```
+
+În continuare, reinstanțiem modelul, pentru a ne asigura că nu continuăm fine-tuningul de dinainte, ci pornim din nou de la modelul preantrenat BERT:
+
+```py
+model = AutoModelForTokenClassification.from_pretrained(
+    model_checkpoint,
+    id2label=id2label,
+    label2id=label2id,
+)
+```
+
+Atunci vom avea nevoie de un optimizator. Vom folosi clasicul `AdamW`, care este ca `Adam`, dar cu o corecție în modul în care se aplică weight decay-ul:
+
+```py
+from torch.optim import AdamW
+
+optimizer = AdamW(model.parameters(), lr=2e-5)
+```
+
+Odată ce avem toate aceste obiecte, le putem trimite la metoda `accelerator.prepare()`:
+
+```py
+from accelerate import Accelerator
+
+accelerator = Accelerator()
+model, optimizer, train_dataloader, eval_dataloader = accelerator.prepare(
+    model, optimizer, train_dataloader, eval_dataloader
+)
+```
+
+<Tip>
+
+🚨 Dacă vă antrenați pe un TPU, va trebui să mutați tot codul începând de la celula de mai sus într-o funcție de antrenament dedicată. Consultați [Capitolul 3](/course/chapter3) pentru mai multe detalii.
+
+</Tip>
+
+Acum că am trimis `train_dataloader` la `accelerator.prepare()`, putem utiliza lungimea acestuia pentru a calcula numărul de pași de antrenare. Rețineți că ar trebui să facem întotdeauna acest lucru după ce pregătim dataloaderul, deoarece această metodă îi va modifica lungimea. Utilizăm un classic liner schedule de la rata de învățare la 0:
+
+```py
+from transformers import get_scheduler
+
+num_train_epochs = 3
+num_update_steps_per_epoch = len(train_dataloader)
+num_training_steps = num_train_epochs * num_update_steps_per_epoch
+
+lr_scheduler = get_scheduler(
+    "linear",
+    optimizer=optimizer,
+    num_warmup_steps=0,
+    num_training_steps=num_training_steps,
+)
+```
+
+În cele din urmă, pentru a trimite modelul nostru către Hub, va trebui să creăm un obiect `Repository` într-un folder de lucru. În primul rând, conectați-vă la Hugging Face, dacă nu sunteți deja conectat. Vom determina numele repositoriului pornind de la ID-ul modelului pe care dorim să îl dăm modelului nostru (nu ezitați să înlocuiți `repo_name` cu propriul nume; trebuie doar să conțină numele vostru de utilizator, ceea ce face funcția `get_full_repo_name()`):
+
+```py
+from huggingface_hub import Repository, get_full_repo_name
+
+model_name = "bert-finetuned-ner-accelerate"
+repo_name = get_full_repo_name(model_name)
+repo_name
+```
+
+```python out
+'sgugger/bert-finetuned-ner-accelerate'
+```
+
+Apoi putem clona acel repositoriu într-un folder local. Dacă există deja, acest folder local ar trebui să fie o clonă existentă a repositoriului cu care lucrăm:
+
+```py
+output_dir = "bert-finetuned-ner-accelerate"
+repo = Repository(output_dir, clone_from=repo_name)
+```
+
+Acum putem încărca orice salvăm în `output_dir` prin apelarea metodei `repo.push_to_hub()`. Acest lucru ne va ajuta să încărcăm modelele intermediare la sfârșitul fiecărei epoci.
+
+### Loopul de antrenare[[training-loop]]
+
+Acum suntem pregătiți să scriem bucla de antrenare completă. Pentru a simplifica partea sa de evaluare, definim funcția `postprocess()` care preia predicțiile și labelurile și le convertește în liste de șiruri de caractere, așa cum se așteaptă obiectul nostru `metric`:
+
+```py
+def postprocess(predictions, labels):
+    predictions = predictions.detach().cpu().clone().numpy()
+    labels = labels.detach().cpu().clone().numpy()
+
+    # Remove ignored index (special tokens) and convert to labels
+    true_labels = [[label_names[l] for l in label if l != -100] for label in labels]
+    true_predictions = [
+        [label_names[p] for (p, l) in zip(prediction, label) if l != -100]
+        for prediction, label in zip(predictions, labels)
+    ]
+    return true_labels, true_predictions
+```
+
+Apoi putem scrie bucla de antrenare. După definirea unei bare de progres pentru a urmări modul în care decurge antrenarea, bucla are trei părți:
+
+- Antrenarea în sine, care este iterația clasică peste `train_dataloader`, trecerea înainte prin model, apoi trecerea înapoi și pasul optimizatorului.
+- Evaluarea, în care există o noutate după obținerea outputurilor modelului nostru pe un batch: din moment ce două procese pot ar fi putut face padding inputurilor și labelurile la forme diferite, trebuie să folosim `accelerator.pad_across_processes()` pentru a face predicțiile și labelurile să aibă aceeași formă înainte de a apela metoda `gather()`. Dacă nu facem acest lucru, evaluarea va da eroare sau se va bloca pentru totdeauna. Apoi trimitem rezultatele la `metric.add_batch()` și apelăm `metric.compute()` odată ce bucla de evaluare s-a încheiat.
+- Salvarea și încărcarea, unde mai întâi salvăm modelul și tokenizerul, apoi apelăm `repo.push_to_hub()`. Observați că folosim argumentul `blocking=False` pentru a spune bibliotecii 🤗 Hub să efectueze push-ul într-un proces asincron. În acest fel, antrenamentul continuă normal, iar această instrucțiune (lungă) este executată în fundal.
+
+Iată codul complet pentru bucla de antrenare:
+
+```py
+from tqdm.auto import tqdm
+import torch
+
+progress_bar = tqdm(range(num_training_steps))
+
+for epoch in range(num_train_epochs):
+    # Training
+    model.train()
+    for batch in train_dataloader:
+        outputs = model(**batch)
+        loss = outputs.loss
+        accelerator.backward(loss)
+
+        optimizer.step()
+        lr_scheduler.step()
+        optimizer.zero_grad()
+        progress_bar.update(1)
+
+    # Evaluation
+    model.eval()
+    for batch in eval_dataloader:
+        with torch.no_grad():
+            outputs = model(**batch)
+
+        predictions = outputs.logits.argmax(dim=-1)
+        labels = batch["labels"]
+
+        # Necessary to pad predictions and labels for being gathered
+        predictions = accelerator.pad_across_processes(predictions, dim=1, pad_index=-100)
+        labels = accelerator.pad_across_processes(labels, dim=1, pad_index=-100)
+
+        predictions_gathered = accelerator.gather(predictions)
+        labels_gathered = accelerator.gather(labels)
+
+        true_predictions, true_labels = postprocess(predictions_gathered, labels_gathered)
+        metric.add_batch(predictions=true_predictions, references=true_labels)
+
+    results = metric.compute()
+    print(
+        f"epoch {epoch}:",
+        {
+            key: results[f"overall_{key}"]
+            for key in ["precision", "recall", "f1", "accuracy"]
+        },
+    )
+
+    # Save and upload
+    accelerator.wait_for_everyone()
+    unwrapped_model = accelerator.unwrap_model(model)
+    unwrapped_model.save_pretrained(output_dir, save_function=accelerator.save)
+    if accelerator.is_main_process:
+        tokenizer.save_pretrained(output_dir)
+        repo.push_to_hub(
+            commit_message=f"Training in progress epoch {epoch}", blocking=False
+        )
+```
+
+În cazul în care este prima dată când vedeți un model salvat cu 🤗 Accelerate, să ne oprim puțin pentru a inspecta cele trei linii de cod care îl însoțesc:
+
+```py
+accelerator.wait_for_everyone()
+unwrapped_model = accelerator.unwrap_model(model)
+unwrapped_model.save_pretrained(output_dir, save_function=accelerator.save)
+```
+
+Prima linie se explică de la sine: aceasta spune tuturor proceselor să aștepte până când toată lumea se află în etapa respectivă înainte de a continua. Acest lucru are rolul de a ne asigura că avem același model în fiecare proces înainte de a salva. Apoi luăm `unwrapped_model`, care este modelul de bază pe care l-am definit. Metoda `accelerator.prepare()` modifică modelul pentru a funcționa în antrenarea distribuită, deci nu va mai avea metoda `save_pretrained()`; metoda `accelerator.unwrap_model()` anulează acest pas. În cele din urmă, apelăm metoda `save_pretrained()`, dar îi spunem să folosească metoda `accelerator.save()` în loc de `torch.save()`.
+
+Odată făcut acest lucru, ar trebui să aveți un model care produce rezultate destul de asemănătoare cu cel antrenat cu `Trainer`. Puteți verifica modelul pe care l-am antrenat folosind acest cod la [*huggingface-course/bert-finetuned-ner-accelerate*] (https://huggingface.co/huggingface-course/bert-finetuned-ner-accelerate). Și dacă doriți să testați orice modificări ale buclei de antrenare, le puteți implementa direct prin editarea codului prezentat mai sus!
+
+
+{/if}
+
+## Utilizarea model fine-tuned[[using-the-fine-tuned-model]]
+
+V-am arătat deja cum puteți utiliza modelul pe care l-am ajustat pe Model Hub cu inference widget. Pentru a-l utiliza la nivel local într-un `pipeline`, trebuie doar să specificați identificatorul de model corespunzător:
+
+```py
+from transformers import pipeline
+
+# Replace this with your own checkpoint
+model_checkpoint = "huggingface-course/bert-finetuned-ner"
+token_classifier = pipeline(
+    "token-classification", model=model_checkpoint, aggregation_strategy="simple"
+)
+token_classifier("My name is Sylvain and I work at Hugging Face in Brooklyn.")
+```
+
+```python out
+[{'entity_group': 'PER', 'score': 0.9988506, 'word': 'Sylvain', 'start': 11, 'end': 18},
+ {'entity_group': 'ORG', 'score': 0.9647625, 'word': 'Hugging Face', 'start': 33, 'end': 45},
+ {'entity_group': 'LOC', 'score': 0.9986118, 'word': 'Brooklyn', 'start': 49, 'end': 57}]
+```
+
+Grozav! Modelul nostru funcționează la fel de bine ca cel implicit pentru aceast pipeline!
\ No newline at end of file
diff --git a/chapters/rum/chapter7/3.mdx b/chapters/rum/chapter7/3.mdx
new file mode 100644
index 000000000..a10df56ca
--- /dev/null
+++ b/chapters/rum/chapter7/3.mdx
@@ -0,0 +1,1043 @@
+<FrameworkSwitchCourse {fw} />
+
+# Fine-tuningul la un masked language model[[fine-tuning-a-masked-language-model]]
+
+{#if fw === 'pt'}
+
+<CourseFloatingBanner chapter={7}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter7/section3_pt.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter7/section3_pt.ipynb"},
+]} />
+
+{:else}
+
+<CourseFloatingBanner chapter={7}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter7/section3_tf.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter7/section3_tf.ipynb"},
+]} />
+
+{/if}
+
+Pentru multe aplicații NLP care implică modele Transformer, puteți lua pur și simplu un model preantrenat de pe Hugging Face Hub și să îl faceți fine-tune direct pe datele voastre pentru sarcina dată. Cu condiția că corpusul utilizat pentru preantrenare să nu fie prea diferit de corpusul utilizat pentru fine-tuning, învățarea prin transfer va produce de obicei rezultate bune.
+
+Cu toate acestea, există câteva cazuri în care veți dori să faceți fine-tune mai întâi modelelor lingvistice pe datele voastre, înainte de a antrena un head specific sarcinii. De exemplu, dacă datasetul vostru conține contracte juridice sau articole științifice, un model Transformer obișnuit, precum BERT, va trata de obicei cuvintele specifice domeniului din corpus ca pe niște tokeni rari, iar performanța rezultată poate fi mai puțin satisfăcătoare. Prin fine-tuningul  modelului lingvistic pe baza datelor din domeniu, puteți crește performanța multor sarcini, ceea ce înseamnă că, de obicei, trebuie să efectuați acest pas o singură dată!
+
+Acest proces de fine-tuning a unui model lingvistic preantrenat pe date din domeniu se numește de obicei _adaptare la domeniu_. Acesta a fost popularizat în 2018 de [ULMFiT](https://arxiv.org/abs/1801.06146), care a fost una dintre primele arhitecturi neuronale (bazate pe LSTM-uri) care a făcut ca învățarea prin transfer să funcționeze cu adevărat pentru NLP. Un exemplu de adaptare la domeniu cu ULMFiT este prezentat în imaginea de mai jos; în această secțiune vom face ceva similar, dar cu un Transformer în loc de un LSTM!
+
+<div class="flex justify-center">
+<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/ulmfit.svg" alt="ULMFiT."/>
+<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/ulmfit-dark.svg" alt="ULMFiT."/>
+</div>
+
+Până la sfârșitul acestei secțiuni, veți avea un [model de limbaj mascat](https://huggingface.co/huggingface-course/distilbert-base-uncased-finetuned-imdb?text=This+is+a+great+%5BMASK%5D.) pe Hub, care poate completa automat propoziții, după cum se poate vedea mai jos:
+
+<iframe src="https://course-demos-distilbert-base-uncased-finetuned-imdb.hf.space" frameBorder="0" height="300" title="Gradio app" class="block dark:hidden container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
+
+Hai să începem!
+
+<Youtube id="mqElG5QJWUg"/>
+
+<Tip>
+
+🙋 Dacă termenii "masked language modeling" și "pretrained model" nu vă sună familiar, mergeți să verificați [Capitolul 1](/course/chapter1), unde vă explicăm toate aceste concepte de bază, cu videoclipuri!
+
+</Tip>
+
+## Alegerea unui model preantrenat pentru masked language modeling[[picking-a-pretrained-model-for-masked-language-modeling]]
+
+Pentru a începe, să alegem un model preantrenat adecvat pentru modelarea limbajului mascat. După cum se vede în următoarea captură de ecran, puteți găsi o listă de candidați prin aplicarea filtrului "Fill-Mask" pe [Hugging Face Hub](https://huggingface.co/models?pipeline_tag=fill-mask&sort=downloads):
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/mlm-models.png" alt="Hub models." width="80%"/>
+</div>
+
+Deși modelele din familia BERT și RoBERTa sunt cele mai descărcate, vom utiliza un model numit [DistilBERT](https://huggingface.co/distilbert-base-uncased)
+care poate fi antrenat mult mai rapid, cu o pierdere mică sau nulă a performanței în aval. Acest model a fost antrenat folosind o tehnică specială numită [_knowledge distillation_](https://en.wikipedia.org/wiki/Knowledge_distillation), în care un "model profesor" mare, precum BERT, este folosit pentru a ghida antrenarea unui "model elev" care are mult mai puțini parametrii. O explicație a detaliilor privind distilarea cunoștințelor ne-ar duce prea departe în această secțiune, dar dacă ești interesat, poți citi totul despre aceasta în [_Natural Language Processing with Transformers_](https://www.oreilly.com/library/view/natural-language-processing/9781098136789/) (cunoscut sub numele colocvial de Transformers textbooks).
+
+{#if fw === 'pt'}
+
+Să continuăm și să descărcăm modelul DistilBERT folosind clasa `AutoModelForMaskedLM`:
+
+```python
+from transformers import AutoModelForMaskedLM
+
+model_checkpoint = "distilbert-base-uncased"
+model = AutoModelForMaskedLM.from_pretrained(model_checkpoint)
+```
+
+Putem vedea câți parametri are acest model prin apelarea metodei `num_parameters()`:
+
+```python
+distilbert_num_parameters = model.num_parameters() / 1_000_000
+print(f"'>>> DistilBERT number of parameters: {round(distilbert_num_parameters)}M'")
+print(f"'>>> BERT number of parameters: 110M'")
+```
+
+```python out
+'>>> DistilBERT number of parameters: 67M'
+'>>> BERT number of parameters: 110M'
+```
+
+{:else}
+
+Să continuăm și să descărcăm modelul DistilBERT folosind clasa `TFAutoModelForMaskedLM`:
+
+```python
+from transformers import TFAutoModelForMaskedLM
+
+model_checkpoint = "distilbert-base-uncased"
+model = TFAutoModelForMaskedLM.from_pretrained(model_checkpoint)
+```
+
+Putem vedea câți parametri are acest model prin apelarea metodei `summary()`:
+
+```python
+model.summary()
+```
+
+```python out
+Model: "tf_distil_bert_for_masked_lm"
+_________________________________________________________________
+Layer (type)                 Output Shape              Param #   
+=================================================================
+distilbert (TFDistilBertMain multiple                  66362880  
+_________________________________________________________________
+vocab_transform (Dense)      multiple                  590592    
+_________________________________________________________________
+vocab_layer_norm (LayerNorma multiple                  1536      
+_________________________________________________________________
+vocab_projector (TFDistilBer multiple                  23866170  
+=================================================================
+Total params: 66,985,530
+Trainable params: 66,985,530
+Non-trainable params: 0
+_________________________________________________________________
+```
+
+{/if}
+
+Cu aproximativ 67 de milioane de parametri, DistilBERT este de aproximativ două ori mai mic decât modelul de bază BERT, ceea ce se traduce aproximativ printr-o creștere de două ori a vitezei de antrenare - super! Să vedem acum ce tipuri de tokeni prezice acest model ca fiind cele mai probabile completări ale unui mic sample de text:
+
+```python
+text = "This is a great [MASK]."
+```
+
+Ca oameni, ne putem imagina multe posibilități pentru tokenul `[MASK]`, cum ar fi "day", "ride" sau "painting". Pentru modelele preantrenate, predicțiile depind de corpusul pe care modelul a fost antrenat, deoarece acesta învață să detecteze tiparele statistice prezente în date. La fel ca BERT, DistilBERT a fost preantrenat pe dataseturile [English Wikipedia](https://huggingface.co/datasets/wikipedia) și [BookCorpus](https://huggingface.co/datasets/bookcorpus), astfel încât ne așteptăm ca predicțiile pentru `[MASK]` să reflecte aceste domenii. Pentru a prezice masca, avem nevoie de tokenizerul DistilBERT pentru a produce inputurile pentru model, deci hai să-l descărcăm și pe acesta din Hub:
+
+```python
+from transformers import AutoTokenizer
+
+tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
+```
+
+Cu un tokenizer și un model, putem acum să transmitem exemplul nostru de text modelului, să extragem logiturile și să tipărim primii 5 candidați:
+
+{#if fw === 'pt'}
+
+```python
+import torch
+
+inputs = tokenizer(text, return_tensors="pt")
+token_logits = model(**inputs).logits
+# Find the location of [MASK] and extract its logits
+mask_token_index = torch.where(inputs["input_ids"] == tokenizer.mask_token_id)[1]
+mask_token_logits = token_logits[0, mask_token_index, :]
+# Pick the [MASK] candidates with the highest logits
+top_5_tokens = torch.topk(mask_token_logits, 5, dim=1).indices[0].tolist()
+
+for token in top_5_tokens:
+    print(f"'>>> {text.replace(tokenizer.mask_token, tokenizer.decode([token]))}'")
+```
+
+{:else}
+
+```python
+import numpy as np
+import tensorflow as tf
+
+inputs = tokenizer(text, return_tensors="np")
+token_logits = model(**inputs).logits
+# Find the location of [MASK] and extract its logits
+mask_token_index = np.argwhere(inputs["input_ids"] == tokenizer.mask_token_id)[0, 1]
+mask_token_logits = token_logits[0, mask_token_index, :]
+# Pick the [MASK] candidates with the highest logits
+# We negate the array before argsort to get the largest, not the smallest, logits
+top_5_tokens = np.argsort(-mask_token_logits)[:5].tolist()
+
+for token in top_5_tokens:
+    print(f">>> {text.replace(tokenizer.mask_token, tokenizer.decode([token]))}")
+```
+
+{/if}
+
+```python out
+'>>> This is a great deal.'
+'>>> This is a great success.'
+'>>> This is a great adventure.'
+'>>> This is a great idea.'
+'>>> This is a great feat.'
+```
+Putem vedea din rezultate că predicțiile modelului se referă la termeni din viața de zi cu zi, ceea ce poate că nu este surprinzător având în vedere fundamentul Wikipedia în limba engleză. Să vedem cum putem schimba acest domeniu în ceva puțin mai nișat - recenzii de filme foarte polarizate!
+
+
+## Datasetul[[the-dataset]]
+
+Pentru a prezenta adaptarea la domeniu, vom utiliza faimosul [Large Movie Review Dataset] (https://huggingface.co/datasets/imdb) (sau IMDb pe scurt), care este un corpus de recenzii de filme care este adesea utilizat pentru a evalua modelele de analiză a sentimentelor. Prin fine-tuningul aplicat asupra DistilBERT pe acest corpus, ne așteptăm ca modelul de limbaj să își adapteze vocabularul de la datele factuale din Wikipedia pe care a fost antrenat în prealabil la elementele mai subiective ale recenziilor de film. Putem obține datele din Hugging Face Hub cu funcția `load_dataset()` din 🤗 Datasets:
+
+```python
+from datasets import load_dataset
+
+imdb_dataset = load_dataset("imdb")
+imdb_dataset
+```
+
+```python out
+DatasetDict({
+    train: Dataset({
+        features: ['text', 'label'],
+        num_rows: 25000
+    })
+    test: Dataset({
+        features: ['text', 'label'],
+        num_rows: 25000
+    })
+    unsupervised: Dataset({
+        features: ['text', 'label'],
+        num_rows: 50000
+    })
+})
+```
+
+Putem vedea că segmentele `train` și `test` conțin fiecare 25.000 de recenzii, în timp ce există un segment fără label numită `unsupervised` care conține 50.000 de recenzii. Să aruncăm o privire la câteva sampleuri pentru a ne face o idee despre tipul de text cu care avem de-a face. Așa cum am făcut în capitolele anterioare ale cursului, vom combina funcțiile `Dataset.shuffle()` și `Dataset.select()` pentru a crea un sample aleatoriu:
+
+```python
+sample = imdb_dataset["train"].shuffle(seed=42).select(range(3))
+
+for row in sample:
+    print(f"\n'>>> Review: {row['text']}'")
+    print(f"'>>> Label: {row['label']}'")
+```
+
+```python out
+
+'>>> Review: This is your typical Priyadarshan movie--a bunch of loony characters out on some silly mission. His signature climax has the entire cast of the film coming together and fighting each other in some crazy moshpit over hidden money. Whether it is a winning lottery ticket in Malamaal Weekly, black money in Hera Pheri, "kodokoo" in Phir Hera Pheri, etc., etc., the director is becoming ridiculously predictable. Don\'t get me wrong; as clichéd and preposterous his movies may be, I usually end up enjoying the comedy. However, in most his previous movies there has actually been some good humor, (Hungama and Hera Pheri being noteworthy ones). Now, the hilarity of his films is fading as he is using the same formula over and over again.<br /><br />Songs are good. Tanushree Datta looks awesome. Rajpal Yadav is irritating, and Tusshar is not a whole lot better. Kunal Khemu is OK, and Sharman Joshi is the best.'
+'>>> Label: 0'
+
+'>>> Review: Okay, the story makes no sense, the characters lack any dimensionally, the best dialogue is ad-libs about the low quality of movie, the cinematography is dismal, and only editing saves a bit of the muddle, but Sam" Peckinpah directed the film. Somehow, his direction is not enough. For those who appreciate Peckinpah and his great work, this movie is a disappointment. Even a great cast cannot redeem the time the viewer wastes with this minimal effort.<br /><br />The proper response to the movie is the contempt that the director San Peckinpah, James Caan, Robert Duvall, Burt Young, Bo Hopkins, Arthur Hill, and even Gig Young bring to their work. Watch the great Peckinpah films. Skip this mess.'
+'>>> Label: 0'
+
+'>>> Review: I saw this movie at the theaters when I was about 6 or 7 years old. I loved it then, and have recently come to own a VHS version. <br /><br />My 4 and 6 year old children love this movie and have been asking again and again to watch it. <br /><br />I have enjoyed watching it again too. Though I have to admit it is not as good on a little TV.<br /><br />I do not have older children so I do not know what they would think of it. <br /><br />The songs are very cute. My daughter keeps singing them over and over.<br /><br />Hope this helps.'
+'>>> Label: 1'
+```
+
+Da, acestea sunt cu siguranță recenzii de film și, dacă sunteți suficient de bătrâni, ați putea chiar înțelege comentariul din ultima recenzie despre deținerea unei versiuni VHS 😜! Deși nu vom avea nevoie de labeluri pentru modelarea limbajului, putem vedea deja că un `0` denotă o recenzie negativă, în timp ce un `1` corespunde uneia pozitive.
+
+<Tip>
+
+✏️ **Încearcă!** Creați un sample aleatoriu din segmentul `unsupervised` și verificați că labelurile nu sunt nici `0`, nici `1`. În același timp, ați putea verifica și dacă labelurile din segmentele `train` și `test` sunt într-adevăr `0` sau `1` - aceasta este o verificare utilă pe care orice practicant NLP ar trebui să o efectueze la începutul unui nou proiect!
+
+</Tip>
+
+Acum că am aruncat o privire rapidă asupra datelor, să ne apucăm să le pregătim pentru modelarea limbajului mascat. După cum vom vedea, există câteva etape suplimentare pe care trebuie să le parcurgem în comparație cu sarcinile de clasificare a secvențelor pe care le-am văzut în [Capitolul 3](/course/chapter3). Să începem!
+
+## Preprocesarea datelor[[preprocessing-the-data]]
+
+<Youtube id="8PmhEIXhBvI"/>
+
+Atât pentru auto-regressive cât și pentru masked language modeling, un pas comun de preprocesare este concatenarea tuturor exemplelor și apoi împărțirea întregului corpus în bucăți de dimensiuni egale. Acest lucru este destul de diferit de abordarea noastră obișnuită, în care pur și simplu tokenizăm exemplele individuale. De ce să concatenăm totul împreună? Motivul este că exemplele individuale ar putea fi trunchiate dacă sunt prea lungi, ceea ce ar duce la pierderea de informații care ar putea fi utile pentru sarcina de modelare a limbajului!
+
+Deci, pentru a începe, vom tokeniza mai întâi corpusul nostru ca de obicei, dar _fără_ a seta opțiunea `truncation=True` în tokenizerul nostru. De asemenea, vom prelua ID-urile cuvintelor dacă acestea sunt disponibile (ceea ce va fi cazul dacă folosim un tokenizer rapid, așa cum este descris în [Capitolul 6](/course/chapter6/3)), deoarece vom avea nevoie de ele mai târziu pentru a face mascarea întregului cuvânt. Vom include acest lucru într-o funcție simplă și, în același timp, vom elimina coloanele `text` și `label`, deoarece nu mai avem nevoie de ele:
+
+```python
+def tokenize_function(examples):
+    result = tokenizer(examples["text"])
+    if tokenizer.is_fast:
+        result["word_ids"] = [result.word_ids(i) for i in range(len(result["input_ids"]))]
+    return result
+
+
+# Utilizați batched=True pentru a activa multithreadingul!
+tokenized_datasets = imdb_dataset.map(
+    tokenize_function, batched=True, remove_columns=["text", "label"]
+)
+tokenized_datasets
+```
+
+```python out
+DatasetDict({
+    train: Dataset({
+        features: ['attention_mask', 'input_ids', 'word_ids'],
+        num_rows: 25000
+    })
+    test: Dataset({
+        features: ['attention_mask', 'input_ids', 'word_ids'],
+        num_rows: 25000
+    })
+    unsupervised: Dataset({
+        features: ['attention_mask', 'input_ids', 'word_ids'],
+        num_rows: 50000
+    })
+})
+```
+
+Deoarece DistilBERT este un model de tip BERT, putem vedea că textele codate constau din `input_ids` și `attention_mask` pe care le-am văzut în alte capitole, precum și din `word_ids` pe care le-am adăugat.
+
+Acum că am tokenizat recenziile de filme, următorul pas este să le grupăm pe toate și să împărțim rezultatul în chunkuri. Dar cât de mari ar trebui să fie aceste chunkuri? Acest lucru va fi determinat în cele din urmă de cantitatea de memorie GPU pe care o aveți disponibilă, dar un bun punct de plecare este să vedeți care este dimensiunea maximă a contextului modelului. Aceasta poate fi dedusă prin inspectarea atributului `model_max_length` al tokenizerului:
+
+```python
+tokenizer.model_max_length
+```
+
+```python out
+512
+```
+
+Această valoare este derivată din fișierul *tokenizer_config.json* asociat cu un checkpoint; în acest caz putem vedea că dimensiunea contextului este de 512 tokeni, la fel ca în cazul BERT.
+
+<Tip>
+
+✏️ **Încearcă!** Unele modele Transformer, precum [BigBird](https://huggingface.co/google/bigbird-roberta-base) și [Longformer](hf.co/allenai/longformer-base-4096), au o lungime de context mult mai mare decât BERT și alte modele Transformer mai vechi. Inițializați tokenizerul pentru unul dintre aceste checkpointuri și verificați dacă `model_max_length` este în concordanță cu ceea ce este menționat pe model card.
+
+</Tip>
+
+Prin urmare, pentru a derula experimentele pe GPU-uri precum cele de pe Google Colab, vom alege ceva mai mic care să încapă în memorie:
+
+```python
+chunk_size = 128
+```
+
+<Tip warning={true}>
+
+Rețineți că utilizarea unei dimensiuni mici a chunkurilor poate fi dăunător în scenariile din lumea reală, astfel încât ar trebui să utilizați o dimensiune care corespunde cazului de utilizare la care veți aplica modelul.
+
+</Tip>
+
+Acum vine partea distractivă. Pentru a arăta cum funcționează concatenarea, să luăm câteva recenzii din setul nostru de antrenare tokenizat și să imprimăm numărul de tokeni per recenzie:
+
+```python
+# Slicingul produce o listă de liste pentru fiecare caracteristică
+tokenized_samples = tokenized_datasets["train"][:3]
+
+for idx, sample in enumerate(tokenized_samples["input_ids"]):
+    print(f"'>>> Review {idx} length: {len(sample)}'")
+```
+
+```python out
+'>>> Review 0 length: 200'
+'>>> Review 1 length: 559'
+'>>> Review 2 length: 192'
+```
+
+Putem apoi concatena toate aceste exemple cu un dictionary comprehension, după cum urmează:
+
+```python
+concatenated_examples = {
+    k: sum(tokenized_samples[k], []) for k in tokenized_samples.keys()
+}
+total_length = len(concatenated_examples["input_ids"])
+print(f"'>>> Concatenated reviews length: {total_length}'")
+```
+
+```python out
+'>>> Concatenated reviews length: 951'
+```
+
+Minunat, lungimea totală se verifică - așa că acum să împărțim recenziile concatenate în chunkuri de dimensiunea dată de `chunk_size`. Pentru a face acest lucru, iterăm peste caracteristicile din `concatenated_examples` și folosim un list comprehension pentru a crea slice-uri ale fiecărei caracteristici. Rezultatul este un dicționar de chunkuri pentru fiecare caracteristică:
+
+```python
+chunks = {
+    k: [t[i : i + chunk_size] for i in range(0, total_length, chunk_size)]
+    for k, t in concatenated_examples.items()
+}
+
+for chunk in chunks["input_ids"]:
+    print(f"'>>> Chunk length: {len(chunk)}'")
+```
+
+```python out
+'>>> Chunk length: 128'
+'>>> Chunk length: 128'
+'>>> Chunk length: 128'
+'>>> Chunk length: 128'
+'>>> Chunk length: 128'
+'>>> Chunk length: 128'
+'>>> Chunk length: 128'
+'>>> Chunk length: 55'
+```
+
+După cum puteți vedea în acest exemplu, ultimul fragment va fi în general mai mic decât dimensiunea maximă a fragmentului. Există două strategii principale pentru a face față acestei situații:
+
+* Aruncați ultimul chunk dacă este mai mic decât `chunk_size`.
+* Faceți padding ultimului chunk până când lungimea sa este egală cu `chunk_size`.
+
+Vom adopta prima abordare aici, așa că hai să încorporăm toată logica de mai sus într-o singură funcție pe care o putem aplica dataseturilor tokenizate:
+
+```python
+def group_texts(examples):
+    # Concatenarea tuturor textelor
+    concatenated_examples = {k: sum(examples[k], []) for k in examples.keys()}
+    # Calcularea lungimii textelor concatenate
+    total_length = len(concatenated_examples[list(examples.keys())[0]])
+    # Renunțăm la ultimul chunk dacă este mai mic decât chunk_size
+    total_length = (total_length // chunk_size) * chunk_size
+    # Împărțiți pe bucăți de max_len
+    result = {
+        k: [t[i : i + chunk_size] for i in range(0, total_length, chunk_size)]
+        for k, t in concatenated_examples.items()
+    }
+    # Creați o nouă coloană de labeluri
+    result["labels"] = result["input_ids"].copy()
+    return result
+```
+
+Observați că în ultimul pas al `group_texts()` creăm o nouă coloană `labels` care este o copie a coloanei `input_ids`. După cum vom vedea în curând, acest lucru se datorează faptului că în modelarea limbajului mascat obiectivul este de a prezice tokeni mascați aleatoriu în input batch, iar prin crearea unei coloane `labels` furnizăm adevărul de bază din care modelul nostru de limbaj poate să învețe.
+
+Să aplicăm acum funcția `group_texts()` dataseturilor tokenizate folosind funcția noastră de încredere `Dataset.map()`:
+
+```python
+lm_datasets = tokenized_datasets.map(group_texts, batched=True)
+lm_datasets
+```
+
+```python out
+DatasetDict({
+    train: Dataset({
+        features: ['attention_mask', 'input_ids', 'labels', 'word_ids'],
+        num_rows: 61289
+    })
+    test: Dataset({
+        features: ['attention_mask', 'input_ids', 'labels', 'word_ids'],
+        num_rows: 59905
+    })
+    unsupervised: Dataset({
+        features: ['attention_mask', 'input_ids', 'labels', 'word_ids'],
+        num_rows: 122963
+    })
+})
+```
+
+Puteți vedea că gruparea și apoi fragmentarea textelor a produs mult mai multe exemple decât cele 25.000 inițiale pentru spliturile `train` și `test`. Acest lucru se datorează faptului că acum avem exemple care implică _contigous tokens_ care se întind pe mai multe exemple din corpusul original. Puteți vedea acest lucru în mod explicit căutând tokenii speciali `[SEP]` și `[CLS]` într-unul dintre chunkuri:
+
+```python
+tokenizer.decode(lm_datasets["train"][1]["input_ids"])
+```
+
+```python out
+".... at.......... high. a classic line : inspector : i'm here to sack one of your teachers. student : welcome to bromwell high. i expect that many adults of my age think that bromwell high is far fetched. what a pity that it isn't! [SEP] [CLS] homelessness ( or houselessness as george carlin stated ) has been an issue for years but never a plan to help those on the street that were once considered human who did everything from going to school, work, or vote for the matter. most people think of the homeless"
+```
+
+În acest exemplu puteți vedea două recenzii de film care se suprapun, una despre un film de liceu și cealaltă despre persoanele fără adăpost. Să verificăm, de asemenea, cum arată labelurile pentru modelarea limbajului mascat:
+
+```python out
+tokenizer.decode(lm_datasets["train"][1]["labels"])
+```
+
+```python out
+".... at.......... high. a classic line : inspector : i'm here to sack one of your teachers. student : welcome to bromwell high. i expect that many adults of my age think that bromwell high is far fetched. what a pity that it isn't! [SEP] [CLS] homelessness ( or houselessness as george carlin stated ) has been an issue for years but never a plan to help those on the street that were once considered human who did everything from going to school, work, or vote for the matter. most people think of the homeless"
+```
+
+Așa cum era de așteptat de la funcția noastră `group_texts()` de mai sus, acest lucru pare identic cu `input_ids` decodificat - dar atunci cum poate modelul nostru să învețe ceva? Ne lipsește un pas cheie: inserarea tokenilor `[MASK]` în poziții aleatorii în inputuri! Să vedem cum putem face acest lucru din mers, în timpul fine-tuningului, folosind un data collator special.
+
+## Fine-tuningul asupra DistilBERT cu API-ul `Trainer`[[fine-tuning-distilbert-with-the-trainer-api]]
+
+Fine-tuningul unui model lingvistic mascat este aproape identic cu fine-tuningul a unui model de clasificare a secvențelor, așa cum am făcut în [Capitolul 3](/course/chapter3). Singura diferență este că avem nevoie de un data collator care poate masca aleatoriu o parte dintre tokeni din fiecare batch de texte. Din fericire, 🤗 Transformers vine pregătit cu un `DataCollatorForLanguageModeling` dedicat tocmai pentru această sarcină. Trebuie doar să îi transmitem tokenizerul și un argument `mlm_probability` care specifică ce fracțiune din tokeni trebuie mascată. Vom alege 15%, care este cantitatea utilizată pentru BERT și o alegere comună în literatura de specialitate:
+
+```python
+from transformers import DataCollatorForLanguageModeling
+
+data_collator = DataCollatorForLanguageModeling(tokenizer=tokenizer, mlm_probability=0.15)
+```
+
+Pentru a vedea cum funcționează mascarea aleatorie, să introducem câteva exemple în data collator. Deoarece se așteaptă la o listă de "dict"-uri, în care fiecare "dict" reprezintă un singur chunk de text continuu, mai întâi iterăm peste dataset înainte de a trimite batchul către data collator. Eliminăm cheia `"word_ids"` pentru acest data collator, deoarece acesta nu o așteaptă:
+
+```python
+samples = [lm_datasets["train"][i] for i in range(2)]
+for sample in samples:
+    _ = sample.pop("word_ids")
+
+for chunk in data_collator(samples)["input_ids"]:
+    print(f"\n'>>> {tokenizer.decode(chunk)}'")
+```
+
+```python output
+'>>> [CLS] bromwell [MASK] is a cartoon comedy. it ran at the same [MASK] as some other [MASK] about school life, [MASK] as " teachers ". [MASK] [MASK] [MASK] in the teaching [MASK] lead [MASK] to believe that bromwell high\'[MASK] satire is much closer to reality than is " teachers ". the scramble [MASK] [MASK] financially, the [MASK]ful students whogn [MASK] right through [MASK] pathetic teachers\'pomp, the pettiness of the whole situation, distinction remind me of the schools i knew and their students. when i saw [MASK] episode in [MASK] a student repeatedly tried to burn down the school, [MASK] immediately recalled. [MASK]...'
+
+'>>> .... at.. [MASK]... [MASK]... high. a classic line plucked inspector : i\'[MASK] here to [MASK] one of your [MASK]. student : welcome to bromwell [MASK]. i expect that many adults of my age think that [MASK]mwell [MASK] is [MASK] fetched. what a pity that it isn\'t! [SEP] [CLS] [MASK]ness ( or [MASK]lessness as george 宇in stated )公 been an issue for years but never [MASK] plan to help those on the street that were once considered human [MASK] did everything from going to school, [MASK], [MASK] vote for the matter. most people think [MASK] the homeless'
+```
+
+Frumos, a funcționat! Putem vedea că tokenul `[MASK]` a fost inserat aleatoriu în diferite locuri din textul nostru. Acestea vor fi tokenii pe care modelul nostru va trebui să le prezică în timpul antrenamentului - iar frumusețea data collatorului este că va introduce aleatoriu tokenul `[MASK]` cu fiecare batch!
+
+<Tip>
+
+✏️ **Încercați!** Rulați fragmentul de cod de mai sus de mai multe ori pentru a vedea cum se întâmplă mascarea aleatorie în fața ochilor voștri! De asemenea, înlocuiți metoda `tokenizer.decode()` cu `tokenizer.convert_ids_to_tokens()` pentru a vedea că uneori un singur token dintr-un cuvânt dat este mascat, și nu celelalte.
+
+</Tip>
+
+{#if fw === 'pt'}
+
+Un efect secundar al mascării aleatorii este faptul că metricile noastre de evaluare nu vor fi deterministe atunci când folosim `Trainer`, deoarece folosim același data collator pentru seturile de antrenare și testare. Vom vedea mai târziu, când ne vom uita la aplicarea fine-tuningului cu 🤗 Accelerate, cum putem folosi flexibilitatea unei bucle de evaluare personalizate pentru a îngheța caracterul aleatoriu.
+
+{/if}
+
+La antrenarea modelelor pentru modelarea limbajului mascat, o tehnică care poate fi utilizată este mascarea cuvintelor întregi împreună, nu doar a tokenilor individuali. Această abordare se numește _whole word masking_. Dacă dorim să utilizăm mascarea întregului cuvânt, va trebui să construim noi înșine un data collator. Un data collator este doar o funcție care preia o listă de sampleuri și le convertește într-un batch, așa că hai să facem asta acum! Vom utiliza ID-urile cuvintelor calculate mai devreme pentru a realiza o hartă între indicii cuvintelor și tokenii corespunzători, apoi vom decide aleatoriu ce cuvinte să mascăm și vom aplica masca respectivă asupra inputurilor. Rețineți că labelurile sunt toate `-100`, cu excepția celor care corespund cuvintelor mascate.
+
+{#if fw === 'pt'}
+
+```py
+import collections
+import numpy as np
+
+from transformers import default_data_collator
+
+wwm_probability = 0.2
+
+
+def whole_word_masking_data_collator(features):
+    for feature in features:
+        word_ids = feature.pop("word_ids")
+
+        # Create a map between words and corresponding token indices
+        mapping = collections.defaultdict(list)
+        current_word_index = -1
+        current_word = None
+        for idx, word_id in enumerate(word_ids):
+            if word_id is not None:
+                if word_id != current_word:
+                    current_word = word_id
+                    current_word_index += 1
+                mapping[current_word_index].append(idx)
+
+        # Randomly mask words
+        mask = np.random.binomial(1, wwm_probability, (len(mapping),))
+        input_ids = feature["input_ids"]
+        labels = feature["labels"]
+        new_labels = [-100] * len(labels)
+        for word_id in np.where(mask)[0]:
+            word_id = word_id.item()
+            for idx in mapping[word_id]:
+                new_labels[idx] = labels[idx]
+                input_ids[idx] = tokenizer.mask_token_id
+        feature["labels"] = new_labels
+
+    return default_data_collator(features)
+```
+
+{:else}
+
+```py
+import collections
+import numpy as np
+
+from transformers.data.data_collator import tf_default_data_collator
+
+wwm_probability = 0.2
+
+
+def whole_word_masking_data_collator(features):
+    for feature in features:
+        word_ids = feature.pop("word_ids")
+
+        # Create a map between words and corresponding token indices
+        mapping = collections.defaultdict(list)
+        current_word_index = -1
+        current_word = None
+        for idx, word_id in enumerate(word_ids):
+            if word_id is not None:
+                if word_id != current_word:
+                    current_word = word_id
+                    current_word_index += 1
+                mapping[current_word_index].append(idx)
+
+        # Randomly mask words
+        mask = np.random.binomial(1, wwm_probability, (len(mapping),))
+        input_ids = feature["input_ids"]
+        labels = feature["labels"]
+        new_labels = [-100] * len(labels)
+        for word_id in np.where(mask)[0]:
+            word_id = word_id.item()
+            for idx in mapping[word_id]:
+                new_labels[idx] = labels[idx]
+                input_ids[idx] = tokenizer.mask_token_id
+        feature["labels"] = new_labels
+
+    return tf_default_data_collator(features)
+```
+
+{/if}
+
+În continuare, îl putem încerca pe aceleași sampleuri ca înainte:
+
+```py
+samples = [lm_datasets["train"][i] for i in range(2)]
+batch = whole_word_masking_data_collator(samples)
+
+for chunk in batch["input_ids"]:
+    print(f"\n'>>> {tokenizer.decode(chunk)}'")
+```
+
+```python out
+'>>> [CLS] bromwell high is a cartoon comedy [MASK] it ran at the same time as some other programs about school life, such as " teachers ". my 35 years in the teaching profession lead me to believe that bromwell high\'s satire is much closer to reality than is " teachers ". the scramble to survive financially, the insightful students who can see right through their pathetic teachers\'pomp, the pettiness of the whole situation, all remind me of the schools i knew and their students. when i saw the episode in which a student repeatedly tried to burn down the school, i immediately recalled.....'
+
+'>>> .... [MASK] [MASK] [MASK] [MASK]....... high. a classic line : inspector : i\'m here to sack one of your teachers. student : welcome to bromwell high. i expect that many adults of my age think that bromwell high is far fetched. what a pity that it isn\'t! [SEP] [CLS] homelessness ( or houselessness as george carlin stated ) has been an issue for years but never a plan to help those on the street that were once considered human who did everything from going to school, work, or vote for the matter. most people think of the homeless'
+```
+
+<Tip>
+
+✏️ **Încercați!** Rulați fragmentul de cod de mai sus de mai multe ori pentru a vedea cum se întâmplă mascarea aleatorie în fața ochilor voștri! De asemenea, înlocuiți metoda `tokenizer.decode()` cu `tokenizer.convert_ids_to_tokens()` pentru a vedea că tokenii dintr-un cuvânt dat sunt întotdeauna mascați împreună.
+
+</Tip>
+
+Acum, că avem două data collators, restul pașilor fine-tuning sunt standard. Pregătirea poate dura ceva timp pe Google Colab dacă nu sunteți suficient de norocos să obțineți un GPU P100 mitic 😭, așa că vom reduce mai întâi dimensiunea setului de antrenare la câteva mii de exemple. Nu vă faceți griji, vom obține în continuare un model lingvistic destul de decent! O modalitate rapidă de a reduce sampleurile unui dataset în 🤗 Datasets este prin intermediul funcției `Dataset.train_test_split()` pe care am văzut-o în [Capitolul 5](/course/chapter5):
+
+```python
+train_size = 10_000
+test_size = int(0.1 * train_size)
+
+downsampled_dataset = lm_datasets["train"].train_test_split(
+    train_size=train_size, test_size=test_size, seed=42
+)
+downsampled_dataset
+```
+
+```python out
+DatasetDict({
+    train: Dataset({
+        features: ['attention_mask', 'input_ids', 'labels', 'word_ids'],
+        num_rows: 10000
+    })
+    test: Dataset({
+        features: ['attention_mask', 'input_ids', 'labels', 'word_ids'],
+        num_rows: 1000
+    })
+})
+```
+
+Acest lucru a creat în mod automat noi splituri de `train` și `test`, cu dimensiunea setului de antrenare setată la 10.000 de exemple și a setului de validare la 10% din aceasta - nu ezitați să măriți această valoare dacă aveți un GPU puternic! Următorul lucru pe care trebuie să îl facem este să ne conectăm la Hugging Face Hub. Dacă executați acest cod într-un notebook, puteți face acest lucru cu următoarea funcție utilitară:
+
+```python
+from huggingface_hub import notebook_login
+
+notebook_login()
+```
+
+care va afișa un widget în care vă puteți introduce credențialele. Alternativ, puteți rula:
+
+```
+huggingface-cli login
+```
+
+in your favorite terminal and log in there. 
+
+{#if fw === 'tf'}
+
+Odată ce ne-am conectat, putem crea dataseturile `tf.data`. Pentru a face acest lucru, vom utiliza metoda `prepare_tf_dataset()`, care utilizează modelul nostru pentru a deduce automat ce coloane ar trebui să intre în dataset. Dacă doriți să controlați exact ce coloane să utilizați, puteți folosi în schimb metoda `Dataset.to_tf_dataset()`. Pentru a simplifica lucrurile, vom utiliza aici doar data collatorul standard, dar puteți încerca și whole word masking collator și puteți compara rezultatele ca un exercițiu:
+
+```python
+tf_train_dataset = model.prepare_tf_dataset(
+    downsampled_dataset["train"],
+    collate_fn=data_collator,
+    shuffle=True,
+    batch_size=32,
+)
+
+tf_eval_dataset = model.prepare_tf_dataset(
+    downsampled_dataset["test"],
+    collate_fn=data_collator,
+    shuffle=False,
+    batch_size=32,
+)
+```
+
+În continuare, setăm hiperparametrii de antrenare și compilăm modelul nostru. Utilizăm funcția `create_optimizer()` din biblioteca 🤗 Transformers, care ne oferă un optimizator `AdamW` cu o scădere liniară a ratei de învățare. Utilizăm, de asemenea, pierderea încorporată în model, care este cea implicită atunci când nu este specificată nicio pierdere ca argument pentru `compile()`, și setăm precizia de antrenare la `"mixed_float16"`. Rețineți că, dacă utilizați un GPU Colab sau alt GPU care nu are suport accelerat pentru float16, ar trebui probabil să comentați această linie.
+
+În plus, am configurat un `PushToHubCallback` care va salva modelul în Hub după fiecare epocă. Puteți specifica numele repositoriului către care doriți să faceți push cu argumentul `hub_model_id` (în special, va trebui să utilizați acest argument pentru a face push către o organizație). De exemplu, pentru a trimite modelul către organizația [`huggingface-course`](https://huggingface.co/huggingface-course), am adăugat `hub_model_id="huggingface-course/distilbert-finetuned-imdb"`. În mod implicit, repositoriul utilizat va fi în namespaceul vostru și numit după output directory-ul pe care l-ați stabilit, deci în cazul nostru va fi `"lewtun/distilbert-finetuned-imdb"`.
+
+```python
+from transformers import create_optimizer
+from transformers.keras_callbacks import PushToHubCallback
+import tensorflow as tf
+
+num_train_steps = len(tf_train_dataset)
+optimizer, schedule = create_optimizer(
+    init_lr=2e-5,
+    num_warmup_steps=1_000,
+    num_train_steps=num_train_steps,
+    weight_decay_rate=0.01,
+)
+model.compile(optimizer=optimizer)
+
+# Train in mixed-precision float16
+tf.keras.mixed_precision.set_global_policy("mixed_float16")
+
+model_name = model_checkpoint.split("/")[-1]
+callback = PushToHubCallback(
+    output_dir=f"{model_name}-finetuned-imdb", tokenizer=tokenizer
+)
+```
+
+Acum suntem gata să executăm `model.fit()` - dar înainte de a face acest lucru, să ne uităm pe scurt la _perplexitate_, care este o metrică comună pentru a evalua performanța modelelor de limbaj.
+
+{:else}
+
+Odată ce suntem conectați, putem specifica argumentele pentru `Trainer`:
+
+```python
+from transformers import TrainingArguments
+
+batch_size = 64
+# Show the training loss with every epoch
+logging_steps = len(downsampled_dataset["train"]) // batch_size
+model_name = model_checkpoint.split("/")[-1]
+
+training_args = TrainingArguments(
+    output_dir=f"{model_name}-finetuned-imdb",
+    overwrite_output_dir=True,
+    evaluation_strategy="epoch",
+    learning_rate=2e-5,
+    weight_decay=0.01,
+    per_device_train_batch_size=batch_size,
+    per_device_eval_batch_size=batch_size,
+    push_to_hub=True,
+    fp16=True,
+    logging_steps=logging_steps,
+)
+```
+
+Aici am modificat câteva dintre opțiunile implicite, inclusiv `logging_steps` pentru a ne asigura că urmărim pierderea de antrenare cu fiecare epocă. De asemenea, am folosit `fp16=True` pentru a activa antrenarea cu precizie mixtă, ceea ce ne oferă un alt impuls vitezei. În mod implicit, `Trainer` va elimina toate coloanele care nu fac parte din metoda `forward()` a modelului. Aceasta înseamnă că, dacă utilizați whole word masking collator, va trebui să setați și `remove_unused_columns=False` pentru a vă asigura că nu pierdem coloana `word_ids` în timpul antrenamentului.
+
+Rețineți că puteți specifica numele repositoriului către care doriți să faceți push cu argumentul `hub_model_id` (în special, va trebui să utilizați acest argument pentru a face push către o organizație). De exemplu, atunci când am făcut push modelului către organizația [`huggingface-course`](https://huggingface.co/huggingface-course), am adăugat `hub_model_id="huggingface-course/distilbert-finetuned-imdb"` la `TrainingArguments`. În mod implicit, repositoriul utilizat va fi în namespaceul vostru și denumit după output directory-ul pe care l-ați stabilit, deci în cazul nostru va fi `"lewtun/distilbert-finetuned-imdb"`.
+
+Acum avem toate ingredientele pentru inițializarea `Trainer`. Aici folosim doar `data_collator` standard, dar puteți încerca whole word masking collator și să comparați rezultatele ca un exercițiu:
+
+```python
+from transformers import Trainer
+
+trainer = Trainer(
+    model=model,
+    args=training_args,
+    train_dataset=downsampled_dataset["train"],
+    eval_dataset=downsampled_dataset["test"],
+    data_collator=data_collator,
+    tokenizer=tokenizer,
+)
+```
+
+Acum suntem gata să rulăm `trainer.train()` - dar înainte de a face acest lucru, să analizăm pe scurt _perplexitatea_, care este o metrică comună de evaluare a performanței modelelor de limbaj.
+
+{/if}
+
+### Perplexity pentru language models[[perplexity-for-language-models]]
+
+<Youtube id="NURcDHhYe98"/>
+
+Spre deosebire de alte sarcini, cum ar fi clasificarea textului sau răspunderea la întrebări, unde ni se oferă un corpus labeled pe care să antrenăm, cu modelarea limbajului nu avem labeluri explicite. Așadar, cum determinăm ce face un model lingvistic bun? La fel ca în cazul funcției de autocorectare din telefon, un model lingvistic bun este unul care atribuie probabilități ridicate propozițiilor corecte din punct de vedere gramatical și probabilități scăzute propozițiilor fără sens. Pentru a vă face o idee mai bună despre cum arată acest lucru, puteți găsi online seturi întregi de "autocorrect fails", în care modelul din telefonul unei persoane a produs niște completări destul de amuzante (și adesea nepotrivite)!
+
+{#if fw === 'pt'}
+
+Presupunând că setul nostru de testare constă în cea mai mare parte din propoziții corecte din punct de vedere gramatical, atunci o modalitate de a măsura calitatea modelului nostru lingvistic este de a calcula probabilitățile pe care le atribuie următorului cuvânt în toate propozițiile din setul de testare. Probabilitatea ridicată indică faptul că modelul nu este "surprins" sau "perplex" de exemplele nevăzute și sugerează că a învățat tiparele gramaticale de bază ale limbii. Există diverse definiții matematice ale perplexității, dar cea pe care o vom utiliza o definește ca the exponential of the cross-entropy loss. Astfel, putem calcula perplexitatea modelului nostru preantrenat utilizând funcția `Trainer.evaluate()` pentru a calcula pierderea de cross-entropy pe setul de testare și apoi luând exponențiala rezultatului:
+
+```python
+import math
+
+eval_results = trainer.evaluate()
+print(f">>> Perplexity: {math.exp(eval_results['eval_loss']):.2f}")
+```
+
+{:else}
+
+Presupunând că setul nostru de testare constă în cea mai mare parte din propoziții corecte din punct de vedere gramatical, atunci o modalitate de a măsura calitatea modelului nostru lingvistic este de a calcula probabilitățile pe care le atribuie următorului cuvânt în toate propozițiile din setul de testare. Probabilitățile ridicate indică faptul că modelul indică faptul că modelul nu este "surprins" sau "perplex" de exemplele nevăzute și sugerează că a învățat modelele de bază ale gramaticii limbii. Există diverse definiții matematice ale perplexității, dar cea pe care o vom folosi o definește ca the exponential of the cross-entropy loss. Astfel, putem calcula perplexitatea modelului nostru preantrenat folosind metoda `model.evaluate()` pentru a calcula pierderea de entropie încrucișată pe setul de testare și apoi luând exponențiala rezultatului:
+
+```python
+import math
+
+eval_loss = model.evaluate(tf_eval_dataset)
+print(f"Perplexity: {math.exp(eval_loss):.2f}")
+```
+
+{/if}
+
+```python out
+>>> Perplexity: 21.75
+```
+
+Un scor de perplexitate mai mic înseamnă un model lingvistic mai bun, iar aici putem vedea că modelul nostru inițial are o valoare oarecum mare. Să vedem dacă o putem reduce prin fine-tuning! Pentru a face acest lucru, vom rula mai întâi bucla de antrenare:
+
+{#if fw === 'pt'}
+
+```python
+trainer.train()
+```
+
+{:else}
+
+```python
+model.fit(tf_train_dataset, validation_data=tf_eval_dataset, callbacks=[callback])
+```
+
+{/if}
+
+și apoi calculați perplexitatea rezultată pe setul de testare ca înainte:
+
+{#if fw === 'pt'}
+
+```python
+eval_results = trainer.evaluate()
+print(f">>> Perplexity: {math.exp(eval_results['eval_loss']):.2f}")
+```
+
+{:else}
+
+```python
+eval_loss = model.evaluate(tf_eval_dataset)
+print(f"Perplexity: {math.exp(eval_loss):.2f}")
+```
+
+{/if}
+
+```python out
+>>> Perplexity: 11.32
+```
+
+Grozav - aceasta este o reducere destul de mare a perplexității, ceea ce ne spune că modelul a învățat ceva despre domeniul recenziilor de filme!
+
+{#if fw === 'pt'}
+
+Odată ce antrenarea este finalizată, putem trimite cardul modelului cu informațiile de antrenare către Hub (checkpointurile sunt salvate în timpul antrenare):
+
+```python
+trainer.push_to_hub()
+```
+
+{/if}
+
+<Tip>
+
+✏️ **Rândul tău!** Rulați antrenamentul de mai sus după schimbarea data collatorului cu whole word masking collator. Obțineți rezultate mai bune?
+
+</Tip>
+
+{#if fw === 'pt'} 
+
+În cazul nostru de utilizare, nu a fost nevoie să facem nimic special cu bucla de antrenare, dar în unele cazuri s-ar putea să fie nevoie să implementați o logică personalizată. Pentru aceste aplicații, puteți utiliza 🤗 Accelerate -- să aruncăm o privire!
+
+## Fine-tuningul DistilBERT cu 🤗 Accelerate[[fine-tuning-distilbert-with-accelerate]]
+
+Așa cum am văzut cu `Trainer`, fine-tuningul unui model de limbaj mascat este foarte asemănător cu exemplul de clasificare a textului din [Capitolul 3](/course/chapter3). De fapt, singura subtilitate este utilizarea unui data collator special, pe care l-am abordat mai devreme în această secțiune!
+
+Cu toate acestea, am văzut că `DataCollatorForLanguageModeling` aplică, de asemenea, o mascare aleatorie cu fiecare evaluare, astfel încât vom vedea unele fluctuații în scorurile noastre de perplexitate cu fiecare rulare de antrenament. O modalitate de a elimina această sursă de dezordine este de a aplica mascarea _o singură dată_ pe întregul set de teste și apoi de a utiliza data collatorul implicit din 🤗 Transformers pentru a colecta batch-urile în timpul evaluării. Pentru a vedea cum funcționează acest lucru, să implementăm o funcție simplă care aplică mascarea pe un batch, similară cu prima noastră întâlnire cu `DataCollatorForLanguageModeling`:
+
+```python
+def insert_random_mask(batch):
+    features = [dict(zip(batch, t)) for t in zip(*batch.values())]
+    masked_inputs = data_collator(features)
+    # Create a new "masked" column for each column in the dataset
+    return {"masked_" + k: v.numpy() for k, v in masked_inputs.items()}
+```
+
+În continuare, vom aplica această funcție setului nostru de testare și vom elimina coloanele nemascate pentru a le putea înlocui cu cele mascate. Puteți utiliza whole word masking prin înlocuirea `data_collator` de mai sus cu cel corespunzător, caz în care trebuie să eliminați prima linie de aici:
+
+```py
+downsampled_dataset = downsampled_dataset.remove_columns(["word_ids"])
+eval_dataset = downsampled_dataset["test"].map(
+    insert_random_mask,
+    batched=True,
+    remove_columns=downsampled_dataset["test"].column_names,
+)
+eval_dataset = eval_dataset.rename_columns(
+    {
+        "masked_input_ids": "input_ids",
+        "masked_attention_mask": "attention_mask",
+        "masked_labels": "labels",
+    }
+)
+```
+
+Putem configura apoi dataloaderele ca de obicei, dar vom folosi `default_data_collator` de la 🤗 Transformers pentru setul de evaluare:
+
+```python
+from torch.utils.data import DataLoader
+from transformers import default_data_collator
+
+batch_size = 64
+train_dataloader = DataLoader(
+    downsampled_dataset["train"],
+    shuffle=True,
+    batch_size=batch_size,
+    collate_fn=data_collator,
+)
+eval_dataloader = DataLoader(
+    eval_dataset, batch_size=batch_size, collate_fn=default_data_collator
+)
+```
+
+De aici, vom urma pașii standard cu 🤗 Accelerate. În primul rând, se încarcă o versiune nouă a modelului antrenat:
+
+```
+model = AutoModelForMaskedLM.from_pretrained(model_checkpoint)
+```
+
+Apoi trebuie să specificăm optimizatorul; vom folosi standardul `AdamW`:
+
+```python
+from torch.optim import AdamW
+
+optimizer = AdamW(model.parameters(), lr=5e-5)
+```
+
+Cu aceste obiecte, acum putem pregăti totul pentru antrenare cu obiectul `Accelerator`:
+
+```python
+from accelerate import Accelerator
+
+accelerator = Accelerator()
+model, optimizer, train_dataloader, eval_dataloader = accelerator.prepare(
+    model, optimizer, train_dataloader, eval_dataloader
+)
+```
+
+Acum că modelul, optimizatorul și dataloaderul sunt configurate, putem specifica learning rate schedulerul cum urmează:
+
+```python
+from transformers import get_scheduler
+
+num_train_epochs = 3
+num_update_steps_per_epoch = len(train_dataloader)
+num_training_steps = num_train_epochs * num_update_steps_per_epoch
+
+lr_scheduler = get_scheduler(
+    "linear",
+    optimizer=optimizer,
+    num_warmup_steps=0,
+    num_training_steps=num_training_steps,
+)
+```
+
+Mai este un singur lucru de făcut înainte de antrenare: creați un repositoriu de modele pe Hugging Face Hub! Putem utiliza biblioteca 🤗 Hub pentru a genera mai întâi numele complet al repositoriul nostru:
+
+```python
+from huggingface_hub import get_full_repo_name
+
+model_name = "distilbert-base-uncased-finetuned-imdb-accelerate"
+repo_name = get_full_repo_name(model_name)
+repo_name
+```
+
+```python out
+'lewtun/distilbert-base-uncased-finetuned-imdb-accelerate'
+```
+
+apoi creați și clonați repositoriul folosind clasa `Repository` din 🤗 Hub:
+
+```python
+from huggingface_hub import Repository
+
+output_dir = model_name
+repo = Repository(output_dir, clone_from=repo_name)
+```
+
+Odată făcut acest lucru, este doar o chestiune simplă de scriere a ciclului complet de antrenare și evaluare:
+
+```python
+from tqdm.auto import tqdm
+import torch
+import math
+
+progress_bar = tqdm(range(num_training_steps))
+
+for epoch in range(num_train_epochs):
+    # Training
+    model.train()
+    for batch in train_dataloader:
+        outputs = model(**batch)
+        loss = outputs.loss
+        accelerator.backward(loss)
+
+        optimizer.step()
+        lr_scheduler.step()
+        optimizer.zero_grad()
+        progress_bar.update(1)
+
+    # Evaluation
+    model.eval()
+    losses = []
+    for step, batch in enumerate(eval_dataloader):
+        with torch.no_grad():
+            outputs = model(**batch)
+
+        loss = outputs.loss
+        losses.append(accelerator.gather(loss.repeat(batch_size)))
+
+    losses = torch.cat(losses)
+    losses = losses[: len(eval_dataset)]
+    try:
+        perplexity = math.exp(torch.mean(losses))
+    except OverflowError:
+        perplexity = float("inf")
+
+    print(f">>> Epoch {epoch}: Perplexity: {perplexity}")
+
+    # Save and upload
+    accelerator.wait_for_everyone()
+    unwrapped_model = accelerator.unwrap_model(model)
+    unwrapped_model.save_pretrained(output_dir, save_function=accelerator.save)
+    if accelerator.is_main_process:
+        tokenizer.save_pretrained(output_dir)
+        repo.push_to_hub(
+            commit_message=f"Training in progress epoch {epoch}", blocking=False
+        )
+```
+
+```python out
+>>> Epoch 0: Perplexity: 11.397545307900472
+>>> Epoch 1: Perplexity: 10.904909330983092
+>>> Epoch 2: Perplexity: 10.729503505340409
+```
+
+Mișto, am reușit să evaluăm perplexitatea cu fiecare epocă și să ne asigurăm că mai multe runde de antrenament sunt reproductibile!
+
+{/if}
+
+## Utilizarea modelului fine-tuned[[using-our-fine-tuned-model]]
+
+Puteți interacționa cu modelul vostru fine-tuned utilizând widgetul său de pe Hub, fie local cu `pipeline` din 🤗 Transformers. Să folosim aceasta din urmă pentru a descărca modelul nostru folosind pipelineuul `fill-mask`:
+
+```python
+from transformers import pipeline
+
+mask_filler = pipeline(
+    "fill-mask", model="huggingface-course/distilbert-base-uncased-finetuned-imdb"
+)
+```
+
+Putem apoi să alimentăm pipelineul cu exemplul nostru de text "This is a hrea [MASK]" și să vedem care sunt primele 5 predicții:
+
+```python
+preds = mask_filler(text)
+
+for pred in preds:
+    print(f">>> {pred['sequence']}")
+```
+
+```python out
+'>>> this is a great movie.'
+'>>> this is a great film.'
+'>>> this is a great story.'
+'>>> this is a great movies.'
+'>>> this is a great character.'
+```
+
+Frumos - modelul nostru și-a adaptat în mod clar weighturile pentru a prezice cuvintele care sunt asociate mai puternic cu filmele!
+
+<Youtube id="0Oxphw4Q9fo"/>
+
+Acest lucru încheie primul nostru experiment de antrenare a unui model lingvistic. În [secțiunea 6](/course/ro/chapter7/6) veți învăța cum să antrenați de la zero un model auto-regressive precum GPT-2; mergeți acolo dacă doriți să vedeți cum vă puteți preantrena propriul model Transformer!
+
+<Tip>
+
+✏️ **Încercați!** Pentru a cuantifica beneficiile adaptării domeniului, faceți fine-tune unui clasificator pe labelurile IMDb atât pentru checkpointurile DistilBERT preantrenate, cât și pentru cele fine-tuned. Dacă aveți nevoie de o recapitulare a clasificării textului, consultați [Capitolul 3](/course/chapter3).
+
+</Tip>
diff --git a/chapters/rum/chapter7/4.mdx b/chapters/rum/chapter7/4.mdx
new file mode 100644
index 000000000..ae1098e58
--- /dev/null
+++ b/chapters/rum/chapter7/4.mdx
@@ -0,0 +1,1001 @@
+<FrameworkSwitchCourse {fw} />
+
+# Traducere[[translation]]
+
+{#if fw === 'pt'}
+
+<CourseFloatingBanner chapter={7}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter7/section4_pt.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter7/section4_pt.ipynb"},
+]} />
+
+{:else}
+
+<CourseFloatingBanner chapter={7}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter7/section4_tf.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter7/section4_tf.ipynb"},
+]} />
+
+{/if}
+
+Să trecem acum la traducere. Aceasta este o altă [sarcină de sequence-to-sequence](/course/chapter1/7), ceea ce înseamnă că este o problemă care poate fi formulată ca trecerea de la o secvență la alta. În acest sens, problema este destul de apropiată de [sumarizare](/course/chapter7/6) și ați putea adapta ceea ce vom vedea aici la alte probleme de la sequence-to-sequence, cum ar fi:
+
+- **Style transfer**: Crearea unui model care *traduce* texte scrise într-un anumit stil în altul (de exemplu, din formal în casual sau din engleza Shakespeariană în engleza modernă)
+- **Generative question answering**: Crearea unui model care generează răspunsuri la întrebări, fiind dat un context
+
+<Youtube id="1JvfrvZgi6c"/>
+
+Dacă aveți un corpus suficient de mare de texte în două (sau mai multe) limbi, puteți antrena un nou model de traducere de la zero, așa cum vom face în secțiunea despre [causal language modeling] (/course/chapter7/6). Cu toate acestea, va fi mai rapid să faceți fine-tune unui model de traducere existent, fie că este vorba de un model multilingv precum mT5 sau mBART, pe care doriți să îi faceți fine-tune pentru o anumită pereche de limbi, sau chiar un model specializat pentru traducerea dintr-o limbă în alta, pe care doriți să îl perfecționați pentru corpusul vostru specific.
+
+În această secțiune, vom pune face fine-tune unui model Marian preantrenat pentru a traduce din engleză în franceză (deoarece mulți dintre angajații Hugging Face vorbesc ambele limbi) pe [datasetul KDE4](https://huggingface.co/datasets/kde4), care este un set de fișiere localizate pentru [KDE apps](https://apps.kde.org/). Modelul pe care îl vom utiliza a fost preantrenat pe un corpus mare de texte în franceză și engleză preluate din [datasetul Opus](https://opus.nlpl.eu/), care conține de fapt datasetul KDE4. Dar chiar dacă modelul preantrenat pe care îl folosim a văzut aceste date în timpul preantrenării sale, vom vedea că putem obține o versiune mai bună a acestuia după fine-tuning.
+
+Odată ce am terminat, vom avea un model capabil să facă predicții ca acesta:
+
+<iframe src="https://course-demos-marian-finetuned-kde4-en-to-fr.hf.space" frameBorder="0" height="350" title="Gradio app" class="block dark:hidden container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
+
+<a class="flex justify-center" href="/huggingface-course/marian-finetuned-kde4-en-to-fr">
+<img class="block dark:hidden lg:w-3/5" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/modeleval-marian-finetuned-kde4-en-to-fr.png" alt="One-hot encoded labels pentru răspunderea la întrebări."/>
+<img class="hidden dark:block lg:w-3/5" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/modeleval-marian-finetuned-kde4-en-to-fr-dark.png" alt="One-hot encoded labels răspunderea la întrebări."/>
+</a>
+
+Ca și în secțiunile anterioare, puteți găsi modelul pe care îl vom antrena și încărca în Hub utilizând codul de mai jos și puteți verifica predicțiile acestuia [aici](https://huggingface.co/huggingface-course/marian-finetuned-kde4-en-to-fr?text=This+plugin+allows+you+to+automatically+translate+web+pages+between+several+languages.).
+
+## Pregătirea datelor[[preparing-the-data]]
+
+Pentru a face fine-tune sau a antrena un model de traducere de la zero, vom avea nevoie de un dataset adecvat pentru această sarcină. După cum am menționat anterior, vom utiliza [datasetul KDE4](https://huggingface.co/datasets/kde4) în această secțiune, dar puteți adapta codul pentru a utiliza propriile date destul de ușor, atâta timp cât aveți perechi de propoziții în cele două limbi din și în care doriți să traduceți. Consultați [Capitolul 5](/course/chapter5) dacă aveți nevoie de o reamintire a modului de încărcare a datelor personalizate într-un `Dataset`.
+
+### Datasetul KDE4[[the-kde4-dataset]]
+
+Ca de obicei, descărcăm datasetul nostru folosind funcția `load_dataset()`:
+
+```py
+from datasets import load_dataset
+
+raw_datasets = load_dataset("kde4", lang1="en", lang2="fr")
+```
+
+Dacă doriți să lucrați cu o pereche de limbi diferită, le puteți specifica prin codurile lor. Un total de 92 de limbi sunt disponibile pentru acest dataset; le puteți vedea pe toate prin extinderea labelurilor de limbă pe [dataset cardul acesteia](https://huggingface.co/datasets/kde4).
+
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/language_tags.png" alt="Limba disponibilă pentru datasetul KDE4." width="100%">
+
+Să aruncăm o privire la dataset:
+
+```py
+raw_datasets
+```
+
+```python out
+DatasetDict({
+    train: Dataset({
+        features: ['id', 'translation'],
+        num_rows: 210173
+    })
+})
+```
+
+Avem 210 173 de perechi de propoziții, dar într-o singură împărțire, deci va trebui să ne creăm propriul set de validare. Așa cum am văzut în [Capitolul 5](/course/chapter5), un `Dataset` are o metodă `train_test_split()` care ne poate ajuta. Vom furniza un seed pentru reproductibilitate:
+
+```py
+split_datasets = raw_datasets["train"].train_test_split(train_size=0.9, seed=20)
+split_datasets
+```
+
+```python out
+DatasetDict({
+    train: Dataset({
+        features: ['id', 'translation'],
+        num_rows: 189155
+    })
+    test: Dataset({
+        features: ['id', 'translation'],
+        num_rows: 21018
+    })
+})
+```
+
+Putem redenumi cheia `"test"` în `"validation"` astfel:
+
+```py
+split_datasets["validation"] = split_datasets.pop("test")
+```
+
+Acum să aruncăm o privire la un element al datasetului:
+
+```py
+split_datasets["train"][1]["translation"]
+```
+
+```python out
+{'en': 'Default to expanded threads',
+ 'fr': 'Par défaut, développer les fils de discussion'}
+```
+
+Obținem un dicționar cu două propoziții în perechea de limbi solicitate. O particularitate a acestui dataset plin de termeni tehnici din domeniul informaticii este că toate sunt traduse integral în franceză. Cu toate acestea, inginerii francezi lasă majoritatea cuvintelor specifice informaticii în engleză atunci când vorbesc. Aici, de exemplu, cuvântul "threads" ar putea foarte bine să apară într-o propoziție în limba franceză, în special într-o conversație tehnică; dar în acest dataset a fost tradus în "fils de discussion". Modelul preantrenat pe care îl folosim, care a fost preantrenat pe un corpus mai mare de propoziții în franceză și engleză, alege opțiunea mai ușoară de a lăsa cuvântul așa cum este:
+
+```py
+from transformers import pipeline
+
+model_checkpoint = "Helsinki-NLP/opus-mt-en-fr"
+translator = pipeline("translation", model=model_checkpoint)
+translator("Default to expanded threads")
+```
+
+```python out
+[{'translation_text': 'Par défaut pour les threads élargis'}]
+```
+
+Un alt exemplu al acestui comportament poate fi văzut cu cuvântul "plugin", care nu este oficial un cuvânt francez, dar pe care majoritatea vorbitorilor nativi îl vor înțelege și nu se vor obosi să îl traducă.
+În datasetul KDE4, acest cuvânt a fost tradus în franceză în termenul puțin mai oficial "module d'extension":
+
+```py
+split_datasets["train"][172]["translation"]
+```
+
+```python out
+{'en': 'Unable to import %1 using the OFX importer plugin. This file is not the correct format.',
+ 'fr': "Impossible d'importer %1 en utilisant le module d'extension d'importation OFX. Ce fichier n'a pas un format correct."}
+```
+
+Modelul nostru preantrenat, cu toate acestea, rămâne la cuvântul englez compact și familiar:
+
+```py
+translator(
+    "Unable to import %1 using the OFX importer plugin. This file is not the correct format."
+)
+```
+
+```python out
+[{'translation_text': "Impossible d'importer %1 en utilisant le plugin d'importateur OFX. Ce fichier n'est pas le bon format."}]
+```
+
+Va fi interesant de văzut dacă modelul nostru fine-tuned reține aceste particularități ale datasetului(spoiler alert: va reține).
+
+<Youtube id="0Oxphw4Q9fo"/>
+
+<Tip>
+
+✏️ **Rândul tău!** Un alt cuvânt englezesc care este adesea folosit în franceză este "email". Găsiți primul sample din datasetul de antrenare care utilizează acest cuvânt. Cum este tradus? Cum traduce modelul preantrenat aceeași propoziție în limba engleză?
+
+</Tip>
+
+### Procesarea datelor[[processing-the-data]]
+
+<Youtube id="XAR8jnZZuUs"/>
+
+Ar trebui să știți deja cum stă treaba: toate textele trebuie convertite în seturi de ID-uri token, astfel încât modelul să le poată înțelege. Pentru această sarcină, va trebui să tokenizăm atât inputurile, cât și targeturile. Prima noastră sarcină este să creăm obiectul `tokenizer`. După cum am menționat mai devreme, vom utiliza un model Marian preantrenat din engleză în franceză. Dacă încercați acest cod cu o altă pereche de limbi, asigurați-vă că adaptați checkpointul modelului. Organizația [Helsinki-NLP](https://huggingface.co/Helsinki-NLP) oferă mai mult de o mie de modele în mai multe limbi.
+
+```python
+from transformers import AutoTokenizer
+
+model_checkpoint = "Helsinki-NLP/opus-mt-en-fr"
+tokenizer = AutoTokenizer.from_pretrained(model_checkpoint, return_tensors="pt")
+```
+
+De asemenea, puteți înlocui `model_checkpoint` cu orice alt model preferat din [Hub](https://huggingface.co/models) sau cu un folder local în care ați salvat un model preantrenat și un tokenizer.
+
+<Tip>
+
+💡 Dacă utilizați un tokenizer multilingv, cum ar fi mBART, mBART-50 sau M2M100, va trebui să setați codurile de limbă ale inputurilor și targeturilor în tokenizer prin setarea `tokenizer.src_lang` și `tokenizer.tgt_lang` la valorile corecte.
+
+</Tip>
+
+Pregătirea datelor noastre este destul de simplă. Trebuie să rețineți un singur lucru; trebuie să vă asigurați că tokenizerul procesează targeturile în limba de ieșire (aici, franceză). Puteți face acest lucru trecând targeturile la argumentul `text_targets` al metodei `__call__` a tokenizerului.
+
+Pentru a vedea cum funcționează acest lucru, să procesăm un sample din fiecare limbă din setul de antrenare:
+
+```python
+en_sentence = split_datasets["train"][1]["translation"]["en"]
+fr_sentence = split_datasets["train"][1]["translation"]["fr"]
+
+inputs = tokenizer(en_sentence, text_target=fr_sentence)
+inputs
+```
+
+```python out
+{'input_ids': [47591, 12, 9842, 19634, 9, 0], 'attention_mask': [1, 1, 1, 1, 1, 1], 'labels': [577, 5891, 2, 3184, 16, 2542, 5, 1710, 0]}
+```
+
+După cum putem vedea, rezultatul conține ID-urile de input asociate cu propoziția în limba engleză, în timp ce ID-urile asociate cu cea în limba franceză sunt stocate în câmpul `labels`. Dacă uitați să indicați că tokenizați labelurile, acestea vor fi tokenizate de către tokenizerul de input, ceea ce în cazul unui model Marian nu va merge deloc bine:
+
+```python
+wrong_targets = tokenizer(fr_sentence)
+print(tokenizer.convert_ids_to_tokens(wrong_targets["input_ids"]))
+print(tokenizer.convert_ids_to_tokens(inputs["labels"]))
+```
+
+```python out
+['▁Par', '▁dé', 'f', 'aut', ',', '▁dé', 've', 'lop', 'per', '▁les', '▁fil', 's', '▁de', '▁discussion', '</s>']
+['▁Par', '▁défaut', ',', '▁développer', '▁les', '▁fils', '▁de', '▁discussion', '</s>']
+```
+
+După cum se poate observa, utilizarea tokenizerului englez pentru preprocesarea unei propoziții franceze are ca rezultat mult mai mulți tokeni, deoarece tokenizerul nu cunoaște niciun cuvânt francez (cu excepția celor care apar și în limba engleză, precum "discussion").
+
+Deoarece `inputs` este un dicționar cu cheile noastre obișnuite (ID-uri de input, attention mask etc.), ultimul pas este să definim funcția de preprocesare pe care o vom aplica dataseturilor:
+
+```python
+max_length = 128
+
+
+def preprocess_function(examples):
+    inputs = [ex["en"] for ex in examples["translation"]]
+    targets = [ex["fr"] for ex in examples["translation"]]
+    model_inputs = tokenizer(
+        inputs, text_target=targets, max_length=max_length, truncation=True
+    )
+    return model_inputs
+```
+
+Rețineți că am stabilit aceeași lungime maximă pentru inputurile și outputurile noastre. Deoarece textele cu care avem de-a face par destul de scurte, vom folosi 128.
+
+<Tip>
+
+💡 Dacă utilizați un model T5 (mai precis, unul dintre checkpointurile `t5-xxx`), modelul se va aștepta ca inputurile text să aibă un prefix care să indice sarcina în cauză, cum ar fi `translate: din engleză în franceză:`.
+
+</Tip>
+
+<Tip warning={true}>
+
+⚠️ Nu acordăm atenție attention maskului a targeturilor, deoarece modelul nu se va aștepta la aceasta. În schimb, labelurile corespunzătoare unui padding token trebuie setate la `-100`, astfel încât acestea să fie ignorate în calculul pierderilor. Acest lucru va fi făcut mai târziu de data collatorul nostru, deoarece aplicăm padding dinamic, dar dacă utilizați padding aici, ar trebui să adaptați funcția de preprocesare pentru a seta toate labelurile care corespund simbolului de padding la `-100`.
+
+</Tip>
+
+Acum putem aplica această preprocesare dintr-o singură dată pe toate diviziunile datasetului nostru:
+
+```py
+tokenized_datasets = split_datasets.map(
+    preprocess_function,
+    batched=True,
+    remove_columns=split_datasets["train"].column_names,
+)
+```
+
+Acum că datele au fost preprocesate, suntem pregătiți să facem fine-tune modelul nostru preantrenat!
+
+{#if fw === 'pt'}
+
+## Fine-tuningul modelului cu API-ul `Trainer`[[fine-tuning-the-model-with-the-trainer-api]]
+
+Codul real care utilizează `Trainer` va fi același ca înainte, cu o singură mică schimbare: folosim aici un [`Seq2SeqTrainer`](https://huggingface.co/transformers/main_classes/trainer.html#seq2seqtrainer), care este o subclasă a `Trainer` care ne va permite să ne ocupăm în mod corespunzător de evaluare, folosind metoda `generate()` pentru a prezice rezultatele din inputuri. Vom analiza acest aspect mai în detaliu atunci când vom vorbi despre calculul metricelor.
+
+În primul rând, avem nevoie de un model pe care să îl aplicăm fine-tuningul. Vom utiliza API-ul obișnuit `AutoModel`:
+
+```py
+from transformers import AutoModelForSeq2SeqLM
+
+model = AutoModelForSeq2SeqLM.from_pretrained(model_checkpoint)
+```
+
+{:else}
+
+## Fine-tuningul modelului cu Keras[[fine-tuning-the-model-with-keras]]
+
+În primul rând, avem nevoie de un model pe care să îl aplicăm fine-tuningul. Vom folosi API-ul obișnuit `AutoModel`:
+
+```py
+from transformers import TFAutoModelForSeq2SeqLM
+
+model = TFAutoModelForSeq2SeqLM.from_pretrained(model_checkpoint, from_pt=True)
+```
+
+<Tip warning={false}>
+
+💡 Checkpointul `Helsinki-NLP/opus-mt-en-fr` are doar weighturi PyTorch, deci
+veți primi o eroare dacă încercați să încărcați modelul fără a utiliza argumentul
+`from_pt=True` în metoda `from_pretrained()`. Atunci când specificați
+`from_pt=True`, biblioteca va descărca și va converti automat
+weighturile PyTorch pentru voi. După cum puteți vedea, este foarte simplu să vă schimbați între
+frameworkuri în 🤗 Transformers!
+
+</Tip>
+
+{/if}
+
+Rețineți că de data aceasta folosim un model care a fost antrenat pe o sarcină de traducere și care poate fi utilizat deja, astfel încât nu există niciun avertisment cu privire la weighturile lipsă sau la cele nou inițializate.
+
+### Data collation[[data-collation]]
+
+Vom avea nevoie de un data collator care să se ocupe de paddingul pentru batching-ul dinamic. Nu putem folosi un `DataCollatorWithPadding` ca în [Capitolul 3](/course/chapter3) în acest caz, pentru că acesta doar face padding inputurilor (input Is, attention mask și token type IDs). Labelurile noastre ar trebui, de asemenea, să fie padded la lungimea maximă întâlnită în labeluri. Și, așa cum am menționat anterior, valoarea de padding utilizată pentru a face padding labelurilor ar trebui să fie `-100` și nu padding tokenul tokenizerului, pentru a ne asigura că aceste valori de padding sunt ignorate în calculul pierderilor.
+
+Toate acestea sunt realizate de un [`DataCollatorForSeq2Seq`](https://huggingface.co/transformers/main_classes/data_collator.html#datacollatorforseq2seq). Ca și `DataCollatorWithPadding`, acesta preia `tokenizer` utilizat pentru preprocesarea inputurilor, dar preia și `modelul`. Acest lucru se datorează faptului că acest data collator va fi, de asemenea, responsabil de pregătirea ID-urilor de input ale decoderului, care sunt versiuni schimbate ale labelurilor cu un token special la început. Deoarece această schimbare se face ușor diferit pentru diferite arhitecturi, `DataCollatorForSeq2Seq` trebuie să cunoască obiectul `model`:
+
+{#if fw === 'pt'}
+
+```py
+from transformers import DataCollatorForSeq2Seq
+
+data_collator = DataCollatorForSeq2Seq(tokenizer, model=model)
+```
+
+{:else}
+
+```py
+from transformers import DataCollatorForSeq2Seq
+
+data_collator = DataCollatorForSeq2Seq(tokenizer, model=model, return_tensors="tf")
+```
+
+{/if}
+
+Pentru a testa acest lucru pe câteva sampleuri, îl apelăm doar pe o listă de sampleuri din setul nostru de antrenare tokenizat:
+
+```py
+batch = data_collator([tokenized_datasets["train"][i] for i in range(1, 3)])
+batch.keys()
+```
+
+```python out
+dict_keys(['attention_mask', 'input_ids', 'labels', 'decoder_input_ids'])
+```
+
+Putem verifica dacă labelurile noastre au fost padded la lungimea maximă a batchului, folosind `-100`:
+
+```py
+batch["labels"]
+```
+
+```python out
+tensor([[  577,  5891,     2,  3184,    16,  2542,     5,  1710,     0,  -100,
+          -100,  -100,  -100,  -100,  -100,  -100],
+        [ 1211,     3,    49,  9409,  1211,     3, 29140,   817,  3124,   817,
+           550,  7032,  5821,  7907, 12649,     0]])
+```
+
+De asemenea, putem arunca o privire la ID-urile de input ale decoderului, pentru a vedea că acestea sunt versiuni schimbate ale labelurilor:
+
+```py
+batch["decoder_input_ids"]
+```
+
+```python out
+tensor([[59513,   577,  5891,     2,  3184,    16,  2542,     5,  1710,     0,
+         59513, 59513, 59513, 59513, 59513, 59513],
+        [59513,  1211,     3,    49,  9409,  1211,     3, 29140,   817,  3124,
+           817,   550,  7032,  5821,  7907, 12649]])
+```
+
+Iată labelurile pentru primul și al doilea element din datasetul nostru:
+
+```py
+for i in range(1, 3):
+    print(tokenized_datasets["train"][i]["labels"])
+```
+
+```python out
+[577, 5891, 2, 3184, 16, 2542, 5, 1710, 0]
+[1211, 3, 49, 9409, 1211, 3, 29140, 817, 3124, 817, 550, 7032, 5821, 7907, 12649, 0]
+```
+
+{#if fw === 'pt'}
+
+Vom transmite acest `data_collator` către `Seq2SeqTrainer`. În continuare, să aruncăm o privire la metrice.
+
+{:else}
+
+Acum putem folosi acest `data_collator` pentru a converti fiecare dintre dataseturile într-un `tf.data.Dataset`, gata pentru antrenare:
+
+```python
+tf_train_dataset = model.prepare_tf_dataset(
+    tokenized_datasets["train"],
+    collate_fn=data_collator,
+    shuffle=True,
+    batch_size=32,
+)
+tf_eval_dataset = model.prepare_tf_dataset(
+    tokenized_datasets["validation"],
+    collate_fn=data_collator,
+    shuffle=False,
+    batch_size=16,
+)
+```
+
+{/if}
+
+
+### Metrice[[metrics]]
+
+<Youtube id="M05L1DhFqcw"/>
+
+{#if fw === 'pt'}
+
+Caracteristica pe care `Seq2SeqTrainer` o adaugă superclasei sale `Trainer` este capacitatea de a utiliza metoda `generate()` în timpul evaluării sau predicției. În timpul antrenării, modelul va utiliza `decoder_input_ids` cu un attention mask care asigură că nu utilizează tokenii de după tokenul pe care încearcă să îl prezică, pentru a accelera antrenarea. În timpul inferenței, nu le vom putea utiliza deoarece nu vom avea labeluri, deci este o idee bună să ne evaluăm modelul cu aceeași configurație.
+
+După cum am văzut în [Capitolul 1](/course/chapter1/6), decoderul realizează inferența prin prezicerea tokenilor unul câte unul - lucru care este implementat behind the scenes în 🤗 Transformers prin metoda `generate()`. `Seq2SeqTrainer` ne va permite să folosim această metodă pentru evaluare dacă setăm `predict_with_generate=True`.
+
+{/if}
+
+Metricele tradiționale utilizate pentru traducere sunt [scorul BLEU](https://en.wikipedia.org/wiki/BLEU), introdus în [un articol din 2002](https://aclanthology.org/P02-1040.pdf) de Kishore Papineni et al. Scorul BLEU evaluează cât de apropiate sunt traducerile de labelurile lor. Acesta nu măsoară inteligibilitatea sau corectitudinea gramaticală a rezultatelor generate de model, ci utilizează reguli statistice pentru a se asigura că toate cuvintele din rezultatele generate apar și în targets. În plus, există reguli care penalizează repetițiile acelorași cuvinte dacă acestea nu sunt repetate și în targets(pentru a evita ca modelul să producă propoziții de tipul `"the the the the the the"`) și să producă propoziții care sunt mai scurte decât cele din targets(pentru a evita ca modelul să producă propoziții de tipul `"the"`).
+
+Un punct slab al BLEU este că se așteaptă ca textul să fie deja tokenizat, ceea ce face dificilă compararea scorurilor între modele care utilizează tokenizere diferite. În schimb, cea mai frecvent utilizată măsură pentru evaluarea comparativă a modelelor de traducere este [SacreBLEU](https://github.com/mjpost/sacrebleu), care abordează acest punct slab (și altele) prin standardizarea etapei de tokenizare. Pentru a utiliza această metrică, trebuie mai întâi să instalăm biblioteca SacreBLEU:
+
+```py
+!pip install sacrebleu
+```
+
+Îl putem încărca apoi prin `evaluate.load()` așa cum am făcut în [Capitolul 3](/course/chapter3):
+
+```py
+import evaluate
+
+metric = evaluate.load("sacrebleu")
+```
+
+Această metrică va lua texte ca inputuri și targeturi. Este conceput pentru a lua mai multe obiective acceptabile, deoarece există adesea mai multe traduceri acceptabile ale aceleiași propoziții - datasetul pe care îl folosim oferă doar una, dar nu este neobișnuit în NLP să găsim dataseturi care oferă mai multe propoziții ca labeluri. Deci, predicțiile ar trebui să fie o listă de propoziții, dar referințele ar trebui să fie o listă de liste de propoziții.
+
+Hai să încercăm acest exemplu:
+
+```py
+predictions = [
+    "This plugin lets you translate web pages between several languages automatically."
+]
+references = [
+    [
+        "This plugin allows you to automatically translate web pages between several languages."
+    ]
+]
+metric.compute(predictions=predictions, references=references)
+```
+
+```python out
+{'score': 46.750469682990165,
+ 'counts': [11, 6, 4, 3],
+ 'totals': [12, 11, 10, 9],
+ 'precisions': [91.67, 54.54, 40.0, 33.33],
+ 'bp': 0.9200444146293233,
+ 'sys_len': 12,
+ 'ref_len': 13}
+```
+
+Se obține un scor BLEU de 46,75, ceea ce este destul de bine - ca referință, modelul original Transformer din lucrarea ["Attention Is All You Need"](https://arxiv.org/pdf/1706.03762.pdf) a obținut un scor BLEU de 41,8 la o sarcină similară de traducere între engleză și franceză! (Pentru mai multe informații despre parametrii individuali, precum `counts` și `bp`, consultați [repositoriul SacreBLEU](https://github.com/mjpost/sacrebleu/blob/078c440168c6adc89ba75fe6d63f0d922d42bcfe/sacrebleu/metrics/bleu.py#L74).) Pe de altă parte, dacă încercăm cu cele două tipuri de predicții proaste (multe repetări sau prea scurte) care rezultă adesea din modelele de traducere, vom obține scoruri BLEU destul de proaste:
+
+```py
+predictions = ["This This This This"]
+references = [
+    [
+        "This plugin allows you to automatically translate web pages between several languages."
+    ]
+]
+metric.compute(predictions=predictions, references=references)
+```
+
+```python out
+{'score': 1.683602693167689,
+ 'counts': [1, 0, 0, 0],
+ 'totals': [4, 3, 2, 1],
+ 'precisions': [25.0, 16.67, 12.5, 12.5],
+ 'bp': 0.10539922456186433,
+ 'sys_len': 4,
+ 'ref_len': 13}
+```
+
+```py
+predictions = ["This plugin"]
+references = [
+    [
+        "This plugin allows you to automatically translate web pages between several languages."
+    ]
+]
+metric.compute(predictions=predictions, references=references)
+```
+
+```python out
+{'score': 0.0,
+ 'counts': [2, 1, 0, 0],
+ 'totals': [2, 1, 0, 0],
+ 'precisions': [100.0, 100.0, 0.0, 0.0],
+ 'bp': 0.004086771438464067,
+ 'sys_len': 2,
+ 'ref_len': 13}
+```
+
+Scorul poate varia de la 0 la 100, iar mai mare înseamnă un scor mai bun.
+
+{#if fw === 'tf'}
+
+Pentru a trece de la rezultatele modelului la texte pe care metricele le pot utiliza, vom utiliza metoda `tokenizer.batch_decode()`. Trebuie doar să curățăm toate `-100` din labeluri; tokenizerul va face automat același lucru pentru padding token. Să definim o funcție care să preia modelul nostru și un dataset și să calculeze metrici pe acesta. De asemenea, vom utiliza un truc care crește dramatic performanța - compilarea codului nostru de generare cu [XLA](https://www.tensorflow.org/xla), compilatorul accelerat de algebră liniară al TensorFlow. XLA aplică diverse optimizări graficului de calcul al modelului și are ca rezultat îmbunătățiri semnificative ale vitezei și utilizării memoriei. După cum se descrie în [blogul](https://huggingface.co/blog/tf-xla-generate) Hugging Face, XLA funcționează cel mai bine atunci când shaperulire noastre de input nu variază prea mult. Pentru a face față acestui lucru, vom aplica padding inputurilor cu multipli ai 128 și vom crea un nou dataset cu padding collatorul, iar apoi vom aplica decoratorul `@tf.function(jit_compile=True)` funcției noastre de generare, care marchează întreaga funcție pentru compilare cu XLA.
+
+```py
+import numpy as np
+import tensorflow as tf
+from tqdm import tqdm
+
+generation_data_collator = DataCollatorForSeq2Seq(
+    tokenizer, model=model, return_tensors="tf", pad_to_multiple_of=128
+)
+
+tf_generate_dataset = model.prepare_tf_dataset(
+    tokenized_datasets["validation"],
+    collate_fn=generation_data_collator,
+    shuffle=False,
+    batch_size=8,
+)
+
+
+@tf.function(jit_compile=True)
+def generate_with_xla(batch):
+    return model.generate(
+        input_ids=batch["input_ids"],
+        attention_mask=batch["attention_mask"],
+        max_new_tokens=128,
+    )
+
+
+def compute_metrics():
+    all_preds = []
+    all_labels = []
+
+    for batch, labels in tqdm(tf_generate_dataset):
+        predictions = generate_with_xla(batch)
+        decoded_preds = tokenizer.batch_decode(predictions, skip_special_tokens=True)
+        labels = labels.numpy()
+        labels = np.where(labels != -100, labels, tokenizer.pad_token_id)
+        decoded_labels = tokenizer.batch_decode(labels, skip_special_tokens=True)
+        decoded_preds = [pred.strip() for pred in decoded_preds]
+        decoded_labels = [[label.strip()] for label in decoded_labels]
+        all_preds.extend(decoded_preds)
+        all_labels.extend(decoded_labels)
+
+    result = metric.compute(predictions=all_preds, references=all_labels)
+    return {"bleu": result["score"]}
+```
+
+{:else}
+
+Pentru a trece de la rezultatele modelului la textele pe care metricele le pot utiliza, vom utiliza metoda `tokenizer.batch_decode()`. Trebuie doar să curățăm toate `-100` din labeluri(tokenizerul va face automat același lucru pentru padding token):
+
+```py
+import numpy as np
+
+
+def compute_metrics(eval_preds):
+    preds, labels = eval_preds
+    # In case the model returns more than the prediction logits
+    if isinstance(preds, tuple):
+        preds = preds[0]
+
+    decoded_preds = tokenizer.batch_decode(preds, skip_special_tokens=True)
+
+    # Replace -100s in the labels as we can't decode them
+    labels = np.where(labels != -100, labels, tokenizer.pad_token_id)
+    decoded_labels = tokenizer.batch_decode(labels, skip_special_tokens=True)
+
+    # Some simple post-processing
+    decoded_preds = [pred.strip() for pred in decoded_preds]
+    decoded_labels = [[label.strip()] for label in decoded_labels]
+
+    result = metric.compute(predictions=decoded_preds, references=decoded_labels)
+    return {"bleu": result["score"]}
+```
+
+{/if}
+
+Acum că am făcut acest lucru, suntem gata să facem fine-tune modelului!
+
+
+### Fine-tuningul modelului[[fine-tuning-the-model]]
+
+Primul pas pe care trebuie să îl faceți este să vă conectați la Hugging Face, astfel încât să vă puteți încărca rezultatele în Model Hub. Există o funcție convenabilă care vă ajuta cu acest lucru într-un notebook:
+
+```python
+from huggingface_hub import notebook_login
+
+notebook_login()
+```
+
+Aceasta va afișa un widget în care puteți introduce datele voastre de autentificare Hugging Face.
+
+Dacă nu lucrați într-un notebook, tastați următoarea linie în terminal:
+
+```bash
+huggingface-cli login
+```
+
+{#if fw === 'tf'}
+
+Înainte de a începe, să vedem ce fel de rezultate obținem de la modelul nostru fără niciun antrenament:
+
+```py
+print(compute_metrics())
+```
+
+```
+{'bleu': 33.26983701454733}
+```
+
+Odată făcut acest lucru, putem pregăti tot ce avem nevoie pentru a compila și antrena modelul nostru. Observați utilizarea `tf.keras.mixed_precision.set_global_policy("mixed_float16")` -- aceasta îi va spune lui Keras să se antreneze folosind float16, ceea ce poate oferi o creștere semnificativă a vitezei pe GPU-urile care o acceptă (Nvidia 20xx/V100 sau mai noi).
+
+```python
+from transformers import create_optimizer
+from transformers.keras_callbacks import PushToHubCallback
+import tensorflow as tf
+
+# Numărul etapelor de antrenare este numărul de sampleuri din dataset, împărțit la dimensiunea batchului, apoi înmulțit
+# cu numărul total de epoci. Rețineți că datasetul tf_train_dataset de aici este un dataset tf.data.Dataset în batchuri,
+# nu datasetul original Hugging Face, deci len() este deja num_samples // batch_size.
+num_epochs = 3
+num_train_steps = len(tf_train_dataset) * num_epochs
+
+optimizer, schedule = create_optimizer(
+    init_lr=5e-5,
+    num_warmup_steps=0,
+    num_train_steps=num_train_steps,
+    weight_decay_rate=0.01,
+)
+model.compile(optimizer=optimizer)
+
+# Antrenarea în float16 cu precizie mixtă
+tf.keras.mixed_precision.set_global_policy("mixed_float16")
+```
+
+În continuare, definim un `PushToHubCallback` pentru a încărca modelul nostru în Hub în timpul antrenamentului, așa cum am văzut în [secțiunea 2]((/course/chapter7/2)), iar apoi pur și simplu facem fit modelului cu acel callback:
+
+```python
+from transformers.keras_callbacks import PushToHubCallback
+
+callback = PushToHubCallback(
+    output_dir="marian-finetuned-kde4-en-to-fr", tokenizer=tokenizer
+)
+
+model.fit(
+    tf_train_dataset,
+    validation_data=tf_eval_dataset,
+    callbacks=[callback],
+    epochs=num_epochs,
+)
+```
+
+Rețineți că puteți specifica numele repositoriului către care doriți să faceți push cu argumentul `hub_model_id` (în special, va trebui să utilizați acest argument pentru a face push către o organizație). De exemplu, atunci când am trimis modelul către organizația [`huggingface-course`](https://huggingface.co/huggingface-course), am adăugat `hub_model_id="huggingface-course/marian-finetuned-kde4-en-to-fr"` la `Seq2SeqTrainingArguments`. În mod implicit, repositoriul utilizat va fi în namespaceul vostru și denumit după output directory-ul pe care l-ați stabilit, deci aici va fi `"sgugger/marian-finetuned-kde4-en-to-fr"` (care este modelul la care am făcut legătura la începutul acestei secțiuni).
+
+<Tip>
+
+💡 Dacă output directory-ul pe care îl utilizați există deja, acesta trebuie să fie o clonă locală a repositoriului către care doriți să faceți push. Dacă nu este, veți primi o eroare atunci când apelați `model.fit()` și va trebui să setați un nume nou.
+
+</Tip>
+
+În cele din urmă, hai să vedem cum arată metricele noastre acum că antrenarea s-a încheiat:
+
+```py
+print(compute_metrics())
+```
+
+```
+{'bleu': 57.334066271545865}
+```
+
+În acest moment, puteți utiliza widgetul de inferență de pe Model Hub pentru a testa modelul și pentru a-l partaja cu prietenii voștrii. Ați făcut fine-tune cu succes unui model pentru o sarcină de traducere - felicitări!
+
+{:else}
+
+Odată făcut acest lucru, putem defini `Seq2SeqTrainingArguments`. Ca și pentru `Trainer`, folosim o subclasă a `TrainingArguments` care conține câteva câmpuri suplimentare:
+
+```python
+from transformers import Seq2SeqTrainingArguments
+
+args = Seq2SeqTrainingArguments(
+    f"marian-finetuned-kde4-en-to-fr",
+    evaluation_strategy="no",
+    save_strategy="epoch",
+    learning_rate=2e-5,
+    per_device_train_batch_size=32,
+    per_device_eval_batch_size=64,
+    weight_decay=0.01,
+    save_total_limit=3,
+    num_train_epochs=3,
+    predict_with_generate=True,
+    fp16=True,
+    push_to_hub=True,
+)
+```
+
+În afară de hiperparametrii obișnuiți (cum ar fi rata de învățare, numărul de epoci, dimensiunea batch-ului și o anumită scădere a weighturilor), aici sunt câteva schimbări în comparație cu ceea ce am văzut în secțiunile anterioare:
+
+- Nu setăm nicio evaluare periodică, deoarece evaluarea durează; ne vom evalua modelul doar o dată înainte și după antrenare.
+- Setăm `fp16=True`, care accelerează antrenarea pe GPU-urile moderne.
+- Setăm `predict_with_generate=True`, așa cum am discutat mai sus.
+- Utilizăm `push_to_hub=True` pentru a încărca modelul în Hub la sfârșitul fiecărei epoci.
+
+Rețineți că puteți specifica numele complet al repositoriului către care doriți să faceți push cu argumentul `hub_model_id` (în special, va trebui să utilizați acest argument pentru a face push către o organizație). De exemplu, atunci când am trimis modelul către organizația [`huggingface-course`](https://huggingface.co/huggingface-course), am adăugat `hub_model_id="huggingface-course/marian-finetuned-kde4-en-to-fr"` la `Seq2SeqTrainingArguments`. În mod implicit, repositoriul utilizat va fi în namespaceul vostru și denumit după output directory-ul pe care l-ați stabilit, deci în cazul nostru va fi `"sgugger/marian-finetuned-kde4-en-to-fr"` (care este modelul la care am făcut legătura la începutul acestei secțiuni).
+
+<Tip>
+
+💡 Dacă output directory-ul pe care îl utilizați există deja, acesta trebuie să fie o clonă locală a repositoriului către care doriți să faceți push. În caz contrar, veți primi o eroare atunci când vă definiți `Seq2SeqTrainer` și va trebui să stabiliți un nume nou.
+
+</Tip>
+
+În final, transmitem totul către `Seq2SeqTrainer`:
+
+```python
+from transformers import Seq2SeqTrainer
+
+trainer = Seq2SeqTrainer(
+    model,
+    args,
+    train_dataset=tokenized_datasets["train"],
+    eval_dataset=tokenized_datasets["validation"],
+    data_collator=data_collator,
+    tokenizer=tokenizer,
+    compute_metrics=compute_metrics,
+)
+```
+
+Înainte de antrenare, ne vom uita mai întâi la scorul obținut de modelul nostru, pentru a verifica dacă nu înrăutățim lucrurile prin fine-tuning. Această comandă va dura ceva timp, așa că puteți lua o cafea sau două în timp ce se execută:
+
+```python
+trainer.evaluate(max_length=max_length)
+```
+
+```python out
+{'eval_loss': 1.6964408159255981,
+ 'eval_bleu': 39.26865061007616,
+ 'eval_runtime': 965.8884,
+ 'eval_samples_per_second': 21.76,
+ 'eval_steps_per_second': 0.341}
+```
+
+Un scor BLEU de 39 nu este prea rău, ceea ce reflectă faptul că modelul nostru este deja bun la traducerea propozițiilor din engleză în franceză.
+
+Urmează antrenarea, care va necesita, de asemenea, puțin timp:
+
+```python
+trainer.train()
+```
+
+Rețineți că, în timpul antrenamentului, de fiecare dată când modelul este salvat (aici, la fiecare epocă), acesta este încărcat în Hub în fundal. În acest fel, veți putea să reluați antrenarea pe o altă mașină, dacă este necesar.
+
+Odată ce formarea este terminată, evaluăm din nou modelul nostru - sperăm că vom vedea o îmbunătățire a scorului BLEU!
+
+```py
+trainer.evaluate(max_length=max_length)
+```
+
+```python out
+{'eval_loss': 0.8558505773544312,
+ 'eval_bleu': 52.94161337775576,
+ 'eval_runtime': 714.2576,
+ 'eval_samples_per_second': 29.426,
+ 'eval_steps_per_second': 0.461,
+ 'epoch': 3.0}
+```
+
+Aceasta este o îmbunătățire de aproape 14 puncte, ceea ce este minunat.
+
+În final, folosim metoda `push_to_hub()` pentru a ne asigura că încărcăm cea mai recentă versiune a modelului. De asemenea, `Trainer` redactează un model card cu toate rezultatele evaluării și o încarcă. Acest model card conține metadate care ajută Model Hub să aleagă widgetul pentru demonstrația de inferență. De obicei, nu este nevoie să se menționeze nimic, deoarece poate deduce widgetul potrivit din clasa modelului, dar în acest caz, aceeași clasă de model poate fi utilizată pentru toate tipurile de probleme de tip sequence-to-sequence, așa că specificăm că este un model de traducere:
+
+```py
+trainer.push_to_hub(tags="translation", commit_message="Training complete")
+```
+
+Această comandă returnează URL-ul comitului pe care tocmai l-am făcut, dacă doriți să îl inspectați:
+
+```python out
+'https://huggingface.co/sgugger/marian-finetuned-kde4-en-to-fr/commit/3601d621e3baae2bc63d3311452535f8f58f6ef3'
+```
+
+În această etapă, puteți utiliza widget-ul de inferență de pe Model Hub pentru a vă testa modelul și pentru a-l partaja cu prietenii. Ați făcut fine-tune cu succes un model pentru o sarcină de traducere - felicitări!
+
+Dacă doriți să pătrundeți puțin mai adânc în bucla de antrenare, vă vom arăta acum să faceți același lucru folosind 🤗 Accelerate.
+
+{/if}
+
+{#if fw === 'pt'}
+
+## O buclă de antrenare personalizată[[a-custom-training-loop]]
+
+Să aruncăm acum o privire la bucla de antrenare completă, astfel încât să puteți personaliza cu ușurință părțile de care aveți nevoie. Va arăta foarte asemănător cu ceea ce am făcut în [secțiunea 2](/course/chapter7/2) și [capitolul 3](/course/chapter7/4).
+
+### Pregătirea tuturor lucrulilor pentru antrenare[[preparing-everything-for-training]]
+
+Ați văzut toate acestea de câteva ori până acum, așa că vom trece prin cod destul de repede. Mai întâi vom construi `DataLoader`s din dataseturile noastre, după ce vom seta dataseturile în formatul `"torch"` astfel încât să obținem tensori PyTorch:
+
+```py
+from torch.utils.data import DataLoader
+
+tokenized_datasets.set_format("torch")
+train_dataloader = DataLoader(
+    tokenized_datasets["train"],
+    shuffle=True,
+    collate_fn=data_collator,
+    batch_size=8,
+)
+eval_dataloader = DataLoader(
+    tokenized_datasets["validation"], collate_fn=data_collator, batch_size=8
+)
+```
+
+În continuare, reinițializăm modelul, pentru a ne asigura că nu continuăm fine-tuningul de dinainte, ci pornim din nou de la modelul preantrenat:
+
+```py
+model = AutoModelForSeq2SeqLM.from_pretrained(model_checkpoint)
+```
+
+Pe urmă vom avea nevoie de un optimizator:
+
+```py
+from transformers import AdamW
+
+optimizer = AdamW(model.parameters(), lr=2e-5)
+```
+
+Odată ce avem toate aceste obiecte, le putem trimite la metoda `accelerator.prepare()`. Amintiți-vă că, dacă doriți să vă antrenați pe un TPU într-un notebook Colab, va trebui să mutați tot acest cod într-o funcție de antrenare, care nu ar trebui să execute nicio celulă care inițializează un `Accelerator`.
+
+```py
+from accelerate import Accelerator
+
+accelerator = Accelerator()
+model, optimizer, train_dataloader, eval_dataloader = accelerator.prepare(
+    model, optimizer, train_dataloader, eval_dataloader
+)
+```
+
+Acum că am trimis `train_dataloader` la `accelerator.prepare()`, putem utiliza lungimea acestuia pentru a calcula numărul de pași de antrenare. Amintiți-vă că trebuie să facem acest lucru întotdeauna după pregătirea data loaderului, deoarece metoda respectivă va modifica lungimea `DataLoader`. Utilizăm un program liniar clasic de la rata de învățare la 0:
+
+```py
+from transformers import get_scheduler
+
+num_train_epochs = 3
+num_update_steps_per_epoch = len(train_dataloader)
+num_training_steps = num_train_epochs * num_update_steps_per_epoch
+
+lr_scheduler = get_scheduler(
+    "linear",
+    optimizer=optimizer,
+    num_warmup_steps=0,
+    num_training_steps=num_training_steps,
+)
+```
+
+În cele din urmă, pentru a trimite modelul nostru către Hub, va trebui să creăm un obiect `Repository` într-un folder de lucru. În primul rând, conectați-vă la Hugging Face Hub, dacă nu sunteți deja conectat. Vom determina numele repositoriului pornind de la ID-ul modelului pe care dorim să îl atribuim modelului nostru (nu ezitați să înlocuiți `repo_name` cu propria alegere; acesta trebuie doar să conțină numele vostru de utilizator, ceea ce face funcția `get_full_repo_name()`):
+
+```py
+from huggingface_hub import Repository, get_full_repo_name
+
+model_name = "marian-finetuned-kde4-en-to-fr-accelerate"
+repo_name = get_full_repo_name(model_name)
+repo_name
+```
+
+```python out
+'sgugger/marian-finetuned-kde4-en-to-fr-accelerate'
+```
+
+Apoi putem clona acel repositoriu într-un folder local. Dacă există deja, acest folder local ar trebui să fie o clonă a repositoriului cu care lucrăm:
+
+```py
+output_dir = "marian-finetuned-kde4-en-to-fr-accelerate"
+repo = Repository(output_dir, clone_from=repo_name)
+```
+
+Acum putem încărca orice salvăm în `output_dir` prin apelarea metodei `repo.push_to_hub()`. Acest lucru ne va ajuta să încărcăm modelele intermediare la sfârșitul fiecărei epoci.
+
+### Bucla de antrenare[[training-loop]]
+
+Acum suntem pregătiți să scriem bucla de antrenare completă. Pentru a simplifica partea de evaluare, definim această funcție `postprocess()` care preia predicțiile și labelurile și le convertește în liste de stringuri pe care obiectul nostru `metric` le va aștepta:
+
+```py
+def postprocess(predictions, labels):
+    predictions = predictions.cpu().numpy()
+    labels = labels.cpu().numpy()
+
+    decoded_preds = tokenizer.batch_decode(predictions, skip_special_tokens=True)
+
+    # Replace -100 in the labels as we can't decode them.
+    labels = np.where(labels != -100, labels, tokenizer.pad_token_id)
+    decoded_labels = tokenizer.batch_decode(labels, skip_special_tokens=True)
+
+    # Some simple post-processing
+    decoded_preds = [pred.strip() for pred in decoded_preds]
+    decoded_labels = [[label.strip()] for label in decoded_labels]
+    return decoded_preds, decoded_labels
+```
+
+Bucla de antrenare seamănă foarte mult cu cele din [secțiunea 2](/course/chapter7/2) și [capitolul 3](/course/chapter3), cu câteva diferențe în partea de evaluare - așa că hai să ne concentrăm pe asta!
+
+Primul lucru pe care îl putem remarca este că folosim metoda `generate()` pentru a calcula predicțiile, dar aceasta este o metodă a modelul nostru de bază, nu pe modelul wrapped 🤗 Accelerate creat în metoda `prepare()`. De aceea, mai întâi facem unwrap modelului, apoi apelăm această metodă.
+
+Al doilea lucru este că, la fel ca în cazul [token classification](/course/chapter7/2), este posibil ca două procese să fi făcut padding inputurilor și labelurilor cu forme diferite, așa că folosim `accelerator.pad_across_processes()` pentru a face predicțiile și labelurile de aceeași formă înainte de a apela metoda `gather()`. Dacă nu facem acest lucru, evaluarea va da o eroare sau se va bloca pentru totdeauna.
+
+```py
+from tqdm.auto import tqdm
+import torch
+
+progress_bar = tqdm(range(num_training_steps))
+
+for epoch in range(num_train_epochs):
+    # Training
+    model.train()
+    for batch in train_dataloader:
+        outputs = model(**batch)
+        loss = outputs.loss
+        accelerator.backward(loss)
+
+        optimizer.step()
+        lr_scheduler.step()
+        optimizer.zero_grad()
+        progress_bar.update(1)
+
+    # Evaluation
+    model.eval()
+    for batch in tqdm(eval_dataloader):
+        with torch.no_grad():
+            generated_tokens = accelerator.unwrap_model(model).generate(
+                batch["input_ids"],
+                attention_mask=batch["attention_mask"],
+                max_length=128,
+            )
+        labels = batch["labels"]
+
+        # Necessary to pad predictions and labels for being gathered
+        generated_tokens = accelerator.pad_across_processes(
+            generated_tokens, dim=1, pad_index=tokenizer.pad_token_id
+        )
+        labels = accelerator.pad_across_processes(labels, dim=1, pad_index=-100)
+
+        predictions_gathered = accelerator.gather(generated_tokens)
+        labels_gathered = accelerator.gather(labels)
+
+        decoded_preds, decoded_labels = postprocess(predictions_gathered, labels_gathered)
+        metric.add_batch(predictions=decoded_preds, references=decoded_labels)
+
+    results = metric.compute()
+    print(f"epoch {epoch}, BLEU score: {results['score']:.2f}")
+
+    # Save and upload
+    accelerator.wait_for_everyone()
+    unwrapped_model = accelerator.unwrap_model(model)
+    unwrapped_model.save_pretrained(output_dir, save_function=accelerator.save)
+    if accelerator.is_main_process:
+        tokenizer.save_pretrained(output_dir)
+        repo.push_to_hub(
+            commit_message=f"Training in progress epoch {epoch}", blocking=False
+        )
+```
+
+```python out
+epoch 0, BLEU score: 53.47
+epoch 1, BLEU score: 54.24
+epoch 2, BLEU score: 54.44
+```
+
+Odată făcut acest lucru, ar trebui să aveți un model care are rezultate destul de asemănătoare cu cel antrenat cu `Seq2SeqTrainer`. Îl puteți verifica pe cel pe care l-am antrenat folosind acest cod la [*huggingface-course/marian-finetuned-kde4-en-to-fr-accelerate*] (https://huggingface.co/huggingface-course/marian-finetuned-kde4-en-to-fr-accelerate). Și dacă doriți să testați orice modificări ale buclei de antrenare, le puteți implementa direct prin editarea codului prezentat mai sus!
+
+{/if}
+
+## Utilizarea modelului fine-tuned[[using-the-fine-tuned-model]]
+
+V-am arătat deja cum puteți utiliza modelul pe căruia i-am aplicat fine-tune pe Model Hub cu widgetul de inferență. Pentru a-l utiliza la nivel local într-un `pipeline`, trebuie doar să specificăm identificatorul de model corespunzător:
+
+```py
+from transformers import pipeline
+
+# Replace this with your own checkpoint
+model_checkpoint = "huggingface-course/marian-finetuned-kde4-en-to-fr"
+translator = pipeline("translation", model=model_checkpoint)
+translator("Default to expanded threads")
+```
+
+```python out
+[{'translation_text': 'Par défaut, développer les fils de discussion'}]
+```
+
+Așa cum era de așteptat, modelul nostru preantrenat și-a adaptat cunoștințele la corpusul pe care i-am făcut fine-tune și, în loc să lase cuvântul englezesc "threads", acum îl traduce în versiunea oficială franceză. Același lucru este valabil și pentru "plugin":
+
+```py
+translator(
+    "Unable to import %1 using the OFX importer plugin. This file is not the correct format."
+)
+```
+
+```python out
+[{'translation_text': "Impossible d'importer %1 en utilisant le module externe d'importation OFX. Ce fichier n'est pas le bon format."}]
+```
+
+Un alt exemplu excelent de adaptare a domeniului!
+
+<Tip>
+
+✏️ **E rândul tău!** Care este rezultatul modelului pentru sampleul cuvântul "email" pe care l-ai identificat mai devreme?
+
+</Tip>
diff --git a/chapters/rum/chapter7/5.mdx b/chapters/rum/chapter7/5.mdx
new file mode 100644
index 000000000..84157cc3f
--- /dev/null
+++ b/chapters/rum/chapter7/5.mdx
@@ -0,0 +1,1074 @@
+<FrameworkSwitchCourse {fw} />
+
+# Sumarizare[[summarization]]
+
+{#if fw === 'pt'}
+
+<CourseFloatingBanner chapter={7}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter7/section5_pt.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter7/section5_pt.ipynb"},
+]} />
+
+{:else}
+
+<CourseFloatingBanner chapter={7}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter7/section5_tf.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter7/section5_tf.ipynb"},
+]} />
+
+{/if}
+
+
+În această secțiune vom analiza modul în care modelele Transformer pot fi utilizate pentru a condensa documente lungi în rezumate, o sarcină cunoscută sub numele de _text summarization_. Aceasta este una dintre cele mai dificile sarcini NLP, deoarece necesită o gamă largă de abilități, cum ar fi înțelegerea pasajelor lungi și generarea unui text coerent care integrează principalele subiecte dintr-un document. Cu toate acestea, atunci când este bine realizată, rezumarea textului este un instrument puternic care poate accelera diverse procese de business prin scutirea experților într-u anumit domeniu de a citi documente lungi în detaliu.
+
+<Youtube id="yHnr5Dk2zCI"/>
+
+Deși există deja diverse modele bine puse la punct pentru sumarizare pe [Hugging Face Hub] (https://huggingface.co/models?pipeline_tag=summarization&sort=downloads), aproape toate acestea sunt potrivite numai pentru documentele în limba engleză. Prin urmare, pentru a adăuga o întorsătură în această secțiune, vom antrena un model bilingv pentru engleză și spaniolă. Până la sfârșitul acestei secțiuni, veți avea un [model](https://huggingface.co/huggingface-course/mt5-small-finetuned-amazon-en-es) care poate rezuma recenziile clienților precum cel prezentat aici:
+
+
+<iframe src="https://course-demos-mt5-small-finetuned-amazon-en-es.hf.space" frameBorder="0" height="400" title="Gradio app" class="block dark:hidden container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
+
+După cum vom vedea, aceste rezumate sunt concise deoarece sunt învățate din titlurile pe care clienții le furnizează în recenziile lor despre produse. Să începem prin alcătuirea unui corpus bilingv adecvat pentru această sarcină.
+
+## Pregătirea unui corpus multilingv[[preparing-a-multilingual-corpus]]
+
+Vom utiliza [Multilingual Amazon Reviews Corpus] (https://huggingface.co/datasets/amazon_reviews_multi) pentru a crea bilingv summarizerul nostru. Acest corpus este format din recenzii ale produselor Amazon în șase limbi și este utilizat de obicei pentru a evalua clasificatoarele multilingve. Cu toate acestea, deoarece fiecare recenzie este însoțită de un titlu scurt, putem folosi titlurile ca rezumate țintă din care modelul nostru să învețe! Pentru a începe, să descărcăm subseturile în engleză și spaniolă de la Hugging Face Hub:
+
+```python
+from datasets import load_dataset
+
+spanish_dataset = load_dataset("amazon_reviews_multi", "es")
+english_dataset = load_dataset("amazon_reviews_multi", "en")
+english_dataset
+```
+
+```python out
+DatasetDict({
+    train: Dataset({
+        features: ['review_id', 'product_id', 'reviewer_id', 'stars', 'review_body', 'review_title', 'language', 'product_category'],
+        num_rows: 200000
+    })
+    validation: Dataset({
+        features: ['review_id', 'product_id', 'reviewer_id', 'stars', 'review_body', 'review_title', 'language', 'product_category'],
+        num_rows: 5000
+    })
+    test: Dataset({
+        features: ['review_id', 'product_id', 'reviewer_id', 'stars', 'review_body', 'review_title', 'language', 'product_category'],
+        num_rows: 5000
+    })
+})
+```
+
+După cum puteți vedea, pentru fiecare limbă există 200.000 de recenzii pentru splitul `train` și 5.000 de recenzii pentru fiecare dintre spliturile `validation` și `test`. Informațiile despre recenzii care ne interesează sunt conținute în coloanele `review_body` și `review_title`. Să analizăm câteva exemple prin crearea unei funcții simple care preia un sample aleatoriu din setul de antrenare cu ajutorul tehnicilor învățate în [Capitolul 5](/course/chapter5):
+
+```python
+def show_samples(dataset, num_samples=3, seed=42):
+    sample = dataset["train"].shuffle(seed=seed).select(range(num_samples))
+    for example in sample:
+        print(f"\n'>> Title: {example['review_title']}'")
+        print(f"'>> Review: {example['review_body']}'")
+
+
+show_samples(english_dataset)
+```
+
+```python out
+'>> Title: Worked in front position, not rear'
+'>> Review: 3 stars because these are not rear brakes as stated in the item description. At least the mount adapter only worked on the front fork of the bike that I got it for.'
+
+'>> Title: meh'
+'>> Review: Does it’s job and it’s gorgeous but mine is falling apart, I had to basically put it together again with hot glue'
+
+'>> Title: Can\'t beat these for the money'
+'>> Review: Bought this for handling miscellaneous aircraft parts and hanger "stuff" that I needed to organize; it really fit the bill. The unit arrived quickly, was well packaged and arrived intact (always a good sign). There are five wall mounts-- three on the top and two on the bottom. I wanted to mount it on the wall, so all I had to do was to remove the top two layers of plastic drawers, as well as the bottom corner drawers, place it when I wanted and mark it; I then used some of the new plastic screw in wall anchors (the 50 pound variety) and it easily mounted to the wall. Some have remarked that they wanted dividers for the drawers, and that they made those. Good idea. My application was that I needed something that I can see the contents at about eye level, so I wanted the fuller-sized drawers. I also like that these are the new plastic that doesn\'t get brittle and split like my older plastic drawers did. I like the all-plastic construction. It\'s heavy duty enough to hold metal parts, but being made of plastic it\'s not as heavy as a metal frame, so you can easily mount it to the wall and still load it up with heavy stuff, or light stuff. No problem there. For the money, you can\'t beat it. Best one of these I\'ve bought to date-- and I\'ve been using some version of these for over forty years.'
+```
+
+<Tip>
+
+✏️ **Încercați!** Schimbați seedul aleatoriu în comanda `Dataset.shuffle()` pentru a explora alte recenzii din corpus. Dacă sunteți vorbitor de spaniolă, aruncați o privire la unele dintre recenziile din `spanish_dataset` pentru a vedea dacă și titlurile par a fi rezumate rezonabil.
+
+</Tip>
+
+Acest sample arată diversitatea recenziilor pe care le găsim de obicei online, variind de la pozitive la negative (și totul între ele!). Deși exemplul cu titlul "meh" nu este foarte informativ, celelalte titluri par a fi rezumate decente ale recenziilor în sine. Antrenarea unui model de rezumare pe toate cele 400 000 de recenzii ar dura mult prea mult pe un singur GPU, așa că ne vom concentra pe generarea de rezumate pentru un singur domeniu de produse. Pentru a avea o idee despre domeniile din care putem alege, să convertim `english_dataset` într-un `pandas.DataFrame` și să calculăm numărul de recenzii per categorie de produse:
+
+```python
+english_dataset.set_format("pandas")
+english_df = english_dataset["train"][:]
+# Show counts for top 20 products
+english_df["product_category"].value_counts()[:20]
+```
+
+```python out
+home                      17679
+apparel                   15951
+wireless                  15717
+other                     13418
+beauty                    12091
+drugstore                 11730
+kitchen                   10382
+toy                        8745
+sports                     8277
+automotive                 7506
+lawn_and_garden            7327
+home_improvement           7136
+pet_products               7082
+digital_ebook_purchase     6749
+pc                         6401
+electronics                6186
+office_product             5521
+shoes                      5197
+grocery                    4730
+book                       3756
+Name: product_category, dtype: int64
+```
+
+Cele mai populare produse din datasetul în limba engleză sunt despre articole de uz casnic, îmbrăcăminte și electronice fără fir. Cu toate acestea, pentru a rămâne la Amazontheme, să ne concentrăm pe rezumatul recenziilor de cărți - la urma urmei, acesta este motivul pentru care compania a fost fondată! Putem vedea două categorii de produse care se potrivesc (`book` și `digital_ebook_purchase`), deci să filtrăm dataseturile în ambele limbi doar pentru aceste produse. După cum am văzut în [Capitolul 5](/course/chapter5), funcția `Dataset.filter()` ne permite să tăiem un datasetfoarte eficient, deci putem defini o funcție simplă pentru a face acest lucru:
+
+```python
+def filter_books(example):
+    return (
+        example["product_category"] == "book"
+        or example["product_category"] == "digital_ebook_purchase"
+    )
+```
+
+Acum, când aplicăm această funcție la `english_dataset` și `spanish_dataset`, rezultatul va conține doar acele rânduri care implică categoriile de cărți. Înainte de a aplica filtrul, să schimbăm formatul din `english_dataset` din `"pandas"` înapoi în `"arrow"`:
+
+```python
+english_dataset.reset_format()
+```
+
+Putem aplica apoi funcția de filtrare și, ca o verificare a corectitudinii, să inspectăm un sample de recenzii pentru a vedea dacă acestea sunt într-adevăr despre cărți:
+
+```python
+spanish_books = spanish_dataset.filter(filter_books)
+english_books = english_dataset.filter(filter_books)
+show_samples(english_books)
+```
+
+```python out
+'>> Title: I\'m dissapointed.'
+'>> Review: I guess I had higher expectations for this book from the reviews. I really thought I\'d at least like it. The plot idea was great. I loved Ash but, it just didnt go anywhere. Most of the book was about their radio show and talking to callers. I wanted the author to dig deeper so we could really get to know the characters. All we know about Grace is that she is attractive looking, Latino and is kind of a brat. I\'m dissapointed.'
+
+'>> Title: Good art, good price, poor design'
+'>> Review: I had gotten the DC Vintage calendar the past two years, but it was on backorder forever this year and I saw they had shrunk the dimensions for no good reason. This one has good art choices but the design has the fold going through the picture, so it\'s less aesthetically pleasing, especially if you want to keep a picture to hang. For the price, a good calendar'
+
+'>> Title: Helpful'
+'>> Review: Nearly all the tips useful and. I consider myself an intermediate to advanced user of OneNote. I would highly recommend.'
+```
+
+Bine, putem vedea că recenziile nu sunt strict despre cărți și se pot referi la lucruri precum calendare și aplicații electronice precum OneNote. Cu toate acestea, domeniul pare potrivit pentru a antrena un model de sumarizare. Înainte de a analiza diferitele modele care sunt potrivite pentru această sarcină, trebuie să mai pregătim puțin datele: să combinăm recenziile în engleză și spaniolă ca un singur obiect `DatasetDict`. 🤗 Datasets oferă o funcție utilă `concatenate_datasets()` care (după cum sugerează și numele) va concatena două obiecte `Dataset` unul peste celălalt. Așadar, pentru a crea datasetul nostru bilingv, vom parcurge în buclă fiecare împărțire, vom concatena dataseturile pentru acel split și vom amesteca rezultatul pentru a ne asigura că modelul nostru nu se adaptează excesiv la o singură limbă:
+
+```python
+from datasets import concatenate_datasets, DatasetDict
+
+books_dataset = DatasetDict()
+
+for split in english_books.keys():
+    books_dataset[split] = concatenate_datasets(
+        [english_books[split], spanish_books[split]]
+    )
+    books_dataset[split] = books_dataset[split].shuffle(seed=42)
+
+# Peek at a few examples
+show_samples(books_dataset)
+```
+
+```python out
+'>> Title: Easy to follow!!!!'
+'>> Review: I loved The dash diet weight loss Solution. Never hungry. I would recommend this diet. Also the menus are well rounded. Try it. Has lots of the information need thanks.'
+
+'>> Title: PARCIALMENTE DAÑADO'
+'>> Review: Me llegó el día que tocaba, junto a otros libros que pedí, pero la caja llegó en mal estado lo cual dañó las esquinas de los libros porque venían sin protección (forro).'
+
+'>> Title: no lo he podido descargar'
+'>> Review: igual que el anterior'
+```
+
+Acest lucru arată cu siguranță ca un amestec de recenzii în engleză și spaniolă! Acum că avem un corpus de antrenament, un ultim lucru de verificat este distribuția cuvintelor în recenzii și în titlurile acestora. Acest lucru este deosebit de important pentru sarcinile de sumarizare, în cazul în care rezumatele scurte de referință din date pot influența modelul să producă doar unul sau două cuvinte în rezumatele generate. Graficele de mai jos arată distribuția cuvintelor și putem observa că titlurile sunt puternic înclinate spre 1-2 cuvinte:
+
+<div class="flex justify-center">
+<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/review-lengths.svg" alt="Distribuția numărului de cuvinte pentru titlurile și textele recenziei."/>
+<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/review-lengths-dark.svg" alt="Distribuția numărului de cuvinte pentru titlurile și textele recenziei."/>
+</div>
+
+Pentru a rezolva acest lucru, vom filtra exemplele cu titluri foarte scurte, astfel încât modelul nostru să poată produce rezumate mai interesante. Deoarece avem de-a face cu texte în engleză și spaniolă, putem folosi rough heuristic pentru a face split titlurilor pe baza spațiului alb și apoi să folosim metoda noastră de încredere `Dataset.filter()` după cum urmează:
+
+```python
+books_dataset = books_dataset.filter(lambda x: len(x["review_title"].split()) > 2)
+```
+
+Now that we've prepared our corpus, let's take a look at a few possible Transformer models that one might fine-tune on it!
+
+## Modele pentru sumarizarea textului[[models-for-text-summarization]]
+
+Dacă vă gândiți bine, rezumarea textului este o sarcină similară cu machine translation: avem un corp de text, cum ar fi o recenzie, pe care am dori să o "traducem" într-o versiune mai scurtă care să capteze caracteristicile principale ale datelor de intrare. În consecință, majoritatea modelelor Transformer pentru rezumare adoptă arhitectura codificator-decodificator pe care am întâlnit-o pentru prima dată în [Capitolul 1](/course/chapter1), deși există unele excepții, cum ar fi familia de modele GPT, care poate fi, de asemenea, utilizată pentru rezumare în few-shot settings. Tabelul de mai jos enumeră câteva modele preantrenate populare care pot fi ajustate pentru sumarizare.
+
+| Transformer model | Description                                                                                                                                                                                                    | Multilingual? |
+| :---------: | -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | :-----------: |
+|    [GPT-2](https://huggingface.co/gpt2-xl)    | Deși este antrenat ca un model lingvistic autoregresiv, puteți face GPT-2 să genereze rezumate prin adăugarea "TL;DR" la sfârșitul textului de intrare.                                                                          |      ❌       |
+|   [PEGASUS](https://huggingface.co/google/pegasus-large)   | Utilizează un obiectiv de preantrenare pentru a prezice propoziții mascate în texte cu mai multe propoziții. Acest obiectiv de preantrenare este mai apropiat de rezumare decât de vanilla language modeling și obține scoruri ridicate la standardele populare. |      ❌       |
+|     [T5](https://huggingface.co/t5-base)      | O arhitectură Transformer universală care formulează toate sarcinile într-un framework text-text; de exemplu, formatul de intrare pentru modelul de rezumare a unui document este `summarize: ARTICOL`.                              |      ❌       |
+|     [mT5](https://huggingface.co/google/mt5-base)     | O versiune multilingvă a T5, preantrenată pe corpusul multilingv Common Crawl (mC4), care acoperă 101 limbi.                                                                                                |      ✅       |
+|    [BART](https://huggingface.co/facebook/bart-base)     | O nouă arhitectură Transformer cu un encoder și un stack de decodere antrenate pentru a reconstrui intrarea coruptă care combină schemele de preantrenare ale BERT și GPT-2.                                   |      ❌       |
+|  [mBART-50](https://huggingface.co/facebook/mbart-large-50)   | O versiune multilingvă a BART, preantrenată pe 50 de limbi.                                                                                                                                                     |      ✅       |
+
+După cum puteți vedea din acest tabel, majoritatea modelelor Transformer pentru rezumare (și, într-adevăr, majoritatea sarcinilor NLP) sunt monolingve. Acest lucru este grozav dacă sarcina voastrăeste într-o limbă cu  multe resurse precum engleza sau germana, dar mai puțin pentru miile de alte limbi utilizate în întreaga lume. Din fericire, există o clasă de modele Transformer multilingve, precum mT5 și mBART, care vin în ajutor. Aceste modele sunt preantrenate folosind modelarea limbajului, dar cu o întorsătură: în loc să fie antrenate pe un corpus dintr-o singură limbă, ele sunt antrenate împreună pe texte în peste 50 de limbi deodată!
+
+Ne vom concentra asupra mT5, o arhitectură interesantă bazată pe T5, care a fost preantrenată într-un cadru text-to-text. În T5, fiecare sarcină NLP este formulată în termenii unui prompt prefix precum `summarize:` care condiționează modelul să adapteze textul generat la prompt. După cum se arată în figura de mai jos, acest lucru face T5 extrem de versatil, deoarece puteți rezolva multe sarcini cu un singur model!
+
+<div class="flex justify-center">
+<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/t5.svg" alt="Diferite sarcini îndeplinite de arhitectura T5."/>
+<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/t5-dark.svg" alt="Diferite sarcini îndeplinite de arhitectura T5."/>
+</div>
+
+mT5 nu utilizează prefixe, dar împărtășește o mare parte din versatilitatea T5 și are avantajul de a fi multilingv. Acum că am ales un model, să aruncăm o privire la pregătirea datelor noastre pentru antrenare.
+
+
+<Tip>
+
+✏️ **Încercați!** După ce ați parcurs această secțiune, vedeți cât de bine se compară mT5 cu mBART prin aplicarea fine-tuningului acestuia din urmă cu aceleași tehnici. Pentru puncte bonus, puteți încerca, de asemenea, fine-tuningul a T5 doar pe recenziile în limba engleză. Deoarece T5 are un prefix prompt special, va trebui să adăugați `summarize:` la exemplele de intrare în pașii de preprocesare de mai jos.
+
+</Tip>
+
+## Preprocessing the data[[preprocessing-the-data]]
+
+<Youtube id="1m7BerpSq8A"/>
+
+Următoarea noastră sarcină este să tokenizăm și să codificăm recenziile și titlurile acestora. Ca de obicei, începem prin încărcarea tokenizelui asociat cu checkpointul modelului preantrenat. Vom folosi `mt5-small` ca checkpoint, astfel încât să putem face fine-tune modelului într-un timp rezonabil:
+
+```python
+from transformers import AutoTokenizer
+
+model_checkpoint = "google/mt5-small"
+tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
+```
+
+<Tip>
+
+💡 În stadiile inițiale ale proiectelor NLP, o bună practică este de a antrena o clasă de modele "mici" pe un sample mic de date. Acest lucru vă permite să faceți debug și să iterați mai rapid către un flux de lucru end-to-end. Odată ce sunteți încrezător în rezultate, puteți oricând să măriți modelul prin simpla schimbare a checkpointului modelului!
+
+</Tip>
+
+Să testăm tokenizerul mT5 pe un mic exemplu:
+
+```python
+inputs = tokenizer("I loved reading the Hunger Games!")
+inputs
+```
+
+```python out
+{'input_ids': [336, 259, 28387, 11807, 287, 62893, 295, 12507, 1], 'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1, 1]}
+```
+
+Aici putem vedea binecunoscutele `input_ids` și `attention_mask` pe care le-am întâlnit în primele noastre experimente de fine-tuning în [Capitolul 3](/course/chapter3). Să decodificăm aceste ID-uri de intrare cu funcția `convert_ids_to_tokens()` a tokenizerului pentru a vedea cu ce fel de tokenizer avem de-a face:
+
+```python
+tokenizer.convert_ids_to_tokens(inputs.input_ids)
+```
+
+```python out
+['▁I', '▁', 'loved', '▁reading', '▁the', '▁Hung', 'er', '▁Games', '</s>']
+```
+
+Caracterul Unicode special `▁` și tokenul de sfârșit de secvență `</s>` indică faptul că avem de-a face cu tokenizeerul SentencePiece, care se bazează pe algoritmul de segmentare Unigram discutat în [Capitolul 6](/course/chapter6). Unigram este deosebit de util pentru corpusurile multilingve, deoarece permite SentencePiece să fie agnostic în ceea ce privește accentele, punctuația și faptul că multe limbi, precum japoneza, nu au caractere de spațiu alb.
+
+Pentru a tokeniza corpusul nostru, trebuie să ne ocupăm de o subtilitate asociată cu rezumarea: deoarece labelurile noastre sunt, de asemenea, text, este posibil ca acestea să depășească dimensiunea maximă a contextului modelului. Acest lucru înseamnă că trebuie să aplicăm trunchierea atât a recenziilor, cât și a titlurilor acestora, pentru a ne asigura că nu trecem inputuri excesiv de lungi modelului nostru. Tokenizerele din 🤗 Transformers oferă un argument ingenios, `text_target`,  care vă permite să tokenizați labelurile în paralel cu inputurile. Iată un exemplu al modului în care inputurile și targeturile sunt procesate pentru mT5:
+
+```python
+max_input_length = 512
+max_target_length = 30
+
+
+def preprocess_function(examples):
+    model_inputs = tokenizer(
+        examples["review_body"],
+        max_length=max_input_length,
+        truncation=True,
+    )
+    labels = tokenizer(
+        examples["review_title"], max_length=max_target_length, truncation=True
+    )
+    model_inputs["labels"] = labels["input_ids"]
+    return model_inputs
+```
+
+Să parcurgem acest cod pentru a înțelege ce se întâmplă. Primul lucru pe care l-am făcut a fost să definim valorile pentru `max_input_length` și `max_target_length`, care stabilesc limitele superioare pentru cât de lungi pot fi recenziile și titlurile noastre. Deoarece corpul recenziei este de obicei mult mai mare decât titlul, am mărit aceste valori în consecință.
+
+Cu ajutorul funcției `preprocess_function()`, este simplu să tokenizăm întregul corpus cu ajutorul funcției practice `Dataset.map()` pe care am folosit-o la greu pe parcursul acestui curs:
+
+```python
+tokenized_datasets = books_dataset.map(preprocess_function, batched=True)
+```
+
+Acum că corpusul a fost preprocesat, să aruncăm o privire asupra unor metrici care sunt utilizate în mod obișnuit pentru sumarizare. După cum vom vedea, nu există un glonț de argint atunci când vine vorba de măsurarea calității textului generat de calculator.
+
+<Tip>
+
+💡 Poate ați observat că am folosit `batched=True` în funcția noastră `Dataset.map()` de mai sus. Aceasta codifică exemplele în batchuri de 1.000 (implicit) și vă permite să utilizați capacitățile multithreading ale tokenizerilor rapizi din 🤗 Transformers. Atunci când este posibil, încercați să utilizați `batched=True` pentru a profita la maximum de preprocesare!
+
+</Tip>
+
+
+## Metrice pentru sumarizare[[metrics-for-text-summarization]]
+
+<Youtube id="TMshhnrEXlg"/>
+
+În comparație cu majoritatea celorlalte sarcini pe care le-am abordat în acest curs, măsurarea performanței sarcinilor de generare a textului, precum sumarizare sau traducerea, nu este la fel de simplă. De exemplu, având în vedere o recenzie precum "Mi-a plăcut să citesc Hunger Games", există mai multe rezumate valide, precum "Mi-a plăcut Hunger Games" sau "Hunger Games este o lectură excelentă". În mod clar, aplicarea unui exact match între rezumatul generat și label nu este o soluție bună - chiar și oamenii s-ar descurca prost cu un astfel de metric, deoarece toți avem propriul nostru stil de scriere.
+
+Pentru rezumare, una dintre cele mai frecvent utilizate metrici este [ROUGE score](https://en.wikipedia.org/wiki/ROUGE_(metric)) (prescurtarea de la Recall-Oriented Understudy for Gisting Evaluation). Ideea de bază din spatele acestei metrici este de a compara un rezumat generat cu un set de rezumate de referință care sunt de obicei create de oameni. Pentru a face acest lucru mai precis, să presupunem că dorim să comparăm următoarele două rezumate:
+
+```python
+generated_summary = "I absolutely loved reading the Hunger Games"
+reference_summary = "I loved reading the Hunger Games"
+```
+
+O modalitate de a le compara ar fi să numărați numărul de cuvinte care se suprapun, care în acest caz ar fi 6. Cu toate acestea, acest lucru este un pic crud, astfel încât, în schimb, ROUGE se bazează pe calcularea scorurilor _preicision_ și _recall_ pentru suprapunere.
+
+<Tip>
+
+🙋 Nu vă faceți griji dacă aceasta este prima dată când auziți de precision și recall - vom trece împreună prin câteva exemple explicite pentru a clarifica totul. Aceste metrici sunt de obicei întâlnite în sarcinile de clasificare, deci dacă doriți să înțelegeți cum sunt definite precizia și recallul în acest context, vă recomandăm să consultați [ghidurile `scikit-learn`] (https://scikit-learn.org/stable/auto_examples/model_selection/plot_precision_recall.html).
+
+</Tip>
+
+Pentru ROUGE, recall măsoară cât de mult din rezumatul de referință este capturat de cel generat. Dacă comparăm doar cuvinte, recall poate fi calculată conform următoarei formule:
+
+$$ \mathrm{Recall} = \frac{\mathrm{Number\,of\,overlapping\, words}}{\mathrm{Total\, number\, of\, words\, in\, reference\, summary}} $$
+
+Pentru exemplul nostru simplu de mai sus, această formulă oferă un recall perfect de 6/6 = 1; adică, toate cuvintele din rezumatul de referință au fost produse de model. Acest lucru poate părea grozav, dar imaginați-vă dacă rezumatul nostru generat ar fi fost "Mi-a plăcut foarte mult să citesc Jocurile Foamei toată noaptea". Aceasta ar avea, de asemenea, o reamintire perfectă, dar este, fără îndoială, un rezumat mai prost, deoarece are mai multe cuvinte. Pentru a face față acestor scenarii, calculăm și precizia, care, în contextul ROUGE, măsoară cât de mult din rezumatul generat a fost relevant:
+
+
+$$ \mathrm{Precision} = \frac{\mathrm{Number\,of\,overlapping\, words}}{\mathrm{Total\, number\, of\, words\, in\, generated\, summary}} $$
+
+Aplicând acest lucru la rezumatul nostru cu mai multe cuvinte, se obține o precizie de 6/10 = 0,6, ceea ce este considerabil mai rău decât precizia de 6/7 = 0,86 obținută de rezumatul nostru mai scurt. În practică, se calculează de obicei atât precision, cât și recallul, iar apoi se raportează scorul F1 (media armonică a precision și recall). Putem face acest lucru cu ușurință în 🤗 Datasets instalând mai întâi biblioteca `rouge_score`:
+
+```py
+!pip install rouge_score
+```
+
+și apoi încărcând metrica ROUGE după cum urmează:
+
+```python
+import evaluate
+
+rouge_score = evaluate.load("rouge")
+```
+
+Apoi, putem utiliza funcția `rouge_score.compute()` pentru a calcula toate metricile odată:
+
+```python
+scores = rouge_score.compute(
+    predictions=[generated_summary], references=[reference_summary]
+)
+scores
+```
+
+```python out
+{'rouge1': AggregateScore(low=Score(precision=0.86, recall=1.0, fmeasure=0.92), mid=Score(precision=0.86, recall=1.0, fmeasure=0.92), high=Score(precision=0.86, recall=1.0, fmeasure=0.92)),
+ 'rouge2': AggregateScore(low=Score(precision=0.67, recall=0.8, fmeasure=0.73), mid=Score(precision=0.67, recall=0.8, fmeasure=0.73), high=Score(precision=0.67, recall=0.8, fmeasure=0.73)),
+ 'rougeL': AggregateScore(low=Score(precision=0.86, recall=1.0, fmeasure=0.92), mid=Score(precision=0.86, recall=1.0, fmeasure=0.92), high=Score(precision=0.86, recall=1.0, fmeasure=0.92)),
+ 'rougeLsum': AggregateScore(low=Score(precision=0.86, recall=1.0, fmeasure=0.92), mid=Score(precision=0.86, recall=1.0, fmeasure=0.92), high=Score(precision=0.86, recall=1.0, fmeasure=0.92))}
+```
+
+Whoa, există o mulțime de informații în aceast output - ce înseamnă toate acestea? În primul rând, 🤗 Datasets calculează de fapt confidence intervalurile pentru precision, recall și scorul F1; acestea sunt atributele `low`, `mid` și `high` pe care le puteți vedea aici. În plus, 🤗 Datasets calculează o varietate de scoruri ROUGE care se bazează pe diferite tipuri de granularitate a textului atunci când compară rezumatele generate și de referință. Varianta `rouge1` este suprapunerea unigramelor - acesta este doar un mod elegant de a spune suprapunerea cuvintelor și este exact metrica pe care am discutat-o mai sus. Pentru a verifica acest lucru, să extragem valoarea `mid` a scorurilor noastre:
+
+```python
+scores["rouge1"].mid
+```
+
+```python out
+Score(precision=0.86, recall=1.0, fmeasure=0.92)
+```
+
+Grozav, numerele de precision și de recall se potrivesc! Acum ce se întâmplă cu celelalte scoruri ROUGE? `rouge2` măsoară suprapunerea dintre bigrame (suprapunerea perechilor de cuvinte), în timp ce `rougeL` și `rougeLsum` măsoară cele mai lungi secvențe de cuvinte care se potrivesc, căutând cele mai lungi substraturi comune în rezumatele generate și de referință. Termenul "sum" din `rougeLsum` se referă la faptul că această metrică este calculată pentru un rezumat întreg, în timp ce `rougeL` este calculată ca medie a propozițiilor individuale.
+
+<Tip>
+
+✏️ **Încercați!** Creați propriul exemplu de rezumat generat și de referință și vedeți dacă scorurile ROUGE rezultate sunt în concordanță cu un calcul manual bazat pe formulele de precision și recall. Pentru puncte bonus, împărțiți textul în bigrame și comparați precizia și recallul pentru metrica `rouge2`.
+
+</Tip>
+
+Vom folosi aceste scoruri ROUGE pentru a urmări performanța modelului nostru, dar înainte de a face acest lucru, să facem ceva ce orice bun practician NLP ar trebui să facă: să creăm un baseline puternic, dar simplu!
+
+### Crearea unui baseline bun[[creating-a-strong-baseline]]
+
+un baseline obișnuit pentru rezumarea textului este de a lua pur și simplu primele trei propoziții ale unui articol, adesea numit _lead-3_ baseline. Am putea folosi puncte de oprire pentru a urmări limitele propoziției, dar acest lucru va eșua în cazul acronimelor precum "U.S." sau "U.N." - așa că vom folosi în schimb biblioteca `nltk`, care include un algoritm mai bun pentru a gestiona aceste cazuri. Puteți instala pachetul folosind `pip` după cum urmează:
+
+```python
+!pip install nltk
+```
+
+și apoi descărcați regulile de punctuație:
+
+```python
+import nltk
+
+nltk.download("punkt")
+```
+
+În continuare, importăm tokenizerul de propoziții din `nltk` și creăm o funcție simplă pentru a extrage primele trei propoziții dintr-o recenzie. Convenția în rezumarea textului este de a separa fiecare rezumat cu o linie nouă, deci să includem și aceasta și să o testăm pe un exemplu de antrenare:
+
+```python
+from nltk.tokenize import sent_tokenize
+
+
+def three_sentence_summary(text):
+    return "\n".join(sent_tokenize(text)[:3])
+
+
+print(three_sentence_summary(books_dataset["train"][1]["review_body"]))
+```
+
+```python out
+'I grew up reading Koontz, and years ago, I stopped,convinced i had "outgrown" him.'
+'Still,when a friend was looking for something suspenseful too read, I suggested Koontz.'
+'She found Strangers.'
+```
+
+Acest lucru pare să funcționeze, deci să implementăm acum o funcție care extrage aceste "rezumate" dintr-un dataset și calculează scorurile ROUGE pentru baseline:
+
+```python
+def evaluate_baseline(dataset, metric):
+    summaries = [three_sentence_summary(text) for text in dataset["review_body"]]
+    return metric.compute(predictions=summaries, references=dataset["review_title"])
+```
+
+Putem folosi apoi această funcție pentru a calcula scorurile ROUGE pe setul de validare și pentru a le înfrumuseța puțin folosind Pandas:
+
+```python
+import pandas as pd
+
+score = evaluate_baseline(books_dataset["validation"], rouge_score)
+rouge_names = ["rouge1", "rouge2", "rougeL", "rougeLsum"]
+rouge_dict = dict((rn, round(score[rn].mid.fmeasure * 100, 2)) for rn in rouge_names)
+rouge_dict
+```
+
+```python out
+{'rouge1': 16.74, 'rouge2': 8.83, 'rougeL': 15.6, 'rougeLsum': 15.96}
+```
+
+Putem vedea că scorul `rouge2` este semnificativ mai mic decât restul; acest lucru reflectă probabil faptul că titlurile recenziilor sunt de obicei concise și, prin urmare, baselineul lead-3 are prea multe cuvinte. Acum, că avem un baseline bun de lucru, să ne îndreptăm atenția către fine-tuningul mT5!
+
+{#if fw === 'pt'}
+
+## Fine-tuningul mT5 cu API-ul `Trainer`[[fine-tuning-mt5-with-the-trainer-api]]
+
+Fine-tuningul unui model pentru rezumare este foarte asemănător cu celelalte sarcini pe care le-am acoperit în acest capitol. Primul lucru pe care trebuie să îl facem este să încărcăm modelul preantrenat din checkpointul `mt5-small`. Deoarece sumarizarea este o sarcină de la secvență la secvență, putem încărca modelul cu clasa `AutoModelForSeq2SeqLM`, care va descărca automat și va stoca în cache weighturile:
+
+```python
+from transformers import AutoModelForSeq2SeqLM
+
+model = AutoModelForSeq2SeqLM.from_pretrained(model_checkpoint)
+```
+
+{:else}
+
+## Fine-tuningul mT5 cu Keras[[fine-tuning-mt5-with-keras]]
+
+Fine-tuningul unui model pentru sumarizare este foarte asemănătoare cu celelalte sarcini pe care le-am acoperit în acest capitol. Primul lucru pe care trebuie să îl facem este să încărcăm modelul preantrenat din punctul de control `mt5-small`. Deoarece rezumarea este o sarcină de la secvență la secvență, putem încărca modelul cu clasa `TFAutoModelForSeq2SeqLM`, care va descărca și va stoca în cache weighturile:
+
+```python
+from transformers import TFAutoModelForSeq2SeqLM
+
+model = TFAutoModelForSeq2SeqLM.from_pretrained(model_checkpoint)
+```
+
+{/if}
+
+<Tip>
+
+💡 Dacă vă întrebați de ce nu vedeți niciun avertisment cu privire la fine-tuningul modelului pe un downstream task, acest lucru se datorează faptului că pentru sarcinile secvență-la-secvență păstrăm toate weighturile rețelei. Comparați acest lucru cu modelul nostru de clasificare a textului din [Capitolul 3](/course/chapter3), unde headul modelului preantrenat a fost înlocuit cu o rețea inițializată aleatoriu.
+
+</Tip>
+
+Următorul lucru pe care trebuie să îl facem este să ne conectăm la Hugging Face Hub. Dacă executați acest cod într-un notebook, puteți face acest lucru cu următoarea funcție:
+
+```python
+from huggingface_hub import notebook_login
+
+notebook_login()
+```
+
+care va afișa un widget în care puteți introduce credențialele. Alternativ, puteți rula această comandă în terminal și să vă conectați acolo:
+
+```
+huggingface-cli login
+```
+
+{#if fw === 'pt'}
+
+Va trebui să generăm rezumate pentru a calcula scorurile ROUGE în timpul antrenării. Din fericire, 🤗 Transformers oferă clase dedicate `Seq2SeqTrainingArguments` și `Seq2SeqTrainer` care pot face acest lucru pentru noi în mod automat! Pentru a vedea cum funcționează acest lucru, să definim mai întâi hiperparametrii și alte argumente pentru experimentele noastre:
+
+```python
+from transformers import Seq2SeqTrainingArguments
+
+batch_size = 8
+num_train_epochs = 8
+# Show the training loss with every epoch
+logging_steps = len(tokenized_datasets["train"]) // batch_size
+model_name = model_checkpoint.split("/")[-1]
+
+args = Seq2SeqTrainingArguments(
+    output_dir=f"{model_name}-finetuned-amazon-en-es",
+    evaluation_strategy="epoch",
+    learning_rate=5.6e-5,
+    per_device_train_batch_size=batch_size,
+    per_device_eval_batch_size=batch_size,
+    weight_decay=0.01,
+    save_total_limit=3,
+    num_train_epochs=num_train_epochs,
+    predict_with_generate=True,
+    logging_steps=logging_steps,
+    push_to_hub=True,
+)
+```
+
+Aici, argumentul `predict_with_generate` a fost setat pentru a indica faptul că ar trebui să generăm rezumate în timpul evaluării, astfel încât să putem calcula scorurile ROUGE pentru fiecare epocă. După cum s-a discutat în [Capitolul 1](/course/chapter1), decodificatorul realizează inference-ul prin prezicerea tokenilor unul câte unul, iar acest lucru este implementat de metoda `generate()` a modelului. Setarea `predict_with_generate=True` îi spune lui `Seq2SeqTrainer` să utilizeze această metodă pentru evaluare. Am ajustat, de asemenea, unii dintre hiperparametrii impliciți, cum ar fi rata de învățare, numărul de epoci și scăderea weighturilor și am setat opțiunea `save_total_limit` pentru a salva numai până la 3 checkpointuri în timpul antrenamentului - acest lucru se datorează faptului că chiar și versiunea "mică" a mT5 utilizează aproximativ 1 GB de spațiu pe hard disk și putem economisi puțin spațiu prin limitarea numărului de copii salvate.
+
+Argumentul `push_to_hub=True` ne va permite să trimitem modelul în Hub după antrenare; veți găsi repositoriul în profilul vostru de utilizator, în locația definită de `output_dir`. Rețineți că puteți specifica numele repositoriului către care doriți să trimiteți modelul cu argumentul `hub_model_id` (în special, va trebui să utilizați acest argument pentru a trimite modelul către o organizație). De exemplu, atunci când am trimis modelul către organizația [`huggingface-course`](https://huggingface.co/huggingface-course), am adăugat `hub_model_id="huggingface-course/mt5-finetuned-amazon-en-es"` la `Seq2SeqTrainingArguments`.
+
+Următorul lucru pe care trebuie să îl facem este să oferim trainerului o funcție `compute_metrics()`, astfel încât să ne putem evalua modelul în timpul antrenării. Pentru sumarizare, acest lucru este un pic mai complicat decât simpla apelare a funcției `rouge_score.compute()` pentru predicțiile modelului, deoarece trebuie să _decodăm_ rezultatele și labelurile din text înainte de a putea calcula scorurile ROUGE. Următoarea funcție face exact acest lucru și, de asemenea, utilizează funcția `sent_tokenize()` din `nltk` pentru a separa propozițiile rezumate cu linii noi:
+
+```python
+import numpy as np
+
+
+def compute_metrics(eval_pred):
+    predictions, labels = eval_pred
+    # Decode generated summaries into text
+    decoded_preds = tokenizer.batch_decode(predictions, skip_special_tokens=True)
+    # Replace -100 in the labels as we can't decode them
+    labels = np.where(labels != -100, labels, tokenizer.pad_token_id)
+    # Decode reference summaries into text
+    decoded_labels = tokenizer.batch_decode(labels, skip_special_tokens=True)
+    # ROUGE expects a newline after each sentence
+    decoded_preds = ["\n".join(sent_tokenize(pred.strip())) for pred in decoded_preds]
+    decoded_labels = ["\n".join(sent_tokenize(label.strip())) for label in decoded_labels]
+    # Compute ROUGE scores
+    result = rouge_score.compute(
+        predictions=decoded_preds, references=decoded_labels, use_stemmer=True
+    )
+    # Extract the median scores
+    result = {key: value.mid.fmeasure * 100 for key, value in result.items()}
+    return {k: round(v, 4) for k, v in result.items()}
+```
+
+{/if}
+
+În continuare, trebuie să definim un data collator pentru sarcina noastră secvență-la-secvență. Deoarece mT5 este un transformer model encoder-decoder, o subtilitate a pregătirii batch-urilor noastre este că, în timpul decodificării, trebuie să deplasăm labelurile la dreapta cu una. Acest lucru este necesar pentru a ne asigura că decodificatorul vede doar labelurile anterioare ale adevărului de bază și nu pe cele actuale sau viitoare, care ar fi ușor de memorat de către model. Acest lucru este similar cu modul în care masked self-attention este aplicată inputurilor într-o sarcină precum [causal language modeling](/course/chapter7/6).
+
+Din fericire, 🤗 Transformers oferă un collator `DataCollatorForSeq2Seq` care va face padding dinamic inputurilor și labelurilor pentru noi. Pentru a inițializa acest collator, trebuie doar să furnizăm `tokenizer` și `model`:
+
+{#if fw === 'pt'}
+
+```python
+from transformers import DataCollatorForSeq2Seq
+
+data_collator = DataCollatorForSeq2Seq(tokenizer, model=model)
+```
+
+{:else}
+
+```python
+from transformers import DataCollatorForSeq2Seq
+
+data_collator = DataCollatorForSeq2Seq(tokenizer, model=model, return_tensors="tf")
+```
+
+{/if}
+
+Să vedem ce produce acest collator atunci când este alimentat cu un mic batch de exemple. În primul rând, trebuie să eliminăm coloanele cu șiruri de caractere, deoarece collatorul nu va ști cum să completeze aceste elemente:
+
+```python
+tokenized_datasets = tokenized_datasets.remove_columns(
+    books_dataset["train"].column_names
+)
+```
+
+Deoarece collatorul așteaptă o listă de `dict`, unde fiecare `dict` reprezintă un singur exemplu din dataset, trebuie să transformăm datele în formatul așteptat înainte de a le transmite data collatorului:
+
+```python
+features = [tokenized_datasets["train"][i] for i in range(2)]
+data_collator(features)
+```
+
+```python out
+{'attention_mask': tensor([[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
+         1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0],
+        [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
+         1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]]), 'input_ids': tensor([[  1494,    259,   8622,    390,    259,    262,   2316,   3435,    955,
+            772,    281,    772,   1617,    263,    305,  14701,    260,   1385,
+           3031,    259,  24146,    332,   1037,    259,  43906,    305,    336,
+            260,      1,      0,      0,      0,      0,      0,      0],
+        [   259,  27531,  13483,    259,   7505,    260, 112240,  15192,    305,
+          53198,    276,    259,  74060,    263,    260,    459,  25640,    776,
+           2119,    336,    259,   2220,    259,  18896,    288,   4906,    288,
+           1037,   3931,    260,   7083, 101476,   1143,    260,      1]]), 'labels': tensor([[ 7483,   259,  2364, 15695,     1,  -100],
+        [  259, 27531, 13483,   259,  7505,     1]]), 'decoder_input_ids': tensor([[    0,  7483,   259,  2364, 15695,     1],
+        [    0,   259, 27531, 13483,   259,  7505]])}
+```
+
+Principalul lucru care trebuie observat aici este că primul exemplu este mai lung decât al doilea, astfel încât `input_ids` și `attention_mask` din al doilea exemplu au primit padding în dreapta cu un simbol `[PAD]` (al cărui ID este `0`). În mod similar, putem vedea că `labels` au primit padding cu `-100`, pentru a ne asigura că tokenii de padding sunt ignorați de funcția de pierdere. În sfârșit, putem vedea un nou `decoder_input_ids` care a deplasat labelurile spre dreapta prin inserarea unui simbol `[PAD]` în prima intrare.
+
+{#if fw === 'pt'}
+
+Avem în sfârșit toate ingredientele de care avem nevoie pentru a antrenare! Acum trebuie doar să inițializăm trainerul cu argumentele standard:
+
+```python
+from transformers import Seq2SeqTrainer
+
+trainer = Seq2SeqTrainer(
+    model,
+    args,
+    train_dataset=tokenized_datasets["train"],
+    eval_dataset=tokenized_datasets["validation"],
+    data_collator=data_collator,
+    tokenizer=tokenizer,
+    compute_metrics=compute_metrics,
+)
+```
+
+și să lansăm cursa noastră de antrenare:
+
+```python
+trainer.train()
+```
+
+În timpul antrenamentului, ar trebui să vedeți cum training loss scade și scorurile ROUGE cresc cu fiecare epocă. După ce antrenamentul este complet, puteți vedea scorurile ROUGE finale executând `Trainer.evaluate()`:
+
+```python
+trainer.evaluate()
+```
+
+```python out
+{'eval_loss': 3.028524398803711,
+ 'eval_rouge1': 16.9728,
+ 'eval_rouge2': 8.2969,
+ 'eval_rougeL': 16.8366,
+ 'eval_rougeLsum': 16.851,
+ 'eval_gen_len': 10.1597,
+ 'eval_runtime': 6.1054,
+ 'eval_samples_per_second': 38.982,
+ 'eval_steps_per_second': 4.914}
+```
+
+Din scorurile obținute, putem vedea că modelul nostru a depășit cu mult modelul nostru de bază lead-3 - frumos! Ultimul lucru de făcut este să introducem weighturile modelului în Hub, după cum urmează:
+
+```
+trainer.push_to_hub(commit_message="Training complete", tags="summarization")
+```
+
+```python out
+'https://huggingface.co/huggingface-course/mt5-finetuned-amazon-en-es/commit/aa0536b829b28e73e1e4b94b8a5aacec420d40e0'
+```
+
+Acest lucru va salva checkpointul și fișierele de configurare în `output_dir`, înainte de a încărca toate fișierele în Hub. Specificând argumentul `tags`, ne asigurăm, de asemenea, că widgetul de pe Hub va fi unul pentru un pipeline de rezumare în locul celui implicit de generare de text asociat arhitecturii mT5 (pentru mai multe informații despre labelurile modelului, consultați [🤗Documentația Hub](https://huggingface.co/docs/hub/main#how-is-a-models-type-of-inference-api-and-widget-determined)). Rezultatul din `trainer.push_to_hub()` este o adresă URL către hash-ul Git commit, astfel încât să puteți vedea cu ușurință modificările care au fost făcute în repositoriul modelului!
+
+Pentru a încheia această secțiune, să aruncăm o privire la modul în care putem, de asemenea, să facem fine-tune la mT5 folosind featururile de nivel scăzut oferite de 🤗 Accelerate.
+
+{:else}
+
+Suntem aproape gata de antrenament! Trebuie doar să convertim dataseturile în `tf.data.Dataset`s folosind data collatorul pe care l-am definit mai sus, iar apoi aplicarea `compil()` și `fit()` modelul. Mai întâi, dataseturile:
+
+```python
+tf_train_dataset = model.prepare_tf_dataset(
+    tokenized_datasets["train"],
+    collate_fn=data_collator,
+    shuffle=True,
+    batch_size=8,
+)
+tf_eval_dataset = model.prepare_tf_dataset(
+    tokenized_datasets["validation"],
+    collate_fn=data_collator,
+    shuffle=False,
+    batch_size=8,
+)
+```
+
+Acum, ne definim hiperparametrii de antrenare și compilare:
+
+```python
+from transformers import create_optimizer
+import tensorflow as tf
+
+# The number of training steps is the number of samples in the dataset, divided by the batch size then multiplied
+# by the total number of epochs. Note that the tf_train_dataset here is a batched tf.data.Dataset,
+# not the original Hugging Face Dataset, so its len() is already num_samples // batch_size.
+num_train_epochs = 8
+num_train_steps = len(tf_train_dataset) * num_train_epochs
+model_name = model_checkpoint.split("/")[-1]
+
+optimizer, schedule = create_optimizer(
+    init_lr=5.6e-5,
+    num_warmup_steps=0,
+    num_train_steps=num_train_steps,
+    weight_decay_rate=0.01,
+)
+
+model.compile(optimizer=optimizer)
+
+# Train in mixed-precision float16
+tf.keras.mixed_precision.set_global_policy("mixed_float16")
+```
+
+În cele din urmă, facem fit modelului modelului. Folosim un `PushToHubCallback` pentru a salva modelul în Hub după fiecare epocă, ceea ce ne va permite să îl folosim ulterior pentru inference:
+
+```python
+from transformers.keras_callbacks import PushToHubCallback
+
+callback = PushToHubCallback(
+    output_dir=f"{model_name}-finetuned-amazon-en-es", tokenizer=tokenizer
+)
+
+model.fit(
+    tf_train_dataset, validation_data=tf_eval_dataset, callbacks=[callback], epochs=8
+)
+```
+
+Am obținut unele valori ale pierderilor în timpul antrenării, dar am dori să vedem metricile ROUGE pe care le-am calculat mai devreme. Pentru a obține aceste metrici, va trebui să generăm outputuri din model și să le convertim în șiruri de caractere. Să construim câteva liste de labels și predicții pentru a compara metrica ROUGE (rețineți că, dacă obțineți erori de import pentru această secțiune, este posibil să fie necesar să faceți `!pip install tqdm`). De asemenea, vom utiliza un truc care crește dramatic performanța - compilarea codului nostru de generare cu [XLA](https://www.tensorflow.org/xla), compilatorul accelerat de algebră liniară al TensorFlow. XLA aplică diverse optimizări graficului de calcul al modelului și are ca rezultat îmbunătățiri semnificative ale vitezei și utilizării memoriei. După cum se descrie în [blogul Hugging Face](https://huggingface.co/blog/tf-xla-generate), XLA funcționează cel mai bine atunci când formele noastre de input nu variază prea mult. Pentru a face față acestui lucru, vom face padding inputurilor la multipli a 128 și vom crea un nou dataset cu padding collatorul, iar apoi vom aplica decoratorul `@tf.function(jit_compile=True)` funcției noastre de generare, care marchează întreaga funcție pentru compilare cu XLA.
+
+```python
+from tqdm import tqdm
+import numpy as np
+
+generation_data_collator = DataCollatorForSeq2Seq(
+    tokenizer, model=model, return_tensors="tf", pad_to_multiple_of=320
+)
+
+tf_generate_dataset = model.prepare_tf_dataset(
+    tokenized_datasets["validation"],
+    collate_fn=generation_data_collator,
+    shuffle=False,
+    batch_size=8,
+    drop_remainder=True,
+)
+
+
+@tf.function(jit_compile=True)
+def generate_with_xla(batch):
+    return model.generate(
+        input_ids=batch["input_ids"],
+        attention_mask=batch["attention_mask"],
+        max_new_tokens=32,
+    )
+
+
+all_preds = []
+all_labels = []
+for batch, labels in tqdm(tf_generate_dataset):
+    predictions = generate_with_xla(batch)
+    decoded_preds = tokenizer.batch_decode(predictions, skip_special_tokens=True)
+    labels = labels.numpy()
+    labels = np.where(labels != -100, labels, tokenizer.pad_token_id)
+    decoded_labels = tokenizer.batch_decode(labels, skip_special_tokens=True)
+    decoded_preds = ["\n".join(sent_tokenize(pred.strip())) for pred in decoded_preds]
+    decoded_labels = ["\n".join(sent_tokenize(label.strip())) for label in decoded_labels]
+    all_preds.extend(decoded_preds)
+    all_labels.extend(decoded_labels)
+```
+
+Odată ce avem listele noastre de labeluri și de șiruri de predicție, calcularea scorului ROUGE este ușoară:
+
+```python
+result = rouge_score.compute(
+    predictions=decoded_preds, references=decoded_labels, use_stemmer=True
+)
+result = {key: value.mid.fmeasure * 100 for key, value in result.items()}
+{k: round(v, 4) for k, v in result.items()}
+```
+
+```
+{'rouge1': 31.4815, 'rouge2': 25.4386, 'rougeL': 31.4815, 'rougeLsum': 31.4815}
+```
+
+
+{/if}
+
+{#if fw === 'pt'}
+
+## Fine-tuningul mT5 cu 🤗 Accelerate[[fine-tuning-mt5-with-accelerate]]
+
+Fine-tuningul nostru cu 🤗 Accelerate este foarte asemănător cu exemplul de clasificare a textului pe care l-am întâlnit în [Capitolul 3](/course/chapter3). Principalele diferențe vor fi necesitatea de a genera în mod explicit rezumatele noastre în timpul antrenării și de a defini modul în care calculăm scorurile ROUGE (reamintim că `Seq2SeqTrainer` a avut grijă de generare pentru noi). Să aruncăm o privire la modul în care putem implementa aceste două cerințe în cadrul 🤗 Accelerate!
+
+### Pregătirea pentru antrenare[[preparing-everything-for-training]]
+
+Primul lucru pe care trebuie să-l facem este să creăm un `DataLoader` pentru fiecare dintre spliturile noastre. Deoarece dataloaders PyTorch așteaptă batchuri de tensori, trebuie să setăm formatul la `"torch"` în dataseturile noastre:
+
+```python
+tokenized_datasets.set_format("torch")
+```
+
+Acum că avem dataseturi formate doar din tensori, următorul lucru este inițializarea `DataCollatorForSeq2Seq`. Pentru aceasta trebuie să furnizăm o versiune nouă a modelului, așa că hai să îl încărcăm din nou din cache:
+
+```python
+model = AutoModelForSeq2SeqLM.from_pretrained(model_checkpoint)
+```
+
+Putem apoi să instanțiem data collatorul și să îl folosim pentru a ne defini dataloaders:
+
+```python
+from torch.utils.data import DataLoader
+
+batch_size = 8
+train_dataloader = DataLoader(
+    tokenized_datasets["train"],
+    shuffle=True,
+    collate_fn=data_collator,
+    batch_size=batch_size,
+)
+eval_dataloader = DataLoader(
+    tokenized_datasets["validation"], collate_fn=data_collator, batch_size=batch_size
+)
+```
+
+Următorul lucru este definirea optimizatorului pe care dorim să îl utilizăm. Ca și în celelalte exemple, vom folosi `AdamW`, care funcționează bine pentru majoritatea problemelor:
+
+```python
+from torch.optim import AdamW
+
+optimizer = AdamW(model.parameters(), lr=2e-5)
+```
+
+În cele din urmă, introducem modelul, optimizatorul și dataloaders în metoda `accelerator.prepare()`:
+
+```python
+from accelerate import Accelerator
+
+accelerator = Accelerator()
+model, optimizer, train_dataloader, eval_dataloader = accelerator.prepare(
+    model, optimizer, train_dataloader, eval_dataloader
+)
+```
+
+<Tip>
+
+🚨 Dacă faceți antrenarea pe un TPU, va trebui să mutați tot codul de mai sus într-o funcție de antrenare aparte. Consultați [Capitolul 3](/course/chapter3) pentru mai multe detalii.
+
+</Tip>
+
+Acum că ne-am pregătit obiectele, mai avem trei lucruri de făcut:
+
+* Definirea learning rate schedule.
+* Implementarea unei funcții de post-procesare a rezumatelor pentru evaluare.
+* Crearea unui repositoriu pe Hub în care să putem trimite modelul nostru.
+
+Pentru learning rate schedule, îl vom utiliza pe cel liniar standard din secțiunile anterioare:
+
+```python
+from transformers import get_scheduler
+
+num_train_epochs = 10
+num_update_steps_per_epoch = len(train_dataloader)
+num_training_steps = num_train_epochs * num_update_steps_per_epoch
+
+lr_scheduler = get_scheduler(
+    "linear",
+    optimizer=optimizer,
+    num_warmup_steps=0,
+    num_training_steps=num_training_steps,
+)
+```
+
+Pentru post-procesare, avem nevoie de o funcție care să împartă rezumatele generate în propoziții separate prin linii noi. Acesta este formatul pe care îl așteaptă metrica ROUGE, iar noi putem realiza acest lucru cu următorul fragment de cod:
+
+```python
+def postprocess_text(preds, labels):
+    preds = [pred.strip() for pred in preds]
+    labels = [label.strip() for label in labels]
+
+    # ROUGE expects a newline after each sentence
+    preds = ["\n".join(nltk.sent_tokenize(pred)) for pred in preds]
+    labels = ["\n".join(nltk.sent_tokenize(label)) for label in labels]
+
+    return preds, labels
+```
+
+Acest lucru ar trebui să vă pară familiar dacă vă amintiți cum am definit funcția `compute_metrics()` a `Seq2SeqTrainer`.
+
+În cele din urmă, trebuie să creăm un repositoriu de modele pe Hugging Face Hub. Pentru aceasta, putem utiliza biblioteca 🤗 Hub intitulată corespunzător . Trebuie doar să definim un nume pentru repositoriul nostru, iar biblioteca are o funcție utilitară pentru a combina ID-ul repositoriul cu profilul utilizatorului:
+
+```python
+from huggingface_hub import get_full_repo_name
+
+model_name = "test-bert-finetuned-squad-accelerate"
+repo_name = get_full_repo_name(model_name)
+repo_name
+```
+
+```python out
+'lewtun/mt5-finetuned-amazon-en-es-accelerate'
+```
+
+Acum putem folosi numele repositoriului pentru a clona o versiune locală în folderul nostru cu rezultate care va stoca artefactele de antrenare:
+
+```python
+from huggingface_hub import Repository
+
+output_dir = "results-mt5-finetuned-squad-accelerate"
+repo = Repository(output_dir, clone_from=repo_name)
+```
+
+Acest lucru ne va permite să trimitem artefactele înapoi la Hub prin apelarea metodei `repo.push_to_hub()` în timpul antrenării! Să încheiem acum analiza noastră prin scrierea buclei de antrenare.
+
+### Bucla de antrenare[[training-loop]]
+
+Bucla de formare pentru sumarizare este destul de asemănătoare cu celelalte exemple 🤗 Accelerate pe care le-am întâlnit și este împărțită aproximativ în patru etape principale:
+
+1. Antrenarea modelului prin iterarea peste toate exemplele din `train_dataloader` pentru fiecare epocă.
+2. Generarea rezumatelor modelului la sfârșitul fiecărei epoci, mai întâi prin generarea token-urilor și apoi prin decodarea lor (și a rezumatelor de referință) în text.
+3. Calcularea scorurilor ROUGE folosind aceleași tehnici pe care le-am văzut mai devreme.
+4. Salvați checkpointurile și încărcați totul pe Hub. Aici ne bazăm pe argumentul `blocking=False` al obiectului `Repository` astfel încât să putem împinge checkointurile pentru fiecare epocă _asincron_. Acest lucru ne permite să continuăm antrenamentul fără a fi nevoiți să așteptăm încărcarea oarecum lentă asociată cu un model de dimensiunea unui GB!
+
+Acești pași pot fi observați în următorul bloc de cod:
+
+```python
+from tqdm.auto import tqdm
+import torch
+import numpy as np
+
+progress_bar = tqdm(range(num_training_steps))
+
+for epoch in range(num_train_epochs):
+    # Training
+    model.train()
+    for step, batch in enumerate(train_dataloader):
+        outputs = model(**batch)
+        loss = outputs.loss
+        accelerator.backward(loss)
+
+        optimizer.step()
+        lr_scheduler.step()
+        optimizer.zero_grad()
+        progress_bar.update(1)
+
+    # Evaluation
+    model.eval()
+    for step, batch in enumerate(eval_dataloader):
+        with torch.no_grad():
+            generated_tokens = accelerator.unwrap_model(model).generate(
+                batch["input_ids"],
+                attention_mask=batch["attention_mask"],
+            )
+
+            generated_tokens = accelerator.pad_across_processes(
+                generated_tokens, dim=1, pad_index=tokenizer.pad_token_id
+            )
+            labels = batch["labels"]
+
+            # If we did not pad to max length, we need to pad the labels too
+            labels = accelerator.pad_across_processes(
+                batch["labels"], dim=1, pad_index=tokenizer.pad_token_id
+            )
+
+            generated_tokens = accelerator.gather(generated_tokens).cpu().numpy()
+            labels = accelerator.gather(labels).cpu().numpy()
+
+            # Replace -100 in the labels as we can't decode them
+            labels = np.where(labels != -100, labels, tokenizer.pad_token_id)
+            if isinstance(generated_tokens, tuple):
+                generated_tokens = generated_tokens[0]
+            decoded_preds = tokenizer.batch_decode(
+                generated_tokens, skip_special_tokens=True
+            )
+            decoded_labels = tokenizer.batch_decode(labels, skip_special_tokens=True)
+
+            decoded_preds, decoded_labels = postprocess_text(
+                decoded_preds, decoded_labels
+            )
+
+            rouge_score.add_batch(predictions=decoded_preds, references=decoded_labels)
+
+    # Compute metrics
+    result = rouge_score.compute()
+    # Extract the median ROUGE scores
+    result = {key: value.mid.fmeasure * 100 for key, value in result.items()}
+    result = {k: round(v, 4) for k, v in result.items()}
+    print(f"Epoch {epoch}:", result)
+
+    # Save and upload
+    accelerator.wait_for_everyone()
+    unwrapped_model = accelerator.unwrap_model(model)
+    unwrapped_model.save_pretrained(output_dir, save_function=accelerator.save)
+    if accelerator.is_main_process:
+        tokenizer.save_pretrained(output_dir)
+        repo.push_to_hub(
+            commit_message=f"Training in progress epoch {epoch}", blocking=False
+        )
+```
+
+```python out
+Epoch 0: {'rouge1': 5.6351, 'rouge2': 1.1625, 'rougeL': 5.4866, 'rougeLsum': 5.5005}
+Epoch 1: {'rouge1': 9.8646, 'rouge2': 3.4106, 'rougeL': 9.9439, 'rougeLsum': 9.9306}
+Epoch 2: {'rouge1': 11.0872, 'rouge2': 3.3273, 'rougeL': 11.0508, 'rougeLsum': 10.9468}
+Epoch 3: {'rouge1': 11.8587, 'rouge2': 4.8167, 'rougeL': 11.7986, 'rougeLsum': 11.7518}
+Epoch 4: {'rouge1': 12.9842, 'rouge2': 5.5887, 'rougeL': 12.7546, 'rougeLsum': 12.7029}
+Epoch 5: {'rouge1': 13.4628, 'rouge2': 6.4598, 'rougeL': 13.312, 'rougeLsum': 13.2913}
+Epoch 6: {'rouge1': 12.9131, 'rouge2': 5.8914, 'rougeL': 12.6896, 'rougeLsum': 12.5701}
+Epoch 7: {'rouge1': 13.3079, 'rouge2': 6.2994, 'rougeL': 13.1536, 'rougeLsum': 13.1194}
+Epoch 8: {'rouge1': 13.96, 'rouge2': 6.5998, 'rougeL': 13.9123, 'rougeLsum': 13.7744}
+Epoch 9: {'rouge1': 14.1192, 'rouge2': 7.0059, 'rougeL': 14.1172, 'rougeLsum': 13.9509}
+```
+
+Și asta e tot! După ce executați acest lucru, veți avea un model și rezultate care sunt destul de asemănătoare cu cele obținute cu `Trainer`.
+
+{/if}
+
+## Utilizarea modelului fine-tuned[[using-your-fine-tuned-model]]
+
+Odată ce ați încărcat modelul în Hub, vă puteți juca cu el prin widgetul de inference, fie cu un obiect `pipeline`, după cum urmează:
+
+```python
+from transformers import pipeline
+
+hub_model_id = "huggingface-course/mt5-small-finetuned-amazon-en-es"
+summarizer = pipeline("summarization", model=hub_model_id)
+```
+
+Putem introduce câteva exemple din setul de testare (pe care modelul nu le-a văzut) în pipelineul noastru pentru a avea o idee despre calitatea rezumatelor. Mai întâi, să implementăm o funcție simplă pentru a afișa împreună recenzia, titlul și rezumatul generat:
+
+```python
+def print_summary(idx):
+    review = books_dataset["test"][idx]["review_body"]
+    title = books_dataset["test"][idx]["review_title"]
+    summary = summarizer(books_dataset["test"][idx]["review_body"])[0]["summary_text"]
+    print(f"'>>> Review: {review}'")
+    print(f"\n'>>> Title: {title}'")
+    print(f"\n'>>> Summary: {summary}'")
+```
+
+Să aruncăm o privire la unul dintre exemplele englezești pe care le primim:
+
+```python
+print_summary(100)
+```
+
+```python out
+'>>> Review: Nothing special at all about this product... the book is too small and stiff and hard to write in. The huge sticker on the back doesn’t come off and looks super tacky. I would not purchase this again. I could have just bought a journal from the dollar store and it would be basically the same thing. It’s also really expensive for what it is.'
+
+'>>> Title: Not impressed at all... buy something else'
+
+'>>> Summary: Nothing special at all about this product'
+```
+
+This is not too bad! We can see that our model has actually been able to perform _abstractive_ summarization by augmenting parts of the review with new words. And perhaps the coolest aspect of our model is that it is bilingual, so we can also generate summaries of Spanish reviews:
+
+```python
+print_summary(0)
+```
+
+```python out
+'>>> Review: Es una trilogia que se hace muy facil de leer. Me ha gustado, no me esperaba el final para nada'
+
+'>>> Title: Buena literatura para adolescentes'
+
+'>>> Summary: Muy facil de leer'
+```
+
+Rezumatul se traduce prin "Very easy to read" în limba engleză, ceea ce putem vedea că în acest caz a fost extras direct din recenzie. Cu toate acestea, acest lucru arată versatilitatea modelului mT5 și v-a dat o idee despre cum este să aveți de-a face cu un corpus multilingv!
+
+În continuare, ne vom îndrepta atenția către o sarcină puțin mai complexă: antrenarea unui model lingvistic de la zero.
\ No newline at end of file
diff --git a/chapters/rum/chapter7/6.mdx b/chapters/rum/chapter7/6.mdx
new file mode 100644
index 000000000..4c78cb1bd
--- /dev/null
+++ b/chapters/rum/chapter7/6.mdx
@@ -0,0 +1,914 @@
+<FrameworkSwitchCourse {fw} />
+
+# Antrenarea de la zero a unui model de limbaj cauzal[[training-a-causal-language-model-from-scratch]]
+
+{#if fw === 'pt'}
+
+<CourseFloatingBanner chapter={7}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter7/section6_pt.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter7/section6_pt.ipynb"},
+]} />
+
+{:else}
+
+<CourseFloatingBanner chapter={7}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter7/section6_tf.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter7/section6_tf.ipynb"},
+]} />
+
+{/if}
+
+Până acum, am folosit în principal modele preantrenate și le-am făcut fine-tuning pentru noi cazuri de utilizare prin reutilizarea weighturilor din preantrenare. După cum am văzut în [Capitolul 1](/course/chapter1), acest lucru este denumit în mod obișnuit _învățare prin transfer_ și este o strategie foarte reușită pentru aplicarea modelelor Transformer la majoritatea cazurilor de utilizare din lumea reală în care datele etichetate sunt puține. În acest capitol, vom adopta o abordare diferită și vom antrena un model complet nou de la zero. Aceasta este o abordare bună dacă aveți multe date și este foarte diferită de datele de preantrenare utilizate pentru modelele disponibile. Cu toate acestea, preantrenarea unui model lingvistic necesită, de asemenea, mult mai multe resurse de calcul decât fine-tuningul unui model existent. Printre exemplele în care poate fi utilă antrenarea unui nou model se numără dataseturile formate din note muzicale, secvențe moleculare precum ADN sau limbaje de programare. Acestea din urmă au câștigat recent teren datorită unor instrumente precum TabNine și Copilot de la GitHub, alimentate de modelul Codex al OpenAI, care pot genera secvențe lungi de cod. Această sarcină de generare a textului este cel mai bine abordată cu modele de limbaj autoregresive sau cauzale, cum ar fi GPT-2.
+
+În această secțiune vom construi o versiune la scară redusă a unui model de generare a codului: ne vom concentra pe completări de o linie în loc de funcții sau clase complete, folosind un subset de cod Python. Atunci când lucrați cu date în Python, sunteți în contact frecvent Python data science stack, formată din bibliotecile `matplotlib`, `seaborn`, `pandas` și `scikit-learn`. Atunci când se utilizează aceste cadre, este frecvent să fie nevoie să se caute comenzi specifice, astfel încât ar fi bine dacă am putea utiliza un model care să efectueze aceste apeluri pentru noi.
+
+<Youtube id="Vpjb1lu0MDk"/>
+
+În [Capitolul 6](/course/chapter6) am creat un tokenizer eficient pentru a procesa codul sursă Python, dar avem nevoie de un dataset la scară largă pe care să preantrenăm un model. Aici, vom aplica tokenizerul nostru la un corpus de cod Python derivat din repositoriile GitHub. Vom utiliza apoi API-ul `Trainer` și 🤗 Accelerate pentru a antrena modelul. Să trecem la treabă!
+
+<iframe src="https://course-demos-codeparrot-ds.hf.space" frameBorder="0" height="300" title="Gradio app" class="block dark:hidden container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
+
+Aceasta este de fapt o prezentare a modelului care a fost antrenat și încărcat în Hub folosind codul prezentat în această secțiune. Îl puteți găsi [aici](https://huggingface.co/huggingface-course/codeparrot-ds?text=plt.imshow%28). Rețineți că, deoarece are loc o anumită randomizare în generarea textului, veți obține probabil un rezultat ușor diferit.
+ 
+## Colectarea datelor[[gathering-the-data]]
+
+Codul Python este disponibil din abundență în repositorii de cod, cum ar fi GitHub, pe care le putem utiliza pentru a crea un dataset prin scraping pentru fiecare repositoriu Python. Aceasta a fost abordarea adoptată în [Transformers textbook](https://learning.oreilly.com/library/view/natural-language-processing/9781098136789/) pentru a preantrena un model GPT-2. Folosind o descărcare GitHub de aproximativ 180 GB care conține aproximativ 20 de milioane de fișiere Python numită `codeparrot`, autorii au construit un dataset pe care l-au oferit apoi pe [Hugging Face Hub](https://huggingface.co/datasets/transformersbook/codeparrot).
+
+Cu toate acestea, antrenarea pe întregul corpus consumă timp și puterea calculatorului, iar noi avem nevoie doar de subsetul datasetului referitor la Python data science stack. Așadar, să începem prin filtrarea datasetului `codeparrot` pentru toate fișierele care includ oricare dintre bibliotecile din aceast stack. Din cauza dimensiunii datasetului, dorim să evităm descărcarea acestuia; în schimb, vom utiliza funcția de streaming pentru a-l filtra din mers. Pentru a ne ajuta să filtrăm exemplele de cod care utilizează bibliotecile pe care le-am menționat mai devreme, vom utiliza următoarea funcție:
+
+```py
+def any_keyword_in_string(string, keywords):
+    for keyword in keywords:
+        if keyword in string:
+            return True
+    return False
+```
+
+Să-l testăm pe două exemple:
+
+```py
+filters = ["pandas", "sklearn", "matplotlib", "seaborn"]
+example_1 = "import numpy as np"
+example_2 = "import pandas as pd"
+
+print(
+    any_keyword_in_string(example_1, filters), any_keyword_in_string(example_2, filters)
+)
+```
+
+```python out
+False True
+```
+
+Putem folosi acest lucru pentru a crea o funcție care va transmite în flux datasetul și va filtra elementele dorite:
+
+```py
+from collections import defaultdict
+from tqdm import tqdm
+from datasets import Dataset
+
+
+def filter_streaming_dataset(dataset, filters):
+    filtered_dict = defaultdict(list)
+    total = 0
+    for sample in tqdm(iter(dataset)):
+        total += 1
+        if any_keyword_in_string(sample["content"], filters):
+            for k, v in sample.items():
+                filtered_dict[k].append(v)
+    print(f"{len(filtered_dict['content'])/total:.2%} of data after filtering.")
+    return Dataset.from_dict(filtered_dict)
+```
+
+Apoi, putem aplica pur și simplu această funcție pe datasetului din flux:
+
+```py
+# This cell will take a very long time to execute, so you should skip it and go to
+# the next one!
+from datasets import load_dataset
+
+split = "train"  # "valid"
+filters = ["pandas", "sklearn", "matplotlib", "seaborn"]
+
+data = load_dataset(f"transformersbook/codeparrot-{split}", split=split, streaming=True)
+filtered_data = filter_streaming_dataset(data, filters)
+```
+
+```python out
+3.26% of data after filtering.
+```
+
+Acest lucru ne lasă cu aproximativ 3% din setul de date original, care este încă destul de mare - datasetul rezultat este de 6 GB și constă din 600.000 de scripturi Python!
+
+Filtrarea datasetului complet poate dura 2-3 ore, în funcție de calculator și de bandwidth. Dacă nu doriți să parcurgeți singur acest proces îndelungat, vă punem la dispoziție datasetul filtrat pe Hub pentru a-l descărca:
+
+```py
+from datasets import load_dataset, DatasetDict
+
+ds_train = load_dataset("huggingface-course/codeparrot-ds-train", split="train")
+ds_valid = load_dataset("huggingface-course/codeparrot-ds-valid", split="validation")
+
+raw_datasets = DatasetDict(
+    {
+        "train": ds_train,  # .shuffle().select(range(50000)),
+        "valid": ds_valid,  # .shuffle().select(range(500))
+    }
+)
+
+raw_datasets
+```
+
+```python out
+DatasetDict({
+    train: Dataset({
+        features: ['repo_name', 'path', 'copies', 'size', 'content', 'license'],
+        num_rows: 606720
+    })
+    valid: Dataset({
+        features: ['repo_name', 'path', 'copies', 'size', 'content', 'license'],
+        num_rows: 3322
+    })
+})
+```
+
+<Tip>
+
+Preantrenarea modelului de limbaj va dura ceva timp. Vă sugerăm să rulați mai întâi bucla de antrenare pe un sample de date prin decomentarea celor două linii parțiale de mai sus și să vă asigurați că antrenarea se finalizează cu succes și că modelele sunt stocate. Nimic nu este mai frustrant decât o rulare de antrenare care eșuează la ultimul pas pentru că ați uitat să creați un folder sau pentru că există o greșeală de tipar la sfârșitul buclei de antrenare!
+
+</Tip>
+
+Să ne uităm la un exemplu din dataset. Vom arăta doar primele 200 de caractere din fiecare câmp:
+
+```py
+for key in raw_datasets["train"][0]:
+    print(f"{key.upper()}: {raw_datasets['train'][0][key][:200]}")
+```
+
+```python out
+'REPO_NAME: kmike/scikit-learn'
+'PATH: sklearn/utils/__init__.py'
+'COPIES: 3'
+'SIZE: 10094'
+'''CONTENT: """
+The :mod:`sklearn.utils` module includes various utilites.
+"""
+
+from collections import Sequence
+
+import numpy as np
+from scipy.sparse import issparse
+import warnings
+
+from .murmurhash import murm
+LICENSE: bsd-3-clause'''
+```
+
+Putem vedea căci câmpul `content` conține codul pe care dorim ca modelul nostru să se antreneze. Acum că avem un dataset, trebuie să pregătim textele astfel încât acestea să fie într-un format adecvat pentru preantrenare.
+
+## Pregătirea datasetului[[preparing-the-dataset]]
+
+<Youtube id="ma1TrR7gE7I"/>
+
+Primul pas va fi tokenizarea datelor, astfel încât să le putem utiliza pentru antrenare. Deoarece obiectivul nostru este de a autocompleta în principal apeluri scurte de funcții, putem păstra dimensiunea contextului relativ mică. Acest lucru are avantajul că putem antrena modelul mult mai rapid și că necesită semnificativ mai puțină memorie. Dacă este important pentru aplicația voastră să aveți mai mult context (de exemplu, dacă doriți ca modelul să scrie teste unitare pe baza unui fișier cu definiția funcției), asigurați-vă că măriți acest număr, dar rețineți, de asemenea, că acest lucru vine cu utilizare mai mare de memorie GPU. Pentru moment, să fixăm dimensiunea contextului la 128 de tokeni, spre deosebire de 1 024 sau 2 048 utilizate în GPT-2 sau respectiv GPT-3.
+
+Majoritatea documentelor conțin mult mai mult de 128 de cuvinte, astfel încât trunchierea simplă a inputurilor la lungimea maximă ar elimina o mare parte din datasetul nostru. În schimb, vom utiliza opțiunea `return_overflowing_tokens` pentru a tokeniza întreagul input și a o împărți în mai multe bucăți, așa cum am făcut în [Capitolul 6](/course/chapter6/4). De asemenea, vom utiliza opțiunea `return_length` pentru a returna automat lungimea fiecărui fragment creat. Adesea, ultimul fragment va fi mai mic decât dimensiunea contextului, iar noi vom scăpa de aceste bucăți pentru a evita problemele de padding; nu avem nevoie de ele, deoarece oricum avem o mulțime de date.
+
+<div class="flex justify-center">
+<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/chunking_texts.svg" alt="Fragmentarea unui text mare în mai multe bucăți."/>
+<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/chunking_texts-dark.svg" alt="Fragmentarea unui text mare în mai multe bucăți."/>
+</div>
+
+Să vedem exact cum funcționează acest lucru analizând primele două exemple:
+
+```py
+from transformers import AutoTokenizer
+
+context_length = 128
+tokenizer = AutoTokenizer.from_pretrained("huggingface-course/code-search-net-tokenizer")
+
+outputs = tokenizer(
+    raw_datasets["train"][:2]["content"],
+    truncation=True,
+    max_length=context_length,
+    return_overflowing_tokens=True,
+    return_length=True,
+)
+
+print(f"Input IDs length: {len(outputs['input_ids'])}")
+print(f"Input chunk lengths: {(outputs['length'])}")
+print(f"Chunk mapping: {outputs['overflow_to_sample_mapping']}")
+```
+
+```python out
+Input IDs length: 34
+Input chunk lengths: [128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 117, 128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 128, 41]
+Chunk mapping: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]
+```
+
+Putem vedea că obținem 34 de segmente în total din aceste două exemple. Uitându-ne la lungimea segmentelor, putem vedea că segmentele de la sfârșitul ambelor documente au mai puțin de 128 de token-uri (117 și, respectiv, 41). Acestea reprezintă doar o mică parte din totalul segmentelor pe care le avem, așa că le putem șterge în siguranță. Cu ajutorul câmpului `overflow_to_sample_mapping`, putem, de asemenea, să reconstituim care segmente au aparținut căror probe de intrare.
+
+Cu această operațiune folosim o caracteristică utilă a funcției `Dataset.map()` din 🤗 Datasets, și anume că nu necesită one-to-one maps; așa cum am văzut în [secțiunea 3](/course/chaptero7/3), putem crea batch-uri cu mai multe sau mai puține elemente decât batch-ul de intrare. Acest lucru este util atunci când efectuăm operațiuni precum augmentarea sau filtrarea datelor care modifică numărul de elemente. În cazul nostru, atunci când tokenizăm fiecare element în segmente de dimensiunea contextului specificat, creăm multe probe din fiecare document. Trebuie doar să ne asigurăm că ștergem coloanele existente, deoarece acestea au o dimensiune conflictuală. Dacă am dori să le păstrăm, am putea să le repetăm în mod corespunzător și să le returnăm în cadrul apelului `Dataset.map()`:
+
+```py
+def tokenize(element):
+    outputs = tokenizer(
+        element["content"],
+        truncation=True,
+        max_length=context_length,
+        return_overflowing_tokens=True,
+        return_length=True,
+    )
+    input_batch = []
+    for length, input_ids in zip(outputs["length"], outputs["input_ids"]):
+        if length == context_length:
+            input_batch.append(input_ids)
+    return {"input_ids": input_batch}
+
+
+tokenized_datasets = raw_datasets.map(
+    tokenize, batched=True, remove_columns=raw_datasets["train"].column_names
+)
+tokenized_datasets
+```
+
+```python out
+DatasetDict({
+    train: Dataset({
+        features: ['input_ids'],
+        num_rows: 16702061
+    })
+    valid: Dataset({
+        features: ['input_ids'],
+        num_rows: 93164
+    })
+})
+```
+
+Avem acum 16,7 milioane de exemple cu 128 de tokenii fiecare, ceea ce corespunde unui total de aproximativ 2,1 miliarde de tokeni. Ca referință, modelele GPT-3 și Codex ale OpenAI sunt antrenate pe 300 și, respectiv, 100 de miliarde de tokeni, unde modelele Codex sunt inițializate din checkpointurile GPT-3. Scopul nostru în această secțiune nu este de a concura cu aceste modele, care pot genera texte lungi și coerente, ci de a crea o versiune la scară redusă care să ofere o funcție rapidă de autocompletare pentru data scientists.
+
+Acum că avem datasetul gata, hai să configurăm modelul!
+
+<Tip>
+
+✏️ **Încercați!** Eliminarea tuturor bucăților care sunt mai mici decât dimensiunea contextului nu a fost o problemă majoră aici, deoarece folosim ferestre de context mici. Pe măsură ce creșteți dimensiunea contextului (sau dacă aveți un corpus de documente scurte), fracțiunea de segmente care sunt aruncate va crește și ea. O modalitate mai eficientă de a pregăti datele este de a uni toate sampleurile tokenizate într-un batch cu un token `eos_token_id` între ele, iar apoi de a efectua chunkingul pe secvențele concatenate. Ca exercițiu, modificați funcția `tokenize()` pentru a utiliza această abordare. Rețineți că veți dori să setați `truncation=False` și să eliminați celelalte argumente din tokenizer pentru a obține secvența completă de token IDs.
+
+</Tip>
+
+
+## Inițializarea unui nou model[[initializing-a-new-model]]
+
+Primul nostru pas este să inițializăm un model GPT-2. Vom utiliza aceeași configurație pentru modelul nostru ca și pentru modelul GPT-2 mic, deci încărcăm configurația preantrenată, ne asigurăm că dimensiunea tokenizerlui corespunde cu dimensiunea vocabularului modelului și transmitem ID-urile tokenilor `bos` și `eos` (începutul și sfârșitul secvenței):
+
+{#if fw === 'pt'}
+
+```py
+from transformers import AutoTokenizer, GPT2LMHeadModel, AutoConfig
+
+config = AutoConfig.from_pretrained(
+    "gpt2",
+    vocab_size=len(tokenizer),
+    n_ctx=context_length,
+    bos_token_id=tokenizer.bos_token_id,
+    eos_token_id=tokenizer.eos_token_id,
+)
+```
+
+Cu această configurație, putem încărca un nou model. Rețineți că aceasta este prima dată când nu folosim funcția `from_pretrained()`, deoarece inițializăm noi înșine un model:
+
+```py
+model = GPT2LMHeadModel(config)
+model_size = sum(t.numel() for t in model.parameters())
+print(f"GPT-2 size: {model_size/1000**2:.1f}M parameters")
+```
+
+```python out
+GPT-2 size: 124.2M parameters
+```
+
+{:else}
+
+```py
+from transformers import AutoTokenizer, TFGPT2LMHeadModel, AutoConfig
+
+config = AutoConfig.from_pretrained(
+    "gpt2",
+    vocab_size=len(tokenizer),
+    n_ctx=context_length,
+    bos_token_id=tokenizer.bos_token_id,
+    eos_token_id=tokenizer.eos_token_id,
+)
+```
+
+Cu această configurație, putem încărca un nou model. Rețineți că aceasta este prima dată când nu folosim funcția `from_pretrained()`, deoarece inițializăm noi înșine un model:
+
+```py
+model = TFGPT2LMHeadModel(config)
+model(model.dummy_inputs)  # Builds the model
+model.summary()
+```
+
+```python out
+_________________________________________________________________
+Layer (type)                 Output Shape              Param #   
+=================================================================
+transformer (TFGPT2MainLayer multiple                  124242432 
+=================================================================
+Total params: 124,242,432
+Trainable params: 124,242,432
+Non-trainable params: 0
+_________________________________________________________________
+```
+
+{/if}
+
+Modelul nostru are 124 milioane de parametri pe care va trebui să le facem tune. Înainte de a începe antrenarea, trebuie să configurăm un data collator care se va ocupa de crearea batch-urilor. Putem utiliza colatorul `DataCollatorForLanguageModeling`, care este conceput special pentru modelarea limbajului (după cum sugerează subtil numele). Pe lângă stacking și paddingul batchurilor, acesta se ocupă și de crearea labelurilor modelului lingvistic - în modelarea cauzală a limbajului, inputurile servesc și ca labels (doar că sunt decalate cu un element), iar acest data collator le creează din mers în timpul antrenării, astfel încât să nu fie nevoie să duplicăm `input_ids`.
+
+Rețineți că `DataCollatorForLanguageModeling` acceptă atât masked language masking (MLM), cât și causal language modeling(CLM). În mod implicit, acesta pregătește datele pentru MLM, dar putem trece la CLM prin setarea argumentului `mlm=False`:
+
+{#if fw === 'pt'}
+
+```py
+from transformers import DataCollatorForLanguageModeling
+
+tokenizer.pad_token = tokenizer.eos_token
+data_collator = DataCollatorForLanguageModeling(tokenizer, mlm=False)
+```
+
+{:else}
+
+```py
+from transformers import DataCollatorForLanguageModeling
+
+tokenizer.pad_token = tokenizer.eos_token
+data_collator = DataCollatorForLanguageModeling(tokenizer, mlm=False, return_tensors="tf")
+```
+
+{/if}
+
+Să aruncăm o privire la un exemplu:
+
+```py
+out = data_collator([tokenized_datasets["train"][i] for i in range(5)])
+for key in out:
+    print(f"{key} shape: {out[key].shape}")
+```
+
+{#if fw === 'pt'}
+
+```python out
+input_ids shape: torch.Size([5, 128])
+attention_mask shape: torch.Size([5, 128])
+labels shape: torch.Size([5, 128])
+```
+
+{:else}
+
+```python out
+input_ids shape: (5, 128)
+attention_mask shape: (5, 128)
+labels shape: (5, 128)
+```
+
+{/if}
+
+Putem vedea că exemplele sunt stacked și că toți tensorii au aceeași formă.
+
+{#if fw === 'tf'}
+
+Acum putem utiliza metoda `prepare_tf_dataset()` pentru a converti dataseturile noastre în dataseturi TensorFlow cu ajutorul data collatorului pe care l-am creat mai sus:
+
+```python
+tf_train_dataset = model.prepare_tf_dataset(
+    tokenized_datasets["train"],
+    collate_fn=data_collator,
+    shuffle=True,
+    batch_size=32,
+)
+tf_eval_dataset = model.prepare_tf_dataset(
+    tokenized_datasets["valid"],
+    collate_fn=data_collator,
+    shuffle=False,
+    batch_size=32,
+)
+```
+
+{/if}
+
+<Tip warning={true}>
+
+⚠️ Schimbarea inputurilor și a labelurilor pentru a le alinia are loc în interiorul modelului, astfel încât data collatorului doar copiază inputurile pentru a crea labeluri.
+
+</Tip>
+
+
+Acum avem totul pregătit pentru a ne antrena modelul - până la urmă nu a fost atât de greu! Înainte de a începe antrenamentul, trebuie să ne conectăm la Hugging Face. Dacă lucrați într-un notebook, puteți face acest lucru cu următoarea funcție de utilitate:
+
+```python
+from huggingface_hub import notebook_login
+
+notebook_login()
+```
+
+Aceasta va afișa un widget în care puteți introduce datele voastre de autentificare Hugging Face.
+
+Dacă nu lucrați într-un notebook, tastați următoarea linie în terminal:
+
+```bash
+huggingface-cli login
+```
+
+{#if fw === 'pt'}
+
+Tot ce a mai rămas de făcut este să configurăm argumentele de antrenare și să pornim `Trainer`-ul. Vom utiliza un cosine learning rate schedule cu un warmup și o dimensiune efectivă a batch-ului de 256 (`per_device_train_batch_size` * `gradient_accumulation_steps`). Acumularea gradientului este utilizată atunci când un singur batch nu încape în memorie și construiește treptat gradientul prin mai multe treceri înainte/înapoi. Vom vedea acest lucru în acțiune atunci când vom crea bucla de antrenare cu 🤗 Accelerate.
+
+```py
+from transformers import Trainer, TrainingArguments
+
+args = TrainingArguments(
+    output_dir="codeparrot-ds",
+    per_device_train_batch_size=32,
+    per_device_eval_batch_size=32,
+    evaluation_strategy="steps",
+    eval_steps=5_000,
+    logging_steps=5_000,
+    gradient_accumulation_steps=8,
+    num_train_epochs=1,
+    weight_decay=0.1,
+    warmup_steps=1_000,
+    lr_scheduler_type="cosine",
+    learning_rate=5e-4,
+    save_steps=5_000,
+    fp16=True,
+    push_to_hub=True,
+)
+
+trainer = Trainer(
+    model=model,
+    tokenizer=tokenizer,
+    args=args,
+    data_collator=data_collator,
+    train_dataset=tokenized_datasets["train"],
+    eval_dataset=tokenized_datasets["valid"],
+)
+```
+
+Acum putem doar să pornim `Trainer`-ul și să așteptăm ca antrenamentul să se termine. În funcție de executarea antrenării pe întregul set de antrenarea sau pe un subset al acestuia, va dura 20 minute, sau respectiv 2 ore, așa că luați câteva cafeluțe și o carte bună de citit!
+
+```py
+trainer.train()
+```
+
+După finalizarea antrenării, putem trimite modelul și tokenizerul către Hub:
+
+```py
+trainer.push_to_hub()
+```
+
+{:else}
+
+Tot ce rămâne de făcut este să configurați hiperparametrii de antrenament și să apelați `compile()` și `fit()`. Vom utiliza un program al learning rate cu un anumit warmup pentru a îmbunătăți stabilitatea antrenării:
+
+```py
+from transformers import create_optimizer
+import tensorflow as tf
+
+num_train_steps = len(tf_train_dataset)
+optimizer, schedule = create_optimizer(
+    init_lr=5e-5,
+    num_warmup_steps=1_000,
+    num_train_steps=num_train_steps,
+    weight_decay_rate=0.01,
+)
+model.compile(optimizer=optimizer)
+
+# Train in mixed-precision float16
+tf.keras.mixed_precision.set_global_policy("mixed_float16")
+```
+
+Acum putem apela `model.fit()` și să așteptăm ca antrenarea să se încheie. În funcție de executarea antrenării pe întregul set de antrenarea sau pe un subset al acestuia, va dura 20 minute, sau respectiv 2 ore, așa că luați câteva cafeluțe și o carte bună de citit!
+
+```py
+from transformers.keras_callbacks import PushToHubCallback
+
+callback = PushToHubCallback(output_dir="codeparrot-ds", tokenizer=tokenizer)
+
+model.fit(tf_train_dataset, validation_data=tf_eval_dataset, callbacks=[callback])
+```
+
+{/if}
+
+<Tip>
+
+✏️ **Try it out!** Ne-a luat doar aproximativ 30 de linii de cod în plus față de `TrainingArguments` pentru a ajunge de la texte brute la antrenarea GPT-2. Încercați antrenarea cu propriul dataset și vedeți dacă puteți obține rezultate bune!
+
+</Tip>
+
+<Tip>
+
+{#if fw === 'pt'}
+
+💡 Dacă aveți acces la un calculator cu mai multe GPU-uri, încercați să rulați codul acolo. `Trainer` gestionează automat mai multe calculatoare, iar acest lucru poate accelera foarte mult antrenamentul.
+
+{:else}
+
+💡 Dacă aveți acces la un calculator cu mai multe GPU-uri, puteți încerca să utilizați un context `MirroredStrategy` pentru a accelera substanțial antrenarea. Va trebui să creați un obiect `tf.distribute.MirroredStrategy` și să vă asigurați că toate metodele `to_tf_dataset()` sau `prepare_tf_dataset()`, precum și crearea modelului și apelul la `fit()` sunt rulate în contextul său `scope()`. Puteți vedea documentația despre acest lucru [aici] (https://www.tensorflow.org/guide/distributed_training#use_tfdistributestrategy_with_keras_modelfit).
+
+{/if}
+
+</Tip>
+
+## Generarea codului cu un pipeline[[code-generation-with-a-pipeline]]
+
+Acum este momentul adevărului: să vedem cât de bine funcționează de fapt modelul antrenat! Putem vedea în loguri că pierderea a scăzut în mod constant, dar pentru a testa modelul, hai să vedem cât de bine funcționează la câteva încerări. Pentru a face acest lucru, vom încorpora modelul într-un `pipeline` de generare a textului și îl vom pune pe un GPU pentru generații rapide, dacă există unul disponibil:
+
+{#if fw === 'pt'}
+
+```py
+import torch
+from transformers import pipeline
+
+device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")
+pipe = pipeline(
+    "text-generation", model="huggingface-course/codeparrot-ds", device=device
+)
+```
+
+{:else}
+
+```py
+from transformers import pipeline
+
+course_model = TFGPT2LMHeadModel.from_pretrained("huggingface-course/codeparrot-ds")
+course_tokenizer = AutoTokenizer.from_pretrained("huggingface-course/codeparrot-ds")
+pipe = pipeline(
+    "text-generation", model=course_model, tokenizer=course_tokenizer, device=0
+)
+```
+
+{/if}
+
+Să începem cu sarcina simplă de a crea un scatter plot:
+
+```py
+txt = """\
+# create some data
+x = np.random.randn(100)
+y = np.random.randn(100)
+
+# crearea unui scatter plot cu x, y
+"""
+print(pipe(txt, num_return_sequences=1)[0]["generated_text"])
+```
+
+```python out
+# crearea unor date
+x = np.random.randn(100)
+y = np.random.randn(100)
+
+# crearea scatter plot cu x, y
+plt.scatter(x, y)
+
+# crearea scatter
+```
+
+Rezultatul pare corect. Funcționează și pentru o operație `pandas`? Să vedem dacă putem crea un `DataFrame` din două array-uri:
+
+```py
+txt = """\
+# create some data
+x = np.random.randn(100)
+y = np.random.randn(100)
+
+# creați dataframeul din x și y
+"""
+print(pipe(txt, num_return_sequences=1)[0]["generated_text"])
+```
+
+```python out
+# create some data
+x = np.random.randn(100)
+y = np.random.randn(100)
+
+# crează un dataframe din x și y
+df = pd.DataFrame({'x': x, 'y': y})
+df.insert(0,'x', x)
+for
+```
+
+Excelent, acesta este răspunsul corect - deși apoi introduce din nou coloana `x`. Deoarece numărul de tokeni generate este limitat, următoarea buclă `for` este întreruptă. Să vedem dacă putem face ceva un pic mai complex și dacă modelul ne ajută să folosim operația `groupby`:
+
+```py
+txt = """\
+# dataframe with profession, income and name
+df = pd.DataFrame({'profession': x, 'income':y, 'name': z})
+
+# calculați venitul mediu pe profesie
+"""
+print(pipe(txt, num_return_sequences=1)[0]["generated_text"])
+```
+
+```python out
+# dataframe with profession, income and name
+df = pd.DataFrame({'profession': x, 'income':y, 'name': z})
+
+# calculeză venitul mediu pe profesie
+profession = df.groupby(['profession']).mean()
+
+# calculează
+```
+
+Nu este rău; acesta este modul corect de a face acest lucru. În cele din urmă, să vedem dacă îl putem folosi și pentru `scikit-learn` și să configurăm un model Random Forest:
+
+```py
+txt = """
+# import random forest regressor from scikit-learn
+from sklearn.ensemble import RandomForestRegressor
+
+# ajustați modelul Random Forest cu 300 de estimatori pe X, y:
+"""
+print(pipe(txt, num_return_sequences=1)[0]["generated_text"])
+```
+
+```python out
+# import random forest regressor from scikit-learn
+from sklearn.ensemble import RandomForestRegressor
+
+# ajustați modelul Random Forest cu 300 de estimatori pe X, y:
+rf = RandomForestRegressor(n_estimators=300, random_state=random_state, max_depth=3)
+rf.fit(X, y)
+rf
+```
+
+{#if fw === 'tf'}
+
+Privind la aceste câteva exemple, se pare că modelul a învățat o parte din sintaxa Python data science stack. Desigur, ar trebui să evaluăm modelul mai amănunțit înainte de a-l implementa în lumea reală, totuși acesta este un prototip impresionant.
+
+{:else}
+
+Privind aceste câteva exemple, se pare că modelul a învățat o parte din sintaxa Python data science stack(desigur, ar trebui să o evaluăm mai bine înainte de a implementa modelul în lumea reală). Cu toate acestea, uneori este nevoie de o mai mare personalizare a antrenării modelului pentru a obține performanța necesară pentru un anumit caz de utilizare. De exemplu, dacă am dori să actualizăm dinamic dimensiunea batch-ului sau să avem o buclă de antrenare condiționată care trece peste exemplele proaste din mers? O opțiune ar fi să facem subclass la `Trainer` și să adăugăm modificările necesare, dar uneori este mai simplu să scriem bucla de antrenare de la zero. Aici intervine 🤗 Accelerate.
+
+{/if}
+
+{#if fw === 'pt'}
+
+## Antrenarea cu 🤗 Accelerate[[training-with-accelerate]]
+
+Am văzut cum să antrenăm un model cu `Trainer`, care poate permite o anumită personalizare. Cu toate acestea, uneori dorim control deplin asupra buclei de antrenare sau dorim să facem unele schimbări exotice. În acest caz, 🤗 Accelerate este o alegere excelentă, iar în această secțiune vom parcurge pașii de utilizare a acestuia pentru a ne antrena modelul. Pentru a face lucrurile mai interesante, vom adăuga și un twist buclei de antrenare.
+
+<Youtube id="Hm8_PgVTFuc"/>
+
+Deoarece suntem interesați în principal de o autocompletare sensibilă pentru bibliotecile din domeniul data science, este logic să acordăm mai multă importanță exemplelor de antrenare care utilizează mai mult aceste biblioteci. Putem identifica cu ușurință aceste exemple prin utilizarea unor cuvinte-cheie precum `plt`, `pd`, `sk`, `fit` și `predict`, care sunt cele mai frecvente nume de import pentru `matplotlib.pyplot`, `pandas` și `sklearn`, precum și modelul fit/predict al acestora din urmă. Dacă acestea sunt reprezentate fiecare ca un singur simbol, putem verifica cu ușurință dacă apar în secvența de input. Tokenii pot avea un prefix de spațiu, deci vom verifica și aceste versiuni în vocabularul tokenizerului. Pentru a verifica dacă funcționează, vom adăuga un token de test care ar trebui să fie împărțit în mai mulți tokeni:
+
+```py
+keytoken_ids = []
+for keyword in [
+    "plt",
+    "pd",
+    "sk",
+    "fit",
+    "predict",
+    " plt",
+    " pd",
+    " sk",
+    " fit",
+    " predict",
+    "testtest",
+]:
+    ids = tokenizer([keyword]).input_ids[0]
+    if len(ids) == 1:
+        keytoken_ids.append(ids[0])
+    else:
+        print(f"Keyword has not single token: {keyword}")
+```
+
+```python out
+'Keyword has not single token: testtest'
+```
+
+Grozav, se pare că funcționează bine! Acum putem scrie o funcție de pierdere personalizată care ia ca secvența de input, logurile și tokenii cheie pe care tocmai le-am selectat. În primul rând, trebuie să aliniem logurile și inputurile: secvența de intrare deplasată cu o unitate la dreapta formează labeluri, deoarece următorul tokenul este labelul pentru tokenul curent. Putem realiza acest lucru începând cu labelurile de la al doilea token al secvenței de intrare, deoarece modelul nu face o predicție pentru primul token în orice caz. Apoi tăiem ultimul logit, deoarece nu avem un label pentru tokenul care urmează secvenței complete de intrare. Astfel, putem calcula pierderea per sample și putem număra aparițiile tuturor cuvintelor-cheie în fiecare sample. În cele din urmă, calculăm media weighturilor pe fiecare sample folosind aparițiile ca weighturi. Deoarece nu dorim să eliminăm toate sampleurile care nu au cuvinte-cheie, adăugăm 1 la weighturi:
+
+```py
+from torch.nn import CrossEntropyLoss
+import torch
+
+
+def keytoken_weighted_loss(inputs, logits, keytoken_ids, alpha=1.0):
+    # Shift so that tokens < n predict n
+    shift_labels = inputs[..., 1:].contiguous()
+    shift_logits = logits[..., :-1, :].contiguous()
+    # Calculate per-token loss
+    loss_fct = CrossEntropyLoss(reduce=False)
+    loss = loss_fct(shift_logits.view(-1, shift_logits.size(-1)), shift_labels.view(-1))
+    # Resize and average loss per sample
+    loss_per_sample = loss.view(shift_logits.size(0), shift_logits.size(1)).mean(axis=1)
+    # Calculate and scale weighting
+    weights = torch.stack([(inputs == kt).float() for kt in keytoken_ids]).sum(
+        axis=[0, 2]
+    )
+    weights = alpha * (1.0 + weights)
+    # Calculate weighted average
+    weighted_loss = (loss_per_sample * weights).mean()
+    return weighted_loss
+```
+
+Înainte de a începe antrenamentul cu această nouă funcție de pierdere minunată, trebuie să pregătim câteva lucruri:
+
+- Avem nevoie de dataloaders pentru a încărca datele în batch-uri.
+- Trebuie să configurăm parametrii de scădere a weighturilor.
+- Din când în când, dorim să evaluăm, astfel încât este logic să includem codul de evaluare într-o funcție.
+
+Să începem cu dataloaders. Trebuie doar să setăm formatul datasetului la `"torch"`, iar apoi îl putem trece la un `DataLoader` PyTorch cu dimensiunea corespunzătoare a batch-lui:
+
+```py
+from torch.utils.data.dataloader import DataLoader
+
+tokenized_datasets.set_format("torch")
+train_dataloader = DataLoader(tokenized_datasets["train"], batch_size=32, shuffle=True)
+eval_dataloader = DataLoader(tokenized_datasets["valid"], batch_size=32)
+```
+
+În continuare, grupăm parametrii astfel încât optimizatorul să știe care dintre aceștia vor primi o scădere suplimentară a weighturilor. De obicei, toți termenii weighturilor bias și LayerNorm sunt scutiți de acest lucru; iată cum putem face acest lucru:
+
+```py
+weight_decay = 0.1
+
+
+def get_grouped_params(model, no_decay=["bias", "LayerNorm.weight"]):
+    params_with_wd, params_without_wd = [], []
+    for n, p in model.named_parameters():
+        if any(nd in n for nd in no_decay):
+            params_without_wd.append(p)
+        else:
+            params_with_wd.append(p)
+    return [
+        {"params": params_with_wd, "weight_decay": weight_decay},
+        {"params": params_without_wd, "weight_decay": 0.0},
+    ]
+```
+
+Deoarece dorim să evaluăm modelul în mod regulat pe setul de validare în timpul antrenării, trebuie să scriem o funcție și pentru acest lucru. Aceasta rulează pur și simplu prin dataloaderul de evaluare și adună toate pierderile în cadrul proceselor:
+
+```py
+def evaluate():
+    model.eval()
+    losses = []
+    for step, batch in enumerate(eval_dataloader):
+        with torch.no_grad():
+            outputs = model(batch["input_ids"], labels=batch["input_ids"])
+
+        losses.append(accelerator.gather(outputs.loss))
+    loss = torch.mean(torch.cat(losses))
+    try:
+        perplexity = torch.exp(loss)
+    except OverflowError:
+        perplexity = float("inf")
+    return loss.item(), perplexity.item()
+```
+
+Cu funcția `evaluate()` putem raporta pierderile și [perplexitatea](/course/chapter7/3) la intervale regulate. În continuare, redefinim modelul nostru pentru a ne asigura că antrenăm din nou de la zero:
+
+```py
+model = GPT2LMHeadModel(config)
+```
+
+Apoi putem defini optimizatorul nostru, folosind funcția de mai devreme pentru a împărți parametrii pentru scăderea weighturilor:
+
+```py
+from torch.optim import AdamW
+
+optimizer = AdamW(get_grouped_params(model), lr=5e-4)
+```
+
+Acum să pregătim modelul, optimizatorul și dataloaderurile, astfel încât să putem începe antrenamentul:
+
+```py
+from accelerate import Accelerator
+
+accelerator = Accelerator(fp16=True)
+
+model, optimizer, train_dataloader, eval_dataloader = accelerator.prepare(
+    model, optimizer, train_dataloader, eval_dataloader
+)
+```
+
+<Tip>
+
+🚨 Dacă antrenați pe un TPU, va trebui să mutați tot codul începând cu celula de mai sus într-o funcție de antrenare dedicată. Consultați [Capitolul 3](/course/chapter3) pentru mai multe detalii.
+
+</Tip>
+
+Acum că am trimis `train_dataloader` la `accelerator.prepare()`, putem utiliza lungimea acestuia pentru a calcula numărul de pași de antrenare. Rețineți că ar trebui să facem acest lucru întotdeauna după ce pregătim dataloaderurile, deoarece această metodă îi va modifica lungimea. Utilizăm un program liniar clasic de la rata de învățare la 0:
+
+```py
+from transformers import get_scheduler
+
+num_train_epochs = 1
+num_update_steps_per_epoch = len(train_dataloader)
+num_training_steps = num_train_epochs * num_update_steps_per_epoch
+
+lr_scheduler = get_scheduler(
+    name="linear",
+    optimizer=optimizer,
+    num_warmup_steps=1_000,
+    num_training_steps=num_training_steps,
+)
+```
+
+În cele din urmă, pentru a trimite modelul nostru către Hub, va trebui să creăm un obiect `Repository` într-un folder de lucru. În primul rând, conectați-vă la Hugging Face Hub, dacă nu sunteți deja conectat. Vom determina numele repositoriului pornind de la ID-ul modelului pe care dorim să îl atribuim modelului nostru (nu ezitați să înlocuiți `repo_name` cu propria alegere; acesta trebuie doar să conțină numele vostru de utilizator, ceea ce face funcția `get_full_repo_name()`):
+
+```py
+from huggingface_hub import Repository, get_full_repo_name
+
+model_name = "codeparrot-ds-accelerate"
+repo_name = get_full_repo_name(model_name)
+repo_name
+```
+
+```python out
+'sgugger/codeparrot-ds-accelerate'
+```
+
+Apoi putem clona acel repositoriu într-un folder local. Dacă există deja, acest folder local ar trebui să fie o clonă existentă a repositoriul cu care lucrăm:
+
+```py
+output_dir = "codeparrot-ds-accelerate"
+repo = Repository(output_dir, clone_from=repo_name)
+```
+
+Acum putem încărca orice salvăm în `output_dir` prin apelarea metodei `repo.push_to_hub()`. Acest lucru ne va ajuta să încărcăm modelele intermediare la sfârșitul fiecărei epoci.
+
+Înainte de antrenament, să efectuăm un test rapid pentru a vedea dacă funcția de evaluare funcționează corect:
+
+```py
+evaluate()
+```
+
+```python out
+(10.934126853942871, 56057.14453125)
+```
+
+Acestea sunt valori foarte ridicate pentru pierdere și perplexitate, dar acest lucru nu este surprinzător, deoarece nu am antrenat încă modelul. Astfel, avem totul pregătit pentru a scrie partea principală a scriptului de antrenare: bucla de antrenare. În bucla de antrenare, iterăm peste dataloader și transmitem batch-urile către model. Cu logurile, putem apoi evalua funcția noastră de pierdere personalizată. Redimensionăm pierderea în funcție de numărul de etape de acumulare a gradientului pentru a nu crea pierderi mai mari atunci când agregăm mai multe etape. Înainte de a optimiza, comprimăm, de asemenea, gradienții pentru o mai bună convergență. În cele din urmă, la fiecare câțiva pași, evaluăm modelul pe setul de evaluare cu noua noastră funcție `evaluate()`:
+
+```py
+from tqdm.notebook import tqdm
+
+gradient_accumulation_steps = 8
+eval_steps = 5_000
+
+model.train()
+completed_steps = 0
+for epoch in range(num_train_epochs):
+    for step, batch in tqdm(
+        enumerate(train_dataloader, start=1), total=num_training_steps
+    ):
+        logits = model(batch["input_ids"]).logits
+        loss = keytoken_weighted_loss(batch["input_ids"], logits, keytoken_ids)
+        if step % 100 == 0:
+            accelerator.print(
+                {
+                    "samples": step * samples_per_step,
+                    "steps": completed_steps,
+                    "loss/train": loss.item() * gradient_accumulation_steps,
+                }
+            )
+        loss = loss / gradient_accumulation_steps
+        accelerator.backward(loss)
+        if step % gradient_accumulation_steps == 0:
+            accelerator.clip_grad_norm_(model.parameters(), 1.0)
+            optimizer.step()
+            lr_scheduler.step()
+            optimizer.zero_grad()
+            completed_steps += 1
+        if (step % (eval_steps * gradient_accumulation_steps)) == 0:
+            eval_loss, perplexity = evaluate()
+            accelerator.print({"loss/eval": eval_loss, "perplexity": perplexity})
+            model.train()
+            accelerator.wait_for_everyone()
+            unwrapped_model = accelerator.unwrap_model(model)
+            unwrapped_model.save_pretrained(output_dir, save_function=accelerator.save)
+            if accelerator.is_main_process:
+                tokenizer.save_pretrained(output_dir)
+                repo.push_to_hub(
+                    commit_message=f"Training in progress step {step}", blocking=False
+                )
+```
+
+Și asta e tot - acum aveți propria buclă de antrenare personalizată pentru modele de limbaj cauzal, cum ar fi GPT-2, pe care o puteți personaliza în continuare în funcție de nevoile voastre.
+
+<Tip>
+
+✏️ **încercați!** Fie vă creați propria funcție de pierdere personalizată, adaptată la cazul vostru de utilizare, fie adăugați un alt pas personalizat în bucla de antrenare.
+
+</Tip>
+
+<Tip>
+
+✏️ **încercați!** Atunci când efectuați experimente de antrenare de lungă durată, este o idee bună să înregistrați parametrii importanți utilizând instrumente precum TensorBoard sau Weights & Biases. Adăugați o logare adecvată la bucla de antrenare, astfel încât să puteți verifica întotdeauna cum decurge antrenarea.
+
+</Tip>
+
+{/if}
diff --git a/chapters/rum/chapter7/7.mdx b/chapters/rum/chapter7/7.mdx
new file mode 100644
index 000000000..37b278a11
--- /dev/null
+++ b/chapters/rum/chapter7/7.mdx
@@ -0,0 +1,1206 @@
+<FrameworkSwitchCourse {fw} />
+
+# Răspuns la întrebări[[question-answering]]
+
+{#if fw === 'pt'}
+
+<CourseFloatingBanner chapter={7}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter7/section7_pt.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter7/section7_pt.ipynb"},
+]} />
+
+{:else}
+
+<CourseFloatingBanner chapter={7}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter7/section7_tf.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter7/section7_tf.ipynb"},
+]} />
+
+{/if}
+
+Este timpul să analizăm răspunsul la întrebări! Această sarcină are mai multe variante, dar cea pe care ne vom concentra în această secțiune se numește răspuns *extractiv* la întrebări. Aceasta presupune formularea de întrebări cu privire la un document și identificarea răspunsurilor ca _intervale de text_ în documentul în sine.
+
+<Youtube id="ajPx5LwJD-I"/>
+
+Vom face fine-tuning unuimodel BERT pe [datasetul SQuAD] (https://rajpurkar.github.io/SQuAD-explorer/), care constă din întrebări adresate de mulțimea de lucrători pe un set de articole Wikipedia. Acest lucru ne va oferi un model capabil să calculeze predicții precum aceasta:
+
+<iframe src="https://course-demos-bert-finetuned-squad.hf.space" frameBorder="0" height="450" title="Gradio app" class="block dark:hidden container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
+
+Aceasta este de fapt o prezentare a modelului care a fost antrenat și încărcat în Hub folosind codul prezentat în această secțiune. Puteți să-l găsiți și să verificați predicțiile [aici](https://huggingface.co/huggingface-course/bert-finetuned-squad?context=%F0%9F%A4%97+Transformers+is+backed+by+the+three+most+popular+deep+learning+libraries+%E2%80%94+Jax%2C+PyTorch+and+TensorFlow+%E2%80%94+with+a+seamless+integration+between+them.+It%27s+straightforward+to+train+your+models+with+one+before+loading+them+for+inference+with+the+other.&question=Which+deep+learning+libraries+back+%F0%9F%A4%97+Transformers%3F).
+
+<Tip>
+
+💡 Modelele bazate doar pe encoding, cum ar fi BERT, tind să fie foarte bune la extragerea răspunsurilor la întrebări de tip factoid, cum ar fi "Cine a inventat arhitectura Transformer?", dar nu se descurcă prea bine atunci când primesc întrebări deschise, cum ar fi "De ce este cerul albastru?" În aceste cazuri mai dificile, modelele encoder-decoder precum T5 și BART sunt utilizate de obicei pentru a sintetiza informațiile într-un mod destul de similar cu [rezumarea textului](/course/chapter7/5). Dacă sunteți interesat de acest tip de răspuns *generativ* la întrebări, vă recomandăm să consultați [demo-ul](https://yjernite.github.io/lfqa.html) nostru bazat pe [datasetul ELI5](https://huggingface.co/datasets/eli5).
+
+</Tip>
+
+## Pregătirea datelor[[preparing-the-data]]
+
+Datasetul care este cel mai utilizat ca referință academică pentru răspunderea extractivă la întrebări este [SQuAD](https://rajpurkar.github.io/SQuAD-explorer/), deci acesta este cel pe care îl vom utiliza aici. Există, de asemenea, un benchmark mai dificil [SQuAD v2](https://huggingface.co/datasets/squad_v2), care include întrebări care nu au un răspuns. Atât timp cât propriul dataset conține o coloană pentru contexte, o coloană pentru întrebări și o coloană pentru răspunsuri, ar trebui să puteți adapta pașii de mai jos.
+
+### Datasetul SQuD[[the-squad-dataset]]
+
+Ca de obicei, putem descărca și stoca în cache datasetul într-un singur pas datorită funcției `load_dataset()`:
+
+```py
+from datasets import load_dataset
+
+raw_datasets = load_dataset("squad")
+```
+
+Ne putem uita apoi la acest obiect pentru a afla mai multe despre datasetul SQuAD:
+
+```py
+raw_datasets
+```
+
+```python out
+DatasetDict({
+    train: Dataset({
+        features: ['id', 'title', 'context', 'question', 'answers'],
+        num_rows: 87599
+    })
+    validation: Dataset({
+        features: ['id', 'title', 'context', 'question', 'answers'],
+        num_rows: 10570
+    })
+})
+```
+
+Se pare că avem tot ce ne trebuie cu câmpurile `context`, `question` și `answers`, așa că să le afișăm pentru primul element al datasetului nostru de antrenare:
+
+```py
+print("Context: ", raw_datasets["train"][0]["context"])
+print("Question: ", raw_datasets["train"][0]["question"])
+print("Answer: ", raw_datasets["train"][0]["answers"])
+```
+
+```python out
+Context: 'Architecturally, the school has a Catholic character. Atop the Main Building\'s gold dome is a golden statue of the Virgin Mary. Immediately in front of the Main Building and facing it, is a copper statue of Christ with arms upraised with the legend "Venite Ad Me Omnes". Next to the Main Building is the Basilica of the Sacred Heart. Immediately behind the basilica is the Grotto, a Marian place of prayer and reflection. It is a replica of the grotto at Lourdes, France where the Virgin Mary reputedly appeared to Saint Bernadette Soubirous in 1858. At the end of the main drive (and in a direct line that connects through 3 statues and the Gold Dome), is a simple, modern stone statue of Mary.'
+Question: 'To whom did the Virgin Mary allegedly appear in 1858 in Lourdes France?'
+Answer: {'text': ['Saint Bernadette Soubirous'], 'answer_start': [515]}
+```
+
+Câmpurile `context` și `question` sunt foarte simplu de utilizat. Câmpul `answers` este un pic mai complicat, deoarece conține un dicționar cu două câmpuri care sunt ambele liste. Acesta este formatul care va fi așteptat de metrica `squad` în timpul evaluării; dacă utilizați propriile date, nu trebuie neapărat să vă faceți griji cu privire la plasarea răspunsurilor în același format. Câmpul `text` este destul de evident, iar câmpul `answer_start` conține indicele caracterului de început al fiecărui răspuns din context.
+
+În timpul antrenamentului, există un singur răspuns posibil. Putem verifica acest lucru folosind metoda `Dataset.filter()`:
+
+```py
+raw_datasets["train"].filter(lambda x: len(x["answers"]["text"]) != 1)
+```
+
+```python out
+Dataset({
+    features: ['id', 'title', 'context', 'question', 'answers'],
+    num_rows: 0
+})
+```
+
+Cu toate acestea, pentru evaluare, există mai multe răspunsuri posibile pentru fiecare sample, care pot fi identice sau diferite:
+
+```py
+print(raw_datasets["validation"][0]["answers"])
+print(raw_datasets["validation"][2]["answers"])
+```
+
+```python out
+{'text': ['Denver Broncos', 'Denver Broncos', 'Denver Broncos'], 'answer_start': [177, 177, 177]}
+{'text': ['Santa Clara, California', "Levi's Stadium", "Levi's Stadium in the San Francisco Bay Area at Santa Clara, California."], 'answer_start': [403, 355, 355]}
+```
+
+Nu ne vom aprofunda în scriptul de evaluare, deoarece totul va fi încorporat de o metrică 🤗 Datasets pentru noi, dar versiunea scurtă este că unele dintre întrebări au mai multe răspunsuri posibile, iar acest script va compara un răspuns prezis cu toate răspunsurile acceptabile și va lua cel mai bun scor. Dacă ne uităm la sampleul de la indexul 2, de exemplu:
+
+```py
+print(raw_datasets["validation"][2]["context"])
+print(raw_datasets["validation"][2]["question"])
+```
+
+```python out
+'Super Bowl 50 was an American football game to determine the champion of the National Football League (NFL) for the 2015 season. The American Football Conference (AFC) champion Denver Broncos defeated the National Football Conference (NFC) champion Carolina Panthers 24–10 to earn their third Super Bowl title. The game was played on February 7, 2016, at Levi\'s Stadium in the San Francisco Bay Area at Santa Clara, California. As this was the 50th Super Bowl, the league emphasized the "golden anniversary" with various gold-themed initiatives, as well as temporarily suspending the tradition of naming each Super Bowl game with Roman numerals (under which the game would have been known as "Super Bowl L"), so that the logo could prominently feature the Arabic numerals 50.'
+'Where did Super Bowl 50 take place?'
+```
+
+putem vedea că răspunsul poate fi într-adevăr una dintre cele trei posibilități pe care le-am văzut anterior.
+
+### Procesarea datelor de antrenare[[processing-the-training-data]]
+
+<Youtube id="qgaM0weJHpA"/>
+
+Să începem cu preprocesarea datelor de antrenare. Partea dificilă va fi generarea labelurilor pentru răspunsul la întrebare, care vor fi pozițiile de început și de sfârșit ale tokenilor corespunzătoare răspunsului în context.
+
+Dar să nu ne grăbim. În primul rând, trebuie să convertim textul din datele de intrare în ID-uri pe care modelul să le poată înțelege, utilizând un tokenizer:
+
+```py
+from transformers import AutoTokenizer
+
+model_checkpoint = "bert-base-cased"
+tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
+```
+
+După cum am menționat anterior, vom face fine-tune unui model BERT, dar puteți utiliza orice alt tip de model, atâta timp cât are implementat un tokenizer rapid. Puteți vedea toate arhitecturile care vin cu o versiune rapidă în [acest tabel mare] (https://huggingface.co/transformers/#supported-frameworks), iar pentru a verifica dacă obiectul `tokenizer` pe care îl utilizați este într-adevăr susținut de 🤗 Tokenizers, vă puteți uita la atributul său `is_fast`:
+
+```py
+tokenizer.is_fast
+```
+
+```python out
+True
+```
+
+Putem transmite împreună întrebarea și contextul către tokenizerul nostru, iar acesta va introduce în mod corespunzător tokenii speciali pentru a forma o propoziție ca aceasta:
+
+```
+[CLS] question [SEP] context [SEP]
+```
+
+Hai să verificăm de două ori:
+
+```py
+context = raw_datasets["train"][0]["context"]
+question = raw_datasets["train"][0]["question"]
+
+inputs = tokenizer(question, context)
+tokenizer.decode(inputs["input_ids"])
+```
+
+```python out
+'[CLS] To whom did the Virgin Mary allegedly appear in 1858 in Lourdes France? [SEP] Architecturally, '
+'the school has a Catholic character. Atop the Main Building\'s gold dome is a golden statue of the Virgin '
+'Mary. Immediately in front of the Main Building and facing it, is a copper statue of Christ with arms '
+'upraised with the legend " Venite Ad Me Omnes ". Next to the Main Building is the Basilica of the Sacred '
+'Heart. Immediately behind the basilica is the Grotto, a Marian place of prayer and reflection. It is a '
+'replica of the grotto at Lourdes, France where the Virgin Mary reputedly appeared to Saint Bernadette '
+'Soubirous in 1858. At the end of the main drive ( and in a direct line that connects through 3 statues '
+'and the Gold Dome ), is a simple, modern stone statue of Mary. [SEP]'
+```
+
+Labelurile vor fi apoi indexul tokenilor care încep și termină răspunsul, iar modelul va fi însărcinat să prezică un logit de început și de sfârșit pentru fiecare token din intrare, labelurile teoretice fiind următoarele:
+
+<div class="flex justify-center">
+<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/qa_labels.svg" alt="One-hot encoded label pentru răspunderea la întrebări."/>
+<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter7/qa_labels-dark.svg" alt="One-hot encoded label pentru răspunderea la întrebări."/>
+</div>
+
+În acest caz, contextul nu este prea lung, dar unele dintre exemplele din dataset au contexte foarte lungi care vor depăși lungimea maximă pe care am stabilit-o (care este de 384 în acest caz). După cum am văzut în [Capitolul 6](/course/chapter6/4) când am explorat elementele interne ale pipelineului `question-answering`, vom trata contextele lungi prin crearea mai multor caracteristici de antrenare dintr-un sample din datasetul nostru, cu un sliding window între ele.
+
+Pentru a vedea cum funcționează acest lucru folosind exemplul curent, putem limita lungimea la 100 și putem utiliza un sliding window de 50 de tokeni. Vă reamintim că folosim:
+
+- `max_length` pentru a stabili lungimea maximă (aici 100)
+- `truncation="only_second"` pentru a trunchia contextul (care este în poziția a doua) atunci când întrebarea cu contextul său este prea lungă
+- `stride` pentru a seta numărul de tokeni care se suprapun între două bucăți succesive (aici 50)
+- `return_overflowing_tokens=True` pentru ca tokenizerul să știe că dorim tokenii care se suprapun
+
+```py
+inputs = tokenizer(
+    question,
+    context,
+    max_length=100,
+    truncation="only_second",
+    stride=50,
+    return_overflowing_tokens=True,
+)
+
+for ids in inputs["input_ids"]:
+    print(tokenizer.decode(ids))
+```
+
+```python out
+'[CLS] To whom did the Virgin Mary allegedly appear in 1858 in Lourdes France? [SEP] Architecturally, the school has a Catholic character. Atop the Main Building\'s gold dome is a golden statue of the Virgin Mary. Immediately in front of the Main Building and facing it, is a copper statue of Christ with arms upraised with the legend " Venite Ad Me Omnes ". Next to the Main Building is the Basilica of the Sacred Heart. Immediately behind the basi [SEP]'
+'[CLS] To whom did the Virgin Mary allegedly appear in 1858 in Lourdes France? [SEP] the Main Building and facing it, is a copper statue of Christ with arms upraised with the legend " Venite Ad Me Omnes ". Next to the Main Building is the Basilica of the Sacred Heart. Immediately behind the basilica is the Grotto, a Marian place of prayer and reflection. It is a replica of the grotto at Lourdes, France where the Virgin [SEP]'
+'[CLS] To whom did the Virgin Mary allegedly appear in 1858 in Lourdes France? [SEP] Next to the Main Building is the Basilica of the Sacred Heart. Immediately behind the basilica is the Grotto, a Marian place of prayer and reflection. It is a replica of the grotto at Lourdes, France where the Virgin Mary reputedly appeared to Saint Bernadette Soubirous in 1858. At the end of the main drive ( and in a direct line that connects through 3 [SEP]'
+'[CLS] To whom did the Virgin Mary allegedly appear in 1858 in Lourdes France? [SEP]. It is a replica of the grotto at Lourdes, France where the Virgin Mary reputedly appeared to Saint Bernadette Soubirous in 1858. At the end of the main drive ( and in a direct line that connects through 3 statues and the Gold Dome ), is a simple, modern stone statue of Mary. [SEP]'
+```
+
+După cum se poate observa, exemplul nostru a fost împărțit în patru inputuri, fiecare dintre acestea conținând întrebarea și o parte din context. Rețineți că răspunsul la întrebare ("Bernadette Soubirous") apare doar în al treilea și ultimul input, astfel încât, prin tratarea contextelor lungi în acest mod, vom crea câteva exemple de antrenament în care răspunsul nu este inclus în context. Pentru aceste exemple, labelurile vor fi `start_position = end_position = 0` (deci vom prezice tokenul `[CLS]`). Vom seta aceste labeluri și în cazul nefericit în care răspunsul a fost trunchiat, astfel încât avem doar începutul (sau sfârșitul) acestuia. Pentru exemplele în care răspunsul este complet în context, labelurile vor fi indicele tokenului în care începe răspunsul și indicele tokenului în care se termină răspunsul.
+
+Datasetul ne oferă caracterul de început al răspunsului în context, iar prin adăugarea lungimii răspunsului, putem găsi caracterul de sfârșit în context. Pentru a le corela cu indicii tokenilor, va trebui să folosim offset mapping pe care le-am studiat în [Capitolul 6](/course/chapter6/4). Putem face ca tokenizatorul nostru să le returneze trecând `return_offsets_mapping=True`:
+
+```py
+inputs = tokenizer(
+    question,
+    context,
+    max_length=100,
+    truncation="only_second",
+    stride=50,
+    return_overflowing_tokens=True,
+    return_offsets_mapping=True,
+)
+inputs.keys()
+```
+
+```python out
+dict_keys(['input_ids', 'token_type_ids', 'attention_mask', 'offset_mapping', 'overflow_to_sample_mapping'])
+```
+
+După cum putem vedea, primim înapoi ID-urile obișnuite de intrare, ID-urile tipului de token și attention maskul, precum și offset mapping necesar și o cheie suplimentară, `overflow_to_sample_mapping`. Valoarea corespunzătoare ne va fi de folos atunci când vom tokeniza mai multe texte în același timp (ceea ce ar trebui să facem pentru a beneficia de faptul că tokenizerul nostru este susținut de Rust). Deoarece un sample poate oferi mai multe caracteristici, aceasta mapează fiecare caracteristică la exemplul din care provine. Deoarece aici am tokenizat un singur exemplu, obținem o listă de `0`:
+
+```py
+inputs["overflow_to_sample_mapping"]
+```
+
+```python out
+[0, 0, 0, 0]
+```
+
+Dar dacă vom tokeniza mai multe exemple, acest lucru va deveni mai util:
+
+```py
+inputs = tokenizer(
+    raw_datasets["train"][2:6]["question"],
+    raw_datasets["train"][2:6]["context"],
+    max_length=100,
+    truncation="only_second",
+    stride=50,
+    return_overflowing_tokens=True,
+    return_offsets_mapping=True,
+)
+
+print(f"The 4 examples gave {len(inputs['input_ids'])} features.")
+print(f"Here is where each comes from: {inputs['overflow_to_sample_mapping']}.")
+```
+
+```python out
+'The 4 examples gave 19 features.'
+'Here is where each comes from: [0, 0, 0, 0, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3].'
+```
+
+După cum se poate observa, primele trei exemple (la indicii 2, 3 și 4 din setul de antrenare) au dat fiecare câte patru caracteristici, iar ultimul exemplu (la indicele 5 din setul de antrenare) a dat 7 caracteristici.
+
+Aceste informații vor fi utile pentru a corela fiecare caracteristică obținută cu labeul corespunzător. După cum am menționat anterior, aceste labelurile sunt:
+
+- `(0, 0)` dacă răspunsul nu se află în intervalul corespunzător al contextului
+- `(start_position, end_position)` dacă răspunsul se află în intervalul corespunzător al contextului, cu `start_position` fiind indicele tokenului (în ID-urile de intrare) la începutul răspunsului și `end_position` fiind indicele tokenului (în ID-urile de intrare) unde se termină răspunsul
+
+Pentru a determina care dintre acestea este cazul și, dacă este relevant, pozițiile tokenilor, vom găsi mai întâi indicii care încep și termină contextul în ID-urile de intrare. Am putea folosi ID-urile tipului de token pentru a face acest lucru, dar deoarece acestea nu există neapărat pentru toate modelele (DistilBERT nu le solicită, de exemplu), vom folosi în schimb metoda `sequence_ids()` a `BatchEncoding` pe care tokenizerul nostru o returnează.
+
+Odată ce avem indicii tokenilor, ne uităm la offseturile corespunzătoare, care sunt tupeluri de două numere întregi reprezentând intervalul de caractere din contextul original. Astfel, putem detecta dacă bucățica de context din această caracteristică începe după răspuns sau se termină înainte de începerea răspunsului (caz în care eticheta este `(0, 0)`). Dacă nu este cazul, facem o buclă pentru a găsi primul și ultimul token al răspunsului:
+
+```py
+answers = raw_datasets["train"][2:6]["answers"]
+start_positions = []
+end_positions = []
+
+for i, offset in enumerate(inputs["offset_mapping"]):
+    sample_idx = inputs["overflow_to_sample_mapping"][i]
+    answer = answers[sample_idx]
+    start_char = answer["answer_start"][0]
+    end_char = answer["answer_start"][0] + len(answer["text"][0])
+    sequence_ids = inputs.sequence_ids(i)
+
+    # Find the start and end of the context
+    idx = 0
+    while sequence_ids[idx] != 1:
+        idx += 1
+    context_start = idx
+    while sequence_ids[idx] == 1:
+        idx += 1
+    context_end = idx - 1
+
+    # If the answer is not fully inside the context, label is (0, 0)
+    if offset[context_start][0] > start_char or offset[context_end][1] < end_char:
+        start_positions.append(0)
+        end_positions.append(0)
+    else:
+        # Otherwise it's the start and end token positions
+        idx = context_start
+        while idx <= context_end and offset[idx][0] <= start_char:
+            idx += 1
+        start_positions.append(idx - 1)
+
+        idx = context_end
+        while idx >= context_start and offset[idx][1] >= end_char:
+            idx -= 1
+        end_positions.append(idx + 1)
+
+start_positions, end_positions
+```
+
+```python out
+([83, 51, 19, 0, 0, 64, 27, 0, 34, 0, 0, 0, 67, 34, 0, 0, 0, 0, 0],
+ [85, 53, 21, 0, 0, 70, 33, 0, 40, 0, 0, 0, 68, 35, 0, 0, 0, 0, 0])
+```
+
+Să aruncăm o privire la câteva rezultate pentru a verifica dacă abordarea noastră este corectă. Pentru prima caracteristică găsim `(83, 85)` ca labeluri, așa că comparăm răspunsul teoretic cu intervalul decodat de tokeni de la 83 la 85 (inclusiv):
+
+```py
+idx = 0
+sample_idx = inputs["overflow_to_sample_mapping"][idx]
+answer = answers[sample_idx]["text"][0]
+
+start = start_positions[idx]
+end = end_positions[idx]
+labeled_answer = tokenizer.decode(inputs["input_ids"][idx][start : end + 1])
+
+print(f"Theoretical answer: {answer}, labels give: {labeled_answer}")
+```
+
+```python out
+'Theoretical answer: the Main Building, labels give: the Main Building'
+```
+
+Deci, asta e o potrivire! Acum să verificăm indexul 4, unde am setat labelurile la `(0, 0)`, ceea ce înseamnă că răspunsul nu se află în chunkul de context al acelei caracteristici:
+
+```py
+idx = 4
+sample_idx = inputs["overflow_to_sample_mapping"][idx]
+answer = answers[sample_idx]["text"][0]
+
+decoded_example = tokenizer.decode(inputs["input_ids"][idx])
+print(f"Theoretical answer: {answer}, decoded example: {decoded_example}")
+```
+
+```python out
+'Theoretical answer: a Marian place of prayer and reflection, decoded example: [CLS] What is the Grotto at Notre Dame? [SEP] Architecturally, the school has a Catholic character. Atop the Main Building\'s gold dome is a golden statue of the Virgin Mary. Immediately in front of the Main Building and facing it, is a copper statue of Christ with arms upraised with the legend " Venite Ad Me Omnes ". Next to the Main Building is the Basilica of the Sacred Heart. Immediately behind the basilica is the Grot [SEP]'
+```
+
+Într-adevăr, nu vedem răspunsul în interiorul contextului.
+
+<Tip>
+
+✏️ **E rândul tău!** Atunci când se utilizează arhitectura XLNet, paddingul este aplicat la stânga, iar întrebarea și contextul sunt schimbate. Adaptați tot codul pe care tocmai l-am văzut la arhitectura XLNet (și adăugați `padding=True`). Fiți conștienți de faptul că tokenul `[CLS]` ar putea să nu se afle la poziția 0 în cazul aplicării paddingului.
+
+</Tip>
+
+Acum că am văzut pas cu pas cum să preprocesăm datele de antrenare, le putem grupa într-o funcție pe care o vom aplica întregului dataset de antrenare. Vom umple fiecare caracteristică la lungimea maximă pe care am stabilit-o, deoarece majoritatea contextelor vor fi lungi (iar sampleurile corespunzătoare vor fi împărțite în mai multe caracteristici), astfel încât nu există niciun beneficiu real pentru aplicarea paddingului dinamic aici:
+
+```py
+max_length = 384
+stride = 128
+
+
+def preprocess_training_examples(examples):
+    questions = [q.strip() for q in examples["question"]]
+    inputs = tokenizer(
+        questions,
+        examples["context"],
+        max_length=max_length,
+        truncation="only_second",
+        stride=stride,
+        return_overflowing_tokens=True,
+        return_offsets_mapping=True,
+        padding="max_length",
+    )
+
+    offset_mapping = inputs.pop("offset_mapping")
+    sample_map = inputs.pop("overflow_to_sample_mapping")
+    answers = examples["answers"]
+    start_positions = []
+    end_positions = []
+
+    for i, offset in enumerate(offset_mapping):
+        sample_idx = sample_map[i]
+        answer = answers[sample_idx]
+        start_char = answer["answer_start"][0]
+        end_char = answer["answer_start"][0] + len(answer["text"][0])
+        sequence_ids = inputs.sequence_ids(i)
+
+        # Find the start and end of the context
+        idx = 0
+        while sequence_ids[idx] != 1:
+            idx += 1
+        context_start = idx
+        while sequence_ids[idx] == 1:
+            idx += 1
+        context_end = idx - 1
+
+        # If the answer is not fully inside the context, label is (0, 0)
+        if offset[context_start][0] > start_char or offset[context_end][1] < end_char:
+            start_positions.append(0)
+            end_positions.append(0)
+        else:
+            # Otherwise it's the start and end token positions
+            idx = context_start
+            while idx <= context_end and offset[idx][0] <= start_char:
+                idx += 1
+            start_positions.append(idx - 1)
+
+            idx = context_end
+            while idx >= context_start and offset[idx][1] >= end_char:
+                idx -= 1
+            end_positions.append(idx + 1)
+
+    inputs["start_positions"] = start_positions
+    inputs["end_positions"] = end_positions
+    return inputs
+```
+
+Rețineți că am definit două constante pentru a determina lungimea maximă utilizată, precum și lungimea al sliding window, și că am adăugat o mică curățare înainte de tokenizare: unele dintre întrebările din datasetul SQuAD au spații suplimentare la început și la sfârșit care nu adaugă nimic (și ocupă spațiu atunci când sunt tokenizate dacă utilizați un model precum RoBERTa), așa că am eliminat aceste spații suplimentare.
+
+Pentru a aplica această funcție întregului set de antrenare, folosim metoda `Dataset.map()` cu flagul `batched=True`. Acesta este necesar aici, deoarece modificăm lungimea datasetului (deoarece un exemplu poate oferi mai multe caracteristici de antrenare):
+
+```py
+train_dataset = raw_datasets["train"].map(
+    preprocess_training_examples,
+    batched=True,
+    remove_columns=raw_datasets["train"].column_names,
+)
+len(raw_datasets["train"]), len(train_dataset)
+```
+
+```python out
+(87599, 88729)
+```
+
+După cum putem vedea, preprocesarea a adăugat aproximativ 1.000 de caracteristici. Setul nostru de antrenare este acum gata de utilizare - să trecem la preprocesarea setului de validare!
+
+### Procesarea datelor de validare[[processing-the-validation-data]]
+
+Preprocesarea datelor de validare va fi puțin mai ușoară, deoarece nu trebuie să generăm labeluri (cu excepția cazului în care dorim să calculăm o pierdere de validare, dar acest număr nu ne va ajuta să înțelegem cât de bun este modelul). Adevărata bucurie va fi să interpretăm predicțiile modelului în intervale ale contextului original. Pentru aceasta, va trebui doar să stocăm atât offset mappings, cât și o modalitate de a corela fiecare caracteristică creată cu exemplul original din care provine. Deoarece există o coloană ID în datasetul original, vom utiliza acel ID.
+
+Singurul lucru pe care îl vom adăuga aici este o mică curățare a offset mappings. Acestea vor conține offseturi pentru întrebare și context, dar odată ajunși în etapa de postprocesare nu vom avea nicio modalitate de a ști care parte a ID-urilor de intrare corespunde contextului și care parte este întrebarea (metoda `sequence_ids()` pe care am folosit-o este disponibilă doar pentru ieșirea tokenizerului). Prin urmare, vom seta offseturile corespunzătoare întrebării la `None`:
+
+
+```py
+def preprocess_validation_examples(examples):
+    questions = [q.strip() for q in examples["question"]]
+    inputs = tokenizer(
+        questions,
+        examples["context"],
+        max_length=max_length,
+        truncation="only_second",
+        stride=stride,
+        return_overflowing_tokens=True,
+        return_offsets_mapping=True,
+        padding="max_length",
+    )
+
+    sample_map = inputs.pop("overflow_to_sample_mapping")
+    example_ids = []
+
+    for i in range(len(inputs["input_ids"])):
+        sample_idx = sample_map[i]
+        example_ids.append(examples["id"][sample_idx])
+
+        sequence_ids = inputs.sequence_ids(i)
+        offset = inputs["offset_mapping"][i]
+        inputs["offset_mapping"][i] = [
+            o if sequence_ids[k] == 1 else None for k, o in enumerate(offset)
+        ]
+
+    inputs["example_id"] = example_ids
+    return inputs
+```
+
+Putem aplica această funcție pe întregul dataset de validare, ca și înainte:
+
+```py
+validation_dataset = raw_datasets["validation"].map(
+    preprocess_validation_examples,
+    batched=True,
+    remove_columns=raw_datasets["validation"].column_names,
+)
+len(raw_datasets["validation"]), len(validation_dataset)
+```
+
+```python out
+(10570, 10822)
+```
+
+În acest caz, am adăugat doar câteva sute de sampleuri, astfel încât se pare că contextele din datasetul de validare sunt un pic mai scurte.
+
+Acum că am preprocesat toate datele, putem trece la antrenare.
+
+{#if fw === 'pt'}
+
+## Fine-tuningul modelului cu API-ul `Trainer`[[fine-tuning-the-model-with-the-trainer-api]]
+
+Codul de antrenare pentru acest exemplu va semăna foarte mult cu codul din secțiunile anterioare - cel mai greu lucru va fi să scriem funcția `compute_metrics()`. Deoarece am făcut padding tuturor sampleurilor la lungimea maximă pe care am stabilit-o, nu trebuie definit niciun data collator, astfel încât acest calcul al metricii este singurul lucru de care trebuie să ne facem griji. Partea dificilă va fi să postprocesăm predicțiile modelului în intervale de text în exemplele originale; odată ce am făcut acest lucru, metrica din biblioteca 🤗 Datasets va face cea mai mare parte a muncii pentru noi.
+
+{:else}
+
+## Fine-tuningul unui model cu Keras[[fine-tuning-the-model-with-keras]]
+
+Codul de antrenare pentru acest exemplu va semăna foarte mult cu codul din secțiunile anterioare, dar calcularea metricilor va fi o provocare unică. Din moment ce am făcut padding tuturor sampleurilor la lungimea maximă pe care am stabilit-o, nu există niciun data collator care să fie definit, astfel încât acest calcul al metricii este singurul lucru de care trebuie să ne facem griji. Partea dificilă va fi să postprocesăm predicțiile modelului în intervale de text în exemplele originale; odată ce am făcut acest lucru, metrica din biblioteca 🤗 Datasets va face cea mai mare parte a muncii pentru noi.
+
+{/if}
+
+### Post-procesare[[post-processing]]
+
+{#if fw === 'pt'}
+
+<Youtube id="BNy08iIWVJM"/>
+
+{:else}
+
+<Youtube id="VN67ZpN33Ss"/>
+
+{/if}
+
+Modelul va produce logits pentru pozițiile de început și de sfârșit ale răspunsului în ID-urile de intrare, așa cum am văzut în timpul explorării [`question-answering` pipeline](/course/chapter6/3b). Etapa de post-procesare va fi similară cu ceea ce am făcut acolo, așa că iată vă reamintim ce acțiuni am luat:
+
+- Am mascat logiturile de început și de sfârșit corespunzătoare tokenilor din afara contextului.
+- Am convertit apoi logiturile de început și de sfârșit în probabilități utilizând un softmax.
+- Am atribuit un scor fiecărei perechi `(start_token, end_token)` prin calcularea produsului celor două probabilități corespunzătoare.
+- Am căutat perechea cu scorul maxim care a dat un răspuns valid (de exemplu, `start_token` mai mic decât `end_token`).
+
+Aici vom schimba ușor acest proces, deoarece nu trebuie să calculăm scorurile reale (doar răspunsul prezis). Aceasta înseamnă că putem sări peste etapa softmax. De asemenea, pentru a merge mai repede, nu vom puncta toate perechile posibile `(start_token, end_token)`, ci doar pe cele care corespund celor mai mari `n_best` logits (cu `n_best=20`). Deoarece vom trece peste softmax, aceste scoruri vor fi scoruri logit și vor fi obținute prin însumarea logiturilor de început și de sfârșit (în loc de produs, datorită regulii \\(\log(ab) = \log(a) + \log(b)\\)).
+
+Pentru a demonstra toate acestea, vom avea nevoie de un fel de predicții. Deoarece nu ne-am antrenat încă modelul, vom utiliza modelul implicit pentru pipelineuri QA pentru a genera unele predicții pe o mică parte a setului de validare. Putem utiliza aceeași funcție de procesare ca înainte; deoarece se bazează pe constanta globală `tokenizer`, trebuie doar să schimbăm acest obiect cu tokenizerul modelului pe care dorim să îl utilizăm temporar:
+
+```python
+small_eval_set = raw_datasets["validation"].select(range(100))
+trained_checkpoint = "distilbert-base-cased-distilled-squad"
+
+tokenizer = AutoTokenizer.from_pretrained(trained_checkpoint)
+eval_set = small_eval_set.map(
+    preprocess_validation_examples,
+    batched=True,
+    remove_columns=raw_datasets["validation"].column_names,
+)
+```
+
+Acum că preprocesarea este terminată, schimbăm tokenizerul înapoi la cel pe care l-am ales inițial:
+
+```python
+tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
+```
+
+Apoi eliminăm coloanele din `eval_set` care nu sunt așteptate de model, construim un batch cu întregul set de validare și îl trecem prin model. Dacă este disponibil un GPU, îl folosim pentru a merge mai repede:
+
+{#if fw === 'pt'}
+
+```python
+import torch
+from transformers import AutoModelForQuestionAnswering
+
+eval_set_for_model = eval_set.remove_columns(["example_id", "offset_mapping"])
+eval_set_for_model.set_format("torch")
+
+device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")
+batch = {k: eval_set_for_model[k].to(device) for k in eval_set_for_model.column_names}
+trained_model = AutoModelForQuestionAnswering.from_pretrained(trained_checkpoint).to(
+    device
+)
+
+with torch.no_grad():
+    outputs = trained_model(**batch)
+```
+
+Deoarece `Trainer` ne va oferi predicții sub formă de matrici NumPy, preluăm logiturile de început și de sfârșit și le convertim în acest format:
+
+```python
+start_logits = outputs.start_logits.cpu().numpy()
+end_logits = outputs.end_logits.cpu().numpy()
+```
+
+{:else}
+
+```python
+import tensorflow as tf
+from transformers import TFAutoModelForQuestionAnswering
+
+eval_set_for_model = eval_set.remove_columns(["example_id", "offset_mapping"])
+eval_set_for_model.set_format("numpy")
+
+batch = {k: eval_set_for_model[k] for k in eval_set_for_model.column_names}
+trained_model = TFAutoModelForQuestionAnswering.from_pretrained(trained_checkpoint)
+
+outputs = trained_model(**batch)
+```
+
+Pentru ușurința experimentelor, să convertim aceste rezultate în array-uri NumPy:
+
+```python
+start_logits = outputs.start_logits.numpy()
+end_logits = outputs.end_logits.numpy()
+```
+
+{/if}
+
+Acum, trebuie să găsim răspunsul prezis pentru fiecare exemplu din `small_eval_set`. Este posibil ca un exemplu să fi fost împărțit în mai multe caracteristici în `eval_set`, astfel încât primul pas constă în maparea fiecărui exemplu din `small_eval_set` la caracteristicile corespunzătoare din `eval_set`:
+
+```python
+import collections
+
+example_to_features = collections.defaultdict(list)
+for idx, feature in enumerate(eval_set):
+    example_to_features[feature["example_id"]].append(idx)
+```
+
+Cu acest lucru în mână, ne putem apuca de treabă trecând prin toate exemplele și, pentru fiecare exemplu, prin toate caracteristicile asociate. Așa cum am spus mai devreme, ne vom uita la scorurile logit pentru `n_cele mai bune` logits de început și de sfârșit, excluzând pozițiile care dau:
+
+- Un răspuns care nu ar fi în interiorul contextului
+- Un răspuns cu lungime negativă
+- Un răspuns care este prea lung (limităm posibilitățile la `max_answer_length=30`)
+
+Odată ce avem toate răspunsurile posibile scored pentru un exemplu, îl alegem pe cel cu cel mai bun scor logit:
+
+```python
+import numpy as np
+
+n_best = 20
+max_answer_length = 30
+predicted_answers = []
+
+for example in small_eval_set:
+    example_id = example["id"]
+    context = example["context"]
+    answers = []
+
+    for feature_index in example_to_features[example_id]:
+        start_logit = start_logits[feature_index]
+        end_logit = end_logits[feature_index]
+        offsets = eval_set["offset_mapping"][feature_index]
+
+        start_indexes = np.argsort(start_logit)[-1 : -n_best - 1 : -1].tolist()
+        end_indexes = np.argsort(end_logit)[-1 : -n_best - 1 : -1].tolist()
+        for start_index in start_indexes:
+            for end_index in end_indexes:
+                # Skip answers that are not fully in the context
+                if offsets[start_index] is None or offsets[end_index] is None:
+                    continue
+                # Skip answers with a length that is either < 0 or > max_answer_length.
+                if (
+                    end_index < start_index
+                    or end_index - start_index + 1 > max_answer_length
+                ):
+                    continue
+
+                answers.append(
+                    {
+                        "text": context[offsets[start_index][0] : offsets[end_index][1]],
+                        "logit_score": start_logit[start_index] + end_logit[end_index],
+                    }
+                )
+
+    best_answer = max(answers, key=lambda x: x["logit_score"])
+    predicted_answers.append({"id": example_id, "prediction_text": best_answer["text"]})
+```
+
+Formatul final al răspunsurilor prezise este cel care va fi așteptat de metrica pe care o vom utiliza. Ca de obicei, o putem încărca cu ajutorul bibliotecii 🤗 Evaluate:
+
+```python
+import evaluate
+
+metric = evaluate.load("squad")
+```
+
+Această metrică așteaptă răspunsurile prezise în formatul pe care l-am văzut mai sus (o listă de dicționare cu o cheie pentru ID-ul exemplului și o cheie pentru textul prezis) și răspunsurile teoretice în formatul de mai jos (o listă de dicționare cu o cheie pentru ID-ul exemplului și o cheie pentru răspunsurile posibile):
+
+```python
+theoretical_answers = [
+    {"id": ex["id"], "answers": ex["answers"]} for ex in small_eval_set
+]
+```
+
+Acum putem verifica dacă obținem rezultate rezonabile analizând primul element din ambele liste:
+
+```python
+print(predicted_answers[0])
+print(theoretical_answers[0])
+```
+
+```python out
+{'id': '56be4db0acb8001400a502ec', 'prediction_text': 'Denver Broncos'}
+{'id': '56be4db0acb8001400a502ec', 'answers': {'text': ['Denver Broncos', 'Denver Broncos', 'Denver Broncos'], 'answer_start': [177, 177, 177]}}
+```
+
+Nu-i deloc rău! Acum putem arunca o privire la scorul pe care ni-l oferă metrica:
+
+```python
+metric.compute(predictions=predicted_answers, references=theoretical_answers)
+```
+
+```python out
+{'exact_match': 83.0, 'f1': 88.25}
+```
+
+Din nou, acest lucru este destul de bun, având în vedere că, în conformitate cu [documentul acestuia] (https://arxiv.org/abs/1910.01108v2), DistilBERT fine-tuned pe SQuAD obține 79,1 și 86,9 pentru aceste scoruri pe întregul dataset.
+
+{#if fw === 'pt'}
+
+Acum să punem tot ce am făcut într-o funcție `compute_metrics()` pe care o vom folosi în `Trainer`. În mod normal, această funcție `compute_metrics()` primește doar un tuple `eval_preds` cu logiți și labels. Aici vom avea nevoie de ceva mai mult, deoarece trebuie să căutăm în dataset de caracteristici pentru offset și în datasetul de exemple pentru contextele originale, astfel încât nu vom putea utiliza această funcție pentru a obține rezultate de evaluare regulate în timpul antrenării. O vom utiliza doar la sfârșitul antrenamentului pentru a verifica rezultatele.
+
+Funcția `compute_metrics()` grupează aceiași pași ca înainte; adăugăm doar o mică verificare în cazul în care nu obținem niciun răspuns valid (caz în care prezicem un șir gol).
+
+{:else}
+
+Acum să punem tot ce tocmai am făcut într-o funcție `compute_metrics()` pe care o vom folosi după antrenarea modelului nostru. Va trebui să transmitem puțin mai mult decât output logits, deoarece trebuie să căutăm în datasetul de caracteristici pentru offset și în datasetul de exemple pentru contextele originale:
+
+{/if}
+
+```python
+from tqdm.auto import tqdm
+
+
+def compute_metrics(start_logits, end_logits, features, examples):
+    example_to_features = collections.defaultdict(list)
+    for idx, feature in enumerate(features):
+        example_to_features[feature["example_id"]].append(idx)
+
+    predicted_answers = []
+    for example in tqdm(examples):
+        example_id = example["id"]
+        context = example["context"]
+        answers = []
+
+        # Loop through all features associated with that example
+        for feature_index in example_to_features[example_id]:
+            start_logit = start_logits[feature_index]
+            end_logit = end_logits[feature_index]
+            offsets = features[feature_index]["offset_mapping"]
+
+            start_indexes = np.argsort(start_logit)[-1 : -n_best - 1 : -1].tolist()
+            end_indexes = np.argsort(end_logit)[-1 : -n_best - 1 : -1].tolist()
+            for start_index in start_indexes:
+                for end_index in end_indexes:
+                    # Skip answers that are not fully in the context
+                    if offsets[start_index] is None or offsets[end_index] is None:
+                        continue
+                    # Skip answers with a length that is either < 0 or > max_answer_length
+                    if (
+                        end_index < start_index
+                        or end_index - start_index + 1 > max_answer_length
+                    ):
+                        continue
+
+                    answer = {
+                        "text": context[offsets[start_index][0] : offsets[end_index][1]],
+                        "logit_score": start_logit[start_index] + end_logit[end_index],
+                    }
+                    answers.append(answer)
+
+        # Select the answer with the best score
+        if len(answers) > 0:
+            best_answer = max(answers, key=lambda x: x["logit_score"])
+            predicted_answers.append(
+                {"id": example_id, "prediction_text": best_answer["text"]}
+            )
+        else:
+            predicted_answers.append({"id": example_id, "prediction_text": ""})
+
+    theoretical_answers = [{"id": ex["id"], "answers": ex["answers"]} for ex in examples]
+    return metric.compute(predictions=predicted_answers, references=theoretical_answers)
+```
+
+Putem verifica dacă funcționează pe baza predicțiilor noastre:
+
+```python
+compute_metrics(start_logits, end_logits, eval_set, small_eval_set)
+```
+
+```python out
+{'exact_match': 83.0, 'f1': 88.25}
+```
+
+Arată bine! Acum să folosim acest lucru pentru a face fine-tune modelului nostru.
+
+### Fine-tuningul modelului[[fine-tuning-the-model]]
+
+{#if fw === 'pt'}
+
+Acum suntem gata să antrenăm modelul. Să-l creăm mai întâi, folosind clasa `AutoModelForQuestionAnswering` ca și înainte:
+
+```python
+model = AutoModelForQuestionAnswering.from_pretrained(model_checkpoint)
+```
+
+{:else}
+
+Acum suntem gata să antrenăm modelul. Să-l creăm mai întâi, folosind clasa `TFAutoModelForQuestionAnswering` ca mai înainte:
+
+```python
+model = TFAutoModelForQuestionAnswering.from_pretrained(model_checkpoint)
+```
+
+{/if}
+
+Ca de obicei, primim un avertisment că unele weighturi nu sunt utilizate (cele din headul de preantrenare), iar altele sunt inițializate aleatoriu (cele pentru headul pentru răspuns la întrebări). Ar trebui să fiți obișnuiți cu acest lucru până acum, dar înseamnă că acest model nu este încă pregătit pentru a fi utilizat și trebuie să fie fine-tuned - bine că suntem pe cale să facem asta!
+
+Pentru a putea trimite modelul nostru către Hub, va trebui să ne conectăm la Hugging Face. Dacă executați acest cod într-un notebook, puteți face acest lucru cu următoarea funcție utilitară, care afișează un widget în care puteți introduce datele voastre de autentificare:
+
+
+```python
+from huggingface_hub import notebook_login
+
+notebook_login()
+```
+
+Dacă nu lucrați într-un notebook, tastați următoarea linie în terminal:
+
+```bash
+huggingface-cli login
+```
+
+{#if fw === 'pt'}
+
+Odată făcut acest lucru, ne putem defini `TrainingArguments`. Așa cum am spus atunci când am definit funcția noastră pentru a calcula metrica, nu vom putea avea o buclă de evaluare obișnuită din cauza parametrilor funcției `compute_metrics()`. Am putea scrie propria noastră subclasă a `Trainer` pentru a face acest lucru (o abordare pe care o puteți găsi în [scriptul exemplu pentru răspunderea la întrebări](https://github.com/huggingface/transformers/blob/master/examples/pytorch/question-answering/trainer_qa.py)), dar este un pic prea lung pentru această secțiune. În schimb, aici vom evalua modelul doar la sfârșitul antrenării și vă vom arăta cum să efectuați o evaluare obișnuită în secțiunea "O buclă de antrenare personalizată" de mai jos.
+
+Acesta este într-adevăr locul în care API-ul `Trainer` își arată limitele și biblioteca 🤗 Accelerate strălucește: personalizarea clasei pentru un caz de utilizare specific poate fi greu de implementat, dar modificarea unei bucle de antrenare complet expuse este ușoară.
+
+Să aruncăm o privire la `TrainingArguments`:
+
+```python
+from transformers import TrainingArguments
+
+args = TrainingArguments(
+    "bert-finetuned-squad",
+    evaluation_strategy="no",
+    save_strategy="epoch",
+    learning_rate=2e-5,
+    num_train_epochs=3,
+    weight_decay=0.01,
+    fp16=True,
+    push_to_hub=True,
+)
+```
+
+Am mai văzut cele mai multe dintre acestea: stabilim niște hiperparametrii (cum ar fi learning rate, numărul de epoci pentru antrenament și o anumită scădere a weighturilor) și indicăm că dorim să salvăm modelul la sfârșitul fiecărei epoci, să sărim peste evaluare și să încărcăm rezultatele noastre în Model Hub. De asemenea, activăm antrenarea cu precizie mixtă cu `fp16=True`, deoarece aceasta poate accelera foarte mult antrenarea pe un GPU recent.
+
+{:else}
+
+Acum, putem crea dataseturile TF. De data aceasta, putem utiliza data collatorul de bază:
+
+```python
+from transformers import DefaultDataCollator
+
+data_collator = DefaultDataCollator(return_tensors="tf")
+```
+
+Și acum creăm dataseturile ca de obicei.
+
+```python
+tf_train_dataset = model.prepare_tf_dataset(
+    train_dataset,
+    collate_fn=data_collator,
+    shuffle=True,
+    batch_size=16,
+)
+tf_eval_dataset = model.prepare_tf_dataset(
+    validation_dataset,
+    collate_fn=data_collator,
+    shuffle=False,
+    batch_size=16,
+)
+```
+
+În continuare, stabilim hiperparametrii de antrenament și compilăm modelul nostru:
+
+```python
+from transformers import create_optimizer
+from transformers.keras_callbacks import PushToHubCallback
+import tensorflow as tf
+
+# Numărul etapelor de antrenare este numărul de sampleuri din dataset, împărțit la dimensiunea batch-ului, apoi înmulțit
+# cu numărul total de epoci. Rețineți că datasetul tf_train_dataset de aici este un batched tf.data.Dataset,
+# nu datasetul original Hugging Face, deci len() este deja num_samples // batch_size.
+num_train_epochs = 3
+num_train_steps = len(tf_train_dataset) * num_train_epochs
+optimizer, schedule = create_optimizer(
+    init_lr=2e-5,
+    num_warmup_steps=0,
+    num_train_steps=num_train_steps,
+    weight_decay_rate=0.01,
+)
+model.compile(optimizer=optimizer)
+
+# Antrenarea în mixed-precision float16
+tf.keras.mixed_precision.set_global_policy("mixed_float16")
+```
+
+În cele din urmă, suntem gata să ne antrenăm cu `model.fit()`. Folosim un `PushToHubCallback` pentru a încărca modelul în Hub după fiecare epocă.
+
+{/if}
+
+În mod implicit, repositoriul utilizat va fi în namespaceul vostru și numit după foldrul de ieșire pe care l-ați stabilit, deci în cazul nostru va fi în `"sgugger/bert-finetuned-squad"`. Putem trece peste acest lucru prin trecerea unui `hub_model_id`; de exemplu, pentru a încărca modelul în organizația `huggingface_course`, am folosit `hub_model_id="huggingface_course/bert-finetuned-squad"` (care este modelul la care am făcut legătura la începutul acestei secțiuni).
+
+
+{#if fw === 'pt'}
+
+<Tip>
+
+💡 Dacă folderul de ieșire pe care îl utilizați există, acesta trebuie să fie o clonă locală a repositoriul în care doriți să faceți push (deci setați un nume nou dacă primiți o eroare la definirea `Trainer`).
+
+</Tip>
+
+În cele din urmă, trecem totul în clasa `Trainer` și lansăm antrenarea:
+
+```python
+from transformers import Trainer
+
+trainer = Trainer(
+    model=model,
+    args=args,
+    train_dataset=train_dataset,
+    eval_dataset=validation_dataset,
+    tokenizer=tokenizer,
+)
+trainer.train()
+```
+
+{:else}
+
+```python
+from transformers.keras_callbacks import PushToHubCallback
+
+callback = PushToHubCallback(output_dir="bert-finetuned-squad", tokenizer=tokenizer)
+
+# Vom face validarea după aceea, deci nu vom face o validare în timpul antrenării
+model.fit(tf_train_dataset, callbacks=[callback], epochs=num_train_epochs)
+```
+
+{/if}
+
+Rețineți că, în timpul antrenamentului, de fiecare dată când modelul este salvat (aici, la fiecare epocă), acesta este încărcat în Hub pe fundal. În acest fel, veți putea să reluați antrenarea pe un alt device, dacă este necesar. Întreaga pregătire durează ceva timp (puțin peste o oră pe un Titan RTX), așa că puteți să vă luați o cafea sau să recitiți unele dintre părțile cursului care vi s-au părut mai dificile în timp ce se desfășoară. De asemenea, rețineți că, de îndată ce se termină prima epocă, veți vedea câteva weighturu încărcate în Hub și puteți începe să vă jucați cu modelul vostru pe pagina acestuia.
+
+{#if fw === 'pt'}
+
+Odată ce antrenamentul este complet, putem în cele din urmă să evaluăm modelul (și să ne rugăm să nu fi petrecut tot timpul de calcul degeaba). Metoda `predict()` a `Trainer` va returna un tuple în care primele elemente vor fi predicțiile modelului (aici o pereche cu logiturile de început și de sfârșit). Trimitem acest rezultat funcției noastre `compute_metrics()`:
+
+```python
+predictions, _, _ = trainer.predict(validation_dataset)
+start_logits, end_logits = predictions
+compute_metrics(start_logits, end_logits, validation_dataset, raw_datasets["validation"])
+```
+
+{:else}
+
+Odată ce antrenamentul este complet, putem în sfârșit să ne evaluăm modelul (și să ne rugăm să nu fi cheltuit tot timpul de calcul degeaba). Metoda `predict()` a modelului nostru `model` se va ocupa de obținerea predicțiilor și, deoarece am făcut toată munca grea de definire a unei funcții `compute_metrics()` mai devreme, putem obține rezultatele noastre într-o singură linie:
+
+```python
+predictions = model.predict(tf_eval_dataset)
+compute_metrics(
+    predictions["start_logits"],
+    predictions["end_logits"],
+    validation_dataset,
+    raw_datasets["validation"],
+)
+```
+
+{/if}
+
+```python out
+{'exact_match': 81.18259224219489, 'f1': 88.67381321905516}
+```
+
+Super! Ca o comparație, scorurile de bază raportate în articolul BERT pentru acest model sunt 80,8 și 88,5, deci suntem exact unde ar trebui să fim.
+
+{#if fw === 'pt'}
+
+În final, folosim metoda `push_to_hub()` pentru a ne asigura că încărcăm cea mai recentă versiune a modelului:
+
+```py
+trainer.push_to_hub(commit_message="Training complete")
+```
+
+Aceasta returnează URL-ul commit-ului pe care tocmai l-a făcut, dacă doriți să îl inspectați:
+
+```python out
+'https://huggingface.co/sgugger/bert-finetuned-squad/commit/9dcee1fbc25946a6ed4bb32efb1bd71d5fa90b68'
+```
+
+De asemenea, `Trainer` redactează un model card cu toate rezultatele evaluării și o încarcă.
+
+{/if}
+
+În această etapă, puteți utiliza widgetul de inferență de pe Model Hub pentru a testa modelul și pentru a-l oferi prietenilor, familia și animalele de companie preferate. Ați făcut fine-tune cu succes unui model pentru o sarcină de răspundere a unei întrebari - felicitări!
+
+<Tip>
+
+✏️ **E rândul tău!** Încearcă un alt model de arhitectură pentru a vedea dacă are performanțe mai bune la această sarcină!
+
+</Tip>
+
+{#if fw === 'pt'}
+
+Dacă doriți să pătrundeți puțin mai adânc în bucla de antrenare, vă vom arăta acum cum să faceți același lucru folosind 🤗 Accelerate.
+
+## O buclă de antrenare personalizată[[a-custom-training-loop]]
+
+Să aruncăm acum o privire la bucla de antrenare completă, astfel încât să puteți personaliza cu ușurință părțile de care aveți nevoie. Aceasta va semăna foarte mult cu bucla de antrenare din [Capitolul 3](/course/chapter3/4), cu excepția buclei de evaluare. Vom putea evalua modelul în mod regulat, deoarece nu mai suntem constrânși de clasa `Trainer`.
+
+### Pregătirea pentru antrenament[[preparing-everything-for-training]]
+
+Mai întâi trebuie să construim `DataLoader`s din dataseturile noastre. Am setat formatul acestor dataseturi la `"torch"` și am eliminat coloanele din setul de validare care nu sunt utilizate de model. Apoi, putem utiliza `default_data_collator` furnizat de Transformers ca un `collate_fn` și să amestecăm setul de antrenare, dar nu și setul de validare:
+
+```py
+from torch.utils.data import DataLoader
+from transformers import default_data_collator
+
+train_dataset.set_format("torch")
+validation_set = validation_dataset.remove_columns(["example_id", "offset_mapping"])
+validation_set.set_format("torch")
+
+train_dataloader = DataLoader(
+    train_dataset,
+    shuffle=True,
+    collate_fn=default_data_collator,
+    batch_size=8,
+)
+eval_dataloader = DataLoader(
+    validation_set, collate_fn=default_data_collator, batch_size=8
+)
+```
+
+În continuare, reinițializăm modelul, pentru a ne asigura că nu continuăm fine-tuningul de dinainte, ci pornim din nou de la modelul preantrenat BERT:
+
+```py
+model = AutoModelForQuestionAnswering.from_pretrained(model_checkpoint)
+```
+
+Atunci vom avea nevoie de un optimizator. Ca de obicei, folosim clasicul `AdamW`, care este ca Adam, dar cu o corecție în modul în care se aplică scăderea weighturilor:
+
+```py
+from torch.optim import AdamW
+
+optimizer = AdamW(model.parameters(), lr=2e-5)
+```
+
+Odată ce avem toate aceste obiecte, le putem trimite metodei `accelerator.prepare()`. Amintiți-vă că, dacă doriți să vă antrenați pe un TPU într-un notebook Colab, va trebui să mutați tot acest cod într-o funcție de antrenament, care nu ar trebui să execute nicio celulă care inițializează un `Accelerator`. Putem forța antrenarea cu precizie mixtă trecând `fp16=True` la `Accelerator` (sau, dacă executați codul ca un script, asigurați-vă că completați `config` în 🤗 Accelerate în mod corespunzător).
+
+```py
+from accelerate import Accelerator
+
+accelerator = Accelerator(fp16=True)
+model, optimizer, train_dataloader, eval_dataloader = accelerator.prepare(
+    model, optimizer, train_dataloader, eval_dataloader
+)
+```
+
+După cum ar trebui să știți din secțiunile anterioare, putem utiliza lungimea `train_dataloader` pentru a calcula numărul de pași de antrenare numai după ce a trecut prin metoda `accelerator.prepare()`. Utilizăm același program liniar ca în secțiunile anterioare:
+
+```py
+from transformers import get_scheduler
+
+num_train_epochs = 3
+num_update_steps_per_epoch = len(train_dataloader)
+num_training_steps = num_train_epochs * num_update_steps_per_epoch
+
+lr_scheduler = get_scheduler(
+    "linear",
+    optimizer=optimizer,
+    num_warmup_steps=0,
+    num_training_steps=num_training_steps,
+)
+```
+
+Pentru a trimite modelul nostru către Hub, va trebui să creăm un obiect `Repository` într-un folder de lucru. În primul rând, conectați-vă la Hugging Face Hub, dacă nu sunteți deja conectat. Vom determina numele repositoriul pornind de la ID-ul modelului pe care dorim să îl atribuim modelului nostru (nu ezitați să înlocuiți `repo_name` cu propria alegere; acesta trebuie doar să conțină numele vostru de utilizator, ceea ce face funcția `get_full_repo_name()`):
+
+```py
+from huggingface_hub import Repository, get_full_repo_name
+
+model_name = "bert-finetuned-squad-accelerate"
+repo_name = get_full_repo_name(model_name)
+repo_name
+```
+
+```python out
+'sgugger/bert-finetuned-squad-accelerate'
+```
+
+Apoi putem clona acel repositoriu într-un folder local. Dacă există deja, acest folder local ar trebui să fie o clonă a repositoriului cu care lucrăm:
+
+```py
+output_dir = "bert-finetuned-squad-accelerate"
+repo = Repository(output_dir, clone_from=repo_name)
+```
+
+Acum putem încărca orice salvăm în `output_dir` prin apelarea metodei `repo.push_to_hub()`. Acest lucru ne va ajuta să încărcăm modelele intermediare la sfârșitul fiecărei epoci.
+
+## Bucla de antrenare[[training-loop]]
+
+Acum suntem pregătiți să scriem bucla de antrenare completă. După definirea unei bare de progres pentru a urmări modul în care decurge antrenamentul, bucla are trei părți:
+
+- Pregătirea în sine, care este iterația clasică peste `train_dataloader`, trecerea înainte prin model, apoi trecerea înapoi și pasul optimizatorului.
+- Evaluarea, în care adunăm toate valorile pentru `start_logits` și `end_logits` înainte de a le converti în matrici NumPy. Odată ce bucla de evaluare este terminată, concatenăm toate rezultatele. Rețineți că trebuie să truncăm deoarece `Accelerator` ar fi putut adăuga câteva exemple la sfârșit pentru a ne asigura că avem același număr de exemple în fiecare proces.
+- Salvarea și încărcarea, unde mai întâi salvăm modelul și tokenizatorul, apoi apelăm `repo.push_to_hub()`. Ca și înainte, folosim argumentul `blocking=False` pentru a spune bibliotecii 🤗 Hub să efectueze push-ul într-un proces asincron. În acest fel, antrenamentul continuă normal, iar această instrucțiune (lungă) este executată pe fundal.
+
+Iată codul complet pentru bucla de antrenare:
+
+```py
+from tqdm.auto import tqdm
+import torch
+
+progress_bar = tqdm(range(num_training_steps))
+
+for epoch in range(num_train_epochs):
+    # Training
+    model.train()
+    for step, batch in enumerate(train_dataloader):
+        outputs = model(**batch)
+        loss = outputs.loss
+        accelerator.backward(loss)
+
+        optimizer.step()
+        lr_scheduler.step()
+        optimizer.zero_grad()
+        progress_bar.update(1)
+
+    # Evaluation
+    model.eval()
+    start_logits = []
+    end_logits = []
+    accelerator.print("Evaluation!")
+    for batch in tqdm(eval_dataloader):
+        with torch.no_grad():
+            outputs = model(**batch)
+
+        start_logits.append(accelerator.gather(outputs.start_logits).cpu().numpy())
+        end_logits.append(accelerator.gather(outputs.end_logits).cpu().numpy())
+
+    start_logits = np.concatenate(start_logits)
+    end_logits = np.concatenate(end_logits)
+    start_logits = start_logits[: len(validation_dataset)]
+    end_logits = end_logits[: len(validation_dataset)]
+
+    metrics = compute_metrics(
+        start_logits, end_logits, validation_dataset, raw_datasets["validation"]
+    )
+    print(f"epoch {epoch}:", metrics)
+
+    # Save and upload
+    accelerator.wait_for_everyone()
+    unwrapped_model = accelerator.unwrap_model(model)
+    unwrapped_model.save_pretrained(output_dir, save_function=accelerator.save)
+    if accelerator.is_main_process:
+        tokenizer.save_pretrained(output_dir)
+        repo.push_to_hub(
+            commit_message=f"Training in progress epoch {epoch}", blocking=False
+        )
+```
+
+În cazul în care este prima dată când vedeți un model salvat cu 🤗 Accelerate, să ne oprim puțin pentru a inspecta cele trei linii de cod care îl însoțesc:
+
+```py
+accelerator.wait_for_everyone()
+unwrapped_model = accelerator.unwrap_model(model)
+unwrapped_model.save_pretrained(output_dir, save_function=accelerator.save)
+```
+
+Prima linie se explică de la sine: aceasta spune tuturor proceselor să aștepte până când toată lumea se află în etapa respectivă înainte de a continua. Acest lucru are rolul de a ne asigura că avem același model în fiecare proces înainte de salvare. Apoi luăm `unwrapped_model`, care este modelul de bază pe care l-am definit. Metoda `accelerator.prepare()` modifică modelul pentru a funcționa în antrenarea distribuită, deci nu va mai avea metoda `save_pretrained()`; metoda `accelerator.unwrap_model()` anulează acest pas. În cele din urmă, apelăm metoda `save_pretrained()`, dar îi spunem să folosească metoda `accelerator.save()` în loc de `torch.save()`.
+
+Odată făcut acest lucru, ar trebui să aveți un model care produce rezultate destul de asemănătoare cu cel antrenat cu `Trainer`. Puteți verifica modelul pe care l-am antrenat folosind acest cod pe [*huggingface-course/bert-finetuned-squad-accelerate*] (https://huggingface.co/huggingface-course/bert-finetuned-squad-accelerate). Și dacă doriți să testați orice modificări ale buclei de antrenare, le puteți implementa direct prin editarea codului prezentat mai sus!
+
+{/if}
+
+## Utilizarea modelului fine-tuned[[using-the-fine-tuned-model]]
+
+V-am arătat deja cum puteți utiliza modelul căruia i-am făcut fine-tune pe Model Hub cu widgetul de inferență. Pentru a-l utiliza local într-un `pipeline`, trebuie doar să specificați identificatorul modelului:
+
+```py
+from transformers import pipeline
+
+# Înlocuiți acest checkpoint cu propriul checkpoint
+model_checkpoint = "huggingface-course/bert-finetuned-squad"
+question_answerer = pipeline("question-answering", model=model_checkpoint)
+
+context = """
+🤗 Transformers is backed by the three most popular deep learning libraries — Jax, PyTorch and TensorFlow — with a seamless integration
+between them. It's straightforward to train your models with one before loading them for inference with the other.
+"""
+question = "Which deep learning libraries back 🤗 Transformers?"
+question_answerer(question=question, context=context)
+```
+
+```python out
+{'score': 0.9979003071784973,
+ 'start': 78,
+ 'end': 105,
+ 'answer': 'Jax, PyTorch and TensorFlow'}
+```
+
+Grozav! Modelul nostru funcționează la fel de bine ca cel implicit pentru aceast pipeline!
diff --git a/chapters/rum/chapter7/8.mdx b/chapters/rum/chapter7/8.mdx
new file mode 100644
index 000000000..21430cade
--- /dev/null
+++ b/chapters/rum/chapter7/8.mdx
@@ -0,0 +1,34 @@
+# Înțelegerea LLM-urilor[[mastering-llms]]
+
+<CourseFloatingBanner
+    chapter={7}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+Dacă ați ajuns până aici în curs, felicitări – acum aveți toate cunoștințele și instrumentele necesare pentru a aborda (aproape) orice sarcină de procesare a limbajului cu 🤗 Transformers și ecosistemul Hugging Face!
+
+## De la NLP la LLM-uri
+
+Deși am acoperit multe sarcini tradiționale de NLP în acest curs, domeniul a fost revoluționat de Modelele Mari de Limbaj (LLM-uri). Aceste modele au extins dramatic ceea ce este posibil în procesarea limbajului:
+
+- Pot gestiona mai multe sarcini fără fine-tuning specific pentru fiecare sarcină
+- Excelează la urmarea instrucțiunilor și adaptarea la contexte diferite
+- Pot genera text coerent și adecvat contextului pentru diverse aplicații
+- Pot realiza raționamente și rezolva probleme complexe prin tehnici precum chain-of-thought prompting
+
+Abilitățile fundamentale de NLP pe care le-ați învățat sunt în continuare esențiale pentru a lucra eficient cu LLM-urile. Înțelegerea tokenizării, a arhitecturilor de modele, a metodelor de fine-tuning și a metricilor de evaluare vă oferă cunoștințele necesare pentru a valorifica la maximum potențialul LLM-urilor.
+
+Am văzut o mulțime de data collators, așa că am făcut acest mic videoclip pentru a vă ajuta să găsiți cel pe care să îl utilizați pentru fiecare sarcină:
+
+<Youtube id="-RPeakdlHYo"/>
+
+După finalizarea acestui tur fulger prin sarcinile de bază ale procesării limbajului, ar trebui să:
+
+* Știți care arhitecturi (encoder, decoder sau encoder-decoder) sunt cele mai potrivite pentru fiecare sarcină
+* Înțelegeți diferența dintre preantrenarea și fine-tuning-ul unui model lingvistic
+* Știți cum să antrenați modele Transformer folosind fie API-ul `Trainer` și funcționalitățile de antrenare distribuită ale 🤗 Accelerate, fie TensorFlow și Keras, în funcție de traseul pe care l-ați urmat
+* Înțelegeți semnificația și limitele metricilor precum ROUGE și BLEU pentru sarcinile de generare de text
+* Știți cum să interacționați cu modelele voastre ajustate, atât pe Hub, cât și folosind `pipeline` din 🤗 Transformers
+* Să apreciați modul în care LLM-urile se bazează pe și extind tehnicile tradiționale de NLP
+
+În ciuda tuturor acestor cunoștințe, va veni un moment în care fie veți întâlni un bug dificil în codul vostru, fie veți avea o întrebare despre cum să rezolvați o anumită problemă de procesare a limbajului. Din fericire, comunitatea Hugging Face este aici pentru a vă ajuta! În ultimul capitol al acestei părți a cursului, vom explora cum puteți depana modelele Transformer și cum puteți solicita ajutor în mod eficient.
\ No newline at end of file
diff --git a/chapters/rum/chapter7/9.mdx b/chapters/rum/chapter7/9.mdx
new file mode 100644
index 000000000..38e4ee0a0
--- /dev/null
+++ b/chapters/rum/chapter7/9.mdx
@@ -0,0 +1,329 @@
+<FrameworkSwitchCourse {fw} />
+
+<!-- DISABLE-FRONTMATTER-SECTIONS -->
+
+# Quiz de sfârșit de capitol[[end-of-chapter-quiz]]
+
+<CourseFloatingBanner
+    chapter={7}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+Să testăm ce ați învățat în acest capitol!
+
+### 1. Care dintre următoarele sarcini pot fi încadrate ca o problemă de clasificare a tokenilor?
+
+<Question
+	choices={[
+		{
+			text: "Găsirea componentelor gramaticale ale unei propoziții.",
+			explain: "Corect! Apoi putem eticheta fiecare cuvânt ca substantiv, verb etc.",
+			correct: true
+		},
+		{
+			text: "Verificarea dacă o propoziție este corectă gramatical sau nu.",
+			explain: "Nu, aceasta este o problemă de clasificare a secvențelor."
+		},
+		{
+			text: "Găsirea persoanelor menționate într-o propoziție.",
+			explain: "Corect! Putem eticheta fiecare cuvânt ca persoană sau nu ca o persoană.",
+            correct: true
+		},
+        {
+			text: "Găsirea grupul de cuvinte dintr-o propoziție care răspunde la o întrebare.",
+			explain: "Nu, aceasta ar fi o problemă de răspundere a unei întrebări."
+		}
+	]}
+/>
+
+### 2. Ce parte a preprocesării pentru clasificarea tokenilor diferă de celelalte pipelineuri de preprocesare?
+
+<Question
+	choices={[
+		{
+			text: "Nu este nevoie să faceți nimic; textele sunt deja tokenizate.",
+			explain: "Textele sunt într-adevăr date ca cuvinte separate, dar tot trebuie să aplicăm modelul de tokenizare a sub-cuvintelor."
+		},
+		{
+			text: "Textele sunt date sub formă de cuvinte, astfel încât trebuie să aplicăm doar tokenizarea sub-cuvintelor.",
+			explain: "Corect! Acest lucru este diferit de preprocesarea obișnuită, în care trebuie să aplicăm întregul proces de tokenizare. Vă puteți gândi la o altă diferență?",
+			correct: true
+		},
+		{
+			text: "Folosim <code>-100</code> pentru a eticheta tokenii speciali.",
+			explain: "Acest lucru nu este specific clasificării tokenilor - folosim întotdeauna <code>-100</code> ca label pentru tokenii pe care dorim să îi ignorăm în pierdere."
+		},
+		{
+			text: "Trebuie să ne asigurăm că labelurile sunt trunchiate sau padded la aceeași dimensiune ca și inputurile, atunci când aplicăm trunchierea/paddingul.",
+			explain: "Într-adevăr! Totuși, aceasta nu este singura diferență.",
+			correct: true
+		}
+	]}
+/>
+
+### 3. Ce problemă apare atunci când tokenizăm cuvintele într-o problemă de clasificare a tokenilor și dorim să etichetăm tokenii?
+
+<Question
+	choices={[
+		{
+			text: "Tokenizatorul adaugă tokeni speciali și nu avem labeluri pentru ele.",
+			explain: "Le etichetăm pe acestea cu <code>-100</code>, astfel încât acestea să fie ignorate în pierdere."
+		},
+		{
+			text: "Fiecare cuvânt poate produce mai mulți tokeni, astfel încât ajungem să avem mai multe tokeni decât labeluri.",
+			explain: "Aceasta este problema principală, iar noi trebuie să aliniem labelurile originale cu tokenii.",
+			correct: true
+		},
+		{
+			text: "Tokenii adăugați nu au etichete, deci nu există nicio problemă.",
+			explain: "Incorect; avem nevoie de atâtea etichete câțo tokeni avem, altfel modelele noastre vor da erori."
+		}
+	]}
+/>
+
+### 4. Ce înseamnă "domain adaptation"??
+
+<Question
+	choices={[
+		{
+			text: "Este atunci când rulăm un model pe un dataset și obținem predicțiile pentru fiecare sample din acel dataset.",
+			explain: "Nu, aceasta este doar o inferență."
+		},
+		{
+			text: "Este atunci când antrenăm un model pe un dataset.",
+			explain: "Nu, acesta este antrenarea unui model; nu există nicio adaptare aici."
+		},
+		{
+			text: "Este atunci când facem fine-tune unui model preantrenat pe un nou dataset, iar acesta oferă predicții care sunt mai bine adaptate la datasetul respectiv",
+			explain: "Corect! Modelul și-a adaptat cunoștințele la noul dataset.",
+            correct: true
+		},
+        {
+			text: "Este atunci când adăugăm sampleuri neclasificate la un dataset pentru a face modelul nostru mai robust.",
+			explain: "Cu siguranță este ceva ce ar trebui să faceți dacă vă reantrenați modelul în mod regulat, dar nu este o adaptare la domeniu."
+		}
+	]}
+/>
+
+### 5. Ce sunt labelurile într-o problemă de modelare a limbajului mascat?
+
+<Question
+	choices={[
+		{
+			text: "Unii dintre tokenii din propoziția de intrare sunt mascate aleatoriu, iar labelurile sunt tokenii de input originali.",
+			explain: "Corect!",
+            correct: true
+		},
+		{
+			text: "Unii dintre tokenii din propoziția de intrare sunt mascate aleatoriu, iar labelurile sunt tokenii de input originali, deplasate spre stânga.",
+			explain: "Nu, deplasarea labelurilor spre stânga corespunde prezicerii următorului cuvânt, ceea ce este modelarea cauzală a limbajului."
+		},
+		{
+			text: "Unele dintre tokenii din propoziția de intrare sunt mascate aleatoriu, iar labelul este dacă propoziția este pozitivă sau negativă.",
+			explain: "Aceasta este o problemă de clasificare a secvențelor cu o anumită creștere a datelor, nu de modelare a limbajului mascat."
+		},
+        {
+			text: "Unii dintre tokenii din cele două propoziții de intrare sunt mascate aleatoriu, iar labelul este dacă cele două propoziții sunt similare sau nu.",
+			explain: "Aceasta este o problemă de clasificare a secvențelor cu o anumită creștere a datelor, nu de modelare a limbajului mascat."
+		}
+	]}
+/>
+
+### 6. Care dintre aceste sarcini poate fi văzută ca o problemă de sequence-to-sequence?
+
+<Question
+	choices={[
+		{
+			text: "Scrierea de recenzii scurte ale documentelor lungi",
+			explain: "Da, aceasta este o problemă de sumarizare. Încercați un alt răspuns!",
+            correct: true
+		},
+		{
+			text: "Răspunderea întrebărilor despre un document",
+			explain: "Acest lucru poate fi încadrat ca o problemă de sequence-to-sequence. Totuși, acesta nu este singurul răspuns corect.",
+            correct: true
+		},
+		{
+			text: "Traducerea unui text din chineză în engleză",
+			explain: "Aceasta este cu siguranță o problemă de sequence-to-sequence. Mai puteți găsi alta?",
+            correct: true
+		},
+        {
+			text: "Corectarea mesajelor trimise de nepotul/prietenul meu pentru ca acestea să fie în limba engleză, scrise gramatical",
+			explain: "Aceasta este un fel de problemă de traducere, deci cu siguranță o sarcină de la sequence-to-sequence. Totuși, acesta nu este singurul răspuns corect!",
+			correct: true
+		}
+	]}
+/>
+
+### 7. Care este modalitatea corectă de preprocesare a datelor pentru o problemă de sequence-to-sequence?
+
+<Question
+	choices={[
+		{
+			text: "Inputurile și targeturile trebuie trimise împreună la tokenizer cu <code>inputs=...</code> și <code>targets=...</code>.",
+			explain: "Acesta ar putea fi un API pe care îl vom adăuga în viitor, dar nu este disponibil acum."
+		},
+		{
+			text: "Inputurile și targturile trebuie preprocesate, în două apeluri separate către tokenizer.",
+			explain: "Acest lucru este adevărat, dar incomplet. Trebuie să faceți ceva pentru a vă asigura că tokenizerul le procesează pe ambele în mod corespunzător."
+		},
+		{
+			text: "Ca de obicei, trebuie doar să tokenizăm inputurile.",
+			explain: "Nu într-o problemă de clasificare a secvențelor; targeturile sunt de asemenea texte pe care trebuie să le convertim în numere!"
+		},
+        {
+			text: "Inputurile trebuie să fie trimise către tokenizer, la fel și targeturile, dar în cadrul unui manager de context special.",
+			explain: "Corect, tokenizerul trebuie să fie pus în target mode de către acel context manager.",
+			correct: true
+		}
+	]}
+/>
+
+{#if fw === 'pt'}
+
+### 8. De ce există o subclasă specifică a `Trainer` pentru problemele sequence-to-sequence?
+
+<Question
+	choices={[
+		{
+			text: "Deoarece problemele de sequence-to-sequence utilizează o pierdere personalizată, pentru a ignora labelurile setate la <code>-100</code>",
+			explain: "Aceasta nu este deloc o pierdere personalizată, ci modul în care pierderea este întotdeauna calculată."
+		},
+		{
+			text: "Deoarece problemele de sequence-to-sequence la secvență necesită o buclă de evaluare specială",
+			explain: "Acest lucru este corect. Predicțiile modelelor sequence-to-sequence sunt de obicei rulate cu metoda <code>generate()</code>.",
+			correct: true
+		},
+		{
+			text: "Deoarece targeturile sunt texte în probleme sequence-to-sequence",
+			explain: "<code>Trainer</code>-ului nu prea îi pasă de asta, deoarece acestea au fost preprocesate înainte."
+		},
+        {
+			text: "Deoarece folosim două modele în problemele sequence-to-sequence",
+			explain: "Într-un fel, folosim două modele, un codificator și un decodificator, dar acestea sunt grupate într-un singur model."
+		}
+	]}
+/>
+
+{:else}
+
+### 9. De ce este adesea inutil să se specifice o pierdere atunci când se apelează `compile()` pe un model Transformer?
+
+<Question
+	choices={[
+		{
+			text: "Deoarece modelele Transformer sunt antrenate cu unsupervised learning",
+			explain: "Nu chiar - chiar și unsupervised learning are nevoie de o funcție de pierdere!"
+		},
+		{
+			text: "Deoarece, în mod prestabilit, se utilizează valoarea pierderilor interne ale modelului",
+			explain: "Corect!",
+			correct: true
+		},
+		{
+			text: "Deoarece calculăm metricele după antrenare",
+			explain: "Facem adesea acest lucru, dar nu explică de unde obținem valoarea pierderii pe care o optimizăm în formare."
+		},
+        {
+			text: "Deoarece pierderea este specificată în `model.fit()`",
+			explain: "Nu, funcția de pierdere este întotdeauna fixată odată ce rulați `model.compile()`, și nu poate fi modificată în `model.fit()`."
+		}
+	]}
+/>
+
+{/if}
+
+### 10. Când ar trebui să preantrenați un model nou?
+
+<Question
+	choices={[
+		{
+			text: "Atunci când nu există un model preantrenat disponibil pentru limba dorită.",
+			explain: "Corect.",
+			correct: true
+		},
+		{
+			text: "Atunci când aveți o mulțime de date disponibile, chiar dacă există un model preantrenat care ar putea funcționa pe ele",
+			explain: "În acest caz, ar trebui, probabil, să utilizați modelul preantrenat și să îi faceți fine-tune pe datele voastre, pentru a evita costurile uriașe de calcul."
+		},
+		{
+			text: "Atunci când aveți îndoieli cu privire la biasul modelului preantrenat pe care îl utilizați",
+			explain: "Este adevărat, dar trebuie să vă asigurați că datele pe care le veți utiliza pentru antrenare sunt cu adevărat mai bune.",
+			correct: true
+		},
+        {
+			text: "Atunci când modelele preantrenate disponibile nu sunt suficient de bune",
+			explain: "Sunteți sigur că ați făcut debbuging în mod corespunzător antrenării?"
+		}
+	]}
+/>
+
+### 11. De ce este ușor să preantrenăm un model lingvistic pe o mulțime de texte?
+
+<Question
+	choices={[
+		{
+			text: "Deoarece există o mulțime de texte disponibile pe internet",
+			explain: "Deși este adevărat, acest lucru nu răspunde cu adevărat la întrebare. Încercați din nou!"
+		},
+		{
+			text: "Deoarece obiectivul de preantrenare nu necesită ca oamenii să eticheteze datele",
+			explain: "Acest lucru este corect, modelarea limbajului este o problemă autosupravegheată.",
+			correct: true
+		},
+		{
+			text: "Deoarece biblioteca 🤗 Transformers necesită doar câteva linii de cod pentru a începe antrenarea",
+			explain: "Deși adevărat, acest lucru nu răspunde cu adevărat la întrebarea pusă. Încercați un alt răspuns!"
+		}
+	]}
+/>
+
+### 12. Care sunt principalele provocări la preprocesarea datelor pentru o sarcină de răspundere a întrebărilor?
+
+<Question
+	choices={[
+		{
+			text: "Trebuie să tokenizați inputurile.",
+			explain: "Este corect, dar este cu adevărat o provocare principală?"
+		},
+		{
+			text: "Trebuie să aveți de-a face cu contexte foarte lungi, care oferă mai multe caracteristici de antrenare care pot sau nu să conțină răspunsul.",
+			explain: "Aceasta este cu siguranță una dintre provocări.",
+			correct: true
+		},
+		{
+			text: "Trebuie să tokenizați răspunsurile la întrebări, precum și inputurile.",
+			explain: "Nu, cu excepția cazului în care vă încadrați problema de răspundere a întrebărilor ca o sarcină de sequence-to-sequence."
+		},
+       {
+			text: "Din intervalul răspunsului din text, trebuie să găsiți tokenul de început și de sfârșit în inputul tokenizat.",
+			explain: "Aceasta este una dintre părțile dificile!",
+			correct: true
+		}
+	]}
+/>
+
+### 13. Cum se face de obicei post-procesarea în răspunderea la întrebări?
+
+<Question
+	choices={[
+		{
+			text: "Modelul vă oferă pozițiile de început și de sfârșit ale răspunsului, iar voi trebuie doar să decodificați intervalul corespunzător de tokeni.",
+			explain: "Acesta ar putea fi un mod de a face acest lucru, dar este un pic prea simplist."
+		},
+		{
+			text: "Modelul vă oferă pozițiile de început și de sfârșit ale răspunsului pentru fiecare caracteristică creată de un exemplu, iar voi trebuie doar să decodificați intervalul corespunzător de tokeni în cel care are cel mai bun scor.",
+			explain: "Acest lucru este apropiat de post-procesarea pe care am studiat-o, dar nu este complet corect."
+		},
+		{
+			text: "Modelul vă oferă pozițiile de început și de sfârșit ale răspunsului pentru fiecare caracteristică creată de un exemplu, iar voi trebuie doar să le potriviți cu intervalul din context pentru cel care are cel mai bun scor.",
+			explain: "Asta e corect!",
+			correct: true
+		},
+        {
+			text: "Modelul generează un răspuns, iar tu trebuie doar să îl decodifici.",
+			explain: "Nu, cu excepția cazului în care vă încadrați problema de răspundere a întrebării ca o sarcină de sequence-to-sequence."
+		}
+	]}
+/>

From 70c2d7dd48033e681ac1426996e8f4cf99c2ddfc Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Thu, 29 May 2025 17:05:27 +0300
Subject: [PATCH 126/167] feat: add translated content for chapter8

---
 chapters/rum/_toctree.yml      |  19 +
 chapters/rum/chapter8/1.mdx    |  17 +
 chapters/rum/chapter8/2.mdx    | 329 ++++++++++++++
 chapters/rum/chapter8/3.mdx    | 163 +++++++
 chapters/rum/chapter8/4.mdx    | 793 +++++++++++++++++++++++++++++++++
 chapters/rum/chapter8/4_tf.mdx | 400 +++++++++++++++++
 chapters/rum/chapter8/5.mdx    |  91 ++++
 chapters/rum/chapter8/6.mdx    |  12 +
 chapters/rum/chapter8/7.mdx    | 204 +++++++++
 9 files changed, 2028 insertions(+)
 create mode 100644 chapters/rum/chapter8/1.mdx
 create mode 100644 chapters/rum/chapter8/2.mdx
 create mode 100644 chapters/rum/chapter8/3.mdx
 create mode 100644 chapters/rum/chapter8/4.mdx
 create mode 100644 chapters/rum/chapter8/4_tf.mdx
 create mode 100644 chapters/rum/chapter8/5.mdx
 create mode 100644 chapters/rum/chapter8/6.mdx
 create mode 100644 chapters/rum/chapter8/7.mdx

diff --git a/chapters/rum/_toctree.yml b/chapters/rum/_toctree.yml
index 25730606c..d00c048cd 100644
--- a/chapters/rum/_toctree.yml
+++ b/chapters/rum/_toctree.yml
@@ -26,3 +26,22 @@
   - local: chapter1/10
     title: Quiz de final de capitol
     quiz: 1
+
+- title: 8. Cum să ceri ajutor
+  sections:
+  - local: chapter8/1
+    title: Introducere
+  - local: chapter8/2
+    title: Ce să faci când primești o eroare
+  - local: chapter8/3
+    title: Cum să ceri ajutor pe forumuri
+  - local: chapter8/4
+    title: Debugging-ul pipeline-ului de antrenament
+    local_fw: { pt: chapter8/4, tf: chapter8/4_tf }
+  - local: chapter8/5
+    title: Cum să scrii un issue bun
+  - local: chapter8/6
+    title: Partea 2 completă!
+  - local: chapter8/7
+    title: Quiz de sfârșit de capitol
+    quiz: 8
\ No newline at end of file
diff --git a/chapters/rum/chapter8/1.mdx b/chapters/rum/chapter8/1.mdx
new file mode 100644
index 000000000..ce5924f10
--- /dev/null
+++ b/chapters/rum/chapter8/1.mdx
@@ -0,0 +1,17 @@
+# Introducere[[introducere]]
+
+<CourseFloatingBanner
+    chapter={8}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+Acum că știți cum să abordați cele mai frecvente sarcini NLP cu 🤗 Transformers, ar trebui să puteți începe propriile proiecte! În acest capitol vom explora ce să faceți când întâmpinați o problemă. Veți învăța cum să vă depanați cu succes codul sau antrenamentul și cum să cereți ajutor de la comunitate dacă nu reușiți să rezolvați problema singuri. Și dacă credeți că ați găsit o eroare într-una dintre bibliotecile Hugging Face, vă vom arăta cea mai bună modalitate de a o raporta astfel încât problema să fie rezolvată cât mai rapid posibil.
+
+Mai precis, în acest capitol veți învăța:
+
+- Primul lucru de făcut când primiți o eroare
+- Cum să cereți ajutor pe [forumuri](https://discuss.huggingface.co/)
+- Cum să vă depanați pipeline-ul de antrenament
+- Cum să scrieți o problemă bună
+
+Nimic din acestea nu este specific 🤗 Transformers sau ecosistemului Hugging Face, desigur; lecțiile din acest capitol sunt aplicabile majorității proiectelor open source! 
\ No newline at end of file
diff --git a/chapters/rum/chapter8/2.mdx b/chapters/rum/chapter8/2.mdx
new file mode 100644
index 000000000..ebc0c1b93
--- /dev/null
+++ b/chapters/rum/chapter8/2.mdx
@@ -0,0 +1,329 @@
+# Ce să faci când primești o eroare[[ce-sa-fac-cand-primesti-o-eroare]]
+
+<CourseFloatingBanner chapter={8}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter8/section2.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter8/section2.ipynb"},
+]} />
+
+În această secțiune vom examina câteva erori comune care pot apărea când încercați să generați predicții din modelul Transformer pe care l-ați ajustat recent. Aceasta vă va pregăti pentru [secțiunea 4](/course/chapter8/section4), unde vom explora cum să depanați faza de antrenament în sine.
+
+<Youtube id="DQ-CpJn6Rc4"/>
+
+Am pregătit un [repository model șablon](https://huggingface.co/lewtun/distilbert-base-uncased-finetuned-squad-d5716d28) pentru această secțiune, și dacă doriți să rulați codul din acest capitol va trebui mai întâi să copiați modelul în contul dumneavoastră pe [Hugging Face Hub](https://huggingface.co). Pentru a face acest lucru, mai întâi conectați-vă rulând fie următoarele într-un notebook Jupyter:
+
+```python
+from huggingface_hub import notebook_login
+
+notebook_login()
+```
+
+sau următoarele în terminalul dumneavoastră preferat:
+
+```bash
+huggingface-cli login
+```
+
+Aceasta vă va solicita să introduceți numele de utilizator și parola și va salva un token sub *~/.cache/huggingface/*. Odată ce v-ați conectat, puteți copia repository-ul șablon cu următoarea funcție:
+
+```python
+from distutils.dir_util import copy_tree
+from huggingface_hub import Repository, snapshot_download, create_repo, get_full_repo_name
+
+
+def copy_repository_template():
+    # Clone the repo and extract the local path
+    template_repo_id = "lewtun/distilbert-base-uncased-finetuned-squad-d5716d28"
+    commit_hash = "be3eaffc28669d7932492681cd5f3e8905e358b4"
+    template_repo_dir = snapshot_download(template_repo_id, revision=commit_hash)
+    # Create an empty repo on the Hub
+    model_name = template_repo_id.split("/")[1]
+    create_repo(model_name, exist_ok=True)
+    # Clone the empty repo
+    new_repo_id = get_full_repo_name(model_name)
+    new_repo_dir = model_name
+    repo = Repository(local_dir=new_repo_dir, clone_from=new_repo_id)
+    # Copy files
+    copy_tree(template_repo_dir, new_repo_dir)
+    # Push to Hub
+    repo.push_to_hub()
+```
+
+Acum când apelați `copy_repository_template()`, aceasta va crea o copie a repository-ului șablon sub contul dumneavoastră.
+
+## Depanarea pipeline-ului din 🤗 Transformers[[depanarea-pipeline-ului-din-transformers]]
+
+Pentru a începe călătoria noastră în lumea minunată a depanării modelelor Transformer, considerați următorul scenariu: lucrați cu un coleg la un proiect de răspuns la întrebări pentru a ajuta clienții unui site web de e-commerce să găsească răspunsuri despre produsele de consum. Colegul dumneavoastră vă trimite un mesaj precum:
+
+> Salut! Tocmai am rulat un experiment folosind tehnicile din [Capitolul 7](/course/chapter7/7) al cursului Hugging Face și am obținut rezultate grozave pe SQuAD! Cred că putem folosi acest model ca punct de plecare pentru proiectul nostru. ID-ul modelului pe Hub este "lewtun/distillbert-base-uncased-finetuned-squad-d5716d28". Simte-te liber să îl testezi :)
+
+și primul lucru la care vă gândiți este să încărcați modelul folosind `pipeline` din 🤗 Transformers:
+
+```python
+from transformers import pipeline
+
+model_checkpoint = get_full_repo_name("distillbert-base-uncased-finetuned-squad-d5716d28")
+reader = pipeline("question-answering", model=model_checkpoint)
+```
+
+```python out
+"""
+OSError: Can't load config for 'lewtun/distillbert-base-uncased-finetuned-squad-d5716d28'. Make sure that:
+
+- 'lewtun/distillbert-base-uncased-finetuned-squad-d5716d28' is a correct model identifier listed on 'https://huggingface.co/models'
+
+- or 'lewtun/distillbert-base-uncased-finetuned-squad-d5716d28' is the correct path to a directory containing a config.json file
+"""
+```
+
+Oh nu, se pare că ceva a mers prost! Dacă sunteți nou în programare, acest tip de erori pot părea puțin criptice la început (ce este un `OSError`?!). Eroarea afișată aici este doar ultima parte dintr-un raport de eroare mult mai mare numit _Python traceback_ (cunoscut și ca stack trace). De exemplu, dacă rulați acest cod pe Google Colab, ar trebui să vedeți ceva similar cu următoarea captură de ecran:
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter8/traceback.png" alt="Un traceback Python." width="100%"/>
+</div>
+
+Există multe informații conținute în aceste rapoarte, așa că să parcurgem împreună părțile cheie. Primul lucru de reținut este că traceback-urile ar trebui citite _de jos în sus_. Aceasta poate părea ciudat dacă sunteți obișnuiți să citiți textul în engleză de sus în jos, dar reflectă faptul că traceback-ul arată secvența de apeluri de funcții pe care `pipeline` le face când descarcă modelul și tokenizer-ul. (Consultați [Capitolul 2](/course/chapter2) pentru mai multe detalii despre cum funcționează `pipeline` în culise.)
+
+<Tip>
+
+🚨 Vedeți acea casetă albastră din jurul "6 frames" în traceback-ul din Google Colab? Aceasta este o caracteristică specială a Colab, care comprimă traceback-ul în "frame-uri". Dacă nu reușiți să găsiți sursa unei erori, asigurați-vă că extindeți traceback-ul complet făcând clic pe acele două săgeți mici.
+
+</Tip>
+
+Aceasta înseamnă că ultima linie a traceback-ului indică ultimul mesaj de eroare și dă numele excepției care a fost ridicată. În acest caz, tipul excepției este `OSError`, care indică o eroare legată de sistem. Dacă citim mesajul de eroare însoțitor, putem vedea că pare să existe o problemă cu fișierul *config.json* al modelului și ni se dau două sugestii pentru a o rezolva:
+
+```python out
+"""
+Make sure that:
+
+- 'lewtun/distillbert-base-uncased-finetuned-squad-d5716d28' is a correct model identifier listed on 'https://huggingface.co/models'
+
+- or 'lewtun/distillbert-base-uncased-finetuned-squad-d5716d28' is the correct path to a directory containing a config.json file
+"""
+```
+
+<Tip>
+
+💡 Dacă întâlniți un mesaj de eroare care este dificil de înțeles, doar copiați și lipiți mesajul în bara de căutare Google sau [Stack Overflow](https://stackoverflow.com/) (da, chiar!). Există o șansă bună că nu sunteți prima persoană care întâlnește eroarea, și aceasta este o modalitate bună de a găsi soluții pe care alții din comunitate le-au postat. De exemplu, căutarea pentru `OSError: Can't load config for` pe Stack Overflow dă mai multe [rezultate](https://stackoverflow.com/search?q=OSError%3A+Can%27t+load+config+for+) care ar putea fi folosite ca punct de plecare pentru rezolvarea problemei.
+
+</Tip>
+
+Prima sugestie ne cere să verificăm dacă ID-ul modelului este într-adevăr corect, așa că primul lucru de făcut este să copiem identificatorul și să îl lipim în bara de căutare a Hub-ului:
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter8/wrong-model-id.png" alt="Numele greșit al modelului." width="100%"/>
+</div>
+
+Hmm, într-adevăr pare că modelul colegului nostru nu este pe Hub... aha, dar există o greșeală de tipar în numele modelului! DistilBERT are doar un "l" în numele său, așa că să corectăm asta și să căutăm "lewtun/distilbert-base-uncased-finetuned-squad-d5716d28" în schimb:
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter8/true-model-id.png" alt="Numele corect al modelului." width="100%"/>
+</div>
+
+Bun, aceasta a dat un rezultat. Acum să încercăm să descărcăm din nou modelul cu ID-ul corect:
+
+```python
+model_checkpoint = get_full_repo_name("distilbert-base-uncased-finetuned-squad-d5716d28")
+reader = pipeline("question-answering", model=model_checkpoint)
+```
+
+```python out
+"""
+OSError: Can't load config for 'lewtun/distilbert-base-uncased-finetuned-squad-d5716d28'. Make sure that:
+
+- 'lewtun/distilbert-base-uncased-finetuned-squad-d5716d28' is a correct model identifier listed on 'https://huggingface.co/models'
+
+- or 'lewtun/distilbert-base-uncased-finetuned-squad-d5716d28' is the correct path to a directory containing a config.json file
+"""
+```
+
+Argh, eșuat din nou -- bun venit în viața de zi cu zi a unui inginer de machine learning! Deoarece am corectat ID-ul modelului, problema trebuie să fie în repository în sine. O modalitate rapidă de a accesa conținutul unui repository pe 🤗 Hub este prin funcția `list_repo_files()` din biblioteca `huggingface_hub`:
+
+```python
+from huggingface_hub import list_repo_files
+
+list_repo_files(repo_id=model_checkpoint)
+```
+
+```python out
+['.gitattributes', 'README.md', 'pytorch_model.bin', 'special_tokens_map.json', 'tokenizer_config.json', 'training_args.bin', 'vocab.txt']
+```
+
+Interesant -- nu pare să existe un fișier *config.json* în repository! Nu e de mirare că `pipeline`-ul nostru nu a putut încărca modelul; colegul nostru trebuie să fi uitat să împingă acest fișier pe Hub după ce l-a ajustat fin. În acest caz, problema pare destul de simplă de rezolvat: am putea să îi cerem să adauge fișierul, sau, deoarece putem vedea din ID-ul modelului că modelul preantrenat folosit a fost [`distilbert-base-uncased`](https://huggingface.co/distilbert-base-uncased), putem descărca configurația pentru acest model și să o împingem în repository-ul nostru pentru a vedea dacă aceasta rezolvă problema. Să încercăm asta. Folosind tehnicile pe care le-am învățat în [Capitolul 2](/course/chapter2), putem descărca configurația modelului cu clasa `AutoConfig`:
+
+```python
+from transformers import AutoConfig
+
+pretrained_checkpoint = "distilbert-base-uncased"
+config = AutoConfig.from_pretrained(pretrained_checkpoint)
+```
+
+<Tip warning={true}>
+
+🚨 Abordarea pe care o adoptăm aici nu este infailibilă, deoarece colegul nostru poate să fi modificat configurația `distilbert-base-uncased` înainte de a ajusta fin modelul. În viața reală, am vrea să verificăm cu ei mai întâi, dar în scopurile acestei secțiuni vom presupune că au folosit configurația implicită.
+
+</Tip>
+
+Apoi putem împinge aceasta în repository-ul nostru de model cu funcția `push_to_hub()` a configurației:
+
+```python
+config.push_to_hub(model_checkpoint, commit_message="Add config.json")
+```
+
+Acum putem testa dacă aceasta a funcționat încărcând modelul din cel mai recent commit pe ramura `main`:
+
+```python
+reader = pipeline("question-answering", model=model_checkpoint, revision="main")
+
+context = r"""
+Extractive Question Answering is the task of extracting an answer from a text
+given a question. An example of a question answering dataset is the SQuAD
+dataset, which is entirely based on that task. If you would like to fine-tune a
+model on a SQuAD task, you may leverage the
+examples/pytorch/question-answering/run_squad.py script.
+
+🤗 Transformers is interoperable with the PyTorch, TensorFlow, and JAX
+frameworks, so you can use your favourite tools for a wide variety of tasks!
+"""
+
+question = "What is extractive question answering?"
+reader(question=question, context=context)
+```
+
+```python out
+{'score': 0.38669535517692566,
+ 'start': 34,
+ 'end': 95,
+ 'answer': 'the task of extracting an answer from a text given a question'}
+```
+
+Woohoo, a funcționat! Să recapitulăm ce ați învățat tocmai:
+
+- Mesajele de eroare în Python sunt cunoscute ca _traceback-uri_ și sunt citite de jos în sus. Ultima linie a mesajului de eroare conține de obicei informațiile de care aveți nevoie pentru a localiza sursa problemei.
+- Dacă ultima linie nu conține informații suficiente, parcurgeți traceback-ul în sus și vedeți dacă puteți identifica unde în codul sursă apare eroarea.
+- Dacă niciunul dintre mesajele de eroare nu vă poate ajuta să depanați problema, încercați să căutați online o soluție la o problemă similară.
+- Biblioteca `huggingface_hub` oferă o suită de instrumente pe care le puteți folosi pentru a interacționa cu și a depana repository-urile de pe Hub.
+
+Acum că știți cum să depanați un pipeline, să aruncăm o privire la un exemplu mai complicat în forward pass-ul modelului în sine.
+
+## Depanarea forward pass-ului modelului dumneavoastră[[depanarea-forward-pass-ului-modelului-dumneavoastra]]
+
+Deși `pipeline` este grozav pentru majoritatea aplicațiilor unde aveți nevoie să generați rapid predicții, uneori va trebui să accesați logit-urile modelului (să zicem, dacă aveți o post-procesare personalizată pe care ați dori să o aplicați). Pentru a vedea ce poate merge prost în acest caz, să extragem mai întâi modelul și tokenizer-ul din `pipeline`-ul nostru:
+
+```python
+tokenizer = reader.tokenizer
+model = reader.model
+```
+
+Apoi avem nevoie de o întrebare, așa că să vedem dacă framework-urile noastre preferate sunt suportate:
+
+```python
+question = "Which frameworks can I use?"
+```
+
+Așa cum am văzut în [Capitolul 7](/course/chapter7), pașii obișnuiți pe care trebuie să îi facem sunt tokenizarea intrărilor, extragerea logit-urilor token-urilor de început și sfârșit, și apoi decodarea span-ului de răspuns:
+
+```python
+import torch
+
+inputs = tokenizer(question, context, add_special_tokens=True)
+input_ids = inputs["input_ids"][0]
+outputs = model(**inputs)
+answer_start_scores = outputs.start_logits
+answer_end_scores = outputs.end_logits
+# Get the most likely beginning of answer with the argmax of the score
+answer_start = torch.argmax(answer_start_scores)
+# Get the most likely end of answer with the argmax of the score
+answer_end = torch.argmax(answer_end_scores) + 1
+answer = tokenizer.convert_tokens_to_string(
+    tokenizer.convert_ids_to_tokens(input_ids[answer_start:answer_end])
+)
+print(f"Question: {question}")
+print(f"Answer: {answer}")
+```
+
+```python out
+"""
+OSError: Can't load config for 'lewtun/distillbert-base-uncased-finetuned-squad-d5716d28'. Make sure that:
+
+- 'lewtun/distillbert-base-uncased-finetuned-squad-d5716d28' is a correct model identifier listed on 'https://huggingface.co/models'
+
+- or 'lewtun/distillbert-base-uncased-finetuned-squad-d5716d28' is the correct path to a directory containing a config.json file
+"""
+```
+
+Oh nu, se pare că avem o eroare în codul nostru! Dar nu ne temem de puțină depanare. Puteți folosi debugger-ul Python într-un notebook:
+
+<Youtube id="rSPyvPw0p9k"/>
+
+sau într-un terminal:
+
+<Youtube id="5PkZ4rbHL6c"/>
+
+Aici, citirea mesajului de eroare ne spune că `'list' object has no attribute 'size'`, și putem vedea o săgeată `-->` care indică linia unde a fost ridicată problema în `model(**inputs)`. Puteți depana aceasta interactiv folosind debugger-ul Python, dar pentru moment vom afișa pur și simplu o porțiune din `inputs` pentru a vedea ce avem:
+
+```python
+inputs["input_ids"][:5]
+```
+
+```python out
+[101, 2029, 7705, 2015, 2064]
+```
+
+Aceasta cu siguranță arată ca o `list` Python obișnuită, dar să verificăm din nou tipul:
+
+```python
+type(inputs["input_ids"])
+```
+
+```python out
+list
+```
+
+Da, aceasta este cu siguranță o `list` Python. Deci ce a mers prost? Amintiți-vă din [Capitolul 2](/course/chapter2) că clasele `AutoModelForXxx` din 🤗 Transformers operează pe _tensori_ (fie în PyTorch sau TensorFlow), și o operație comună este să extragi dimensiunile unui tensor folosind `Tensor.size()` în, să zicem, PyTorch. Să aruncăm din nou o privire la traceback, pentru a vedea care linie a declanșat excepția:
+
+```
+~/miniconda3/envs/huggingface/lib/python3.8/site-packages/transformers/models/distilbert/modeling_distilbert.py in forward(self, input_ids, attention_mask, head_mask, inputs_embeds, output_attentions, output_hidden_states, return_dict)
+    471             raise ValueError("You cannot specify both input_ids and inputs_embeds at the same time")
+    472         elif input_ids is not None:
+--> 473             input_shape = input_ids.size()
+    474         elif inputs_embeds is not None:
+    475             input_shape = inputs_embeds.size()[:-1]
+
+AttributeError: 'list' object has no attribute 'size'
+```
+
+Se pare că codul nostru a încercat să apeleze `input_ids.size()`, dar aceasta în mod clar nu va funcționa pentru o `list` Python, care este doar un container. Cum putem rezolva această problemă? Căutarea mesajului de eroare pe Stack Overflow dă destul de multe [rezultate](https://stackoverflow.com/search?q=AttributeError%3A+%27list%27+object+has+no+attribute+%27size%27&s=c15ec54c-63cb-481d-a749-408920073e8f) relevante. Făcând clic pe primul afișează o întrebare similară cu a noastră, cu răspunsul arătat în captura de ecran de mai jos:
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter8/stack-overflow.png" alt="Un răspuns de pe Stack Overflow." width="100%"/>
+</div>
+
+Răspunsul recomandă să adăugăm `return_tensors='pt'` la tokenizer, așa că să vedem dacă aceasta funcționează pentru noi:
+
+```python out
+inputs = tokenizer(question, context, add_special_tokens=True, return_tensors="pt")
+input_ids = inputs["input_ids"][0]
+outputs = model(**inputs)
+answer_start_scores = outputs.start_logits
+answer_end_scores = outputs.end_logits
+# Get the most likely beginning of answer with the argmax of the score
+answer_start = torch.argmax(answer_start_scores)
+# Get the most likely end of answer with the argmax of the score
+answer_end = torch.argmax(answer_end_scores) + 1
+answer = tokenizer.convert_tokens_to_string(
+    tokenizer.convert_ids_to_tokens(input_ids[answer_start:answer_end])
+)
+print(f"Question: {question}")
+print(f"Answer: {answer}")
+```
+
+```python out
+"""
+Question: Which frameworks can I use?
+Answer: pytorch, tensorflow, and jax
+"""
+```
+
+Minunat, a funcționat! Acesta este un exemplu grozav de cât de util poate fi Stack Overflow: prin identificarea unei probleme similare, am putut beneficia de experiența altora din comunitate. Cu toate acestea, o căutare ca aceasta nu va da întotdeauna un răspuns relevant, așa că ce puteți face în astfel de cazuri? Din fericire, există o comunitate primitoare de dezvoltatori pe [forumurile Hugging Face](https://discuss.huggingface.co/) care vă pot ajuta! În secțiunea următoare, vom arunca o privire asupra modului în care puteți formula întrebări bune pe forum care au șanse să primească răspuns. 
\ No newline at end of file
diff --git a/chapters/rum/chapter8/3.mdx b/chapters/rum/chapter8/3.mdx
new file mode 100644
index 000000000..dc95460e5
--- /dev/null
+++ b/chapters/rum/chapter8/3.mdx
@@ -0,0 +1,163 @@
+# Cum să ceri ajutor pe forumuri[[cum-sa-ceri-ajutor-pe-forumuri]]
+
+<CourseFloatingBanner chapter={8}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter8/section3.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter8/section3.ipynb"},
+]} />
+
+<Youtube id="S2EEG3JIt2A"/>
+
+[Forumurile Hugging Face](https://discuss.huggingface.co) sunt un loc excelent pentru a obține ajutor de la echipa open source și comunitatea mai largă Hugging Face. Iată cum arată pagina principală într-o zi obișnuită:
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter8/forums.png" alt="Forumurile Hugging Face." width="100%"/>
+</div>
+
+În partea stângă puteți vedea toate categoriile în care sunt grupate diversele subiecte, în timp ce partea dreaptă arată subiectele cele mai recente. Un subiect este o postare care conține un titlu, o categorie și o descriere; este destul de similar cu formatul GitHub issues pe care l-am văzut când am creat propriul nostru set de date în [Capitolul 5](/course/chapter5). Așa cum sugerează numele, categoria [Beginners](https://discuss.huggingface.co/c/beginners/5) este destinată în principal persoanelor care abia încep cu bibliotecile și ecosistemul Hugging Face. Orice întrebare despre oricare dintre biblioteci este binevenită acolo, fie pentru a depana cod sau pentru a cere ajutor despre cum să faci ceva. (Totuși, dacă întrebarea ta se referă la o bibliotecă în particular, probabil ar trebui să mergi la categoria corespunzătoare a bibliotecii pe forum.)
+
+În mod similar, categoriile [Intermediate](https://discuss.huggingface.co/c/intermediate/6) și [Research](https://discuss.huggingface.co/c/research/7) sunt pentru întrebări mai avansate, de exemplu despre biblioteci sau despre cercetări NLP noi și interesante pe care ați dori să le discutați.
+
+Și, în mod natural, ar trebui să menționăm și categoria [Course](https://discuss.huggingface.co/c/course/20), unde puteți pune orice întrebări aveți care sunt legate de cursul Hugging Face!
+
+Odată ce ați selectat o categorie, veți fi gata să scrieți primul vostru subiect. Puteți găsi câteva [ghiduri](https://discuss.huggingface.co/t/how-to-request-support/3128) pe forum despre cum să faceți acest lucru, și în această secțiune vom arunca o privire asupra unor caracteristici care alcătuiesc un subiect bun.
+
+## Scrierea unei postări bune pe forum[[scrierea-unei-postari-bune-pe-forum]]
+
+Ca exemplu în curs de desfășurare, să presupunem că încercăm să generăm embeddings din articole Wikipedia pentru a crea un motor de căutare personalizat. Ca de obicei, încărcăm tokenizer-ul și modelul după cum urmează:
+
+```python
+from transformers import AutoTokenizer, AutoModel
+
+model_checkpoint = "distilbert-base-uncased"
+tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
+model = AutoModel.from_pretrained(model_checkpoint)
+```
+
+Acum să presupunem că încercăm să încorporăm o întreagă secțiune din [articolul Wikipedia](https://en.wikipedia.org/wiki/Transformers) despre Transformers (franciza, nu biblioteca!):
+
+```python
+text = """
+Generation One is a retroactive term for the Transformers characters that
+appeared between 1984 and 1993. The Transformers began with the 1980s Japanese
+toy lines Micro Change and Diaclone. They presented robots able to transform
+into everyday vehicles, electronic items or weapons. Hasbro bought the Micro
+Change and Diaclone toys, and partnered with Takara. Marvel Comics was hired by
+Hasbro to create the backstory; editor-in-chief Jim Shooter wrote an overall
+story, and gave the task of creating the characthers to writer Dennis O'Neil.
+Unhappy with O'Neil's work (although O'Neil created the name "Optimus Prime"),
+Shooter chose Bob Budiansky to create the characters.
+
+The Transformers mecha were largely designed by Shōji Kawamori, the creator of
+the Japanese mecha anime franchise Macross (which was adapted into the Robotech
+franchise in North America). Kawamori came up with the idea of transforming
+mechs while working on the Diaclone and Macross franchises in the early 1980s
+(such as the VF-1 Valkyrie in Macross and Robotech), with his Diaclone mechs
+later providing the basis for Transformers.
+
+The primary concept of Generation One is that the heroic Optimus Prime, the
+villainous Megatron, and their finest soldiers crash land on pre-historic Earth
+in the Ark and the Nemesis before awakening in 1985, Cybertron hurtling through
+the Neutral zone as an effect of the war. The Marvel comic was originally part
+of the main Marvel Universe, with appearances from Spider-Man and Nick Fury,
+plus some cameos, as well as a visit to the Savage Land.
+
+The Transformers TV series began around the same time. Produced by Sunbow
+Productions and Marvel Productions, later Hasbro Productions, from the start it
+contradicted Budiansky's backstories. The TV series shows the Autobots looking
+for new energy sources, and crash landing as the Decepticons attack. Marvel
+interpreted the Autobots as destroying a rogue asteroid approaching Cybertron.
+Shockwave is loyal to Megatron in the TV series, keeping Cybertron in a
+stalemate during his absence, but in the comic book he attempts to take command
+of the Decepticons. The TV series would also differ wildly from the origins
+Budiansky had created for the Dinobots, the Decepticon turned Autobot Jetfire
+(known as Skyfire on TV), the Constructicons (who combine to form
+Devastator),[19][20] and Omega Supreme. The Marvel comic establishes early on
+that Prime wields the Creation Matrix, which gives life to machines. In the
+second season, the two-part episode The Key to Vector Sigma introduced the
+ancient Vector Sigma computer, which served the same original purpose as the
+Creation Matrix (giving life to Transformers), and its guardian Alpha Trion.
+"""
+
+inputs = tokenizer(text, return_tensors="pt")
+logits = model(**inputs).logits
+```
+
+```python output
+IndexError: index out of range in self
+```
+
+Uh-oh, am întâmpinat o problemă -- și mesajul de eroare este mult mai criptic decât cele pe care le-am văzut în [secțiunea 2](/course/chapter8/section2)! Nu putem înțelege nimic din traceback-ul complet, așa că decidem să ne îndreptăm către forumurile Hugging Face pentru ajutor. Cum am putea să formulăm subiectul?
+
+Pentru a începe, trebuie să facem clic pe butonul "New Topic" din colțul din dreapta sus (rețineți că pentru a crea un subiect, va trebui să fim conectați):
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter8/forums-new-topic.png" alt="Crearea unui nou subiect pe forum." width="100%"/>
+</div>
+
+Aceasta deschide o interfață de scriere unde putem introduce titlul subiectului nostru, să selectăm o categorie și să redactăm conținutul:
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter8/forum-topic01.png" alt="Interfața pentru crearea unui subiect pe forum." width="100%"/>
+</div>
+
+Deoarece eroarea pare să fie exclusiv despre 🤗 Transformers, vom selecta aceasta pentru categorie. Prima noastră încercare de a explica problema ar putea arăta cam așa:
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter8/forum-topic02.png" alt="Redactarea conținutului pentru un nou subiect pe forum." width="100%"/>
+</div>
+
+Deși acest subiect conține mesajul de eroare cu care avem nevoie de ajutor, există câteva probleme cu modul în care este scris:
+
+1. Titlul nu este foarte descriptiv, așa că oricine navighează pe forum nu va putea să spună despre ce este subiectul fără să citească și corpul.
+2. Corpul nu oferă suficiente informații despre _de unde_ vine eroarea și _cum_ să o reproduci.
+3. Subiectul etichetează câteva persoane direct cu un ton oarecum exigent.
+
+Subiecte ca acesta nu sunt susceptibile să primească un răspuns rapid (dacă primesc unul deloc), așa că să vedem cum îl putem îmbunătăți. Vom începe cu prima problemă de a alege un titlu bun.
+
+### Alegerea unui titlu descriptiv[[alegerea-unui-titlu-descriptiv]]
+
+Dacă încercați să obțineți ajutor cu o eroare în codul vostru, o regulă bună este să includeți suficiente informații în titlu astfel încât alții să poată determina rapid dacă cred că pot răspunde la întrebarea voastră sau nu. În exemplul nostru în curs de desfășurare, știm numele excepției care este ridicată și avem câteva indicii că este declanșată în forward pass-ul modelului, unde apelăm `model(**inputs)`. Pentru a comunica aceasta, un titlu posibil ar putea fi:
+
+> Sursa IndexError în forward pass-ul AutoModel?
+
+Acest titlu îi spune cititorului _de unde_ credeți că vine eroarea, și dacă au întâlnit un `IndexError` înainte, există o șansă bună că vor ști cum să îl depaneze. Desigur, titlul poate fi orice doriți, și alte variații precum:
+
+> De ce modelul meu produce un IndexError?
+
+ar putea fi de asemenea bune. Acum că avem un titlu descriptiv, să ne uităm la îmbunătățirea corpului.
+
+### Formatarea fragmentelor de cod[[formatarea-fragmentelor-de-cod]]
+
+Citirea codului sursă este destul de grea într-un IDE, dar este și mai grea când codul este copiat și lipit ca text simplu! Din fericire, forumurile Hugging Face suportă utilizarea Markdown, așa că ar trebui să înconjurați întotdeauna blocurile de cod cu trei backtick-uri (```) astfel încât să fie mai ușor de citit. Să facem aceasta pentru a înfrumuseța mesajul de eroare -- și în timp ce suntem la asta, să facem corpul puțin mai politicos decât versiunea noastră originală:
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter8/forum-topic03.png" alt="Subiectul nostru revizuit pe forum, cu formatarea corectă a codului." width="100%"/>
+</div>
+
+Așa cum puteți vedea în captură, înconjurarea blocurilor de cod în backtick-uri convertește textul brut în cod formatat, complet cu stilizare color! De asemenea, rețineți că backtick-urile simple pot fi folosite pentru a formata variabile inline, așa cum am făcut pentru `distilbert-base-uncased`. Acest subiect arată mult mai bine, și cu puțin noroc am putea găsi pe cineva în comunitate care poate ghici despre ce este eroarea. Cu toate acestea, în loc să ne bazăm pe noroc, să facem viața mai ușoară prin includerea traceback-ului în toată splendoarea sa!
+
+### Includerea traceback-ului complet[[includerea-traceback-ului-complet]]
+
+Deoarece ultima linie a traceback-ului este adesea suficientă pentru a vă depana propriul cod, poate fi tentant să furnizați doar aceea în subiectul vostru pentru a "economisi spațiu". Deși este bine intenționat, aceasta de fapt face _mai greu_ pentru alții să depaneze problema deoarece informațiile care sunt mai sus în traceback pot fi de asemenea foarte utile. Deci, o practică bună este să copiați și să lipiți _întregul_ traceback, asigurându-vă că este frumos formatat. Deoarece aceste traceback-uri pot deveni destul de lungi, unii oameni preferă să le arate după ce au explicat codul sursă. Să facem aceasta. Acum, subiectul nostru pe forum arată astfel:
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter8/forum-topic04.png" alt="Exemplul nostru de subiect pe forum, cu traceback-ul complet." width="100%"/>
+</div>
+
+Aceasta este mult mai informativă, și un cititor atent ar putea fi capabil să indice că problema pare să se datoreze trecerii unei intrări lungi din cauza acestei linii în traceback:
+
+> Token indices sequence length is longer than the specified maximum sequence length for this model (583 > 512).
+
+Cu toate acestea, putem face lucrurile și mai ușoare pentru ei prin furnizarea codului real care a declanșat eroarea. Să facem asta acum.
+
+### Furnizarea unui exemplu reproductibil[[furnizarea-unui-exemplu-reproductibil]]
+
+Dacă ați încercat vreodată să depanați codul altcuiva, probabil că ați încercat mai întâi să recreați problema pe care au raportat-o astfel încât să puteți începe să vă faceți drumul prin traceback pentru a identifica eroarea. Nu este diferit când vine vorba de a obține (sau a da) asistență pe forumuri, așa că ajută cu adevărat dacă puteți furniza un exemplu mic care reproduce eroarea. Jumătate din timp, simpla parcurgere a acestui exercițiu vă va ajuta să vă dați seama ce merge prost. În orice caz, piesa lipsă din exemplul nostru este să arătăm _intrările_ pe care le-am furnizat modelului. Făcând aceasta ne dă ceva ca următorul exemplu completat:
+
+<div class="flex justify-center">
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter8/forum-topic05.png" alt="Versiunea finală a subiectului nostru pe forum." width="100%"/>
+</div>
+
+Acest subiect conține acum destul de multe informații și este scris într-un mod care este mult mai probabil să atragă atenția comunității și să primească un răspuns util. Cu aceste ghiduri de bază, puteți acum crea subiecte grozave pentru a găsi răspunsurile la întrebările voastre 🤗 Transformers! 
\ No newline at end of file
diff --git a/chapters/rum/chapter8/4.mdx b/chapters/rum/chapter8/4.mdx
new file mode 100644
index 000000000..9c961d5f1
--- /dev/null
+++ b/chapters/rum/chapter8/4.mdx
@@ -0,0 +1,793 @@
+<FrameworkSwitchCourse {fw} />
+
+# Debugging-ul pipeline-ului de antrenament[[debugging-pipeline-ului-de-antrenament]]
+
+<CourseFloatingBanner chapter={8}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter8/section4.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter8/section4.ipynb"},
+]} />
+
+Ați scris un script frumos pentru a antrena sau ajusta fin un model pe o sarcină dată, urmând cu atenție sfaturile din [Capitolul 7](/course/chapter7). Dar când lansați comanda `trainer.train()`, se întâmplă ceva oribil: primiți o eroare 😱! Sau mai rău, totul pare să fie în regulă și antrenamentul rulează fără eroare, dar modelul rezultat este prost. În această secțiune, vă vom arăta ce puteți face pentru a depana acest tip de probleme.
+
+## Debugging-ul pipeline-ului de antrenament[[debugging-pipeline-ului-de-antrenament]]
+
+<Youtube id="L-WSwUWde1U"/>
+
+Problema când întâlniți o eroare în `trainer.train()` este că ar putea veni din mai multe surse, deoarece `Trainer` de obicei pune împreună multe lucruri. Convertește seturile de date în dataloader-e, așa că problema ar putea fi ceva greșit în setul vostru de date, sau o problemă când încearcă să grupeze elementele seturilor de date împreună. Apoi ia un batch de date și îl alimentează la model, așa că problema ar putea fi în codul modelului. După aceea, calculează gradienții și efectuează pasul de optimizare, așa că problema ar putea fi și în optimizatorul vostru. Și chiar dacă totul merge bine pentru antrenament, ceva ar putea merge prost în timpul evaluării dacă există o problemă cu metrica voastră.
+
+Cea mai bună modalitate de a face debugging la o eroare care apare în `trainer.train()` este să parcurgeți manual întregul pipeline pentru a vedea unde au mers lucrurile prost. Eroarea este apoi adesea foarte ușor de rezolvat.
+
+Pentru a demonstra aceasta, vom folosi următorul script care (încearcă să) ajusteze fin un model DistilBERT pe [setul de date MNLI](https://huggingface.co/datasets/glue):
+
+```py
+from datasets import load_dataset
+import evaluate
+from transformers import (
+    AutoTokenizer,
+    AutoModelForSequenceClassification,
+    TrainingArguments,
+    Trainer,
+)
+
+raw_datasets = load_dataset("glue", "mnli")
+
+model_checkpoint = "distilbert-base-uncased"
+tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
+
+
+def preprocess_function(examples):
+    return tokenizer(examples["premise"], examples["hypothesis"], truncation=True)
+
+
+tokenized_datasets = raw_datasets.map(preprocess_function, batched=True)
+model = AutoModelForSequenceClassification.from_pretrained(model_checkpoint)
+
+args = TrainingArguments(
+    f"distilbert-finetuned-mnli",
+    evaluation_strategy="epoch",
+    save_strategy="epoch",
+    learning_rate=2e-5,
+    num_train_epochs=3,
+    weight_decay=0.01,
+)
+
+metric = evaluate.load("glue", "mnli")
+
+
+def compute_metrics(eval_pred):
+    predictions, labels = eval_pred
+    return metric.compute(predictions=predictions, references=labels)
+
+
+trainer = Trainer(
+    model,
+    args,
+    train_dataset=raw_datasets["train"],
+    eval_dataset=raw_datasets["validation_matched"],
+    compute_metrics=compute_metrics,
+)
+trainer.train()
+```
+
+Dacă încercați să îl executați, veți fi întâmpinați cu o eroare destul de criptică:
+
+```python out
+'ValueError: You have to specify either input_ids or inputs_embeds'
+```
+
+### Verificați datele voastre[[verificati-datele-voastre]]
+
+Aceasta este de la sine înțeles, dar dacă datele voastre sunt corupte, `Trainer` nu va putea forma batch-uri, cu atât mai puțin să vă antreneze modelul. Deci primul lucru, trebuie să aruncați o privire asupra a ceea ce este în setul vostru de antrenament.
+
+Pentru a evita nenumărate ore petrecute încercând să reparați ceva care nu este sursa bug-ului, vă recomandăm să folosiți `trainer.train_dataset` pentru verificările voastre și nimic altceva. Să facem asta aici:
+
+```py
+trainer.train_dataset[0]
+```
+
+```python out
+{'hypothesis': 'Product and geography are what make cream skimming work. ',
+ 'idx': 0,
+ 'label': 1,
+ 'premise': 'Conceptually cream skimming has two basic dimensions - product and geography.'}
+```
+
+Observați ceva greșit? Aceasta, în conjuncție cu mesajul de eroare despre `input_ids` lipsă, ar trebui să vă facă să realizați că acelea sunt texte, nu numere pe care modelul le poate înțelege. Aici, eroarea originală este foarte înșelătoare deoarece `Trainer` elimină automat coloanele care nu se potrivesc cu semnătura modelului (adică argumentele așteptate de model). Aceasta înseamnă că aici, totul în afară de etichete a fost eliminat. Nu a existat astfel nicio problemă cu crearea batch-urilor și apoi trimiterea lor la model, care la rândul său s-a plâns că nu a primit intrarea potrivită.
+
+De ce nu au fost procesate datele? Am folosit metoda `Dataset.map()` pe seturi de date pentru a aplica tokenizer-ul pe fiecare eșantion. Dar dacă vă uitați cu atenție la cod, veți vedea că am făcut o greșeală când am trecut seturile de antrenament și evaluare la `Trainer`. În loc să folosim `tokenized_datasets` aici, am folosit `raw_datasets` 🤦. Să reparăm asta!
+
+```py
+from datasets import load_dataset
+import evaluate
+from transformers import (
+    AutoTokenizer,
+    AutoModelForSequenceClassification,
+    TrainingArguments,
+    Trainer,
+)
+
+raw_datasets = load_dataset("glue", "mnli")
+
+model_checkpoint = "distilbert-base-uncased"
+tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
+
+
+def preprocess_function(examples):
+    return tokenizer(examples["premise"], examples["hypothesis"], truncation=True)
+
+
+tokenized_datasets = raw_datasets.map(preprocess_function, batched=True)
+model = AutoModelForSequenceClassification.from_pretrained(model_checkpoint)
+
+args = TrainingArguments(
+    f"distilbert-finetuned-mnli",
+    evaluation_strategy="epoch",
+    save_strategy="epoch",
+    learning_rate=2e-5,
+    num_train_epochs=3,
+    weight_decay=0.01,
+)
+
+metric = evaluate.load("glue", "mnli")
+
+
+def compute_metrics(eval_pred):
+    predictions, labels = eval_pred
+    return metric.compute(predictions=predictions, references=labels)
+
+
+trainer = Trainer(
+    model,
+    args,
+    train_dataset=tokenized_datasets["train"],
+    eval_dataset=tokenized_datasets["validation_matched"],
+    compute_metrics=compute_metrics,
+)
+trainer.train()
+```
+
+Acest cod nou va da acum o eroare diferită (progres!):
+
+```python out
+'ValueError: expected sequence of length 43 at dim 1 (got 37)'
+```
+
+Uitându-ne la traceback, putem vedea că eroarea se întâmplă în pasul de colectare a datelor:
+
+```python out
+~/git/transformers/src/transformers/data/data_collator.py in torch_default_data_collator(features)
+    105                 batch[k] = torch.stack([f[k] for f in features])
+    106             else:
+--> 107                 batch[k] = torch.tensor([f[k] for f in features])
+    108 
+    109     return batch
+```
+
+Deci, ar trebui să ne îndreptăm către asta. Înainte să facem asta, totuși, să terminăm de inspectat datele noastre, doar pentru a fi 100% siguri că sunt corecte.
+
+Un lucru pe care ar trebui să îl faceți întotdeauna când depanați o sesiune de antrenament este să aruncați o privire asupra intrărilor decodate ale modelului vostru. Nu putem înțelege numerele pe care le alimentăm direct, așa că ar trebui să ne uităm la ceea ce reprezintă acele numere. În computer vision, de exemplu, aceasta înseamnă să ne uităm la imaginile decodate ale pixelilor pe care îi treceți, în vorbire înseamnă să ascultați eșantioanele audio decodate, și pentru exemplul nostru NLP aici înseamnă să folosim tokenizer-ul nostru pentru a decoda intrările:
+
+```py
+tokenizer.decode(trainer.train_dataset[0]["input_ids"])
+```
+
+```python out
+'[CLS] conceptually cream skimming has two basic dimensions - product and geography. [SEP] product and geography are what make cream skimming work. [SEP]'
+```
+
+Deci pare corect. Ar trebui să faceți aceasta pentru toate cheile din intrări:
+
+```py
+trainer.train_dataset[0].keys()
+```
+
+```python out
+dict_keys(['attention_mask', 'hypothesis', 'idx', 'input_ids', 'label', 'premise'])
+```
+
+Rețineți că cheile care nu corespund intrărilor acceptate de model vor fi eliminate automat, așa că aici vom păstra doar `input_ids`, `attention_mask`, și `label` (care va fi redenumit `labels`). Pentru a verifica din nou semnătura modelului, puteți afișa clasa modelului vostru, apoi să verificați documentația sa:
+
+```py
+type(trainer.model)
+```
+
+```python out
+transformers.models.distilbert.modeling_distilbert.DistilBertForSequenceClassification
+```
+
+Deci în cazul nostru, putem verifica parametrii acceptați pe [această pagină](https://huggingface.co/transformers/model_doc/distilbert.html#distilbertforsequenceclassification). `Trainer` va înregistra de asemenea coloanele pe care le elimină.
+
+Am verificat că ID-urile de intrare sunt corecte prin decodarea lor. Următorul este `attention_mask`:
+
+```py
+trainer.train_dataset[0]["attention_mask"]
+```
+
+```python out
+[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]
+```
+
+Deoarece nu am aplicat padding în preprocesarea noastră, aceasta pare perfect naturală. Pentru a fi siguri că nu există nicio problemă cu acea mască de atenție, să verificăm că are aceeași lungime ca ID-urile noastre de intrare:
+
+```py
+len(trainer.train_dataset[0]["attention_mask"]) == len(
+    trainer.train_dataset[0]["input_ids"]
+)
+```
+
+```python out
+True
+```
+
+Asta e bun! În sfârșit, să verificăm eticheta noastră:
+
+```py
+trainer.train_dataset[0]["label"]
+```
+
+```python out
+1
+```
+
+Ca ID-urile de intrare, acesta este un număr care nu are cu adevărat sens de unul singur. Așa cum am văzut înainte, maparea între întregi și numele etichetelor este stocată în atributul `names` al *feature*-ului corespunzător al setului de date:
+
+```py
+trainer.train_dataset.features["label"].names
+```
+
+```python out
+['entailment', 'neutral', 'contradiction']
+```
+
+Deci `1` înseamnă `neutral`, ceea ce înseamnă că cele două propoziții pe care le-am văzut mai sus nu sunt în contradicție, și prima nu implică a doua. Pare corect!
+
+Nu avem ID-uri de tip token aici, deoarece DistilBERT nu le așteaptă; dacă aveți unele în modelul vostru, ar trebui să vă asigurați de asemenea că se potrivesc corespunzător unde sunt prima și a doua propoziție în intrare.
+
+<Tip>
+
+✏️ **Rândul vostru!** Verificați că totul pare corect cu al doilea element al setului de date de antrenament.
+
+</Tip>
+
+Facem verificarea doar pe setul de antrenament aici, dar ar trebui desigur să verificați din nou seturile de validare și test în același mod.
+
+Acum că știm că seturile noastre de date arată bine, este timpul să verificăm următorul pas al pipeline-ului de antrenament.
+
+### De la seturi de date la dataloader-e[[de-la-seturi-de-date-la-dataloader-e]]
+
+Următorul lucru care poate merge prost în pipeline-ul de antrenament este când `Trainer` încearcă să formeze batch-uri din setul de antrenament sau validare. Odată ce sunteți siguri că seturile de date ale `Trainer` sunt corecte, puteți încerca să formați manual un batch executând următoarele (înlocuiți `train` cu `eval` pentru dataloader-ul de validare):
+
+```py
+for batch in trainer.get_train_dataloader():
+    break
+```
+
+Acest cod creează dataloader-ul de antrenament, apoi iterează prin el, oprindu-se la prima iterație. Dacă codul se execută fără eroare, aveți primul batch de antrenament pe care îl puteți inspecta, și dacă codul dă eroare, știți sigur că problema este în dataloader, așa cum este cazul aici:
+
+```python out
+~/git/transformers/src/transformers/data/data_collator.py in torch_default_data_collator(features)
+    105                 batch[k] = torch.stack([f[k] for f in features])
+    106             else:
+--> 107                 batch[k] = torch.tensor([f[k] for f in features])
+    108 
+    109     return batch
+
+ValueError: expected sequence of length 45 at dim 1 (got 76)
+```
+
+Inspectarea ultimului frame al traceback-ului ar trebui să fie suficientă pentru a vă da un indiciu, dar să facem puțină săpătură. Majoritatea problemelor în timpul creării batch-ului apar din cauza colectării exemplelor într-un singur batch, așa că primul lucru de verificat când aveți îndoieli este ce `collate_fn` folosește `DataLoader`-ul vostru:
+
+```py
+data_collator = trainer.get_train_dataloader().collate_fn
+data_collator
+```
+
+```python out
+<function transformers.data.data_collator.default_data_collator(features: List[InputDataClass], return_tensors='pt') -> Dict[str, Any]>
+```
+
+Deci acesta este `default_data_collator`, dar nu este ceea ce vrem în acest caz. Vrem să facem padding la exemplele noastre la cea mai lungă propoziție din batch, ceea ce se face de colectorul `DataCollatorWithPadding`. Și acest colector de date ar trebui să fie folosit în mod implicit de `Trainer`, deci de ce nu este folosit aici?
+
+Răspunsul este pentru că nu am trecut `tokenizer` la `Trainer`, așa că nu a putut crea `DataCollatorWithPadding` pe care îl vrem. În practică, nu ar trebui să ezitați niciodată să treceți explicit colectorul de date pe care doriți să îl folosiți, pentru a vă asigura că evitați acest tip de erori. Să adaptăm codul nostru pentru a face exact asta:
+
+```py
+from datasets import load_dataset
+import evaluate
+from transformers import (
+    AutoTokenizer,
+    AutoModelForSequenceClassification,
+    DataCollatorWithPadding,
+    TrainingArguments,
+    Trainer,
+)
+
+raw_datasets = load_dataset("glue", "mnli")
+
+model_checkpoint = "distilbert-base-uncased"
+tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
+
+
+def preprocess_function(examples):
+    return tokenizer(examples["premise"], examples["hypothesis"], truncation=True)
+
+
+tokenized_datasets = raw_datasets.map(preprocess_function, batched=True)
+model = AutoModelForSequenceClassification.from_pretrained(model_checkpoint)
+
+args = TrainingArguments(
+    f"distilbert-finetuned-mnli",
+    evaluation_strategy="epoch",
+    save_strategy="epoch",
+    learning_rate=2e-5,
+    num_train_epochs=3,
+    weight_decay=0.01,
+)
+
+metric = evaluate.load("glue", "mnli")
+
+
+def compute_metrics(eval_pred):
+    predictions, labels = eval_pred
+    return metric.compute(predictions=predictions, references=labels)
+
+
+data_collator = DataCollatorWithPadding(tokenizer=tokenizer)
+
+trainer = Trainer(
+    model,
+    args,
+    train_dataset=tokenized_datasets["train"],
+    eval_dataset=tokenized_datasets["validation_matched"],
+    compute_metrics=compute_metrics,
+    data_collator=data_collator,
+    tokenizer=tokenizer,
+)
+trainer.train()
+```
+
+Vestea bună? Nu primim aceeași eroare ca înainte, ceea ce este cu siguranță progres. Vestea proastă? Primim în schimb o eroare CUDA infamă:
+
+```python out
+RuntimeError: CUDA error: CUBLAS_STATUS_ALLOC_FAILED when calling `cublasCreate(handle)`
+```
+
+Aceasta este rea deoarece erorile CUDA sunt extrem de greu de depanat în general. Vom vedea într-un minut cum să rezolvăm aceasta, dar mai întâi să terminăm analiza noastră a creării batch-ului.
+
+Dacă sunteți siguri că colectorul vostru de date este cel potrivit, ar trebui să încercați să îl aplicați pe câteva eșantioane din setul vostru de date:
+
+```py
+data_collator = trainer.get_train_dataloader().collate_fn
+batch = data_collator([trainer.train_dataset[i] for i in range(4)])
+```
+
+Acest cod va eșua deoarece `train_dataset` conține coloane string, pe care `Trainer` le elimină de obicei. Le puteți elimina manual, sau dacă doriți să replicați exact ceea ce face `Trainer` în culise, puteți apela metoda privată `Trainer._remove_unused_columns()` care face asta:
+
+```py
+data_collator = trainer.get_train_dataloader().collate_fn
+actual_train_set = trainer._remove_unused_columns(trainer.train_dataset)
+batch = data_collator([actual_train_set[i] for i in range(4)])
+```
+
+Ar trebui apoi să puteți depana manual ce se întâmplă în interiorul colectorului de date dacă eroarea persistă.
+
+Acum că am depanat procesul de creare a batch-ului, este timpul să trecem unul prin model! 
+
+### Trecerea prin model[[trecerea-prin-model]]
+
+Ar trebui să puteți obține un batch executând următoarea comandă:
+
+```py
+for batch in trainer.get_train_dataloader():
+    break
+```
+
+Dacă rulați acest cod într-un notebook, s-ar putea să primiți o eroare CUDA similară cu cea pe care am văzut-o mai devreme, caz în care trebuie să reporniți notebook-ul și să reexecutați ultimul fragment fără linia `trainer.train()`. Acesta este al doilea lucru cel mai enervant despre erorile CUDA: ele strică iremediabil kernel-ul vostru. Cel mai enervant lucru despre ele este faptul că sunt greu de depanat.
+
+De ce este așa? Are de-a face cu modul în care funcționează GPU-urile. Ele sunt extrem de eficiente la executarea multor operații în paralel, dar dezavantajul este că atunci când una dintre acele instrucțiuni rezultă într-o eroare, nu știți instantaneu. Doar când programul apelează o sincronizare a multiplelor procese de pe GPU va realiza că ceva a mers prost, așa că eroarea este de fapt ridicată într-un loc care nu are nimic de-a face cu ceea ce a creat-o. De exemplu, dacă ne uităm la traceback-ul nostru anterior, eroarea a fost ridicată în timpul backward pass-ului, dar vom vedea într-un minut că de fapt provine din ceva din forward pass.
+
+Deci cum depanăm aceste erori? Răspunsul este simplu: nu o facem. Dacă eroarea voastră CUDA nu este o eroare out-of-memory (ceea ce înseamnă că nu există suficientă memorie în GPU-ul vostru), ar trebui să vă întoarceți întotdeauna la CPU pentru a o depana.
+
+Pentru a face aceasta în cazul nostru, trebuie doar să punem modelul înapoi pe CPU și să îl apelăm pe batch-ul nostru -- batch-ul returnat de `DataLoader` nu a fost încă mutat pe GPU:
+
+```python
+outputs = trainer.model.cpu()(**batch)
+```
+
+```python out
+~/.pyenv/versions/3.7.9/envs/base/lib/python3.7/site-packages/torch/nn/functional.py in nll_loss(input, target, weight, size_average, ignore_index, reduce, reduction)
+   2386         )
+   2387     if dim == 2:
+-> 2388         ret = torch._C._nn.nll_loss(input, target, weight, _Reduction.get_enum(reduction), ignore_index)
+   2389     elif dim == 4:
+   2390         ret = torch._C._nn.nll_loss2d(input, target, weight, _Reduction.get_enum(reduction), ignore_index)
+
+IndexError: Target 2 is out of bounds.
+```
+
+Deci, imaginea devine mai clară. În loc să avem o eroare CUDA, acum avem un `IndexError` în calculul loss-ului (deci nimic de-a face cu backward pass-ul, așa cum am spus mai devreme). Mai precis, putem vedea că este target 2 care creează eroarea, așa că acesta este un moment foarte bun pentru a verifica numărul de etichete al modelului nostru:
+
+```python
+trainer.model.config.num_labels
+```
+
+```python out
+2
+```
+
+Cu două etichete, doar 0 și 1 sunt permise ca target-uri, dar conform mesajului de eroare am primit un 2. Primirea unui 2 este de fapt normală: dacă ne amintim numele etichetelor pe care le-am extras mai devreme, erau trei, deci avem indicii 0, 1 și 2 în setul nostru de date. Problema este că nu am spus asta modelului nostru, care ar fi trebuit să fie creat cu trei etichete. Să reparăm asta!
+
+```py
+from datasets import load_dataset
+import evaluate
+from transformers import (
+    AutoTokenizer,
+    AutoModelForSequenceClassification,
+    DataCollatorWithPadding,
+    TrainingArguments,
+    Trainer,
+)
+
+raw_datasets = load_dataset("glue", "mnli")
+
+model_checkpoint = "distilbert-base-uncased"
+tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
+
+
+def preprocess_function(examples):
+    return tokenizer(examples["premise"], examples["hypothesis"], truncation=True)
+
+
+tokenized_datasets = raw_datasets.map(preprocess_function, batched=True)
+model = AutoModelForSequenceClassification.from_pretrained(model_checkpoint, num_labels=3)
+
+args = TrainingArguments(
+    f"distilbert-finetuned-mnli",
+    evaluation_strategy="epoch",
+    save_strategy="epoch",
+    learning_rate=2e-5,
+    num_train_epochs=3,
+    weight_decay=0.01,
+)
+
+metric = evaluate.load("glue", "mnli")
+
+
+def compute_metrics(eval_pred):
+    predictions, labels = eval_pred
+    return metric.compute(predictions=predictions, references=labels)
+
+
+data_collator = DataCollatorWithPadding(tokenizer=tokenizer)
+
+trainer = Trainer(
+    model,
+    args,
+    train_dataset=tokenized_datasets["train"],
+    eval_dataset=tokenized_datasets["validation_matched"],
+    compute_metrics=compute_metrics,
+    data_collator=data_collator,
+    tokenizer=tokenizer,
+)
+trainer.train()
+```
+
+Nu includem încă linia `trainer.train()`, pentru a ne lua timpul să verificăm că totul arată bine. Dacă cerem un batch și îl trecem la modelul nostru, acum funcționează fără eroare!
+
+```py
+for batch in trainer.get_train_dataloader():
+    break
+
+outputs = trainer.model.cpu()(**batch)
+```
+
+Următorul pas este apoi să ne întoarcem la GPU și să verificăm că totul încă funcționează:
+
+```py
+import torch
+
+device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")
+batch = {k: v.to(device) for k, v in batch.items()}
+
+outputs = trainer.model.to(device)(**batch)
+```
+
+Dacă încă primiți o eroare, asigurați-vă că reporniți notebook-ul și executați doar ultima versiune a scriptului.
+
+### Efectuarea unui pas de optimizare[[efectuarea-unui-pas-de-optimizare]]
+
+Acum că știm că putem construi batch-uri care trec efectiv prin model, suntem gata pentru următorul pas al pipeline-ului de antrenament: calcularea gradienților și efectuarea unui pas de optimizare.
+
+Prima parte este doar o chestiune de a apela metoda `backward()` pe loss:
+
+```py
+loss = outputs.loss
+loss.backward()
+```
+
+Este destul de rar să primiți o eroare în această etapă, dar dacă o faceți, asigurați-vă să vă întoarceți la CPU pentru a obține un mesaj de eroare util.
+
+Pentru a efectua pasul de optimizare, trebuie doar să creăm `optimizer` și să apelăm metoda sa `step()`:
+
+```py
+trainer.create_optimizer()
+trainer.optimizer.step()
+```
+
+Din nou, dacă folosiți optimizatorul implicit în `Trainer`, nu ar trebui să primiți o eroare în această etapă, dar dacă aveți un optimizator personalizat, ar putea fi câteva probleme de depanat aici. Nu uitați să vă întoarceți la CPU dacă primiți o eroare CUDA ciudată în această etapă. Vorbind despre erorile CUDA, mai devreme am menționat un caz special. Să aruncăm o privire asupra acestuia acum.
+
+### Gestionarea erorilor CUDA out-of-memory[[gestionarea-erorilor-cuda-out-of-memory]]
+
+Ori de câte ori primiți un mesaj de eroare care începe cu `RuntimeError: CUDA out of memory`, aceasta indică faptul că nu aveți memorie GPU. Aceasta nu este legată direct de codul vostru și se poate întâmpla cu un script care rulează perfect. Această eroare înseamnă că ați încercat să puneți prea multe lucruri în memoria internă a GPU-ului vostru, și aceasta a rezultat într-o eroare. Ca și cu alte erori CUDA, va trebui să reporniți kernel-ul pentru a fi într-un punct unde puteți rula din nou antrenamentul.
+
+Pentru a rezolva această problemă, trebuie doar să folosiți mai puțin spațiu GPU -- ceva care este adesea mai ușor de spus decât de făcut. În primul rând, asigurați-vă că nu aveți două modele pe GPU în același timp (dacă nu este necesar pentru problema voastră, desigur). Apoi, probabil ar trebui să reduceți dimensiunea batch-ului, deoarece aceasta afectează direct dimensiunile tuturor ieșirilor intermediare ale modelului și gradienții lor. Dacă problema persistă, considerați folosirea unei versiuni mai mici a modelului vostru.
+
+<Tip>
+
+În următoarea parte a cursului, vom examina tehnici mai avansate care vă pot ajuta să reduceți amprenta de memorie și să vă permită să ajustați fin cele mai mari modele.
+
+</Tip>
+
+### Evaluarea modelului[[evaluarea-modelului]]
+
+Acum că am rezolvat toate problemele cu codul nostru, totul este perfect și antrenamentul ar trebui să ruleze fără probleme, nu? Nu atât de repede! Dacă rulați comanda `trainer.train()`, totul va arăta bine la început, dar după un timp veți primi următoarele:
+
+```py
+# Aceasta va dura mult timp și va da eroare, așa că nu ar trebui să rulați această celulă
+trainer.train()
+```
+
+```python out
+TypeError: only size-1 arrays can be converted to Python scalars
+```
+
+Veți realiza că această eroare apare în timpul fazei de evaluare, deci acesta este ultimul lucru pe care va trebui să îl depanăm.
+
+Puteți rula bucla de evaluare a `Trainer` independent de antrenament astfel:
+
+```py
+trainer.evaluate()
+```
+
+```python out
+TypeError: only size-1 arrays can be converted to Python scalars
+```
+
+<Tip>
+
+💡 Ar trebui să vă asigurați întotdeauna că puteți rula `trainer.evaluate()` înainte de a lansa `trainer.train()`, pentru a evita risipa multor resurse de calcul înainte de a întâlni o eroare.
+
+</Tip>
+
+Înainte de a încerca să depanați o problemă în bucla de evaluare, ar trebui să vă asigurați mai întâi că v-ați uitat la date, puteți forma un batch corespunzător și puteți rula modelul pe el. Am completat toți acești pași, așa că următorul cod poate fi executat fără eroare:
+
+```py
+for batch in trainer.get_eval_dataloader():
+    break
+
+batch = {k: v.to(device) for k, v in batch.items()}
+
+with torch.no_grad():
+    outputs = trainer.model(**batch)
+```
+
+Eroarea vine mai târziu, la sfârșitul fazei de evaluare, și dacă ne uităm la traceback vedem aceasta:
+
+```python trace
+~/git/datasets/src/datasets/metric.py in add_batch(self, predictions, references)
+    431         """
+    432         batch = {"predictions": predictions, "references": references}
+--> 433         batch = self.info.features.encode_batch(batch)
+    434         if self.writer is None:
+    435             self._init_writer()
+```
+
+Aceasta ne spune că eroarea provine din modulul `datasets/metric.py` -- deci aceasta este o problemă cu funcția noastră `compute_metrics()`. Aceasta ia un tuplu cu logit-urile și etichetele ca array-uri NumPy, așa că să încercăm să îi alimentăm asta:
+
+```py
+predictions = outputs.logits.cpu().numpy()
+labels = batch["labels"].cpu().numpy()
+
+compute_metrics((predictions, labels))
+```
+
+```python out
+TypeError: only size-1 arrays can be converted to Python scalars
+```
+
+Primim aceeași eroare, deci problema se află cu siguranță în acea funcție. Dacă ne uităm înapoi la codul ei, vedem că doar transmite `predictions` și `labels` la `metric.compute()`. Deci există o problemă cu acea metodă? Nu chiar. Să aruncăm o privire rapidă asupra formelor:
+
+```py
+predictions.shape, labels.shape
+```
+
+```python out
+((8, 3), (8,))
+```
+
+Predicțiile noastre sunt încă logit-uri, nu predicțiile reale, de aceea metrica returnează această eroare (oarecum obscură). Reparația este destul de ușoară; trebuie doar să adăugăm un argmax în funcția `compute_metrics()`:
+
+```py
+import numpy as np
+
+
+def compute_metrics(eval_pred):
+    predictions, labels = eval_pred
+    predictions = np.argmax(predictions, axis=1)
+    return metric.compute(predictions=predictions, references=labels)
+
+
+compute_metrics((predictions, labels))
+```
+
+```python out
+{'accuracy': 0.625}
+```
+
+Acum eroarea noastră este reparată! Aceasta a fost ultima, așa că scriptul nostru va antrena acum un model corespunzător.
+
+Pentru referință, iată scriptul complet reparat:
+
+```py
+import numpy as np
+from datasets import load_dataset
+import evaluate
+from transformers import (
+    AutoTokenizer,
+    AutoModelForSequenceClassification,
+    DataCollatorWithPadding,
+    TrainingArguments,
+    Trainer,
+)
+
+raw_datasets = load_dataset("glue", "mnli")
+
+model_checkpoint = "distilbert-base-uncased"
+tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
+
+
+def preprocess_function(examples):
+    return tokenizer(examples["premise"], examples["hypothesis"], truncation=True)
+
+
+tokenized_datasets = raw_datasets.map(preprocess_function, batched=True)
+model = AutoModelForSequenceClassification.from_pretrained(model_checkpoint, num_labels=3)
+
+args = TrainingArguments(
+    f"distilbert-finetuned-mnli",
+    evaluation_strategy="epoch",
+    save_strategy="epoch",
+    learning_rate=2e-5,
+    num_train_epochs=3,
+    weight_decay=0.01,
+)
+
+metric = evaluate.load("glue", "mnli")
+
+
+def compute_metrics(eval_pred):
+    predictions, labels = eval_pred
+    predictions = np.argmax(predictions, axis=1)
+    return metric.compute(predictions=predictions, references=labels)
+
+
+data_collator = DataCollatorWithPadding(tokenizer=tokenizer)
+
+trainer = Trainer(
+    model,
+    args,
+    train_dataset=tokenized_datasets["train"],
+    eval_dataset=tokenized_datasets["validation_matched"],
+    compute_metrics=compute_metrics,
+    data_collator=data_collator,
+    tokenizer=tokenizer,
+)
+trainer.train()
+```
+
+În acest caz, nu mai sunt probleme, și scriptul nostru va ajusta fin un model care ar trebui să dea rezultate rezonabile. Dar ce putem face când antrenamentul continuă fără nicio eroare, și modelul antrenat nu performează deloc bine? Aceasta este partea cea mai grea a machine learning-ului, și vă vom arăta câteva tehnici care pot ajuta.
+
+<Tip>
+
+💡 Dacă folosiți o buclă de antrenament manuală, aceiași pași se aplică pentru a vă depana pipeline-ul de antrenament, dar este mai ușor să îi separați. Asigurați-vă că nu ați uitat `model.eval()` sau `model.train()` la locurile potrivite, sau `zero_grad()` la fiecare pas, totuși!
+
+</Tip>
+
+## Depanarea erorilor silențioase în timpul antrenamentului[[depanarea-erorilor-silentioase-in-timpul-antrenamentului]]
+
+Ce putem face pentru a depana un antrenament care se completează fără eroare dar nu obține rezultate bune? Vă vom da câteva indicii aici, dar fiți conștienți că acest tip de depanare este partea cea mai grea a machine learning-ului, și nu există un răspuns magic.
+
+### Verificați datele voastre (din nou!)[[verificati-datele-voastre-din-nou]]
+
+Modelul vostru va învăța ceva doar dacă este de fapt posibil să învețe ceva din datele voastre. Dacă există o eroare care corupe datele sau etichetele sunt atribuite aleatoriu, este foarte probabil că nu veți obține niciun antrenament de model pe setul vostru de date. Deci începeți întotdeauna prin a verifica din nou intrările și etichetele voastre decodate, și întrebați-vă următoarele întrebări:
+
+- Sunt datele decodate înțelegibile?
+- Sunteți de acord cu etichetele?
+- Există o etichetă care este mai comună decât altele?
+- Care ar trebui să fie loss-ul/metrica dacă modelul ar prezice un răspuns aleatoriu/întotdeauna același răspuns?
+
+<Tip warning={true}>
+
+⚠️ Dacă faceți antrenament distribuit, afișați eșantioane din setul vostru de date în fiecare proces și verificați de trei ori că obțineți același lucru. O eroare comună este să aveți o sursă de aleatoriu în crearea datelor care face ca fiecare proces să aibă o versiune diferită a setului de date.
+
+</Tip>
+
+După ce vă uitați la datele voastre, treceți prin câteva dintre predicțiile modelului și decodați-le și pe ele. Dacă modelul prezice întotdeauna același lucru, ar putea fi pentru că setul vostru de date este părtinitor către o categorie (pentru problemele de clasificare); tehnici precum supraesantionarea claselor rare ar putea ajuta.
+
+Dacă loss-ul/metrica pe care o obțineți pe modelul vostru inițial este foarte diferită de loss-ul/metrica pe care ați aștepta-o pentru predicții aleatorii, verificați din nou modul în care loss-ul sau metrica voastră este calculată, deoarece probabil există o eroare acolo. Dacă folosiți mai multe loss-uri pe care le adăugați la sfârșit, asigurați-vă că sunt de aceeași scară.
+
+Când sunteți siguri că datele voastre sunt perfecte, puteți vedea dacă modelul este capabil să se antreneze pe ele cu un test simplu.
+
+### Supraajustați modelul vostru pe un batch[[supraajustati-modelul-vostru-pe-un-batch]]
+
+Supraajustarea este de obicei ceva pe care încercăm să îl evităm când antrenăm, deoarece înseamnă că modelul nu învață să recunoască caracteristicile generale pe care vrem să le recunoască, ci în schimb doar memorează eșantioanele de antrenament. Cu toate acestea, încercarea de a vă antrena modelul pe un batch din nou și din nou este un test bun pentru a verifica dacă problema așa cum ați formulat-o poate fi rezolvată de modelul pe care încercați să îl antrenați. De asemenea, vă va ajuta să vedeți dacă rata voastră de învățare inițială este prea mare.
+
+Făcând aceasta odată ce ați definit `Trainer` este foarte ușor; doar luați un batch de date de antrenament, apoi rulați o buclă mică de antrenament manual folosind doar acel batch pentru ceva ca 20 de pași:
+
+```py
+for batch in trainer.get_train_dataloader():
+    break
+
+batch = {k: v.to(device) for k, v in batch.items()}
+trainer.create_optimizer()
+
+for _ in range(20):
+    outputs = trainer.model(**batch)
+    loss = outputs.loss
+    loss.backward()
+    trainer.optimizer.step()
+    trainer.optimizer.zero_grad()
+```
+
+<Tip>
+
+💡 Dacă datele voastre de antrenament sunt dezechilibrate, asigurați-vă să construiți un batch de date de antrenament care conține toate etichetele.
+
+</Tip>
+
+Modelul rezultat ar trebui să aibă rezultate aproape perfecte pe același `batch`. Să calculăm metrica pe predicțiile rezultate:
+
+```py
+with torch.no_grad():
+    outputs = trainer.model(**batch)
+preds = outputs.logits
+labels = batch["labels"]
+
+compute_metrics((preds.cpu().numpy(), labels.cpu().numpy()))
+```
+
+```python out
+{'accuracy': 1.0}
+```
+
+100% acuratețe, acum acesta este un exemplu frumos de supraajustare (ceea ce înseamnă că dacă încercați modelul vostru pe orice altă propoziție, foarte probabil vă va da un răspuns greșit)!
+
+Dacă nu reușiți să faceți modelul vostru să obțină rezultate perfecte ca aceasta, înseamnă că există ceva greșit cu modul în care ați formulat problema sau datele voastre, așa că ar trebui să reparați asta. Doar când reușiți să treceți testul de supraajustare puteți fi siguri că modelul vostru poate învăța de fapt ceva.
+
+<Tip warning={true}>
+
+⚠️ Va trebui să vă recreați modelul și `Trainer` după acest test, deoarece modelul obținut probabil nu va putea să se recupereze și să învețe ceva util pe setul vostru complet de date.
+
+</Tip>
+
+### Nu ajustați nimic până nu aveți o primă linie de bază[[nu-ajustati-nimic-pana-nu-aveti-o-prima-linie-de-baza]]
+
+Ajustarea hiperparametrilor este întotdeauna subliniată ca fiind partea cea mai grea a machine learning-ului, dar este doar ultimul pas pentru a vă ajuta să câștigați puțin la metrică. Majoritatea timpului, hiperparametrii impliciți ai `Trainer` vor funcționa bine pentru a vă da rezultate bune, așa că nu vă lansați într-o căutare de hiperparametri consumatoare de timp și costisitoare până nu aveți ceva care bate linia de bază pe care o aveți pe setul vostru de date.
+
+Odată ce aveți un model suficient de bun, puteți începe să ajustați puțin. Nu încercați să lansați o mie de rulări cu hiperparametri diferiți, ci comparați câteva rulări cu valori diferite pentru un hiperparametru pentru a avea o idee despre care are cel mai mare impact.
+
+Dacă ajustați modelul în sine, păstrați-l simplu și nu încercați nimic pe care nu îl puteți justifica în mod rezonabil. Asigurați-vă întotdeauna că vă întoarceți la testul de supraajustare pentru a verifica că schimbarea voastră nu a avut consecințe neintenționate.
+
+### Cereți ajutor[[cereti-ajutor]]
+
+Sperăm că veți fi găsit câteva sfaturi în această secțiune care v-au ajutat să vă rezolvați problema, dar dacă nu este cazul, amintiți-vă că puteți întotdeauna să cereți comunității pe [forumuri](https://discuss.huggingface.co/).
+
+Iată câteva resurse suplimentare care se pot dovedi utile:
+
+- ["Reproducibility as a vehicle for engineering best practices"](https://docs.google.com/presentation/d/1yHLPvPhUs2KGI5ZWo0sU-PKU3GimAk3iTsI38Z-B5Gw/edit#slide=id.p) de Joel Grus
+- ["Checklist for debugging neural networks"](https://towardsdatascience.com/checklist-for-debugging-neural-networks-d8b2a9434f21) de Cecelia Shao
+- ["How to unit test machine learning code"](https://medium.com/@keeper6928/how-to-unit-test-machine-learning-code-57cf6fd81765) de Chase Roberts
+- ["A Recipe for Training Neural Networks"](http://karpathy.github.io/2019/04/25/recipe/) de Andrej Karpathy
+
+Desigur, nu fiecare problemă pe care o întâlniți când antrenați rețele neuronale este vina voastră! Dacă întâlniți ceva în biblioteca 🤗 Transformers sau 🤗 Datasets care nu pare corect, s-ar putea să fi întâlnit o eroare. Ar trebui cu siguranță să ne spuneți totul despre aceasta, și în secțiunea următoare vă vom explica exact cum să faceți asta. 
\ No newline at end of file
diff --git a/chapters/rum/chapter8/4_tf.mdx b/chapters/rum/chapter8/4_tf.mdx
new file mode 100644
index 000000000..fa2872d78
--- /dev/null
+++ b/chapters/rum/chapter8/4_tf.mdx
@@ -0,0 +1,400 @@
+<FrameworkSwitchCourse {fw} />
+
+# Debugging-ul pipeline-ului de antrenament[[debugging-pipeline-ului-de-antrenament]]
+
+<CourseFloatingBanner chapter={8}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter8/section4_tf.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter8/section4_tf.ipynb"},
+]} />
+
+Ați scris un script frumos pentru a antrena sau ajusta fin un model pe o sarcină dată, urmând cu atenție sfaturile din [Capitolul 7](/course/chapter7). Dar când lansați comanda `model.fit()`, se întâmplă ceva oribil: primiți o eroare 😱! Sau mai rău, totul pare să fie în regulă și antrenamentul rulează fără eroare, dar modelul rezultat este prost. În această secțiune, vă vom arăta ce puteți face pentru a depana acest tip de probleme.
+
+## Debugging-ul pipeline-ului de antrenament[[debugging-pipeline-ului-de-antrenament]]
+
+<Youtube id="N9kO52itd0Q"/>
+
+Problema când întâlniți o eroare în `model.fit()` este că ar putea veni din mai multe surse, deoarece antrenamentul aduce de obicei împreună multe lucruri la care ați lucrat până în acel punct. Problema ar putea fi ceva greșit în setul vostru de date, sau o problemă când încearcă să grupeze elementele seturilor de date împreună. Sau ar putea fi ceva greșit în codul modelului, sau funcția voastră de loss sau optimizatorul. Și chiar dacă totul merge bine pentru antrenament, ceva ar putea merge prost în timpul evaluării dacă există o problemă cu metrica voastră.
+
+Cea mai bună modalitate de a face debugging la o eroare care apare în `model.fit()` este să parcurgeți manual întregul pipeline pentru a vedea unde au mers lucrurile prost. Eroarea este apoi adesea foarte ușor de rezolvat.
+
+Pentru a demonstra aceasta, vom folosi următorul script care (încearcă să) ajusteze fin un model DistilBERT pe [setul de date MNLI](https://huggingface.co/datasets/glue):
+
+```py
+from datasets import load_dataset
+import evaluate
+from transformers import (
+    AutoTokenizer,
+    TFAutoModelForSequenceClassification,
+)
+
+raw_datasets = load_dataset("glue", "mnli")
+
+model_checkpoint = "distilbert-base-uncased"
+tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
+
+
+def preprocess_function(examples):
+    return tokenizer(examples["premise"], examples["hypothesis"], truncation=True)
+
+
+tokenized_datasets = raw_datasets.map(preprocess_function, batched=True)
+
+train_dataset = tokenized_datasets["train"].to_tf_dataset(
+    columns=["input_ids", "labels"], batch_size=16, shuffle=True
+)
+
+validation_dataset = tokenized_datasets["validation_matched"].to_tf_dataset(
+    columns=["input_ids", "labels"], batch_size=16, shuffle=True
+)
+
+model = TFAutoModelForSequenceClassification.from_pretrained(model_checkpoint)
+
+model.compile(loss="sparse_categorical_crossentropy", optimizer="adam")
+
+model.fit(train_dataset)
+```
+
+Dacă încercați să îl executați, ați putea primi niște `VisibleDeprecationWarning`-uri când faceți conversia setului de date -- aceasta este o problemă UX cunoscută pe care o avem, deci vă rugăm să o ignorați. Dacă citiți cursul după, să zicem, noiembrie 2021 și încă se întâmplă, atunci trimiteți tweet-uri furioase la @carrigmat până când o repară.
+
+Ce este o problemă mai serioasă, totuși, este că primim o eroare directă. Și este într-adevăr, înfricoșător de lungă:
+
+```python out
+ValueError: No gradients provided for any variable: ['tf_distil_bert_for_sequence_classification/distilbert/embeddings/word_embeddings/weight:0', '...']
+```
+
+Ce înseamnă asta? Am încercat să antrenăm pe datele noastre, dar nu am primit niciun gradient? Aceasta este destul de nedumeritoare; cum începem să depanăm ceva ca aceasta? Când eroarea pe care o primiți nu sugerează imediat unde este problema, cea mai bună soluție este adesea să parcurgeți lucrurile în secvență, asigurându-vă la fiecare etapă că totul arată corect. Și desigur, locul de început este întotdeauna să...
+
+### Verificați datele voastre[[verificati-datele-voastre]]
+
+Aceasta este de la sine înțeles, dar dacă datele voastre sunt corupte, Keras nu va putea să le repare pentru voi. Deci primul lucru, trebuie să aruncați o privire asupra a ceea ce este în setul vostru de antrenament.
+
+Deși este tentant să vă uitați în interiorul `raw_datasets` și `tokenized_datasets`, vă recomandăm puternic să mergeți la date chiar la punctul unde vor intra în model. Aceasta înseamnă să citiți o ieșire din `tf.data.Dataset` pe care l-ați creat cu funcția `to_tf_dataset()`! Deci cum facem asta? Obiectele `tf.data.Dataset` ne dau batch-uri întregi odată și nu suportă indexarea, așa că nu putem să cerem pur și simplu `train_dataset[0]`. Putem, totuși, să îi cerem politicos un batch:
+
+```py
+for batch in train_dataset:
+    break
+```
+
+`break` termină bucla după o iterație, așa că aceasta prinde primul batch care iese din `train_dataset` și îl salvează ca `batch`. Acum, să aruncăm o privire asupra a ceea ce este în interior:
+
+```python out
+{'attention_mask': <tf.Tensor: shape=(16, 76), dtype=int64, numpy=
+ array([[1, 1, 1, ..., 0, 0, 0],
+        [1, 1, 1, ..., 0, 0, 0],
+        [1, 1, 1, ..., 0, 0, 0],
+        ...,
+        [1, 1, 1, ..., 1, 1, 1],
+        [1, 1, 1, ..., 0, 0, 0],
+        [1, 1, 1, ..., 0, 0, 0]])>,
+ 'label': <tf.Tensor: shape=(16,), dtype=int64, numpy=array([0, 2, 1, 2, 1, 1, 2, 0, 0, 0, 1, 0, 1, 2, 2, 1])>,
+ 'input_ids': <tf.Tensor: shape=(16, 76), dtype=int64, numpy=
+ array([[ 101, 2174, 1010, ...,    0,    0,    0],
+        [ 101, 3174, 2420, ...,    0,    0,    0],
+        [ 101, 2044, 2048, ...,    0,    0,    0],
+        ...,
+        [ 101, 3398, 3398, ..., 2051, 2894,  102],
+        [ 101, 1996, 4124, ...,    0,    0,    0],
+        [ 101, 1999, 2070, ...,    0,    0,    0]])>}
+```
+
+Aceasta pare corectă, nu? Transmitem `labels`, `attention_mask`, și `input_ids` la model, care ar trebui să fie tot ce are nevoie pentru a calcula ieșirile și a calcula loss-ul. Deci de ce nu avem un gradient? Priviți mai atent: transmitem un singur dicționar ca intrare, dar un batch de antrenament este de obicei un tensor de intrare sau dicționar, plus un tensor de etichete. Etichetele noastre sunt doar o cheie în dicționarul nostru de intrare.
+
+Este aceasta o problemă? Nu întotdeauna, de fapt! Dar este una dintre cele mai comune probleme pe care le veți întâlni când antrenați modele Transformer cu TensorFlow. Modelele noastre pot calcula toate loss-ul intern, dar pentru a face asta etichetele trebuie să fie transmise în dicționarul de intrare. Acesta este loss-ul care este folosit când nu specificăm o valoare de loss la `compile()`. Keras, pe de altă parte, se așteaptă de obicei ca etichetele să fie transmise separat de dicționarul de intrare, și calculele de loss vor eșua de obicei dacă nu faceți asta.
+
+Problema a devenit acum mai clară: am transmis un argument `loss`, ceea ce înseamnă că îi cerem lui Keras să calculeze loss-urile pentru noi, dar am transmis etichetele noastre ca intrări la model, nu ca etichete în locul pe care Keras le așteaptă. Trebuie să alegem una sau alta: fie folosim loss-ul intern al modelului și păstrăm etichetele unde sunt, fie continuăm să folosim loss-urile Keras, dar mutăm etichetele în locul pe care Keras le așteaptă. Pentru simplitate, să adoptăm prima abordare. Schimbați apelul la `compile()` să citească:
+
+```py
+model.compile(optimizer="adam")
+```
+
+Acum vom folosi loss-ul intern al modelului, și această problemă ar trebui să fie rezolvată! 
+
+<Tip>
+
+✏️ **Rândul vostru!** Ca o provocare opțională după ce am rezolvat celelalte probleme, puteți încerca să vă întoarceți la acest pas și să faceți modelul să funcționeze cu loss-ul original calculat de Keras în loc de loss-ul intern. Va trebui să adăugați `"labels"` la argumentul `label_cols` al `to_tf_dataset()` pentru a vă asigura că etichetele sunt scoase corect, ceea ce vă va da gradienți -- dar mai există o problemă cu loss-ul pe care l-am specificat. Antrenamentul va rula încă cu această problemă, dar învățarea va fi foarte lentă și va ajunge la un platou la un loss de antrenament ridicat. Puteți să vă dați seama ce este?
+
+Un indiciu codificat ROT13, dacă sunteți blocați: Vs lbh ybbx ng gur bhgchgf bs FrdhraprPynffvsvpngvba zbqryf va Genafsbezref, gurve svefg bhgchg vf `ybtvgf`. Jung ner ybtvgf?
+
+Și un al doilea indiciu: Jura lbh fcrpvsl bcgvzvmref, npgvingvbaf be ybffrf jvgu fgevatf, Xrenf frgf nyy gur nethzrag inyhrf gb gurve qrsnhygf. Jung nethzragf qbrf FcnefrPngrtbevpnyPebffragebcl unir, naq jung ner gurve qrsnhygf?
+
+</Tip>
+
+Acum, să încercăm antrenamentul. Ar trebui să primim gradienți acum, așa că cu speranță (muzică sinistră se aude aici) putem pur și simplu să apelăm `model.fit()` și totul va funcționa bine!
+
+```python out
+  246/24543 [..............................] - ETA: 15:52 - loss: nan
+```
+
+Oh nu.
+
+`nan` nu este o valoare foarte încurajatoare pentru loss. Cu toate acestea, am verificat datele noastre, și pare destul de bună. Dacă aceea nu este problema, unde putem merge următorul? Următorul pas evident este să...
+
+### Verificați modelul vostru[[verificati-modelul-vostru]]
+
+`model.fit()` este o funcție de conveniență foarte grozavă în Keras, dar face multe lucruri pentru voi, și aceasta poate face mai complicat să găsiți exact unde a apărut o problemă. Dacă depanați modelul vostru, o strategie care poate ajuta cu adevărat este să transmiteți doar un singur batch la model, și să vă uitați la ieșirile pentru acel batch în detaliu. Un alt sfat foarte util dacă modelul aruncă erori este să `compile()` modelul cu `run_eagerly=True`. Aceasta îl va face mult mai lent, dar va face mesajele de eroare mult mai comprehensibile, deoarece vor indica exact unde în codul modelului vostru a apărut problema.
+
+Pentru moment, totuși, nu avem nevoie de `run_eagerly` încă. Să rulăm `batch`-ul pe care l-am primit înainte prin model și să vedem cum arată ieșirile:
+
+```py
+model(batch)
+```
+
+```python out
+TFSequenceClassifierOutput(loss=<tf.Tensor: shape=(16,), dtype=float32, numpy=
+array([nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan,
+       nan, nan, nan], dtype=float32)>, logits=<tf.Tensor: shape=(16, 2), dtype=float32, numpy=
+array([[nan, nan],
+       [nan, nan],
+       [nan, nan],
+       [nan, nan],
+       [nan, nan],
+       [nan, nan],
+       [nan, nan],
+       [nan, nan],
+       [nan, nan],
+       [nan, nan],
+       [nan, nan],
+       [nan, nan],
+       [nan, nan],
+       [nan, nan],
+       [nan, nan],
+       [nan, nan]], dtype=float32)>, hidden_states=None, attentions=None)
+```
+
+Ei bine, aceasta este complicată. Totul este `nan`! Dar aceasta este ciudată, nu? Cum ar deveni toate logit-urile noastre `nan`? `nan` înseamnă "not a number" (nu un număr). Valorile `nan` apar adesea când efectuați o operație interzisă, cum ar fi împărțirea la zero. Dar un lucru care este foarte important de știut despre `nan` în machine learning este că această valoare tinde să se *propage*. Dacă înmulțiți un număr cu `nan`, ieșirea este de asemenea `nan`. Și dacă primiți un `nan` oriunde în ieșirea voastră, loss-ul voastru sau gradientul voastru, atunci se va răspândi rapid prin întreaga voastră rețea -- deoarece când acea valoare `nan` este propagată înapoi prin rețeaua voastră, veți primi gradienți `nan`, și când actualizările de greutăți sunt calculate cu acei gradienți, veți primi greutăți `nan`, și acele greutăți vor calcula și mai multe ieșiri `nan`! În curând întreaga rețea va fi doar un bloc mare de `nan`-uri. Odată ce se întâmplă asta, este destul de greu să vedeți unde a început problema. Cum putem izola unde `nan` a intrat pentru prima dată?
+
+Răspunsul este să încercăm să *reinițializăm* modelul nostru. Odată ce am început antrenamentul, am primit un `nan` undeva și s-a propagat rapid prin întregul model. Deci, să încărcăm modelul dintr-un checkpoint și să nu facem nicio actualizare de greutăți, și să vedem unde primim o valoare `nan`:
+
+```py
+model = TFAutoModelForSequenceClassification.from_pretrained(model_checkpoint)
+model(batch)
+```
+
+Când rulăm asta, primim:
+
+```py out
+TFSequenceClassifierOutput(loss=<tf.Tensor: shape=(16,), dtype=float32, numpy=
+array([0.6844486 ,        nan,        nan, 0.67127866, 0.7068601 ,
+              nan, 0.69309855,        nan, 0.65531296,        nan,
+              nan,        nan, 0.675402  ,        nan,        nan,
+       0.69831556], dtype=float32)>, logits=<tf.Tensor: shape=(16, 2), dtype=float32, numpy=
+array([[-0.04761693, -0.06509043],
+       [-0.0481936 , -0.04556257],
+       [-0.0040929 , -0.05848458],
+       [-0.02417453, -0.0684005 ],
+       [-0.02517801, -0.05241832],
+       [-0.04514256, -0.0757378 ],
+       [-0.02656011, -0.02646275],
+       [ 0.00766164, -0.04350497],
+       [ 0.02060014, -0.05655622],
+       [-0.02615328, -0.0447021 ],
+       [-0.05119278, -0.06928903],
+       [-0.02859691, -0.04879177],
+       [-0.02210129, -0.05791225],
+       [-0.02363213, -0.05962167],
+       [-0.05352269, -0.0481673 ],
+       [-0.08141848, -0.07110836]], dtype=float32)>, hidden_states=None, attentions=None)
+```
+
+*Acum* ajungem undeva! Nu există valori `nan` în logit-urile noastre, ceea ce este liniștitor. Dar vedem câteva valori `nan` în loss-ul nostru! Există ceva special despre acele eșantioane în particular care cauzează această problemă? Să vedem care sunt (rețineți că dacă rulați acest cod voi înșivă, ați putea primi indici diferiți deoarece setul de date a fost amestecat):
+
+```python
+import numpy as np
+
+loss = model(batch).loss.numpy()
+indices = np.flatnonzero(np.isnan(loss))
+indices
+```
+
+```python out
+array([ 1,  2,  5,  7,  9, 10, 11, 13, 14])
+```
+
+Să ne uităm la eșantioanele din care au venit acești indici:
+
+```python
+input_ids = batch["input_ids"].numpy()
+input_ids[indices]
+```
+
+```python out
+array([[  101,  2007,  2032, ...,     0,     0,     0],
+       [  101,  1998,  6814, ...,     0,     0,     0],
+       [  101,  1998,  2007, ...,     0,     0,     0],
+       ...,
+       [  101, 13543,  1999, ...,     0,     0,     0]])
+```
+
+Ei bine, există multe aici, dar nimic nu iese în evidență ca fiind neobișnuit. Să ne uităm la etichete:
+
+```python out
+labels = batch['labels'].numpy()
+labels[indices]
+```
+
+```python out
+array([2, 2, 2, 2, 2, 2, 2, 2, 2])
+```
+
+Ah! Eșantioanele `nan` au toate aceeași etichetă, și este eticheta 2. Aceasta este un indiciu foarte puternic. Faptul că primim doar un loss de `nan` când eticheta noastră este 2 sugerează că acesta este un moment foarte bun pentru a verifica numărul de etichete în modelul nostru:
+
+```python
+model.config.num_labels
+```
+
+```python out
+2
+```
+
+Acum vedem problema: modelul crede că sunt doar două clase, dar etichetele merg până la 2, ceea ce înseamnă că există de fapt trei clase (deoarece 0 este de asemenea o clasă). Așa am primit un `nan` -- prin încercarea de a calcula loss-ul pentru o clasă inexistentă! Să încercăm să schimbăm asta și să încadrăm din nou modelul:
+
+```
+model = TFAutoModelForSequenceClassification.from_pretrained(model_checkpoint, num_labels=3)
+model.compile(optimizer='adam')
+model.fit(train_dataset)
+```
+
+```python out
+  869/24543 [>.............................] - ETA: 15:29 - loss: 1.1032
+```
+
+Antrenăm! Nu mai sunt `nan`-uri, și loss-ul nostru scade... cumva. Dacă îl urmăriți pentru o vreme, ați putea începe să deveniți puțin nerăbdători, deoarece valoarea loss-ului rămâne încăpățânat de mare. Să oprim antrenamentul aici și să încercăm să ne gândim la ce ar putea cauza această problemă. În acest punct, suntem destul de siguri că atât datele cât și modelul sunt în regulă, dar modelul nostru nu învață bine. Ce altceva rămâne? Este timpul să...
+
+### Verificați hiperparametrii voștri[[verificati-hiperparametrii-vostri]]
+
+Dacă vă uitați înapoi la codul de mai sus, ați putea să nu puteți vedea niciun hiperparametru deloc, în afară de poate `batch_size`, și acela nu pare un vinovat probabil. Nu vă lăsați înșelați, totuși; întotdeauna există hiperparametri, și dacă nu îi puteți vedea, înseamnă doar că nu știți la ce sunt setați. În particular, amintiți-vă un lucru critic despre Keras: dacă setați un loss, optimizator, sau funcție de activare cu un string, _toate argumentele sale vor fi setate la valorile lor implicite_. Aceasta înseamnă că deși folosirea string-urilor pentru aceasta este foarte convenabilă, ar trebui să fiți foarte atenți când o faceți, deoarece poate ascunde ușor lucruri critice de la voi. (Oricine încearcă provocarea opțională de mai sus ar trebui să ia notă cu atenție de acest fapt.)
+
+În acest caz, unde am setat un argument cu un string? Setăm optimizatorul cu un string. Ar putea ascunde asta ceva de la noi? Să aruncăm o privire la [argumentele sale](https://www.tensorflow.org/api_docs/python/tf/keras/optimizers/Adam).
+
+Iese ceva în evidență aici? Exact -- rata de învățare! Când folosim doar string-ul `'adam'`, vom primi rata de învățare implicită, care este 0.001, sau 1e-3. Aceasta este mult prea mare pentru un model Transformer! În general, recomandăm să încercați rate de învățare între 1e-5 și 1e-4 pentru modelele voastre; aceasta este undeva între de 10X și 100X mai mică decât valoarea pe care o folosim de fapt aici. Sună a o problemă majoră, așa că să încercăm să o reducem. Pentru a face asta, trebuie să importăm obiectul `optimizer` real. În timp ce suntem la asta, să reinițializăm modelul din checkpoint, în cazul în care antrenamentul cu rata de învățare mare i-a deteriorat greutățile:
+
+```python
+from tensorflow.keras.optimizers import Adam
+
+model = TFAutoModelForSequenceClassification.from_pretrained(model_checkpoint)
+model.compile(optimizer=Adam(5e-5))
+```
+
+<Tip>
+
+💡 Puteți de asemenea importa funcția `create_optimizer()` din 🤗 Transformers, care vă va da un optimizator AdamW cu weight decay corect precum și warmup și decay pentru rata de învățare. Acest optimizator va produce adesea rezultate puțin mai bune decât cele pe care le obțineți cu optimizatorul Adam implicit.
+
+</Tip>
+
+Acum, putem încerca să încadrăm modelul cu noua rată de învățare îmbunătățită:
+
+```python
+model.fit(train_dataset)
+```
+
+```python out
+319/24543 [..............................] - ETA: 16:07 - loss: 0.9718
+```
+
+Acum loss-ul nostru chiar merge undeva! Antrenamentul pare în sfârșit că funcționează. Există o lecție aici: când modelul vostru rulează dar loss-ul nu scade, și sunteți siguri că datele voastre sunt în regulă, este o idee bună să verificați hiperparametri ca rata de învățare și weight decay. Setarea oricăruia dintre acestea prea mare este foarte probabil să cauzeze antrenamentul să "stagneze" la o valoare mare de loss.
+
+## Alte probleme potențiale[[alte-probleme-potentiale]]
+
+Am acoperit problemele din scriptul de mai sus, dar există mai multe erori comune cu care v-ați putea confrunta. Să aruncăm o privire la o listă (foarte incompletă).
+
+### Gestionarea erorilor out-of-memory[[gestionarea-erorilor-out-of-memory]]
+
+Semnul revelator al rămânerii fără memorie este o eroare ca "OOM when allocating tensor" -- OOM este prescurtare pentru "out of memory". Aceasta este o problemă foarte comună când aveți de-a face cu modele de limbă mari. Dacă întâlniți aceasta, o strategie bună este să vă înjumătățiți dimensiunea batch-ului și să încercați din nou. Rețineți, totuși, că unele modele sunt *foarte* mari. De exemplu, GPT-2 complet are 1.5B parametri, ceea ce înseamnă că veți avea nevoie de 6 GB de memorie doar pentru a stoca modelul, și încă 6 GB pentru gradienții săi! Antrenamentul modelului GPT-2 complet va necesita de obicei peste 20 GB de VRAM indiferent de dimensiunea batch-ului pe care îl folosiți, pe care doar câteva GPU-uri îl au. Modele mai ușoare cum ar fi `distilbert-base-cased` sunt mult mai ușor de rulat, și se antrenează mult mai rapid de asemenea.
+
+<Tip>
+
+În următoarea parte a cursului, vom examina tehnici mai avansate care vă pot ajuta să reduceți amprenta de memorie și să vă permită să ajustați fin cele mai mari modele.
+
+</Tip>
+
+### TensorFlow flămând flămând 🦛[[tensorflow-flamand-flamand]]
+
+O particularitate specifică a TensorFlow de care ar trebui să fiți conștienți este că alocă *toată* memoria GPU pentru sine de îndată ce încărcați un model sau faceți orice antrenament, și apoi împarte acea memorie după cum este necesar. Aceasta este diferită de comportamentul altor framework-uri, cum ar fi PyTorch, care alocă memorie după cum este necesar cu CUDA în loc să o facă intern. Un avantaj al abordării TensorFlow este că poate da adesea erori utile când rămâneți fără memorie, și se poate recupera din acea stare fără să strice întregul kernel CUDA. Dar există de asemenea un dezavantaj important: dacă rulați două procese TensorFlow simultan, atunci **o să aveți probleme**.
+
+Dacă rulați pe Colab nu trebuie să vă faceți griji pentru aceasta, dar dacă rulați local aceasta este cu siguranță ceva de care ar trebui să fiți atenți. În particular, fiți conștienți că închiderea unei file de notebook nu închide neapărat acel notebook! Ați putea fi nevoiți să selectați notebook-urile care rulează (cele cu o iconiță verde) și să le închideți manual în listarea de directoare. Orice notebook care rula și folosea TensorFlow ar putea să țină încă o grămadă din memoria GPU, și aceasta înseamnă că orice notebook nou pe care îl porniți ar putea întâlni probleme foarte ciudate.
+
+Dacă începeți să primiți erori despre CUDA, BLAS, sau cuBLAS în cod care funcționa înainte, aceasta este adesea de vină. Puteți folosi o comandă cum ar fi `nvidia-smi` pentru a verifica -- când închideți sau reporniți notebook-ul curent, este cea mai multă memorie liberă, sau este încă în uz? Dacă este încă în uz, altceva o ține!
+
+### Verificați din nou datele voastre![[verificati-din-nou-datele-voastre]]
+
+Modelul vostru va învăța ceva doar dacă este de fapt posibil să învețe ceva din datele voastre. Dacă există o eroare care corupe datele sau etichetele sunt atribuite aleatoriu, este foarte probabil că nu veți obține niciun antrenament de model pe setul vostru de date. Un instrument util aici este `tokenizer.decode()`. Aceasta va transforma `input_ids` înapoi în string-uri, așa că puteți vizualiza datele și vedea dacă datele voastre de antrenament învață ceea ce vreți să învețe. De exemplu, după ce obțineți un `batch` din `tf.data.Dataset`-ul vostru cum am făcut mai sus, puteți decoda primul element astfel:
+
+```py
+input_ids = batch["input_ids"].numpy()
+tokenizer.decode(input_ids[0])
+```
+
+Apoi puteți să îl comparați cu prima etichetă, astfel:
+
+```py
+labels = batch["labels"].numpy()
+label = labels[0]
+```
+
+Odată ce puteți vizualiza datele voastre în acest mod, vă puteți întreba următoarele întrebări:
+
+- Sunt datele decodate înțelegibile?
+- Sunteți de acord cu etichetele?
+- Există o etichetă care este mai comună decât altele?
+- Care ar trebui să fie loss-ul/metrica dacă modelul ar prezice un răspuns aleatoriu/întotdeauna același răspuns?
+
+După ce vă uitați la datele voastre, treceți prin câteva dintre predicțiile modelului -- dacă modelul vostru scoate tokenuri, încercați să le decodați și pe acelea! Dacă modelul prezice întotdeauna același lucru, ar putea fi pentru că setul vostru de date este părtinitor către o categorie (pentru problemele de clasificare), așa că tehnici precum supraesantionarea claselor rare ar putea ajuta. Alternativ, aceasta poate fi de asemenea cauzată de probleme de antrenament cum ar fi setări proaste de hiperparametri.
+
+Dacă loss-ul/metrica pe care o obțineți pe modelul vostru inițial înainte de orice antrenament este foarte diferită de loss-ul/metrica pe care ați aștepta-o pentru predicții aleatorii, verificați din nou modul în care loss-ul sau metrica voastră este calculată, deoarece probabil există o eroare acolo. Dacă folosiți mai multe loss-uri pe care le adăugați la sfârșit, asigurați-vă că sunt de aceeași scară.
+
+Când sunteți siguri că datele voastre sunt perfecte, puteți vedea dacă modelul este capabil să se antreneze pe ele cu un test simplu.
+
+### Supraajustați modelul vostru pe un batch[[supraajustati-modelul-vostru-pe-un-batch]]
+
+Supraajustarea este de obicei ceva pe care încercăm să îl evităm când antrenăm, deoarece înseamnă că modelul nu învață să recunoască caracteristicile generale pe care vrem să le recunoască, ci în schimb doar memorează eșantioanele de antrenament. Cu toate acestea, încercarea de a vă antrena modelul pe un batch din nou și din nou este un test bun pentru a verifica dacă problema așa cum ați formulat-o poate fi rezolvată de modelul pe care încercați să îl antrenați. De asemenea, vă va ajuta să vedeți dacă rata voastră de învățare inițială este prea mare.
+
+Făcând aceasta odată ce ați definit `model`-ul vostru este foarte ușor; doar luați un batch de date de antrenament, apoi tratați acel `batch` ca întreg setul vostru de date, antrenând pe el pentru un număr mare de epoci:
+
+```py
+for batch in train_dataset:
+    break
+
+# Asigurați-vă că ați rulat model.compile() și ați setat optimizatorul,
+# și loss-ul/metricile voastre dacă le folosiți
+
+model.fit(batch, epochs=20)
+```
+
+<Tip>
+
+💡 Dacă datele voastre de antrenament sunt dezechilibrate, asigurați-vă să construiți un batch de date de antrenament care conține toate etichetele.
+
+</Tip>
+
+Modelul rezultat ar trebui să aibă rezultate aproape perfecte pe `batch`, cu un loss care scade rapid către 0 (sau valoarea minimă pentru loss-ul pe care îl folosiți).
+
+Dacă nu reușiți să faceți modelul vostru să obțină rezultate perfecte ca aceasta, înseamnă că există ceva greșit cu modul în care ați formulat problema sau datele voastre, așa că ar trebui să reparați asta. Doar când reușiți să treceți testul de supraajustare puteți fi siguri că modelul vostru poate învăța de fapt ceva.
+
+<Tip warning={true}>
+
+⚠️ Va trebui să vă recreați modelul și să recompilați după acest test de supraajustare, deoarece modelul obținut probabil nu va putea să se recupereze și să învețe ceva util pe setul vostru complet de date.
+
+</Tip>
+
+### Nu ajustați nimic până nu aveți o primă linie de bază[[nu-ajustati-nimic-pana-nu-aveti-o-prima-linie-de-baza]]
+
+Ajustarea intensă a hiperparametrilor este întotdeauna subliniată ca fiind partea cea mai grea a machine learning-ului, dar este doar ultimul pas pentru a vă ajuta să câștigați puțin la metrică. Valori *foarte* proaste pentru hiperparametrii voștri, cum ar fi folosirea ratei de învățare implicite Adam de 1e-3 cu un model Transformer, vor face învățarea să procedeze foarte lent sau să stagneze complet, desigur, dar majoritatea timpului hiperparametri "rezonabili", cum ar fi o rată de învățare de la 1e-5 la 5e-5, vor funcționa bine pentru a vă da rezultate bune. Deci, nu vă lansați într-o căutare de hiperparametri consumatoare de timp și costisitoare până nu aveți ceva care bate linia de bază pe care o aveți pe setul vostru de date.
+
+Odată ce aveți un model suficient de bun, puteți începe să ajustați puțin. Nu încercați să lansați o mie de rulări cu hiperparametri diferiți, ci comparați câteva rulări cu valori diferite pentru un hiperparametru pentru a avea o idee despre care are cel mai mare impact.
+
+Dacă ajustați modelul în sine, păstrați-l simplu și nu încercați nimic pe care nu îl puteți justifica în mod rezonabil. Asigurați-vă întotdeauna că vă întoarceți la testul de supraajustare pentru a verifica că schimbarea voastră nu a avut consecințe neintenționate.
+
+### Cereți ajutor[[cereti-ajutor]]
+
+Sperăm că veți fi găsit câteva sfaturi în această secțiune care v-au ajutat să vă rezolvați problema, dar dacă nu este cazul, amintiți-vă că puteți întotdeauna să cereți comunității pe [forumuri](https://discuss.huggingface.co/).
+
+Iată câteva resurse suplimentare care se pot dovedi utile:
+
+- ["Reproducibility as a vehicle for engineering best practices"](https://docs.google.com/presentation/d/1yHLPvPhUs2KGI5ZWo0sU-PKU3GimAk3iTsI38Z-B5Gw/edit#slide=id.p) de Joel Grus
+- ["Checklist for debugging neural networks"](https://towardsdatascience.com/checklist-for-debugging-neural-networks-d8b2a9434f21) de Cecelia Shao
+- ["How to unit test machine learning code"](https://medium.com/@keeper6928/how-to-unit-test-machine-learning-code-57cf6fd81765) de Chase Roberts
+- ["A Recipe for Training Neural Networks"](http://karpathy.github.io/2019/04/25/recipe/) de Andrej Karpathy
+
+Desigur, nu fiecare problemă pe care o întâlniți când antrenați rețele neuronale este vina voastră! Dacă întâlniți ceva în biblioteca 🤗 Transformers sau 🤗 Datasets care nu pare corect, s-ar putea să fi întâlnit o eroare. Ar trebui cu siguranță să ne spuneți totul despre aceasta, și în secțiunea următoare vă vom explica exact cum să faceți asta. 
\ No newline at end of file
diff --git a/chapters/rum/chapter8/5.mdx b/chapters/rum/chapter8/5.mdx
new file mode 100644
index 000000000..6937b9a7e
--- /dev/null
+++ b/chapters/rum/chapter8/5.mdx
@@ -0,0 +1,91 @@
+# Cum să scrieți un issue bun[[cum-sa-scrieti-un-issue-bun]]
+
+<CourseFloatingBanner chapter={8}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter8/section5.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter8/section5.ipynb"},
+]} />
+
+Când întâlniți ceva care nu pare corect cu una dintre bibliotecile Hugging Face, ar trebui cu siguranță să ne spuneți astfel încât să o putem repara (același lucru se aplică pentru orice bibliotecă open source, de altfel). Dacă nu sunteți complet siguri dacă bug-ul se află în propriul vostru cod sau într-una dintre bibliotecile noastre, primul loc de verificat sunt [forumurile](https://discuss.huggingface.co/). Comunitatea vă va ajuta să clarificați acest lucru, și echipa Hugging Face urmărește de asemenea îndeaproape discuțiile de acolo.
+
+<Youtube id="_PAli-V4wj0"/>
+
+Când sunteți siguri că aveți un bug în mână, primul pas este să construiți un exemplu minimal reproductibil.
+
+## Crearea unui exemplu minimal reproductibil[[crearea-unui-exemplu-minimal-reproductibil]]
+
+Este foarte important să izolați bucata de cod care produce bug-ul, deoarece nimeni din echipa Hugging Face nu este magician (încă), și nu pot repara ceea ce nu pot vedea. Un exemplu minimal reproductibil ar trebui, așa cum indică numele, să fie reproductibil. Aceasta înseamnă că nu ar trebui să se bazeze pe niciun fișier extern sau date pe care le-ați putea avea. Încercați să înlocuiți datele pe care le folosiți cu niște valori fictive care arată ca cele reale și încă produc aceeași eroare.
+
+<Tip>
+
+🚨 Multe probleme din repository-ul 🤗 Transformers sunt nerezolvate deoarece datele folosite pentru a le reproduce nu sunt accesibile.
+
+</Tip>
+
+Odată ce aveți ceva care este autonom, puteți încerca să îl reduceți la și mai puține linii de cod, construind ceea ce numim un _exemplu minimal reproductibil_. Deși aceasta necesită puțină muncă suplimentară din partea voastră, veți fi aproape garantat să primiți ajutor și o reparație dacă furnizați un reproductor de bug frumos și scurt.
+
+Dacă vă simțiți suficient de confortabil, mergeți să inspectați codul sursă unde se întâmplă bug-ul vostru. Ați putea găsi o soluție la problema voastră (caz în care puteți chiar sugera un pull request pentru a o repara), dar mai general, aceasta poate ajuta întreținătorii să înțeleagă mai bine sursa când citesc raportul vostru.
+
+## Completarea șablonului de issue[[completarea-sablonului-de-issue]]
+
+Când depuneți un issue, veți observa că există un șablon de completat. Vom urma pe cel pentru [problemele 🤗 Transformers](https://github.com/huggingface/transformers/issues/new/choose) aici, dar același tip de informații va fi necesar dacă raportați o problemă într-un alt repository. Nu lăsați șablonul gol: luarea timpului pentru a-l completa va maximiza șansele voastre de a primi un răspuns și de a vă rezolva problema.
+
+În general, când depuneți un issue, rămâneți întotdeauna curtenitori. Acesta este un proiect open source, deci folosiți software gratuit, și nimeni nu are nicio obligație să vă ajute. Puteți include ceea ce simțiți că este critică justificată în problema voastră, dar atunci întreținătorii s-ar putea să o ia prost și să nu se grăbească să vă ajute. Asigurați-vă că citiți [codul de conduită](https://github.com/huggingface/transformers/blob/master/CODE_OF_CONDUCT.md) al proiectului.
+
+### Includerea informațiilor despre mediul vostru[[includerea-informatiilor-despre-mediul-vostru]]
+
+🤗 Transformers oferă un utilitar pentru a obține toate informațiile de care avem nevoie despre mediul vostru. Doar tastați următoarele în terminalul vostru:
+
+```
+transformers-cli env
+```
+
+și ar trebui să obțineți ceva ca aceasta:
+
+```out
+Copy-and-paste the text below in your GitHub issue and FILL OUT the two last points.
+
+- `transformers` version: 4.12.0.dev0
+- Platform: Linux-5.10.61-1-MANJARO-x86_64-with-arch-Manjaro-Linux
+- Python version: 3.7.9
+- PyTorch version (GPU?): 1.8.1+cu111 (True)
+- Tensorflow version (GPU?): 2.5.0 (True)
+- Flax version (CPU?/GPU?/TPU?): 0.3.4 (cpu)
+- Jax version: 0.2.13
+- JaxLib version: 0.1.65
+- Using GPU in script?: <fill in>
+- Using distributed or parallel set-up in script?: <fill in>
+```
+
+Puteți de asemenea adăuga un `!` la începutul comenzii `transformers-cli env` pentru a o executa dintr-o celulă de notebook, și apoi să copiați și lipiți rezultatul la începutul problemei voastre.
+
+### Etichetarea persoanelor[[etichetarea-persoanelor]]
+
+Etichetarea persoanelor prin tastarea unui `@` urmat de handle-ul lor GitHub le va trimite o notificare astfel încât să vă vadă problema și ar putea răspunde mai repede. Folosiți aceasta cu moderație, deoarece persoanele pe care le etichetați s-ar putea să nu aprecieze să fie notificate dacă este ceva cu care nu au nicio legătură directă. Dacă v-ați uitat la fișierele sursă legate de bug-ul vostru, ar trebui să etichetați ultima persoană care a făcut modificări la linia pe care credeți că este responsabilă pentru problema voastră (puteți găsi această informație uitându-vă la acea linie pe GitHub, selectând-o, apoi făcând clic pe "View git blame").
+
+Altfel, șablonul oferă sugestii de persoane de etichetat. În general, nu etichetați niciodată mai mult de trei persoane!
+
+### Includerea unui exemplu reproductibil[[includerea-unui-exemplu-reproductibil]]
+
+Dacă ați reușit să creați un exemplu autonom care produce bug-ul, acum este momentul să îl includeți! Tastați o linie cu trei backtick-uri urmată de `python`, astfel:
+
+```
+```python
+```
+
+apoi lipiți exemplul vostru minimal reproductibil și tastați o linie nouă cu trei backtick-uri. Aceasta va asigura că codul vostru este formatat corespunzător.
+
+Dacă nu ați reușit să creați un exemplu reproductibil, explicați în pași clari cum ați ajuns la problema voastră. Includeți un link către un notebook Google Colab unde ați primit eroarea dacă puteți. Cu cât mai multe informații partajați, cu atât mai bine vor putea întreținătorii să vă răspundă.
+
+În toate cazurile, ar trebui să copiați și să lipiți întregul mesaj de eroare pe care îl primiți. Dacă lucrați în Colab, amintiți-vă că unele dintre frame-uri pot fi comprimate automat în stack trace, așa că asigurați-vă că le extindeți înainte de copiere. Ca și cu exemplul de cod, puneți acel mesaj de eroare între două linii cu trei backtick-uri, astfel încât să fie formatat corespunzător.
+
+### Descrierea comportamentului așteptat[[descrierea-comportamentului-asteptat]]
+
+Explicați în câteva linii ce ați așteptat să obțineți, astfel încât întreținătorii să înțeleagă complet problema. Această parte este în general destul de evidentă, așa că ar trebui să încapă într-o propoziție, dar în unele cazuri ați putea avea multe de spus.
+
+## Și apoi ce?[[si-apoi-ce]]
+
+Odată ce problema voastră este depusă, asigurați-vă să verificați rapid că totul arată în regulă. Puteți edita problema dacă ați făcut o greșeală, sau chiar să îi schimbați titlul dacă realizați că problema este diferită de ceea ce ați gândit inițial.
+
+Nu are sens să faceți ping la oameni dacă nu primiți un răspuns. Dacă nimeni nu vă ajută în câteva zile, este probabil că nimeni nu a putut înțelege problema voastră. Nu ezitați să vă întoarceți la exemplul reproductibil. Îl puteți face mai scurt și mai la obiect? Dacă nu primiți un răspuns într-o săptămână, puteți lăsa un mesaj cerând cu blândețe ajutor, mai ales dacă v-ați editat problema pentru a include mai multe informații despre problemă. 
\ No newline at end of file
diff --git a/chapters/rum/chapter8/6.mdx b/chapters/rum/chapter8/6.mdx
new file mode 100644
index 000000000..d05487204
--- /dev/null
+++ b/chapters/rum/chapter8/6.mdx
@@ -0,0 +1,12 @@
+# Partea 2 completă![[partea-2-completa]]
+
+<CourseFloatingBanner
+    chapter={8}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+Felicitări, ați ajuns la sfârșitul celei de-a doua părți a cursului! Lucrăm activ la cea de-a treia, așa că abonați-vă la [newsletter-ul](https://huggingface.curated.co/) nostru pentru a vă asigura că nu îi ratați lansarea.
+
+Ar trebui să puteți acum să abordați o gamă largă de sarcini NLP și să ajustați fin sau să preantrenați un model pe ele. Nu uitați să vă partajați rezultatele cu comunitatea pe [Model Hub](https://huggingface.co/models).
+
+Abia așteptăm să vedem ce veți construi cu cunoștințele pe care le-ați câștigat! 
\ No newline at end of file
diff --git a/chapters/rum/chapter8/7.mdx b/chapters/rum/chapter8/7.mdx
new file mode 100644
index 000000000..7488ab262
--- /dev/null
+++ b/chapters/rum/chapter8/7.mdx
@@ -0,0 +1,204 @@
+<!-- DISABLE-FRONTMATTER-SECTIONS -->
+
+# Quiz de sfârșit de capitol[[quiz-de-sfarsit-de-capitol]]
+
+<CourseFloatingBanner
+    chapter={8}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+Să testăm ce ați învățat în acest capitol!
+
+### 1. În ce ordine ar trebui să citiți un traceback Python?
+
+<Question
+	choices={[
+		{
+			text: "De sus în jos",
+			explain: "Încercați din nou -- deși majoritatea celorlalte limbaje de programare afișează excepția în partea de sus, Python este special în această privință."
+		},
+		{
+			text: "De jos în sus",
+			explain: "Corect! Un avantaj al traceback-urilor Python care arată excepția în partea de jos este că este mai ușor de depanat când lucrați în terminal și aceasta este ultima linie pe care o vedeți.",
+			correct: true
+		}
+	]}
+/>
+
+### 2. Ce este un exemplu minimal reproductibil?
+
+<Question
+	choices={[
+		{
+			text: "O implementare simplă a unei arhitecturi Transformer dintr-un articol de cercetare",
+			explain: "Deși este foarte educativ să implementați propriile modele Transformer de la zero, nu despre asta vorbim aici."
+		},
+		{
+			text: "Un bloc de cod compact și autonom care poate fi rulat fără nicio dependență externă de fișiere sau date private",
+			explain: "Corect! Exemplele minimale reproductibile îi ajută pe întreținătorii bibliotecii să reproducă problema pe care o aveți, astfel încât să poată găsi soluții mai rapid.",
+			correct: true
+		},
+		{
+			text: "O captură de ecran a traceback-ului Python",
+			explain: "Încercați din nou -- deși este tentant să includeți o captură de ecran a erorii cu care vă confruntați când depuneți o problemă, aceasta face foarte dificil pentru alții să reproducă eroarea."
+		},
+		{
+			text: "Un notebook care conține întreaga analiză, inclusiv părți care nu sunt legate de eroare",
+			explain: "Nu chiar -- deși poate fi util să partajați un notebook Google Colab care arată eroarea, asigurați-vă că este scurt și conține doar codul relevant."
+		}
+	]}
+/>
+
+### 3. Să presupunem că încercați să rulați următorul cod, care aruncă o eroare:
+
+```py
+from transformers import GPT3ForSequenceClassification
+
+# ImportError: cannot import name 'GPT3ForSequenceClassification' from 'transformers' (/Users/lewtun/miniconda3/envs/huggingface/lib/python3.8/site-packages/transformers/__init__.py)
+# ---------------------------------------------------------------------------
+# ImportError                               Traceback (most recent call last)
+# /var/folders/28/k4cy5q7s2hs92xq7_h89_vgm0000gn/T/ipykernel_30848/333858878.py in <module>
+# ----> 1 from transformers import GPT3ForSequenceClassification
+
+# ImportError: cannot import name 'GPT3ForSequenceClassification' from 'transformers' (/Users/lewtun/miniconda3/envs/huggingface/lib/python3.8/site-packages/transformers/__init__.py)
+```
+
+Care dintre următoarele ar putea fi o alegere bună pentru titlul unui subiect pe forum pentru a cere ajutor?
+
+<Question
+	choices={[
+		{
+			text: "<code>ImportError: cannot import name 'GPT3ForSequenceClassification' from 'transformers' (/Users/lewtun/miniconda3/envs/huggingface/lib/python3.8/site-packages/transformers/__init__.py)</code>",
+			explain: "Includerea ultimei linii a traceback-ului poate fi descriptivă, dar aceasta este mai bine rezervată pentru corpul principal al subiectului. Încercați din nou!"
+		},
+		{
+			text: "Problemă cu <code>from transformers import GPT3ForSequenceClassification</code>",
+			explain: "Încercați din nou -- deși aceasta oferă informații utile, probabil este cel mai bine rezervată pentru corpul principal al textului.",
+		},
+		{
+			text: "De ce nu pot importa <code>GPT3ForSequenceClassification</code>?",
+			explain: "Alegere bună! Acest titlu este concis și îi dă cititorului un indiciu despre ce ar putea fi greșit (adică că GPT-3 nu este suportat în 🤗 Transformers).",
+			correct: true
+		},
+		{
+			text: "Este GPT-3 suportat în 🤗 Transformers?",
+			explain: "Bună alegere! Folosirea întrebărilor ca titluri de subiecte este o modalitate excelentă de a comunica problema comunității.",
+			correct: true
+		}
+	]}
+/>
+
+### 4. Să presupunem că ați încercat să rulați `trainer.train()` și vă confruntați cu o eroare criptică care nu vă spune exact de unde vine eroarea. Care dintre următoarele este primul loc unde ar trebui să căutați erori în pipeline-ul vostru de antrenament?
+
+<Question
+	choices={[
+		{
+			text: "Pasul de optimizare unde calculăm gradienții și efectuăm backpropagation",
+			explain: "Deși pot exista bug-uri în optimizatorul vostru, acesta este de obicei la mai mulți pași în pipeline-ul de antrenament, așa că există alte lucruri de verificat mai întâi. Încercați din nou!"
+		},
+		{
+			text: "Pasul de evaluare unde calculăm metricile",
+			explain: "Evaluarea este de obicei ceea ce faceți după antrenament pentru o epocă completă, așa că ar trebui să verificați mai întâi undeva mai devreme în pipeline-ul de antrenament."
+		},
+		{
+			text: "Seturile de date",
+			explain: "Corect! Privirea la datele voastre este aproape întotdeauna primul lucru pe care ar trebui să îl faceți, pentru a vă asigura că textul este codificat corespunzător, are caracteristicile așteptate, și așa mai departe.",
+			correct: true
+		},
+		{
+			text: "Dataloader-ele",
+			explain: "Încercați din nou -- aceasta este foarte aproape de primul lucru pe care ar trebui să îl verificați. Vă amintiți ce obiect transmitem la dataloader-e?"
+		}
+	]}
+/>
+
+### 5. Care este cea mai bună modalitate de a depana o eroare CUDA?
+
+<Question
+	choices={[
+		{
+			text: "Postați mesajul de eroare pe forumuri sau GitHub.",
+			explain: "Asta nu va ajuta pe nimeni deoarece mesajele de eroare CUDA sunt de obicei foarte neinformative."
+		},
+		{
+			text: "Executați același cod pe CPU.",
+			explain: "Exact, asta ar trebui să vă dea un mesaj de eroare mai bun!",
+			correct: true
+		},
+		{
+			text: "Citiți traceback-ul pentru a afla ce a cauzat eroarea.",
+			explain: "Asta este ceea ce ați face pentru orice altă eroare, dar erorile CUDA nu sunt de obicei ridicate unde s-au întâmplat deoarece majoritatea operațiilor CUDA sunt asincrone."
+		},
+		{
+			text: "Reduceți dimensiunea batch-ului.",
+			explain: "Reducerea dimensiunii batch-ului este de obicei o strategie bună pentru gestionarea erorilor CUDA out-of-memory, dar nu pentru această problemă particulară. Încercați din nou!"
+		},
+		{
+			text: "Reporniți kernel-ul Jupyter.",
+			explain: "Încercați din nou -- repornirea kernel-ului nu va face eroarea să dispară prin magie!",
+		}
+	]}
+/>
+
+### 6. Care este cea mai bună modalitate de a face ca o problemă pe GitHub să fie reparată?
+
+<Question
+	choices={[
+		{
+			text: "Postați un exemplu complet reproductibil al bug-ului.",
+			explain: "Da, aceasta este cea mai bună modalitate de a îi ajuta pe întreținători să găsească bug-ul vostru. Ce altceva ar trebui să faceți?",
+			correct: true
+		},
+		{
+			text: "Cereți în fiecare zi o actualizare.",
+			explain: "Este puțin probabil să vă aducă ajutor; oamenii probabil vă vor ignora mai mult.",
+		},
+		{
+			text: "Inspectați codul sursă din jurul bug-ului și încercați să găsiți motivul pentru care se întâmplă. Postați rezultatele în problemă.",
+			explain: "Asta îi va ajuta cu siguranță pe întreținători! Și dacă găsiți sursa bug-ului și o reparație, puteți chiar deschide un pull request. Ce altceva ar trebui să faceți?",
+			correct: true
+		}
+	]}
+/>
+
+### 7. De ce este supraajustarea pe un batch de obicei o tehnică bună de depanare?
+
+<Question
+	choices={[
+		{
+			text: "Nu este; supraajustarea este întotdeauna rea și ar trebui evitată.",
+			explain: "Când antrenați pe întregul set de date, supraajustarea poate într-adevăr fi un semn că modelul vostru nu se va generaliza bine la exemple noi. Pentru depanare, totuși, nu antrenăm de obicei pe întregul set de date. Încercați din nou!"
+		},
+		{
+			text: "Ne permite să verificăm că modelul este capabil să reducă loss-ul la zero.",
+			explain: "Corect! Cu un batch mic cu doar două exemple, putem verifica rapid dacă modelul este capabil să învețe.",
+			correct: true
+		},
+		{
+			text: "Ne permite să verificăm că formele tensorilor intrărilor și etichetelor noastre sunt corecte.",
+			explain: "Încercați din nou -- dacă formele tensorilor voștri sunt dezalinate, atunci cu siguranță nu veți putea antrena, nici măcar pe un singur batch.",
+		}
+	]}
+/>
+
+### 8. De ce este o idee bună să includeți detalii despre mediul vostru de calcul cu `transformers-cli env` când creați o problemă nouă în repository-ul 🤗 Transformers?
+
+<Question
+	choices={[
+		{
+			text: "Le permite întreținătorilor să înțeleagă ce versiune a bibliotecii folosiți.",
+			explain: "Corect! Deoarece fiecare versiune majoră a bibliotecii poate avea modificări în API, știind ce versiune specifică folosiți poate ajuta la restrângerea problemei. Care sunt celelalte beneficii?",
+			correct: true
+		},
+		{
+			text: "Le permite întreținătorilor să știe dacă rulați cod pe Windows, macOS sau Linux.",
+			explain: "Corect! Erorile pot fi uneori cauzate de sistemul de operare specific pe care îl folosiți, și știind acest lucru îi ajută pe întreținători să le reproducă local. Dar aceasta nu este singura cauză.",
+			correct: true
+		},
+		{
+			text: "Le permite întreținătorilor să știe dacă rulați cod pe un GPU sau CPU.",
+			explain: "Corect! Așa cum am văzut în acest capitol, codul rulat pe GPU-uri sau CPU-uri poate produce rezultate sau erori diferite, și știind ce hardware folosiți poate ajuta la concentrarea atenției întreținătorilor. Dar aceasta nu este singurul beneficiu...",
+			correct: true
+		}
+	]}
+/> 
\ No newline at end of file

From 6a2e1f594799319de201e354a1cd508edb08940d Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Thu, 29 May 2025 17:51:50 +0300
Subject: [PATCH 127/167] feat: add chapter 9 transalted content for rum folder

---
 chapters/rum/_toctree.yml   |  23 ++++
 chapters/rum/chapter9/1.mdx |  37 ++++++
 chapters/rum/chapter9/2.mdx | 118 ++++++++++++++++++
 chapters/rum/chapter9/3.mdx | 177 ++++++++++++++++++++++++++
 chapters/rum/chapter9/4.mdx | 147 ++++++++++++++++++++++
 chapters/rum/chapter9/5.mdx |  67 ++++++++++
 chapters/rum/chapter9/6.mdx | 102 +++++++++++++++
 chapters/rum/chapter9/7.mdx | 236 +++++++++++++++++++++++++++++++++++
 chapters/rum/chapter9/8.mdx |  24 ++++
 chapters/rum/chapter9/9.mdx | 239 ++++++++++++++++++++++++++++++++++++
 10 files changed, 1170 insertions(+)
 create mode 100644 chapters/rum/chapter9/1.mdx
 create mode 100644 chapters/rum/chapter9/2.mdx
 create mode 100644 chapters/rum/chapter9/3.mdx
 create mode 100644 chapters/rum/chapter9/4.mdx
 create mode 100644 chapters/rum/chapter9/5.mdx
 create mode 100644 chapters/rum/chapter9/6.mdx
 create mode 100644 chapters/rum/chapter9/7.mdx
 create mode 100644 chapters/rum/chapter9/8.mdx
 create mode 100644 chapters/rum/chapter9/9.mdx

diff --git a/chapters/rum/_toctree.yml b/chapters/rum/_toctree.yml
index 25730606c..1a06a7263 100644
--- a/chapters/rum/_toctree.yml
+++ b/chapters/rum/_toctree.yml
@@ -26,3 +26,26 @@
   - local: chapter1/10
     title: Quiz de final de capitol
     quiz: 1
+
+- title: 9. Construirea și partajarea demo-urilor
+  subtitle: Am antrenat un model, dar cum îl pot prezenta?
+  sections:
+  - local: chapter9/1
+    title: Introducere în Gradio
+  - local: chapter9/2
+    title: Construirea primului tău demo
+  - local: chapter9/3
+    title: Înțelegerea clasei Interface
+  - local: chapter9/4
+    title: Partajarea demo-urilor cu alții
+  - local: chapter9/5
+    title: Integrări cu Hugging Face Hub
+  - local: chapter9/6
+    title: Caracteristici avansate ale Interface
+  - local: chapter9/7
+    title: Introducere în Gradio Blocks
+  - local: chapter9/8
+    title: Gradio, verificat!
+  - local: chapter9/9
+    title: Quiz de final de capitol
+    quiz: 9
diff --git a/chapters/rum/chapter9/1.mdx b/chapters/rum/chapter9/1.mdx
new file mode 100644
index 000000000..1363a4b94
--- /dev/null
+++ b/chapters/rum/chapter9/1.mdx
@@ -0,0 +1,37 @@
+# Introducere în Gradio[[introduction-to-gradio]]
+
+<CourseFloatingBanner
+    chapter={9}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+În acest capitol vom învăța cum să construim **demo-uri interactive** pentru modelele noastre de machine learning.
+
+De ce să construim un demo sau o interfață grafică pentru modelul nostru de machine learning în primul rând? Demo-urile permit:
+
+- **Dezvoltatorilor de machine learning** să își prezinte cu ușurință lucrarea unei audiențe largi, inclusiv echipelor non-tehnice sau clienților
+- **Cercetătorilor** să reproducă mai ușor modelele și comportamentul machine learning
+- **Testerilor de calitate** sau **utilizatorilor finali** să identifice și să depaneze mai ușor punctele de eșec ale modelelor
+- **Utilizatorilor diverși** să descopere prejudecățile algoritmice din modele
+
+Vom folosi biblioteca Gradio pentru a construi demo-uri pentru modelele noastre. Gradio vă permite să construiți, să personalizați și să partajați demo-uri web pentru orice model de machine learning, în întregime în Python.
+
+Iată câteva exemple de demo-uri de machine learning construite cu Gradio:
+
+* Un model de **recunoaștere a schițelor** care primește o schiță și afișează etichete cu ceea ce crede că este desenat:
+
+<iframe src="https://course-demos-draw2.hf.space" frameBorder="0" height="450" title="Gradio app" class="container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
+
+* Un model extractiv de **răspunsuri la întrebări** care primește un paragraf de context și o întrebare și afișează un răspuns și un scor de probabilitate (am discutat despre acest tip de model [în Capitolul 7](/course/chapter7/7)):
+
+<iframe src="https://course-demos-question-answering-simple.hf.space" frameBorder="0" height="640" title="Gradio app" class="container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
+
+* Un model de **eliminare a fundalului** care primește o imagine și afișează imaginea cu fundalul eliminat:
+
+<iframe src="https://course-demos-remove-bg-original.hf.space" frameBorder="0" height="640" title="Gradio app" class="container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
+
+Acest capitol este împărțit în secțiuni care includ atât _concepte_ cât și _aplicații_. După ce învățați conceptul din fiecare secțiune, îl veți aplica pentru a construi un anumit tip de demo, de la clasificarea imaginilor la recunoașterea vocii. Până când terminați acest capitol, veți putea construi aceste demo-uri (și multe altele!) în doar câteva linii de cod Python.
+
+<Tip>
+👀 Consultați <a href="https://huggingface.co/spaces" target="_blank">Hugging Face Spaces</a> pentru a vedea multe exemple recente de demo-uri de machine learning construite de comunitatea machine learning!
+</Tip> 
\ No newline at end of file
diff --git a/chapters/rum/chapter9/2.mdx b/chapters/rum/chapter9/2.mdx
new file mode 100644
index 000000000..a81512834
--- /dev/null
+++ b/chapters/rum/chapter9/2.mdx
@@ -0,0 +1,118 @@
+# Construirea primului tău demo[[building-your-first-demo]]
+
+<CourseFloatingBanner chapter={9}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter9/section2.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter9/section2.ipynb"},
+]} />
+
+Să începem prin instalarea Gradio! Întrucât este un pachet Python, pur și simplu rulează:
+
+`$ pip install gradio `
+
+Puteți rula Gradio oriunde, fie din IDE-ul tău Python preferat, în notebook-urile Jupyter sau chiar în Google Colab 🤯!
+Deci instalați Gradio oriunde rulați Python!
+
+Să începem cu un exemplu simplu "Hello World" pentru a ne familiariza cu sintaxa Gradio:
+
+```py
+import gradio as gr
+
+
+def greet(name):
+    return "Hello " + name
+
+
+demo = gr.Interface(fn=greet, inputs="text", outputs="text")
+
+demo.launch()
+```
+
+Să parcurgem codul de mai sus:
+
+- Primul, definim o funcție numită `greet()`. În acest caz, este o funcție simplă care adaugă "Hello" înaintea numelui tău, dar poate fi *orice* funcție Python în general. De exemplu, în aplicațiile de machine learning, această funcție ar *apela un model pentru a face o predicție* pe o intrare și ar returna ieșirea.
+- Apoi, creăm o `Interface` Gradio cu trei argumente, `fn`, `inputs`, și `outputs`. Aceste argumente definesc funcția de predicție, precum și _tipul_ componentelor de intrare și ieșire pe care le-am dori. În cazul nostru, ambele componente sunt cutii de text simple.
+- Apoi apelăm metoda `launch()` pe `Interface`-ul pe care l-am creat.
+
+Dacă rulați acest cod, interfața de mai jos va apărea automat într-un notebook Jupyter/Colab, sau va apărea într-un browser la **[http://localhost:7860](http://localhost:7860/)** dacă rulează dintr-un script.
+
+<iframe src="https://course-demos-hello-world.hf.space" frameBorder="0" height="250" title="Gradio app" class="container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
+
+Încercați să folosiți această interfață grafică chiar acum cu numele vostru sau cu alte intrări!
+
+Veți observa că în această interfață grafică, Gradio a dedus automat numele parametrului de intrare (`name`)
+și l-a aplicat ca etichetă deasupra cutiei de text. Ce se întâmplă dacă doriți să schimbați asta?
+Sau dacă doriți să personalizați cutia de text în alt fel? În acest caz, puteți
+instanția un obiect de clasă care reprezintă componenta de intrare.
+
+Priviți exemplul de mai jos:
+
+```py
+import gradio as gr
+
+
+def greet(name):
+    return "Hello " + name
+
+
+# Instanțiem clasa Textbox
+textbox = gr.Textbox(label="Tastați numele aici:", placeholder="John Doe", lines=2)
+
+gr.Interface(fn=greet, inputs=textbox, outputs="text").launch()
+```
+
+<iframe src="https://course-demos-hello-world-custom.hf.space" frameBorder="0" height="300" title="Gradio app" class="container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
+
+Aici, am creat o cutie de text de intrare cu o etichetă, un placeholder și un număr setat de linii.
+Ați putea face același lucru pentru cutia de text de ieșire, dar o vom lăsa pentru mai târziu.
+
+Am văzut că cu doar câteva linii de cod, Gradio vă permite să creați o interfață simplă în jurul oricărei funcții
+cu orice tip de intrări sau ieșiri. În această secțiune, am început cu o
+cutie de text simplă, dar în următoarele secțiuni, vom acoperi alte tipuri de intrări și ieșiri. Să aruncăm acum o privire la includerea unor NLP într-o aplicație Gradio.
+
+
+## 🤖 Includerea predicțiilor modelului[[including-model-predictions]]
+
+Să construim acum o interfață simplă care vă permite să demonstrați un model de **generare de text** ca GPT-2.
+
+Vom încărca modelul nostru folosind funcția `pipeline()` din 🤗 Transformers.
+Dacă aveți nevoie de o reîmprospătare rapidă, puteți să vă întoarceți la [acea secțiune din Capitolul 1](/course/chapter1/3#text-generation).
+
+Primul, definim o funcție de predicție care primește un prompt de text și returnează completarea textului:
+
+```py
+from transformers import pipeline
+
+model = pipeline("text-generation")
+
+
+def predict(prompt):
+    completion = model(prompt)[0]["generated_text"]
+    return completion
+```
+
+Această funcție completează prompt-urile pe care le furnizați, și puteți să o rulați cu propriile prompt-uri de intrare pentru a vedea cum funcționează. Iată un exemplu (este posibil să obțineți o completare diferită):
+
+```
+predict("My favorite programming language is")
+```
+
+```
+>> My favorite programming language is Haskell. I really enjoyed the Haskell language, but it doesn't have all the features that can be applied to any other language. For example, all it does is compile to a byte array.
+```
+
+Acum că avem o funcție pentru generarea predicțiilor, putem crea și lansa o `Interface` în același mod în care am făcut mai devreme:
+
+```py
+import gradio as gr
+
+gr.Interface(fn=predict, inputs="text", outputs="text").launch()
+```
+
+
+Asta e! Acum puteți folosi această interfață pentru a genera text folosind modelul GPT-2 așa cum se arată mai jos 🤯.
+
+<iframe src="https://course-demos-gpt-2.hf.space" frameBorder="0" height="300" title="Gradio app" class="container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
+
+Continuați să citiți pentru a vedea cum să construiți alte tipuri de demo-uri cu Gradio! 
\ No newline at end of file
diff --git a/chapters/rum/chapter9/3.mdx b/chapters/rum/chapter9/3.mdx
new file mode 100644
index 000000000..9c723cb5c
--- /dev/null
+++ b/chapters/rum/chapter9/3.mdx
@@ -0,0 +1,177 @@
+# Înțelegerea clasei Interface[[understanding-the-interface-class]]
+
+<CourseFloatingBanner chapter={9}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter9/section3.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter9/section3.ipynb"},
+]} />
+
+În această secțiune, vom examina mai îndeaproape clasa `Interface` și vom înțelege
+parametrii principali folosiți pentru a crea una.
+
+## Cum să creați o Interface[[how-to-create-an-interface]]
+
+Veți observa că clasa `Interface` are 3 parametri necesari:
+
+`Interface(fn, inputs, outputs, ...)`
+
+Acești parametri sunt:
+
+  - `fn`: funcția de predicție care este încapsulată de interfața Gradio. Această funcție poate lua unul sau mai mulți parametri și poate returna una sau mai multe valori
+  - `inputs`: tipul(tipurile) componentei de intrare. Gradio oferă multe componente pre-construite precum `"image"` sau `"mic"`.
+  - `outputs`: tipul(tipurile) componentei de ieșire. Din nou, Gradio oferă multe componente pre-construite de ex. `"image"` sau `"label"`.
+
+Pentru o listă completă a componentelor, [consultați documentația Gradio](https://gradio.app/docs). Fiecare componentă pre-construită poate fi personalizată prin instanțierea clasei corespunzătoare componentei.
+
+De exemplu, așa cum am văzut în [secțiunea anterioară](/course/chapter9/2),
+în loc să transmiteți `"textbox"` la parametrul `inputs`, puteți transmite o componentă `Textbox(lines=7, label="Prompt")` pentru a crea o cutie de text cu 7 linii și o etichetă.
+
+Să aruncăm o privire la un alt exemplu, de data aceasta cu o componentă `Audio`.
+
+## Un exemplu simplu cu audio[[a-simple-example-with-audio]]
+
+Așa cum am menționat mai devreme, Gradio oferă multe intrări și ieșiri diferite.
+Deci să construim o `Interface` care funcționează cu audio.
+
+În acest exemplu, vom construi o funcție audio-la-audio care primește un
+fișier audio și pur și simplu îl inversează.
+
+Vom folosi pentru intrare componenta `Audio`. Când folosiți componenta `Audio`,
+puteți specifica dacă doriți ca `source`-ul audio să fie un fișier pe care utilizatorul
+îl încarcă sau un microfon cu care utilizatorul își înregistrează vocea. În acest caz, să
+o setăm la `"microphone"`. Doar pentru distracție, vom adăuga o etichetă la `Audio`-ul nostru care spune
+"Vorbiți aici...".
+
+În plus, am dori să primim audio-ul ca un array numpy pentru a putea cu ușurință
+să îl "inversăm". Deci vom seta `"type"`-ul să fie `"numpy"`, care transmite datele de intrare
+ca un tuplu de (`sample_rate`, `data`) în funcția noastră.
+
+Vom folosi și componenta de ieșire `Audio` care poate reda automat
+un tuplu cu o rată de eșantionare și un array numpy de date ca fișier audio redabil.
+În acest caz, nu avem nevoie să facem nicio personalizare, deci vom folosi scurtătura string
+`"audio"`.
+
+
+```py
+import numpy as np
+import gradio as gr
+
+
+def reverse_audio(audio):
+    sr, data = audio
+    reversed_audio = (sr, np.flipud(data))
+    return reversed_audio
+
+
+mic = gr.Audio(source="microphone", type="numpy", label="Vorbiți aici...")
+gr.Interface(reverse_audio, mic, "audio").launch()
+```
+
+Codul de mai sus va produce o interfață ca cea de mai jos (dacă browser-ul dvs. nu
+vă cere permisiuni pentru microfon, <a href="https://huggingface.co/spaces/course-demos/audio-reverse" target="_blank">deschideți demo-ul într-o filă separată</a>.)
+
+<iframe src="https://course-demos-audio-reverse.hf.space" frameBorder="0" height="250" title="Gradio app" class="container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
+
+Acum ar trebui să puteți să vă înregistrați vocea și să vă auziți vorbind în sens invers - înfricoșător 👻!
+
+## Gestionarea intrărilor și ieșirilor multiple[[handling-multiple-inputs-and-outputs]]
+
+Să spunem că avem o funcție mai complicată, cu intrări și ieșiri multiple.
+În exemplul de mai jos, avem o funcție care primește un index dropdown, o valoare slider și un număr,
+și returnează un eșantion audio al unui ton muzical.
+
+Priviți cum transmitem o listă de componente de intrare și ieșire,
+și vedeți dacă puteți urmări ce se întâmplă.
+
+Cheia aici este că atunci când transmiteți:
+* o listă de componente de intrare, fiecare componentă corespunde unui parametru în ordine.
+* o listă de componente de ieșire, fiecare componentă corespunde unei valori returnate.
+
+Fragmentul de cod de mai jos arată cum trei componente de intrare se aliniază cu cei trei argumente ai funcției `generate_tone()`:
+
+```py
+import numpy as np
+import gradio as gr
+
+notes = ["C", "C#", "D", "D#", "E", "F", "F#", "G", "G#", "A", "A#", "B"]
+
+
+def generate_tone(note, octave, duration):
+    sr = 48000
+    a4_freq, tones_from_a4 = 440, 12 * (octave - 4) + (note - 9)
+    frequency = a4_freq * 2 ** (tones_from_a4 / 12)
+    duration = int(duration)
+    audio = np.linspace(0, duration, duration * sr)
+    audio = (20000 * np.sin(audio * (2 * np.pi * frequency))).astype(np.int16)
+    return (sr, audio)
+
+
+gr.Interface(
+    generate_tone,
+    [
+        gr.Dropdown(notes, type="index"),
+        gr.Slider(minimum=4, maximum=6, step=1),
+        gr.Number(value=1, label="Durata în secunde"),
+    ],
+    "audio",
+).launch()
+```
+
+<iframe src="https://course-demos-generate-tone.hf.space" frameBorder="0" height="450" title="Gradio app" class="container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
+
+
+### Metoda `launch()`[[the-launch-method]]
+
+Până acum, am folosit metoda `launch()` pentru a lansa interfața, dar nu
+am discutat cu adevărat ce face.
+
+În mod implicit, metoda `launch()` va lansa demo-ul într-un server web care
+rulează local. Dacă rulați codul într-un notebook Jupyter sau Colab, atunci
+Gradio va incorpora interfața GUI demo în notebook pentru a o putea folosi cu ușurință.
+
+Puteți personaliza comportamentul `launch()` prin parametri diferiți:
+
+  - `inline` - dacă să afișeze interfața inline în notebook-urile Python.
+  - `inbrowser` - dacă să lanseze automat interfața într-o filă nouă în browser-ul implicit.
+  - `share` - dacă să creeze un link partajabil public de pe calculatorul dvs. pentru interfață. Cam ca un link Google Drive!
+
+Vom acoperi parametrul `share` în mult mai multe detalii în următoarea secțiune!
+
+## ✏️ Să aplicăm![[lets-apply-it]]
+
+Să construim o interfață care vă permite să demonstrați un model de **recunoaștere vocală**.
+Pentru a o face interesantă, vom accepta *fie* o intrare de microfon, fie un fișier încărcat.
+
+Ca de obicei, vom încărca modelul nostru de recunoaștere vocală folosind funcția `pipeline()` din 🤗 Transformers.
+Dacă aveți nevoie de o reîmprospătare rapidă, puteți să vă întoarceți la [acea secțiune din Capitolul 1](/course/chapter1/3). Următorul, vom implementa o funcție `transcribe_audio()` care procesează audio-ul și returnează transcrierea. În final, vom încapsula această funcție într-o `Interface` cu componentele `Audio` pentru intrări și doar text pentru ieșire. În ansamblu, codul pentru această aplicație este următorul:
+
+```py
+from transformers import pipeline
+import gradio as gr
+
+model = pipeline("automatic-speech-recognition")
+
+
+def transcribe_audio(audio):
+    transcription = model(audio)["text"]
+    return transcription
+
+
+gr.Interface(
+    fn=transcribe_audio,
+    inputs=gr.Audio(type="filepath"),
+    outputs="text",
+).launch()
+```
+
+Dacă browser-ul dvs. nu vă cere permisiuni pentru microfon, <a href="https://huggingface.co/spaces/course-demos/audio-reverse" target="_blank">deschideți demo-ul într-o filă separată</a>.
+
+<iframe src="https://course-demos-asr.hf.space" frameBorder="0" height="550" title="Gradio app" class="container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
+
+
+Asta e! Acum puteți folosi această interfață pentru a transcrie audio. Observați aici că
+prin transmiterea parametrului `optional` ca `True`, permitem utilizatorului să ofere fie
+un microfon, fie un fișier audio (sau niciunul, dar asta va returna un mesaj de eroare).
+
+Continuați să vedeți cum să vă partajați interfața cu alții! 
\ No newline at end of file
diff --git a/chapters/rum/chapter9/4.mdx b/chapters/rum/chapter9/4.mdx
new file mode 100644
index 000000000..1c00af570
--- /dev/null
+++ b/chapters/rum/chapter9/4.mdx
@@ -0,0 +1,147 @@
+# Partajarea demo-urilor cu alții[[sharing-demos-with-others]]
+
+<CourseFloatingBanner chapter={9}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter9/section4.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter9/section4.ipynb"},
+]} />
+
+Acum că ați construit un demo, probabil doriți să îl partajați cu alții. Demo-urile Gradio
+pot fi partajate în două moduri: folosind un ***link de partajare temporar*** sau ***găzduire permanentă pe Spaces***.
+
+Vom acoperi ambele abordări în curând. Dar înainte să vă partajați demo-ul, este posibil să doriți să îl înfrumusețați 💅.
+
+### Înfrumusețarea demo-ului Gradio:[[polishing-your-gradio-demo]]
+
+<div class="flex justify-center">
+<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter9/gradio-demo-overview.png" alt="Overview of a gradio interface">
+<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter9/gradio-demo-overview-dark.png" alt="Overview of a gradio interface">
+</div>
+
+Pentru a adăuga conținut suplimentar la demo-ul dvs., clasa `Interface` suportă câțiva parametri opționali:
+    - `title`: puteți da un titlu demo-ului dvs., care apare _deasupra_ componentelor de intrare și ieșire.
+    - `description`: puteți da o descriere (în text, Markdown sau HTML) pentru interfață, care apare deasupra componentelor de intrare și ieșire și sub titlu.
+    - `article`: puteți scrie și un articol extins (în text, Markdown sau HTML) explicând interfața. Dacă este furnizat, apare _sub_ componentele de intrare și ieșire.
+    - `theme`: nu vă plac culorile implicite? Setați tema să folosească una dintre `default`, `huggingface`, `grass`, `peach`. Puteți adăuga și prefixul `dark-`, de ex. `dark-peach` pentru tema întunecată (sau doar `dark` pentru tema întunecată implicită).
+    - `examples`: pentru a face demo-ul *mult mai ușor de folosit*, puteți furniza exemple de intrări pentru funcție. Acestea apar sub componentele UI și pot fi folosite pentru a popula interfața. Acestea ar trebui furnizate ca o listă imbricată, în care lista exterioară constă din exemple și fiecare listă interioară constă dintr-o intrare corespunzătoare fiecărei componente de intrare.
+    - `live`: dacă doriți să faceți demo-ul "live", adică modelul să ruleze din nou de fiecare dată când intrarea se schimbă, puteți seta `live=True`. Acest lucru are sens să se folosească cu modele rapide (vom vedea un exemplu la sfârșitul acestei secțiuni)
+Folosind opțiunile de mai sus, ajungem la o interfață mai completă. Rulați codul de mai jos pentru a putea conversa cu Rick și Morty:
+
+```py
+title = "Ask Rick a Question"
+description = """
+The bot was trained to answer questions based on Rick and Morty dialogues. Ask Rick anything!
+<img src="https://huggingface.co/spaces/course-demos/Rick_and_Morty_QA/resolve/main/rick.png" width=200px>
+"""
+
+article = "Check out [the original Rick and Morty Bot](https://huggingface.co/spaces/kingabzpro/Rick_and_Morty_Bot) that this demo is based off of."
+
+gr.Interface(
+    fn=predict,
+    inputs="textbox",
+    outputs="text",
+    title=title,
+    description=description,
+    article=article,
+    examples=[["What are you doing?"], ["Where should we time travel to?"]],
+).launch()
+```
+
+Folosind opțiunile de mai sus, ajungem la o interfață mai completă. Încercați interfața de mai jos:
+
+<iframe src="https://course-demos-Rick-and-Morty-QA.hf.space" frameBorder="0" height="800" title="Gradio app" class="container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
+
+### Partajarea demo-ului cu link-uri temporare[[sharing-your-demo-with-temporary-links]]
+Acum că avem un demo funcțional al modelului nostru de machine learning, să învățăm cum să partajăm cu ușurință un link către interfața noastră.
+Interfețele pot fi partajate public cu ușurință prin setarea `share=True` în metoda `launch()`:
+
+```python
+gr.Interface(classify_image, "image", "label").launch(share=True)
+```
+
+Aceasta generează un link public, partajabil pe care îl puteți trimite oricui! Când trimiteți acest link, utilizatorul din cealaltă parte poate încerca modelul în browser-ul lor timp de până la 72 de ore. Deoarece procesarea se întâmplă pe dispozitivul dvs. (atâta timp cât dispozitivul dvs. rămâne pornit!), nu trebuie să vă faceți griji cu privire la împachetarea dependențelor. Dacă lucrați dintr-un notebook Google Colab, un link de partajare este întotdeauna creat automat. De obicei arată cam așa: **XXXXX.gradio.app**. Deși link-ul este servit printr-un link Gradio, suntem doar un proxy pentru server-ul dvs. local și nu stocăm datele trimise prin interfețe.
+
+Rețineți totuși că aceste link-uri sunt accesibile public, ceea ce înseamnă că oricine poate folosi modelul dvs. pentru predicție! Prin urmare, asigurați-vă să nu expuneți informații sensibile prin funcțiile pe care le scrieți sau să permiteți modificări critice pe dispozitivul dvs. Dacă setați `share=False` (implicit), doar un link local este creat.
+
+### Găzduirea demo-ului pe Hugging Face Spaces[[hosting-your-demo-on-hugging-face-spaces]]
+
+Un link de partajare pe care îl puteți transmite colegilor este cool, dar cum puteți găzdui permanent demo-ul și să îl faceți să existe în propriul său "spațiu" pe internet?
+
+Hugging Face Spaces oferă infrastructura pentru a găzdui permanent modelul dvs. Gradio pe internet, **gratuit**! Spaces vă permite să creați și să împingeți într-un repo (public sau privat),
+unde codul interfața dvs. Gradio
+va exista într-un fișier `app.py`. [Citiți un tutorial pas cu pas](https://huggingface.co/blog/gradio-spaces) pentru a începe, sau urmăriți un videoclip exemplu mai jos.
+
+<Youtube id="LS9Y2wDVI0k" />
+
+## ✏️ Să aplicăm![[lets-apply-it]]
+
+Folosind ceea ce tocmai am învățat în secțiunile de până acum, să creăm demo-ul de recunoaștere a schițelor pe care l-am văzut în [secțiunea unu din acest capitol](/course/chapter9/1). Să adăugăm câteva personalizări la interfața noastră și să setăm `share=True` pentru a crea un link public pe care îl putem transmite.
+
+Putem încărca etichetele din [class_names.txt](https://huggingface.co/spaces/dawood/Sketch-Recognition/blob/main/class_names.txt) și să încărcăm modelul pytorch pre-antrenat din [pytorch_model.bin](https://huggingface.co/spaces/dawood/Sketch-Recognition/blob/main/pytorch_model.bin). Descărcați aceste fișiere urmărind link-ul și făcând clic pe download în colțul din stânga sus al previzualizării fișierului. Să aruncăm o privire la codul de mai jos pentru a vedea cum folosim aceste fișiere pentru a încărca modelul nostru și a crea o funcție `predict()`:
+```py
+from pathlib import Path
+import torch
+import gradio as gr
+from torch import nn
+
+LABELS = Path("class_names.txt").read_text().splitlines()
+
+model = nn.Sequential(
+    nn.Conv2d(1, 32, 3, padding="same"),
+    nn.ReLU(),
+    nn.MaxPool2d(2),
+    nn.Conv2d(32, 64, 3, padding="same"),
+    nn.ReLU(),
+    nn.MaxPool2d(2),
+    nn.Conv2d(64, 128, 3, padding="same"),
+    nn.ReLU(),
+    nn.MaxPool2d(2),
+    nn.Flatten(),
+    nn.Linear(1152, 256),
+    nn.ReLU(),
+    nn.Linear(256, len(LABELS)),
+)
+state_dict = torch.load("pytorch_model.bin", map_location="cpu")
+model.load_state_dict(state_dict, strict=False)
+model.eval()
+
+
+def predict(im):
+    x = torch.tensor(im, dtype=torch.float32).unsqueeze(0).unsqueeze(0) / 255.0
+    with torch.no_grad():
+        out = model(x)
+    probabilities = torch.nn.functional.softmax(out[0], dim=0)
+    values, indices = torch.topk(probabilities, 5)
+    return {LABELS[i]: v.item() for i, v in zip(indices, values)}
+```
+
+Acum că avem o funcție `predict()`. Următorul pas este să definim și să lansăm interfața noastră gradio:
+
+```py
+interface = gr.Interface(
+    predict,
+    inputs="sketchpad",
+    outputs="label",
+    theme="huggingface",
+    title="Sketch Recognition",
+    description="Who wants to play Pictionary? Draw a common object like a shovel or a laptop, and the algorithm will guess in real time!",
+    article="<p style='text-align: center'>Sketch Recognition | Demo Model</p>",
+    live=True,
+)
+interface.launch(share=True)
+```
+
+<iframe src="https://course-demos-Sketch-Recognition.hf.space" frameBorder="0" height="650" title="Gradio app" class="container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
+
+
+Observați parametrul `live=True` în `Interface`, care înseamnă că demo-ul cu schițe face
+o predicție de fiecare dată când cineva desenează pe sketchpad (fără buton de submit!).
+
+În plus, am setat și argumentul `share=True` în metoda `launch()`.
+Aceasta va crea un link public pe care îl puteți
+trimite oricui! Când trimiteți acest link, utilizatorul din cealaltă parte poate încerca
+modelul de recunoaștere a schițelor. Pentru a reitera, ați putea găzdui și modelul pe Hugging Face Spaces,
+care este modul în care reușim să încorporăm demo-ul de mai sus.
+
+Următorul, vom acoperi alte moduri în care Gradio poate fi folosit cu ecosistemul Hugging Face! 
\ No newline at end of file
diff --git a/chapters/rum/chapter9/5.mdx b/chapters/rum/chapter9/5.mdx
new file mode 100644
index 000000000..6c90eb5ff
--- /dev/null
+++ b/chapters/rum/chapter9/5.mdx
@@ -0,0 +1,67 @@
+# Integrări cu Hugging Face Hub[[integrations-with-the-hugging-face-hub]]
+
+<CourseFloatingBanner chapter={9}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter9/section5.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter9/section5.ipynb"},
+]} />
+
+Pentru a vă face viața și mai ușoară, Gradio se integrează direct cu Hugging Face Hub și Hugging Face Spaces.
+Puteți încărca demo-uri din Hub și Spaces cu o singură *linie de cod*.
+
+### Încărcarea modelelor din Hugging Face Hub[[loading-models-from-the-hugging-face-hub]]
+Pentru a începe, alegeți unul dintre miile de modele pe care Hugging Face le oferă prin Hub, așa cum este descris în [Capitolul 4](/course/chapter4/2).
+
+Folosind metoda specială `Interface.load()`, transmiteți `"model/"` (sau, echivalent, `"huggingface/"`) 
+urmată de numele modelului. 
+De exemplu, iată codul pentru a construi un demo pentru [GPT-J](https://huggingface.co/EleutherAI/gpt-j-6B), un model de limbaj mare, cu adăugarea a câtorva exemple de intrări:
+
+```py
+import gradio as gr
+
+title = "GPT-J-6B"
+description = "Gradio Demo for GPT-J 6B, a transformer model trained using Ben Wang's Mesh Transformer JAX. 'GPT-J' refers to the class of model, while '6B' represents the number of trainable parameters. To use it, simply add your text, or click one of the examples to load them. Read more at the links below."
+article = "<p style='text-align: center'><a href='https://github.com/kingoflolz/mesh-transformer-jax' target='_blank'>GPT-J-6B: A 6 Billion Parameter Autoregressive Language Model</a></p>"
+
+gr.Interface.load(
+    "huggingface/EleutherAI/gpt-j-6B",
+    inputs=gr.Textbox(lines=5, label="Input Text"),
+    title=title,
+    description=description,
+    article=article,
+).launch()
+```
+    
+Codul de mai sus va produce interfața de mai jos:
+
+<iframe src="https://course-demos-gpt-j-6B.hf.space" frameBorder="0" height="750" title="Gradio app" class="container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
+
+Încărcarea unui model în acest mod folosește [API-ul de Inferență](https://huggingface.co/inference-api) de la Hugging Face,
+în loc să încarce modelul în memorie. Acest lucru este ideal pentru modele uriașe precum GPT-J sau T0pp care
+ necesită multă RAM.
+
+### Încărcarea din Hugging Face Spaces[[loading-from-hugging-face-spaces]]
+Pentru a încărca orice Space din Hugging Face Hub și a-l recrea local, puteți transmite `spaces/` la `Interface`, urmată de numele Space-ului.
+
+Vă amintiți demo-ul din secțiunea 1 care elimina fundalul unei imagini? Să-l încărcăm din Hugging Face Spaces:
+
+```py
+gr.Interface.load("spaces/abidlabs/remove-bg").launch()
+```
+
+<iframe src="https://course-demos-remove-bg-original.hf.space" frameBorder="0" height="650" title="Gradio app" class="container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
+
+Unul dintre lucrurile cool la încărcarea demo-urilor din Hub sau Spaces este că le puteți personaliza 
+prin suprascrierea oricăruia dintre 
+parametri. Aici, adăugăm un titlu și facem să funcționeze cu o webcam în schimb:
+
+```py
+gr.Interface.load(
+    "spaces/abidlabs/remove-bg", inputs="webcam", title="Remove your webcam background!"
+).launch()
+```
+
+<iframe src="https://course-demos-Remove-bg.hf.space" frameBorder="0" height="550" title="Gradio app" class="container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
+
+Acum că am explorat câteva moduri de a integra Gradio cu Hugging Face Hub, să aruncăm o privire la câteva caracteristici avansate ale clasei `Interface`. Aceasta este tema următoarei secțiuni! 
\ No newline at end of file
diff --git a/chapters/rum/chapter9/6.mdx b/chapters/rum/chapter9/6.mdx
new file mode 100644
index 000000000..91c8d65f0
--- /dev/null
+++ b/chapters/rum/chapter9/6.mdx
@@ -0,0 +1,102 @@
+# Caracteristici avansate ale Interface[[advanced-interface-features]]
+
+<CourseFloatingBanner chapter={9}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter9/section6.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter9/section6.ipynb"},
+]} />
+
+Acum că putem construi și partaja o interfață de bază, să explorăm câteva caracteristici mai avansate precum starea și interpretarea.
+
+### Folosirea stării pentru a persista datele[[using-state-to-persist-data]]
+
+Gradio suportă *starea sesiunii*, unde datele persistă prin multiple trimiteri într-o
+încărcare de pagină. Starea sesiunii este utilă pentru construirea demo-urilor, de exemplu, chatbot-uri unde doriți să
+persistați datele pe măsură ce utilizatorul interacționează cu modelul. Rețineți că starea sesiunii nu partajează datele între diferiți utilizatori ai modelului dvs.
+
+Pentru a stoca date într-o stare de sesiune, trebuie să faceți trei lucruri:
+
+1. Transmiteți un *parametru suplimentar* în funcția dvs., care reprezintă starea interfeței.
+1. La sfârșitul funcției, returnați valoarea actualizată a stării ca o *valoare de returnare suplimentară*.
+1. Adăugați componentele de intrare 'state' și ieșire 'state' când creați `Interface`-ul dvs.
+
+Vedeți exemplul de chatbot de mai jos:
+
+```py
+import random
+
+import gradio as gr
+
+
+def chat(message, history):
+    history = history or []
+    if message.startswith("How many"):
+        response = random.randint(1, 10)
+    elif message.startswith("How"):
+        response = random.choice(["Great", "Good", "Okay", "Bad"])
+    elif message.startswith("Where"):
+        response = random.choice(["Here", "There", "Somewhere"])
+    else:
+        response = "I don't know"
+    history.append((message, response))
+    return history, history
+
+
+iface = gr.Interface(
+    chat,
+    ["text", "state"],
+    ["chatbot", "state"],
+    allow_screenshot=False,
+    allow_flagging="never",
+)
+iface.launch()
+```
+
+<iframe src="https://course-demos-Chatbot-Demo.hf.space" frameBorder="0" height="350" title="Gradio app" class="container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
+
+Observați cum starea componentei de ieșire persistă prin trimiteri.
+Notă: puteți transmite o valoare implicită la parametrul state,
+care este folosită ca valoarea inițială a stării.
+
+### Folosirea interpretării pentru a înțelege predicțiile[[using-interpretation-to-understand-predictions]]
+
+Majoritatea modelelor de machine learning sunt cutii negre și logica internă a funcției este ascunsă de utilizatorul final. Pentru a încuraja transparența, am făcut foarte ușor să adăugați interpretare la modelul dvs. prin simpla setare a cuvântului cheie interpretation în clasa Interface la default. Aceasta permite utilizatorilor dvs. să înțeleagă ce părți ale intrării sunt responsabile pentru ieșire. Aruncați o privire la interfața simplă de mai jos care arată un clasificator de imagini care include și interpretare:
+
+```py
+import requests
+import tensorflow as tf
+
+import gradio as gr
+
+inception_net = tf.keras.applications.MobileNetV2()  # load the model
+
+# Download human-readable labels for ImageNet.
+response = requests.get("https://git.io/JJkYN")
+labels = response.text.split("\n")
+
+
+def classify_image(inp):
+    inp = inp.reshape((-1, 224, 224, 3))
+    inp = tf.keras.applications.mobilenet_v2.preprocess_input(inp)
+    prediction = inception_net.predict(inp).flatten()
+    return {labels[i]: float(prediction[i]) for i in range(1000)}
+
+
+image = gr.Image(shape=(224, 224))
+label = gr.Label(num_top_classes=3)
+
+title = "Gradio Image Classifiction + Interpretation Example"
+gr.Interface(
+    fn=classify_image, inputs=image, outputs=label, interpretation="default", title=title
+).launch()
+```
+
+Testați funcția de interpretare prin trimiterea unei intrări apoi făcând clic pe Interpret sub componenta de ieșire.
+
+<iframe src="https://course-demos-gradio-image-interpretation.hf.space" frameBorder="0" height="570" title="Gradio app" class="container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
+
+Pe lângă metoda de interpretare implicită pe care o oferă Gradio, puteți specifica și `shap` pentru parametrul `interpretation` și să setați parametrul `num_shap`. Aceasta folosește interpretarea bazată pe Shapley, despre care puteți citi mai multe [aici](https://christophm.github.io/interpretable-ml-book/shap.html).
+În final, puteți transmite și propria funcție de interpretare în parametrul `interpretation`. Vedeți un exemplu în pagina de început a Gradio [aici](https://gradio.app/getting_started/).
+
+Aceasta încheie explorarea noastră profundă a clasei `Interface` din Gradio. Așa cum am văzut, această clasă face simplu să creați demo-uri de machine learning în câteva linii de cod Python. Cu toate acestea, uneori veți dori să personalizați demo-ul prin schimbarea layout-ului sau înlănțuirea mai multor funcții de predicție împreună. Nu ar fi frumos dacă am putea cumva să împărțim `Interface`-ul în "blocuri" personalizabile? Din fericire, se poate! Aceasta este tema secțiunii finale. 
\ No newline at end of file
diff --git a/chapters/rum/chapter9/7.mdx b/chapters/rum/chapter9/7.mdx
new file mode 100644
index 000000000..7ef5f2b4d
--- /dev/null
+++ b/chapters/rum/chapter9/7.mdx
@@ -0,0 +1,236 @@
+# Introducere în Gradio Blocks[[introduction-to-gradio-blocks]]
+
+<CourseFloatingBanner chapter={9}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter9/section7.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter9/section7.ipynb"},
+]} />
+
+În secțiunile anterioare am explorat și am creat demo-uri folosind clasa `Interface`. În această secțiune vom introduce API-ul nostru de nivel scăzut **recent dezvoltat** numit `gradio.Blocks`.
+
+Acum, care este diferența între `Interface` și `Blocks`?
+
+- ⚡ `Interface`: un API de nivel înalt care vă permite să creați un demo complet de machine learning simplu prin furnizarea unei liste de intrări și ieșiri.
+
+- 🧱 `Blocks`: un API de nivel scăzut care vă permite să aveți control complet asupra fluxurilor de date și layout-ului aplicației dvs. Puteți construi aplicații foarte complexe, cu mai mulți pași folosind `Blocks` (ca în "piese de construcție").
+
+
+### De ce Blocks 🧱?[[why-blocks-]]
+
+Așa cum am văzut în secțiunile anterioare, clasa `Interface` vă permite să creați cu ușurință demo-uri complete de machine learning cu doar câteva linii de cod. API-ul `Interface` este extrem de ușor de folosit, dar îi lipsește flexibilitatea pe care o oferă API-ul `Blocks`. De exemplu, ați putea dori să:
+
+- Grupați demo-uri înrudite ca file multiple într-o aplicație web
+- Schimbați layout-ul demo-ului dvs., de ex. să specificați unde sunt localizate intrările și ieșirile
+- Aveți interfețe cu mai mulți pași, în care ieșirea unui model devine intrarea următorului model, sau să aveți fluxuri de date mai flexibile în general
+- Schimbați proprietățile unei componente (de exemplu, opțiunile dintr-un dropdown) sau vizibilitatea sa pe baza intrării utilizatorului
+
+Vom explora toate aceste concepte mai jos.
+
+### Crearea unui demo simplu folosind Blocks[[creating-a-simple-demo-using-blocks]]
+
+După ce ați instalat Gradio, rulați codul de mai jos ca script Python, notebook Jupyter sau notebook Colab.
+
+```py
+import gradio as gr
+
+
+def flip_text(x):
+    return x[::-1]
+
+
+demo = gr.Blocks()
+
+with demo:
+    gr.Markdown(
+        """
+    # Flip Text!
+    Start typing below to see the output.
+    """
+    )
+    input = gr.Textbox(placeholder="Flip this text")
+    output = gr.Textbox()
+
+    input.change(fn=flip_text, inputs=input, outputs=output)
+
+demo.launch()
+```
+
+<iframe src="https://course-demos-flip-text.hf.space" frameBorder="0" height="400" title="Gradio app" class="container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
+
+Acest exemplu simplu de mai sus introduce 4 concepte care stau la baza Blocks:
+
+1. Blocks vă permite să construiți aplicații web care combină markdown, HTML, butoane și componente interactive simplu prin instanțierea obiectelor în Python într-un context `with gradio.Blocks`.
+<Tip>
+🙋Dacă nu sunteți familiarizați cu declarația `with` în Python, vă recomandăm să consultați excelentul [tutorial](https://realpython.com/python-with-statement/) de la Real Python. Întoarceți-vă aici după citirea acestuia 🤗
+</Tip>
+Ordinea în care instanțiați componentele contează deoarece fiecare element este redat în aplicația web în ordinea în care a fost creat. (Layout-uri mai complexe sunt discutate mai jos)
+
+2. Puteți defini funcții Python obișnuite oriunde în codul dvs. și să le rulați cu intrări de la utilizator folosind `Blocks`. În exemplul nostru, avem o funcție simplă care "inversează" textul de intrare, dar puteți scrie orice funcție Python, de la un calcul simplu la procesarea predicțiilor dintr-un model de machine learning.
+
+3. Puteți atribui evenimente oricărei componente `Blocks`. Aceasta va rula funcția dvs. când componenta este apăsată, schimbată, etc. Când atribuiți un eveniment, transmiteți trei parametri: `fn`: funcția care ar trebui apelată, `inputs`: (lista) componentei(lor) de intrare, și `outputs`: (lista) componentelor de ieșire care ar trebui apelate.
+
+   În exemplul de mai sus, rulăm funcția `flip_text()` când valoarea din `Textbox`-ul numit intrare `input` se schimbă. Evenimentul citește valoarea din `input`, o transmite ca parametru de nume la `flip_text()`, care apoi returnează o valoare care este atribuită celui de-al doilea `Textbox` numit `output`.
+
+   Pentru a vedea o listă a evenimentelor pe care le suportă fiecare componentă, consultați [documentația](https://www.gradio.app/docs/) Gradio.
+
+4. Blocks determină automat dacă o componentă ar trebui să fie interactivă (să accepte intrări de la utilizator) sau nu, pe baza declanșatorilor de evenimente pe care îi definiți. În exemplul nostru, prima cutie de text este interactivă, deoarece valoarea sa este folosită de funcția `flip_text()`. A doua cutie de text nu este interactivă, deoarece valoarea sa nu este niciodată folosită ca intrare. În unele cazuri, ați putea dori să suprascriați acest lucru, ceea ce puteți face prin transmiterea unui boolean la parametrul `interactive` al componentei (de ex. `gr.Textbox(placeholder="Flip this text", interactive=True)`).
+
+### Personalizarea layout-ului demo-ului dvs.[[customizing-the-layout-of-your-demo]]
+
+Cum putem folosi `Blocks` pentru a personaliza layout-ul demo-ului nostru? În mod implicit, `Blocks` redă componentele pe care le creați vertical într-o coloană. Puteți schimba asta prin crearea de coloane suplimentare `with gradio.Column():` sau rânduri `with gradio.Row():` și crearea componentelor în acele contexte.
+
+Iată ce ar trebui să țineți minte: orice componente create sub o `Column` (aceasta este și setarea implicită) vor fi aranjate vertical. Orice componentă creată sub un `Row` va fi aranjată orizontal, similar cu [modelul flexbox în dezvoltarea web](https://developer.mozilla.org/en-US/docs/Web/CSS/CSS_Flexible_Box_Layout/Basic_Concepts_of_Flexbox).
+
+În final, puteți crea și file pentru demo-ul dvs. folosind managerul de context `with gradio.Tabs()`. În acest context, puteți crea file multiple prin specificarea `with gradio.TabItem(name_of_tab):` copii. Orice componentă creată în interiorul unui context `with gradio.TabItem(name_of_tab):` apare în acea filă.
+
+Acum să adăugăm o funcție `flip_image()` la demo-ul nostru și să adăugăm o filă nouă care inversează imaginile. Mai jos este un exemplu cu 2 file și folosește și un Row:
+
+```py
+import numpy as np
+import gradio as gr
+
+demo = gr.Blocks()
+
+
+def flip_text(x):
+    return x[::-1]
+
+
+def flip_image(x):
+    return np.fliplr(x)
+
+
+with demo:
+    gr.Markdown("Flip text or image files using this demo.")
+    with gr.Tabs():
+        with gr.TabItem("Flip Text"):
+            with gr.Row():
+                text_input = gr.Textbox()
+                text_output = gr.Textbox()
+            text_button = gr.Button("Flip")
+        with gr.TabItem("Flip Image"):
+            with gr.Row():
+                image_input = gr.Image()
+                image_output = gr.Image()
+            image_button = gr.Button("Flip")
+
+    text_button.click(flip_text, inputs=text_input, outputs=text_output)
+    image_button.click(flip_image, inputs=image_input, outputs=image_output)
+
+demo.launch()
+```
+
+<iframe src="https://course-demos-flip-text-image.hf.space" frameBorder="0" height="450" title="Gradio app" class="container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
+
+
+Veți observa că în acest exemplu, am creat și o componentă `Button` în fiecare filă, și am atribuit un eveniment de clic fiecărui buton, care este ceea ce rulează de fapt funcția.
+
+### Explorarea evenimentelor și stării[[exploring-events-and-state]]
+
+La fel cum puteți controla layout-ul, `Blocks` vă oferă control fin asupra evenimentelor care declanșează apelurile de funcții. Fiecare componentă și multe layout-uri au evenimente specifice pe care le suportă.
+
+De exemplu, componenta `Textbox` are 2 evenimente: `change()` (când valoarea din interiorul cutiei de text se schimbă), și `submit()` (când un utilizator apasă tasta enter în timp ce este focalizat pe cutia de text). Componentele mai complexe pot avea și mai multe evenimente: de exemplu, componenta `Audio` are și evenimente separate pentru când fișierul audio este redat, șters, întrerupt, etc. Consultați documentația pentru evenimentele pe care le suportă fiecare componentă.
+
+Puteți atașa declanșatorul de eveniment la niciunul, unul sau mai multe dintre aceste evenimente. Creați un declanșator de eveniment prin apelarea numelui evenimentului pe instanța componentei ca funcție -- de ex. `textbox.change(...)` sau `btn.click(...)`. Funcția primește trei parametri, așa cum s-a discutat mai sus:
+
+- `fn`: funcția care să ruleze
+- `inputs`: o (listă de) componentă(e) ale căror valori ar trebui furnizate ca parametri de intrare la funcție. Valoarea fiecărei componente este mapată la parametrul funcției corespunzător, în ordine. Acest parametru poate fi None dacă funcția nu primește parametri.
+- `outputs`: o (listă de) componentă(e) ale căror valori ar trebui actualizate pe baza valorilor returnate de funcție. Fiecare valoare returnată setează valoarea componentei corespunzătoare, în ordine. Acest parametru poate fi None dacă funcția nu returnează nimic.
+
+Puteți face chiar ca componenta de intrare și ieșire să fie aceeași componentă, așa cum facem în acest exemplu care folosește un model GPT pentru completarea textului:
+
+```py
+import gradio as gr
+
+api = gr.Interface.load("huggingface/EleutherAI/gpt-j-6B")
+
+
+def complete_with_gpt(text):
+    # Use the last 50 characters of the text as context
+    return text[:-50] + api(text[-50:])
+
+
+with gr.Blocks() as demo:
+    textbox = gr.Textbox(placeholder="Type here and press enter...", lines=4)
+    btn = gr.Button("Generate")
+
+    btn.click(complete_with_gpt, textbox, textbox)
+
+demo.launch()
+```
+
+<iframe src="https://course-demos-blocks-gpt.hf.space" frameBorder="0" height="300" title="Gradio app" class="container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
+
+### Crearea demo-urilor cu mai mulți pași[[creating-multi-step-demos]]
+
+În unele cazuri, ați putea dori un _demo cu mai mulți pași_, în care reutilizați ieșirea unei funcții ca intrare la următoarea. Acest lucru este foarte ușor de făcut cu `Blocks`, deoarece puteți folosi o componentă pentru intrarea unei declanșări de eveniment, dar ieșirea alteia. Priviți componenta text din exemplul de mai jos, valoarea sa este rezultatul unui model speech-to-text, dar este transmisă și într-un model de analiză de sentiment:
+
+```py
+from transformers import pipeline
+
+import gradio as gr
+
+asr = pipeline("automatic-speech-recognition", "facebook/wav2vec2-base-960h")
+classifier = pipeline("text-classification")
+
+
+def speech_to_text(speech):
+    text = asr(speech)["text"]
+    return text
+
+
+def text_to_sentiment(text):
+    return classifier(text)[0]["label"]
+
+
+demo = gr.Blocks()
+
+with demo:
+    audio_file = gr.Audio(type="filepath")
+    text = gr.Textbox()
+    label = gr.Label()
+
+    b1 = gr.Button("Recognize Speech")
+    b2 = gr.Button("Classify Sentiment")
+
+    b1.click(speech_to_text, inputs=audio_file, outputs=text)
+    b2.click(text_to_sentiment, inputs=text, outputs=label)
+
+demo.launch()
+```
+
+<iframe src="https://course-demos-blocks-multi-step.hf.space" frameBorder="0" height="600" title="Gradio app" class="container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
+
+### Actualizarea Proprietăților Componentei[[updating-component-properties]]
+
+Până acum, am văzut cum să creăm evenimente pentru a actualiza valoarea unei alte componente. Dar ce se întâmplă dacă doriți să schimbați alte proprietăți ale unei componente, cum ar fi vizibilitatea unei cutii de text sau opțiunile dintr-un grup de butoane radio? Puteți face acest lucru prin returnarea metodei `update()` a unei clase de componentă în loc de o valoare de returnare obișnuită din funcția dvs.
+
+Acest lucru este cel mai ușor ilustrat cu un exemplu:
+
+```py
+import gradio as gr
+
+
+def change_textbox(choice):
+    if choice == "short":
+        return gr.Textbox.update(lines=2, visible=True)
+    elif choice == "long":
+        return gr.Textbox.update(lines=8, visible=True)
+    else:
+        return gr.Textbox.update(visible=False)
+
+
+with gr.Blocks() as block:
+    radio = gr.Radio(
+        ["short", "long", "none"], label="What kind of essay would you like to write?"
+    )
+    text = gr.Textbox(lines=2, interactive=True)
+
+    radio.change(fn=change_textbox, inputs=radio, outputs=text)
+    block.launch()
+```
+
+<iframe src="https://course-demos-blocks-update-component-properties.hf.space" frameBorder="0" height="300" title="Gradio app" class="container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
+
+Tocmai am explorat toate conceptele de bază ale `Blocks`! La fel ca în cazul `Interface`-urilor, puteți crea demo-uri cool care pot fi partajate folosind `share=True` în metoda `launch()` sau implementate pe [Hugging Face Spaces](https://huggingface.co/spaces). 
\ No newline at end of file
diff --git a/chapters/rum/chapter9/8.mdx b/chapters/rum/chapter9/8.mdx
new file mode 100644
index 000000000..6ad5509f7
--- /dev/null
+++ b/chapters/rum/chapter9/8.mdx
@@ -0,0 +1,24 @@
+# Gradio, verificat![[gradio-check]]
+
+<CourseFloatingBanner
+    chapter={9}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+Aceasta încheie capitolul despre construirea demo-urilor cool ML cu Gradio - sperăm că v-a plăcut! Pentru a recapitula, în acest capitol am învățat:
+
+- Cum să creați demo-uri Gradio cu API-ul de nivel înalt `Interface`, și cum să configurați diferite modalități de intrare și ieșire.
+- Diferite moduri de a partaja demo-urile Gradio, prin link-uri temporare și găzduire pe [Hugging Face Spaces](https://huggingface.co/spaces).
+- Cum să integrați demo-urile Gradio cu modelele și Spaces de pe Hugging Face Hub.
+- Caracteristici avansate precum stocarea stării într-un demo sau furnizarea autentificării.
+- Cum să aveți control complet asupra fluxului de date și layout-ului demo-ului dvs. cu Gradio Blocks.
+
+Dacă doriți să vă testați înțelegerea conceptelor acoperite în acest capitol, consultați quiz-ul din următoarea secțiune!
+
+## Unde să mergeți mai departe?[[where-to-next]]
+
+Dacă doriți să aflați mai multe despre Gradio, puteți
+
+- Să aruncați o privire la [Demo-uri](https://github.com/gradio-app/gradio/tree/main/demo) în repo, sunt destul de multe exemple acolo.
+- Să vedeți pagina [Ghiduri](https://gradio.app/guides/), unde puteți găsi ghiduri despre caracteristici cool și avansate.
+- Să consultați pagina [Documentație](https://gradio.app/docs/) pentru a învăța detaliile. 
\ No newline at end of file
diff --git a/chapters/rum/chapter9/9.mdx b/chapters/rum/chapter9/9.mdx
new file mode 100644
index 000000000..318d2da7e
--- /dev/null
+++ b/chapters/rum/chapter9/9.mdx
@@ -0,0 +1,239 @@
+<!-- DISABLE-FRONTMATTER-SECTIONS -->
+
+# Quiz de final de capitol[[end-of-chapter-quiz]]
+
+<CourseFloatingBanner
+    chapter={9}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+Să testăm ce ați învățat în acest capitol!
+
+### 1. Pentru ce puteți folosi Gradio?
+
+<Question
+	choices={[
+        {
+			text: "Să creați un demo pentru modelul vostru de machine learning",
+			explain: "Cu câteva linii de cod Python puteți genera un demo pentru modelul vostru ML folosind biblioteca noastră de componente pre-construite.",
+			correct: true
+		},
+		{
+			text: "Să partajați modelul vostru de machine learning cu alții",
+			explain: "Folosind parametrul <code>share=True</code> în metoda launch, puteți genera un link de partajare pe care să îl trimiteți oricui.",
+            correct: true
+		},
+		{
+			text: "Să depanați modelul vostru",
+			explain: "Un avantaj al unui demo gradio este să puteți testa modelul cu date reale pe care le puteți schimba și să observați predicțiile modelului schimbându-se în timp real, ajutându-vă să depanați modelul.",
+			correct: true
+		},
+		{
+			text: "Să antrenați modelul vostru",
+			explain: "Gradio este conceput să fie folosit pentru inferența modelului, DUPĂ ce modelul este antrenat.",
+		}
+	]}
+/>
+
+### 2. Gradio funcționează DOAR cu modele PyTorch
+
+<Question
+	choices={[
+        {
+			text: "Adevărat",
+			explain: "Gradio funcționează cu modele PyTorch, dar funcționează și pentru orice tip de model de machine learning!"
+        },
+        {
+			text: "Fals",
+			explain: "Gradio este agnostic față de model, ceea ce înseamnă că puteți crea un demo pentru orice tip de model de machine learning.",
+			correct: true
+        }
+	]}
+/>
+
+### 3. De unde puteți lansa un demo Gradio?
+
+<Question
+	choices={[
+        {
+			text: "IDE-uri Python standard",
+			explain: "Gradio funcționează excelent cu IDE-ul vostru preferat.",
+            correct: true
+        },
+        {
+			text: "Notebook-uri Google Colab",
+			explain: "Puteți crea și lansa un demo în notebook-ul vostru Google Colab.",
+			correct: true
+        },
+        {
+			text: "Notebook-uri Jupyter",
+			explain: "Alegere bună - Puteți crea și lansa un demo în notebook-ul vostru Jupyter.",
+			correct: true
+        }
+	]}
+/>
+
+### 4. Gradio este conceput în primul rând pentru modele NLP
+
+<Question
+	choices={[
+        {
+			text: "Adevărat",
+			explain: "Gradio funcționează cu aproape orice tip de date, nu doar NLP."
+        },
+        {
+			text: "Fals",
+			explain: "Gradio oferă dezvoltatorilor o bibliotecă de componente pre-construite pentru aproape toate tipurile de date.",
+            correct: true
+        }
+	]}
+/>
+
+### 5. Care dintre următoarele caracteristici sunt suportate de Gradio?
+
+<Question
+	choices={[
+        {
+			text: "Intrări și ieșiri multiple",
+			explain: "Intrări și ieșiri multiple sunt posibile cu gradio. Tot ce trebuie să faceți este să transmiteți o listă de intrări și ieșiri la parametrii corespunzători",
+            correct: true
+        },
+        {
+			text: "Stare pentru persistența datelor",
+			explain: "Gradio este capabil să adauge stare la interfața voastră.",
+			correct: true
+        },
+        {
+			text: "Autentificare cu nume de utilizator și parole",
+			explain: "Transmiteți o listă de tuple nume de utilizator/parolă la metoda launch pentru a adăuga autentificare.",
+			correct: true
+        },
+        {
+			text: "Analize automate pentru cine folosește demo-ul vostru gradio",
+			explain: "Încercați din nou - Gradio nu oferă dezvoltatorilor analize despre cine folosește demo-urile lor."
+        },
+        {
+			text: "Încărcarea unui model din hub-ul de modele Hugging Face sau Hugging Face Spaces",
+			explain: "Absolut - încărcați orice model Hugging Face folosind metoda <code>gr.Interface.load()</code>",
+			correct: true
+        }
+	]}
+/>
+
+### 6. Care dintre următoarele sunt moduri valide de a încărca un model Hugging Face din Hub sau Spaces?
+
+<Question
+	choices={[
+        {
+			text: "gr.Interface.load('huggingface/{user}/{model_name}')",
+			explain: "Aceasta este o metodă validă de a încărca un model Hugging Face din Hub",
+            correct: true
+        },
+        {
+			text: "gr.Interface.load('model/{user}/{model_name}')",
+			explain: "Aceasta este o metodă validă de a încărca un model Hugging Face din Hub",
+			correct: true
+        },
+        {
+			text: "gr.Interface.load('demos/{user}/{model_name}')",
+			explain: "Încercați din nou -- nu puteți încărca un model folosind prefixul 'demos'."
+        },
+        {
+			text: "gr.Interface.load('spaces/{user}/{model_name}')",
+			explain: "Aceasta este o metodă validă de a încărca un model Hugging Face din Spaces",
+			correct: true
+        }
+	]}
+/>
+
+### 7. Selectați toți pașii necesari pentru adăugarea stării la interfața voastră Gradio
+
+<Question
+	choices={[
+        {
+			text: "Transmiteți un parametru suplimentar în funcția voastră de predicție, care reprezintă starea interfeței.",
+			explain: "Un parametru suplimentar care stochează istoricul sau starea interfeței voastre este necesar.",
+            correct: true
+        },
+        {
+			text: "La sfârșitul funcției de predicție, returnați valoarea actualizată a stării ca o valoare de returnare suplimentară.",
+			explain: "Această valoare de istoric sau stare trebuie să fie returnată de funcția voastră.",
+            correct: true
+        },
+        {
+			text: "Adăugați componentele de intrare și ieșire de stare când creați Interface-ul vostru",
+			explain: "Gradio oferă o componentă de intrare și ieșire de stare pentru a persista datele.",
+            correct: true
+        }
+	]}
+/>
+
+### 8. Care dintre următoarele sunt componente incluse în biblioteca Gradio?
+
+<Question
+	choices={[
+        {
+			text: "Textbox.",
+			explain: "Da, puteți crea cutii de text cu componenta Textbox.",
+            correct: true
+        },
+        {
+			text: "Graph.",
+			explain: "În prezent nu există o componentă Graph.",
+        },
+        {
+			text: "Image.",
+			explain: "Da, puteți crea un widget de încărcare imagini cu componenta Image.",
+            correct: true
+        },
+        {
+			text: "Audio.",
+			explain: "Da, puteți crea un widget de încărcare audio cu componenta Audio.",
+            correct: true
+        },
+	]}
+/>
+
+### 9. Ce vă permite să faceți Gradio `Blocks`?
+
+<Question
+	choices={[
+        {
+			text: "Să combinați mai multe demo-uri într-o aplicație web",
+			explain: "Puteți folosi `with gradio.Tabs():` pentru a adăuga file pentru mai multe demo-uri",
+			correct: true
+        },
+        {
+			text: "Să atribuiți declanșatori de evenimente precum clicked/changed/etc la componentele `Blocks`",
+			explain: "Când atribuiți un eveniment, transmiteți trei parametri: fn: funcția care ar trebui apelată, inputs: (lista) componentei(lor) de intrare, și outputs: (lista) componentelor de ieșire care ar trebui apelate.",
+			correct: true
+        },
+        {
+			text: "Să determinați automat care componentă `Blocks` ar trebui să fie interactivă vs. statică",
+			explain: "Pe baza declanșatorilor de evenimente pe care îi definiți, `Blocks` determină automat dacă o componentă ar trebui să accepte intrări de la utilizator sau nu.",
+			correct: true
+        },
+		 {
+			text: "Să creați demo-uri cu mai mulți pași; adică să vă permită să reutilizați ieșirea unei componente ca intrare la următoarea",
+			explain: "Puteți folosi o componentă pentru intrarea unui declanșator de eveniment, dar ieșirea altuia.",
+            correct: true
+        },
+	]}
+/>
+
+### 10. Puteți partaja un link public la un demo `Blocks` și puteți găzdui un demo `Blocks` pe Hugging Face spaces.
+
+<Question
+	choices={[
+        {
+			text: "Adevărat",
+			explain: "La fel ca `Interface`, toate capacitățile de partajare și găzduire sunt aceleași pentru demo-urile `Blocks`!",
+			correct: true
+        },
+        {
+			text: "Fals",
+			explain: "La fel ca `Interface`, toate capacitățile de partajare și găzduire sunt aceleași pentru demo-urile `Blocks`!",
+			correct: false
+        }
+	]}
+/> 
\ No newline at end of file

From 3afde13db8f99235bde0cd33877c6e457611e9d0 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Thu, 29 May 2025 18:59:35 +0300
Subject: [PATCH 128/167] feat: add content chapter 10

---
 chapters/rum/_toctree.yml    |  19 ++++
 chapters/rum/chapter10/1.mdx |  26 +++++
 chapters/rum/chapter10/2.mdx |  55 +++++++++++
 chapters/rum/chapter10/3.mdx | 108 ++++++++++++++++++++
 chapters/rum/chapter10/4.mdx |  44 +++++++++
 chapters/rum/chapter10/5.mdx |  69 +++++++++++++
 chapters/rum/chapter10/6.mdx |  19 ++++
 chapters/rum/chapter10/7.mdx | 186 +++++++++++++++++++++++++++++++++++
 8 files changed, 526 insertions(+)
 create mode 100644 chapters/rum/chapter10/1.mdx
 create mode 100644 chapters/rum/chapter10/2.mdx
 create mode 100644 chapters/rum/chapter10/3.mdx
 create mode 100644 chapters/rum/chapter10/4.mdx
 create mode 100644 chapters/rum/chapter10/5.mdx
 create mode 100644 chapters/rum/chapter10/6.mdx
 create mode 100644 chapters/rum/chapter10/7.mdx

diff --git a/chapters/rum/_toctree.yml b/chapters/rum/_toctree.yml
index 25730606c..ba02215af 100644
--- a/chapters/rum/_toctree.yml
+++ b/chapters/rum/_toctree.yml
@@ -26,3 +26,22 @@
   - local: chapter1/10
     title: Quiz de final de capitol
     quiz: 1
+
+- title: 10. Curați seturi de date de înaltă calitate
+  subtitle: Cum să folosiți Argilla pentru a crea seturi de date uimitoare
+  sections:
+  - local: chapter10/1
+    title: Introducere în Argilla
+  - local: chapter10/2
+    title: Configurați-vă instanța Argilla
+  - local: chapter10/3
+    title: Încărcați setul de date în Argilla
+  - local: chapter10/4
+    title: Adnotați setul de date
+  - local: chapter10/5
+    title: Folosiți setul de date adnotat
+  - local: chapter10/6
+    title: Argilla, terminat!
+  - local: chapter10/7
+    title: Quiz de final de capitol
+    quiz: 10
diff --git a/chapters/rum/chapter10/1.mdx b/chapters/rum/chapter10/1.mdx
new file mode 100644
index 000000000..380ddd93c
--- /dev/null
+++ b/chapters/rum/chapter10/1.mdx
@@ -0,0 +1,26 @@
+# Introducere în Argilla[[introducere-în-argilla]]
+
+<CourseFloatingBanner
+    chapter={10}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+În Capitolul 5 ați învățat cum să construiți un set de date folosind biblioteca 🤗 Datasets și în Capitolul 6 ați explorat cum să ajustați modele pentru unele sarcini NLP comune. În acest capitol, veți învăța cum să folosiți [Argilla](https://argilla.io) pentru a **anota și cura seturi de date** pe care le puteți folosi pentru a antrena și evalua modelele dumneavoastră.
+
+Cheia pentru antrenarea modelelor care funcționează bine este să aveți date de înaltă calitate. Deși există unele seturi de date bune în Hub pe care le-ați putea folosi pentru a antrena și evalua modelele dumneavoastră, acestea s-ar putea să nu fie relevante pentru aplicația sau cazul de utilizare specific. În acest scenariu, s-ar putea să doriți să construiți și să curați un set de date propriu. Argilla vă va ajuta să faceți acest lucru eficient.
+
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter10/signin-hf-page.png" alt="Pagina de autentificare Argilla."/>
+
+Cu Argilla puteți:
+
+- transforma datele nestructurate în **date structurate** care să fie folosite în sarcini NLP.
+- cura un set de date pentru a trece de la un set de date de calitate scăzută la un **set de date de înaltă calitate**.
+- aduna **feedback uman** pentru LLM-uri și modele multi-modale.
+- invita experți să colaboreze cu dumneavoastră în Argilla, sau să aduceți adnotări de la mulțime!
+
+Iată câteva dintre lucrurile pe care le veți învăța în acest capitol:
+
+- Cum să vă configurați propria instanță Argilla.
+- Cum să încărcați un set de date și să îl configurați pe baza unor sarcini NLP populare.
+- Cum să folosiți interfața Argilla pentru a vă anota setul de date.
+- Cum să folosiți setul de date curat și să îl exportați către Hub. 
\ No newline at end of file
diff --git a/chapters/rum/chapter10/2.mdx b/chapters/rum/chapter10/2.mdx
new file mode 100644
index 000000000..e4505b45c
--- /dev/null
+++ b/chapters/rum/chapter10/2.mdx
@@ -0,0 +1,55 @@
+# Configurați-vă instanța Argilla[[configurați-vă-instanța-argilla]]
+
+<CourseFloatingBanner chapter={10}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter10/section2.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter10/section2.ipynb"},
+]} />
+
+Pentru a începe să folosiți Argilla, va trebui să configurați mai întâi propria instanță Argilla. Apoi va trebui să instalați SDK-ul Python pentru a putea gestiona Argilla folosind cod Python.
+
+## Implementați interfața Argilla
+
+Cea mai ușoară modalitate de a configura instanța Argilla este prin Hugging Face Spaces. Pentru a crea Space-ul Argilla, urmați pur și simplu [acest formular](https://huggingface.co/new-space?template=argilla%2Fargilla-template-space). Dacă aveți nevoie de îndrumări suplimentare, consultați [ghidul rapid Argilla](https://docs.argilla.io/latest/getting_started/quickstart/).
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter10/space_config.png" alt="Formularul de configurare Space."/>
+
+>[!WARNING]
+> ⚠️ S-ar putea să doriți să activați **Persistent storage** astfel încât datele să nu se piardă dacă Space-ul este pus în pauză sau repornit.
+> Puteți face asta din Settings-urile Space-ului dumneavoastră.
+
+Odată ce Argilla este operațională, vă puteți autentifica cu acreditările dumneavoastră.
+
+## Instalați și conectați SDK-ul Python
+
+Acum puteți merge în mediul Python sau notebook-ul dumneavoastră și instala biblioteca argilla:
+
+`!pip install argilla`
+
+Să ne conectăm cu instanța noastră Argilla. Pentru asta veți avea nevoie de următoarele informații:
+
+- **URL-ul API-ului dumneavoastră**: Acesta este URL-ul unde rulează Argilla. Dacă folosiți un Space, puteți deschide Space-ul, face clic pe cele trei puncte din colțul din dreapta sus, apoi "Embed this Space" și copiați **Direct URL**. Ar trebui să arate ca `https://<numele-utilizatorului>.<numele-space-ului>.hf.space`.
+- **Cheia API**: Pentru a obține cheia, autentificați-vă în instanța Argilla și mergeți la "My Settings", apoi copiați cheia API.
+- **Token-ul HF**: Dacă Space-ul dumneavoastră este privat, veți avea nevoie de un Access Token în contul Hugging Face Hub cu permisiuni de scriere.
+
+```python
+import argilla as rg
+
+HF_TOKEN = "..."  # doar pentru space-uri private
+
+client = rg.Argilla(
+    api_url="...",
+    api_key="...",
+    headers={"Authorization": f"Bearer {HF_TOKEN}"},  # doar pentru space-uri private
+)
+```
+
+Pentru a verifica că totul funcționează corect, vom apela `me`. Aceasta ar trebui să returneze utilizatorul nostru:
+
+```python
+client.me
+```
+
+Dacă a funcționat, instanța Argilla este operațională și sunteți conectat la ea! Felicitări!
+
+Acum putem începe să încărcăm primul nostru set de date în Argilla. 
\ No newline at end of file
diff --git a/chapters/rum/chapter10/3.mdx b/chapters/rum/chapter10/3.mdx
new file mode 100644
index 000000000..7a10d6612
--- /dev/null
+++ b/chapters/rum/chapter10/3.mdx
@@ -0,0 +1,108 @@
+# Încărcați setul de date în Argilla[[încărcați-setul-de-date-în-argilla]]
+
+<CourseFloatingBanner chapter={10}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter10/section3.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter10/section3.ipynb"},
+]} />
+
+În funcție de sarcina NLP cu care lucrați și cazul de utilizare sau aplicația specifică, datele dumneavoastră și sarcina de adnotare vor arăta diferit. Pentru această secțiune a cursului, vom folosi [un set de date care colectează știri](https://huggingface.co/datasets/SetFit/ag_news) pentru a completa două sarcini: o clasificare de text asupra subiectului fiecărui text și o clasificare de token-uri pentru a identifica entitățile numite menționate.
+
+<iframe
+  src="https://huggingface.co/datasets/SetFit/ag_news/embed/viewer/default/train"
+  frameborder="0"
+  width="100%"
+  height="560px"
+></iframe>
+
+Este posibil să importați seturi de date din Hub folosind direct interfața Argilla, dar vom folosi SDK-ul pentru a învăța cum putem face editări suplimentare la date dacă este necesar.
+
+## Configurați setul de date
+
+Primul pas este să ne conectăm la instanța Argilla așa cum am făcut în secțiunea anterioară:
+
+```python
+import argilla as rg
+
+HF_TOKEN = "..."  # doar pentru space-uri private
+
+client = rg.Argilla(
+    api_url="...",
+    api_key="...",
+    headers={"Authorization": f"Bearer {HF_TOKEN}"},  # doar pentru space-uri private
+)
+```
+
+Acum putem gândi la setările setului nostru de date în Argilla. Acestea reprezintă sarcina de adnotare pe care o vom face asupra datelor noastre. Mai întâi, putem încărca setul de date din Hub și să inspectăm caracteristicile acestuia, astfel încât să ne asigurăm că configurăm setul de date corect.
+
+```python
+from datasets import load_dataset
+
+data = load_dataset("SetFit/ag_news", split="train")
+data.features
+```
+
+Acestea sunt caracteristicile setului nostru de date:
+
+```python out
+{'text': Value(dtype='string', id=None),
+ 'label': Value(dtype='int64', id=None),
+ 'label_text': Value(dtype='string', id=None)}
+```
+
+Conține un `text` și de asemenea câteva etichete inițiale pentru clasificarea textului. Le vom adăuga la setările setului nostru de date împreună cu o întrebare `spans` pentru entitățile numite:
+
+```python
+settings = rg.Settings(
+    fields=[rg.TextField(name="text")],
+    questions=[
+        rg.LabelQuestion(
+            name="label", title="Clasificați textul:", labels=data.unique("label_text")
+        ),
+        rg.SpanQuestion(
+            name="entities",
+            title="Evidențiați toate entitățile din text:",
+            labels=["PERSON", "ORG", "LOC", "EVENT"],
+            field="text",
+        ),
+    ],
+)
+```
+
+Să aprofundăm puțin ce înseamnă aceste setări. Mai întâi, am definit **fields** (câmpuri), acestea includ informațiile pe care le vom anota. În acest caz, avem doar un câmp și vine sub forma unui text, așa că am ales un `TextField`.
+
+Apoi, definim **questions** (întrebări) care reprezintă sarcinile pe care vrem să le efectuăm asupra datelor noastre:
+
+- Pentru sarcina de clasificare de text am ales o `LabelQuestion` și am folosit valorile unice ale coloanei `label_text` ca etichetele noastre, pentru a ne asigura că întrebarea este compatibilă cu etichetele care există deja în setul de date.
+- Pentru sarcina de clasificare de token-uri, vom avea nevoie de o `SpanQuestion`. Am definit un set de etichete pe care le vom folosi pentru acea sarcină, plus câmpul pe care vom desena intervalele.
+
+Pentru a afla mai multe despre toate tipurile disponibile de câmpuri și întrebări și alte setări avansate, precum metadatele și vectorii, mergeți la [documentația Argilla](https://docs.argilla.io/latest/how_to_guides/dataset/#define-dataset-settings).
+
+## Încărcați setul de date
+
+Acum că am definit câteva setări, putem crea setul de date:
+
+```python
+dataset = rg.Dataset(name="ag_news", settings=settings)
+
+dataset.create()
+```
+
+Setul de date apare acum în instanța noastră Argilla, dar veți vedea că este gol:
+
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter10/empty_dataset.png" alt="Captură de ecran cu setul de date gol."/>
+
+Acum trebuie să adăugăm înregistrările pe care le vom anota, adică rândurile din setul nostru de date. Pentru a face asta, va trebui pur și simplu să înregistrăm datele ca înregistrări și să oferim o mapare pentru acele elemente care nu au același nume în seturile de date din hub și Argilla:
+
+```python
+dataset.records.log(data, mapping={"label_text": "label"})
+```
+
+În maparea noastră, am specificat că coloana `label_text` din setul de date ar trebui mapată la întrebarea cu numele `label`. În acest fel, vom folosi etichetele existente din setul de date ca pre-adnotări astfel încât să putem anota mai rapid.
+
+În timp ce înregistrările continuă să se înregistreze, puteți începe deja să lucrați cu setul de date în interfața Argilla. În acest moment, ar trebui să arate așa:
+
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter10/argilla_initial_dataset.png" alt="Captură de ecran cu setul de date în Argilla."/>
+
+Acum setul nostru de date este gata să începem adnotarea! 
\ No newline at end of file
diff --git a/chapters/rum/chapter10/4.mdx b/chapters/rum/chapter10/4.mdx
new file mode 100644
index 000000000..27ed77fce
--- /dev/null
+++ b/chapters/rum/chapter10/4.mdx
@@ -0,0 +1,44 @@
+# Adnotați setul de date[[adnotați-setul-de-date]]
+
+<CourseFloatingBanner
+    chapter={10}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+Acum este timpul să începem să lucrăm din interfața Argilla pentru a adnota setul nostru de date.
+
+## Aliniați echipa cu îndrumări de adnotare
+
+Înainte să începeți să adnotați setul de date, este întotdeauna o practică bună să scrieți câteva îndrumări, mai ales dacă lucrați ca parte dintr-o echipă. Aceasta vă va ajuta să vă aliniați asupra sarcinii și utilizării diferitelor etichete, și să rezolvați întrebările sau conflictele când apar.
+
+În Argilla, puteți merge la pagina de setări a setului de date din interfață și să modificați îndrumările și descrierile întrebărilor pentru a ajuta la aliniere.
+
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter10/argilla_dataset_settings.png" alt="Captură de ecran cu pagina Dataset Settings din Argilla."/>
+
+Dacă doriți să aprofundați subiectul despre cum să scrieți îndrumări bune, vă recomandăm să citiți [această postare de blog](https://argilla.io/blog/annotation-guidelines-practices) și referințele bibliografice menționate acolo.
+
+## Distribuiți sarcina
+
+În pagina de setări a setului de date, puteți de asemenea să schimbați setările de distribuire a setului de date. Aceasta vă va ajuta să adnotați mai eficient când lucrați ca parte dintr-o echipă. Valoarea implicită pentru răspunsurile minime trimise este 1, ceea ce înseamnă că de îndată ce o înregistrare are 1 răspuns trimis va fi considerată completă și va conta către progresul din setul de date.
+
+Uneori, doriți să aveți mai mult de un răspuns trimis per înregistrare, de exemplu, dacă doriți să analizați acordul între adnotatori în sarcina dumneavoastră. În acel caz, asigurați-vă că schimbați această setare la un număr mai mare, dar întotdeauna mai mic sau egal cu numărul total de adnotatori. Dacă lucrați singur la sarcină, doriți ca această setare să fie 1.
+
+## Adnotați înregistrări
+
+>[!TIP]
+>💡 Dacă implementați Argilla într-un Hugging Face Space, orice membri ai echipei se vor putea autentifica folosind Hugging Face OAuth. Altfel, s-ar putea să trebuiască să creați utilizatori pentru ei urmând [acest ghid](https://docs.argilla.io/latest/how_to_guides/user/).
+
+Când deschideți setul de date, veți realiza că prima întrebare este deja completată cu câteva etichete sugerate. Aceasta pentru că în secțiunea anterioară am mapat întrebarea noastră numită `label` la coloana `label_text` din setul de date, astfel încât trebuie pur și simplu să revizuim și să corectăm etichetele deja existente:
+
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter10/argilla_initial_dataset.png" alt="Captură de ecran cu setul de date în Argilla."/>
+
+Pentru clasificarea de token-uri, va trebui să adăugăm toate etichetele manual, deoarece nu am inclus nicio sugestie. Așa ar putea arăta după adnotările de interval:
+
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter10/argilla_dataset_with_spans.png" alt="Captură de ecran cu setul de date din Argilla cu intervale adnotate."/>
+
+Pe măsură ce vă deplasați prin diferitele înregistrări, există diferite acțiuni pe care le puteți întreprinde:
+- trimiteți răspunsurile, odată ce ați terminat cu înregistrarea.
+- salvați-le ca ciornă, în cazul în care doriți să reveniți la ele mai târziu.
+- renunțați la ele, dacă înregistrarea nu ar trebui să facă parte din setul de date sau nu veți da răspunsuri pentru ea.
+
+În secțiunea următoare, veți învăța cum puteți exporta și folosi acele adnotări. 
\ No newline at end of file
diff --git a/chapters/rum/chapter10/5.mdx b/chapters/rum/chapter10/5.mdx
new file mode 100644
index 000000000..ef60581df
--- /dev/null
+++ b/chapters/rum/chapter10/5.mdx
@@ -0,0 +1,69 @@
+# Folosiți setul de date adnotat[[folosiți-setul-de-date-adnotat]]
+
+<CourseFloatingBanner chapter={10}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter10/section5.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter10/section5.ipynb"},
+]} />
+
+Vom învăța acum cum să exportăm și să folosim datele adnotate pe care le avem în Argilla.
+
+## Încărcați setul de date
+
+Mai întâi, va trebui să ne asigurăm că suntem conectați la instanța noastră Argilla ca în pașii anteriori:
+
+```python
+import argilla as rg
+
+HF_TOKEN = "..."  # doar pentru space-uri private
+
+client = rg.Argilla(
+    api_url="...",
+    api_key="...",
+    headers={"Authorization": f"Bearer {HF_TOKEN}"},  # doar pentru space-uri private
+)
+```
+
+Și acum, vom încărca setul de date cu care vom lucra:
+
+```python
+dataset = client.datasets(name="ag_news")
+```
+
+Încărcarea setului de date și apelarea înregistrărilor sale cu `dataset.records` este suficient pentru a începe să folosiți setul de date și înregistrările pentru propriile scopuri și pipeline-uri. Cu toate acestea, vom învăța de asemenea cum să facem câteva operații opționale, precum filtrarea înregistrărilor și exportarea setului de date către Hugging Face Hub.
+
+## Filtrați setul de date
+
+Uneori doriți să folosiți doar înregistrările care au fost completate, așa că vom filtra mai întâi înregistrările din setul nostru de date pe baza statutului lor:
+
+```python
+status_filter = rg.Query(filter=rg.Filter([("status", "==", "completed")]))
+
+filtered_records = dataset.records(status_filter)
+```
+
+>[!TIP]
+>⚠️ Rețineți că înregistrările cu statutul `completed` (adică înregistrările care îndeplinesc răspunsurile minime trimise configurate în setările de distribuire a sarcinii) ar putea avea mai mult de un răspuns și că fiecare răspuns poate avea orice statut dintre `submitted`, `draft` sau `discarded`.
+
+Aflați mai multe despre interogarea și filtrarea înregistrărilor în [documentația Argilla](https://docs.argilla.io/latest/how_to_guides/query/).
+
+## Exportați către Hub
+
+Acum putem exporta adnotările noastre către Hugging Face Hub, astfel încât să le putem împărtăși cu alții. Pentru a face asta, va trebui să convertim înregistrările într-un 🤗 Dataset și apoi să îl împingem către Hub:
+
+```python
+filtered_records.to_datasets().push_to_hub("argilla/ag_news_annotated")
+```
+
+Alternativ, putem exporta direct setul de date Argilla complet (inclusiv înregistrările în așteptare) astfel:
+
+```python
+dataset.to_hub(repo_id="argilla/ag_news_annotated")
+```
+
+Aceasta este o alegere interesantă în cazul în care alții vor să deschidă setul de date în instanțele lor Argilla, deoarece setările sunt salvate automat și ei pot pur și simplu să importe setul de date complet folosind o singură linie de cod:
+
+```python
+dataset = rg.Dataset.from_hub(repo_id="argilla/ag_news_annotated")
+``` 
\ No newline at end of file
diff --git a/chapters/rum/chapter10/6.mdx b/chapters/rum/chapter10/6.mdx
new file mode 100644
index 000000000..41f0f5142
--- /dev/null
+++ b/chapters/rum/chapter10/6.mdx
@@ -0,0 +1,19 @@
+# Argilla, terminat![[argilla-terminat]]
+
+<CourseFloatingBanner
+    chapter={10}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+Asta e tot! Felicitări! 👏
+
+În acest capitol, ați învățat pașii de bază pentru a:
+- configura Argilla.
+- adnota pentru a îmbunătăți calitatea setului de date.
+- adapta un set de date existent și să îl reutilizați pentru o sarcină NLP diferită.
+- partaja setul de date adnotat cu comunitatea în Hugging Face Hub.
+
+## Ce urmează?
+- Verificați mai multe tutoriale pas cu pas pentru alte sarcini populare în [pagina de tutoriale](https://docs.argilla.io/latest/tutorials/).
+- Puteți de asemenea să explorați alte exemple de seturi de date în această [demonstrație](https://demo.argilla.io/sign-in?auth=ZGVtbzoxMjM0NTY3OA==).
+- Dacă doriți să continuați să învățați despre Argilla și caracteristici mai avansate, consultați [documentația Argilla](https://docs.argilla.io/latest/). 
\ No newline at end of file
diff --git a/chapters/rum/chapter10/7.mdx b/chapters/rum/chapter10/7.mdx
new file mode 100644
index 000000000..6ed08d5a9
--- /dev/null
+++ b/chapters/rum/chapter10/7.mdx
@@ -0,0 +1,186 @@
+<!-- DISABLE-FRONTMATTER-SECTIONS -->
+
+# Quiz de final de capitol[[quiz-de-final-de-capitol]]
+
+<CourseFloatingBanner
+    chapter={10}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+Să testăm ce ați învățat în acest capitol!
+
+### 1. Pentru ce puteți folosi Argilla?
+
+<Question
+	choices={[
+		{
+			text: "Pentru a transforma datele nestructurate în date structurate pentru sarcini NLP",
+			explain: "Puteți folosi Argilla pentru a adăuga adnotări la un set de date și să îl folosiți pentru sarcini NLP.",
+            correct: true
+		},
+		{
+			text: "Pentru a extrage date de pe un site web public pentru a construi un set de date",
+			explain: "Aceasta nu este o caracteristică din Argilla, dar puteți extrage date de pe un site web public și să îl transformați într-un set de date Argilla pentru adnotări folosind SDK-ul Python."
+		},
+		{
+			text: "Pentru a îmbunătăți calitatea unui set de date existent",
+			explain: "Puteți folosi adnotările anterioare ca sugestii și să le corectați pentru a îmbunătăți calitatea unui set de date.",
+			correct: true
+		},
+		{
+			text: "Pentru a adapta un set de date existent la propriul caz de utilizare",
+			explain: "Puteți folosi diferite tipuri de întrebări în Argilla pentru a adapta un set de date existent la propriul caz de utilizare.",
+			correct: true
+		},
+		{
+			text: "Pentru a antrena modelul",
+			explain: "Nu puteți antrena un model direct în Argilla, dar puteți folosi datele pe care le curați în Argilla pentru a antrena propriul model",
+		},
+		{
+			text: "Pentru a genera seturi de date sintetice",
+			explain: "Pentru a genera seturi de date sintetice, puteți folosi pachetul distilabel și apoi să folosiți Argilla pentru a revizui și cura datele generate.",
+		}
+	]}
+/>
+
+### 2. Argilla funcționează DOAR în Hugging Face Spaces și cu Hugging Face Datasets.
+
+<Question
+	choices={[
+        {
+			text: "Adevărat",
+			explain: "Puteți de asemenea să implementați Argilla local folosind Docker și puteți folosi SDK-ul Python pentru a încărca orice tip de date, inclusiv Hugging Face Datasets."
+        },
+        {
+			text: "Fals",
+			explain: "Puteți de asemenea să implementați Argilla local folosind Docker și puteți folosi SDK-ul Python pentru a încărca orice tip de date, inclusiv Hugging Face Datasets.",
+			correct: true
+        }
+	]}
+/>
+
+### 3. Aveți nevoie de un token Hugging Face pentru a conecta SDK-ul Python la serverul Argilla.
+
+<Question
+	choices={[
+        {
+			text: "Adevărat",
+			explain: "Aceasta este necesară doar dacă Space-ul Argilla este privat!",
+        },
+        {
+			text: "Fals",
+			explain: "Nu aveți nevoie de un token dacă folosiți un Space Argilla public sau o implementare locală cu Docker.",
+			correct: true
+        }
+	]}
+/>
+
+### 4. Ce sunt **câmpurile** în Argilla? Câte câmpuri puteți folosi?
+
+<Question
+	choices={[
+        {
+			text: "Câmpurile arată datele pe care le adnotăm. Toate aceste informații trebuie să fie colectate într-un singur câmp.",
+			explain: "Puteți să împărțiți informațiile pe mai multe câmpuri, dacă aveți nevoie."
+        },
+		{
+			text: "Câmpurile arată datele pe care le adnotăm. Toate aceste informații pot fi împărțite pe mai multe câmpuri.",
+			explain: "Da, puteți avea mai multe câmpuri și de asemenea câmpuri de diferite tipuri (text, chat, imagine...) în funcție de tipul de date pe care le adnotați.",
+			correct: true
+        },
+        {
+			text: "Câmpurile conțin metadatele înregistrărilor. Puteți folosi câte aveți nevoie.",
+			explain: "Puteți avea atât câmpuri cât și metadate în setul de date, dar ele servesc scopuri separate. Metadatele sunt folosite pentru filtrare și sortare ca informații extra, în timp ce câmpurile arată datele pe care le adnotăm."
+        }
+	]}
+/>
+
+### 5. Care este cel mai bun tip de întrebare pentru o sarcină de clasificare de token-uri?
+
+<Question
+	choices={[
+        {
+			text: "O SpanQuestion",
+			explain: "SpanQuestions vă permit să evidențiați bucăți de text și să aplicați o etichetă la ele. Acesta este cel mai bun tip pentru o sarcină de clasificare de token-uri.",
+            correct: true
+        },
+        {
+			text: "O LabelQuestion",
+			explain: "Acest tip de întrebare vă permite să selectați o etichetă care se aplică la întreaga înregistrare. Acest tip este cel mai bun pentru o sarcină de clasificare de text."
+        },
+        {
+			text: "O TextQuestion",
+			explain: "Acest tip de întrebare vă permite să scrieți text. Aceasta nu este potrivită pentru o sarcină de clasificare de token-uri."
+        },
+        {
+			text: "Niciuna din cele de mai sus",
+			explain: "SpanQuestions vă permit să evidențiați bucăți de text și să aplicați o etichetă la ele. Acesta este cel mai bun tip pentru o sarcină de clasificare de token-uri."
+        }
+	]}
+/>
+
+### 6. Care este scopul butonului "Save as draft"?
+
+<Question
+	choices={[
+        {
+			text: "Să trimiteți răspunsurile",
+			explain: "Acest buton salvează răspunsurile, dar nu le trimite",
+        },
+        {
+			text: "Să salvați răspunsurile fără să le trimiteți",
+			explain: "Aceasta este o metodă validă de încărcare a unui model Hugging Face din Hub",
+			correct: true
+        },
+        {
+			text: "Să renunțați la o înregistrare",
+			explain: "Încercați din nou -- nu puteți încărca un model folosind prefixul 'demos'."
+        }
+	]}
+/>
+
+### 7. Argilla nu oferă etichete sugerate automat, trebuie să furnizați acele date singur.
+
+<Question
+	choices={[
+        {
+			text: "Adevărat",
+			explain: "Puteți adăuga sugestii la înregistrările dumneavoastră (sau să le actualizați) în orice moment al proiectului.",
+            correct: true
+        },
+        {
+			text: "Fals",
+			explain: "Dacă doriți să vedeți etichete sugerate, trebuie să le înregistrați singur când creați înregistrările sau la un moment ulterior."
+        }
+	]}
+/>
+
+### 8. Selectați toți pașii necesari pentru a exporta complet un set de date Argilla către Hub:
+
+<Question
+	choices={[
+        {
+			text: "Trebuie să fiți conectat la serverul Argilla: <code>client= rg.Argilla(api_url='...', api_key='...')</code>",
+			explain: "Da, pentru a interacționa cu serverul va trebui să îl instanțiați mai întâi.",
+            correct: true
+        },
+		{
+			text: "Importați setul de date din hub: <code>dataset = rg.Dataset.from_hub(repo_id='argilla/ag_news_annotated')</code>",
+			explain: "Nu. Aceasta este pentru a importa un set de date din Hub în instanța Argilla.",
+        },
+        {
+			text: "Încărcați setul de date: <code>dataset = client.datasets(name='my_dataset')</code>",
+			explain: "Da, veți avea nevoie de aceasta pentru operații ulterioare",
+			correct: true
+        },
+        {
+			text: "Convertiți setul de date Argilla într-un set de date Datasets: <code>dataset = dataset.to_datasets()</code>",
+			explain: "Aceasta nu este necesară dacă exportați setul de date complet. Argilla se va ocupa de aceasta pentru dumneavoastră. Cu toate acestea, s-ar putea să aveți nevoie de ea dacă lucrați cu un subset de înregistrări."
+        },
+        {
+			text: "Folosiți metoda </code>to_hub</code> pentru a exporta setul de date: <code>dataset.to_hub(repo_id='my_username/dataset_name')</code>",
+			explain: "Aceasta va împinge setul de date la repo id-ul indicat, și va crea un repo nou dacă nu există.",
+            correct: true
+        },
+	]}
+/> 
\ No newline at end of file

From e3366b7b4a24aedaea6d9a94cb067f4ec21a5eec Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Thu, 29 May 2025 20:05:57 +0300
Subject: [PATCH 129/167] feat: add chapter11 translated contnet to romanian

---
 chapters/rum/_toctree.yml    |  19 ++
 chapters/rum/chapter11/1.mdx |  33 +++
 chapters/rum/chapter11/2.mdx | 253 +++++++++++++++++++++++
 chapters/rum/chapter11/3.mdx | 384 +++++++++++++++++++++++++++++++++++
 chapters/rum/chapter11/4.mdx | 171 ++++++++++++++++
 chapters/rum/chapter11/5.mdx | 214 +++++++++++++++++++
 chapters/rum/chapter11/6.mdx |  13 ++
 chapters/rum/chapter11/7.mdx |  31 +++
 8 files changed, 1118 insertions(+)
 create mode 100644 chapters/rum/chapter11/1.mdx
 create mode 100644 chapters/rum/chapter11/2.mdx
 create mode 100644 chapters/rum/chapter11/3.mdx
 create mode 100644 chapters/rum/chapter11/4.mdx
 create mode 100644 chapters/rum/chapter11/5.mdx
 create mode 100644 chapters/rum/chapter11/6.mdx
 create mode 100644 chapters/rum/chapter11/7.mdx

diff --git a/chapters/rum/_toctree.yml b/chapters/rum/_toctree.yml
index 25730606c..c032c79ae 100644
--- a/chapters/rum/_toctree.yml
+++ b/chapters/rum/_toctree.yml
@@ -26,3 +26,22 @@
   - local: chapter1/10
     title: Quiz de final de capitol
     quiz: 1
+
+- title: 11. Fine-tuning pentru modele mari de limbaj
+  subtitle: Folosiți fine-tuningul supervizat și adaptarea de rang scăzut pentru a ajusta fin un model mare de limbaj
+  sections:
+  - local: chapter11/1
+    title: Introducere
+  - local: chapter11/2
+    title: Template-uri de chat
+  - local: chapter11/3
+    title: Fine-tuning cu SFTTrainer
+  - local: chapter11/4
+    title: LoRA (Adaptarea de rang scăzut)
+  - local: chapter11/5
+    title: Evaluarea
+  - local: chapter11/6
+    title: Concluzie
+  - local: chapter11/7
+    title: E timpul examenului!
+    quiz: 11
diff --git a/chapters/rum/chapter11/1.mdx b/chapters/rum/chapter11/1.mdx
new file mode 100644
index 000000000..967010bab
--- /dev/null
+++ b/chapters/rum/chapter11/1.mdx
@@ -0,0 +1,33 @@
+# Fine-tuning supervizat
+
+În [Capitolul 2 Secțiunea 2](/course/chapter2/2), am văzut că modelele de limbaj generativ pot fi ajustate pentru sarcini specifice, cum ar fi rezumarea și răspunsul la întrebări. Cu toate acestea, în zilele noastre este mult mai frecvent să ajustăm modelele de limbaj pe o gamă largă de sarcini simultan; o metodă cunoscută sub numele de fine-tuning supervizat (SFT). Acest proces ajută modelele să devină mai versatile și capabile să gestioneze diverse cazuri de utilizare. Majoritatea LLM-urilor cu care oamenii interacționează pe platforme precum ChatGPT au trecut prin SFT pentru a fi mai utile și aliniate cu preferințele umane. Vom împărți acest capitol în patru secțiuni:
+
+## 1️⃣ Template-uri de chat
+
+Template-urile de chat structurează interacțiunile dintre utilizatori și modelele AI, asigurând răspunsuri consecvente și adecvate contextual. Acestea includ componente precum prompturi de sistem și mesaje bazate pe roluri.
+
+## 2️⃣ Fine-tuning supervizat
+
+Fine-tuningul supervizat (SFT) este un proces critic pentru adaptarea modelelor de limbaj pre-antrenate la sarcini specifice. Aceasta implică antrenarea modelului pe un set de date specific sarcinii cu exemple etichetate. Pentru un ghid detaliat despre SFT, inclusiv pașii cheie și cele mai bune practici, consultați [secțiunea de fine-tuning supervizat din documentația TRL](https://huggingface.co/docs/trl/en/sft_trainer).
+
+## 3️⃣ Adaptarea de rang scăzut (LoRA)
+
+Adaptarea de rang scăzut (LoRA) este o tehnică pentru fine-tuningul modelelor de limbaj prin adăugarea de matrice de rang scăzut la straturile modelului. Aceasta permite un fine-tuning eficient păstrând în același timp cunoștințele pre-antrenate ale modelului. Unul dintre beneficiile cheie ale LoRA este economia semnificativă de memorie pe care o oferă, făcând posibilă ajustarea modelelor mari pe hardware cu resurse limitate.
+
+## 4️⃣ Evaluarea
+
+Evaluarea este un pas crucial în procesul de fine-tuning. Ne permite să măsurăm performanța modelului pe un set de date specific sarcinii.
+
+<Tip>
+⚠️ Pentru a beneficia de toate funcționalitățile disponibile cu Model Hub și 🤗 Transformers, recomandăm <a href="https://huggingface.co/join">crearea unui cont</a>.
+</Tip>
+
+## Referințe
+
+- [Documentația Transformers despre template-urile de chat](https://huggingface.co/docs/transformers/main/en/chat_templating)
+- [Script pentru fine-tuning supervizat în TRL](https://github.com/huggingface/trl/blob/main/trl/scripts/sft.py)
+- [`SFTTrainer` în TRL](https://huggingface.co/docs/trl/main/en/sft_trainer)
+- [Lucrarea despre optimizarea directă a preferințelor](https://arxiv.org/abs/2305.18290)
+- [Fine-tuning supervizat cu TRL](https://huggingface.co/docs/trl/sft_trainer)
+- [Cum să faceți fine-tuning la Google Gemma cu ChatML și Hugging Face TRL](https://github.com/huggingface/alignment-handbook)  
+- [Fine-tuning LLM pentru a genera cataloage de produse persane în format JSON](https://huggingface.co/learn/cookbook/en/fine_tuning_llm_to_generate_persian_product_catalogs_in_json_format) 
\ No newline at end of file
diff --git a/chapters/rum/chapter11/2.mdx b/chapters/rum/chapter11/2.mdx
new file mode 100644
index 000000000..b5fe8d46a
--- /dev/null
+++ b/chapters/rum/chapter11/2.mdx
@@ -0,0 +1,253 @@
+<CourseFloatingBanner chapter={2}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/main/course/en/chapter11/section2.ipynb"},
+]} />
+
+# Template-uri de chat
+
+## Introducere
+
+Template-urile de chat sunt esențiale pentru structurarea interacțiunilor dintre modelele de limbaj și utilizatori. Indiferent dacă construiți un chatbot simplu sau un agent AI complex, înțelegerea modului de a formata corect conversațiile este crucială pentru a obține cele mai bune rezultate de la modelul dumneavoastră. În acest ghid, vom explora ce sunt template-urile de chat, de ce sunt importante și cum să le folosiți eficient.
+
+<Tip>
+Template-urile de chat sunt cruciale pentru:
+- Menținerea unei structuri consecvente de conversație
+- Asigurarea identificării corecte a rolurilor
+- Gestionarea contextului pe mai multe tururi
+- Suportarea funcționalităților avansate precum utilizarea instrumentelor
+</Tip>
+
+## Tipuri de modele și template-uri
+
+### Modele de bază versus modele instruct
+Un model de bază este antrenat pe date text brute pentru a prezice următorul token, în timp ce un model instruct este ajustat specific pentru a urma instrucțiuni și a se angaja în conversații. De exemplu, [`SmolLM2-135M`](https://huggingface.co/HuggingFaceTB/SmolLM2-135M) este un model de bază, în timp ce [`SmolLM2-135M-Instruct`](https://huggingface.co/HuggingFaceTB/SmolLM2-135M-Instruct) este varianta sa ajustată pentru instrucțiuni.
+
+Modelele ajustate pentru instrucțiuni sunt antrenate să urmeze o structură conversațională specifică, făcându-le mai potrivite pentru aplicații de chatbot. Mai mult, modelele instruct pot gestiona interacțiuni complexe, inclusiv utilizarea instrumentelor, intrări multimodale și apeluri de funcții.
+
+Pentru a face ca un model de bază să se comporte ca un model instruct, trebuie să formatăm prompturile într-un mod consecvent pe care modelul să îl înțeleagă. Aici intervin template-urile de chat. ChatML este unul dintre aceste formate de template care structurează conversațiile cu indicatori clari de rol (sistem, utilizator, asistent). Iată un ghid despre [ChatML](https://huggingface.co/HuggingFaceTB/SmolLM2-135M-Instruct/blob/e2c3f7557efbdec707ae3a336371d169783f1da1/tokenizer_config.json#L146).
+
+<Tip warning={true}>
+Când folosiți un model instruct, verificați întotdeauna că folosiți formatul corect de template de chat. Folosirea unui template greșit poate duce la performanțe slabe ale modelului sau comportament neașteptat. Cea mai ușoară modalitate de a vă asigura de acest lucru este să verificați configurația tokenizer-ului modelului pe Hub. De exemplu, modelul `SmolLM2-135M-Instruct` folosește <a href="https://huggingface.co/HuggingFaceTB/SmolLM2-135M-Instruct/blob/e2c3f7557efbdec707ae3a336371d169783f1da1/tokenizer_config.json#L146">această configurație</a>.
+</Tip>
+
+### Formate comune de template
+
+Înainte de a aprofunda implementări specifice, este important să înțelegem cum diferite modele se așteaptă ca conversațiile lor să fie formatate. Să explorăm câteva formate comune de template folosind un exemplu simplu de conversație:
+
+Vom folosi următoarea structură de conversație pentru toate exemplele:
+
+```python
+messages = [
+    {"role": "system", "content": "You are a helpful assistant."},
+    {"role": "user", "content": "Hello!"},
+    {"role": "assistant", "content": "Hi! How can I help you today?"},
+    {"role": "user", "content": "What's the weather?"},
+]
+```
+
+Acesta este template-ul ChatML folosit în modele precum SmolLM2 și Qwen 2:
+
+```sh
+<|im_start|>system
+You are a helpful assistant.<|im_end|>
+<|im_start|>user
+Hello!<|im_end|>
+<|im_start|>assistant
+Hi! How can I help you today?<|im_end|>
+<|im_start|>user
+What's the weather?<|im_start|>assistant
+```
+
+Acesta folosește formatul de template `mistral`:
+
+```sh
+<s>[INST] You are a helpful assistant. [/INST]
+Hi! How can I help you today?</s>
+[INST] Hello! [/INST]
+```
+
+Diferențele cheie între aceste formate includ:
+1. **Gestionarea mesajelor de sistem**:
+   - Llama 2 înfășoară mesajele de sistem în etichete `<<SYS>>`
+   - Llama 3 folosește etichete `<|system|>` cu încheierea `</s>`
+   - Mistral include mesajul de sistem în prima instrucțiune
+   - Qwen folosește rolul explicit `system` cu etichete `<|im_start|>`
+   - ChatGPT folosește prefixul `SYSTEM:`
+
+2. **Granițele mesajelor**:
+   - Llama 2 folosește etichete `[INST]` și `[/INST]`
+   - Llama 3 folosește etichete specifice rolurilor (`<|system|>`, `<|user|>`, `<|assistant|>`) cu încheierea `</s>`
+   - Mistral folosește `[INST]` și `[/INST]` cu `<s>` și `</s>`
+   - Qwen folosește token-uri de start/sfârșit specifice rolurilor
+
+3. **Token-uri speciale**:
+   - Llama 2 folosește `<s>` și `</s>` pentru granițele conversației
+   - Llama 3 folosește `</s>` pentru a încheia fiecare mesaj
+   - Mistral folosește `<s>` și `</s>` pentru granițele turului
+   - Qwen folosește token-uri de start/sfârșit specifice rolurilor
+
+Înțelegerea acestor diferențe este cheia pentru a lucra cu modele variate. Să vedem cum biblioteca transformers ne ajută să gestionăm aceste variații automat:
+
+```python
+from transformers import AutoTokenizer
+
+# Acestea vor folosi template-uri diferite automat
+mistral_tokenizer = AutoTokenizer.from_pretrained("mistralai/Mistral-7B-Instruct-v0.1")
+qwen_tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen-7B-Chat")
+smol_tokenizer = AutoTokenizer.from_pretrained("HuggingFaceTB/SmolLM2-135M-Instruct")
+
+messages = [
+    {"role": "system", "content": "You are a helpful assistant."},
+    {"role": "user", "content": "Hello!"},
+]
+
+# Fiecare va formata conform template-ului modelului său
+mistral_chat = mistral_tokenizer.apply_chat_template(messages, tokenize=False)
+qwen_chat = qwen_tokenizer.apply_chat_template(messages, tokenize=False)
+smol_chat = smol_tokenizer.apply_chat_template(messages, tokenize=False)
+```
+
+<details>
+<summary>Faceți clic pentru a vedea exemplele de template</summary>
+
+Template ChatML pentru Qwen 2 și SmolLM2:
+
+```sh
+<|im_start|>system
+You are a helpful assistant.<|im_end|>
+<|im_start|>user
+Hello!<|im_end|>
+<|im_start|>assistant
+Hi! How can I help you today?<|im_end|>
+<|im_start|>user
+What's the weather?<|im_start|>assistant
+```
+
+Template Mistral:
+
+```sh
+<s>[INST] You are a helpful assistant. [/INST]
+Hi! How can I help you today?</s>
+[INST] Hello! [/INST]
+```
+
+</details>
+
+### Funcționalități avansate
+Template-urile de chat pot gestiona scenarii mai complexe dincolo de simpla interacțiune conversațională, inclusiv:
+
+1. **Utilizarea instrumentelor**: Când modelele trebuie să interacționeze cu instrumente externe sau API-uri
+2. **Intrări multimodale**: Pentru gestionarea imaginilor, audio sau alte tipuri de media
+3. **Apeluri de funcții**: Pentru executarea structurată de funcții
+4. **Context multi-turn**: Pentru menținerea istoricului conversației
+
+<Tip>
+Când implementați funcționalități avansate:
+- Testați temeinic cu modelul dumneavoastră specific. Template-urile de viziune și utilizare a instrumentelor sunt deosebit de diverse.
+- Monitorizați cu atenție utilizarea token-urilor între fiecare funcționalitate și model.
+- Documentați formatul așteptat pentru fiecare funcționalitate
+</Tip>
+
+Pentru conversații multimodale, template-urile de chat pot include referințe la imagini sau imagini codificate în base64:
+
+```python
+messages = [
+    {
+        "role": "system",
+        "content": "You are a helpful vision assistant that can analyze images.",
+    },
+    {
+        "role": "user",
+        "content": [
+            {"type": "text", "text": "What's in this image?"},
+            {"type": "image", "image_url": "https://example.com/image.jpg"},
+        ],
+    },
+]
+```
+
+Iată un exemplu de template de chat cu utilizarea instrumentelor:
+
+```python
+messages = [
+    {
+        "role": "system",
+        "content": "You are an AI assistant that can use tools. Available tools: calculator, weather_api",
+    },
+    {"role": "user", "content": "What's 123 * 456 and is it raining in Paris?"},
+    {
+        "role": "assistant",
+        "content": "Let me help you with that.",
+        "tool_calls": [
+            {
+                "tool": "calculator",
+                "parameters": {"operation": "multiply", "x": 123, "y": 456},
+            },
+            {"tool": "weather_api", "parameters": {"city": "Paris", "country": "France"}},
+        ],
+    },
+    {"role": "tool", "tool_name": "calculator", "content": "56088"},
+    {
+        "role": "tool",
+        "tool_name": "weather_api",
+        "content": "{'condition': 'rain', 'temperature': 15}",
+    },
+]
+```
+
+## Cele mai bune practici
+
+### Ghiduri generale
+Când lucrați cu template-uri de chat, urmați aceste practici cheie:
+
+1. **Formatare consecventă**: Folosiți întotdeauna același format de template în toată aplicația
+2. **Definirea clară a rolurilor**: Specificați clar rolurile (sistem, utilizator, asistent, instrument) pentru fiecare mesaj
+3. **Gestionarea contextului**: Fiți atenți la limitele token-urilor când mențineți istoricul conversației
+4. **Gestionarea erorilor**: Includeți gestionarea adecvată a erorilor pentru apelurile de instrumente și intrările multimodale
+5. **Validare**: Validați structura mesajelor înainte de a le trimite la model
+
+<Tip warning={true}>
+Capcane comune de evitat:
+- Amestecarea diferitelor formate de template în aceeași aplicație
+- Depășirea limitelor de token-uri cu istoricuri lungi de conversație
+- Neescaparea corespunzătoare a caracterelor speciale în mesaje
+- Uitarea validării structurii mesajelor de intrare
+- Ignorarea cerințelor specifice de template ale modelului
+</Tip>
+
+## Exercițiu practic
+
+Să exersăm implementarea template-urilor de chat cu un exemplu din lumea reală.
+
+<Tip>
+Urmați acești pași pentru a converti setul de date `HuggingFaceTB/smoltalk` în formatul chatml:
+
+1. Încărcați setul de date:
+```python
+from datasets import load_dataset
+
+dataset = load_dataset("HuggingFaceTB/smoltalk")
+```
+
+2. Creați o funcție de procesare:
+```python
+def convert_to_chatml(example):
+    return {
+        "messages": [
+            {"role": "user", "content": example["input"]},
+            {"role": "assistant", "content": example["output"]},
+        ]
+    }
+```
+
+3. Aplicați template-ul de chat folosind tokenizer-ul modelului ales
+
+Amintiți-vă să validați că formatul de ieșire se potrivește cu cerințele modelului țintă!
+</Tip>
+
+## Resurse adiționale
+
+- [Ghidul Hugging Face pentru template-uri de chat](https://huggingface.co/docs/transformers/main/en/chat_templating)
+- [Documentația Transformers](https://huggingface.co/docs/transformers)
+- [Depozitul de exemple pentru template-uri de chat](https://github.com/chujiezheng/chat_templates) 
\ No newline at end of file
diff --git a/chapters/rum/chapter11/3.mdx b/chapters/rum/chapter11/3.mdx
new file mode 100644
index 000000000..1d9f924a2
--- /dev/null
+++ b/chapters/rum/chapter11/3.mdx
@@ -0,0 +1,384 @@
+<CourseFloatingBanner chapter={2}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/main/course/en/chapter11/section3.ipynb"},
+]} />
+
+# Fine-tuning supervizat
+
+Fine-tuningul supervizat (SFT) este un proces folosit în principal pentru a adapta modelele de limbaj pre-antrenate să urmeze instrucțiuni, să se angajeze în dialog și să folosească formate specifice de ieșire. În timp ce modelele pre-antrenate au capacități generale impresionante, SFT ajută la transformarea lor în modele asemănătoare asistentului care pot înțelege și răspunde mai bine la prompturile utilizatorilor. Acest lucru se realizează de obicei prin antrenare pe seturi de date cu conversații și instrucțiuni scrise de oameni.
+
+Această pagină oferă un ghid pas cu pas pentru fine-tuningul modelului [`deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B`](https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B) folosind [`SFTTrainer`](https://huggingface.co/docs/trl/en/sft_trainer). Urmând acești pași, puteți adapta modelul să îndeplinească anumite sarcini mai eficient.
+
+## Când să utilizați SFT
+
+Înainte de a se adânci în implementare, este important să înțelegem când SFT este alegerea potrivită pentru proiectul dumneavoastră. Ca primul pas, ar trebui să considerați dacă folosirea unui model existent ajustat pentru instrucțiuni cu prompturi bine elaborate ar fi suficientă pentru cazul dumneavoastră de utilizare. SFT implică resurse computaționale semnificative și efort de inginerie, așa că ar trebui urmărit doar când promptarea modelelor existente se dovedește insuficientă.
+
+<Tip>
+Considerați SFT doar dacă:
+- Aveți nevoie de performanțe suplimentare dincolo de ceea ce poate realiza promptarea
+- Aveți un caz de utilizare specific în care costul folosirii unui model mare de uz general depășește costul fine-tuningului unui model mai mic
+- Aveți nevoie de formate de ieșire specializate sau cunoștințe specifice domeniului cu care modelele existente se confruntă
+</Tip>
+
+Dacă determinați că SFT este necesar, decizia de a continua depinde de doi factori principali:
+
+### Controlul template-ului
+SFT permite control precis asupra structurii de ieșire a modelului. Acest lucru este deosebit de valoros când aveți nevoie ca modelul să:
+1. Genereze răspunsuri într-un format specific de template de chat
+2. Urmeze scheme stricte de ieșire
+3. Mențină stiluri consecvente în toate răspunsurile
+
+### Adaptarea la domeniu
+Când lucrați în domenii specializate, SFT ajută la alinierea modelului cu cerințele specifice domeniului prin:
+1. Predarea terminologiei și conceptelor domeniului
+2. Impunerea standardelor profesionale
+3. Gestionarea adecvată a întrebărilor tehnice
+4. Urmarea ghidurilor specifice industriei
+
+<Tip>
+Înainte de a începe SFT, evaluați dacă cazul dumneavoastră de utilizare necesită:
+- Formatare precisă de ieșire
+- Cunoștințe specifice domeniului
+- Modele consecvente de răspuns
+- Aderarea la ghiduri specifice
+
+Această evaluare va ajuta să determinați dacă SFT este abordarea potrivită pentru nevoile dumneavoastră.
+</Tip>
+
+## Pregătirea setului de date
+
+Procesul de fine-tuning supervizat necesită un set de date specific sarcinii structurat cu perechi intrare-ieșire. Fiecare pereche ar trebui să conțină:
+1. Un prompt de intrare
+2. Răspunsul așteptat al modelului
+3. Orice context sau metadate suplimentare
+
+Calitatea datelor de antrenare este crucială pentru succesul fine-tuningului. Să vedem cum să pregătim și să validăm setul de date:
+
+<iframe
+  src="https://huggingface.co/datasets/HuggingFaceTB/smoltalk/embed/viewer/all/train?row=0"
+  frameborder="0"
+  width="100%"
+  height="360px"
+></iframe>
+
+## Configurația antrenamentului
+
+Succesul fine-tuningului depinde în mare măsură de alegerea parametrilor de antrenare corecți. Să explorăm fiecare parametru important și cum să îi configurați eficient:
+
+Configurația SFTTrainer necesită considerarea mai multor parametri care controlează procesul de antrenare. Să explorăm fiecare parametru și scopul lor:
+
+1. **Parametrii duratei antrenamentului**:
+   - `num_train_epochs`: Controlează durata totală a antrenamentului
+   - `max_steps`: Alternativă la epoci, stabilește numărul maxim de pași de antrenare
+   - Mai multe epoci permit învățare mai bună dar riscă supraadaptarea
+
+2. **Parametrii dimensiunii batch-ului**:
+   - `per_device_train_batch_size`: Determină utilizarea memoriei și stabilitatea antrenamentului
+   - `gradient_accumulation_steps`: Permite dimensiuni efective mai mari ale batch-ului
+   - Batch-uri mai mari oferă gradienți mai stabili dar necesită mai multă memorie
+
+3. **Parametrii ratei de învățare**:
+   - `learning_rate`: Controlează dimensiunea actualizărilor greutăților
+   - `warmup_ratio`: Porțiunea de antrenament folosită pentru încălzirea ratei de învățare
+   - Prea mare poate cauza instabilitate, prea mică rezultă în învățare lentă
+
+4. **Parametrii de monitorizare**:
+   - `logging_steps`: Frecvența înregistrării metricilor
+   - `eval_steps`: Cât de des să evalueze pe datele de validare
+   - `save_steps`: Frecvența salvării punctelor de verificare ale modelului
+
+<Tip>
+Începeți cu valori conservatoare și ajustați bazat pe monitorizare:
+- Începeți cu 1-3 epoci
+- Folosiți dimensiuni mai mici ale batch-ului inițial
+- Monitorizați metricile de validare atent
+- Ajustați rata de învățare dacă antrenamentul este instabil
+</Tip>
+
+## Implementare cu TRL
+
+Acum că înțelegem componentele cheie, să implementăm antrenamentul cu validare și monitorizare adecvate. Vom folosi clasa `SFTTrainer` din biblioteca Transformers Reinforcement Learning (TRL), care este construită pe biblioteca `transformers`. Iată un exemplu complet folosind biblioteca TRL:
+
+```python
+from datasets import load_dataset
+from trl import SFTConfig, SFTTrainer
+import torch
+
+# Setați dispozitivul
+device = "cuda" if torch.cuda.is_available() else "cpu"
+
+# Încărcați setul de date
+dataset = load_dataset("HuggingFaceTB/smoltalk", "all")
+
+# Configurați modelul și tokenizer-ul
+model_name = "HuggingFaceTB/SmolLM2-135M"
+model = AutoModelForCausalLM.from_pretrained(pretrained_model_name_or_path=model_name).to(
+    device
+)
+tokenizer = AutoTokenizer.from_pretrained(pretrained_model_name_or_path=model_name)
+# Configurați template-ul de chat
+model, tokenizer = setup_chat_format(model=model, tokenizer=tokenizer)
+
+# Configurați trainer-ul
+training_args = SFTConfig(
+    output_dir="./sft_output",
+    max_steps=1000,
+    per_device_train_batch_size=4,
+    learning_rate=5e-5,
+    logging_steps=10,
+    save_steps=100,
+    eval_strategy="steps",
+    eval_steps=50,
+)
+
+# Inițializați trainer-ul
+trainer = SFTTrainer(
+    model=model,
+    args=training_args,
+    train_dataset=dataset["train"],
+    eval_dataset=dataset["test"],
+    processing_class=tokenizer,
+)
+
+# Începeți antrenamentul
+trainer.train()
+```
+
+<Tip>
+Când folosiți un set de date cu un câmp "messages" (ca exemplul de mai sus), SFTTrainer aplică automat template-ul de chat al modelului, pe care îl recuperează de pe hub. Aceasta înseamnă că nu aveți nevoie de nicio configurație suplimentară pentru a gestiona conversațiile în stil chat - trainer-ul va formata mesajele conform formatului de template așteptat al modelului.
+</Tip>
+
+## Împachetarea setului de date
+
+SFTTrainer suportă împachetarea exemplelor pentru a optimiza eficiența antrenamentului. Această funcționalitate permite ca mai multe exemple scurte să fie împachetate în aceeași secvență de intrare, maximizând utilizarea GPU în timpul antrenamentului. Pentru a activa împachetarea, pur și simplu setați `packing=True` în constructorul SFTConfig. Când folosiți seturi de date împachetate cu `max_steps`, fiți conștienți că s-ar putea să antrenați pentru mai multe epoci decât ați așteptat, în funcție de configurația de împachetare. Puteți personaliza modul în care exemplele sunt combinate folosind o funcție de formatare - deosebit de utilă când lucrați cu seturi de date care au mai multe câmpuri precum perechi întrebare-răspuns. Pentru seturile de date de evaluare, puteți dezactiva împachetarea setând `eval_packing=False` în SFTConfig. Iată un exemplu de bază de personalizare a configurației de împachetare:
+
+```python
+# Configurați împachetarea
+training_args = SFTConfig(packing=True)
+
+trainer = SFTTrainer(model=model, train_dataset=dataset, args=training_args)
+
+trainer.train()
+```
+
+Când împachetați setul de date cu mai multe câmpuri, puteți defini o funcție de formatare personalizată pentru a combina câmpurile într-o singură secvență de intrare. Această funcție ar trebui să ia o listă de exemple și să returneze un dicționar cu secvența de intrare împachetată. Iată un exemplu de funcție de formatare personalizată:
+
+```python
+def formatting_func(example):
+    text = f"### Question: {example['question']}\n ### Answer: {example['answer']}"
+    return text
+
+
+training_args = SFTConfig(packing=True)
+trainer = SFTTrainer(
+    "facebook/opt-350m",
+    train_dataset=dataset,
+    args=training_args,
+    formatting_func=formatting_func,
+)
+```
+
+## Monitorizarea progresului antrenamentului
+
+Monitorizarea eficientă este crucială pentru succesul fine-tuningului. Să explorăm ce să urmărim în timpul antrenamentului:
+
+### Înțelegerea modelelor de pierdere
+
+Pierderea antrenamentului urmează de obicei trei faze distincte:
+1. Scădere abruptă inițială: Adaptare rapidă la noua distribuție de date
+2. Stabilizare graduală: Rata de învățare încetinește pe măsură ce modelul se ajustează fin
+3. Convergența: Valorile pierderilor se stabilizează, indicând finalizarea antrenamentului
+
+<img src="https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/nlp_course_sft_loss_graphic.png" alt="Antrenamentul SFTTrainer" />
+
+### Metrici de monitorizat
+
+Monitorizarea eficientă implică urmărirea metricilor cantitative și evaluarea metricilor calitative. Metricile disponibile sunt:
+
+- Pierderea antrenamentului
+- Pierderea validării
+- Progresia ratei de învățare
+- Normele gradientului
+
+<Tip warning={true}>
+Urmăriți aceste semne de avertizare în timpul antrenamentului:
+1. Pierderea validării crește în timp ce pierderea antrenamentului scade (supraadaptare)
+2. Nicio îmbunătățire semnificativă în valorile pierderilor (subadaptare)
+3. Valori extrem de mici ale pierderilor (posibilă memorizare)
+4. Formatare inconsistentă a ieșirii (probleme de învățare a template-ului)
+</Tip>
+
+### Calea către convergență
+
+Pe măsură ce antrenamentul progresează, curba pierderii ar trebui să se stabilizeze treptat. Indicatorul cheie al antrenamentului sănătos este un decalaj mic între pierderea antrenamentului și cea de validare, sugerând că modelul învață modele generalizabile mai degrabă decât să memoreze exemple specifice. Valorile absolute ale pierderilor vor varia în funcție de sarcina și setul de date.
+
+### Monitorizarea progresului antrenamentului
+
+Graficul de mai sus arată o progresie tipică a antrenamentului. Observați cum atât pierderea antrenamentului, cât și cea de validare scad brusc la început, apoi se nivelează treptat. Acest model indică faptul că modelul învață eficient menținând în același timp capacitatea de generalizare.
+
+### Semne de avertizare de urmărit
+
+Mai multe modele în curbele pierderilor pot indica probleme potențiale. Mai jos ilustrăm semne comune de avertizare și soluții pe care le putem considera.
+
+<img src="https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/sft_loss_1.png" alt="Antrenamentul SFTTrainer" />
+
+Dacă pierderea validării scade cu o rată semnificativ mai lentă decât pierderea antrenamentului, modelul probabil se supraadaptează la datele de antrenare. Considerați:
+- Reducerea pașilor de antrenare
+- Creșterea dimensiunii setului de date
+- Validarea calității și diversității setului de date
+
+<img src="https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/sft_loss_2.png" alt="Antrenamentul SFTTrainer" />
+
+Dacă pierderea nu arată îmbunătățiri semnificative, modelul ar putea să:
+- Învețe prea încet (încercați să creșteți rata de învățare)
+- Se confrunte cu sarcina (verificați calitatea datelor și complexitatea sarcinii)
+- Atingă limitările arhitecturii (considerați un model diferit)
+
+<img src="https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/sft_loss_3.png" alt="Antrenamentul SFTTrainer" />
+
+Valori extrem de mici ale pierderilor ar putea sugera memorizare mai degrabă decât învățare. Acest lucru este deosebit de îngrijorător dacă:
+- Modelul performează slab pe exemple noi, similare
+- Ieșirile lipsesc de diversitate
+- Răspunsurile sunt prea similare cu exemplele de antrenare
+
+<Tip warning={true}>
+Monitorizați atât valorile pierderilor, cât și ieșirile efective ale modelului în timpul antrenamentului. Uneori pierderea poate arăta bine în timp ce modelul dezvoltă comportamente nedorite. Evaluarea calitativă regulată a răspunsurilor modelului ajută la detectarea problemelor pe care metricile singure le-ar putea rata.
+</Tip>
+
+Ar trebui să observăm că interpretarea valorilor pierderilor pe care o descriem aici este destinată cazului cel mai comun, și de fapt, valorile pierderilor se pot comporta în moduri diferite în funcție de model, setul de date, parametrii de antrenare, etc. Dacă sunteți interesați să explorați mai multe despre modelele descrise, ar trebui să consultați acest articol de blog de la oamenii de la [Fast AI](https://www.fast.ai/posts/2023-09-04-learning-jumps/).
+
+## Evaluarea după SFT
+
+În secțiunea [11.4](/en/chapter11/4) vom învăța cum să evaluăm modelul folosind seturi de date de referință. Pentru moment, ne vom concentra pe evaluarea calitativă a modelului.
+
+După finalizarea SFT, considerați aceste acțiuni de urmărire:
+
+1. Evaluați modelul temeinic pe datele de test păstrate deoparte
+2. Validați aderarea la template pe diverse intrări
+3. Testați reținerea cunoștințelor specifice domeniului
+4. Monitorizați metricile de performanță din lumea reală
+
+<Tip>
+Documentați procesul de antrenare, inclusiv:
+- Caracteristicile setului de date
+- Parametrii antrenamentului
+- Metricile de performanță
+- Limitările cunoscute
+Această documentație va fi valoroasă pentru iterațiile viitoare ale modelului.
+</Tip>
+
+## Chestionar
+
+### 1. Ce parametri controlează durata antrenamentului în SFT?
+
+<Question
+	choices={[
+		{
+			text: "num_train_epochs și max_steps",
+			explain: "Corect! Acești parametri determină cât timp va antrena modelul, fie prin numărul de epoci, fie prin pașii totali.",
+			correct: true
+		},
+		{
+			text: "batch_size și learning_rate",
+			explain: "Deși aceștia afectează antrenamentul, nu controlează direct durata."
+		},
+		{
+			text: "gradient_checkpointing și warmup_ratio",
+			explain: "Acești parametri afectează eficiența și stabilitatea antrenamentului, nu durata."
+		}
+	]}
+/>
+
+### 2. Ce model în curbele pierderilor indică supraadaptarea potențială?
+
+<Question
+    choices={[
+        {
+            text: "Pierderea validării crește în timp ce pierderea antrenamentului continuă să scadă",
+            explain: "Corect! Această divergență între pierderea antrenamentului și cea de validare este un semn clasic al supraadaptării.",
+            correct: true
+        },
+        {
+            text: "Atât pierderea antrenamentului, cât și cea de validare scad constant",
+            explain: "Acest model indică de fapt un antrenament sănătos."
+        },
+        {
+            text: "Pierderea antrenamentului rămâne constantă în timp ce pierderea validării scade",
+            explain: "Acesta ar fi un model neobișnuit și nu indică supraadaptarea."
+        }
+    ]}
+/>
+
+### 3. Pentru ce este folosit gradient_accumulation_steps?
+
+<Question
+    choices={[
+        {
+            text: "Pentru a crește dimensiunea efectivă a batch-ului fără a folosi mai multă memorie",
+            explain: "Corect! Acumulează gradienții pe mai multe treceri înainte înainte de a actualiza greutățile.",
+            correct: true
+        },
+        {
+            text: "Pentru a salva puncte de verificare în timpul antrenamentului",
+            explain: "Aceasta este gestionată de parametrii save_steps și save_strategy."
+        },
+        {
+            text: "Pentru a controla programul ratei de învățare",
+            explain: "Programarea ratei de învățare este controlată de learning_rate și warmup_ratio."
+        }
+    ]}
+/>
+
+### 4. Ce ar trebui să monitorizați în timpul antrenamentului SFT?
+
+<Question
+    choices={[
+        {
+            text: "Atât metricile cantitative, cât și ieșirile calitative",
+            explain: "Corect! Monitorizarea ambelor tipuri de metrici ajută la detectarea tuturor problemelor potențiale.",
+            correct: true
+        },
+        {
+            text: "Doar pierderea antrenamentului",
+            explain: "Pierderea antrenamentului singură nu este suficientă pentru a asigura un comportament bun al modelului."
+        },
+        {
+            text: "Doar calitatea ieșirii modelului",
+            explain: "Deși importantă, evaluarea calitativă singură ratează dinamici importante ale antrenamentului."
+        }
+    ]}
+/>
+
+### 5. Ce indică convergența sănătoasă în timpul antrenamentului?
+
+<Question
+    choices={[
+        {
+            text: "Un decalaj mic între pierderea antrenamentului și cea de validare",
+            explain: "Corect! Aceasta indică faptul că modelul învață modele generalizabile.",
+            correct: true
+        },
+        {
+            text: "Pierderea antrenamentului ajungând la zero",
+            explain: "Valori extrem de mici ale pierderilor ar putea indica memorizare mai degrabă decât învățare."
+        },
+        {
+            text: "Pierderea validării fiind mai mică decât pierderea antrenamentului",
+            explain: "Aceasta ar fi neobișnuită și ar putea indica probleme cu setul de validare."
+        }
+    ]}
+/>
+
+## 💐 Bună treabă!
+
+Ați învățat cum să faceți fine-tuning la modele folosind SFT! Pentru a continua învățarea:
+1. Încercați notebook-ul cu parametri diferiți
+2. Experimentați cu alte seturi de date
+3. Contribuiți cu îmbunătățiri la materialul cursului
+
+## Resurse adiționale
+
+- [Documentația TRL](https://huggingface.co/docs/trl)
+- [Depozitul de exemple SFT](https://github.com/huggingface/trl/blob/main/trl/scripts/sft.py)
+- [Cele mai bune practici pentru fine-tuning](https://huggingface.co/docs/transformers/training) 
\ No newline at end of file
diff --git a/chapters/rum/chapter11/4.mdx b/chapters/rum/chapter11/4.mdx
new file mode 100644
index 000000000..9781706e1
--- /dev/null
+++ b/chapters/rum/chapter11/4.mdx
@@ -0,0 +1,171 @@
+<CourseFloatingBanner chapter={2}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/main/course/en/chapter11/section4.ipynb"},
+]} />
+
+# LoRA (Adaptarea de rang scăzut)
+
+Fine-tuningul modelelor mari de limbaj este un proces intensiv în resurse. LoRA este o tehnică care ne permite să facem fine-tuning la modele mari de limbaj cu un număr mic de parametri. Funcționează prin adăugarea și optimizarea unor matrice mai mici la greutățile atenției, reducând de obicei parametrii antrenabili cu aproximativ 90%.
+
+## Înțelegerea LoRA
+
+LoRA (Adaptarea de rang scăzut) este o tehnică de fine-tuning eficientă din punct de vedere al parametrilor care înghețează greutățile modelului pre-antrenat și injectează matrice de descompunere de rang antrenabile în straturile modelului. În loc să antreneze toți parametrii modelului în timpul fine-tuningului, LoRA descompune actualizările greutăților în matrice mai mici prin descompunere de rang scăzut, reducând semnificativ numărul de parametri antrenabili menținând în același timp performanța modelului. De exemplu, când este aplicat la GPT-3 175B, LoRA a redus parametrii antrenabili de 10.000 de ori și cerințele de memorie GPU de 3 ori comparativ cu fine-tuningul complet. Puteți citi mai multe despre LoRA în [lucrarea LoRA](https://arxiv.org/pdf/2106.09685).
+
+LoRA funcționează prin adăugarea de perechi de matrice de descompunere de rang la straturile transformer, concentrându-se de obicei pe greutățile atenției. În timpul inferenței, aceste greutăți ale adaptorului pot fi îmbinate cu modelul de bază, rezultând în nicio latență suplimentară. LoRA este deosebit de util pentru adaptarea modelelor mari de limbaj la sarcini sau domenii specifice menținând în același timp cerințele de resurse gestionabile.
+
+## Avantajele cheie ale LoRA
+
+1. **Eficiența memoriei**:
+   - Doar parametrii adaptorului sunt stocați în memoria GPU
+   - Greutățile modelului de bază rămân înghețate și pot fi încărcate la precizie mai mică
+   - Permite fine-tuningul modelelor mari pe GPU-uri de consum
+
+2. **Caracteristici de antrenare**:
+   - Integrare nativă PEFT/LoRA cu configurare minimă
+   - Suport pentru QLoRA (LoRA cuantificat) pentru eficiență de memorie și mai bună
+
+3. **Gestionarea adaptorului**:
+   - Salvarea greutăților adaptorului în timpul punctelor de verificare
+   - Funcționalități pentru îmbinarea adaptorilor înapoi în modelul de bază
+
+## Încărcarea adaptorilor LoRA cu PEFT
+
+[PEFT](https://github.com/huggingface/peft) este o bibliotecă care oferă o interfață unificată pentru încărcarea și gestionarea metodelor PEFT, inclusiv LoRA. Vă permite să încărcați și să comutați cu ușurință între diferite metode PEFT, făcând mai ușor să experimentați cu diferite tehnici de fine-tuning.
+
+Adaptorii pot fi încărcați pe un model pre-antrenat cu `load_adapter()`, care este util pentru a încerca adaptori diferiți ale căror greutăți nu sunt îmbinate. Setați greutățile adaptorului activ cu funcția `set_adapter()`. Pentru a reveni la modelul de bază, ați putea folosi unload() pentru a descărca toate modulele LoRA. Acest lucru face ușor să comutați între greutăți specifice sarcinilor diferite.
+
+```python
+from peft import PeftModel, PeftConfig
+
+config = PeftConfig.from_pretrained("ybelkada/opt-350m-lora")
+model = AutoModelForCausalLM.from_pretrained(config.base_model_name_or_path)
+lora_model = PeftModel.from_pretrained(model, "ybelkada/opt-350m-lora")
+```
+
+![lora_load_adapter](https://github.com/huggingface/smol-course/raw/main/3_parameter_efficient_finetuning/images/lora_adapter.png)
+
+## Fine-tuning LLM folosind `trl` și `SFTTrainer` cu LoRA
+
+[SFTTrainer](https://huggingface.co/docs/trl/sft_trainer) din `trl` oferă integrare cu adaptorii LoRA prin biblioteca [PEFT](https://huggingface.co/docs/peft/en/index). Aceasta înseamnă că putem face fine-tuning la un model în același mod ca și cu SFT, dar folosim LoRA pentru a reduce numărul de parametri pe care trebuie să îi antrenăm.
+
+Vom folosi clasa `LoRAConfig` din PEFT în exemplul nostru. Configurarea necesită doar câțiva pași de configurare:
+
+1. Definiți configurația LoRA (rang, alfa, dropout)
+2. Creați SFTTrainer cu configurația PEFT
+3. Antrenați și salvați greutățile adaptorului
+
+## Configurația LoRA
+
+Să parcurgem configurația LoRA și parametrii cheie.
+
+| Parametru | Descriere |
+|-----------|-----------|
+| `r` (rang) | Dimensiunea matricelor de rang scăzut folosite pentru actualizările greutăților. De obicei între 4-32. Valori mai mici oferă mai multă compresie dar potențial mai puțină expresivitate. |
+| `lora_alpha` | Factor de scalare pentru straturile LoRA, de obicei setat la 2x valoarea rangului. Valori mai mari rezultă în efecte de adaptare mai puternice. |
+| `lora_dropout` | Probabilitatea dropout pentru straturile LoRA, de obicei 0.05-0.1. Valori mai mari ajută la prevenirea supraadaptării în timpul antrenamentului. |
+| `bias` | Controlează antrenarea termenilor de bias. Opțiunile sunt "none", "all" sau "lora_only". "none" este cel mai comun pentru eficiența memoriei. |
+| `target_modules` | Specifică la care module ale modelului să aplice LoRA. Poate fi "all-linear" sau module specifice precum "q_proj,v_proj". Mai multe module permit o adaptabilitate mai mare dar cresc utilizarea memoriei. |
+
+<Tip>
+Când implementați metode PEFT, începeți cu valori mici ale rangului (4-8) pentru LoRA și monitorizați pierderea antrenamentului. Folosiți seturi de validare pentru a preveni supraadaptarea și comparați rezultatele cu liniile de bază de fine-tuning complet când este posibil. Eficacitatea diferitelor metode poate varia în funcție de sarcină, așa că experimentarea este cheia.
+</Tip>
+
+## Folosirea TRL cu PEFT
+
+Metodele PEFT pot fi combinate cu TRL pentru fine-tuning pentru a reduce cerințele de memorie. Putem trece `LoraConfig` la model când îl încărcăm.
+
+```python
+from peft import LoraConfig
+
+# TODO: Configurați parametrii LoRA
+# r: dimensiunea rangului pentru matricele de actualizare LoRA (mai mică = mai multă compresie)
+rank_dimension = 6
+# lora_alpha: factor de scalare pentru straturile LoRA (mai mare = adaptare mai puternică)
+lora_alpha = 8
+# lora_dropout: probabilitatea dropout pentru straturile LoRA (ajută la prevenirea supraadaptării)
+lora_dropout = 0.05
+
+peft_config = LoraConfig(
+    r=rank_dimension,  # Dimensiunea rangului - de obicei între 4-32
+    lora_alpha=lora_alpha,  # Factor de scalare LoRA - de obicei 2x rangul
+    lora_dropout=lora_dropout,  # Probabilitatea dropout pentru straturile LoRA
+    bias="none",  # Tipul bias pentru LoRA. bias-urile corespunzătoare vor fi actualizate în timpul antrenamentului.
+    target_modules="all-linear",  # La care module să aplice LoRA
+    task_type="CAUSAL_LM",  # Tipul sarcinii pentru arhitectura modelului
+)
+```
+
+Mai sus, am folosit `device_map="auto"` pentru a atribui automat modelul la dispozitivul corect. De asemenea, puteți atribui manual modelul la un dispozitiv specific folosind `device_map={"": device_index}`.
+
+Vom avea nevoie, de asemenea, să definim `SFTTrainer` cu configurația LoRA.
+
+```python
+# Creați SFTTrainer cu configurația LoRA
+trainer = SFTTrainer(
+    model=model,
+    args=args,
+    train_dataset=dataset["train"],
+    peft_config=peft_config,  # Configurația LoRA
+    max_seq_length=max_seq_length,  # Lungimea maximă a secvenței
+    processing_class=tokenizer,
+)
+```
+
+<Tip>
+
+✏️ **Încercați!** Construiți pe modelul dumneavoastră ajustat fin din secțiunea anterioară, dar faceți fine-tuning cu LoRA. Folosiți setul de date `HuggingFaceTB/smoltalk` pentru a face fine-tuning la un model `deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B`, folosind configurația LoRA pe care am definit-o mai sus.
+
+</Tip>
+
+## Îmbinarea adaptorilor LoRA
+
+După antrenarea cu LoRA, s-ar putea să doriți să îmbinați greutățile adaptorului înapoi în modelul de bază pentru implementare mai ușoară. Aceasta creează un singur model cu greutățile combinate, eliminând necesitatea de a încărca adaptorii separat în timpul inferenței.
+
+Procesul de îmbinare necesită atenție la gestionarea memoriei și precizie. Deoarece va trebui să încărcați atât modelul de bază, cât și greutățile adaptorului simultan, asigurați-vă că există memorie GPU/CPU suficientă disponibilă. Folosirea `device_map="auto"` în `transformers` va găsi dispozitivul corect pentru model bazat pe hardware-ul dumneavoastră.
+
+Mențineți precizia consistentă (de ex., float16) pe tot parcursul procesului, potrivind precizia folosită în timpul antrenamentului și salvând modelul îmbinat în același format pentru implementare.
+
+## Implementarea îmbinării
+
+După antrenarea unui adaptor LoRA, puteți îmbina greutățile adaptorului înapoi în modelul de bază. Iată cum să faceți acest lucru:
+
+```python
+import torch
+from transformers import AutoModelForCausalLM
+from peft import PeftModel
+
+# 1. Încărcați modelul de bază
+base_model = AutoModelForCausalLM.from_pretrained(
+    "base_model_name", torch_dtype=torch.float16, device_map="auto"
+)
+
+# 2. Încărcați modelul PEFT cu adaptorul
+peft_model = PeftModel.from_pretrained(
+    base_model, "path/to/adapter", torch_dtype=torch.float16
+)
+
+# 3. Îmbinați greutățile adaptorului cu modelul de bază
+merged_model = peft_model.merge_and_unload()
+```
+
+Dacă întâmpinați discrepanțe de dimensiune în modelul salvat, asigurați-vă că salvați și tokenizer-ul:
+
+```python
+# Salvați atât modelul, cât și tokenizer-ul
+tokenizer = AutoTokenizer.from_pretrained("base_model_name")
+merged_model.save_pretrained("path/to/save/merged_model")
+tokenizer.save_pretrained("path/to/save/merged_model")
+```
+
+<Tip>
+
+✏️ **Încercați!** Îmbinați greutățile adaptorului înapoi în modelul de bază. Folosiți setul de date `HuggingFaceTB/smoltalk` pentru a face fine-tuning la un model `deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B`, folosind configurația LoRA pe care am definit-o mai sus.
+
+</Tip>
+
+# Resurse
+
+- [LoRA: Adaptarea de rang scăzut a modelelor mari de limbaj](https://arxiv.org/pdf/2106.09685)
+- [Documentația PEFT](https://huggingface.co/docs/peft)
+- [Articolul de blog Hugging Face despre PEFT](https://huggingface.co/blog/peft) 
\ No newline at end of file
diff --git a/chapters/rum/chapter11/5.mdx b/chapters/rum/chapter11/5.mdx
new file mode 100644
index 000000000..47ebfcc0a
--- /dev/null
+++ b/chapters/rum/chapter11/5.mdx
@@ -0,0 +1,214 @@
+# Evaluarea
+
+Cu un model ajustat fin prin SFT sau LoRA SFT, ar trebui să îl evaluăm pe criterii de referință standard. Ca ingineri de machine learning, ar trebui să mențineți o suită de evaluări relevante pentru domeniul dumneavoastră țintă de interes. În această pagină, vom privi la unele dintre criteriile de referință cele mai comune și cum să le folosiți pentru a evalua modelul dumneavoastră. De asemenea, vom vedea cum să creați criterii de referință personalizate pentru cazul specific de utilizare.
+
+## Criterii de referință automate
+
+Criteriile de referință automate servesc ca instrumente standardizate pentru evaluarea modelelor de limbaj pe diferite sarcini și capacități. În timp ce acestea oferă un punct de plecare util pentru înțelegerea performanței modelului, este important să recunoaștem că reprezintă doar o piesă dintr-o strategie de evaluare cuprinzătoare.
+
+## Înțelegerea criteriilor de referință automate
+
+Criteriile de referință automate constau de obicei din seturi de date curate cu sarcini și metrici de evaluare predefinite. Aceste criterii de referință au ca scop să evalueze diverse aspecte ale capacității modelului, de la înțelegerea de bază a limbajului la raționament complex. Avantajul cheie al folosirii criteriilor de referință automate este standardizarea lor - permit compararea consistentă între modele diferite și oferă rezultate reproductibile.
+
+Cu toate acestea, este crucial să înțelegem că performanța la criterii de referință nu se traduce întotdeauna direct în eficacitate din lumea reală. Un model care excelează la criterii de referință academice poate totuși să se confrunte cu aplicații de domeniu specifice sau cazuri de utilizare practice.
+
+## Criterii de referință pentru cunoștințe generale
+
+[MMLU](https://huggingface.co/datasets/cais/mmlu) (Massive Multitask Language Understanding) testează cunoștințele pe 57 de subiecte, de la știință la științe umane. Deși cuprinzător, poate să nu reflecte profunzimea expertizei necesare pentru domenii specifice. TruthfulQA evaluează tendința unui model de a reproduce concepții greșite comune, deși nu poate captura toate formele de dezinformare.
+
+## Criterii de referință pentru raționament
+
+[BBH](https://huggingface.co/datasets/lukaemon/bbh) (Big Bench Hard) și [GSM8K](https://huggingface.co/datasets/openai/gsm8k) se concentrează pe sarcini de raționament complex. BBH testează gândirea logică și planificarea, în timp ce GSM8K vizează specific rezolvarea problemelor matematice. Aceste criterii de referință ajută la evaluarea capacităților analitice dar pot să nu captureze raționamentul nuanțat necesar în scenarii din lumea reală.
+
+## Înțelegerea limbajului
+
+[HELM](https://github.com/stanford-crfm/helm) oferă un cadru de evaluare holistic. Criterii de referință precum HELM oferă perspective asupra capacităților de procesare a limbajului pe aspecte precum bunul simț, cunoștințele despre lume și raționamentul. Dar pot să nu reprezinte complet complexitatea conversației naturale sau terminologia specifică domeniului.
+
+## Criterii de referință specifice domeniului
+
+Să ne uităm la câteva criterii de referință care se concentrează pe domenii specifice precum matematica, codarea și chatul.
+
+[Criteriul de referință MATH](https://huggingface.co/papers/2103.03874) este un alt instrument important de evaluare pentru raționamentul matematic. Constă din 12.500 de probleme din competiții de matematică, acoperind algebra, geometria, teoria numerelor, numărarea, probabilitatea și altele. Ceea ce face MATH deosebit de provocator este că necesită raționament în mai mulți pași, înțelegerea notației matematice formale și capacitatea de a genera soluții pas cu pas. Spre deosebire de sarcinile aritmetice mai simple, problemele MATH necesită adesea strategii sofisticate de rezolvare a problemelor și aplicații de concepte matematice.
+
+[Criteriul de referință HumanEval](https://github.com/openai/human-eval) este un set de date de evaluare axat pe codare format din 164 de probleme de programare. Criteriul de referință testează capacitatea unui model de a genera cod Python funcțional corect care rezolvă sarcinile de programare date. Ceea ce face HumanEval deosebit de valoros este că evaluează atât capacitățile de generare de cod, cât și corectitudinea funcțională prin executarea efectivă a cazurilor de test, mai degrabă decât doar similaritatea superficială cu soluțiile de referință. Problemele variază de la manipularea de bază a șirurilor la algoritmi și structuri de date mai complexe.
+
+[Alpaca Eval](https://tatsu-lab.github.io/alpaca_eval/) este un cadru de evaluare automatizat conceput pentru a evalua calitatea modelelor de limbaj care urmează instrucțiuni. Folosește GPT-4 ca judecător pentru a evalua ieșirile modelului pe diverse dimensiuni, inclusiv utilitatea, onestitatea și inofensivitatea. Cadrul include un set de date cu 805 de prompturi atent curate și poate evalua răspunsurile față de modele multiple de referință precum Claude, GPT-4 și altele. Ceea ce face Alpaca Eval deosebit de util este capacitatea sa de a oferi evaluări consistente, scalabile fără a necesita adnotatori umani, în timp ce încă capturează aspecte nuanțate ale performanței modelului pe care metricile tradiționale le-ar putea rata.
+
+## Abordări alternative de evaluare
+
+Multe organizații au dezvoltat metode alternative de evaluare pentru a aborda limitările criteriilor de referință standard:
+
+### LLM-ca-judecător
+
+Folosirea unui model de limbaj pentru a evalua ieșirile altuia a devenit din ce în ce mai populară. Această abordare poate oferi feedback mai nuanțat decât metricile tradiționale, deși vine cu propriile sale prejudecăți și limitări.
+
+### Arene de evaluare
+
+Arenele de evaluare precum [Chatbot Arena](https://lmarena.ai/) oferă o abordare unică pentru evaluarea LLM prin feedback crowdsourced. În aceste platforme, utilizatorii se angajează în "bătălii" anonime între două LLM-uri, punând întrebări și votând care model oferă răspunsuri mai bune. Această abordare capturează modelele de utilizare și preferințele din lumea reală prin întrebări diverse, provocatoare, cu studii care arată acord puternic între voturile crowdsourced și evaluările experților. Deși puternice, aceste platforme au limitări, inclusiv prejudecăți potențiale ale bazei de utilizatori, distribuții distorsionate ale prompturilor și o concentrare principală pe utilitate mai degrabă decât pe considerațiile de siguranță.
+
+### Suite de criterii de referință personalizate
+
+Organizațiile dezvoltă adesea suite interne de criterii de referință adaptate nevoilor și cazurilor lor specifice de utilizare. Acestea ar putea include teste de cunoștințe specifice domeniului sau scenarii de evaluare care reflectă condițiile reale de implementare.
+
+## Evaluare personalizată
+
+În timp ce criteriile de referință standard oferă o linie de bază utilă, nu ar trebui să fie singura metodă de evaluare. Iată cum să dezvoltați o abordare mai cuprinzătoare:
+
+1. Începeți cu criterii de referință standard relevante pentru a stabili o linie de bază și a permite comparația cu alte modele.
+
+2. Identificați cerințele și provocările specifice ale cazului dumneavoastră de utilizare. Ce sarcini va îndeplini efectiv modelul? Ce tipuri de erori ar fi cele mai problematice?
+
+3. Dezvoltați seturi de date de evaluare personalizate care reflectă cazul real de utilizare. Aceasta ar putea include:
+   - Întrebări reale ale utilizatorilor din domeniul dumneavoastră
+   - Cazuri comune de margine pe care le-ați întâlnit
+   - Exemple de scenarii deosebit de provocatoare
+
+4. Considerați implementarea unei strategii de evaluare pe mai multe niveluri:
+   - Metrici automate pentru feedback rapid
+   - Evaluare umană pentru înțelegere nuanțată
+   - Revizuire de experți de domeniu pentru aplicații specializate
+   - Testare A/B în medii controlate
+
+## Implementarea evaluărilor personalizate
+
+În această secțiune, vom implementa evaluarea pentru modelul nostru ajustat fin. Putem folosi [`lighteval`](https://github.com/huggingface/lighteval) pentru a evalua modelul nostru ajustat fin pe criterii de referință standard, care conține o gamă largă de sarcini încorporate în bibliotecă. Trebuie doar să definim sarcinile pe care dorim să le evaluăm și parametrii pentru evaluare.
+
+Sarcinile LightEval sunt definite folosind un format specific:
+
+```
+{suite}|{task}|{num_few_shot}|{auto_reduce}
+```
+
+| Parametru | Descriere |
+|-----------|-----------|
+| `suite` | Suita de criterii de referință (de ex., 'mmlu', 'truthfulqa') |
+| `task` | Sarcina specifică din suită (de ex., 'abstract_algebra') |
+| `num_few_shot` | Numărul de exemple de inclus în prompt (0 pentru zero-shot) |
+| `auto_reduce` | Dacă să reducă automat exemplele few-shot dacă promptul este prea lung (0 sau 1) |
+
+Exemplu: `"mmlu|abstract_algebra|0|0"` evaluează pe sarcina de algebră abstractă MMLU cu inferență zero-shot.
+
+## Exemplu de pipeline de evaluare
+
+Să configurăm un pipeline de evaluare pentru modelul nostru ajustat fin. Vom evalua modelul pe un set de sub-sarcini care se raportează la domeniul medicinei.
+
+Iată un exemplu complet de evaluare pe criterii de referință automate relevante pentru un domeniu specific folosind Lighteval cu backend-ul VLLM:
+
+```bash
+lighteval accelerate \
+    "pretrained=your-model-name" \
+    "mmlu|anatomy|0|0" \
+    "mmlu|high_school_biology|0|0" \
+    "mmlu|high_school_chemistry|0|0" \
+    "mmlu|professional_medicine|0|0" \
+    --max_samples 40 \
+    --batch_size 1 \
+    --output_path "./results" \
+    --save_generations true
+```
+
+Rezultatele sunt afișate în format tabular arătând:
+
+```
+|                  Task                  |Version|Metric|Value |   |Stderr|
+|----------------------------------------|------:|------|-----:|---|-----:|
+|all                                     |       |acc   |0.3333|±  |0.1169|
+|leaderboard:mmlu:_average:5             |       |acc   |0.3400|±  |0.1121|
+|leaderboard:mmlu:anatomy:5              |      0|acc   |0.4500|±  |0.1141|
+|leaderboard:mmlu:high_school_biology:5  |      0|acc   |0.1500|±  |0.0819|
+```
+
+Lighteval include, de asemenea, un API Python pentru sarcini de evaluare mai detaliate, care este util pentru manipularea rezultatelor într-un mod mai flexibil. Consultați [documentația Lighteval](https://huggingface.co/docs/lighteval/using-the-python-api) pentru mai multe informații.
+
+<Tip>
+
+✏️ **Încercați!** Evaluați modelul dumneavoastră ajustat fin pe o sarcină specifică în lighteval.
+
+</Tip>
+
+# Chestionar de sfârșit de capitol[[end-of-chapter-quiz]]
+
+<CourseFloatingBanner
+    chapter={11}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+### 1. Care sunt principalele avantaje ale folosirii criteriilor de referință automate pentru evaluarea modelului?
+
+<Question
+	choices={[
+		{
+			text: "Ele oferă metrici perfecte de performanță din lumea reală",
+			explain: "Incorect! Deși criteriile de referință automate sunt utile, nu se traduc întotdeauna direct în performanța din lumea reală."
+		},
+		{
+			text: "Ele permit compararea standardizată între modele și oferă rezultate reproductibile",
+			explain: "Corect! Aceasta este unul dintre beneficiile cheie ale criteriilor de referință automate.",
+			correct: true
+		},
+		{
+			text: "Ele elimină nevoia pentru orice altă formă de evaluare",
+			explain: "Incorect! Criteriile de referință automate ar trebui să facă parte dintr-o strategie de evaluare cuprinzătoare, nu singura metodă."
+		}
+	]}
+/>
+
+### 2. Care criteriu de referință testează specific cunoștințele pe 57 de subiecte diferite?
+
+<Question
+	choices={[
+		{
+			text: "BBH (Big Bench Hard)",
+			explain: "Incorect! BBH se concentrează pe sarcini de raționament complex, nu pe cunoștințe ample de subiecte."
+		},
+		{
+			text: "GSM8K",
+			explain: "Incorect! GSM8K vizează specific rezolvarea problemelor matematice."
+		},
+		{
+			text: "MMLU",
+			explain: "Corect! MMLU (Massive Multitask Language Understanding) testează cunoștințele pe 57 de subiecte, de la știință la științe umane.",
+			correct: true
+		}
+	]}
+/>
+
+### 3. Ce este LLM-ca-judecător?
+
+<Question
+	choices={[
+		{
+			text: "Folosirea unui model de limbaj pentru a evalua ieșirile altuia",
+			explain: "Corect! Aceasta este o abordare alternativă de evaluare care poate oferi feedback mai nuanțat.",
+			correct: true
+		},
+		{
+			text: "Un criteriu de referință care testează raționamentul judiciar",
+			explain: "Incorect! LLM-ca-judecător se referă la folosirea unui model pentru a evalua pe altul, nu la testarea raționamentului judiciar."
+		},
+		{
+			text: "O metodă pentru antrenarea modelelor pe seturi de date juridice",
+			explain: "Incorect! Aceasta nu este legată de antrenarea pe date juridice, ci de folosirea unui model pentru a evalua ieșirile altuia."
+		}
+	]}
+/>
+
+### 4. Ce ar trebui inclus într-o strategie de evaluare cuprinzătoare?
+
+<Question
+	choices={[
+		{
+			text: "Doar criterii de referință automate",
+			explain: "Incorect! O strategie cuprinzătoare ar trebui să includă mai multe tipuri de evaluare."
+		},
+		{
+			text: "Metrici automate, evaluare umană, revizuire de experți și testare A/B",
+			explain: "Corect! O abordare cuprinzătoare include mai multe tipuri de evaluare pentru o înțelegere completă a performanței.",
+			correct: true
+		},
+		{
+			text: "Doar evaluare umană",
+			explain: "Incorect! Deși evaluarea umană este importantă, o strategie cuprinzătoare necesită mai multe abordări."
+		}
+	]}
+/> 
\ No newline at end of file
diff --git a/chapters/rum/chapter11/6.mdx b/chapters/rum/chapter11/6.mdx
new file mode 100644
index 000000000..89356375e
--- /dev/null
+++ b/chapters/rum/chapter11/6.mdx
@@ -0,0 +1,13 @@
+# Concluzie
+
+În acest capitol, am explorat componentele esențiale ale fine-tuningului modelelor de limbaj:
+
+1. **Template-urile de chat** oferă structură interacțiunilor cu modelul, asigurând răspunsuri consecvente și adecvate prin formatare standardizată.
+
+2. **Fine-tuningul supervizat (SFT)** permite adaptarea modelelor pre-antrenate la sarcini specifice menținând în același timp cunoștințele lor fundamentale.
+
+3. **LoRA** oferă o abordare eficientă pentru fine-tuning prin reducerea parametrilor antrenabili păstrând în același timp performanța modelului.
+
+4. **Evaluarea** ajută la măsurarea și validarea eficacității fine-tuningului prin diverse metrici și criterii de referință.
+
+Aceste tehnici, când sunt combinate, permit crearea de modele specializate de limbaj care pot excela în sarcini specifice rămânând în același timp eficiente din punct de vedere computațional. Indiferent dacă construiți un bot de servicii pentru clienți sau un asistent specific domeniului, înțelegerea acestor concepte este crucială pentru adaptarea cu succes a modelului. 
\ No newline at end of file
diff --git a/chapters/rum/chapter11/7.mdx b/chapters/rum/chapter11/7.mdx
new file mode 100644
index 000000000..2ef2c530e
--- /dev/null
+++ b/chapters/rum/chapter11/7.mdx
@@ -0,0 +1,31 @@
+# E timpul examenului!
+
+E timpul să vă puneți cunoștințele la încercare! Am pregătit un scurt chestionar pentru a vă testa înțelegerea conceptelor abordate în acest capitol.
+
+Pentru a face chestionarul, va trebui să urmați acești pași:
+
+1. Conectați-vă la contul dumneavoastră Hugging Face.
+2. Răspundeți la întrebările din chestionar.
+3. Trimiteți răspunsurile dumneavoastră.
+
+## Chestionar cu alegere multiplă
+
+În acest chestionar, vi se va cere să selectați răspunsul corect dintr-o listă de opțiuni. Vă vom testa pe elementele fundamentale ale fine-tuningului supervizat.
+
+<iframe
+	src="https://nlp-course-supervised-finetuning-quiz.hf.space"
+	frameborder="0"
+	width="850"
+	height="450"
+></iframe>
+
+## Chestionar de cod
+
+În acest chestionar, vi se va cere să scrieți cod pentru a completa o sarcină. Vă vom testa pe codul pe care l-ați studiat în curs din biblioteci precum `datasets`, `transformers`, `peft` și `TRL`.
+
+<iframe
+	src="https://nlp-course-sft-code-quiz.hf.space"
+	frameborder="0"
+	width="850"
+	height="450"
+></iframe> 
\ No newline at end of file

From 2b7213c5024cc37c6c35572a318f9faf14a01d96 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Sun, 1 Jun 2025 12:50:45 +0300
Subject: [PATCH 130/167] feat: add translated events chapter to romanian

---
 chapters/rum/_toctree.yml |   9 +++
 chapters/rum/events/1.mdx |  49 +++++++++++
 chapters/rum/events/2.mdx | 165 ++++++++++++++++++++++++++++++++++++++
 chapters/rum/events/3.mdx |   9 +++
 4 files changed, 232 insertions(+)
 create mode 100644 chapters/rum/events/1.mdx
 create mode 100644 chapters/rum/events/2.mdx
 create mode 100644 chapters/rum/events/3.mdx

diff --git a/chapters/rum/_toctree.yml b/chapters/rum/_toctree.yml
index 25730606c..a766b3fdb 100644
--- a/chapters/rum/_toctree.yml
+++ b/chapters/rum/_toctree.yml
@@ -26,3 +26,12 @@
   - local: chapter1/10
     title: Quiz de final de capitol
     quiz: 1
+
+- title: Evenimente Curs
+  sections:
+  - local: events/1
+    title: Sesiuni live și workshop-uri
+  - local: events/2
+    title: Evenimentul de lansare a părții 2
+  - local: events/3
+    title: Petrecerea Gradio Blocks
diff --git a/chapters/rum/events/1.mdx b/chapters/rum/events/1.mdx
new file mode 100644
index 000000000..02b584e9a
--- /dev/null
+++ b/chapters/rum/events/1.mdx
@@ -0,0 +1,49 @@
+# Sesiuni live și workshop-uri[[sesiuni-live-si-workshop-uri]]
+
+Pentru lansarea părților 1 și 2 ale cursului, am organizat mai multe sesiuni de codare live și workshop-uri. Puteți găsi linkuri către înregistrările acestor sesiuni și workshop-uri mai jos.
+
+## Sesiuni de codare live[[sesiuni-de-codare-live]]
+
+Pentru prima sesiune, Sylvain trece prin Capitolul 1 al cursului împreună cu voi, explicându-l pas cu pas:
+
+<div class="flex justify-center">
+<Youtube id="aV4wfnIakSQ"/>
+</div>
+
+În a doua sesiune, este rândul lui Lewis să prezinte Capitolul 2:
+
+<div class="flex justify-center">
+<Youtube id="qEl7eORxpFA"/>
+</div>
+
+Pentru că Capitolul 2 este atât de interesant, Sylvain a oferit și el o prezentare pas cu pas!
+
+<div class="flex justify-center">
+<Youtube id="u4e8OGWYpPk"/>
+</div>
+
+Pentru Capitolul 3, Lewis revine să vă ghideze prin cod:
+
+<div class="flex justify-center">
+<Youtube id="Be4s0dsbavM"/>
+</div>
+
+În sfârșit, Omar încheie sesiunile live legate de prima parte a cursului abordând capitolul 4:
+
+<div class="flex justify-center">
+<Youtube id="1ATVsyBxu1I"/>
+</div>
+
+## Workshop-uri[[workshop-uri]]
+
+În primul workshop, Merve îl primește pe Lewis pentru a discuta secțiunea 7 din capitolul 7 despre [question answering]( https://huggingface.co/course/chapter7/7?fw=pt).
+
+<div class="flex justify-center">
+<Youtube id="Ihgk8kGLpIE"/>
+</div>
+
+Pentru al doilea workshop, Merve îl găzduiește pe Leandro pentru a vorbi despre capitolul 7, secțiunea 6 privind [antrenarea unui model de limbaj cauzal de la zero]( https://huggingface.co/course/chapter7/6?fw=pt) cu o aplicație cu [CodeParrot](https://huggingface.co/codeparrot).
+
+<div class="flex justify-center">
+<Youtube id="ExUR7w6xe94"/>
+</div> 
\ No newline at end of file
diff --git a/chapters/rum/events/2.mdx b/chapters/rum/events/2.mdx
new file mode 100644
index 000000000..54cd94dfc
--- /dev/null
+++ b/chapters/rum/events/2.mdx
@@ -0,0 +1,165 @@
+# Evenimentul de lansare a părții 2[[evenimentul-de-lansare-a-partii-2]]
+
+Pentru lansarea părții 2 a cursului, am organizat un eveniment live cu două zile de prezentări înainte de un sprint de fine-tuning. Dacă l-ați ratat, puteți urmări prezentările care sunt toate listate mai jos!
+
+## Ziua 1: O viziune de ansamblu asupra Transformers și cum să îi antrenați[[ziua-1-o-viziune-de-ansamblu-asupra-transformers-si-cum-sa-ii-antrenati]]
+
+**Thomas Wolf:** *Transfer Learning și nașterea bibliotecii Transformers*
+
+<div class="flex justify-center">
+<Youtube id="wCYVeahJES0"/>
+</div>
+
+<p align="center">
+<img src="https://i.imgur.com/9eq8oUi.png" alt="Un rezumat vizual al prezentării lui Thom" width="80%"/>
+</p>
+
+Thomas Wolf este co-fondator și Chief Science Officer la Hugging Face. Instrumentele create de Thomas Wolf și echipa Hugging Face sunt folosite în peste 5.000 de organizații de cercetare, inclusiv Facebook Artificial Intelligence Research, Google Research, DeepMind, Amazon Research, Apple, Allen Institute for Artificial Intelligence, precum și majoritatea departamentelor universitare. Thomas Wolf este inițiatorul și președintele principal al celei mai mari colaborări de cercetare care a existat vreodată în Inteligența Artificială: ["BigScience"](https://bigscience.huggingface.co), precum și al unui set de [biblioteci și instrumente](https://github.com/huggingface/) utilizate pe scară largă. Thomas Wolf este, de asemenea, un educator prolific, un lider de opinie în domeniul Inteligenței Artificiale și Procesării Limbajului Natural, și un speaker invitat regulat la conferințe din întreaga lume [https://thomwolf.io](https://thomwolf.io).
+
+**Jay Alammar:** *O introducere vizuală ușoară la modelele Transformers*
+
+<div class="flex justify-center">
+<Youtube id="VzvG23gmcYU"/>
+</div>
+
+<p align="center">
+<img src="https://i.imgur.com/rOZAuE9.png" alt="Un rezumat vizual al prezentării lui Jay" width="80%"/>
+</p>
+
+Prin blog-ul său popular de ML, Jay a ajutat milioane de cercetători și ingineri să înțeleagă vizual instrumentele și conceptele de machine learning de la nivel de bază (ajungând în documentația NumPy, Pandas) până la cele de ultimă generație (Transformers, BERT, GPT-3).
+
+**Margaret Mitchell:** *Despre valori în dezvoltarea ML*
+
+<div class="flex justify-center">
+<Youtube id="8j9HRMjh_s8"/>
+</div>
+
+<p align="center">
+<img src="https://i.imgur.com/NuIsnY3.png" alt="Un rezumat vizual al prezentării lui Margaret" width="80%"/>
+</p>
+
+Margaret Mitchell este o cercetătoare care lucrează pe Ethical AI, concentrându-se în prezent pe aspectele dezvoltării AI informate de etică în tehnologie. A publicat peste 50 de lucrări pe generarea limbajului natural, tehnologii asistate, computer vision și etica AI, și deține multiple brevete în domeniile generării de conversații și clasificării sentimentelor. Anterior a lucrat la Google AI ca Staff Research Scientist, unde a fondat și co-condus grupul Ethical AI de la Google, concentrat pe cercetarea fundamentală în etica AI și operaționalizarea eticii AI în cadrul Google. Înainte de a se alătura Google, a fost cercetătoare la Microsoft Research, concentrându-se pe generarea de la computer vision la limbaj; și a fost postdoc la Johns Hopkins, concentrându-se pe modelarea Bayesiană și extragerea informațiilor. Deține un doctorat în Computer Science de la Universitatea din Aberdeen și un master în lingvistică computațională de la Universitatea din Washington. În timp ce și-a luat diplomele, a lucrat din 2005-2012 pe machine learning, tulburări neurologice și tehnologii asistate la Oregon Health and Science University. A condus o serie de workshop-uri și inițiative la intersecția diversității, incluziunii, informaticii și eticii. Munca ei a primit premii de la Secretarul de Apărare Ash Carter și American Foundation for the Blind, și a fost implementată de multiple companii de tehnologie. Îi place grădinăritul, câinii și pisicile.
+
+**Matthew Watson și Chen Qian:** *Workflow-uri NLP cu Keras*
+
+<div class="flex justify-center">
+<Youtube id="gZIP-_2XYMM"/>
+</div>
+
+<p align="center">
+<img src="https://i.imgur.com/1vD2az8.png" alt="Un rezumat vizual al prezentării lui Matt și Chen" width="80%"/>
+</p>
+
+Matthew Watson este inginer de machine learning în echipa Keras, cu focus pe API-uri de modelare de nivel înalt. A studiat Computer Graphics în timpul licenței și unui master la Stanford University. Aproape o majoră în engleză care s-a îndreptat către informatică, este pasionat de lucrul interdisciplinar și de a face NLP accesibil unei audiențe mai largi.
+
+Chen Qian este inginer software din echipa Keras, cu focus pe API-uri de modelare de nivel înalt. Chen a obținut o diplomă de master în Electrical Engineering de la Stanford University, și este interesat în special de simplificarea implementărilor de cod ale sarcinilor ML și ML-ul la scară largă.
+
+**Mark Saroufim:** *Cum să antrenezi un model cu Pytorch*
+
+<div class="flex justify-center">
+<Youtube id="KmvPlW2cbIo"/>
+</div>
+
+<p align="center">
+<img src="https://i.imgur.com/TPmlkm8.png" alt="Un rezumat vizual al prezentării lui Mark" width="80%"/>
+</p>
+
+Mark Saroufim este Partner Engineer la Pytorch lucrând pe instrumente OSS de producție inclusiv TorchServe și Pytorch Enterprise. În viețile sale trecute, Mark a fost Applied Scientist și Product Manager la Graphcore, [yuri.ai](http://yuri.ai/), Microsoft și NASA's JPL. Pasiunea sa principală este să facă programarea mai distractivă.
+
+**Jakob Uszkoreit:** *Nu e stricat, așa că <del>nu-l repara</del> să-l stricăm*
+
+<div class="flex justify-center">
+<Youtube id="C6jweXYFHSA"/>
+</div>
+
+<p align="center">
+<img src="https://i.imgur.com/5dWQeNB.png" alt="Un rezumat vizual al prezentării lui Jakob" width="80%"/>
+</p>
+
+Jakob Uszkoreit este co-fondatorul Inceptive. Inceptive proiectează molecule RNA pentru vaccinuri și terapeutice folosind deep learning la scară largă într-un ciclu strâns cu experimente de randament ridicat cu scopul de a face medicamentele bazate pe RNA mai accesibile, mai eficiente și mai aplicabile pe scară largă. Anterior, Jakob a lucrat la Google pentru mai mult de un deceniu, conducând echipe de cercetare și dezvoltare în Google Brain, Research și Search lucrând pe fundamentele deep learning, computer vision, înțelegerea limbajului și traducerea automată.
+
+## Ziua 2: Instrumentele de folosit[[ziua-2-instrumentele-de-folosit]]
+
+**Lewis Tunstall:** *Antrenament simplu cu 🤗 Transformers Trainer*
+
+<div class="flex justify-center">
+<Youtube id="u--UVvH-LIQ"/>
+</div>
+
+Lewis este inginer de machine learning la Hugging Face, concentrându-se pe dezvoltarea de instrumente open-source și pe a le face accesibile comunității mai largi. Este, de asemenea, co-autor al cărții O'Reilly [Natural Language Processing with Transformers](https://www.oreilly.com/library/view/natural-language-processing/9781098136789/). Îl puteți urmări pe Twitter (@_lewtun) pentru sfaturi și trucuri NLP!
+
+**Matthew Carrigan:** *Funcționalități noi TensorFlow pentru 🤗 Transformers și 🤗 Datasets*
+
+<div class="flex justify-center">
+<Youtube id="gQUlXp1691w"/>
+</div>
+
+Matt este responsabil pentru întreținerea TensorFlow la Transformers, și în cele din urmă va conduce o lovitură de stat împotriva facțiunii PyTorch incumbente, care probabil va fi coordonată prin contul său de Twitter @carrigmat.
+
+**Lysandre Debut:** *Hugging Face Hub ca mijloc de colaborare și partajare a proiectelor de Machine Learning*
+
+<div class="flex justify-center">
+<Youtube id="RBw1TmdEZp0"/>
+</div>
+
+<p align="center">
+<img src="https://i.imgur.com/TarIPCz.png" alt="Un rezumat vizual al prezentării lui Lysandre" width="80%"/>
+</p>
+
+Lysandre este Machine Learning Engineer la Hugging Face unde este implicat în multe proiecte open source. Scopul său este să facă Machine Learning accesibil pentru toată lumea prin dezvoltarea de instrumente puternice cu un API foarte simplu.
+
+**Lucile Saulnier:** *Obțineți propriul tokenizer cu 🤗 Transformers & 🤗 Tokenizers*
+
+<div class="flex justify-center">
+<Youtube id="UkNmyTFKriI"/>
+</div>
+
+Lucile este inginer de machine learning la Hugging Face, dezvoltând și susținând utilizarea instrumentelor open source. Este, de asemenea, implicată activ în multe proiecte de cercetare în domeniul Procesării Limbajului Natural, cum ar fi antrenamentul colaborativ și BigScience.
+
+**Sylvain Gugger:** *Supraîncărcați bucla de antrenament PyTorch cu 🤗 Accelerate*
+
+<div class="flex justify-center">
+<Youtube id="t8Krzu-nSeY"/>
+</div>
+
+Sylvain este Research Engineer la Hugging Face și unul dintre principalii întreținători ai 🤗 Transformers și dezvoltatorul din spatele 🤗 Accelerate. Îi place să facă antrenamentul modelelor mai accesibil.
+
+**Merve Noyan:** *Prezentați demo-urile modelelor cu 🤗 Spaces*
+
+<div class="flex justify-center">
+<Youtube id="vbaKOa4UXoM"/>
+</div>
+
+Merve este developer advocate la Hugging Face, lucrând la dezvoltarea de instrumente și construirea de conținut în jurul lor pentru a democratiza machine learning pentru toată lumea.
+
+**Abubakar Abid:** *Construirea aplicațiilor de Machine Learning rapid*
+
+<div class="flex justify-center">
+<Youtube id="c7mle2yYpwQ"/>
+</div>
+
+<p align="center">
+<img src="https://i.imgur.com/qWIFeiF.png" alt="Un rezumat vizual al prezentării lui Abubakar" width="80%"/>
+</p>
+
+Abubakar Abid este CEO-ul [Gradio](www.gradio.app). A primit licența în Bachelor of Science în Electrical Engineering și Computer Science de la MIT în 2015, și doctoratul în Applied Machine Learning de la Stanford în 2021. În rolul său ca CEO al Gradio, Abubakar lucrează pentru a face modelele de machine learning mai ușor de demonstrat, depanat și implementat.
+
+**Mathieu Desvé:** *AWS ML Vision: Făcând Machine Learning accesibil pentru toți clienții*
+
+<div class="flex justify-center">
+<Youtube id="O2e3pXO4aRE"/>
+</div>
+
+<p align="center">
+<img src="https://i.imgur.com/oLdZTKy.png" alt="Un rezumat vizual al prezentării lui Mathieu" width="80%"/>
+</p>
+
+Entuziast al tehnologiei, maker în timpul liber. Îmi plac provocările și rezolvarea problemelor clienților și utilizatorilor, și lucrul cu oameni talentați pentru a învăța în fiecare zi. Din 2004, lucrez în multiple poziții comutând între frontend, backend, infrastructură, operațiuni și management. Încerc să rezolv probleme tehnice și manageriale comune într-o manieră agilă.
+
+**Philipp Schmid:** *Antrenament gestionat cu Amazon SageMaker și 🤗 Transformers*
+
+<div class="flex justify-center">
+<Youtube id="yG6J2Zfo8iw"/>
+</div>
+
+Philipp Schmid este Machine Learning Engineer și Tech Lead la Hugging Face, unde conduce colaborarea cu echipa Amazon SageMaker. Este pasionat de democratizarea și punerea în producție a modelelor NLP de ultimă generație și îmbunătățirea ușurinței de utilizare pentru Deep Learning. 
\ No newline at end of file
diff --git a/chapters/rum/events/3.mdx b/chapters/rum/events/3.mdx
new file mode 100644
index 000000000..c5b706f16
--- /dev/null
+++ b/chapters/rum/events/3.mdx
@@ -0,0 +1,9 @@
+# Petrecerea Gradio Blocks[[petrecerea-gradio-blocks]]
+
+Împreună cu lansarea capitolului Gradio al cursului, Hugging Face a găzduit un eveniment comunitar pentru construirea de demo-uri interesante de machine learning folosind noua funcționalitate Gradio Blocks.
+
+Puteți găsi toate demo-urile pe care le-a creat comunitatea sub organizația [`Gradio-Blocks`](https://huggingface.co/Gradio-Blocks) pe Hub. Iată câteva exemple de la câștigători:
+
+**Limbaj natural către SQL**
+
+<iframe src="https://curranj-words-to-sql.hf.space" frameBorder="0" height="640" title="Aplicația Gradio" class="container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe> 
\ No newline at end of file

From eb7542ce7272eda496695a07a149420a92b891d0 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Sun, 1 Jun 2025 12:52:11 +0300
Subject: [PATCH 131/167] feat: add image folder to rum version chapter 12

---
 chapters/rum/chapter12/img/1.png | Bin 0 -> 58807 bytes
 chapters/rum/chapter12/img/2.jpg | Bin 0 -> 44339 bytes
 2 files changed, 0 insertions(+), 0 deletions(-)
 create mode 100644 chapters/rum/chapter12/img/1.png
 create mode 100644 chapters/rum/chapter12/img/2.jpg

diff --git a/chapters/rum/chapter12/img/1.png b/chapters/rum/chapter12/img/1.png
new file mode 100644
index 0000000000000000000000000000000000000000..a53e8a1863920d2bb6a190bb13466a2f6435d150
GIT binary patch
literal 58807
zcmdSBg<Bj;6X=aYaDqF51QvJqz@ou}LvVL@cZURb2@>4h3GTMIySv-nob$@L_j~_=
zkLMY-ce<;!rl+RrHyb7|D~^IlfCvErfg&j(st5rA?F~+^Ai#nDZ%bwmLO?+3nTd$V
zONxk)$=ll)n^_t`Kmg*LV#jF%?1=hxST!Evu$}E)H-Cy<kr5Hi>rsb1%-VX~Cd*h|
zx!xi)-J@y!jHkW8jpPdD;*y{q8g$wza2AdkuhAoX02SVqxMYp*J)J@;-=yk&Eb;rg
z$U^m*Vrb+zeRFW5FCs?lIW?0xxMzdeY(tY)=M^$3?=EAkd|>h9MrL#8)Ya62({^(8
zx}jrpcC4SJdA}vTn6Lo0+}GB1mW5~)%bMd;{CR!P1vx1X5&fllj)^%rz?15D7IU%n
zyrxo6W4C{pD?w|rgN5th$l%~WQX%UrEyZsM*67cn2sAIq<iB214(LZ<)Vp<we*iZ>
zRvNmi5e59TRKiP$;?cejQeG&S+FO3SLy=ysUN$77(m6?LHRVjV6dE=fwBYp*=I3f-
zVN-f)Dy7xQP~TUG&`JtQC0_E5@-2iGAhCL)w^$;DU-$OEdZxO<H>O%!6F36Txr&jR
zq_K<)1PwTi009|d1_1+3L4pqg@Bv<)@4*o8;LrEqLo^%e-?`A<+0g$^L#+HMD6AwR
zDGB~mGO#x?vUV`Faco)pk_WB|WcF3fQBCFxkAaO9gPx&{z7d0~mF*u92tHRHaMH@i
zQIE{k%F^0_$CaP_uM#}q^q<p=<Ya#pakStkSCf$^6S1*3BI96SVqhW{KqMn0<Fhw3
z=1~+C`<FQQ8$Y?JqoXYkBcqFp3xf+QgN?ljBQrNQHzN}ZBMS>XxCFg}o3*2!E4{S?
z#ov|uyB<*^2LpRETSqe+YqCG}>gn4!Ir5W}|7qwye}DJW$kpt>Em=GKYgpg`GXBY7
zWM*Ju{7>CrQNBNCdF0JpjV#qg&8)!F18zfrg@u{#uk!z&od34?4@tHEN^)_t{ZsNE
zIsdPuvV)Pmh>aDvNk@VIuFSuL|C#wOK|aPmBmc)t{5{QoodwUc03sjbf7VO@@z(v9
zB?N>JgrunOS69g64EWZMz>9mrSOA%=_<M913@$GJZo6%|?+$Q4dog?TLGF@mx{XjN
zILNr{KoJZW;aECyDRdyyxzeM~nt!U#S!+thf>+DgiHE9FmIv$7^mI;hb8~TXvvDo}
zornlJ8nWNlpp$tW&lZ^r?q6SZ=k;|r^_E!AlK<bFzY7B3v@RSz|3l!v@;yY*<@YF8
zkhiDY|E}%7nbDA{&*}f`bblvPzb~zKkEd^&$N%b3C$?bW|LA8YGt&t3diWX>sqR_k
z|Lkh-xY<9O|Ibj79grJ0IY;2<TlW4r@PC&D50Bvg2gAGn(jd>|d_2$O{d{kYeYV5%
zKjzji^S4lB)!yPPd#}y){v`jLx=rl=nyO@UW~MmPytcw<*-(lNFX#Vi!@nnm2wJ<_
zH|yf)y?&e8e<t!jI@8HKL5pYGTcIk}y|nSa=CnBwy!y?7YK)-&TiO1u{u&XiQ%4DL
z=g$AA@jpuG$Dr4V-NEny6yfy0`qkzSuG-z`V=M9hQl4ySy!}O&XP(*ByEPxd=ZA40
zRGrt$Bwpp8Nz+?+t_S%^-4ro=?@wE=#%ymFOhOI{(#rca`5H$JyuUE_V(C>6QceeZ
zUQdeaeV3$sH~ocG22|<ua-_4-gC>ZqB*U(JzxMWu`wFf%7~dqF`3v90dELuIzs}p^
z+=d@K2}0Jxh)K6FJaPO+-sxybMLR)3ru!k2{q{g}g=;$z93K2V7u&lif((uNx2KLb
zq&ILy-9B$mI{D+AYo1DbZ`v*^*yT;T1jD;?98BjiKF=b1o#WoOHB46{tRXATOJz}t
z&k67Fp-XW)UQTR!z`Y{MblnWI?SjRvjf@t2y@=UJ>UcJ~AC&Wc@4R4?R5`C7QKu!=
z!q|wsz_9yxmwA=>x>1p4bJsd^*LLQ`XxV&Fu=3k4N!#CVn6ZOzMBwRo1GnQIC>cFQ
zMFErPvg)=mZxDmB)fa_C>Ul1_M~g4^=@NfTNsgbrw6Ys<qbBRcGTA6my*tz66raR>
zKPULx>#0kJQg6tGmg`1P&qY5esqRP*e)bY=MJo%D^Sqwk^ZkXDlT$yj3$i$go1x|z
z$m?J$Mi5o!<xsUpjL_=qUBZV1Gy(q&YjF2b4EiG9MKCm*CVM{~C=Y5H#sRzEOVj0y
z<EZIE=I=x>wsR3V%_wXvT2v4#z8v@Vy<QgzqO4!-=f$YxwBass#V@kqS#0WV?bXeF
zLsHeU19Cl|_w<}JtgWgzc;EMs1}n*O0~7i>o_83n5++Zjp+AY}fAt&BG35!I7;fEb
z+RH@Jx$nkxY)e7!FD}Fu3|y3EY-4-g<?MJT2wps@-xv6?0v+ewNP2r2E~sw7&#NA1
z)R<3CYi|N%C)wX6sWQIehJxE}$#Z%=vGGyT`>y?a0|rxuEsljT-UwnN75I3h^X4wX
z*>RarQ3TQ0M_>_n=6%=V*L&`e^`s?|xpBK?q4ShVfH9RZuJU+)Im{RWPwFY}k}+R*
zh@*Ra50+juc~zd}jAhgAqbOb+aBx0WXwUL_eK;26Ejm_wd%f!zpBm%8(^5vjKnKr2
zFAvZo6A{_6vI~v}o~HU?iwJIL--`+KTWcEbd2iWayv$-`e=^TvR{M8S`&GtSQKUkN
zFRC$t1pZ}N!z$u{lq=&5tg}*_9rLO)VR&DDn$s=IS=Uool{<I_2;}8C&Inmh0!aDG
z?qBZv1yNZ?m;!PiMp(y*;Py{P8ID`d+ReiZ`T;?0cdMFIeHs>J36y99{D?AC8@Uk-
zQyGL>Bq0>@^B=x&LTm9CrrQr0s|T;tIGY{RPRk-8@Se3lS^Ii7!~T#HXrd7+BWQs8
zUNGz`N}MkAqh_4LLqz2<-Q^+Os(!(7E;aHbT3zJRs|fRYqh$vApFz(326;>_a2`%6
z;Oi7Wc~fcf$Fgjra4w^N^LcUN|E$n});M9^u;T1T0lN}hZFgYY7Qnpg^cWB_x@6Nq
zEX#NCJNVe>s{O+>)BWUhIBCm!blOv)`{1_&IUfQzz*!qZHd`faw|W8Jc2LdpRnFy-
zvlrLg?mAvkH-vTN-KvL8<4&TcqjkE^>VtB{^$|DkN*Tj<XvyhOS5f8uIUS#u${iI=
z4nx|*Bk(#40$QL@P_9U$A-jZF-ANfN^c&#Z$sQDyN#QhtEfY8jGMqI|x<fH2ikqj-
z_S)DOUQWNjBLWCYjIY|Em2bab@R!`%g(lZ9ro(SAF_o);H?BKPF(Mq&Ww^aGoA$~P
zmf<2oEe!<!m4^14vdTfqv_Nq07(Abr)=(|Ope=j0rlS+kRJncW9~AP$ez7$7lXw`u
zE?ZtHjr9@Ql)iBj{%)dym}?p3So$*UvgYL?QzN)lPJlcAUdLs{X_g<Y!xREH2)y3B
z#|>-V?r_0YX36uPk?67J!ypj+E04-s4j0JA2FbYWGAUpmJ01^9O3og>OEcgzw4Qfg
zSFP5Z$i&7_WqB%&Utwqkd5kTTwO$T+JwM{(E(-a~X*rBm9u}7z+Dt(%4ylLQcy1Bu
z4bwLuA6Hv-yxcCrjoqI!yp$k;7c;Hi;Pqh-4Iyq^;K?#e^&MPIFOFs)c-7^XeiUN!
zj`w|VxD<H3--0|seZa3Nt6wbk<1iHzgAaH*>kzbTy8)#pReA2Fm>kC?&XroT=)Vj6
z#?@apL{k#zb-O^t+cA*iG8V_|ef+4q4Iy`(bi08%C$mn6?GX5er``z*X`r}|mQk=X
z&kt!TEBJC<Iin~Y<hGZg+Rw?K6bc)!?Y#?I?lbYx@ylw0iiRZgo0|H;4Vuq=K&IVK
zQt<xP*jz`TUGPwRYL^iN5&&;G@XH2SFDo@0;0>4B6J;)QE1H*~v}TNFkz;rB_312Y
z$LcnnwG@V_>rmQ@`uR|`L$MuZbb_>xs#gI+X6b2k*NgY6CRAKad!;?`V!3wJ_=<Ma
z<Ss_wv1kg8FYCbsLTBCcgNbp<6`Yf+RSm~>KYpsNwgG)tMk8`^$T>AgcudHCmEQ)U
zEcZusb&Af&uOG5J)WeD)xP~c$ZF*(FZ<7LxgQ?1MD^agrS7~cAb$&JdrI_c|_aA&)
z*gc^ZO<q{nm+>D!nl^0$Djt{d7qlK7#aY1XRcVXdn*fW#Jsu-+o381^Z|(<`>qW58
zm&m*yowD(Ds_%|U?M8QhBupPK79*<zF^$F}4B0JIvDYfEd<W8FqI~Gk0|&DgTFrqR
zb(e>c5j*rpCH#AfUz}yH^6%1H#3@C0^|eJPt8Y@c<p|#19hyMUzyINTgW(<Y46DOr
zTHmgbc^!`II>x<MWZBy^ixs}>_2@ajj5K-sap3d&PmLk<GFTy8V3VL%-6Vs3h-}WB
z@vO9d(OkiEI8XF8qT4h#{UOXAj>bbLz7p`+Fun`Krv4=tAyFZ)4G@Ukn<a>-_nUh+
z8Jhl+)I_A~x*xn4cM%bgY>w^2R4L!#wsuviD28Q?qxHvJU98+F7CrV1?*Z=8fv3c~
zNY=5?_g+k^?nh;D)zMs=p@7#LjTi(9yBVmwTo~X)_3O)-kGO(yUV6mjB|z1)HxCf^
zm?r3PQm2ZwLyHI<=CW)jj@2tS{C-2>Y9KJ2TtbxF2DA5uCOo_J4R{dtzDe2+*kMKF
z8s;3P_#Rj}%W_YFXdZv1uYeN<h<m6NP=C%-lgmYbR-kml+TahL!Ur-<aHKnd)EAzB
zobhriS_hbC5w=9VR$q?XFM4rn<~n~M$SaHi%u^9;G#U`TJf<<HTa-7|@?B2KDV#ge
z1*VubBj~8RElbQWpU9;m$V^aiJEVS6os|(&&`JmnJUH;M&y+qu=0lv0AfEup9#k;(
zHlEZk(M0))*o{W&Ja6JsY^@-hVxARl>BRel5IdXV$thUZ(MQsf`6q9R$6LIt=<v*b
zMtlt|0b+HrhBM`RC1kTog-m?3otELGwwj{arN2T+#ri}h1(60gEml}Itp47$)df#l
z>Ja|GaGG)f-r^#2nP$7CRbrRr69Fq1QJkw2hRj%|_?wsM#>1yTg=p|5+SD#ie%-Id
zZhET~DKez=`*P_V)eDpJZomPemC1P>8IWg|sXXd&FTC=w5GgLN+QKx>cP09$1vdiO
z*B-ui={@^QQ!ElG$J75y1gn(}$#d}jqbFWbk44F1EUC#pFw#}3|9qSry-W2WF<m-3
zcNvJ`9Zwp%0T})Uq%t%_KA^fb=yWId1LPi?Ybus*!m9Uei!Cq3yD*Ed+bmhuM1g=0
z%4CSrSb0+Mrg6<6d+e>G_VIfN!N<v%_`*qVZmLx5!TC^#BDaklIOXSX&(X()$W?d`
znOcE@IoUBMT2*8Po`MNt3+yfZqmP#|tfqZQv1xeyJQiBBp5`Dp4^TMrLL?=iV&ST_
zv~Lmm>jla#sy!T6oDfCxDR~T(@>Q|&LhVAMY0zMnu~(g?a&^rP?I!;@%VYY`W+ExR
zA_viN;n2o8HS?<}fdy+d1WO5EHWg&)HHs)@Jpmgjhc9QzarQ$sWR#wlkslr*3jq#*
z0atxg@Y{ayQ<9qE0rqCBb`bz)HkeOed9v4E6c6cl5@O8Hh#S>uqr!+RM6r(#uo`qv
z#oG#5T^~Y-a?jExbPo`s%(MZq0BQ7e$f2~r<>+_|GG2F$Owq`xk1+NNL6HEO+P4JN
zZ&ju4Kqd~ZhwUGPL%7maG>HZ1>H_hwSVMeTJ});K;>GtD<>|d<c!aAWfE<4Py20>=
zsigLwm|y9F)Cumc(_q{2lQ)wR#l5R8&H1aJ3M!-rTwXE|nfTC=st_d$W+<4Z+b?3G
z=kAVUjw{U`-%+LOO2)A*hQ4Q*%&K-g*Sq<yR%neQ3v(}m#?M9@LWrfl*rNtD!QR1)
z{?k`p#GNL+VEm+AyI0QNv}j6y$2NiZ5TOj>C0~jD=X#7NzNJLlarH34d6x(l<Kq}q
z+!*sN&cQFTfqOlo_eka<O>{$mBV|Op$0?^d?KvvJa2m0YXHSE%+|G2c@o0uooc&$?
zX8GIqm1wx$m>_~6LD={Zu*P#s)8rjAU$rMZsP|D+_tm;8sa}+9HaYF7DqJx&VvW)x
zoBkw3tJth7tM#+P!Oa8UI9a{t13EWEq!v0b$*ETJ7M!J3RibA6?8dzY__gL9#{(B2
zO^X`BaoG%Cui@c(`Q(7|(sPx$ck6Sd6bO~nl_1|I@RJmebnxlbRYu4;U`naC0=1)f
zdYr|bbcCH*M8bahpeg!0d=@K(k)kpYuX8Cu{d8^a6HB{cxXvuW+>j?taaOI0(Ev?q
zk-KaLWl74WYA>fNyc;TkYy$Dr(O8L!;dHfKPCHid<6`)6`ekM<D##He)3*q*8khre
zB|O-~m=PELt%f`n3p^^XPzlkF!vyqT2}(1j-Q9XNYI#h}Dmk~$oWxn#*Bd>=&{D2#
z>POTg+ER2Hz2}U@5=}-EjfVbRoHMzLqh;I07SSBCQSL9D;3egICI?v^FdvJ{iBLao
zcg2Q|l%9!(K3w(5%ol4h6Z8owlmrT=B(^yoQ5ZJ&3By{)xu)8s%vwtqV%f~LVms{%
z#HrDBSg0F>H3u9#k*zP>WwxaP&umcaI!WW)3}gxKC@oTTGu2MkMz>TaT>Tr0Eh#o+
z#Rj3N=oO}4jWeOGpR`}>V4%Ox<3S<2Iu=~pkagwe_&MNnO>@alh7>byXGUa+m4_+t
zK1jwsg>xcza8g`SZf?6#qQnW`9@GR2rOE`Vl}k?84B}W9fWZ?8Iykg>3ecqRwNNS~
zdvPW;K@v@oPtt2ogX7<tLKN_OoibBT3!_5}4f@uB24tfrb24B}5AB?^eT{M(@bqWI
zTTk_m$j>mSbcBjf<4#m@GJ3ZA#ky+n9C9JOG75m#8iFdw8GDx!(}H?6zpFRvU?I&z
z`7`W2q39qoj7m3lJa@zqV|j(LyvwSRiO-&ivgYGcYxo{0LkD=`8yrq1h@;$EpTHr{
zp&)DL1l0(>*QWzVC%7A@WqA)+wYrkC8V|yCe_FrtnFh%wFEvVa6&i`Rji;Q_e3PG%
zSkCUJ;}#>`NQGzMsz{AVO!7$rR5UUsdF3T=5X6tJJ#)o%pmvxSW{obgOjzXB1%Zv3
zX29x@2sh3Tc*77`p}%#}Lav0x5L@Oee<86OPuV7+krh?jX=^o4$-QAs^X2&8I>@->
zy~Io%AtuXXk8s5B4DG5M?O{s?pMs~Z71{Afx)6QkHc)%+YkX9J^Yy$i@($OKI8m~f
zc8$y#TNqs|{JUX9CcF6Z4b&b!SC$`>8XO<I{Pm^p6ht;40mv!JEKDYjXLXyS;6W-p
z?t4~*A*EAFF4b6@66XIo8Oooi>+6>sRzKe>o%E_9=$)UPclx0cA9;xv#ND`Ke!GcQ
zxtptu@ea!VK#T(XN_X2lFFyAF37l>3?<X}%ukm-&z5Ea;Z-Px0xx_tG-1<O<&ctJD
z2_?`CCnPvH?30OslE@nFS(1;)l^5D6RAh~Z4ArjY9p5Jp;4*+2lMq*9E>db}Bs6!%
z`O4ezZlzPJSBC9;(9c*mf}XU&8jcbsM~wse5i$dBg0l}9Zp5b#&Ipgx!?d)+(fnq+
z;{K7;VT73n{#Q&hgy(SyL=HL+Q#unvdcYSHT4ken{*aDrLx;W}Z`8WALJuZmepJv4
zWwTf1kyLLRya?9_q!aqH4zyHl-MCBwcHZKp9gm?`ZTcIkIb@@09cO2)Hb&mNN2j-E
zeB(fFxWx<|r$x<P3r(w@0SpRd-Cs(awE=$bUSpVKO}#pIC21YI)x{$55WZF)O?AQp
zYQk}2snGN%=W2ATTXHOR=0EipcWXGJF0BH6x48Fic~G40m3d$2EcSFu!^|{!_~&vk
zG&QH)o87W>wlp&29_s5TL{uh4XRka7@3nh5!&j?nop%%3hS|rdrcIRZl)X*@k4MB%
z?P;E6TDNN@H_b4A_k6G**?WW><9W{rB}6S+-?Oe)?Z$glg2Ms%cEH^$w`|Gc$1BL7
z#-~t>UW7g{+!@FcDC{qe1qmaX>|9#-urB~${)r)xOB_qTPiBJIjplt0t^MVL7Prrg
zJeJi@5||cezuvSAj&>RG^>;($QN+^md@!)5G8@?>bo3`sR(*=(46Z@I?62fRE`;;K
ztU-e~D7H~XMa1h9OrHg$2vk1WBHCtaYf*RK%xROZz8tj(FGCT8S12_ArHuAiIy@HS
z)dYR;R<G9dM{tL8hZtfYp>_;n_;J8~HELz1`Kq9A^()SrD`7`485-KopL|hx(O@Qh
z{h;f&Ox!e@a$$1MlTN~`do*wnKK59{_;Fr#e(rUExwz&AslZe|owmsBeZaBsr^{K!
z<jOmAYbWszaEZrv7V6!RckwtkjIGh*d5bK+JY(VH;Xk`_x}LJ>5oy>{W&O5P#-ZCt
z-U%m#-LfEb=+}9svL7g<4HMOkFj$V{_fauZy%(v75$#--?<+#Mf!Hje&ExO+gmH@w
z=9%oq0^Zx((vCTv=i&_S#JY$_I18EMKCO_X>flb+Cb=$TD>Dtw(<k1n#kdb8rn!f1
z_#~+pC_nVVSFKFGVJA$>YAEaQe&97I3N|5i+m54gSsx5m#bT-QTj_a1h*g6-DXlOv
zk^vlG-f4(qtlRC;LIncjnd#QmZihN?Bw-3!bX_3w<;G&K2mOIqN6pOH0{ArV=d~#i
z0XKQs<qfCqUaPvQam0Df6dacd9`XE(p*Nzaneg231vl&N;onEPQ%^~%*Y#0op-L;2
zeLu-Vt?XM<N5~?!jwhpks=$;7k<fi_q|1qitRL<{wIIG<>-S24&@x%b@7fHsfV9Se
zn9Q@CYdp_IO4yx;{gNZQQZF*#>WDcH3q1eM8kTRZqIRe@GaB{d7M&T5ESIG39rsqw
zY2dLp)F0#K;~o5`v<&g3lU-)9WM{vi&|WG3<{}S64b&Fndfx8^xGObjFP+e6rtw|5
zd%I)lxb0mZknme>j=KX)oRvpc$`0KWv;j#Y%tLXk>gF@T7-Wb<pmi+8RBNZz!kw=x
zNuz@^TRFv%vVv#h&!0`<FKgjrBy+;&ZVOS&_#d81`nAh=J?k?s_{Lo{b1+v!Z1g|$
zyM_=pxzV4O{<*+m7rO}p`va-H`1*<K@O7C2$`x>~hDa^!Ni6TWUBB~(sP5!|&6g#x
z`6738e49EDt-oLwWIf`vO>%GaZ6f%rb56rAp0V!oo6nvS@87oy#zP(KHHkGzv$7Sp
zgv7byc5^N8eS&%+<tF|izy-sA(!_}{b#xMLTeCGl@tMu=J85mh!eiRF&P_{cd6(8+
z@#6B~Ri@%Imy0hFSx)URL<Hxls~N(f=QkX3EcAGuz<jJPrrpKkP`{gqu*jjEMb%=b
z=uK)I6Hr?D8(121TXPW<-gY%DGX<tRoLAMhIn;atj$7f-)Rw0l>{aTu%gAs>*sd85
z08Yoxx{}q}Uz|yc;O7WntS+~oy1Iw-M`gbhbE#!G=c78Cs=<6Lf)HdCN)~sMx`>*s
zv~0+yTR~)l^vzHjj`%!mO;cV|;3zpGXhhQJu8+^TPW;)Ou#)gyrJAB_bLa-o0K>cS
z<6{&z1%UjkE?;A0D(|OpUmmBtuic&VQ9G<S)bd#;6Zp|5sk>Y4bo`_J48+$WT-&X}
zkU_>hC>&pR7@V?zdSY?1kjoCvSo@4%*UVzuB;{w?@?XblTjcM4)|%ZJdC5&LL>X95
zyEv~w^hId{0~PZ=c*$SF<H|;IP@3-6*x?}II*cWy=J?rPwcLueOeoGelmvJl_>Z8{
zg<B%VOTRRJg$A-&HI}iS)ye*9KyXd`j348xn&+tc?#WDjIq!Zts~QOE1DTS&wewf-
zc3hraEiHF)Q^-7RL?MtlpMnm{|5(r;1jm3U)wPmTX<vI1Mc_*n(iz$3?DDF39Q9u+
znRlj<8tHmG@C1h-ie3HchRcr~FGvF@5D`5S#%C&_O}7l(u2ezdAiLdAd^>K^G(nMJ
zj|pBV@{@pyE>^Xr1L#<ga){3CfeC(_rnYnbt94lz-X>G6ek7egSQ|mAAiF~j5tdA>
zz;#mQo=^?X+EB(x@17LxE3fKnm0hLwNaw#z>Tfe0H0@oy!L%S6khS5s%5K8O$gV31
z=`CMbi3FU~TFIdWZFNoEu&bN~S~ZOcD9(VnJ%1H`+hDARbUswifr1{IJAp#`C%dN4
z^yAc1wR6Jglk;3t?O0|rF6APokm$z`Fj1Z2MHVRtUW=c;@FR^gfEFbhzhT@yZc_;3
z`~V;aLdy{l#{go;*?{WF)z9|jv_tT1>`*Cc7Zf?IK(iroz|iLc1s_w~o%07+@>hHW
zhZ#rmukWF_VKK<rjy(zN=)A`Gvp8c<jsYqtR?u-0z0D;GpMu_rR*jj*%N-`3SfX@U
z8=;@bgnsRzi;#21%4Z0#E}0Y<6nVK$asi%4U5@g<Si;_2t81Z`76CBDhshcBj*Z@%
zH@Yg6UweI?9yXkNCNDAzlsep1!pc1dVl37Xvk0@J8T6Zwi{?zVV^}AlU&7@Y9<W{_
z<kf5k(|*VbD@C+6{17hM13jKw$-cb>udss<LWh*&E#Qy7q0b%}`O6OgO>h$@ASL7{
zaesle?U}Y2W-13(f2K|3iUZcuqZt(X_r2lG4{QjIqVW>sQhsveU6*F4nbXz^nKkCW
zbIT9xzme@y=ozO7wCOQ0iFe{#C9X)JEXexg=<NqSDx&9T3+_Q=yvN6Uq&m!EnxWJ5
z*=M8u*aTT9dY#vy{}2;sZNhhtG8(2|p&%QyVC-h9#50#e{|K`Zv00oi-I+{BKsz4#
zlNMw_Y?B5pmM7`JX2@2HAQ!hHpFunFf_3kSum$umquRl&&Xn^!CrsUK0A%xk#5|P8
zb4c%#@p2qdyPrZ!`xD%xu*9oO%@Hi_Q-UfBtblCVCaVpsf)TDTR=SaR(&UtLkhz!L
z!<{J`GGp$>74<z1CA+FBuBX9Gom9@I@U76Etk&mHQ|sIl#@H44^TmIhny+H~qrU9G
zz^urMu<E>4zj{BBTsW1<ch4zKK`x?xQ|!QatuhrDp$x|JcSFTJNS7ydrc1RyZp6oS
z0BC-1LM`k02<wcc!sPenZ^^2n_VuB~6Pk$U0)3(0mBvF4KH5n4qv<;h!mQrFOr96I
zTo>{p)a_J+mq`_j)iMi|IqOj;fgHW8N_|-}%+T&Kw*JQIQ;`TG`QJ$z+FQlDN(w74
zf8G24I97s}$;C!BJfTT`n`C4g*h+89WSf7(m`uD0bqaMk8Ylp6DF*g~-7C+^)vOQU
zu4vUphyy;gYvh2!@y3wburW02(CD!}1~rQfp9zWC$5h6cwb4aowllZFS*K_hcYMlR
zJO6uO_)?$a&MHDbC(Jkd8dLSH`4nB3U`IADx@R@mR7jJM%H&H_1{i0q)zzHUi>>~W
zy6=0(WAkItU!<&%7=(Ym%Tu<<YeLX-Vi$C!qphWf{qSX_*tn$`d7t*CgPb?2QQejU
zO;^pf34&@yMtdgf7FX5Z#QW*XJ(qXs369a{3lk>=IBRk>=3^~ft}V_Rd-l#z8OpfL
z&|81p$DVRr5XPbGlV2U4^hYQ83iWa7ak__Kw8QUVX+Voj&T&A}ML{&5FYhvL)o+6x
zShV`#r14>!KEz>muC6H4UToE4C5G!Bd;vX6l+)-|xwlH53u}^Z*b$g#@xmF+Zb|l?
z_+ERhQNUX0xk%Vr7}<L{AISamw{?J^aca&wS~<DeZ#=pE%&Pv7)uAsskR57-qp(=G
zMiF9(yLqS12W<5Hr_?c3y0|idNGB8yq28YbClW3o&XHCMuKS}gu43&Q7a1rIM%?;-
zG>JA(^6e<LkJ?xu-S6P<$m1H#w@P2dT5pMZzfMyw?{uPE!}@fwGxj>w?8OVe^eLHg
zp5(1eAQ}v$lk&Se;z0B-{;mrxDB0zA&Ce<u8|RCubQY=rI?QJls@ftjt_ymNO!J;p
zGg~F>C5~3qzUF#hgvP&aFh&v@d|v9r-0DhJz0ja-C`AEojd11j%@0XbjO^g*xH3n6
zbFJOYCn6MFt;of+l_cp~+{I`?{s}oj>6v&@GK@5JYd0Q^ezMKSy`xBVGYQIlNNh**
zR?iEa=^x|sTbb8>5BUY!GT-f2KpliP+<3O&jIcI`3B8~dU{jT^VriVO4Q)GBVnrVr
z8CS>AZr;9xzD(1rd?oeh{G%&cOJnJ~32H9(g$Va1#sEGYbC)REG&$gnBK*~y=>#Z-
zjq$|)TPZ2!pXZ;Ny>)WN62FdS&wy4}d?v;?L6qWM?5(cmNyMy?n26bgZ)rE|qwwu1
z1``tBoGD39q}|Xuy236<Xpt6hxyd>hmK@4Qytd=fUN3~z+*9&<w8HqnK1Z41%BN!I
zoxQfUxgj2tv+Kh;6ReJJz}SZ2|3VCYrv}+6n{zLV9))lh6O$C!L{7GU!y_5Lg~ow5
z$A){YbpIDHAp#5in|s|enbu3h=yz*Iv|mmT7+?qnxw=^p{~O3*qGR@5BJ_P)4n!n^
zB-1Dk_zT+Dhl6vcDK_Ec**E$J>@m@Tx4w+B_jvyk)pywB@nvDvs;L1?#(*&lWP0R#
z{Ei&<Z>t*r=>jq>GJ1Lt(<RIb835id6G7|4Bw~oNU>oaS^n`BZAEZV%#&_=Qe_|Yw
zkS;gJEdFh-|EcdE#0Jwmm;te=6z@E8`Cp)hcAwC==*>3tl;?aL+EZ#)$4v%;4$<o_
zbhzltrbtr9<7`DYI0#%q%D(EnWJO=1;{gNh3Am0GL7j}b`sR7j`>1zBVwTDQo$3yb
z-`!9wfTN14jk~E9&5L}dcL#-8sDC2x(4=(yU^b#fL#N&La4+D%6DGks3mlnvpcC2T
zBu%<$68soEM7SV=w=QxZ$A9zH^}Gwdhxe=%Q<iHZki=a3F3o=#;?3iJBcumYjt_&O
zaozt^RYL)q6z%P%!iSi|bsaLn1C?h#JDih%6z!S-r1o_FI!k-Kd9-p~P$PVl!4#9}
z%jmg*WCzAcV*aouH*a(`BcJ*9xWLp0ofX){6bYs!oQOEBwU!;HWo{n8LAo`}lQTIA
z=M|?puCvxFv6Sr>>H?G1gn&o8D0Wcj+Usq@79wpadcPo#KzKLipJDdXmN({7Ek2yK
zoQavjr}~c_c7lV1JzQWPznRYAw%pYpBq8kSxJK@Ic~1aWoSuosi;e8=Psno_9Gl&`
zo|YrsOEJlW{8dAkfZWiuhC-yA@X)gM!Z60%PjnHlB>QXVaJ(hb&yN7f^&AW_5cirA
zBx%_XGTasW^twP(F}7VRF57gxe9hD)K7>UNFjxi$F`Zr(bOTT{tQC1J)P@s~Yj6*z
zR4OJSDqMOZAv}Ka@^2kdhwFeTi`VQHjAIERFdkBjeAc)Xt-kmNjcErX4}tXc^W>gq
z9&3bbMorV$9XB9N$YE5Kg=Syi;gmEZN@1qE`HJe|SU<c`49{VaEtoL?(SRTSZxQ}b
zAzWLLtlcknYovX2+?1_vuTOs3ogJ??6?H>JKMsO$zadoH!Z}BjkY%|9;~OK8-v?u>
zYE>Q19zS@TwH3bTmTCln3vs1`*%Cc4bYp%q8@;Wg>j&FyR+xeFyK^G$@=<Bv4}J5;
zPoRpUAiC9Kb*f69gM=^ed@i!XdHl?U%mCNSj`P3`ht@YN6rb63VjH#C;`am0jcCpd
zP3DQunRay=J}l0)<BWloj%k!_dZxG%(?YE*JlL+Fxt1O8k0LQqwvrraj5oTIqi-FW
zG0lEeIyl+>A!jY={<4YNQ8dS9BNF`Kek+*J8iCa7I<C19WF=rtyJXd%O%K^@onrLB
z(7c~(yB#MUO!~4fZlqrA7*A29`0M+RPeY@r7UjPf#2PQ05e?y`MSSxnz6z_as_aY9
z?Fu`aXc829wrKofe6yzVMst3-hTO3NshgA?%i>4feI}(LT<gJa2VbVa;P`!uj^lFA
z3ZbIR5lAh5v?_<mr8x)_ArJRSr$Ht|ttWV9d;hb6W`0?-!E{)`qx;-DI(K|0rU_PF
z?@g%riPh?NE?}I8eVdR$P(wNNFLdD%j4m`sL)A!(ftNACsY-L0GbQ{{DPBcg_Xl$N
z%}=Y%*QJkhR52QZOQn^vcRA|XJvR$rMaBQUQ(Nr;ExDBtg>Q_X9_?Ww)WVG8w5N8a
zn^W~^rBl)XMdVDi5LB5ncQsbusA@Jm*D@AelcW;um#OePl&1C~`drm>SW;1LZAn{J
ztC%BA4t5p_zTQ{9J|0=Df^i1A*5}LNgrGMtzXE!;zhxR&2({e^!o79d19L_w78Pyv
zuR4E7Bo$37?APZ#L6e7}%!n47MzEFyr1K+4(^UmF>nupyv_BM_GFa74ialCB>?EPV
zNHTXiz3)W1s=A1Q)$%~*YK`v2y%W%4pk7;+u%l{xxm|*8QEeQBYK({`V5gaIUS=z^
zq(#G(SqF1qd2k|b&lmkC3R$$L%@By|a^9Di{1S|N!)(c&L$np8kZ!KB>U-%9vh%h*
zC_Nh?q$FUb<%VnzstzR*TRxc63*ckBlnh42dcf$+FJbBI0G6U34frHQTYvbjYshEF
zMv^Uoy3^*P;w4jJ9y)W<)5?i6jwQ<<{FJ_6HpKEho=+d_Blr>yson!}P7tZ+^`%!O
zIaF@Q`8+BqfX>0Bmql96K@g4x;26y6NJ&48G%VXo--8<3^R3jan|A!umn;YFz+_hN
zUx1UzALgnC?BQGv*oiD`ep-aykBwoy%Ho6J064s{^U&qm(N>_2X=Xe*nbydrjPB;t
zb&PSb`q;X?^>MaiB&r*yRDyR4c<vH?AYgSNE<_xiFVv0GcqEzW?fL5H`4Jow&)ONi
zi-JEnhgr=#@i=WVnRnfa>d}v&FQ~l(ucX;|Zmrig`@lFw>GFiYvs2xy3X<wKw|pZM
zFzV(9r`=rx*^Y7oj-fFOl^`hU%LDTgWA5x4`r6VS&p-QmqZIeW-^K8rHdc=D9KnF_
zUF*{^>*wmcMl((D1>2|zkd_A+JD%-{kLVkg6{AeS1W{Xk5_4~hpHm+GOo{>C-eElN
zX|bK~SQd56mcgOm%YmG9N#7E558bt7C;L6dGqIM#r%J3&jk@b8Y1$Zl%ak>^jNk9J
z23_Un{PS>TxPQyK5O+euYp9$5%KuvKdsg_|puIZ&IFRmF$k=|rImEls>y+JLkvw}b
zKoL{q*_mA0d|12zM$_5_%#+a6njRjc9>JSGrfr3hjDJYJy@GdXgdv1!05@D&_nMl8
zP0I;KiK1D!8x)#;nW#6jXE&zg*4u(f){6M<0OG@S0k-=AW5vMS=vkM>S!_U#lVRjF
z0(L9WqMA+HO?Mbo=KRDq%|hgeQEQ&WY5uqESe{i)6qF0n6TNKlF@jsOU;wxKzB;8%
zmdQs1=*hiJD$*c7VAvEk&^87p2*bhz%a7bc4nY(8H-eo-DifSnNGEfyuF=CK=U-fd
z9&I=TF8E%8%8$jU7F`WtsNRdB2wj6d0h6uWJwegM=4(9ewiikf9l9x3?zK_LL5A^V
z%kyd!cN~nuz0f0b54p9Q!guzvvxR5ppP^%gJc^=Ew(?;@en51Hsh$v1pk&KJ*m%^!
z*#m?p!ntHKRwML6qwz7lZ-n9dP8q3qbs5sS8C-IZOJuGMV?_;hm<W6FqxF5KD4r8m
zuf$tK?9YQ-iK7zobYm+Dd9-n$e3a4`W}u;G>V`~mIozGz^KWdmB^Xpu-NWh9;#Tr(
z)0X0M2rv4U<LcBT=($cA&Xssr{9=)iRth9t5nJ4IA$f|vR6DqAZSDX(?oiYTF!L}k
zd{Oic*2i#i#_qdAvI5K{Kr9+?I%SujtYS7GqYH1B6kV+*hLO89NR>ro#=F(N?vEs<
zFaY+CpvoOc!Jx|g2of^OSVtJ47Q%B9i^%OXC-C`bZpxu!-FBlQQ>a63YT9C0$V1q$
zm+8UaF>akY>DsX8jco<mpi;hy^#<Xa_<z8-myG8GqO=O*>;rgL;&>p`*__5$gCl9#
zMm;H$Vc9xeuSjBVQBt8acHXu25b2gj==RCcCpAfU!Jz4<r}Vo?>|u0?i5^6VlX}%&
z;xnrNh`U`N_eobjCfa7Og5%9#;6&)51#g5+j+o#R#XY8oDprs7$BC&~Rh=@|gqm#)
z*$igvfNwuhK#a^<Y$H3xdm0Ltg{E|B7I>WgmA+^grtAo4C&4aEeIsQoMX3h4fwMHK
z@%@1C%yQUV7&9k(V_vD56Vog1HMo0J$kJ?R5aO!I=nnrbuV21e9xyf%Yy?Rf9`B=F
zTTW1?OT-&zV4jOG(*eVF@q1mfZ)V?}k~8=X+4RciIJ_enb%$nz)7W{L82LkzaK%Yv
z#?`%oNs<wewB`~D+CiO?1s<4gV&br8_*UW@oWstHSKkXi<y>%u{Q!)A1i%4_9k$Uy
zw<*S{)a{o;w2vA*ARr4wEngvwPRqk?T8+7AoGO7~G@g*l1jdmAiReL$e&y_Tt-zL7
zVh8wggsG@>KjBF}${^ZMSa?rF0>*7YA2ar<g>xHajM|N>@flSwqFa|EETuYm?*l~Z
zM-T7PPW7_CarK<e>S)+&_r?rbBQXb60e0T0l{$MRLm_8)GPSY@0XW3uNEY}N3VyUx
zfDEwVrdZHH14v)_sn8Vo%_6A1^+!Q#ePn~sm8JyQYM0T>?9$@GpZqlu>23ik)XASs
zq2l=|NIx5eE5&mj4kcNf{Zz%#xMcCBCNqt*4ksP|-JNeH+U&U%#mUw}z2|h^r~j^|
z2-?U^=AtAZ<fx+K+mb~%>CKe&qjCu9U>1!xf*|0$ns+D<S-u_vq@=4LgWGwHe>bu8
zu$Q$K`#fsn%^I#L&DIqa0`Nw#nNULnJRLNKDJ%Qb+!v6wxTiAUoYUd=2Dm8o#)RO}
zN{l0gBYXp-Da(s(72MBuxwSZS;9G&HYsUCW2}~jt5k@$ukaYldtmAw&ubjO|8c=f&
zK|f%51vx+st>;QfRJz&O+Qwh1orN(+cH&*;Yp%_&5PHej*(Mm{B~5W)2ZW#~%u>}-
z*u(CO`agm46?Oqo+hF9v1bB$8C+Bam?=_n|Wr8*FOvIY0b<>)&xh=k+=6N8kqX-mn
zE~;K$4$wh1SC;4KS3{E5Egk}H6qGx@<i$*Ad(#g#1T`~v>dP|;eF#KVXjc?k?~#wF
zG@Z~%&)&{4)V&|+nXfWnZ*~;me<L&yMXdhu>jc*(hOP;Fl`(5vK0l;A-xob{bN0(c
z&GU<PPbm2i-hfGEsYF|@t3f3*w2rpGguKLM&#r|z*&g!|<;`%kTjEk54<mG^2$QbC
z#{uX*a#zvj;3^y@L4`|{Y}I?o=2vwu>NAUkZ;!*YrCtw5y5%kdxREl&_mcwKh<~sR
zDUOn1-Y=&sRt+my*w=y?I&RPRXJdN011;`|6gFIyQ7!0eP`{%fIzK_r!Bx%wI*Mh&
za)L$g(iqPP(=B-je<iZ*g!HR<?{EDA7poTO&olt%0*m46kFb51IC!^i8}WO#*IyMJ
zT3?l<O!=APuC8^%$pEaz{AvB;<9f9^Y@_u1E|gBE&vcS{Q<7A(oiqn6DpdDUkPUc`
zLO&;E{b!RB2e}|;sJs1FBYd;xcwDC=i652V(STl+wKP0m((px)CveJJ8U;5H6a3YH
zv)a~Wbs$AmP6fvqD>Tj|7T;CdIT+g*KO8&49;0^+8(5*)5f;XX!7j^;kX464;I|DJ
z1{icxWmbOJE_I!}n<MG$tNM`l+=<eVCLeV5I^uPtl*w_FsBS`{62-cfh-DDloR;tU
zaUI*bQ?v%#NRt$wcqljBSUE}bz3mcnW&46niw3^3gK!{>Rnktw-9}Y<13hn+)x$Br
z*5*m3$u$yBps~`N(>{X6?+m1Mns6;E0_<LOH;&U>>T|-o1s($_LaqRcA$RnAp_QWt
zj)IHr;ytsr1Fr=&`OM>VIEAU|<K>9Y^OdiLXqt_`l*$2feyl6GktMWD7Gy6*kvia~
z^nyC(f^)XM5g}xLcUq|CPX|s9*omqxpm^~cT&i5%{RNxl+^fz<ZFpN9c-yp{B_Gil
z7*TW(txu$L$vwK8T@+?elN^kkf_#nrz#M5&YD41&R4I03eiU_eEa3ieR6A3%qj-qI
z21BStv^UVDpz{JVS4!}9-ax%N$|-Za+h8Ds*ODZ38zn}lp1G2OMpTkrh+(S{`ZC6E
z)}*7U{xf67I=0zL*|O@SdPaT1tcgLU&zRb7&R?onD!c3o8C|&UeKz5R>`CtC(vb;S
z0=WU{zln^YyVuTT(?gEdiGZ*db3VEd&(cYnH7-Tw+LNsNnWz$nR{J(w&GUv8i;3v9
zXFz@VoZ94~#61%`e)*h4VAj)6we-UyOmC=zo4$;s{cT&2pF_DHE7P^r@pprS$q4p*
zn_Yh_EN$N)y=<ZOsJX&o=W|eDtoO%jTr@YZruj25w&+Rar893nOCU0R#-bfd8XAie
z=zi07&b}csOyz7#($4DKlnvAhB*D?~t@%KW^=@}FHBbHbWwGj*DFNz~OOyEhb}3G`
ze9glTpNgf9E3UKg<%arQvl{CZCont1m8O6gM1e;49b#(+`O5^m_dK1=0&5=h);m1Z
zY)m^Bq!1$eP?~#v?YS%azKWqCscEYXx#<yv@3<3U(Rd5}vGPe`%*LHbN|3QUIk?%U
z$t)dQXEdkwkEBG|ftL#e{$G^&=Y}31LcDe757@ScjYdVnICGF8(SfpB{Wr)SB{$<t
zFUUa^$@Zb|rx>=E#?%e^@&tW_qp!>+1df^}jWUyPX5;om0ORR3qlA;;t0#sU-mCfu
zaIt1;(D!JWu|ZrNW3AS350|Ms8LqkQh|mwr^H_uAZURr+m~!S9K))q5B)=I5zYoX@
zq1*^^P=+Cb1E_7QoKMq;ZI0opY!-4WCT=_>OZCk=NjoLqM>Tec2WU~DBmDFV?{_9m
zK4XIFJ+~)3SFbrCsn9bQRwU4B4b-I|b9-5CW|ZW9#mZ(wUfR%xELCBt@XHNLo%I??
z3(j^nT%9)Uktjn+<nbHx%Umt-t61WZcSi$dTQ3R-PcCAc>LVI*CWHg$hbtQSD)agw
zJp_LE2^sm41z^8Fs&14#JSA=!wQmQ6dMM~&DdAWv-RC&@u5&v<8l&hc!=QgxkgqD;
z&C6yklsF2qfigFcey!!blMbKWZZ-m?geY%Wy7qsUKF`N0C8mrm7;pB9sSFhYl6`;@
zt@4PJAG9X!QhkJu510yR5W$|wSAhBG+>v8vCw#0_x>0Q&r3(*Zu<muYQplG=4DWnW
z<(uU=B}tH8uy7@SeP;_*`|cZ)01A6&cBeI0UudgcPBdg7gd_|RITv=HUZ?Z(Vi&BH
z(4dsd%Cx=do{%rTpZ9qH>HgS>&`e520JlVJB2BX8<se%Gb%~ibD^8_@m9L(^kTCc)
zpr1o}czyDeR@R#BxfZn7`a3sCs#tY-9cE5Tpf&em!<w8C-p7cvoJ;R2b>pJib}`;C
z%aB<FBogaPCrDN9WuTonOQ(IvkvL)_2Bc@UCaO(Ib%-<x#+YyMUMlsSxIbEvu5e40
zp`=jYNIvbEf6DDUBkWIc650jV3XZ&_MC0s|KCfq6e(Kppr3|Z6uef#GG8Ug~9=~y(
zK4iwG*G&)`=0-DH!yPX&CmvsJg8a{e^r`kRXFl~`=Fk021Qc9fM6z7U2Sa0h(ee&m
zhS$vyJNQu(^FR(2j-aAi)7QNZiPeiW1;{evxidN$*t1}_dGu~^5TvK@(J35hzN$1&
zx8h{aN3lQyX*;KfFE7x^aaJ5VZivBpRR?sQ>i8rGEJh@d<fCbn`Zu$gyNXKE`tukJ
zd7OWQ`4Y+IYFN27K;#8>kJZi>?*W}$Sj!T)6K&vI9uZc|MCUy-zrCQ?=$kOu><9U%
zoWxF3<rZ(w8nk5m+;Jl`bAp71?XHG#Qowz^=I7%*JSJb{eZf~+vip*!uh9f;=LLTI
z!SO^$wipT|jx6NLu+wGA!k+kD+#mJ;m2y=D&|uF%|7N}cCSdZFT5~HuWKq`h_Bk!7
zd~G<{O<gv3n{OQuNwDOIcN1@~=(%wjr}1|7Mo9Wa&eV{{f|QwWkRc`^tOg8|DzkVm
zQ~4p?MI%Oisp^m%Vk@)rv+t&f(+^Tg^DN%VyFnYAqvE|*1FJe(L=*SEAikMle6*#L
zo*gWq9HZ*$9{9X%!98yT&8Y98*qOvaw3<5K1#fvzBKWt=$D10O<%6kf7B<b!7833t
zpR81;N>3fXNWdSiqZkJ%Mg%2Ru|XdHcu(+_xKnqlrb)2&_;y0Ma=Dnm=D{dKu|k$5
zt0UuQ{K2@iQulLSIyB@wznFvsWU4-Aw1Xay>A>*E;hv-`8Z_)i+$ZyN;~j12MWoDZ
zLg=y1TrKie!j<6<HvHp5Zj?i;vA!Zw7Qc|9nh@+r5-xmI)Lrf1VUfjE;CPwRH`cY#
zoRXT{@K^HLG82>f%Mxr3PR3qpqxt?=q^Ex@QmyGK^Q$oEb883z?zevKk5BalHw)#7
zbLD2uQR3}3iT#;NEzWg&&%2g{;aG`IFq-k&uZ6YxX9?O1arGI-m*_m{8L6%QiDN0X
zrOj+on%tZ+MYenZMP097tOd0nI-ZQK!kaX2_{vz@IJNfrKR;<zW5$oCC7RqBIh0yA
zxz<l~pn%r0HzJuVP`=TR`tn?MAHBWY{m6r+M#(q&>2=5`J0I2u@b`!Gft|OaIDQMo
z7h@ZMcx1ZkcO?tPcg182@L<%nl0F-Lj4#*<Mkv$UHc-X$t*9yqjpI1!5TLuCUSp3O
zmk>I_Ggk}>Z+_QiqkAIzWIo=wc*REV^Y%!pGsoJP7=4FmGV$;n2cuQBjhyxHYH%N?
z%kemv{M_1u9_`s{0;eb>(7hjh9GE-iHp8cuHT9^GlO%f{?wNLc_s1;7zD8+6>LqCI
z-}jhRRyDhtVy^f;dU%OSJ6#?O-+>ANXXxvJh>$>wm?*aT{nP@6Mc@}%xC}`4Vk`R6
ziz$lZBhDN^WiNQ&pnCtnBc4JkMJ$@au?@kHfHF&tG&G+t{3zPn`vWak6UGL6cy^f+
zI=AAOv*`@&DR6!$cQ5RdT#rBIP3VBODD6-FZnfH4<8dR5s7outsCY4*uyCq~D6wcv
z$_k8$-&q<LA5OobD3luNjec&NW+b<P3X~|MOZgq=VrU|?BubLY_dY)?RHgePJ89g_
zl&MQ#`mPswKgJDeY>*Vi_c#WraBrH=q}#6p<zI0!Q_-(QE#7Z@@ZRHHo3w3fWgLnQ
zw%(gY3iPCkLa>cYXdE#9#L<&x^c_~1qFW(Yt);rC=$5Z-_bMD}={-qkr^M2)2nk2g
z4)Y+?u%DD6OYH6h2GVM-<c3hUDKL7^1YL0^6L?#nK<qCg!9?!Xj|Uii;mo)>z@9qH
z{P>IPwuvU75av<A6zny`>H((0a;S46d@j`#>H;v5{HFz;+rDPtui(-N@;FdY#G_lt
zv*?$PQ2-my+b-Xt#-CSNrn#*;FhI6d#IdD}C*@jdqy%roJbb}lsUf-N0F<v$SJQHW
zWd<KVM@Ca+nUPIpcpbvF4yNF|JR{wI3@6^QCTj@_H?ey+J5Kr2>qqam2e}dlziOj?
z+B6T2L@j(D(?HW8qfV`ljC>Ny<7};b4nwZVZQ@uPj$`M)5KU=<z}JiVjPO&oxb48K
ztIlk4HN&Ja2qib=eN(iA{{*-E4WCub3T{*o0QxZu55%;f5aUTs9%U=_!bkD!)l8|8
z;ygOe%p6^(#gG+?e#dMD&j;Z>nou1Mk=f&EOt!B9_3z&T_;yZmRF9|Sbb3W{kLmYK
za7*`W$-PGdR>lR9DzGTaAey^Yb{Fp`0HJmW$&B>mXB&_#cobmm|HyC&+Zr)WG3kB(
zY2#RPM`VT~m>?=%>Sdz6@v-DfSE@M++&xXeYq?(hFdw>zcD<|wI?WFLgdMMEc2SvV
zxiS5wpn~p(<N*EvIrUEi?T^r8q+#TR3Ua-^WeUP^N%z;^kG~fHjqXO?^-+^brXrhp
z^*xCS&wxp|q}R*v(yFF3ursg}U$i<%&|h$uF>6zo;an36>cHj_6gQgsm-E4sypP)=
zSO*>g8dD(z*>W5r5ziUfmb9l#j56RA$2f&}tRDrs!}5coSM;aR<*|K)aW~Q<R#hZp
zKOn*XVe2i!;)dFPT^x#2DDJdnaCaEoy%ZSS-QC@twzxYKcPQ@eP-JLvcP&z&C%pf6
z?|t^U&L=)_O(v79BrEH8Klj71iu~`MlCg7QP86lps#_G}><t7uk(<?auehSSvYDsA
z_)}thYa&K+x9GxrnvQ}8%lG_{0bk=$`A4e{_<Gf%Z}`$A?jZ6w<hGw!QQuv?7O!s7
zA<*qxmos^yhb05P;n*<0gJ-^yqoTlsUV@-IGn_p7IqZq`TU)rS*=cGRo}}pj=#Yca
z3-R+8XPMzGsq9!<JDT4^X@4MolNTwAlht2P^sFTntSBc<?yU43*HFnVJ-V<qzB7}3
z#mXYg>4ml0KrrmMk1Nh-TYgh$u#teZvB)<rNyO51VNBS0VOdN?B7ZSX$YF4jh1+UK
z@TQ{dbeSk;jzQpjdpKb!Tc5FMhG_dU0;E12nVOVNQBBxHq5FWv)vl-da{b?*yV`-Y
z505iVyPFxMmqBTNXCyhGjepcHzm<E*tRKa4JfJ8IGSltTr!PrKH-@pnwQLYUH@ma<
zH}zh`Ef#AU9g0MkVzJB?ci$8QmP_X9$=;K7z(J|AIi?|h-bkq<oJhDdC%aVMAcA|7
z|CGW!&$u5m*oDTc@lyxr5f?Mw)BDD9_p7aZkjY<3+j<<)4J3HWE1Q&#KAofrJW(Qi
zNU*kpp2At!4dSr0GcMnduneU+HQxBHJSpuHKCIHEJ|1v%z@@epfMPUww&8m$VD`#q
z@t>))*=pT_1cwS+OXEaxz^j9A+<L_?KN;zT+aDw}^?Md*Wc(EeAA}mdFW|Lq&v&{|
z%=9AgE@r%t%bmL|RY0Q3z7F0%)t%E^E4E9Le=vJW{`kiNgCnD$)02diz)@Y_Y4BZ>
z{@kGlgD+(S_j8oZt@OVKkl@XQ_)%2<nI1jvioim0JQuI58O-=FCLXzBEWAq!*_=5{
z6}!Ec;NI~zk7p@{NX5+@g}&;dKQwX76}}Gms(j@Q5-$Q@aom{?jp8~G&7(2%jh09c
zR*x%Z7L$a^ZB|yo1HM5A!?x3=|EB690)#zrX(DPUKT+c8^6;owvGGF6A|(^){X;!H
zUNM7kEF^_XpS=}}aOKht+V~)&&>-XaXV#-UkHP;k3j7hU?i8x`S8^0whVO=~Cz*r)
z2PXI*NTKtUJ@B>>?BM!O{GV6KCbD1{%(d)+G(R-vrSG;qA^l7KdgBOwAi?J-Nfav4
z{Tl5<2Vkx<12BP)h&UJ<ex*V5Zm?RT|1T17z=eKsNIYedzq1LIEs~}_#Cb?;DD$1k
za?z6P;Zb_cjfHAP(&@nDiuVr4z=sSiO<+v0zkL6I66fz7`9rZ$W~xfy^#F8+zzT0K
z37Bj$IsJzx5J!R!0E&@0e?961c*!U8pwTZ>!V5o)Dsu)RMCT)pCmw`P>R(y_yVZl;
z1Jm1i?_PmO+Q%!QLKfW4``--$zt)1W<HLV`?f-FG{LhbPAiUu4*AuNEIQsu%AH0zP
zxykJm#8dwN&zmBm$;v89?;r5AO##3D6$)hGxBVm8eYP!Qr=S0ZyYTt)W?|i4!F~cC
zC_udaP9r<Z(qbXcJU~DeI7$MijgBK!5$G0;p6jIWWc@G{Qe6Pn07qeGLC(jEgbwd}
z^8nO;W9iucDE3eMHHZ9ntW@$|<pBtlN!+1UrM>n_8p0I4T|hy3e|`ixF*6VvF#47K
zMsJ*$uW;4ivInBBQlu`c6o<Usw{R{(7d`OANyk|(Q&x+ORM+TQ=dXeX-m}*2K0r^v
zX$lqEz(}5H???LIJc3cV;$PR3y5XVX6zyow{!1Xbw#{fsj`&UAlFY48=GA=>#xei|
zK|*q$MW2Po85<7n<4O70<uhHT__l#pW3pFp;S69qE?@N!07USC_H)v0#X7Z$Bws59
z&o9S*|Kx2JEHZRbpbXY2KMa4)>-MB!8Z$fGN4`B87N_~OkeT8Gf5qGoP(Hr;^HH1b
zsW??X`tNCrfhk$yxl;3$wT{>E7$u;kh{?2X`@V(tOI@_)YE{E5XZ`ui!zrF`FA{JE
z$f>9P6+AcNKb~KHzd1-?5c_t8Gunt>_S9!JUiVY#+T$XAp@c!)Yn|lW2ByG?N|M<~
zF#u)gsdBqEDw6<;ghZQvB3z!3)BC#ZkPjH+QLy;JeG$3dN8eM5j7C;YkFl_4&&mqp
zQ44s@2eH>Wx_8aP9u(yXu?JbO)lY!s=%s&<PeEiJzu4q`ZhvZWjV-5r7!G}1Nxpzz
zU{dFYwfJb9d0L><W0{uM7LVvw7{{HF_jr<BHPrJObW0>+0i1-l+aBx`+ubjhW2mtA
z%>nH9AJypfuO;l~e&;?-s|#pP&A9ao5fuJq>`;I)P-{O=sY^YafI?g)|L6kDOg~UQ
zynK<Sym8X?_e@J$z*!cj(+pALSEMoCE0YkdD}H>r)b)q!be<C^Zf+z7_f#>xEYHF4
z6sZ0D4TQ;?g$ZEPZ;ISn8t*BH*6iC)i9Zrz(Pmf{Fe(f15a_w8Zs10~){_$JpF8}(
z2zy9?5~cygzQjYW<=;!@Jb()Rt8n(YnK`fqMw!(ivghDw$%&60)4RR&2y`UhDfIMw
z;*0P<>~`p%SKB^>+`x68hBDs%tnugS00MCgcI}E#eif4y>-OlYZh-JO+VTS4HtxJ)
zuY`{)8~(^T6bDG&ESC0sd{edXvnVachg0|OPdW*#3Nqouuk?OTIlvY3BNT^5>Yzz2
zV4@(gWy`hPm!*^o9WY_M!(d5Le9HIDDaa2Ix(GSvO5Xf|oUyO?Kle)b_#pdHO87|!
zfVr6cPsZDk8K^Y+$?M70CQzkPC3e8CdRtxP<9_y_dc75JIrzClTxTWw`_Nc^(NYMc
z0aH=G+#3yCB)DAQ<g}h;;qvqv9hl_N;t4lbv_P#H+-RUc9_<!^Sz<!zKXFuT(ai$T
zN0cv@K^+LhhN<TO>w~#9PLTpJe&hC`wgaLIleT2CO@U@xvmcaznn1+yaYFdtljs!V
zp^_9>`Gp7B1QwG=_-ce^6UgGHE#A0|`90q*^^^OY<og+zC9C%Va+kth*+;yT_cQCj
z-U*HH4N_VV_XGF<>8rYh5t%uzm3>P;5G_8-MTLj-s=9Gb4&&^5N2m>BgptveAaaEB
znaFti{Z>r><8e(*E7HC+sgr~TRxkMgkKkX$9%Oe-B7zGLcxQzJ^EY|G)1@{(vuLJW
zvz8}-Kiu;5LJSK!<n<aYQuW;56iUURVu9}sHKbbX4b6dY+%NGuNDdjnk4~F$NRNwo
zgB(`>73GP@1(Ytuish@N<?R0e)*=E}ozf&oK*WcL9D*qz+mk%&=o2`<E(qIqQw_kZ
z_H-iuV(FfD`21e$#p@ZXW)!*{@PbKZ0Obq$&Ph?*{MYapG?Ug5>KIVms_ssDZ;k(L
zMNhAXrFq>T{(M*0AE*s1^y@WcO4a5gz~CV9=@hssXG03|>4qHs3kaB{<T_1UBk5M|
zRAwOE)x|oSEB+4Nqy_GS3d=x=zWi}S^^(5NDeJoLwbk0f!A$H_RW$&OXsnl_JHnrv
zWMP!&=ycsY4&W*yAdp!ih{EezGM}HuW3(1J%<%h}*}pt4bt_fad1K|+>h3VwwE}jT
zhNspYTyz9qT<oGLQpSF?hzFh(Q`};z1C%wRK6*ch%On@c9>;Z{??fu_Zt&4Yt)Xsw
z-dB%Yohv{~7^M=XTcXui2x1b)mBeg`HB+glwT)(<QN@JN(r1FGe{r4ruVYbL^4+9m
zcix+f&x1ZA3$_^b&c|CpzLge$@5UA4xDd==vtnkA6v7n3sZ)5}C@l=lo}Y9yoCY2v
zn8j#&LIR(h@%1T){@H7$jLq|hHTNS|W*;VV;k+Oyhn>NK$-99=a!4FH5!r4V0J{?N
zfGQk1Tpyx^L=o`hl&8OVE+}&T4<I&fh3jcVHF){Ih;igV8mlku+pqbnQhj!$JzEfE
zh=9^wB&t4>Xd1=y&O7~=<gxYa6rC!u_<Kt6+7xDhdDsMqHhY*mOhr~ogaus6iTBaM
z{&*Fil0?U$@6iRu&a?#&@<Qr4?FV?Y;D4ZSM6-()fZjiLxpF}_o$LNc;C#HzqwN(A
z1r>m}wWk2UPF#^7p9Z+)HGf$rg(D#71r3nB?j_Gc>PsRbf3!`07fWze%3r|j)4uC0
zd9fHWMcsPP&VJdXToB5=L0OgQW5lic(HsvJvZ|<pi&--sT&m>&D3?w)TJHsIU@(nD
zR1q#^W^n5`C2>+3j3qB(Un6ggQdVFh8>G78q8i#*b0dJ5ZtHESm9)XB<wTQG&8Ubc
zh*3*DR$ju^g@BkpS<onf>5I!7Tvw_O6~lf5r4#efP-5UIxVOxdY^C#y6JezWN#nrX
z*8V^#Q4KZsI|pnbV{5n{$;@zKsX<ak`WgO1L>3ZGF0n0Z-Zm*Lo!^htvf0gG)pXwm
z%HS1&q8sK)2~q0H^VGCL3nZ%MIdM=5vaI3`d(DS3dbj~?mCK(T6e*~`CAnpo`IX<c
zpB4)BO>eK?9%W;18hZ_)&0LQGDgrOIIa&JOKtj2KR!*z`pop!2zQvp~y$hL%1(?8S
ze-!mL4T^rn02Ze`KczC>Kg#9sjQr3oW~*y77nDpQ$@bW4D?blZ!=X$%?-54_$>WWK
z&<yYpWmd<Z3YbLRWq*^_9cW@6gOgxWc`@q!RGxDz|3kPDCx;5D427i*{_o8@OAFf#
zrut=R9OnXw{y2aH$-0t;qYg5#aj2$SQNCc2)58nnjHdi9n&hdB{y8JU)iUAgXrh<C
zgO&W1-gtdvG;ll8%w{%qdV#6KOF?7CQU>ZKsihD6g5^_BVS9ERD1WHJGeJl)r)a+Q
z<$4&|ivFLgn2euPGK>_CDudJ;m46!deAZokl-DL(6YnbLDq|)e2rPRJwy4hmpu&Dt
zJUBZ|b;s186w$Q58{O7%Q}g8a))q?F`b4$%J;<BGmE#xos^JYM*@?xUv|9|RtFB;)
zlS(<*wCR=2CPm2=VD;lGLv2T)u3J&GQhXL^=HK0ve<0MS14^Vu<{gs73-g}GA!ruz
z9)b-?eTioQ-9KsWuwgj2ov%-A<}TGgz2YWNFrc0)!pBH<iDeB>wlF&gY-Izl$>mw|
zs=aDbb@=|IzpJ)=m@v8TMK673@4sHyCvxHv<?rYVm3p{a9E|xw@E`|tLa}OCD+vkX
zxxOs)Nb^v~TsW%^hi`!vD4-%XD>c?ZmKv3Uo-YQz_46lwXGR})Xx^%!x{aHuW*CJN
z6(CT_8fYShI-AiJQVBf=C1wV<vRLcPd8~PEV<?J)%z_E?%7Bv`K~^HWffsiCbUod|
z=q)MB8R#{qkwgKXMmxr7RxI~6nm<@qn-=G@B5(5@4x^W5rBMprAQ^S^su<pQSBV|~
z$l;W%VJ@gYL3S(~VDDx!A$?4;1fp{ab$hU$nO=M8>MG;x_`i~Fqr#fX73z%t5T!c!
zUuQ<ssEL?Kf4;m2o}8Qu_S?g}d3cq;#e*^Z5Y&gzMF(Fd&yk_^GSjjkBGUGz&P$Xe
z2p>Lv7V+L>mScBdEa|t+V9ajA&C@$*pnslhU6y%5zB-}svsf7`>spU7Vh=$Y3n95>
z1kndZ;a%3QCuzzeA;!h}OjE6!F^(jZJk0FEv^>tDz@9+}y!!O~-3j?1{d5GRwbu*P
zZ5W9P8Mbu9(zyo~8MIb`*ZnHWGU}QUM*nc=TWTi}T*-layn$Gl)4Ik}i3>WK(OWwR
z6vZ~{%bQyM(qaqN;X7=adio%IAD*&_JR#b1P-owMQ>^@NK~IPI$IjcT7Hf=3@xPz5
z2}ZnXFweg?ApPuxmm?qRCi<k7WjIjw>1jkbkv)>mU)`qhwov$Kacsn3(*=Y^2u-Ye
z1+LS0cAx^l(2ZSGlMJ~!zJk3faSi|C4cO}#xq7}*1P%@Ki|n%q!euBgJu5rkKF7?W
z!N0RX5ZnfE&8fxOt{)_7d47&MNHa8Y0puIM-8`w!SK3m>I^6cT&P$^yc&VvB){7Bg
zTwqe_!?peC(;1w94+iM)TtUmLmT%4sKSe4yCOOq8%qWTpLkbxDcSB}zt8?lP=psdm
zG||$iL(A-=TDNQcSma{BsfZsoQ0apwXj%LpJpdV?)xF++1PUI;ilZBXBhN9`=VS(a
z&fic1SO%19Nm$K045J=xrZZc!9u4lm_CQ8=02tMuS*Nx<NEQx9Yd)BFfwcDFB*M3#
z83I?P#=76HSX1M20Y+w=zLOii0A5H}A1XtcJcAt~ihYO<g{XSytR-=PBS!!8{Lw%d
zwkBjH`7?pWQ2f7E^o>mB#hMd6D0Rwvw|;6Ik4nH|z~QqNM{>cWz|D~1qZLZ5doD3L
z6RCScmSI}igX8yAWpbrmlE=)iT<xPh_n%WbRo388dW|JQ-H(pv2oh|w4EAll713oS
zfpNKzn0|n-E@8%gq<j!Z&>joM4{GByk(_A}gb>YWp|<L6lE=xv6KOZC8#`+3*!T?o
z@ntrlc)vyi%l@moGP&hD539%IHa8t|T|HPfr7|>1=AlM$1bM|4;iQnil<WRGhG6^E
z)<0tfmRdLTeQjHv%-Jz8IHvpRdM-rDj=?(L$*yX=*Hj)#g&i^8Q<K8vnhNq^B_(88
z@RkviJkp`c<aT}P`r+rajxHgJo@HcI%{tsm0h{XRrvOV_{yMnB>TryhU!iyHFqCpR
z`3-4woOFg{6gtsR-Ca@BN&)vBrp#%<aq;YjaRGeFC_d`GJbZYJmbvQ2vo@QU+5YHv
zHiqv`OWjKE+`O=Ocb_0D#GeVU>igeHV5{F9H<JC*sjcz#ez`Lop#(;GQ{C$*m#Mj+
zD9G7r1BJ^7y`>fa@mtLKx}8@XL^{VVUIWW%@P|H2dLG$hC>LtFf|;<pG%Qz&(rih`
zvxJLY@oq^$Abjs6BuxcNG#-zGe$&kQI~i&4JCn*bBA#*0Kb4ruJ9?S@R)7z~LhwXr
zkxExU>&{fO<}1<wB)^{TidK-Ec<)|`<Dlr5oKWkFOJf*cZZKg0>gCtH^qF(vd3ltL
zShD?@3$}eh!f$a6GN8A{ei{K*_#T9dfPSyIPqB2>0S)10DLd5n2P<MA7^=mF@Bx9e
zjvuKGAz5QO9Y4wFiUW2~tjOz4vM!>6EulD67_Y^_?^s8h#f@g7z%@$1g!?-oGT3`M
zoqlR4uN9C83LPCYwSOPOyZkOK!#bGV?C1`g_?tjzx?f1_`w1mdsQ8pyF{|@{%)9Ej
z#-OeUr#wp{%F2S+w7DMY;NY=z1-t}$(2?42b|MmddOX{yoH`YF?#0;7)*1wSx|PW}
z3zP)VF5{ju_%aGM=+AzTi@iwlm9_-OLw&iwctv1#!^Snq3{lL)tMbPr{?lZz)pHsB
zxBcdkVlO)|-W#F~Hbf3VO3yvmU2KtbZr}MmK}Qjae3-HVmnk9Vk3p=^r-;S0egxRO
z-|ExXZr3`M&E6$Z*R>O+b@K7*l5Yn~F?WW;2T217n$T{(D3^=ugE+G~MXc~_Y^$iR
zU1~7_T?k+IFdygM$8%EOnchu<e=nLMG6Rsotc`2%;g3xFtFrQkOlo)<L)5C~@wL-w
zs2I^h)7aE%>TK7~%<kqspNuL|x67V~k`C-N2eqH)`iY`#y$&&tOzjTVp2qgfZ6gI_
zsijx0pBKW*8wDw3t_vGQk0<OF6We-zxGZ)7WfSEIPK-?OG;if{PC(`PtbQ79Sm&Eh
z^_Pp~Pi{Fp{gT;tnQ_Q25tA^njP)cLM0w?7gRIk~pLh$?>;>^Umt=puqY+dcBqE7e
zWSdcorkET)3KR+5%@~9+3mNV2)mt%N%8sw7Zj%eiY+U=j=GBkj1ebBq&FqLxK^hg4
zMX%IhA>i*eKC*9u3?qsm&o@SjZxS3rdB3u$ADnS9Nrd1=h}}!v8eI{jJy}ak?V8`J
zvtBlgV9m&Jf`loVmwN*rRIjE|s(@!5j7K>WA`BzA4=Xjfe4!{il;HkVDluX7W3EC2
zNA6YN73wmx%ZnFJ08L($PaWz8A$p3AJzw_qi7R$ip|FU7>f<tE6`XrEEWRK@FkY;?
z>d0~@48-=TJ)}ryjh<in(i9m#A0B=Qz_bg(DflcZ+wat;zcXN6NF{kN&f|YL8_Kkw
zu&8)mO|rU26)>SILMr4G>Lkz<=lUcPV7{>Rqt&u_MZ2vggaDl!#g!1r3f{z8ARlx|
zsIsBzoFbJhW+U>uuHnh8#%<q0%j>jx{NAC$MqW!`LtTXEG_`XH_1vl%$tV<|d=KAs
z98(DCeW8(!4q01M2W~WaaDFJ@)d|$GIc?%>B^!doc8J4n<ev1b@c2|D3CFtFf&kOn
zeP|G%G!lUk;?vGQ&-;aa63)K^5>>mYeNmCt>(`m@Lpq>>g&X8j5813$i)=w(<1q^y
z{?d9~p)lMQ)e&hSNd!#i%=`<JQoZ(i;Yr8XSe+gUd%b`J_uJ5J;NV)QS}0QG;EC<V
z(1)&0CNAu|KKq`3VEcrgSTD+=MmUK+c&z5X1MRKlx5$Q$C&oq}Ebb!7Fhk20)X{BN
z;Mz#<F<#Y^$)YN>4~BT4gCvvcC_oTVhC&VTfs(-w`LM#KVyE#1E0^XerE4a%YkS-)
z92VLmK=B;)L|5R48FwUb`nhm=s=k()fJ8wFUbQc*XCbgaQFHX*Zqgu0p%{QhJO&{W
z7PCB?n`r&B9VQ~(3(7`1$jR0qfp<TM$z#sukcQ!_DHO!qgcltzC{h=iUcwNXapwz2
zqx0LL($;S`<o$9z<`>;#*N(bj1xc9y?a0{JTGE2%b{Q-(+={b{VFrbP#oQ(1=kW0N
z(eOB74ESx6{jgeD>Aw2&4Ekv?g&xY{Q}b@E|32mQx(%G0p7LGm8JSA?(UaQ5rAT4T
zE(86ean48IbC#6lq25d8fOau*=9zx+>x_TRdbRw@By9*1M-}fCmtTx>A!a<)PxGNw
z&lAux{hTjPpR?FyO?9N(Il!m~)niIUFXWkdouV>r*M-@BM(hlhhyDO0kVocd_AeV1
zBam43m~qB%PRqUc)pM1Vg7i7*72qxTl2}|=B%KEf`3N@B(Se*lx9EOd5XoEV(!{to
z7Q43gg@iIT&$CuOu)+u@O?|q0r;dXTM2?~f8H61-(Nt7;Nh;RCXCMG(m#g^rKGW4H
z>(wdofqlV4X9{c6S?qPX_(7*ChMhw#8G7WuIAC20<<G0YlZj7tu4z90wBvY84UJG6
zlzE7EEzEYgMc_s}Otd^UoE_@Pi3;YT2i`YVw%#jydx?(zh7M|s`MqCy#O^{&-6uKN
z%P{tiW_h>CknlNoV^<hjlFDvT_vU!^d|G$g3{lnG5rCd~6(poHOknhCVMbR3PyXeW
zLRmi4;?AKm4B^11NTNU>0%rm~y(EdDg{dl{XF@v_4WNLbpi7IKfx$1=$7f1tAG;2(
zKC)*dpXz0PsjUao(%T-r5WywFSq&hnt*0G_jfTG|ixi=uobEqS?7zL&pcR8}|C;q~
z9F1@WqQ}3FOPp0I6I9pud$fH2(C1g-!Zk3-Tzc<`<NJ-Q$JgN0<L7d1NTf<A90nLi
zN#%XMmX6B&!xx8dmmopp1Cl<taQXvwgO)j!I6epg%TPlPa&8N259J`CEM+;^qW?Ia
z%<SE4$Ima_i|O4RCcLBDjmhrCz(Tc7Ecr=BN^fVe=4@A|#lxv~>fOw_pac8Mkmuqc
z{8>ApH7ha43yc7qFSF?YIt}q6xgX@pBF_|?#G_xci|^rv8rmSJp`lLnu>XgIv`~-=
z5cRGgnm#R4akO!!mkQS>HO-GTJ~laU-NQUoP3x|_8zzh^fU7ZA6lI3nSob6|gz3vB
z55c|`J|E0WXL!jo-G~Y&K&Y;p!3&SOfuKp&;@76sx@aS|-WbP<mGtGApV|`;Xc$CO
z$jjIK$!dJ^?BTd9Gr{;!4WB~?a|J&}CdZAG0aTYCYq?#Q%_u0oEN9Hn{YWl%Tt!|#
zfcLBfijmhGJ-c?S6gcj4m02kV7F|S=1k=m>ppqzheYG)$%NMaTL&jAzD86$QGNvL_
ztdlfi^7zf#2=6gY8CGwJ%~Ly!XRRXd=@wmD!^0aUrK#i?-iggeitW6UPYnO$(4>n4
zX{f!CSfCc8qH>7xlx&X?!BdE9mF_fFjrO$;Vm*7pH&W~$jES*LlC7}Xq5AYqA+eIz
zh?kg4F0>8=SFra@4<oJ?^i6j4J)B$0x_xA@w2<*>{rk>24Qk&#;XA{0U}n!LaiQ$0
zVl?;ValpA`^CU_}#uRiZx}?mDt*@I_*~J{4E47O|I2~={T^x54<3F#V8pv5GINOaL
z%6G8O+!Jz=WCgn9gnMtdO|<#*R0w=a856rlfYvJIxg+OVL2bE6J8q!<F@MxdbP*-F
zfb_7GN#bzEKS-d!>1~|4Za$ak4~Tu!c|o4(7yj=t4^-`P#D{W8!62!3*({;m_@erm
z^Qe;}VymqBTlR%U^Z7a#7;E`vs-%?_#O~>?1;ukLfiuv??3<fz#<#?$u?M<ll)(jE
z;(jw2x$0DXpjmgdk!z%jkA0#UAEFT<`|+*KAQnpY8c_cVEjuH}wR)&^m1ZdQ^A7wh
zTrZu9<o*s0tXO{#u25Q;sf3$}{}}b)_Sh@87on^jC~O&4M*u55Zq|i^m~!y7Dn1Tm
zGZq6P$dPwdqlV+alBFr~cpOb>lr7jeETufr;}foQmEyx!t@+6Z32SNezv_#*rj(P&
zofd-Rl-E^o<W@1Z16Pp*G2Wn@(^#qdh8|r&m38XR<Zg{BrqfDwv&P(9lfy@yh`Z&s
zIa`eK7-XCQF8&XV$W>8JT+tRG)m#(E1?_t@nEOt{=l0{2A+OUit(2h*C09EzhanEl
zUk3T&MkP)u(`JqPz%21&nteUDU3Dm;C+5v4VN8(L{J=NK-9qzY8LfX6b6PyRgt1aX
zO4nodxmQD+RVO(p!!vaM^5sq6n8x!1Q4MpVmrnYU<Te!&*sj_ZY?)+q4|YbXhdV~M
zkrkM+`k@|M3Po4_)07=6P#-w(GSh^Vo^>1EB+X3*wYsYHx1jc>4P8<bF~rCKkop<s
zN?Zu_RoC#&;M>Vf^-3HFV7EOrWV*BcX;NpL8uyzrXOmVT{i!9SW@lGe0Q&@Z=fl8w
zxIs?w2^Npc%kRa5GNt}zWdyTt-WD$Gt!aOzwQ7v<=7WseBb+9Osje!l_agiCk5Nx(
zS5dp4h1@y4Gh2#xZmqWoMT~gC7DQMg??--6^OVF?GkG%sza4yAMbx!C*-L%hD-1@F
zXK85MigUK@IAMGv0Dsdvw)I0R_Ud*oAOvl#l+iNi<ywbO+}$(#N(Oly##1KuI@4kX
z(SK(qco$xI1IB}pF~CgaC#_FHTSoGmDSh9~L00e0*=VdWGg~WRUO1Nj1Ar7eFn*Ez
zGVFM2I!uy5rOe-*7uCio4!+2WCwR_R4EG=rA2&JuNYRMu@AP4yI8u+t{Xy2^F5Y#j
zH|lMvsI@08RxAGXtc@Ui?UC`rw%qC`&=y7`2AT)zO+*hP#E`F4PHXWGC&eAaZzT-z
zt`$zJhiqI^YG2S|KbEh@m+FW{AN}Tc-qDZUaf6kWJbmcoG6_bA$F^BjY+N#yLr=z7
zHR!a_sR;9I+!0|dDrc0mnWHEcr`sxX*6}yrNc-f4`RQ&nA{lh51tV41GPdWFnF_c2
z4VUsYU4pfSe#66f7HsN9kdGy9mzigs^ElLOdc3+OrIP8iT3xcyfOEJf`O*Qp7<+d?
z+EUMNqe3RA!Xu!0;?L0?yO&lYSlFq4EZbt1*t^lP@uM5&1)5x(cb&Aj318Vh(>dE-
zTx`QU4T*u>Gos&L$>`^RhG!Zd#YsGh!0q>5qHLmwll7>boCo~%ff!G`g$}=L1ixHU
zct><=j5a@91`boxe8Xg=b&6}ME1S<X_aa<X8mn4V+I#E!W-UrVs;!D^2JJMWl>aFJ
z{ibN^?qBA<$7{atH~?c`fsiLEGM*dO0~6#N-L8-x<4}HI%<R{Xqq#==zgPr2bVn&N
z4-;KEMY_XNe4pcwpV3>11@q%O?pE1YBMA*XFv3`BZf4&zdP0~rldij7nTG%Ah;rbD
zzM(jzWvcn;?N`*{SAEZi@rn=th6XsPi{BJ~<Mp9|=f3*_M?))&P|%sS$W!aS;LrK$
z`_BJ1*ie8W6uBG^cxwrF(Cp!aVw|_%watUzbfEa!T|;}I2M}IY`9DY`Cc!Uzn}59~
zf++9>$lNrsQzkY0X>3A|t1)P#;%6LmQg-iL|GQ8BlS9S_VL!#@ss#bx!)i%L83~tP
zu>Lr%6XZamjh$(Zv4u;4kI)lLEX!GAUUSd!e|;2J5NNcKxgpzw^S`@m{IA~&*djb$
zZ4sN`zBS?h>qGxJB!<DSJz8)D-!#U<bj49q<Sf<>R&}2`ydD!@lPCw+D=oB#w04>z
z1bBo?FMxRO0|I(tZXojds++C2m+5llv|S76<d5$1_;uP+_Xr6g=od^%;DCnfDS_h_
zIppR)K{Zv?zI{AuK$NrQ2$U6vk2AMd9%Jm1G`-dhF9SJWh;L=*@vRqPd=NX(!9_Ei
zNSS32hGN+t-~bx1I8x1TkmG}>qG6LTzzDua-%H(#k$pigz?v-jYb@Eif9BKn33+TB
zAPcG~z~^#^@G1vD-9N!=PUN_tDjoJ($gL6ge8`jg_6Lx$-TwWeY2eqC^Px)pyTwrm
zELci0uOyBeS~kt0OvsB~tDoyUMz<M^#*7m1Fm8ZUy(L=yz1r6qXk-CWdR^PR0On4g
zo143Dd;y>|>@{BnkPALovtPYztdRehGFXK}kDq(7{IP+Mv4-kb$eJbpdbtU0q0X43
z!%cmQj;JG1QZx|BH{|D2_}?4#P(J|yJ!g@}(J+uHSBmuj&ikL=ss94>{tW;~*a$xg
zp3H_mc}}qQqtiDwUnvg1-1v;ql`cGL82H_i56;Y3;kQFyyO+?Sm=&f<hfQzSuJYuI
zeDVF%xM&Z=okvcp1T4?R`#{b<y<5^Y^2b+i5IF04lIIr;Pk>*3b}-BF3G=xhX1#V5
z2*LUQ7y;TH{B+vP<~S=!5C$|-`6Nu7i{Gb&*bb%5@ifl(b@|uc|HK10qZ)&5AW1<c
zk_3&5g(&})PX@zL#%Xx3E@k9j=D(}#E|6Wt^7q*vifpUw5LvSG_BD=3e9JHK(KXT0
zi3ZPKqqk+CNURTtZNa+31y<b`SnGglq7Ud4vc_r9j>RVrM4n5bK&nw<g;NT2LRbdE
zfWD${N>I*q$AIOi%QPVOf2T+T*f-A(j#ge2fpuSKGtjc7PML%@)3zRLCC-$e`d4MZ
zB_mFnp_L-i-y;~gajrB!E!C|r>~}t|bLY=JAfFbAa|GHR*v^M1kJ4sq+aO2hti*L}
zhLgYv&h@g*SfSr^Y(<=NeKQ0g7Sx)KD>*_g>(AjK6o5M5adVFa7$`=7r+T4*=npmz
z)08*Rq+oqU{4wkI>llXj8jdBxHN<|99VGe+v<T7p$5KB+ZB$X!jLLY{eLu+3_gZz&
zz2<51+znhB2)bWk#{LuZjzI(dJ#$f5kN}tqq0LwQVLdLTcdfwN0FN(luCaV$iSx2v
z+b(Qi)(*UtFZ00<qB!8O%eHSjgtJ!$+ORl7tcsI4Yr2-Fg-Jt)_I<k^_U7AG4nZON
zxdGr<3gNB=z24zMbeF-y)=k)%xmV;s`0vVeeXO$JW$4^992z4wK7f6YWxnR|D=zJu
zB%ZIt(cCIfS&#qcx5xSgFuV_SH%W<le1NM%7h;j^mgJttV%hl4^J<h9K8E=w;&K-l
z!Ao9^E9RMIgB^f)!3c1A%y0-*RMyKa11JR?T5~TDg%SZwlBS;$Ns58Lmr(cMweJJO
z(y7Iys~Yg`dy`L%$<~-%(@pmOz`yA0K+XjQsa+mZ56}e%tJ8UJ>x(qGYCr1TL=@2L
zftA$%e)Ex(T%;Du6XrU@-+2$-a5$0kB^T)7kTC?bOS#V7yx&g1@-52g3am&q@aOZ%
z>CPAQB->TNqG*m_h6xP>O0qfSSqj1$I|RY=7Ls@BCYm=&?N*bXO0%9j$Guz`ZZPDN
zyvu^r2CCgFs=`3*056!@@Cv|vjUNX34OLuIo$qDVO#8pK3z@4kje{|G-W~PgFPz|7
zgoyt|JcV(yEW@k`RIUvd)!B#x3*O9#FLHGP&_;t1a2OZ3T++=_-gvqZVo`}Rc$%)6
z$P5(1J|a7|gm~1_{7tU$m7LFrD>hFQcJs{IZL-P1%((pKtCOx%c{#Hjf(5pev^K=t
zd+(_Ws2Dgw-$r4zKK|JBn{wXFLH{QP_5@lUH8851Xb;v@<XF5*{&hk2*>e-f)oKLe
z^;QHqw~@08R(-Q2yD!^#fe5|t6(K98-RWSr{FqCa00P#LJIsBllxaHVnT2%x+y}$(
zyv4~m^#`6dcriFfRurxPAdf#BR+ZQLt;9@pJ&IHvjC9l<ewY(aquNJFz^6A>K(L!=
zj~5<j^?uB_<Uxku13e&K$&I5vk;Ew~V0=`?Jd?&L;yMR<FC-_^F-xf;1c6WsN}~D*
z2!JX?P)z<y3W~2&G+jw#-$a8)>laHc?G%t5#v%2Nq!wiXic1Fb1pnATeEo$KjxXow
zYe$9GR!v(#OPlgrxx5HofUmOgay|paYa4!k6~Yv<c2(L!KZw~T=@o$Fw37z8Drm+(
zZ%Yvx;faE$051mA0S7{3XNy!nPhhsmFtN2g3-yeoq>xmduS=n%ma{3CVX*i5h~|PP
z`JNrilz_W13h&{SSEC+~)SBSb!oLBXft&zBDjFCl%DQep)swjg0`px)ELGj(lAGu1
z%g@X%qh240&D(+Sn32?+pi{=qo4Lm$;I@drpJsw-$MVLxS^6;AU!}&^Q7GDp3b<qc
z$S}a41nrX)o){mWH~QkB7lPz20p&(~f#>0qnZ39PlKS=NRnT~y$*>d@Ss9x~4i6sa
z3}CO_oK-gu9)+tgp~T^)@#M@Bzeb`CwAQ~!M84?pWyeNjiJl>lgjsm+NEvNP%I9o~
zS3F-&$6}mA61jz2r8sem*YgDhA^AGV<CCu#?PQ+yNk-@DSOa}dKSXDJ{xT0!b@APu
z@lGT%xu;<g3}&?Q0bGu?%ECDS@6koiRi4Xp8v7;q7Pt-oR*w&3Kf1ujF`%T3f55%u
zXMyCQs&|S1;}@}ZLB3)RDD4n-wq_;Aj64}}c|QY0Am2-Mt8t~kQ{q57X|s|9=x`MF
zM>z>b(WEQdx$Kz54W?@2OB*5Wiq)uRTvq1-A9AkYukxX<{Kr?kS0#yaqVI%9Ti$tz
zqgTrjG*`>NA3_O8Y3SCDBV58W$OUe2ZdsM~7sI5IQ};k!IqnCM#Jz7LUowiP(ljoC
zTBOC4n=xP5edCU~9|I0MG>fRJ<w?RiFZBL1Z`zvL#;RW*3BLfF(AGZqj!(~Hz)&TH
zOP=MMa^8A<Q_2rC{qlRU9I3KKGH?9t)<p}!bgyt-(9k3je}QifoAj4A=^V}{l!d}M
z03Hh+gb`2_LVU$7@N5c|JXgpfS(m9_AE-2FX+aPZ^(ZkqxlMV4$FHb5#(ZO6e?;Vu
z#EYkdiy`+b2Ms1VV;DYdy~W4T#z?CLm43hI<sigRSPPU)<e%qOn*wGom1teNh10Cm
zPBuT^<4seSL|jm{M|}xHhE;P1v4_o#(YKAAMX>wgNkd2aLK9UHS^1Jw)IzTx`~<Zr
zupCDrrKs?pgNbY}vzHhk^H>~oj6AX-Y<N-BdYV#Ka}zmmXwCJsu<&Gwn1i@j90kzp
zsI!?M1bzt3l1LKs16J=`C<z0qINEcF|DbdA9peEVr7sEOfid)zwqepD5W&-RT36eR
zLw4K46(fmWBys5Yl01k37dEMguK`UP=DCi!`Fy#pmju3$&Bf?pJLL$$Jd|f@O4@4@
z)HNdz8&~kclPddsNwW?huSE|kv1*Cg-#`|SxuTN0aAjQfX!a$d_JTWYS(~u^q__w=
z|BsP6&l7L%Yi0!wC7;8Q2$hFeCSzvfZu&6=CZZQ?%I}RpT0qmapCU_%ba#bhIkv7t
zP(xSip<sT_&k>q=Dm1@J11ZO~(F`L4Qz4xxSiRqFqyCxeTE9zpJ5Yw@m#JE8%?OM@
z8;2KbSCxp|3ue2p;mG|2{K3DVCy>~T%-a3axWUV(`OP0Nt?92=E%10R?LNgCS^?(I
z$^ja2R`0s2z3tuhYD(^lrA)634+<Q%dh=@*c9EZpSAGAU@QkrbVefH<Bgf{t<;j8R
zbZh{d!Z^XB`1B2p`V%X?YK><s=P9)b^O}uZ?nrK|5&bl`-wFjk5-K2Vs?KSh#XiK;
z{Ps=*BC1#5*g{?8jWbd$P6?NJL$@(RrBOz?$lx}qa1G1|1|C;nabOxu&m^gAM;Ooy
z62nyVW&w>5vm0#xPcuL#HMs_~`nl!Y=zpy%wdzyo0|?=&Grsyrs~KGKjU0M>VmIa5
zR5P46Su|e<KkFe_@~qy4>I49NWSDf)Oux$Bkhgq>S>n`{yrPU{i>xhR_G_IQIWxi@
zPi))Ry@opU;cu@E@QLCe-3l1{l2l9)p|6nrocYyQisB25%>-(}ui@=W0C#&}qH8~3
z{M~|n9_1T#E20)JyLVlE9<Alv5Z>dyFFbQheMm`l$P5|tU{&z!$7-c4H^Z0B0<pgm
zhA8zul{Xl6<HpH;XYefyIOI+IzZ504&|7z5tOP23bt_ME1WC(>?eGXhT_UPDa?>d4
zuZaeD#n^}<zfg}%efraWAmzRl^Oa*s3}>f){{rI|>*+5BW~bITcKlY9sDk`|PMTXM
zL{H^J*g?v8uyOa+5009HLh9~LOy93EwrUw&vg;UpT9mv4Je5=*TAxcO1**m>)&bU#
z@kiNu%E$KZm0uf(V<weO1`KdGTR%Hf*oK7ai5mOA#Z4VV%+fXLr-mP0L<3e4*`+tZ
zPaFPpebsFbn~$i8NGv$TMfpAx0(<<8w9!Fen|BEpxxk{2x`|fm@a}lax`r~Df1g0(
zyF0yKm9W(XBZzRAUzo?bOI9f^Q9kkb>YAtTw|WHYxY#xMKJAUjX0ugoEvZjeP1PSq
zZ~14y4NJkqBg42ohz1;LFpNJ_g$IGe#%TCHQA?%w_*TKIU&*Qyxjl#l9Prt}H^#Ly
zNn_s^DRbm08M8!wB4z$|jv?kSQbP*s?1&C{^^FfpvcEn)V2Y6iGsRG#=AAHeF?}&)
z@%6-&8ZUT*i{CN@o_!cY#qr2E$s+gSwGl~2aedn7Q;6gcxIctv49<$%VkEIh^W5JE
z!NmOcc-IXF2Zt7VB2m^e6si>DPMw%3Hf(CnmQRXbBKY}DNeYGNR}K=8D=R|Xz)B%l
z^J!NV1=2Hy*9vBlg%j&&okCdQqW7+}0+Z+Fl_Xz+#7j<!4$}pvQb($73EOudTq1^+
zz#4wAGv%4)CSWyG%@1?hVtgZ-_^Ea0tNcv|AsYHWFRXkd6WBiMibS5F5#}8HAhzDA
z$^txNg?zA6;Vhp-r~)3W4TTF?A)?DiMBL>$&diXHjtl9^jMb7BVg~{3Fj#q=8+aY?
z6VI;pjv5FXC-2}W0zZuq>7l=mwc^P0BTUC0!NK1|1dZ3Lt(-J9=lmpUZ$^E&DR%c#
z`puuuk@uT}6~r@>dBRGd5#@*&PiR7N-WMxtEFcI|D2wW51<XecCyne3e{Zdt!B`Bl
z1?KT)P{F~glG|ppiYvbSc&_d%+_iC^OfX{*tk(MBb|2L#45a$I#eXsx{92le4}Z}F
znk;(*EX+b)^e;ms%5gONz_$OHW$JXgRTGZG7XH(C5N&tWS>Rq_Q>WPlS`VskGLHco
zIB77Qca4@d&jDXmf<venmTw^*yaG;K$-`+5N5I5yAmTpy*W^L&_!aLbMNKCS@+jO_
zm-w$P*a)Iga`<@IDv6{?q<Dz3$i^^;??I~X>B~%al!8r1ML$HAp**RYdmR7kIzQv$
z>J;J-YUgNZXgT)-xBpht(*t@v9REc7*<2XT$kMIUh2n~_J-ihz8-a+oKSk<uQrFf#
zb=IPowTLbQw1^l!3}fQ-3eW#%81+P}kd_A@ov;nOZsb|TM60#}xH^{>emOe-`{1M?
z$#hxsdy#q)c$1OMY1S~hOVN$~vEdeV3GKZ~7#eTYeU$H}9JyEmUx8P*cK$3w=XdW2
z^(K0F7isWsIHp(&ncqfldHE<v6tDaN^?hY^kNg5hliq}pXrTXZy!?RGHufDiAuGc0
z3e22n5u(iICu0k;AyQecv+9+fyCLu<AFacz7DRtH<ipM)KU7E(9>!F~64$C>UQow6
zp}Rm5%19I_-int^cpAgn3#<ULojoEF?uE-xT%{RF&h4B*<u=P^AJXN>HcyUG3nxiL
z`E0eiH;4@rS>O0GMyN3_OKev$xHEgF_(CRYex6@4i7*5!N|oVUFO~D<*;3GRXtHXg
z_0N`zMvEDUiHCdFEt_YF_)bG0C8oQzaj7?2?dO^4+Zjyq{^0L-;8@bPs@$a*3^7>X
z(7MYpe#BB|Te+yyGRe{EaI-?M{8``M2VN<gl=k8L6iHPks<V)Qx-(<(U^fgKmPNG^
zrcXDRMsbU@O=~1m7r4s2Y`@(9+O?URpmR9v@Sx9KMJ2q^YpGk4gpcL2(ud0)y7Q6F
zBZq^(Wjz|SzvlR;BuKPrb`-j;Jfr8fP^hAYOLoTS0oE<sEBea*8FcB+1u+hSqp}k`
zDl2p~ti%1bH|~N&Ccx$S$<&xVIA5%<2d;O4_Jl~&9qC~i&ud0*o2zYqyWcnwkv2yB
zBL;X`M(v2rFNIlwd`*6(SYoR+sLcO@N|wkn#%9TBdnoJ~t8DVKj}Lm6P!FNH2u+%0
z8ujPL*u!liv}i%9Ch@_<Nt{Qrxo*MvVSyVvLj0of8(jC=l>r%b=_qO5m=yC-Zp;JZ
zCKRrBM}vKE--+JtycUHNmRfr^tx0de%@6y+BoirnR+(_TX&RSWSXy5K$^9YSOO~XA
z!jR%m@G3<4ey7b5nQvCy=4_Luk8FH9gd>&RJkElSw5mTrC1nPk+A2BMBD}8lB5$gF
za$|K-;yC>>U6b6sLTc2Hz$G(8m}7U%xxmMlOWr+xlV9(GNb+^SY=T3xcBBZP8Y$U0
z-*9eoDEl5KiZsmflYVxOw`sP0cqm%?%UEk=GQoE>(2_c7IMlv5QlgEMY^Anl!)d_d
zt)JwvQfs~!QouRBSa+b;2XSF@xMC9TM|9Y(Y)Ct{RxP}heOxo#-{y?d_;nY1s45D(
z{<e-v9V3Cd3X$6qqFhgI$njbjp((YL-lfslcc55UK`3m4g#TUOyuN{*wv4NGKJJ;g
zdPD0yw3-Bs`lIPblm#urr>hWTE|`~S5QfD?I)hV;JoKYcEh|_8J4Qpdh9p0H&=_0K
z<)-dBl=JIN^NM%oM6#fhA>+y}J9{!(yEgCbmL-a#VL?B4bOQTZT(zazR<mjuUL#6X
zRZ&HJ&0Er4$J3@Ijn1j}=>6KtU$;-$TK|Y}5y6=}!oCF;X+O<&t9&c$rWq86OFPHC
zfyF1Xh3mnqZQV{7Y{l`*3e%Un5g&PEzay>c>67eOylhBh3~1MW&n<qx@lAQ{48|Or
zgo@jG0zAED(owJVCH0TdY9@Q$jmMk}!Dq9fZ@gWq;i*4@{Ou7wHp`mYiSYG8@d>#T
zid;fFmD9EIR4CrVE?*T72*NZoq8d5RbIu^i=(S&0;(zO>CZoeRs<n+Q=3M?`OeOko
znwHLPC*8Fyf0g4YJ{jGcHERFFw>>r5cl0|c-Nm{o;+D@Q)ffCH%dx$M!RU`Zu~e%n
z_?N$nWVC3fR$zWqUn>X6Y5vrxMs;I?N(sAP*@<qDHsRZlq%`<io4yw;H&a_9fD&i_
z4XX1@!f-P=vfbC!_QIe5E*W1>)ql;rDJh*cnm$wK>@HcIn#bDa;LYC!^>3Bd_eo;n
zT=`q-zYk>DS+6A}U-pn%+CO+v1otw}mn7w{0XLF|fnP{3JPM~72}YY{`|vgbW8Xfd
z^Os!O{BD@-nWd0v9zmm{vte7<SEFwLQ*});9JZu5Rz&>FtxdYxl=K_ef@mN9{k3|1
zv(^V;sShvg&I>Xd4q-i;2@N_N+=*-=ce*6o+(AJnf_(^#L+LxtS?(+wX4Go@9^?MK
z!#iUq680D4w%c3>`6!I$xeB#pY&{8qB!8M0LQ$V5<}ML=k?EBN&lc%^U@C)Z)u+3z
z`it_b4J(mRxR23e3C|PN^~)rVzr_Ej*gIY_#-K1^tsOYFOy2^F0jf(qTgy^HWvVP+
z`o7;O`cNbok!n%JrXx1pp!$2_4#fG(88YLl5p!;=t(w5RFNQO{Q%$hT>omhj{h>Mh
z%xiRo6IakjWHz_-B18IxQQ9b))9;r+%xM(B0X@H=slMdPKsZkhonOC%iRMudjM_w8
zlu1*%HJAQZCFzNjq$i~)@7_vdBEBHqaF7(`I*PV5?>X21msX$cdnsdlV<mOIMnXYf
ztkv&}KUVM2$o&im(cL)W<pTuuOYHZVn3ue_N4GYKzTFUdcrNs-k?y8SW=iE_*5Cj1
zm4vI--?_*eS}tN1G|@#3v5-AV<_p>P3}d8zsFnWGW!=7Y`8f^A4t|IW!j?Na^kwlI
z_dsDSqjULJV_jAEt>Oh+pP+n3eXch~PmKnfILl?Kt2haFy@@8Qu@@o}r1Tk>_zMe7
zmQ$lG5z8f36mZBFB?eKAAIGH|IXFqNChH+{+i;b++MQ<CtkM0fakQUUPTT9Tr|0r8
zi<EN_R$a-5OtyDZ^{Sn$u(SwmGEv2A^hqPwX-l7DO+JhmaI(}pa~+9GFmh<lwA?eZ
zdqg(MBsAoaAJ$P*%g$UfWfGQ#YE%9%7r>DjAxq-Kv-=aO7gq?)b5U6U2St*d{1qd|
zFiuV6*c9zU-N+Z@dOGdo_vGN-#B(l}QpP^F_+*T>a?c{kZWGKQ`1gd)P2klsMUu&-
zxE#%Q=5tt!^rXf8_c&4d$pltkuB=<ju8uDGI_4~aWx{SIdW%lhJw(A%R2RK>RTGb)
z1kqhh*=N&-JV{{cJvc4Bv;-@PE=6A(iGJ|}^7`$;`bht6lt!2!^0`Dzo~=mZZ6Vx3
z8+QgO_n-HZ)uco9k+-{r)zc^@5eo~&_mdp%R*s&1?I%c7T0P%r-PM|0$1kfRh{>CA
z>GJvel`xe^t#KZ<>g4cq%Bh1JF$%ykI?GxTTch!njGV5iwHn%|n8RSypIAkBlH6!k
zFKgs<#JlG!q7tVmWU@u(QicgP@p{6KrMH@oh<<6{U`1NYu;seanz_53!m7<>d6fR5
zIqLV#H+=7*GO;T{ip2v(A)nuThnbE+sd0-XxH6xZ;i;-Ax%}dsuPv*q#aY2$CnWv*
zdXzQ?{khKII68EtBjK&|)W8CKSlvqATC8mKE&94m9PRiw1~UtbocetFXr3n5lVCJV
zW>azLVX)OF=A$0cK8L;J#>%2`!l7ddJJlFV@xA1`H9wZhra#&l$WB($(6uqxoFbDs
z7x@G-&muWPGvLN5MutIs?h6hLQ3e>%?qSc;Zetxe3fm9Gr=s0R0giAKj?@nQacz))
zdH?2luAh_kpHwZN-~7!WD)w5sR^BPf{^WaP;|bjT%*^K-maMnacO1v?Ny5e2ej{6)
z84MtfQ+kCEf92Y9=K2*H^0)64@N2b9PP95l(SYWhG9AAEK4SFOE9eA^ukgh;UVnB6
z(-FtqunqajP0&mfS|VNO75yWK^E;Z<9nKQ_XLf?xkomFL#b>rdq)6)8t#DtRXcTKq
zQO^>02swcJpPI%?+LB#P!=23}a@A2w%Cuq4WTo;*h<C|4ROxQt)xLo74@T4DwGf*c
z654eI%?v(*X|Rhk0xHf%pq_h7b{iIKkzqaS*wl-h{0Nb}AP1fDBVzyy8k-R3BapL=
z3Lo7&tmYF8)ogotn1uJid=F({(rIZ-WgID7*23hS5M-)Y7l0ENH7s+<nx+*O?f$!d
zdn<d_@+Gxa0Ox?XCdY2mT4<JvDsZVq`)wZ8hZ7boB3So5r^OzFoaIqdX(xE6U-OX@
zo`MeIiw8mhYyJq1<PFkWBGIJn#htb1{g{ZE<h0UxWGIc+@ix*cf|HxlJxjFx>qz>+
zU!npz{An6~^MA6Ql6E~(Lb$jZ>?3ib?iec`Z~_6LMU{83LVwH|-*8N~J>?3?yz#&b
z&Ue4Hw<xN2u*g}@dFAHPqmZrNbNZf=uFeS1s2-Jl-dttq3V(lYbB%I%H%12n4KA$3
zlazV8*LP_?xc0NQ3h(kAUMwg3q6vy-X&K{Mx?cEY8R~f4-e#<}t8#{Z+lFcUf!P_E
zaxwX_u^-XPTt?TU={Azw5=^5bxK0Rdq(S);PT*WuuWj#3QdnujWo*K_DZOwEw&`V@
z18M}ve@`1BSmE8>4<16RK%kIHvXPV*6Rpz#Dr4Q^gh5u|J?vTO!Pl`><#^e740Hjj
zI*BW`q_}(^Z93Cuk<LR2>V4fj9@U{yd?3vRO6W#x?j4+T4~`=O@NNIEKObEXtp8Hw
zPB5JPbou}M>vgvpDK}!*Ev>9-N`Z~=!u@Ak|NRsD|FHMgZ&9{?zpsdtbV|2$cX#*D
zA>Ab+NSD$L64Egs4BaJNLxXflOLsS{i~IgQYdw2C`!CqX{@L-E;kstd^SnN<cj&*#
zI3=o67QJJL`N4~p*S-Ued|jR+3+rrh2nd9WvM6OGeFe2-(N;Fet@$}Y==EE17HA7J
zLO<P?J!wtydUDtPyu{J(nzv`8V0Zup0lq%U@P|8E|9nIfu7BRy#<C)hG9dCH`{6I`
z8er%|0rI0aA!3^^W%bC+wQ4)Ny9BtGhnnvJAggsK3rr+6QveRvg{8=Z86$i(C+495
zG?W|Moc(Agwo0=t_@{*(nYD$@_u!g}7={>Y%{MuZcR}7kcLcEdu6eKA8wu8&){^{t
zjev`jahg6%G*@zs`5LGIx95Ajm{cTjcp5jLx;_F5ixFQ)Iv>E1WIw+DRr@!Rxn6fQ
z;PS;mt9S#n8yNayXH9Ga^#Y#&(|a(GFRNOyas%a^=<{0<f3to*7TWfBg?u`~YmmJE
zLie9eWBr2wX@7&IE#CVV0$tLR(vp_@k`4?oc9FFayqPBLr*>du+YR{1>-1xV|NMJD
zbC5AUK`W36J0pMVy^)E$*au#&P2&!@eh!#A^5}T;eSZVibB%_XNfpjA1^9iLvrtFr
zoa4%FiHFV0T<Z`5{p7J&zl*#|z#<a_AbegSAb^iqkvAK|+67GWka_Gw`wTfcmPF&H
zet5}jccIvqap>&MbX%Z*@qsYQ4J7>Mdu8+PHC4!|Wbj^z@uOWM@E0!zOY0OyURVJx
zWh8Xr3pJe|lgP7vZw8~_97g^T3ZyW($qE7ve&=G!YarA&%8gFO{jo4xB#0ggzxGZ4
zTX&}WGQn1s_eZVM&4U5pCX~G2ol&p=z)tZc#OmfkeHMVu?8Cn$tQxeffSOUq6w72i
zJK?KO|9;EAvWVsE6SM;+d5+42Mj&fE<cE<L{R`+JaDb?p8dm{k>rf!;SQsddg`4Lj
zrhhoF7Daw3!0raL0i|g8SASeoqnj7(N`g5@`OE{vMcj<}x>jQi{}{T>zwh`|l^!`b
zbG7JH;SX_NtAyz??Y9;=Pc5$1b-;E9Y^}(^8-LcO`B>ig@YZrw<hp4r_$B}T;i{p1
zdOJT*7{ksJ(D)Y@U%p5g^qmF;09b{fiOaiSlUE5)aJxUnL5feSpKMNgcx-`^ovDXm
z3Ta06?o+s%uQ0kM+ZR9$pT*BVs+#3lfSK-qw|T<&rt2LSi=%dtX0>%-FOy=<C@K%<
z1^t3IVCvVgCb``KN-fB6Y5>N?<Fluc{T3i*L*P}RO&|_o+|5+uTQB*eJrI4}zYc`Q
z`;XUlngOA~Xb5CJpE?NSYBZgg{!ZQjbhUUd7zhVYc>>*>bfb3zwHE|4fOaClj?$N5
zsmLENqr*-}+|d<Rv9_Fii{V_KxCRohXNtLYMOW@-8oI1S@AZ6Dp1DJ?(+2@QsK1zW
zCH!==QR7Z9_7XjQbq~P$Nk0jH7<*^~NEqcAuxp0^aKm`z>j2f!R=QKUV}wT13)4+C
zaUh8mx!VaS+y0~>JY4FK__(<8RKMOQB%A%xlYZ%(cl%B5#Rbm?SU-{PYd0~af-8-;
zTH9K$&{`)%b46^2jN;iY6$G!s(@YZif76NF+3X~6Tz>pzyYu5|nf0;N{jg55Vz`Q6
z;Ln_U4`!~Dlf1^AcZGxQ<%+Au72n&Z#~&ZCyxdoWF9tJ|?pit8uUHx~jP7aWqwkIz
zsV>Uf{dSV7<Zmq|9_gY#@ULU51}!t!Beo7H5Kde@a*Uyo7nR^Q!|#cag6=NW!kS=l
zjqezI_g^|C!Y_efX3~`N6j*$+{j!Fv1tNo|%dGADhSu)78Q!7w97+KoioZjs*FCBV
zrOq5J;C3^1WB}Ni6f;RqNyPT%RBR#B(-r?&vEO6F!Aa?S_W?-nGWbAS=Cp%u<&w5|
zke=)h9f|~w3{3=y1`d=};Y%Kq2{-9lmz4DUX;jx=DLo|_y&f4;v^+K;!fSxB4^7|{
zB7^YiLHVx<X;6$m0I3IHpUR5{kB^byQC!|RlfVO#k3A6MNvwi0h7WkQpp@RZm6eLM
z>fe!FJJPo&vbQ^SDF+yR^aUxDfY&rSt%50H<3)V48xH%u@j_iuc3wOh$g8wS=Gpv?
zZkqw<Pr#7po|oUF9;seFA#XKXcvqs7sRiZDi(6LDsAa-#IEa7d&ga0Ktb`#C!erZA
za7p=0_H+`u0KZNjpIxPuVrw?g4(tVz`@Vo_vxh2%kJ1Q;Oab9J5z5@>OQj>4(^-i-
z*;O*x)vAue$FY@yfG!~&ym@CpSrYXRJhm^ZySN492{^rNil;PULZWsgwg~$~gjJ*M
zGUmBET7yhPWYV#<D~RUrEZHGnvVje516YDdgU5g003^;Ahemn77I647@Jwmo{c;AX
zP$H^pjJZjJJ7?MLE@7zd%HthA*ywj9>cts#8fRqn0E=n^!v{@`yty$;(`dE_U@ytM
zv>aqcws%B;mL!GuK;9ivrqh9H5x{aPHA3*-ur$Mht9r2=8-Si?6wKA7gx^9(qz}S(
z^$qp<Eo)0_ils2}4os0_Su%|-*Z90!XnqWm?Hv?4hYp?%^)0tvMYP@@5qZB~iHJ%V
z{NvIWQ7ikb$cia^HTa-6|EXIy)unun@f_<|6VH%Kd&WRD`+7*oP|qxU&b=G;&R~WA
za!NPeZ<28XcF+H$bB@u)#gawdyEn<qa){ZyVs+Mgl)nl{m#CuLkUsx$cLj)B4wC#N
z{F2J*C$4XGv|<9$W0IKb!&(b7u)J0ID73Y8P0eo61Z>QFc4w0^-6E3U@KRE?)9j%U
z50{2sw#h~{yknxzJ}**>>RF3G)haw|1-+D|FxV8jQUCRq3SHE_{r$*wJ-!JMwY+WH
z=j3QC-%$U{HoYiI=<7#IK+HDdM6klSkL)9;&y8^6n2cIQXE%0dNJ;k8LlM2zd2<6a
z%_k-;I{oLg6oL*ztz{_v(y6o#h;Pb}CFUujU*NOp?M=smL=qw;vl`7H-ruVUa5df9
z211Q#k1(>z{Fgd%%N-Lo4Xkco<=HN&1x!F!5Yr#JC?|ADkDXwRudQ$UvwwXA5k638
zk|SXh*aV7@wIXFRZ`G>Vf=z^^zgxuCFb-ozMyvX)WB(Gv373VcS;c?mW$WJ{!#Bnq
zT>l>YS)r^41sZ-Ac0n=pjjb|(LZK@Eh>~J(y^fGmaSp#-s0IzqfeXLpBz@&UX6OmX
zZx}V2E|ClR5>M5<dv_1`erG(G3QYEF&G9_hJSl%huK-O)CCk>ZuazPexTAI5nDUQ5
zsR{;`9kgwe?H(tn2owR|ObLX<Z72Wx^pMUeLeiEV8aPYQtrT-E)CF{?kwa$jL=Xjs
znJF@wgAe}KOb`00+6h#AC=C&Jvb7!x0eWJjpY%M1c^Z>y^D=PU(Z^fR&tCyi7hOSi
z_f7EIIa0#8w0UtRUUxz?`dnj5c#YLqw-EOWZS`;O2WfRcTcyWO_a&s4j}P0}spVx2
zqh0qFu<`^|K(o`tTAu689Ai4qgiRHti@P*_y-;UL=fmZauj&;95Pwxs5*bp$40k0`
z1Pu&1c4%7EpwVc$1y(oe@mmNfSdVoDCq&>94E>#DO(D>-I7ct2#--LL(;60eOmyzp
zGR-<_yZ`9O8~;g1xSD-pho4pNS%pB9hl0qr#)M^FXjp@B`;}t46DE-~eYmS|bvXTZ
zDA(Nae-4u&NMFlAmr^74!1jpl9qIM^4!lgIlu+!n*7Yk)&9tjP>=SbJ2EK)kW+rV;
zS}K+uOC(dZ9L5$a@|IBwk=917SbPqgo=u5B4AV`Z97R`o^HDJmF`hM`XH$p07nFiS
zlJJFFM4B2@n@o&t56Sx;`c8DpKPreHv5O1-kN;4Y>QJ;mo}9tA15$%pHn-Bb9K_t@
zx4GZL8EmsE7vp*xiraxQuCI2+loJwK+{1l!D~T?3(>jycknY?xF5rMrtRoQFU6+(H
z@97C-jg(o5FM)8S;F38Isd9n!T}MkTUSiMbsgAIQX-%HDaaL76Uwq*RLMz^dv5PB6
zx)9L@O>)ECV);E9S4Xhdu`1s#MS}0Mi%khL<+km+r|KW1*3JO7>XQ&bb%@57)h>T<
zi6IG4<81*b4{X*m`5AY$J19XZb1fiMt_XI|8pBr_uLTBIQBNrZX@izdrid04&$p8z
zW10Mf9$riN+sRodP`?<{2n+OFD>P&#mrA~%hL__NtKf*4`=mgYe^iU~MM=vga@kfI
zUspVuO>!EqG=)eF$;#nGw!M2a@^-X;p~$99EI5_Fi}?4PVDM~}dVQ?FP!#6nN+R^r
z@+L8ddxV#TOu`m~6y%(UMwZ_lS_KIbd2~e_Ysc`CQsz=MSKGzCqBY`mCjGs=T9q>#
z4~Bl6;<Qz|3cIsW5S}Q{6@|xi_rnn?A~tvX6E1!OYP@J*2iGh6K_ctZf{>7bB(K2H
z`zY8awIV6hv?^+>y<#Ry7ghhfx6DKmsS(Z5@iJqc^LOrPpHiK)2}N6-Hi_d3(%bu_
zzBYYzN=W$kk*(u|ip}{w$HS&tI_w9n8k;~E2Mg+$KxBMQJg|=87p+yQFbZ!y1T>E|
zbIgy_%@ua4w0j|T-q+50Z{n|j#}0eY)MzYv<vi)>C`gv{r;4=+j^3~Y7@FsXIv@EN
zRx$#W1epu}&C@5}=#d}3L6bL3VM7?m;s=wJ?O+rp1v|{)w>&EQ<;~>_AAN7y(UYoz
zVdx|SJC!ua>Kup}Ul{_KA9jM!b<%WchkNprL*^bC1n2<7Fh%d~mJx->;wqS}AWrTe
zk-g&zB_u*5z|h!FgYwzH?dH;VFDjG%N_dX7+L>H^jJ$c{PUso^KHUl`arZP?eFLpm
zoT8gtE%tWs9kxQ*LLkx$>$Ru)79Kd?k=%y}MOA`K?%9`?6A{<4K8_=Li{G{LTYoF+
z)5A6gX5zPja~-#XI&EeZyHI%1K{Lbz!(=>Nldt4^Kv{eON2}!uZ5BI(E$&MZ!qXNN
zd?BfoRcNp<%VV%#s9`xorewq@B6d^Ht*!DVcve1YH^90p;BA8dd7~^(gL;>nN>N9=
zT<n|;(1@BloAzwSkHCHq@hQZ1WHMibnS}G%qQ9LV8rZa-6Nom^rr>>IeQsk1t7H|$
z+TzTS{d+qVd$%y7N^h%4hT%qMD_!d(4Zh9`4U!ZaD){dcx+}r!YLi_;iT6sxX;SfF
zkU^B|piLwLf`jjBO^QgDJT>W+pEL=oo`<ma^8Y3j0+}#eSqwb%5Pf-#UGC^WU-DxR
zyryWhn(BsX$^aco6r8orlw-u%5T(*DOa!VlCp#c7z`R{L0#8~$cdu}6=;vN39&PJe
zDk5pS9ELEwm_sTC0eWEn*`tp7x}fPuz9$cP7F$1&KJ2v^C#mw}5ENik6l9}16sDQK
z(GzhKR&dC)anZ}M#jsP{b&CAaJ}46a#oo%_i{}#>KhgB9W01%svji3fBnMmdFO?52
zQ-hV`ijMIXE|Np33q_`i3QN86iXupL1Xv+u3>ki`F%eUwNq(cvkUc`v<8V}rW7C?@
zN9G`Xn$37rOiX-X5=+h=qj7sZ6i~(cF|RKTLAy@XHagza^KU@Yy52JfTKQeDdugh$
z4k<)un#eUs*fch2o>Aw==gq0N;2mG&lCTl_y+mnEJ<m<u_*2^{TDK917Z^V6dy&x<
z-bLzDdpq~|(NPC%jSd4CPjB94<A9gfccV`=ig%!Xob)Q<7nf&RSuV5;gy!out%a>6
zjQ!<a8{#!#HD}6c6%lr;%d-LID<?eB<&gk8sLRX?O|;4SOK1LpET4NlHZSv*$W7N6
zx`@RW7fz4-*9m{=t5~OYkxxuWcpS~@dsO;Gq`vGN1``NxF2i@PbxDCBuV^-8J$VpC
z4aqE1WjIj_v4k8^FpL^ETRx6$n~?0`cM?x(hAuIT{Mu#@h~&aISHz@jp<MmJ7$*kt
z;Xe9vB3le~c}=l-XQ=u55SS1e^SO95O%*w*8^{(jY*jCq(9CBG{8^ncurB#tYBj>5
zi<-=1TuOp5s$Rh-zPezFVHi+XG#Oi^T5@?AeJODulry8av#-$v4j8)=&~*p8b4aR4
zjknO!x27U^ES7YXD-SiDJD9ylxr*IT4}0m)*`z$o_3oydNjhj|tVKp3f^Cdb3r?{i
zWdTpy88x<H9r$Sn&2R!i$oG}c=gi`GoyFBZVu$z`B^8;Q5@ot0O_?QNU)2pI?wN*2
zA>w|{=YV*i1rN^TX_K10qThS#6jHVRvj+20?jAngAtJO42DIUV%}wjo6X-w-F`g<7
zgj`(pU*|=<r4AV}335YXXtdGA!6byq|3P|49+f)UT1%fsYQz6h+ju8nw;7%FZc|cs
z{+4$obb%c~m*CtJa~Y*AImY-u$AN`FF&%b4ZE3vt7d*NkmW$Q9jzR?EY=Lp3w%{o<
z_k02}74MV4gN{vIFfq^PmZ|U7ekvE@G;_`_F2Gb-n6u0eTEOiICAws!!YiFy3eS6M
z_(8wX(DbvMQ+ingQsWWNx2hhao_@`p1G}{;<YvB4Vo8Yi82D;a?SpeCIT3win|K2`
z>tU!kSHZU}`q2c)-UqsBvx<l1JuopGu*Bb@2raTgBJ@Or?;S5ku9F^IQoI*%tg=LG
z-iQ#hn_BG7Pj}5zn_$M;vB`eUf5S<KHOd7!X&cv-GX@)fDh>C*Pzo$Lay$sjS2$d(
z{30oht#Dd-?~}>Ij*Nh;;ahKA|GTEjY%S{jod`pBk^X^*85#WKpfj06OTH$aB%_l+
z0W*oFag`G;eH#Y^$mZ4YHmY&2^Kk2BiBZN$nUawrBwi6u8&=(wi8wgi#pHDO;LH>V
zq8i?DG3g6Ii;~c%Jx$d8!W2;#XvmCS?oex@lR-KiFGBW-^;{yGxZRXGt4tyrLUWbj
zqrM}**gNHOD6k7>S#41o`p)?6V>L{?x~ScWeK{ty-%4MGt?rR*q?7QY?E-hC&@N4C
z%^|3rO?@{W+m{1j=*>H*iaJ$;#~fvdg40g>_A)sOZ6L(arag~!M!k7-If-Z?VMCd(
zEf+6$Vg#DzVKBp=?BSsP^mN@`;T7zJ>l@`mB)r`Velpxj555!dRVOBdyF*K7FUx{0
zHFMCex*fpplfi9KJ1od5n6Yzy-1~PD%cg|r8oFBLOn)LnKdPmvB_onnyiONa)W<Qk
zc=93Cj@*bB<lO@&a#Xr$j$>J<rG>;_-hrs4nuUpQeNGv!eyOh6p#~gCRq^t*jA#!H
z*ZlzZL}m6oZk@d8=jxSPqL}X;=R}*Gfz&LOP3x8zm$I4xCuj1lYC~LK_$I{Pqa|rg
z2_h)2D@jf!2U|+@qN>_YVRI|R>(=9P#x!(DT4a4%RBgsBy1;U$OW8dCt_-UMmlzzj
z9`Hk6vm#1q8r!LYI00t-*uoUDX8_rE?g^92r8Lr{(3_HtN3rwzJd=NwdXe%<ljg7y
zK{I{;`#2jyJ$TeuFn-YP$~4#9<*>_+<*EAf>Q6Z&$NA42UzBO482wcbbUzLB4?ROx
ziZ}?0dc;teVk?;_A~q>u?1rnBA&)L^vc1fy*^?^w#`VqQMo3V>8#EJ?Wa%kH$q!SU
z$#Ur%G;}&?2z@fYuR*6wk{(Q!8C$JQGhRQu###Hbsi<wNrwsWO;CY`s^ppoaK|)j6
zK4Xr>M=1+|!P+W5TW}{fT*h%^j|8lR!@<#VTEah#HE*!LoJ2HkY^MZ2W$?-fvxp1f
zmFTE~U=DFrTOJcM^SIGd`xw^ct0{ev(K8`|R|?O&(!DO<-~DM@bc)4IML+qamns_*
zA9vgQy!petg4jtTeuIb0ksmMEoEW%_HPz!X*ur6hup0c+=7iLu!h{l2THbxpHM7O#
zgxMSPCxi@rY8R2eL>MlIn}!1~!>Di_l-NdZp?|~OWGpk?3R(LLR1;mUrZ$-OhQXP+
zvf$sMss5m*pp!6zW6y<lX-0{5?8N3_USw|9iTbk>qmu1cnwk_XBj3^eJ({dO<jss+
zZvl^$<<L|A|4f^@BgN3?hoppGP^DHpiL#!B?X9y>m(!Gpv)I=Kq~<sbQ@NI5PsDal
zs0srbp~t&vhI}>;XDQ~9mNMJd1EOwR^V8Cw<FR72<~;jO+VSF9Ct!&EKhd>jxaWh4
z&_}uBmMJ#H?Yhd@nxD(4`AH?+oA_HYy@=5MS{vq)q&Tk%?*<wutfFs0RHwn(rZWEI
z%nPVdoj*AA1iyXtl+PzYMOX%eW__CPhcvOv$kx8Zdps1d<l8!?%xqi6FIOU~{E3!Y
z8ksVj<dbZY&BU0l=p*xQG377`u$Ie6C&!ckOZgTBUc!D7;}BaSAc7PT<TAXq3VDx(
ze8+|5LOoHP3etG1+-^));YW)!iEx58cvB`_$CgigVOjaJr55JU{!oXp)oX3l<a@l=
z>4Y_3Mpp@yPKI)Ban!~1ohISCx?_$M3M5M-uj8fbE`9q7Ts#~tTgZVAsGhWyl0F%V
zt`WA8>j#=XjQ8=P@ywe-IV3|1$Tya=7DxGc453y&QK5f}R-H#fD!z>f3AoDNFj|le
zcO~CdozQJe?e*R4xrjfIZ%;t_WJXM%{)+!J%jf6wB`~PkS#fV?+d8O`K)0L5YM0%r
zV_NQ+(|SIAOZXE#hN6uRHW0soC#!^#R&+-L!*>wsDL~^PLwrZ(yc2tcW)Amdls4N#
zojBpD1TVnh$%c42a8G#b8mNm?xmixUwK{E;s3WMeW#qK2{fw5=hGDmS{BWOHxo1~m
zbqNH|bHhAu|GTpN)_x<yv@xr#Dda3`5=7A<11Br@*YU56E_X{~caRwLCY*LWUV?t3
zuuml_@tZgQf3{TOuci_?mu=;tMU+`(RBZZ~VrHSJ1mC4-|2yyk20A&20LzO|J7tqK
zc|#GvkUNJKlY`|AYDR+rdEz~emosWFy#|70^m(gAUH>-|`)b#X(%1bjZ!wu7&&d)z
z{Tm)S-|$Ru$I?hHRW*O$w)ZZ!<Wa|{sP~}#Ztu7MqT`a01#9+yfit!P#Ks<{x%3X?
ze@I#f8^!O%!WbPdzSl5a&TsvfRMw+xQ2KTcelc#JMMZJA3l<oO{D)x-kixhham@2p
z>HPj508d8nb@?9uf_K2|%K!K`8t)f=b&x*CxbuI(JHFR>BribI8~x<&KMxK6hwgP)
z#ELCuG-vof-L3&#D(wK~;;q2{gZ=&U+BnKjKz>T0X!ClT<EY^bkbcVM_i$4V$$!`N
zKRyZZR}~73=97&1die)vCMV0ox$*M>PJLGFe_fsbP8Y>c-z?Camc(Zx{Ev_J!ZKa)
zfvYiL+953Xf8Ey?tSJx;u;5IYKj;51G&83gk#A%6|NoEwAHO(av+REC&;m9a9zTt6
z@4p2Y_(+bY05z>B67c-HCT&7}QM4xA@8bSO0>Z6g7rf2RNW}WQEO#%gzQ>O>IDf=Z
zFZdWg<4%+`JIfP|akd@Of#are<pr2-Lv)NixuY`89PkC*){XC20_!R&STC-wLKJ>t
z%^3SXR(8Bb&Ic7Ag}VUgHRz>qcnyGvC@(x?4j6QntpD`~ve{AB0PPr3qUF==HadW_
zEkzU*{Z;_Kswt2GPM<jgxPGyq(M0cFI>*zFTYwPyHDKb5`qFWa&uOKUVirL!p{lB?
z_3-rcgwp;3KOKPFWUaC0UD?6~Gsu^M_Lp+Yw=W**+I9zkyGbfnAKmjVxoX^8w?C5<
zq}eezS}&xzSvvgQwoWk(sRY`OL#5vtYG%(WJEV{;1N3?gKr6^Emd(0$^{p3&aB1Uu
zgd@FP$=wv7b;T}kfAS)+*HGdAx$bat9-r|7+$E5iakTX;lVHr*jM<@ALg&NSA^^|c
zCYyeE1k$N^9{?-stWPSVW9j6(gIE!9|9{9Kp?xVP9$+s_+r14OkM01#JO-Yg1t#2A
zzw<n@M>?UqoxHUe!6QUtfC0WRZ|+R<h_1-E`wg;Z{FK6%aplQu`xCbi;L?&FmvPl)
z&iGZPUW)8@H<=B;MKB}&(${_SXIo@8-s}l5I-$StVUx1)uyUZN`6N{IL44L27@z9%
z0fp8?trJt{ZiOqFroZSu3tXM|dI7@GF5u1ap|NCS0O4)_bTw~{&?fxSTHXbqu=LoY
zc16mQ2}M@=<E{p;&v^v|qA6)FNnEByKa&S5Ula}9FBV&%Nt?j3$D`x5eOD0D8u0qE
zp_@*+QH~*|HDH8p-~pKXFIt(_2zh~Y_-K}`8<P>?>p$FPs4O>ttMoSq=PAb=zL;gW
zz#qVm@+B|f2{5c;1GrT=(;<BL^(7z^KnJ|=zAvTF)z`Q9-Q;eZ8?&SJ{Q>yvsE_A>
zHxUguy!dzk0RXQpKk|0kys-T>z#=qV+6L4N>`)I=p8<beDDScdm0J1riod7>ke~db
zgvjEcIAqb`+?`|vLhffzfJE}p$Lkg2`z_#O;R7kHD?u+2g=>u)F~~3GbWZu?h{a+N
zxEY7y${aIngaStZ9nbJb`~pmdzAwUH^cQ)=&HR{OL6nZZ*cJ`+`~@5z0ZyjY=cz)G
zB$*;_beCHIJM;UTC1h*Dukd(J{LuBOS+xpW1v-9Rp{#Iy$DD7_1a`<R;dO0l8UwAe
zJgpv&UJSgyKsNFA!HX`<93pdk!hlMn8(=B6oe4{IOr+g<&Rc2xTPajRz-?XwQp{QE
z(Cnl=0ecT~ri*T1)v|4EzhzBS9m&dglD2*kt~5j;Z)sP@l1IW1C)$@$V5JJEf~GhC
zeiNoc%nid^Fg%!gsx?quv+(y!zl?#e0HAeH;B9CCtkxY?Jr=SYYh2P3NH4+ZA1+4$
zH2}c{XWjvqcJNCM11KL(%e2nV=lOnxRVh!~C;pF(k8O%RC=Kn0w0<JGsnBWw>^i_h
zi7j(yGzqIeMV`Tw-Nzgp^l9lB)-lAOsFV!>0SUUePh<X1oF6MY;k8VcZt`#)*`L0i
z#@FKvI4PDOF4t}X(#Yir*C84jGEGMV)2p|}O+Zux81OS6)I-T0RuO`oLm1WEGV<7%
zLHXCP5#--bZkCSy+{HXfUh9t+mNLCm$Je1+X!L%oE|F8XAlMLjKYtTWX&C<E0LOuT
z*g!l_k+Jn)Rr3AdxtU}SO@K4X_%fr%edq)@@VPf`1CJzfoE~m;=l$;Io_F#{7*iZj
zq)ko0Hj$c}w+Yz~Qunb3XFuLnL~!l)y>y13uVjHesQ63qRF<?0fq-?H#q(eL<@<8u
zFRKxqK01g8jPO@yKb=V_JK4FS^@{LBg%jpbr9HLU)#Z=Ac{T^~<U47}k7B36NKx50
zJ+xpsSOlT-04QP@Pp)4&y5K=2G+x#us=zWuj^k`k<v?5Vz^0H3=%s*LkHwLAdkrXy
zAirpuoes%QUj0Z!X%Nyr=*s=ZPPh{%iH=k)ri0tBJ@bxx6>vhc4-2lGK!oPzAX<el
zcliB|kSL%n_!3&K{YNE46<?Gh=X1C#A$PA(S=-&7xCqnjYWahqYFDIG^651I+w4TE
z-sVuA12P5e>1x0R?}_|z@6P}E+Mip?QSJC;l_axpk)0lh&k=}5d2<)bM;YXOgbD_a
zSG^_!Dg=t@$%!yYh9)`F9xyxpzM`ihl=ZZm<()sXb-zm<lWU(LythF$9aOs@k@0?0
zldNsu6Ya`0l<W_zWoUBU;~^=;MYcesF|Z82LbJ-V(up*&`*_v7SWz7~9Z$J6Eso0D
zTo8;Au6E~A-MS6?W|J2;MBnsaBFDDiW4qV3$q)n9K;?1U{T_8738kB0xAOIpe>UFN
zkx)tj3B2~(=m@aK5~-El&#Cv1a`k3kg@Iq@zLg9n{G3JZmi%H3KZxrpa{0WHMa*R4
z!}MfOt2Lv-k{oIUuBQiK9{N}P$6~`33(3Z%T?3JX?m9@c?xKl`$+tis;mGBIzSEUD
z%#@5%`?S*%RE<MgunLABP!6+Sj-~RFN7-}&*oSKhToD2fUf91~?dUhe=8OuTO~#+^
zWLx|J?aUjHJnF%(8uPJoq+d@|Npbq&3^@zYrm<B^Zi~Up^>dUZXw9N*;i{sKwHz38
z+!W%HpXG(tCHeUI0qgpgu8vc*yA4|e1XhP^-KZ=esl?9v0*IwIc%LgLE{EK@U9DMv
zScXEAnTyIiJm?EZ2OzBkXlN#hpJFD$;vo2@#sgBRSFkA4<J<5JFGj(`s<_X3{2o89
zQLqo*IDhC#;xOx8c)Q@&d|0;xG)l17)yZY@CGHMI-}%%WMo7Kwx<Zv@@hsj%40zHi
z$Q*<YZ7UjN_?!(a(9DsUiSpt|6kh{&YT0{N!Tfz&vii^8=+77XM6Rkn0Wlts=o(?g
zifE`1^gfa7UUDnsrNm{=0j3a{Z-9egvXA*=QOVqm)O^OyJ6bK_{c<8`ShQU>UtNUz
zAA&BF$xzbq417j&IX8F_1(k&|<NUXvgZI!dM~Fu)k}qv0js-?AJxd#3<SeV(B8Yk<
z9+ik7Rv75KfF89r9Q>gs;ywG=K3CpTQh_E+3A2wWSm&2ovcB&Wl%=JEWPUYAb+I}n
zc6NXr{xPvpm@<>pW%X;W?7?qNLM34jJ%^3NQYH0JCWm$GNB`bUogmsQABk->D6PvF
zP|E{ep`tWl9D1<Xh-@2akr2f>r1)}k4(Qcnw+VOx%aiZQ>t^)rh7v3$Ck(d44-l)a
zyRI%@q-nX)YI$vXnvm*qo4h9AI`}MhXlhnza(-p+&8P!Za1i0ooJ3(aZ#&$-LX7sI
zR9EVAhVL-jP(Eb^atc6sPUlJ$c{>S{RwjN%J6}Krf~%sSn6olHywS>E?vN~Vmcbn5
z_Qc-rWJS$H%tdio4{GRX?JH4v=ER1wvL&nE{e^C^+~a*~2>y9GDzMM=<*D}?+ZwRX
zpU*cZYnM#0MmBFc>C7k(ci-3q5NxJPkmy>Qj@g)_KO?`ibxeD{^<xPe^61&(ar9Sg
zNM--#hWhww1UsXU{pchQW-Hm>@1W2Z&KT#Rs$P5|v<IDx=pC&~Nm8U|*d@g%=Izzm
zAEn{+T6DdPi!@f)edjHD2gEVH4V0x8YQNOG?|A3<_AGZ*kd%^wgfe#~<2|SV?!Eh#
z-1^!9o#8pwyB7TWxxGp46TG?U$h%+fe{O8Vhms-b7=8J9H`GDDghZQ>V@t)nB-!?^
zG+4uoMJ#Pl*EE61EQ328?HFXe#klZJR%lL(jBbU}2aG~gCn1cx$W$bj2)7dOH@_Mb
z6_EFeL{(rnKP(f~`CMSrYJ--9z8ui~f$&(Jf&L!#X884?fD(n~WYjpmsW2eG!9nO|
zHIT{~5QgF^Bl}w4nrQw69fv}y>w2LTbgF|&B)xgY;~O5pyhr91QTDVHzlsQp6#}9e
zq8l!S$|7WJ=Tne~Mo`7b-2%FuZMvxJkfBhC6>KZ|!F8(0vDSDc98lCZZpVr5(mxmI
z$^eDc!bhtLno%pTtChF1GmYQ!a<$UpP)GDSP=RPp#7xVhYPL#Z$uV)!>%kv^FdC+u
z>LC=lPR}_=BbF%d9?+_&og>fNlMowUpm=*@04R|z={J82Xx+o_ek)Oui}<0`f++|e
z#^|dhQhnDZXRqa+RVxL~bKZOG-b!e!b9gu~+_SWN!wYdR{)pqmcE~`MUOKACTIZS=
zE@BqjpTYpHKGftf8ox<K7sJ7gk|V<l+?Uh04C8@aY>CdUdw(9y2IWqW7|Xs+uRCQ_
zP!mzp%TA1S0^y+Ab8UJ4@QnG)-Y_7`V9yF7o8cO~I!z0v^E&B7sH&dds^U2Isp8oF
zP^IHAROw#Q@1ucfa2zowjb)@~8ayXD(3WouRg>O&1QbO3HEqD5J<r2zrI>o7N@uGq
zqSi^&t&M~9zPyP>yXUB>dYB`gE9Z%KB?>ncnc;j`ko`G9H3qjTuk@hNywss_t*6D3
z^bi<9=<4}D>S79NF_U=$K~V=knzU`%F5}va=WPphF<a_l%-$7W!(D;?o>urjG7cgb
zEry9Os_255e$i~PK3i6SrfF?i^@ME6`dCsuk%%lElpK$k?T2Qgl+)*L256EOyaA1w
z6$md=|Krw}PrK6;Z_Qg8Udyd<4j0&~>vcn&AsQ5yMCBa1QASGNtftJ<j+P8o7fjOC
zN8lvO^F0RQy6c|cE-fs|!JAJVIY@^r=1Amh^Yfgd{_byI3t|#|`%ikM_Ja3l)fdg(
z*Yj;_`Fdl}*y?^OmHeeJ#cYf^E=7SsnYfTh_uouPcsC#+6#GU#fym*XxBNYnymvI|
z(JMd}OfTKu-Y=f+8Ko3QWn+8_#p08Ny^HitVPkUBxGz5JGdD8G*qD}qf`bymgEGP8
zf|X@(*3M@??THWS2@-~zgE+O%>Rm1S5Ou4!y2#+|jSpxDTuS}-qkZQy#y@{=e?)S@
zvFtYLgEbu{@HC4uZ(y~0Z<jZwuhODyZ9m}i;6s2<>l4VVI*6WBbgWqYMB_BGb%TJR
zntwN9Hu9r9R_aoBpC+CC*RuH|<#6g5rtK|D%ZUUD=X$Dc`${!GS#Z&$7ZIz(FQP$r
zaUQ+8;lGNv1m{t{Ghd?IKXG=&hDS3SOrp_{Oqd(?>1Ujdq+m0XWfu1TxWZ!2qf6IH
z{?b=|z=W2%$L<$!6KVVaW<XEj6HwXf@5UFUaUxuhb0eL;g*)9vl#xc36shGK?4XcT
z_}hKYS3;+_)O9ls+D$R@*41*2a+mI@h=e5t&e&FQjl18l`q+ayb=jLv#shYOTtC9M
zdN@w8-S-8&V#TAWMz-qoQl;G_Ap4L9u3yzlt+$@A%IW?P&vF}np^kuJyUK^Saqen5
zYSEKFWE{VNxg2QWuD!4HOX+Qk^=WEH2Xz_QaadWP*=uYTL7O-9<ArjvZcCIhyVcEn
z9rCfg$`zIbqRUmiB-ncMZ6A0@cX=1fecl{y$SfVk3Ye;)waHj67CE%|WK**8z?#gI
zp)w!K%qE_~8sH0OG*wmwO_JdSTtc*>$Rb${{)B5bStVQc2_gL!VZzZ3V2}A!+4~K}
zu0D2O@%{7VAf;R?nW@d)QQLN2gT=6>+oIz-rzwU;u^hoAiRo+SxCvVL3tR$KwF)LL
z6YyQaZODm;-m3N%mW(=2t%Vp?{*?FMc<jmV(i-i2ogBse5;Etyu2pl-bLM!&-j*%c
z%gxqxk`V=a6fQ{|iELHh@hlI2G%3)OFl9fWx}a?Y_gW}8ykfiN2(2Mk2#@B$v!P#e
z2s@o+fue7#vuP#HB8E!-mCvqYpHNz<b)B$p^{hSk(@}u4`Ar`7M<Osk5%PsLntbG9
zFnfTM9Q-oCY2|2`WEoDPui_uzW#~mvN>P+jC<YBBXG_x{x4ULazV=BsH7PO>hK>zN
z8({npDC{xII&szbu?>jKLpkVeKOA*Nh~~+xSeQSUT<G=_cK)skEBrY8r4BN^`=eLb
zn3NwX;k=$6hefo@wk7ibubScebM&nqS!L5GCr?52U<~Gr)$mgNxczZWXLh-1B(zO#
z$Tf!C=?%lh&_%PH-gy++Fr_(7`!e=n9Lz@lpqUOMERlNYw)BYRtY|Hu*I9pv8@Wl8
zN>@6CHK&@v^F#;}$}=V!Ki;thqgsl41&@PSIkT%MK3b?GU`YH-r)Ik`NpbIjrqKMs
zZ|^MVrqR!;s);7RSA$~NXR2r{5{Tj*Kpk{9PmB;Dltv9XHc@1mbgE#ypQmdR(Pzk#
zU5)`;qG>|dp$w?PAF;+DMEIhg%w;?BHMM!l56A;d1x)6qSE({--O|H{q<&yUk*~>J
zshiP;d=jw9y3svF832Po1}CKsi`cW&ox7paA}1aOBiOJJpD_wa!xbRVjlhpmq)HKN
z&eGI&Y<Fma3Nm1Ai0MHZkK_oOpOVEC5>2~<F$+;F2k;ed=`N=gTwuEs46p5`hDpQ@
z$v_Qy*{(=$3w$G_IVPAFdpA5e6FK~%=<!7cS!FpbkQcmm>mp9gH^O~V4JQ1uww4Z3
zwqeJhDt->=1+j&jHm)ncI7rnZUkXboKuTXH9_}?tdTCotU(%BMtoz+(qOY%IO8aSW
z)H^AQ<pk*`X-Ju(y)3IFbys@d8N?aM8*FR|p>+{s84Y;KlWGd{Ea*;x|5%1C*)0eg
z?i{n|b|_)QP!EJDvvQ%GtqfB_gWc0m8+;}hi2|6`qnm216Th;n5X5WqEb=mEUg+DC
zI$C`U02L@XDB)pF;AiFGnrI@^ZdC|X(I>LZ_%UPc`FLH$KqhwKP3O-7*>}6y@Zy=(
zhS>b%Qt|JnW)V?o2S<6y3SQF;g&hk=J`1sj=0{}<v)<91595obWC@){zbZ+j81AcD
zDU)kwI!d<os&gj@wRyn*s`qPr*oyFrL~#=Ba=PLcKM(Spjg3_l`L5zDD4Azik%6gb
z+I@E=QBmph!SsQ`FZvDH%pLU7(6gWm{BUdGYL4Hb>UITfJ<87SN!|!feML2-;xPo0
zfGy6Wn#K|7N%!AR3}dUiPAKt;NLd<n|4tslb|EIhqyM=d%hi(V`uoU4Icr4<Jd8*Z
zw}<wwZV9SND0}GqI}b_<x1=|zTwlVaE>rZF1P6{qGwsukt+f0KoZmU7J9+bTT(hfi
z6GtoV>I)2vSj#?ogfuYEXMW|M?e?rf>gom`9N0Y4QDudybNJqJDY<!G6cT7Ga+)e!
z;4MZ{Dr6eYxy*-y3_p$HJ4lVx`-%v=UQsw;S4#hlB3n?wtMgi|RH|Q~O}qRRwym9-
zUy|XO?>Y31GAu1BODnNKCk}}_dZF6;V$&Ak_EpIdufPTHU?7wtvZB;Hk$oaGn2l*p
za4(=2P-Iwi*(q}<MUpFXI&qa>CiNOC=v3pLjxo^CRu)aTP&Gd&OSGQW6a3sS%iWKb
zJt~_a9X7IRg47)O&^cQT$_w2sur;HNBtbZgZ1ay-Mm$B}+}h0hS>IyoC%L;}D}Z_&
zIqIL_%mB|Y@f$tZkKg=b)Esfa6qRGD`rp+P^xlG6Xlm&kCbTabas7-Z3`X{DPi!m=
z2x&a!x0Hh*&`O*4@~9pdytT!+q*E#+SJRxHo`Lsf*-~{duoy4$4dO>5GMew7Y(n+M
zb$|*yMw@*c5yS_hL}5dln1U_@rw*<muh38j$MOPG_w7BGty;;|6FP1~qQjiPa`00$
z5wMl1ftKvX!Ejec7(6<jSnx)HgUQ)WO>*+z97Hw~?CyBa`OYa<UJZ_1C-bXn?!FGK
zHczM4SGQB8j#RGG==)f#C6zsp09mt(V`IIQReokk@YDM<=@fw*#AX_InZa}5SoQc_
zng6mrYRMogsB;KmH%$uPv2ND)D%HAsxMui+-AG6o-HLd;HkzD93aN0qQ%4}h8xxJb
zJDoSMu<C2W?bSdt)re0;imI+^W&QUNoJ%6pwl`8q9E{)C)*}iXP;5MHk)d4nXjBe&
zCo#rcs%F*<>S}fOH8*a!AwwT)7_U0!mboP@CrmTZj=vt7D|9^+x8~Sj<ad&^Itgy{
z^`W7=aS>x<1_lMkhE*$)sWS+^d;2!wgK(D`uG!is0^T?Nl#dI$Q@VJt<KP%DX7dRd
z@*A5OJ*yGo;uGhP+|A!A@gmc%DC47hCtumEs*OY>9lh}`F%aTD^U+%*Aiy_OYj8p~
zSfXIoV2!0b^n>tgJ?(U!JLB-pK8RV~f1dY9vkCOKTuh3^g+FBDtTr!K;*#gJqmB2l
zK_cu`j2w{o2KOpthw@a1>fyoziRU}w7&dgTE(|Wu29A!CaW78XZDrb~UHd_QO=*=0
zFJ)4_3sLwzG0ZAmxL0LAt62;4lL^!ZlufKa)=-VIJBZ+>q>4|abo+{svw(q4WdS1&
z*IldeaVOq+)Xnk63AJE^vVKFqg7p14_Tif^#JwR%qx#TrDq<cQDgC_jMu<}}6%4cu
z;#;&4_+7q1m@qv$5gY!u5Ou@4cj9qPS;oF&AZNSWNMP>`Zc)<5lPa~K-7P~j8r64T
zzQ+JvzFBbfW@u+Xe=}}R2yv)u<S(#5n@Kq)Ge+i*`QIGSv8+Wa55}{j5U#;>qmoj#
z5lYKxW&R9{Q`&kTU@2_KMH#m?vB5JoJDo6>q6Yu^`n>FYoHSt8?>yJ|^~MN2_-vy-
z^%yrMPl~d1Uk6Ggi(h3r<Q^Z5M1?Q(MywW=uWEEN_U6KACJQn8tPebY5B;;=W5pNl
zRn-ZbplH0_$P#~3f=x4nTACdaxiEOsDSiIcoU--dYzV<ncCpF8J@d<cfvF$|TLc)Y
z#d{>@5q3?s(|WzKpLTb0YTod+BJC1_>*&-R%GO-wpo%ZkPt)xq9JOZt$?co&n@a4+
zzwk&nn)R$dqGutbw{F4CCWUWVt)wj+sl4`nZ75~P99kT6Mf}+6(+#1=`$E&Yo|%ja
zXa1C8aAGshG%tfgM(%bv@7rtd$l22qgV5vE!?!94jS)%^O;?u=3PO_)xNORexivlB
zSjXikCEq9vqTM8&kJCu2?HJvl`sIops9kDRd49TZ)*S9NHJIJYv+;%=XPM)ay#E_K
zprP?ate6FVF7!XRaYwGIl4#Nmt2_7RN@>c)laV_aPXAKI7qqcUB##*Bn~z*4r)heL
zN&3UKkCMT_uNEf9I?J<wF13I_VoMUQXE@$wt<tmOkDPbaS^$Fd7Ej88w!-~eWKoo_
zmd+JgTs%B;VQaBYqzmL`V+HNEJe33sVY=Diq={kts#}6^JzASiIJ_x`vjuv|k>*r>
z7*jYxSR0JFEv2%D`JL_9<1N5jn43=UVYk~Mu}a&_1%7~|v9L$*ccs@zh9>z8!}{Fr
zfB=vMKv5(wC9cU4hLo<5+!<NN<kD7VN+W%^^V4g;u2-)n{hJget5qNF=Paea>FC=H
zJMT&qfULSBwF^FE&T;xZXNYE$s|0gYOxHKHmc%d8Uvyh2tN8xLN$w>Vrq%-qcm<Jc
zBGm^x8wJa5R}+nat+FFw;eoME<5F_?krgd}ttxM)y<<s4&%UPOrFSV=R=gaUDvSs`
zlAUx?%&ItxZV40E)L-Fo{QFo?Pz!fk#b=%yviG6&mh#!JY(=Txj4@}9id)H@#J+V>
ziLW`;jJTXk5Y4{t(uaBdl_efV8R2>0?gmqeK`wZjwOB}fm+dMa+g_`Ip#|Y`x2SN!
zUGuPJujnD}b1;1&qB)KH<9Y1jWwWVp6a_Qr6_l@7)PbWC*#TL>tq{Z-c$*^%-kP^9
zo<8n1QX-f#j}eiHoGJ!JYVDn)sJFFq9p9?9_!49$nA<=-rlg!^q&(AKkR>yT1djil
zyY?-2P1?_&u>!o*OX*c{n;fe;_@HskDP-=3Qn@X@@n{<#fr<y0oZ8=};kRF4?nSy#
z$~93dXX3@sx{)UQOzwIvw|9>&j$j*k{Ru;`+2MHDQDRff2yu!N<N#mXt~cbZz2HpA
zVL{!Dk>bzqa@qK^W#H;d>4`8enshq)$-V-qEVWB6vn;7@L}qblvF$T~YUen})67BK
zR^XN|^DY`nv7!m3O!sB`W}}EoJ1M(l&~=mgOV4lIgh81r4L_El5WTyji64VZf{N%t
z4t`!Q&}4b_gg_S}mv54a&s%pW{;OZ*t#vuO2ea~o#PD#rou1dV=<!~YVkSl}k%mU%
z4`w{fc+LU*(<*o(q8^i8vql?n2Ydpn<Pbyq;7Iq5VU^dI+}5$-c__GsREKQU*UV&H
z>9*eMHRteE*j*MK5{Qe;>`~L1BzTWSh7>9D7A34RH`bQ-E1_iJkDwtFQ?ci6Qp(;a
z*Q#9;%n-XuP_hd49_&RsnCHFnnfUuqPVb##Ge~C9`B}?9hjXsz!CJ;<s{_hNiuTrI
zLw>Tii*L<QhUzuuJuECd46?!P6zrz&i0a-`2h3F^Ql$SlvtyAXonPDB2=+yH%a^t|
zu3@te(fymZJUD7Tjxaa@X07COBI~I(&${lUJ#0_5s`1T;#bPL7`j$S=6=|k1#d>Hq
z<v-S%`&`-GjXy7boSOg9X^i9kSB5Z+^~GgQ8l(3Y-?MT}I&WzqnjpGizgWnC#dq<n
z1-^%sP`wYWRVO~Ac#QIk-x_(eVhOB&>)cz2L~-a`4t<yon|o!l*7Ya(*m|8!yj_b)
z3M9w^e(<Q|8wpwT-c1te(Z%XRNM*n$5|t|kDKB~c$gJ5JxfnV4`4>6}gxpLG|1mkP
zr0FOa*+OhXXPe8ojpSl|KQy*}7S+qU2Dz&WF%=1PHZzh-HBE6=lFjnEqc>D4a1k*7
z;hs(}nj!&7t&W!_n7aWS|5F;1pY8q%JXhL&GwsEp;qDYGfvNLyh#U#Zp(8kBNRy0c
z8)$LbFZQx5y&fL?9RZAVmd@%JhuIpp!%<BWG783Qcr~WqXE>2>SFtyw+hVQ(Go0cm
z3}0OClSBtYSzXY|`xYa?0RLZYR?OYEJwC8{8maWJc7I>l6insmTdrnuTy8Ex;aP^s
z>`9=g-vuXAOnq&GsGYiQ!mTLqpas<SuVyYWh^B`Nqn=$2`x}tMnbW)F@S{r~-0D6x
zb1YA?JDr|A&UGEy9WQccqd5+@MA$L-M%QIMZt|uuMaO)AgNS2q$Mk=V*fW%UTS7`_
zc@|MEnElh%DC@+Fy7~9#<fHDr&lxw>-QP)&$unsOJLC2YBdjw-Y3&?9XkKKiO`&Xh
z`Q#HC4P}j<N#YRC!8Z`n8jp}|V!eK;c@i~r0gt?5S@6f7N1m4N<R@uRN7=gfHI~mU
zK?02>y^-d6UVxiwS_7<Pr03VQDpeI;s_;5ifkWPo807fdMed{r&I*I2t!$VBe`@H5
zlA0GDXhEd0TUA&r6@lF}InU>BjnK$_Ugi*$Qbs-8_H(~j|GKkA1@mCN@b2nb($#C1
z`RVw}slYcSk!GWC;O7$rZ4b$=N!$2qZD08(=b%tXr^U9|AOhQGtJruHwabb3f(mJ*
z_-C}m9$GBl=tF(pOby{!=COiUM;D7_yZC@o(~~SEue}jv8k0jRkJR3pbhZkutl0^!
zp{vd6(==P1(M~YyWcG<)1d&w?lF6R|m_FE;&bU}5rb!jc_04;nZN4-e?d3wlPE9-k
zt?lRhIp?tt-E+7_P0$}CA4rHY<Ws&MBwJhSOgx>fjq`_ktqW_5=-;)mh3zf#ABzYp
z4;}HV2Xg=)kS^lAM}hya^Tn6QK0aPMt}T8$*oyopq-E=)zbKHz!7JzG&Spa2?{_~a
z&O?f}57wBmD>67}wca?5E+`fmL*qy{$z=&4)+4IrSd1Ji7lr0>Q1gn~$gE4+bEo4*
z=R2KvugmvYuJ`<ksx3%Xw}XvGnSU|Mb%bWLlJ(roNE59?Nkj!2RNv-XA30}b69-QM
zR%`tpt3A^%>xRnq>a9h_1mAmeuL^xW=t<eM$0?6LP+jtbT}y5GE~GZ4+{!xGUl>d)
z-30W!4-n~c#~X{gcn=jc5+T_35M~0)_}1)Xa-7?wHhry?)>5j<X&;0S_2b3g$iPf~
zh7PT_(Wnrgc6+?hf%5g~sKIa9RGKVXE58blNGtyWkQF>-<ji+^-Th#_jYMYA_|xwW
z=48XS@EfhVJj8WEi4>1C_VC<K&cv@atDUR}QQdDF>whShaOobOyM(btfOz_9Jfv4F
zVr<qI?fKZ=5y`alrv+Ji6x3bHCz~7<XzlU_dh5RtvR2myRm4UKn;y6lf65U1HOgL*
zRZj|Dy1`R(Z)=s-bc<TWO+J407@dceGP$c!I<j|ZD5SmM9{t%lhSHu?$d@Deb_T>d
zgAaxlOIu{+D(jw~^m!2<r(AHG3Pl#P=b#WPc8`nSQqc`g{h*=<@|^q(0HU~$=6YO}
zu7;gHJ(!FSRu4dmgY7R;tCr2#)eEu-%<zV+5_tl?EtG@O#}l`aUwu%17oxfNSWKh(
z&IqBCzgfoq9mZkg;9XZaV;;9^XBE<0(Y>(36%`G10tHieX*oEyD=F$x7J?6g8EoI1
zG?ik?Fa#qw*h_c?H^4t@?0tHgJ{``@ouDMqM#-EuCLWpSQOrA2`99fg(kmq$^;a@}
zE0!VfHQq%jHdp=Sv6T1GHbv>Tc2F1NcSJoO?h6q+Rt>j<=D7iK)-(wk_TC=1XJ(d5
zF@~?q7+!~SMqh~%>tWk%VHIPA<{k@uJCZL3(ARk#r9Zf}GpXw7La5)E`%Ta|QN!4#
z+r2)k02w6OdMhGVl+_A1CvvDU>sDMK5c^bOkBrh_iS21d&h@Ux{?ZUV>g?UKIgY0l
zWIy1@<q3Q%u0N)~8{o_Ewf<s)vDyBwsxg?PBb_6_pSdDt_ukF8o|QLZR;l?ruO&Q@
z8v;G=1}3h=?TOwv{0Cr1ZS}CtHdFfjoWh90*;N@W#$8CdxfpYesMr_Ksw!Go2BF=^
zXzNvJ8-c6k_E5v?hsL#Lw|_@-_8f!af5~B8_%QINi)?dEAzR^|^mvx=TpKMtVaMQM
zfRfc1Co^{M(%HLn?_>ME;l0H>PEzj=JN!?LY%=*3r**U4DVsgF+M~-7lNiHrH{`D(
zW5VfDKe1X)uY6NgSg#T6-<=X~JZ6(|aPYPedP_$p9nXVdBF(M2Ww!jD*-yiX_+4CR
z6t8XRo=1LwB<hyZa(tT@q4M-bp86Z+!eK38VEg^MRZOiv&Fq4DsKw=%GK)Airb^u*
zB;lV&Hm<r;;*n&Y!G&$aWz0cC_l}V81A$Irr-O0{L)-)8f3<by;ZUx9952a|Ezu;#
zHdDyfSkfe0#UM+@nzD?9$P$h)*_W)7EEUnn*p;0&l7`5>FOhxA7Gq!Qy&uOp=Y6mD
z_-8KHT!!a<mixYcKEKbm=X~s)Zw@}9ONqY>rK7qNxzrY|Hs7Rv3k=efu~<p;|A4e+
zRnccqTpZqxu;UQEV?Cz9F>y;y!us<7C{duU_t9j%A7gEsJRQ-IwF6^eY_q;Km0Zed
zc|tQD`Stv+K>tM*qb=%bzTJ8@&(=H!fj$vf<{jn~MHCAs#c@k3qoplmJ`uyYBNHj~
zsmXPv1G9WvqyzjTwu>MVbE<^9b>;xFGq1^Ua5Ux2!xBcV6Wyk2wHwTn4h^Cerk^vq
zcO0DGwJWwUrZ`D3Q*POMzc(C8=eBpav>jMhO79Twb7I4>Etyc6<T6r1r+R;71n*Y&
z%)k7OQ$tm|n4bB@fo`_pkm{apl{Bl};14O3)uKq(dIEcrB&^9ij*02=q*ym05_u{D
zgZqpw@}zmqF*NPoUa=eZrJL3(WE0sq)8N&rDO<wg%@CGHCsJY`$yBd-6M2S)MY>To
z@2PMlx|Gh}`m_(2*e2@YZ>tIHJk6Y^XXd3E%&Q979e-M^UXN#JKFp==_QGUFA_m24
zXRLMA?|yVFvel7VbF|jDL;I1EG4*58k!6kxA?2ZSaLlQu7a31`H%_|G8~qE0ixHuM
zHwDI_O3!H)qOvW;%6>{azFK%exqFU8B>o@s8+nylM?UzTsIhVup1hJ^vqnM#H(E`8
z@K=|gbXy(B7p+f17L~`PH~EI=Wj9ME3VM|77vlt)j#rrxKf`b?*|oS?MXDhwCyz-7
zcWT4W5pn@X3*3(S97uxu7tsypp3HE}mtWT%g0Jz+qU<r0@8L$~_V|lhS6qI!Pm}RJ
z^D2IpsOs5F&ZOu57ix+)S}zhzsLM@N9sAu(>%NR=<--$^#Df9X`>*{GgJ{mE2`_#|
zl-2ev=P?bb3>AIsQEoUTjJBwx1b9d@juMK09-KoKk<5Nrs2-RygVzO)orXt*azB+l
zcr2<ZnECm`kCkSAc~|^AXGjs^x-?Pbl)*40*Q3PY(Bu(>&CWvx&z7El0jQbzTRl%&
zh6qo7`-jwqaOnN-G?gn)DlX9PcVPVYi{>Q2p3f(oFEDEP|BnR_csa}dM=**|p|$V1
z{DZu&A%-K(A5d01_W*ki8EP|+kzk94GHi{JiH{0;vGPz=xJVuc^M&!pn6{fs<%yI#
z>W5v!N^&ZoP!4=s<LL#(eKsG%LDjrLD4<y$-6P3$X#4}2Wraim<2pjCxN#}r2X~az
zz)D9jkhSnZ*k{Vyw{Pb+-7oUw(!4ZSop_!7<%GH19AFJ|#YvfewFy`NynPlmOnk97
z47rzwfB#zeO$KoQu(cuI-v`y3fz97yGQox!$aSXtYzB^28e_`liZp7&+qFD20jp&X
z6g~ATZy5XxyW9cY$-=wcTT2G{E3J7X{D=K9<i1?lLYY0<N+kUGTQI|KKkYj7-j3BG
z@2Q<Y7!i{i@k(B8<n-X~M}P;2*aI%F{vDJSaj1T1#?SGy<qNlN`t<>Ka}U7$Rv{up
z+h^>or%Q7xa<2-C#1H*7{0vkBWe5%!T2628j>0fgsjcv(Nvd=<X_{j_`?<Tt_M(Vx
zbVd2@j5*}Gyqf9H`J?ZK@wLA+Q2bPS(vc&qd(H}ubUG6+$`>FJa-@SK|56t-LwJ4A
zuisBTw@80tc;v~|(@+44umeE)=E;CCe!;&AL4|zLWgxDo>hKAZ$HDy&iOL3Y>0==J
z^HrzKkoP*1#@UZ0^4+r_&G#4(nLJ+vqaju)3L%?};D~K9Dr^~+vNMUY4_KxdgXX^j
zw-PrLgAIjMS+~6Z{N^XX8yS58p-bL_V{h1HD{c0G=7AiK7KLs54Zwe9=RgTm=4hZ8
zB12&uK-?wpL|XT$^$&kqkeCXPX%BEx$uSz@CxHR2klf?x1NpT;a>+T!lVuFA--X!T
z4m1!5Ltt`R3!Q2JrVr}j>0@*`9086%KVQWILaY7n4}XM&|IP{kA%;3xbFHeT8v$Y&
zKjCz~e7z(2m-Khv-@7A#VPyjFrwMvA6j@RZ%N*?La{xNAwmSmY?OMfODc&^dLT?g2
zZ4WGvH>Z+$4R1P>-W!irwRW~OvS0XN8MgpDN%=AG7_(P1+e-~+Lx9^y!3zMwH&l;Y
z`s6!4qDp>ZWO@>W?ufXxx{~PygCJoQaDF7yfj%YG>%P0IrRCF#^(wv}fK#gq1Z%-2
zlYM>M7K<At8`9c#2LHUVUz*Z|ayjg`yZBQdq&(yR+;@ji#HNsN92Pc&?OaB?@@Y$a
zVaLXo3Nh+IFnVgQqAi*d8T2ib%y{RW+L-9|{DtymZT9UqLc-4}AmS$s5Y3;)j4GC%
z2t}HfgJiAZcjnuDJtd6Qte8{3fGsNm44_k7aB&T*wd9epG|xu#SR^*S5Z$G(_XXrg
zV22Wck!$7KH=E=a>2(B@HkRY##>WNkv%hA|e}|KAt2lpW4fc$rh2K+xt%H0G-K4vD
z@1+T6eJBywPW7=&fYHALl{V#QecN}aK;s?!c~U#a+umCd@4)%1g(5`4Gf_0pY2w2P
zx7K7m!%RsEY}RN7-yKSADyrKVz|0*s<a@JHdF0Sq@Mtis0-$uaP-Dno;762bu*Y}j
zT5e}>4|n19Xe@q_P|MgkU^{BqQsAgqsuwXn`Ht24LU?hkP@{$yP-vC<9*t5geAQ8;
z*Mh*Wb{UPG01!1~g}b{&?zQuV2za5$+a~wFS)EH-VkmynWxL#TzGu9;%$j{tk;iNC
zGX?6Dd&9LVz`aG+S-%w?$dSvoVPD)N^ITywZI|fMDh@6}Z%9J+$|{35z~<`8GGr$M
zF7|9}`~*PHe@Pr!&Zh)>5<o+NyNN~c@phxXPyZLXAXw&9-36#u2Ss8%I(>s(U6(z(
z!4DrAgb2r58N5@w`9~p9(g)^$*nvpdZnRNIosO`CMPx*{!M1n8LK>hJ0n?6h;3_IY
zf3JMKJ9++7TLFZ<hL5X`h3Sh{P-?igYPVZ2OeLkZ=+;CXKJV5Gu10C?Ef&nP!wQV)
zZ9vzSZGpmzb`o$noD5DDbP@c%esAQs04HMwAoCbKe&srOYjj*YsfgGGVz2JSI7;y|
z3*9rB5<W2TW?gA`hQrRGu~fCCxWeKo6^})GaJD+um9M7v-t>ycEp39IalF*0jY>D)
zoiQp#IReYybwb0%I0k{tP~4V9fQ7z#Vg;rwoicq0MM3pd@3uwxuv<LjkH^c<>uv$>
zTCQ!|d0jgdZ}o-g%;fGB0;O0E%K2gnG4=tTEz#@e1+w}<#$8gdb1@*gnQ(I)mes+|
z)Ndgs+F)UWWxpq@8!;^7v()AM=X80rvOi6YHvmNqi!;Txu~`dlHxbmFa(prsGZOEA
zSh0cVGpd<HghcjL8;~H!*l_k!dCsR4@sKUSQ@Ry?Q`*SrQ^6pD#K@O4iLQma{*bpK
zKM?e_tbNplDn=H&zdz!7G{}|#;dV7})eN?TKOUyJrg<t1|2zAdw{WPwFhi|nn%ZxD
zEB4Yxe9%<^y8uKw=TR{Of)+3A$pEnjFA$?dKr|X%cUbMBV%8VXjK}3?=h&|y-xsc3
zq*Sv>&3Sl%1_8U*B|cffB+fFB)+cx-NHZ6E%JdQkk3n#5IBJ@9P{Mig@`EcSybcd%
zUb8xc&CGy{#hV}!Nz9>MHj!ZpKrO)x@)7=Buk5MygL}x?fF;D`{vm1-KP=3pSHt4X
zb{vcB<1M|ee^HM_5Ms$m9Tqq?zfuUap?gzp3CF>=l)DlyiAi9hjWnT#CQ!bZ+=A_&
zWj(KzLCZ^%4S}Z;tpt_`xZ$L8@yFxUVKq?tUSL)<P4t1o(G}Srd5N+r<V+cTl0fF*
zMLn9=Sf9<QP9|ZOCYCGomQ<EPx^f@it`oA0hD@dsY<PChwC6~BRLZZ}kt8{B;j)){
z`<Wg_Mi;s>A?G$DD-V;`Bu>xmyd*URNSl3oV9!O!zBZJSk2@h0)61vZwg{+kp$=vE
z+_A(I$yKpfqC||XNm4hi%BK1Pp|@@_K~Lr!ZmS@{ZGS~|N0CaLa#yj27ziETQEGdO
zEvPF=>@+M<R?9u?^i!P>5iW-k>@dq2dS(nx6t~5f6wmjO>?+vEHnm!)R1;l`qt9TL
z#GFoMW_&KzzT85ye3M<DDw03qmo{r7wv4V$knya8m8RS(n_Gk5_^fO4wuwejo&hbk
zOh5B78h^<yGVlaEU&-6sTdb~(JFLK2Nm2E=H)!I!3j^=wd>9QE5%!t?+S9S$_Lzlv
z>23aX#%t%<-qOc3>VTcQju}ZWe^}t4=nW4eyof>m^SDTN9Ad-rQsk7D96rM?O>GEt
zFJ%h5#!Z2=K;0)wWSzrs#<1P^ikeMlm7wuxbgrzmA70m{6B%(Ta1@@N#gQVOf#By9
zzkKyRSR=ivPe)7AbJ-X8<GJO5bx8kQ@xa98TsD?`k8S0y?oNFF3n!8G6SXQIZ26mU
z0q8F5^f^sl;g>4MCJe`?ZTHtw`be;HJ;(E_0Zfb-2`ZF%?@j01hZx%9bksHG=jRf#
zQKX!N7>_Z=QC3N&_A#E&7V<!vuK}yT?r{8J`{qdWni4#e+S#5Ial4^|`0R;JpEHx%
z>!qL)Y*IZVdW)Yo|J%@Lwxo_i>`L0g?{PszbzkfC`*OkGWcv<viep{j+5s0%2%b8K
zd06C^u5OzsW+WA(lU6eNO&VvOkYh`dkvm3r&N|-rRB9GHkXJRR^OjjMc*K*N0-|+{
z&Zh1S_dqykWgO^}G!qApoF8Z^lz#8vrBMUyeAeTDLY?C+;laWYD4C;Ec>_S%>0jIn
zCQNhc=D;g%#~!w+JvvCI7G6+G<`K1mSx|pzNXMugduk)+>6gk%F-s78I)7lj>}R<~
z%Q#pMH^kK;@+1P|hUm^=IcVpqa0+^43d6A$AiP8}$kd$DLOwuGXADY__(uE_6o3)W
zz|=tQCJklf<oLT#O>)9DOORG+FiCT~M@0P7<(5}hN?kx=WcyNVURTtEuRi^5w|=Pp
z7L!YUw)<v^_oD=*nRs*K*{2<=d6wS5qDy{NJil}-Mf*4k*4steO+ux%aNn~sSvS+Y
zYseOBm8_F2{nxe_9+{~fy6h%-`qj0Howa^q=E6Ov7P0T6T}R$d!G`kGD)r8w=UY6V
zMzU<Z8L2TS59qs#w<@n|W1d+&>}K)TiU`KvdP6XU_<V18kz5CjU)PL1x+v}<L)0wB
zH*=|?hV6)BC-1#YK1P{1dY7Q#Wx+EB05o_o{nuutu}0bE{6Ms$|MCKw<*{OOQ0$=(
ztC~{HzXOAuJ6DvCi`Vmy;@PQc#lHGa<J0^wF}~wXW#bLWC=C7$d@~|E{h_l0=ZH)1
z+lm@bk0c4TU388Tb94`q3a#K*Oiw^p5nQ{~o*_lY{nmw=mFJx0<_fA-5>U4IWO<=?
zBbu_0zVeARGqBTOW`!b)9y-(TOjU-(2|h?1<E@SkQ<##UsiV-u#SQ@yxa3VNN;^6g
zt`>Wb@+fC@;vGY1@ml!e@K?IRx{hTw&nQcJ<@)CnEleYbkq#-kVB<C$paA;A;C-m2
zFR6&*3#?d}K;rEIEoS$h^15X*Cv^zreCiWaa{>)rJon~kRHYx&wgjv9D17<mvoq;I
z01XscQ9XAIygzL=InA&#rd{(*NoI)6nWBwR97!_$`YmKd1=&11cCyyc1Z*HVMb|>{
z-TWgez9lKBe9mV`CCCo@_1*qd%6f;JO8(U8*n)k3l~TX~-4o>k2!kql`Re0!wD%1?
zFXKZP9;D%|ks;J{T}to_zG#W#n8D*1&C@|yOo(&JRCnGu$f<TQ)zQv4lkd@#;}Mq{
z*``T`eLejr3{4#jv<{Uj&1LAM#vXp(M?LD@)-E`gLd$z3YG;~Ni!D*4_;>LN_ElOr
zTwaMs?e~U5j;9)4XQ+ymUM7SvSE6>vE9<N(=kSMQ7eA@#7=>d-8p$p??)P2}-VdUp
z2(h^pN<O9;6hFhT9u!!XZV*K48LhYw4V%AuF@3dQZS16NY(8pH_@gqyo~RgoO95=6
zw<1fjGFJ~)N%?+xAo3;=y>+SGuH9f3IbN5{oo%s@`Y57=bs=4i`STNxa+~?qoUH&P
znxd+(L!-AO<@Nb!QoD;T^Sue~yIfn6%_c$qEG~2(*SPC9!S2*J>eWlLtfoFJa@^|r
z^?|?5A<|&u%*E;R>kTv$A*caZn@aZ(d$S9;F)wrfeCZfAU_~r2-X3A`<rqh~80a-B
z^5%X5>t@4MlL$)^i1f5MzzAjeN_rtCm^?)Pp5a)i9LIWiOymvr7fE%D{$P74hV#8%
zy@EBETU2(_o9_@P&SA-x1zYpttMu~)n_jmB#Kx7}|GG!l_`#EVyI?hLzi=Rcq{eNb
zpHrQymP>(*q33gy8}v1ooiVdcoyPpl{Gy0LDJGP+&*KNIvOJ*DLG?&!7P29`UB_RA
zmcb{Hex_{qokSPkyK{QeC4q;m-BfKMr$?qVIduwbA6dIi-3OH5nRe7`gAbgnX4d*#
z&z2^ZX7;`(ZPgVD!ZGHv!}y4W{UVot3O`u(U8!mrx=#)F$NE)*9ck9jDQC>Vl=j-f
zBcsP%**gbc#Ul<ByMSc2>@n`7sNrgATBY7~XTJA(5>#l<_dt^!_Zdku^J4fduwREj
z3A-DoS=|1ty4*Pf$|R-i+SeNYzf|M@^Gc<Gd|AF$x$@q6X@9EQe<@)HrJNf_G6na>
z;J*q((1@%<gSuWC_U!AweC$)G%A+x|QoZlG{O^|^3Q&oqLWXi|Z&UGiwQ28{w(5d6
z@198_#_v5)|M!m?2!Up=9sx7NpVz|wSjTTbQ=3?D2iw1O>2E`)Z@aHrWBjk$);~w8
cq`|u3`&~eUI-Y+b;sE$kSJ76^yNnC?54LkIjsO4v

literal 0
HcmV?d00001

diff --git a/chapters/rum/chapter12/img/2.jpg b/chapters/rum/chapter12/img/2.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..d1fd22662f5aa0bf6162154312742aeea03d6d98
GIT binary patch
literal 44339
zcmcG#1wdTOvM4$Pci03UBuGdg1a}L;g1c*i4ub}F0txOKY;b2F$lw}+yNAIcxVyuj
zopa9K=ic}3`|tgK-x{V?v%0#ft5;8TN%!N=#}z=clsm`*0Faes24DaH05rfKNXP&r
zMCs2j1rqA-yB4BM`OmTuqWt2YI8P8|q9=djgMv|h<0A<EzTP3=pLG6pM*{$2&;clj
zC+wUY>`1ZyC?g>#0J8r1oP(VmDeE5;A0GjLCt3fX_zlqr`JZLwKS?64$2oum01a`W
zqoHG9pkrYpKKOVzIC%IZ1cZnW2^}#xG2)Mont>XK`0_G8f6mM+%FW3wsvs$;V612C
z?OpgM5v2d$MA`v_7)Z(}-;j~$08a>!kO`3<e*mZuvOhsaLR|moF9M>WBcY%oKf%C6
zRGSb0kdTp)kWsL(@X*mvP*D+hPmobi3DMC1ct*q_uKJXej`O|ar`UuEViI08O|AIK
z>M?pQp0^s#F0OHj*;O^;eCpaC%s;MjJAKaS_>RHA7$6<^CAagrgrw=Q8G-`^g5sb2
z|6-4L8-H>@L(~ZqBDf(TdV__EjPmCT__K}>8Rd^>97N)(YO$zvoazYXaoH<eZ$EtO
z2&f!;N-yEWP-S{_{0Il&AR}56A`=3{0QYJkAs8Y4|4ks}jif?U4T{2-3RP`+g@v8a
zwa^xOcdPp%UP6hIi%;3xm_*iK6Z#Bjk?F$5dq%6C8Yr78<h#rFny4_ak4D2W!JzLX
z(U}Uyd5f)V7j^g~Cw1T}_6hF0nn<zA4<h0f&wa^r=)N=@me|E|UuT;Yy+YBvU4oGt
z&x;onfAu*_<YDkY{y+os834hl-k`$E7Zg18QOlYJ%~O^*F?Y;diWu~aH3afuo+rPK
zJgzD9_`Q4L9F3UX*tdE57#6Ru4b9GnJOcK3LS6yOEW5KtW~b9q(qL?jlP)QCiBU{F
z7b+x8uG-Z{`<tLEGdF`O*_V%i1OBWuWyh?75jJfUzs*?ab^qE>8FxC<USrS<&2`DD
z{qTAzwg2dtKV`lx*~2-5k{B%Ct}CymObk3R-EF!!{zKFvYuvYWbdOxHWaL*_$lWl@
zTgAdHG$56tz1VuZ*9NNmYVBNB52KVa&9y1m*QB<SLLe1A7S(&dWb4_Gcj(f3n6~dO
z){WidnS9e+q(s|*l*VByk4agUe`Em&c}U&BTMIs-(RypTZ92sG;|iMCTC6mNLR$Mg
z{jyGZ$^`;7trbn)cIkEBPlOaJeG8!t1_{1%8Zi>Pv9&KTMh7+WJ55bTKV<0cB-|5d
z_gGV~9qnYV)lJ>xpSTw0po{c7uH}@_2wQiqhOlJAY|$q?kncv7mNLReZI$29JUq*%
z*}%6So-%P%u*^UqOj8`i7v>RZ8h9=0QZ<ylrR`*$rkzy6ahk}^QJtT4{p89;81FFW
z{c+7x!q^IK@wNSuq3v&vfT@A~)FtWWmDJSHLt-<ghxIw1@;N3y357$Tq8Ps(Cn$rD
zZSIxpreA6**Xd^()g47KHu&LF{6_$*q~!*Sui(u~$G)kzhbJwC8!SQhM7cCe+u;(;
z&JLNk+JR?y!R{U7wchS8R%y6Y<Rw0l1K*mtd-r2MA9VF&@+n|lyQ@5SI3Q`Wj?6@!
z*D;O0pRcOEG$7FNP$+up#XZh`Uy|A=3LS_v^#y6?p5a!YNV&9q7ff+2eFQYDqioVc
zIf=dC=g?cN@+rbcz&SG0IM0BE2$fTaPq_XL&KWtCJnbVO6@@54<)!oRx8e6QQ_v$>
z32DSL-ioh#`r;9{u>2SoS!<BkiQJ#R5zx!pcuGgyIpu!OU)e<#e$pRdY0sy~mZ{Lb
zCblrhYGU5c66n0kif-J;A~_zvC|;N$9vh^#Y$pxm;jP2RO@1>dW57pY`EdOK8}lii
zqNS5Rp0T7g(oA1%s)^X!53TfY)MpHeg*>mQ%rE-V(UaKEh|V-`FEVm-_=`$Q3+Zom
zu!<f5p6o3vaHCIY;VvQ#t(c62nOsK!AH&2HOPyg_s3H%uFGX-lB6}`~;b8@k_h0i(
zdoB&APH8VBM<PvWof60;dv_&KB;QE>Z-KWCDHs^AjnaZZVA)s?#P$;HZg(uM`y!ZQ
z-^sJ1_w+M$NGnQ&qdWK$E58Fe!yjCMzgTwNU1&JO6O4sAi>||lkHiyndXEZ@c0@k}
zzNl;#7X6Td!5Nx(Vl*8f+rBG|zAt_jzFq-N1>%Ws(1#f7V*GEb#?S<W){9&Ye3?kx
zup3El?PzX$5hQ@r5h6D;@XM6*@Mry+ahGNztDftvam!*aTtXQ!36|7MF<!kY(Dd4i
z8fQuMqV5FMIc}Dfy2u~TG$@U7EiW1cDuJ2n>SuOkO(Tcah+Cs5d?uE?=c{9s6Fk=t
zLtJ@a?sKuAOfUXifSDeA<>#E9*uD=gw2Xu{3^+9sIHkh3*X_5^dA^>!WNcCd&FKe1
zFZ8gqy|zru?D%(C$;BxsWhW+nY|g!JGzj7EqC%C-?LC>UrUq8z7N48TzRwyx{}gq5
z126G3aEEuYw0+2Q)D<^g15M$JZWiT=MQ928U>MWO?~<Re@Jz|;dCba4p^6GCxyLTS
zblwHD?z`9|-!~rnLaFGyB8Jc(0XB?*gS9VfLD?^tTDjM8qPCs)_5!>u)Yb(gfjcaU
zRsJ8M0#egmq=@M6M@b%peO=B%L><uIAYMet{Wq;i{WId>+SJyPxExGc=Ref@KX`cM
z;VdvX)!{LGCJ9ni8EMq~c>%V~EozwGg`w^wmgh%SH&sQP*6`a2WkiG@M)PGTI^!j^
z>Avvr+Q=%epBW<iL*~^%9EPWx4!%(1!g#<Bsq2T&hUNN}O`{UNO<t7tp^2OmVTBlj
z!?<+9e%kSirFSUg|9i9bAG2CK0A1zHs6dh``Y=MAbslc6I#->q$CDeu-n$C~GM3|l
zT6vJ(iHkm`@f)3tQ<!7nY*IkVtf2L$!gBs=`d{<Ul*Ul~;3M)f5B+nIFSpnYtW%;1
zmS|sjiF@%+?Ci_qtL%-jKLQSUb~+@9PitDgMIb3wfY}9^UlbSIL&5m_x+M2`6E!Dp
zyNs$^>syTBqB`r3fShlHsD4yh6SOEppl?&AH>rKgOnnUYG%)(f#(qA(jWb5AtxXpm
z7w$!qQ$npL-2`taEA(dNnVoC%3p)-o?45^BCmN+<Ywq!8JzkdIN8GIut0*h>^l(u;
zy$y2|Z_k}-)M{8sNWL{YT$%6DBwFZc$J6j9ctfA!Q0m;8S}*2X+htee>eRx@{gFoK
zlj@~Sk0fS;mCb6(^)SdHH97hbz_>3iqELiiBTJXiCsWEpC8myRQf%R^$r`_@V;gTg
zA#f0^Gcj35HRzHwO(RsiL^>GYm!Nr61~+Fh*oN{lFXJPjYD|`k%IX~7YKb%$zYJ9D
zkyxZ35h^xBHI)h8v&Xv+dBvc41-FZh>_~*UJjG{ff#yTfXm0bYXkc=-@PIDop2|x-
z<}yTQEL>%8^Rjkxx{q{w-$?e;($PJk`_F**8XMFEZqS%fwwfS*9gxbDB&$y|XW_t4
zM}G+&;Q%U!`uf9troFTRCwUx%T*c-4VDmr7)9HJU{132?Hb!3Lmd^;<rAh~L%#ayu
z#K!3L*b{iWi{F6X?eR`AHZr$pGb;Lc@8QQWDP2?nj~52sIi(BA@*CYmoAHp8fL>Ej
zY#Z7`zoa}3a1#`0za2Gj=RdQgEj@2;&!#=gy1T99mG>KO%umi`mDo9`;;l$<O1&f^
zLPDuSF-;5R%yVtBu}Gde%z;g5cFEo7SeQwB(9|0z#bAdrxCyMbf#I*T<|JoiU;NYo
z?^0>9FZQk*jE?IGB6WL%k2fEli7a$o^JZQ`0=i~5hRWb+;_z}8H_9^2#3#9)I@akN
z4O~Cxd1iq_Sh)>Lu*IQsTf;_{d&$*Q>6qE{?PsZcfQ>_rA8WM7J%pp0YgI!YxqE2>
zRTBpG2{Fo~W+yQXKYACo7gv&Mh<*SoMg-yenia4ib45sy$LHZFW~<ciMjO(6$mwW~
z5Wgq*a94OZZ`)W6u_pJh3#*My>`^H7_gOkOl3@0lOE!BkxjU(f6jjq{(k62%7oEbw
zB0Ab_$m(=McDosbzyH1`t7Z=lmWHzuH49q18<^An!en%eZKsaG{)TlY0~^_<RP*Ir
z%C*L}IIb=U^U2UZ7lGV5hgH^=SoeR;P+6nw%mptsM3BU$M==$9?73NA&K{mkQ!be9
zJ}YIcIqi31Py-ksxe28n*a?e&-&^8ME-1Q?x35u~r!T4>`cRO^F10|G{vJ$i<Pmg8
z80B5E`vFd|>pI1|`y*jo#x6TPX?=d2k|E-d?7P<*gb4`1cnvMzH&SG6vZ}F5%Zm-}
zWAS$a{XDQk|KzcS?hn)uvJetY(^C;svmS`Fwb8`)dYR=S(eChm!D(Jk9NC?Kf@82v
z6ik^gBckaIO<W&NYW#q?W#x!V{RUt>DuOEqS0pbm0VBKFYBaUuQFgN%c;~I7lGkLU
zMzUE62ENnM9&L?wo>Z^OkwGTsUji}2=qWqn<Gk+f<!#{2POKGLo7)Qkai0Uw!u-eL
zW{}#2@dSVvN2P`8<D3<Wi`x*+S?D=oCQ<G)KmJ#wn9#aXbLZEragdUi6f&0v`1|7b
z!sstr$;1IsA2@|e_mL3ZA>sc5n7-f)|KdJ*<J;Z7n=zi0OwVdlh1SxU)?n#<NUNG#
zZoONt<J>jg?63gQ!lL+yuXHaBlnKp8{gN24jO54<FiSKFqsp1DpIq3V{yHq$BZXO#
zMnyXyN`W6*y4@u3O=0=A`TWuicDp>!Y|MgmB)RajXDe$73df7iE3$pj)TOSr7c?;j
zoBH_6nWUXs{1{5I1C@99HB>6C6~rH7(V$30q(A9~{_?rl#TU-(y1D(cRY*`AmX-Jl
zkfW9tpB{kil#PN^n~|-3K(QbrVQ0nU$>PGsyoxWwqGs6hos7gw|K|?iLa%DuMQFCm
z)-1}xZ=qXf(4D>Tnwo|aVYK%0Ukr(u*7&ndmk6rP;Jk{+Bu8d+<?}9%T{(U3?Q4ef
zstkeEhxm`S|CMFWhHn3p=jtyoDw_o-++9ACOGQN0EF$cpm=LVMxwH(&@OPkEe%OqB
zCz8V^t_A(t@?gpd%VD-UJXm6<w7d~!O?E&s-D&Iav}Pnq+dNok*aN*yU|9yqKY*!#
zE>p=iYR#r;O0-e$1})9SMf#ALY*F|tJyO<k02<eq8#Y?Utxe_<IQ8e|9r;#BJ$!fD
zYO_{koYxX|;Nj?GKskT3u+pVap3oRqswk_dtS*H+Zf()SFjqyUvl$^WRwp#if3R7Y
zfvQ`Xd9T!@w<GgJ%4c@)%Vq)p$ufFuhhdEy1=c~|o?KDEo@a0e-}B`IB`s5rs2;8$
z_b-YdC{c|f*LxB#^Nrr#z&wYP$!bxRZP8oCxdtlW)5|v?UGCbnfCUi=Yi5NBMRgUV
z+gEYT8EY*){Ox@^;@tlymcV~u<f2C4WmScU0^67MR$`<vgk|<s!-ImyF6j)l3!&q}
zr+vK~75C5mHHrze@5}cmS8}G@TjnH`Bwp_3dHXSmy;%DB%~nVv=MM@+d2xq6%F3Cs
zkCOP83B&dWi6%K1$gtPYEKW*DBt+-y*oBv^f{S=h2QWSSt{s|cm;=Hrd^$1Tg{y=H
z+FkPj`a>d=DC1ZAQ&+5~RmNu2TOsACFIW70fMtKMU%~eR0?q$4jVF>~V`K=#jdfMf
z_jZPqF6GUOq1AE*hN<M?bWFFSVxFABl%>6swrB%UMv$a?1%V|cR4NlHhVBznzZe*5
zNEpwDsao*ddH_VbOPk<UgjfQHhr=(G@3`l)*~`}||LLdwwl>tfsMV@;zcr<4LSD|0
z=uMx~D&3p0s5pK9HuNq1&#o<?!qVriYjpJz{Y010*9(rKwAyD06~k##KW#`$QcIx$
zTI$nstJfgo@8kv^^W#E2)Q|wr7~fD}hp#OB?50{u3w|Fp&6i?Q7Nw>y+%asL<1maZ
z;ZCsfDGJN9(4~BQ?<v7t#SO)#!4=swXF&ocaHGy2e|`}}zl6M|s+gnavN2Y&PZgdE
ze(@pS2D(&|#7oqllpf>g&*%L@D2;?7UR^@ny>X|hCL*uQ#&Nt>h28@!F~Sn#mg?r;
z{vG-VIL16U5bLXX1T>%Dpj&vpJ<jHac2m@H))vSmYw%*pJW+O-Mnjjc=bFDtWUKKZ
zuCX;OHf!k2e;z=H<M5+rQa$;gn(1}t5hlYC2JZ`AuyXMQk6A^Xn&ey;pLy>LPj*GI
zNyc*b34i^v8~KK?pyvB(MJLhlNt>b={xRi{(wrWb2FR74M{ty&NAiwgLbaC8p6kAt
z+xR&<FZuI@GMiCR_L+w9^=09DV7ddUHl@zbb$H|LUU_O35%0H#DHWc*==kLPHSe1D
zcbne>&sjwjMKoXWJUyv>XC7K5LyxDo!EeS-okMzh2=*K2&A&5mlb%9I+ERU%UwKgq
zi7zS50oN60P${y<5gfd>0N#<r|8QZh(6*Ta>4mEq+O5g=VU(n|RHl9f>dga?gw~>-
z;7?GHDu8nHoV#Qz^&?L7tQN1mC`2v=Mr)EuO&Q{cH6th}MkxRQ697NbvgYE5H4I3i
zubFdPuw#`eB@PscF%NoY-0R=H=D6PR1LyR;POn(nt$5Xl`LtXAOC3E_vpAW_4+)3g
zqFT|1+uZgZR)~8fK_y=osc~!3_@j5}tRmNXH)3*|<Ypt=^wp&3&7aP^plm{w=A7Y9
zKlz9>yqG(TRmQCg_Z?m>f=z?0!}Due#^3JfqI`+s@3Y`^Qx@Guj($pd@U33Pemr@n
zt{zWrL1m?f+;s()n$sQi?s9BeE_|b)M&IPUQ$dNvCGvb_p~nIL7B0DQo(oiK{Nj@=
zF=QccXTJvD$yn{CE+pgmb}!yyHw8WrAj|xH7BcXH+w2bwWftc0crI7j_D)mKT3-)@
ze^+=N_1h>qU#!pnV8H%m)OM?wlZvjp)ah*-YC4n!B%#INRKKIQP-Y*f{Bee=tzm0T
zaZRI~|B4TLK6|dY#<7vvqKU?bzJ23pO~mRoPSN?M*7g8>>OkZ;hPf-B$?)CCNK0sn
zSMw)Lbsg8PV*Yu%1YS>VJnoti5BCv?404n!=?l`2Lsg#g?v8QihRIEwSnP0;=Ceal
z;r_iVqri`w6?Px!c7(W{*)xvdy9*Mw$4?eN&<Ty#Q%3|9#luipr)72Zq2=17+`+DR
z8M%qE4nY0>9}Hff9s&GX=4k$7NtgB=COMq;_8-T)nUX~;WZg0{nUn0QcujD4ashY%
z{6DZf$Gi0@X3s7LN=&^%hZJol&rX47EhnP7?~aRsiC(hBPE@$m89DDa{}>T5o%>}<
zM*~wxUtK#z{Y)_X3citjI}Ub#*|BNPTE&j;Prk%_7B4$*O@^w}*hcF7RgoKTO^)Yh
zoy?So@|G3T#!49W2vF6qycx)Ub06D~?J4wTTRY<2ZrUSY$Qdg3pviJln25r@H}STq
zExX9?y0m2Bv{y?=*NQDL|Exb#rvRdHlJ(`HdNk8tc^hU_X$dO`y2C1+*t!3Za;@GU
zKn|agc)--Y`CdI;kzE~0vS`H;9JZ#rtI^XB(IDig-lr2taiC_&u!kB2if@1Fs4}En
zZPY?II?M@l7$Y?-Y>V29a}WAZ%Q9o8H*>u!UXzN)h9zw~=PafJ_<_ZCfiW23#!Z&a
z!D(tcu2<#NkATU<6JGa@#hnEev77LW+xAji0`1N>!$J$-;+{JVrTeY^vx`h!WP`PG
z9s;m9<4971Kf3JeFUp*4Vw#P0AnlzSC(TzB)(c{E8$a9>&4xDnE}QwCkyi9T+lPb4
zKV$^dE*7HgH3WG)<2oc*a)k8D@IW0uoD%^wl(f&B7^bzpdqsX56dSTFbQ{9ZA|{C*
zuTiOG_M*bDB0I?WgJ_MdfBvGS@By{%hTBhVCU^YaPuhp|_L<hL>z9^;neCC=0SV=U
z18B&_CrY9HA~?e%fG1V;w(5(ym(j!{;K|%Qg;=pj1?Um*$@U?dW-^01dH49UbKTw-
zhx@{o$RD1Y3ca37Hf5Fv{aVHFuD;AW**x<{z`C~7BS5B90)CKrMY6Otb}zf{rhJEO
ze`fWNw{_NL9Kn>|X2udy+r@%rUNZ3qq-bYnP3&}nIM}wIS17V%0TB|sv5RDS1T;Oh
z?!9RGSN}&~`(j6|ZDYAN@d!zb*b)8s{DidybTmH+2UGYxq-<MU=VO=3*C}QyU_wgD
z<L}S8M)pI5Un;{E{@E}Fv>+-_HvI^Yj^2?SpV&$B!An|*8Ku;lodrZnp<#@`*B>+?
zb3(#bUFdy%ccp&ti{By~BSi4}HxaZW=n*1t3)$?Qu05q;Vmc|b&474+2>kWyL9^{|
z%)iIp+0(e98!zcTW^}*0dL%-{J3X^Mqt?~qI1E2N{#xr1@V9LLWQiEHv2EWrGC}<d
z35nX_5m65DlaGGPuCue7-7iFyl-KniW)O>Kd+l#wl)-SnWqrR~nR6zY{F^(IZTneV
zyuamuQx)$$fRM?Hw#7x*79%|70s5l<*4l`eLR(?7+cdT3%?1PogJKCj|MbrnH70_X
zEWCxq0R?0m0b24z-MaKZ;0)e3nI|nB#u>XsI~SJ5xQi1E<2uhX$||y)!hcY1A{}pD
zxVuxk++abhEQ4NVdl>^Gz&|gJ@xVdi)K5tCQoX)@O`rCVmoxU7WxtS=N?k>$WHtes
z`X$T_@e6~oVTV=$tNW920VYP_B0dj9@#EO-dj7gHGw!0En0I=O?={Fny+6<`DSC;C
zm8MnC2%!`f)^jiW24oJCk`w=Djj9;lZ#d|QYKV{Zv+9@$EC?@PgZ>x3ly^%9lp*V;
zS7*__mD(k1Q(%6x_gi3g>yo$d_Mc!E5+X>sf7v<Q`f<dYB#d@_2bT-f+Cx-=6jp+h
zs`pcAT}r5N&3#pv_DF<fKz9E16gN?)TS#qfSc#mj1<tRv;`t7n<EX*_OysY>UiZ^(
z+1D-M3;qV1Ie0<0K1Zhoe}Zz)e^qgx5;W|RiH}PaKh2|>p{7E$&HBA=Jtrh!ul$lA
z9)Yre{UVSI)4wW&!@t@;B#?|s{zVAK=kNWr@7e#0L|3c9@~D9U0GR<|BK$%$2~(5!
z6g(XQMy*g98}e;v@(+uTP~3eT^8|y6F)ONyBwbL<*g9Rl)V}4@yE`IKZN^{}x~s1H
zW?Bf!6&9xLE=bU5O7o{;aa?2bku5PcuH=t%szqF3&vyousx>WdL_2U_r{y{J#;LHd
zyhEoAa)?X;Vz|CjXTeMU2HH_o2Gw@R4FXm>7MiHoJPy*`of8+^#f?;KI^`u)SYE3t
zdq6v=;+<lqgwUh5Oq=}Cr71gfUPVTj>U0Oea&fK504@O1MM7lE&yuKXVjk;81Kqwy
z?%#2x3LPqPYe%QFwG`+I3q!{To~<=bM?mbHCIz)tgLZ3q<ynDjR?Z(6p{l(TKLiTO
zg#(wxH&I87403E0@iOYh)!QNz>Zf}9gSn4Uk2@(lF)#CeIae6&=igBkv~U(qmZG30
z5MNx3Kj2LmrKs<ydx8AWK@|$c=gf%6<p1~QT70$1N3N-eRZp#qLEKQ@u!i}?;5mio
zgf^vnBQx`?fX`xF2e&OaI*^`O2GlsZ$T~TL^%8qIBY%+LeS2UqPiOWJJ&H5&GdE9f
zIoN0l?o<TTE{~ME$re&qIjx863nnSM&Wl<oV-r4nZvA@Hla3D0cGa>2)S%EA+#}Bd
z_YBv0r>WFO8%2d`{fdlJ6hyP)=*sEcKQ>9@VD|_J8M*zUmBxIDZ1xCv)%H$XDS2h?
zQUcdlu60`{B&2MpbCQqcOZlvbEfow_fF>yWfh$D$d3T(=EILzr7D-E<ak;Cq#kRBL
z_*}aOTU0Hde8@0RQW71=^2hxp+Ud1u;a30MelBk;N&M_WIotbP^P)J<f(eC-T0y>d
zo4?TC8A3J-gA>&zLN_N{OgRRGwKtNcTzxdbq}XQVukh!S_#$WNe7PD|)|X|T<XKnD
z8U>e)lL#hh4^fuvJ~yl4<ZAAPcdtN4WLH1Rpk}*HmzPbtg)3-p!e8z;RSLQnW$3;-
z$4805+l6;?k!>*)T+ne1E({I}u%7GB?A%M}YWoH%z(FjO7O|C@f;rlir$awlnO(n`
zzUszwBo`h?$>yOhm`os@GdGtg-Yqr<gUSOUc&ep0m&M{@(BeN0eQG~1+US45R&D4a
z`Tc<ss28L(5RORpChTQwl2UVQ-Zu9?pWyG&`%p<fqPF>MezS45h-EV?DNJ`2&xgC^
z&XT_e2y`(+ozXCqZh$t2!xWzvx)jF@z0x4yoZo>Me0OXU{u14Ny-YFD?o?4>Ptjj(
z;gVdRTbNz1(lR!MS)8umZ@2m`b(LcN(6N`EJ|N@jBKM<q9CN1947gL?7BL$67**j4
ziNwy(Xs&}Qx{bb;C^lE*j2}otU+{`&QiE#Scc(~let{t#IyPf-RIi@1?vGLCJDWB9
za(q2381E~@Fc10Z8!Akws@G{?{nJ@9=n-JYK8DrsAs{DXl-jV`{C2K9CT5yy5N}i1
zDY4D372Lw-J>jBF`Q_=PHcLo8WC;hro9P{a*6&pqgXdOn_IW9)kB_OAl+*kTjP+rC
zKWQp|pQuM!TN8Pw1WZGg98(xg`_abj<7R!$CkT@FPm$(v>&9K%VHxe&A^xPK)vMJo
z>9*jX^K|V@q3HCv%x?9$Zb2V2*NM@ew?bRh7D~5VxS)|yy1I6GVTdu*{dOwqflbw|
z6jZa)BA_KYa!%E$3aSUc=2j{wGb;~pB_V@vvOl37Junfc#>vxr?x1Kv|FVjXg*j~Z
zD}AQ)4)42B{XOrIwHdM{>JOwcmPE3=!4o5~Kk8LE8blNrvpfKLo&)nixpyh*XXaje
zJ@eF%JMD+nT=gTriYsH~iA*?zj&9u<k&S~f3mvcOgVl1|5L-f6KKZqESw<yB<|mcc
zmaF3uKV`sViosp$`iX1$W+2@i(6mEw+E!C44@9!@bcOAqSh@@seaVZ;kwHOvJ#L1y
zUjzEtK|b%}B9Xp?#2Sopl|22I`qB*iEN*OX%eK7Fvz;iK|8Gj@>3`dEy^&(J3+?as
zGM4#4VKTLR1}{pexK#u;U7D*IOo7vJj?J9ta_KQLPwE@@BYeZAkcLpa@O4L)zx-hH
zVu()a1H~S^_Syo?Z&H6$Fo_E+92W-XG%V0}H@^5U^Oo2~xrc9m>P^vjt&5kDitf5(
z)u<>N8uEu>_%FI*hrZ?q>y7<r=<!F+aDE%Oqg89GnpK=fIVQNR&hdVOEg<m_k(EEj
zVCQ*VmcT1#i){440X4|8--?0uc55IMbVU7fKTz)xV0rpbm47o82l(EPH8+O_dl=cg
zH<v#zti=W2XO7(TC+}*>(L!6kfsOYb{H8V9^t?=_+h*?`0cFL$FteQhy*54nMoo<t
zN>lb)>u9zDuGKjA&VXX4dk9xU)$%a^SEv)^{hrCo0Rtcs2!$|4yqETrpw2RYA|x-!
zYL4L}$DkLG6F7rIAijyhylYV{%NsZm72DNSqZmPSXzFO{XZjYie~T|%Ce&$0JY&~e
z98L9q6@31Wp=lFD6n|PvZFGD{Q&ZTXgGfFvNd^rD1^$XFN?kB7ft?#94Uqy9lBVD3
zs(T~|a=rmd`mm0?p&EPG!EF5ocL`Kzt3<nZ>HCS3U3ie$>=D>IeBfE%)Sk6Bu6Juh
zGE#DY4};H(+m@sS&ZA+h%Z}X59;2FAEu?QRyd;Z*yzZ@VxMg*2CpS<QJ#0oV^7vSW
zL%Y1a&tp1KV;E|k6$asoJXvJ(0CpV;ycXqb`uSHT9$`7S3%~bbBfsrf!{B);rhh+B
z`(T7HvPrtwRqpLCU(a28PTc7e=sY7pWWqYO#S=90Es7>@3iW0{EdqK2E>z$AcKE1e
ztKS*9e^iCt_x7#CPs(*AtL(_X9+!@7G;E14D9PRn(+j0DbCP`HxZw62;OeF<_6hap
zpIeav@eY+kwHiq?b$p#?ya%<^n<iE@%fD<+(`4{0aS<pb?TLZylQ;F`U1?x-1E*PM
zk~#w7egD(-SR+jrOvP$lV~Ch<V?9FKjHV{*$oY(Wv~IWq^_fp1_Dbh*lkckTpBV}o
z2iq^;@c1y_=6|50tL8S<p5JD@zz$~XPu5UZ#(5R>lF{jxvnB2m_CtYoO{EcA-lmIT
zrMSipbzBKURhBeX;n+sH&GoqMO>XX__@VSOmMejw4M%GF&#yhm*c^}JG%XqubAE<K
z!DzBw7-y8Ld{|3ff+=puQJ%UC7A9Hcg&dh;f1NSGiJX{fU&GE+b!y%_HQd4KgSu$C
z>Q64j_D|F_j18n`qKP}AP&)>YZUHVo`ClSUVqybg(}}vI_byI;Wo+$j4q;YWdqsYy
z{Bp1&t7>1<1N@LgzUEXy(|B;;2J^2+j+yosW=5_GPhi*H@wBdIUiRreW;n~y1L-hE
z-p&uRw(|@B_~LmeB(Ny3J3<_H3Gtwo`O?K_8T{0OLzpK0>>#h%X0?3Nq)E4&nA@&2
z&J!z4I@z9A=@SG+h<q1S_S^@4s9QZSSMKc8sp;&LW>;6sH1NtH;QMr6Utlo7_$kC@
z#o*I0aF{;I<3>fGliw*gBqpso!dz(VYdXsi|4;i{!KfL^ydZ7ep;pIN%8_GoTW;^3
zEt}z-MqxFN!7tA9p_QQU;jc~d`jTtJe5PFPazlGT=|?LNJRpW~c6hqSymG`kUpmJE
zjiBAhs=W*~7Pj@rg&l66sDQ?omQ8)eR0c;A?bnn~eU_Y>M`avi7QG=ZhcL=6stI^P
z0#0eMjkeWp-mh)T0ovY!bZj(yJUbUJbYUFydVHj3mI?7UJrA*}JP_e`HPZYqpf0TA
zbEVD~O)yn?<2P1ccr;WiJ68FUficoYi})+C?NQ8*g*=L`1q~7+#En%^6G}ZP1tk$2
z=Ul>o-Zkp;bor3&cJ-l6OQ9YSkJWFo!oLzZbVD~Hx4PNyR`OjK*DMaoC$z&Ey9-hh
zIc3Gw<%SMaE7m@ZN>s*<<9)1P6;byr%knXwMpkB&Jcz^6b~`&VLF1GdKaJdUA^Nh2
z=g<v&`~7RVU|+3gJ;ER@;VEnBwHE736qD9&9rWqgKJ4;4VCmHLikb9_XZDS#@cDWh
zII$G=2$<Kf_QgMc1YmF9_@NvVlCoq;N}?94E=B(_r<X`|bxeD#GI9TWu8p_k5fB!t
zkih*2kgYu&DrsBI5r3b9&<jsdjMHjAmAZb)x6>-kHynmAgASsjgrtORlN0hkN3@JL
zqmv3#BRVUn0l`u%*EX)X@6TyvmbW=aJ$L<?Mh$vzwFqYL>OPBdSl)A@HX~Jgg;R!b
z_b_T3E=fzo=%??olcxd?P?Jx5_{P4Rmiu(=ME9Pzy<I;yx&35*m#KL69$i1reMZWu
zQ6|#)Kc^P{&NPs~WEMTN`lpL-N0@P4Fxze`M`@z99|36Ryef!@ToV=2)w$o1y|`(V
zNr*rIEgh>~W22{_URX(rK9E3in=y8N&=l=7-5Y>HAd<CDH<R;nD??rBCS}KH1xQ%W
zeZcOf%y5QhkCizw%oOxekDa=^9v?YK`<J4nyn2zdQSJ;M*2f+#4RvwrF!2R(31B^X
zA==xIewI(#G`43wyl^1~n+e&4ZrjpWc>TYlwq?A=2k6SauMYD)tEb*qJpvpAy^bw?
zSYniuf3H#hr%M$+=jzho1yl@N)L>8|$$gB+ls_yyWVP+Mg>AR%lnv7_Dcvo!;hsEB
zLCD&UpAIn*=+jsT>eH>EOsB|IRTmV}cs&G}d^jK4g1jG;Z$#%frrl7}<)NOme%7#b
z4R%cfcW&)N9c>b6on&7E+s~-W?O;ACDr0low0XIOQCRLelt2Y5upaswBwN0KoBxn2
z`#)HVoO7OBvuqRi+W*Wjubm#Un9HzvI<>m9rZ&4s@1!$$DdQbQ`D5L7D`aEJOQCi5
z#afL1%T?}#KS&NjdnvyRj>tUmuGgmOl-&j=8k^7jw4LHQCATPul8He>lmFC9MQ&J6
z8w7c=67*b#h=QV<BO7W(1;8^2$gzV>9nLiBO=((%Er>hX>i<v^shVu~Cb^0H{P5#2
zEfD8ws<#MNwYX*lKKwb|s0fF9bfz{(RS28TIaUCQ@4ydY3c_kNfnbH0ref+c*jqU<
zm<FaUdx`@w#P>o%*bmOG62aLX=fRtbZi8LsLM@_<dRs<5@2@8ePdQMw|MXw4eO>bE
z-rwqbw+Z4);m;)SHZCx^oA(!3ds=O0vTTH|M_WF}L@|jxJb}2dYi`tab*~gSUkb65
zHqk-rd$}j+6P*l~oi5+v_X=8C&iL6z<}{A>VS{W(8s5z;+rRC$XFm(T?gdc+W!~P4
zRpn+Nn~N=^ZDUm)?pc1T^WdXw+w)%Y0y@?!aZQ#+CVG9U@=G$#V=0tBg5G8aRpc8x
zmq|)$Ss+3+k@GO$WZ0Bo+=^#@K|0dcbw|)akoZQ28jms}T-c;Cv0Z9o#_O?LXvQXb
zrQWd8u)~-|tgrCHL9dcXSQ|ZgsOw|-%z#KL*+#=WZC;d2632KG(l9bVl{*%8m7*-;
zp{zKntOK;RsgjvuCHQ^do>|~TQ~TB1qS`KXk%JPsi(cH;8RxJmWRD+-c&7P9eh=f*
zbwx#K9u1$ny!XVE_3d15^I5F7m{U}dLvdqM7KEDdFp*h&KH8Ipn+HvZd|zP?N`mkn
z5^%aN^FXaOnZBap7s2US3&Ow~kovh7r3_%&(v-1x)5(19ANNhebNRP~H8$webBTnr
zKNL+(=zy9OyW<vgKZe2*IeUN_Lj%8FC#*DeG%TQtu$Zb?v)BeK!uxwfR%OYFh1nyo
ztr_E6%uJk;JrY@Ju%~P-az+!T;GQK*T=uGcl=*Ql^%>0f?D%pVJ3j&SJQDPN{z{!;
z8$&UP@x;1{J?`#lm4QWo<<mC_reRrTamoO6xs@dz94$E98pEmtTu$tro0VI*fcNVC
zL7o>xZ<?K&+;P<-nMG+=PJU>-bwt&^xNhMk1r-mK^lnvW)OHl;*$_Fki_loQWmtW>
zC6J2pdD+CwPU?-9W=En@-u!w7rD45*!l%YnfE(Z2*b@6UJY{f_2?=R*i#HC!jOzxW
zx`WTh2<Z^MAwrK&S6x0sY$AQGaZhe^%W;Wb*hc&asIR~^Kafy;P$<6PY`HK!z*qKV
zc?3AB7GH_Y+_4pI-x2+gG${XsI3bWP<0~w0Ypvn7_9L)MLisGs?hao1z|6?`@9Pq3
z5W=EV#plEyq3Cga1k?^uSu*)T=8#GgOogf(lhNDV$TzhU7i-Id7DS|28?Cp00-{ox
zc%r=0-)wpSkkaEvNhe-id_CZtPqE9hb&kOGQGaieG6cX8xLTwKI73rQO7!GBm`aMm
z$aFZb85~S01ghlg0Rgq6o`q^gJk*tSizfM>=ge|#946u}suRI|1H;(SNTb9B#Hd*=
z)S3ICHQHVrQcb$*Z(kZ%m=M|V?7KaeJ^1zxNPI<LPDmgH8>w$my{4|)GH5NMad_1h
zzug+amf>{3rr|3Cy&+{QMW4rJ`*mZViy`=@@5hqyryKZR@92k>h@SS>YW=z7sep?V
z9{~$d{&${jSA4})pO@}`ZsGSJb}R>aVgsE}#0LqHRBvS}eDm7$oKcCzBc|$=U1FP$
zC#3m0(Z!tiEC(x4jVEl{B-M?`-GXLbRG8g;E8=l^?HDi6HyA9ijs8ho)0Xe87jE^=
zWu1o6W<W~Kepp<N)gUF*OK1837P+yd)f!nZH<bPp{GlMJL|S)+j;ykc{%bp*e)F4Q
z8M!@cMf$>XVFGcFTpvl5=7tEO0V0WLoLI`V_$i3_rP((fXK1+|*x4{tvPaZ1^m*)_
zCEoVjc*7iYC4Ou?fHdDltE3(r-j#DKBQHZG()e<%AoQ*})y$#$E}e4^2*hDARB^Rc
zEr^<du_{+P13%X`TID26vU41Q$iar`e+UM&c8tj3AZ(exSKN>P4J)q68a8w3)SSY^
z#jW`UBw%0RwnpgeXoA$PSwmp{Yp*LBg?s#vf8g83^xb`3MwE<cNaf^*BA<O*cfg4Z
zG!}UQFRq-Vh8uC}0|$W48Malb**H>Yd$Gg(b(28m0;F^Fpk{fgCXCoR#~+uE@TdO6
zY{32<556$sx(w_luzq3J<V9DdHbNh08gyzMCll{K&08*9e}$&eXRWO=Hvgi;s`Qyn
z%{if<fT<f->Pi5=BlQ!37}p-Tey9lyTx!EwkUd%B!hL)cGH<oSDxt@Z*7z>Z#8>2)
zT!dvV9<JR<;Wuh6VvS8m?AEu>vJxq_#X}7f5XtxED7;6@ozAKx)b@sqw~|df1gh?;
z|J?vnbs`D5B~1$7Syt@Y{VINDzC4dW3PmA|ECpx-;EDWgEg<`2A^*Qq)%tgKREwE^
zK%JRLtQ!DAan_zEJ<j~xu+Pyip853I!%=PQ0t(gUigVo1`=s7pj5LjtZRa`Zy}R85
zz7#2$k+7;$o7;N-t9aRBmogo~#P|c^#-AQPuHsDcpFGlA=C-=kCaam7bRm*Cb4F~R
zgL{ccg|A0zPR#AhsM#5ek~ghY;@!4V8r_hLev7KFzCZghc@T$5aF>qB5%yfkjJfEt
zP3C&?HddWQXuK4IvYkG?yn!%^NePQZqEdCA;~4B<9$GiqyJK<yY{p*&4z~gwC$*)c
zsf2nA6qGxnDg;Mb?C8GtS3e_s8u3E9WW{gP2W8Q$C$~j$QtdFud1zyW*ynqgZV5dr
zM_bj7ZeP+eGFg-~EPVmsxLRs6=%80WLd;RZ*tkWNrKzpEO~s%Wl(-i}vW%p&76hRu
zxA`nYC7@5KQ7Kh;0nWFzaXk*$CuL!xsZ!Yb<s7}%6CSEPIGyIaF~42>xjZ{TR$&`>
z*~k}kU~kVKw-)UKf&FN+vSll>rWAoM-W1lnZ<^x41-qLzm@?qnIrbojmCdA%xvxOV
zt#9qhN+^sb)P627@`#L+GwVj7kPwV}llPvKUrcRgRm?(%i{p6TSyL)9vh+}$Tn2n!
z!bDXnE=y_z>%wZ&5^`U?a^{j{e8VctCz~=N)FQ!8h5bpqdgz&bQtCU_DAt0QK4lyj
zks=P8uzU(I%1NS`e^Wu3+TcAQN9Qbayt=HWX~Ui;xR13UFN}9mWcG&>?$9RxBf#0@
z`f0B9`1jXoLclx^m-A?#IOFGU_V@=^9*KpXRdD+nPL+ihYbAwVf#EbU62V-l8!>u^
z7|b+y{k(oev?kxWkDq>7^OdDGc-IY-uhJ8w99mXw68<0(8ZM(pRJvX>zVG{W2a_Re
zN#BA%T;;hpj_Hpt3ll$OaF@l`KE=qT=<YX?L~FIPa=1zjoy804&T8#Iq)CE4^~bF(
zS>ghBls(2h?Jn&CmK<Q}eTslCVOzA<k^nS%j)SBKy!Y*8pnImmn)O#_(`jCy6uvnF
z>dSX`IBv>JUcu5BJ#TB7M0BK0sl31WTd{2uftDgC?hdv82!T8EeyyI*s~=Svz}1L)
z9cMI9>=9G{>*Ui3!5u_oR9FM1=tS5>@?!)MC(~6WG|7tGW&21GePXVBKzvwD<KXFa
zY<wFQyf1q8zUmfTT0lSJXDtMSva2J?VbSpjXyP$dSO`_D*4a-QT|Vf_kD^;?7Z@UA
za33Ky)a_1?v8|er6W-1=tqKWGL3p#+e+GgXYkx<D#aFYd+$iO0T7L0Vfp(^)WxG#j
zRk6cmKI1W))sybx@P&Xvic{mN;_URoYJnfW$wp52?*((Tuj~s02^0vm4T8qW=WB02
z#NZ(v)(y@GQ8DluSpKN~TfHFmt~LF-NIdG!Jfn!#OaDu0spy1%FG$5IGR8UTd1X)L
zL_NAu@3b5klV$K1%D?M1edqJga?><W4xZ^J5P?im?4S%D%IkK`O{SWPAcPN{HR(C|
zHygx}1j7?AxhqrU8(bNvk}}8`2eAo3yy(10h+==wB5VrJ%b)s(mQ%XZ_hsRA8(n&D
zEqR5H+_1guLU5`lM#Ph+9}M|?n_EeCgoZ?<fc7>)0dZeDa7Nw_C>(e}HfyMb0s#;g
zL54WlH`~-aV+IGYYlct%%Og3cP}NI_X4P*SBGB-y3p%cGmVrl;XuW0b^T;b|O<n^k
zi4RfdZ+pF-%UOq5m`gEgm<Svx(|8`?KjB{)5?%|yblAXVZVsyh5wgoLHg>43bSBvv
zjH0_MSnwS{D&ty2;^9o~u42<_HwlPCPWWaQp+{8F=LxO(|6Xyv$*nr{H1=J0OEd_a
zx(u8_N5pTJ#Z{F5r|5qugOhNO_C)Z|+4tP9OdkQ(`>044%2t_3KOX_Q@;mCYB01jZ
zruXJ-#o}U8fd5d#`ge_H)F2WCy3#MgR5h89-c`~m7txlM_8Y8X)}#{IR9#gbhH;H4
zf#8fv(#pv94lB(cW!|QYtEsE1sgJ8m(g$FqJXMXds0?(;a`zYi)`)Yczlsg{eZ%1V
zef%<<Ts5trX52L_P}!k%RDDorE0as2+x^&{|0F9uC%|=RRE!+D#7tCc_vvcL?ph_l
zH4Jl(@6DY>op+JaY$N&_Pt*EaO!x~Xn+4?K)P<95A&V`Vi0Q*b3?{3rjB026Zm?Vb
z=l!%SUoQPt4cd&qNs?+!m7V1;W~t8|)({g>U%c1=#jJ&PdJGF=F!WX?CLpGR!k6!p
zsX+^cHs^eTo3T&n17*A~A-JaA3?)%X3l-;OwiWe@7FGKBl#^!~DK^8F{7wt)$48lT
znY=7*UR~gH3ooCq(iWDkbQWHu{mk+(R*uan(i2Z*vrMRv+PJr6o2Tr}w2$b(ZsB@j
z9gkP0COj-|UtabYa=*>At29}YNq)E(=UcOVVQeV&DlN5Tq-0-8)-^xxYQ*;}{=Cpy
zPdVc9P*zOO`IfCbGf8pCXmiRnC$H&Wq$gmkOx<3Wd6`f_pX3?kf#(|)PCHH7tNZmJ
z!OeZV*h%hjx!XZivY+!*+qplKtajRQ86dEae=(?Fvhke1&dGp>U2L1;5%yXRe5D$u
z@aXpRoG6_2alWgvv%VB9?jCVgd>%P*tRg9~!ypVbSellT#uH3kG%1w(hcJ(T|0Ip_
zf1@<2YKFxiQLd#HhI<e^DSl1lc3gQn<M)upJ83tZ8y3eDzy3Xv4{^S*72enxJ;$I5
zrJb;nV`_sPtkeEb!0mLLGR+HhL&MYwLPM*;lR<^I&l_XOQ<XbB&FF%xpvJN#P^IE1
zCUJG_Yvx8vw=p?EVcIidF72<WgFkx6Bo!1aP$X4i-A5Mj$^NzPKvJr6ia7Bpg{g|x
zgxE(<u%Sk!5cz@^{cF$(L7;TC?oUvu^^05|LvsZb%+;K{)QUK!?2YFQS?3Y!?zb*=
zclbqZ8k&A|G232>j0GLGIr$d5^o8%4@(&#bAP02_>ub8{O2i7`A==f@An&kE5gYeH
z7OX_kCyh&(+hTS2j|zleupIths3g#~pV6|?*=Dw~PdKVEKb5yG0h6K2N3FE0mB=;f
z!L6)|t?40{dQ`y5dVwhPJc1?$2hH--$Qr#0J$+iFga{vEGgYLZ9!7m2!@>?8$DwIi
zRtD=&-{~c`;hKMDIK;QIDaGjIaV6Ifrv;l0%}%G^iES0EYd5ht`Ub)Jl{|F8jOb<Z
z>hv9_Pf4%>cX2VTr*MOG8IqD(ksbj_(BRJz+Z~rfBS4R^wECccO#%Qp!w~>gLf&ig
z_Dy+dP><2AVE`tMeYpvpbuyl>!V#@|WoHIBUw^1t-)=3v*rQDPITxhh5O!ZVMlFXc
zWmy*5Ov$KVUKKliu(Bked%<UG9K5|WCJF^#WQ<oJP4Q^!uHSCcs0Xag464@*hd%=T
zIIB1-Pw%nyeTUc|!SAX(`19{ZB9U|2D>rUu%B6bu1<uA-$@zZyLJC`L$82(s067aG
z@QKeb^-@aZo*ldmf1)kNN6(A0wxaXwa4S;_cKa8iYs#44s!`%Y!l3KSuiJEyHZIej
z3ou`rLO;oyn!mY$FaCwM&z18C_|d|0|MKg8Mc*aAm#;-nWs~)tn9@V&Ip}Y0Gk+t(
zEfG8ULOr!_)H&vi;}0Az?uMdGU8k;mGwz9YCjMdvtN0u7FYyaZYulLSSN5;dsJr(|
zkM4zTn5GK<;s-YV3$YNCLHfYBZM?037%%09&bd?GzlTWqFLu*y|H4z65M;ZPA8#8^
ziGtr{ItABl*!(?0kiVEgegB1*@vmX#qJmwEZsObjhu86CPD;jMcOfjJFfcFlb2IYz
ze9y=__TT->{(12=f>cdwp*a6`R#!c4VrEd(`5%KW#I&Knoiy^IjOXJ53kzd|;W~N(
zG&7@tjE*<X&1w9jT;-FTEgq8GF+OV{i@Y+Pi?F&AjXFLYS)xWtzI&&hLgq8zZkiSw
z$xxxdI_ud+HISaVTb0o4e=zcz*Hg)!#ewq89Hqy%8N34ZrfbZSiP`}zPnmSpdmJ+5
z^(@!q4c(uVh@w{YC?jtYHdDJMvzs|*-9#Jd6k5eaK@N2ZhnWg$r{sw$4~@u!@iCTL
zL>foE|EXv)YfJzF{>C~-SrsjRKlO6Sx}s6_Eh>4CGFkin_5WVw+6;yFBqD-Yp5;9<
zA6#9unP(O)JcOT^-5>&hFdGlHmTTPzCE`jEo3W-s+y_5)A6W9ti#-CczU*C8mDEZ8
zEGUlYdr|1D6x;LK50UD2WJ-@&WJDP#cGed9GZliwNhoPQle(d$uDg#DdCB~BFh~}O
zL;cM}Ah*8>M3`(bu7J+M5hLZhVS<WkmaQhO=%K2<Q~I%UA~8Phh|(|Bq{`g(CpY_!
zxuU4SXTKiIZ9tcWod*$fRl@3@ReWbCxR$Njl$1A={wgVeE}<)zTz0+3N`&IK238}V
za_$AhQiT30aTG4r1<wyP(RcAnq3=88JfMXm2%G)M;vc2%OwUCcC*Hm2rz=lsVBHZ{
z6l@dm*YSUsD13I^eFp#Ay6_j{eV07ATXt3)M0~LiRdP(Eu#BYH@!#a(Bw|LQGMrJE
z9#=OgH8!*^PW;xP{~G0Nym=*dSl|CbETy7bd|Bg)8D8H5{Bd5u^a^Sn-FyN~{B1^K
zf^%M2G?$hHDhpERE}_6+2?=x-KvCW)IeM?Jo>YxW_;2ySQ7vPx{mBzr*34uZ@1Grq
z^38u2=&a)kTxOA|4I1&~QhfxBoWGnZ8MCcXk&v*<i%Ly>79>NqK+QF+EGsN)_{#lm
zi$xSpDRMQ0P+(${88y6K$Eo2De#N?Jxt*JeV=JdwWw%x~muozvhz%HOuA{Su-PUZ^
z5BU~$(fApBGQq<E)%)4iOA(XCr}wgR5|(Y`MQximi7Ac3qRtD{G=f+o|LBO{$T^cO
zF67Pvp<6R|v@Euct|y$`y|-9)ShKb~Z-Ue(tmV+<PLRpA`S?Ql0rqPQXQ&*;ZrHY{
z{c+ZUJ61a{*X?MYM&f~}jWfiZ86_9H=WWO3uBFQNwZ)%C3ynCl$823j%YqFkGoN5K
zZgI8PhrIUueWU%I6~oYKYS0>;CCA0-rf9r@Ta!KS_F&R{M`nf`Oj5_-uKl5}@YS>+
zhrGB9(01794w<21+dEp=U~OD3!WMhq)A%%X_Uwz!d-NVgnr8d2Our$Ur1)l^%pv6l
z=5L5SM&NOxdfR;+@bNc1lce@e@I7udN&gL72+=ctH+#)`s;FC$U{_F)8@VPB^#<8I
z^d3KSE!;p5!|>OOXPzXRhK8oUb_>=^wybxoEYrx=4dtIj$VSxxFpr9JDtJ8}h7e(K
z0lQ3vGH#R?!6~RrHSgx!rf*0(`6#qUST)8@Yn9%aq2m+1J1GTchL!NhoV8^?0-l!K
z_Ys$qG9@rYeRgs7xEjhY7@-Lj@%nkg84^D191;@Pos%Qz&X}sW-wQX`pH2qiWpT<L
zp&|+C%<dX(2;Plu!~t=Lo{aNTtu%E~6Tb)gzZ1beefUzEn+H!C_o6Ex)7w@Okb(KH
zzE$>iztVy`LrXorLI@}Gp&T59(@jvmCaI11Drn-7rbNd0RYptT<jOF<e|gT`Ty;{X
zDl9`^^F7TC8xyV9>I!n6qurLh_(5H`<7n9>SpSR9__kD`jZq)({DV@72eZB+DeDA|
zBy8?*<;M{cTP}x<b`?{!ma6{IDnwHg;ZrH9tI|f1<vRWHYDk@qi1Q8;C~!#(*PwU=
ze6UE;Qj_alyzDkb9YOhjSbOWRwzjQ(lqwXbxR&Atf_s2Mad#+QiUx<^))tBucXx+C
zahC$c2@(hpT!Xt5DBU-EpR?th@4NRtzvub=0h2Ma=3H|vvXVK*c;9zKEgjHA$F{p!
z)iv3c3vZP~EBd5^yjffIF}7aDI`_)~RfUMr<_oJsE*r@8AJ++|hrFLFSX%L3NoaAr
zu^BpvectNFNl2K=^wXTMN7pK6M%Q18aWeUa(IvN>@BFx5e<?Z{ndz*_UWywAceZ_d
zJatFraF`F_R%Gz?%#?CP4z;2^Hjg3PFcMiRn&lbODP`dsO%jl|SUM<~ZX~yS=dl(q
z)MUJf?mQ$crpT-a1BF#_N7sK}r;mix>qHkJ*eY*57D~(56Lb-K`B6uS%5yo-QabR=
z>{@PWad}!(vW#^=lQp*F0Q<OpA%^(0B-*vQSjy)6QL&|owNFXZ#6OpftX~iv4-oB=
zBz4*jm6mN)77{h!T3LLQXWSgRTe|xAY`<qofAqa>G#4sE*H5DHL_vnE-XYm0_vn4Q
zfpYCv=cjL>o<IGE&MRs(FIQl)nLob>-tX<0Y$`*OKaUH;VoK2Q*i2rlhlTy;=3j;!
zzP#RGx@oYI=bFF*ZM-H%VFl<=dHYz!!<7S~oFkObLla3>+kIfdecy*xlJ$plmXBT~
z8Sdfa)}m07Bw2Nc;?|`_sKyERI?I|BZwGtyW5G~aQfSU>1F=uCzo1W@$O72mH7B7V
zS80UJtr8X5z?c5O;XjC(I^T0{CEzRJ2I3%{=!!3|FFrxKp4a<L<!1c%E_<xYNG!6}
zm~EUNKy;q-OAD)Or=^uHe3}BNs@W<wFkoN&T(InCD#v|AOnsm&J3fNUgrRK~rp{My
z5h8zbqi}+OIH*9Qt-dNT7Q_8C&HLs+c=|9@{Mn|x+?BB3E+&S<t-+8A)*}NJGw%VV
zEt|N3Va4eM(hG3FZ)m~4UVdqKe-~==Ge_w{#aQG+@QcoXIBb5g*FoiB5u<(5lKAa*
zW6Tzn?u^h)P%)LKF?OMldwodkG2K|TiOn6v@D<Ckx=0=pJ49l~WMg`g)={xqV3OWE
zM@s%Wq#-3%Df8gzM*{_h^CtrfV#8x)=Jkk5O*wG;mA9W&Z1@tDkTclm$^uORotkW@
z2kOAhJ5;F4M4xe?*t7lpRg?Zk@|Nb}6pGHQm5{v6GQe`?;}z(~`T&d|hA)5ue?t>U
z$b7p6=GK~LCw}+}13PIVWEI`|<MMDlf}UKLjd#eVvV27S5Z6#fB~sFYU)wW4rk=ke
zdCnZXH2|h%cd-%-C7kG}Myw;Pr?2)Y>yKF+pF2)!d)SdvrP2a@x#Op%yqk+JC~Irr
zM2giKv%M88_UiL}JwA>@{u1SO-ed-c17fGi)<MmJF>XF76eY%b<1U?3`s~!%Bd8!P
zREbdwbhi48J-DcfgC0G6fX7L)jg6e>DYd_nR(@L9u7gekfusB`XoLIs`ykS<14`={
z3I3?CX9NM(`|Mx9=~asCvXqQWhW5!0zCVtFN*wtXN0YnstNk$%Q)_Gdikz6GQ4h;Y
zkXt;yJepUn-<O!;29+GG$>|wHVZ8jyGA`1N5HaM_P|MuYemups0Z0|`r66yKJ=2DY
zW9oM?rE(ddWm2XowGhDL=22lRW`sS5iJ`JdAvOT7Q~7Wf9JPaR_EQvW-x**yx~XF;
zBOsn8A<=luW|RDb?Ly~D*Z_}Fc`t;<b+&gYQ1oLAfu`{jV?aRESM6bixM}WCq0AH#
zoY4fhOMHvLe}Zgt{tdD<zy1T{13pqCAaHF(MSK2$_W&CH!1~}36HJ@z@NsVW#H?;<
zZvDfMd`<NYAN*KC`pu`r;gZYb=`9#c*FzwyqOvG2o5jv{@n|3_Ua5~q>@+3QE&9<*
zn`MvAA6td~F>2aIHcXI+s3!E+alz-WkLiyTJcOHCY6FkZS-y(sqJTP2sV6sdvPb=U
z^gpbB2=l4?PxBd4{<JCr=@vt=lS}hH_x3I3m*whePjZ~e`lu5b6)ZsmQOa?bv$CGg
zHY-<AhBv($7aA3_lU=Q^TkD`@t#qvHbaXfd2!tZ0et9|4f=jyRhQWKu&OmsGQ7_R~
zqS@p<vB(E`BfHY3Mfi*Y17B1k--gdi-k?l8{RdJgx-O2s4sJ|-N%)b4jvxt-C+>TA
zee<K$!SOg_ZN5nj1gLChEs}@AiU;G{q9es3e+$|wZRD<s)6>Fc6PpZMNM8Eld;8Ow
zrww;g7OVV4i$cy~tj-wQ+77stEk?(!<?*3vGLCJU8X<7_5YYPFrc@R_HV)+~GF0G!
zk%Mq)!)U8WsG-p%wrXCHrA2}|PgdTHWUUwkH{n?I+7*oq?P1V`$%)Ep>0VmHg%6eO
z+$Dj#9q5T);!}*^7cZkVCLctd7%T%9=7mg2#z5fKy?Y!nfZu4-G6XiJ@n&_FNBEr?
z2**PZB?mBJlJQM2un5pZt-;g?zhXI_5)m=Lu*&y4sa2Jk3TfZu6ZFE~h<Wp6Zoe_(
z!vyYhoGtvj21aSRh}D!_xHK+fj~u>NrdcjF?LBi+(({Sd@Y@Up{p07da0QKLTL#NG
zTl6kbTP-^rpq}L4aa~uHdC^@eCLjy)=NiiBpS~51IiCbRz_M1;RWLTI*Ohm@jUZ$6
z-UrV;Gil0c5ybm$b>Gv15L`^o`kA71VP^X4^`73j-*cINM5#;bj3qrjU9-;I1kC)D
z(%$`tp{{TKt2F3W>Bq3IK{;-13l2n@@I}`3;*uE3vq9$xBWLu;q#8MWC1a&0I_zV~
z&kF40<YCDzRpgJoFn=yI*bX%qr3XeNTQ|-Z?^5$?%}EmK0fXpIWqGp;lAP^_H8?)O
z@X*tj2tP=mXd;u35C71u&_(g35WVO5ZP(_yu9a?r3k{)28PB8sK%f5^5)N!f;2|!W
zko<MKm|uIU1%j?R05@ayw{I%BP#N84iRvBh5Ei%KjJlFw*cd|~tAQ1j2*`MJ!fO>b
z;WMFVWw4|zz_<axTT(Dh%4$f;gygPOZ>SA_xdmM8@_o{M{mrmdvvI?;_>ef|0e*RD
zL4>~ayN2Asr2{l@^pnRZgav*+5%D(kH?;W%W+VW%n-o$WMc`LE!K*2y@19?hu)sKa
zqy(h*z-~dur7at190QyN&hKh`;K9A^*F)Ru_|q(|T5!v+*;mS{Do++^Gja@#tt|BN
zUFae-I*2@KM<*PW6=eaY7u>#^KmiGL0yZONF{8_;bycJqsBsKI)e+@{O4`rNj#9ma
zg~Up5K_~dc>!dFd#Q=D>1;3$z?CQ>@?@{3#)E;--4TT-v+zdox4wWOmS&%hkzcwy&
zprE+(XMAV>ebnNV=N(4M<BunP6&KVx05N0H=}Urex}@M3Gbj}dic9o9Lt>}ZAdL0Z
z#pPqozLOuD7QR(>8GZPYhM?sJ$Odm(FhD;o=DmuXoSYQ4v!<4m8Wwf(03jtMx(UU^
z!~831;LgkGTgQ45qg_X*bXlQmH9VWhX7`W!<7=4r8X3^2sq5j8=|u?9C1FEez9yE%
z5><E0=jTG_EJYh0GmS1n8%Ioasi}K<h9X6N3vUpNQ>n-5L%M@+uVVEXAVBChs=KaB
zQ{Pud4K!0V11QpMJPnnXYdo6)mP~Cn!r`li6!8m&oi^&IC992oDlU=pzAAp2kSQY0
zxQj*#A)_CrSdsPsj%dkHzSYy=_C2`g`78m!iJq%D<`)?)HRF=2HU;^q8)RiwG?QRB
zIEOMw;xrozQhV=Nl#vH|<w(kEpzm<fNs(IO3<BUX2t&k9Xg3}e>0d!!7PDU(Cppwj
zX^u7P4@-~1T7B?nL`O{gaSD(vl!<Um(wUUwG-bbI<T7BJx%YFHitutcl$mf<20&%%
z(yLO=mqV}rX3y3)nB0l>=vFA_s#fCI=qauUW}zEPhf$U87$rEkpPJW{QANAGN8{Od
zc0UopOyeNv!{*E6suUF|NtT+~MMEv#0?+qNz6t%@+2~*D7Ne84@(+^^9N?F3#hV<Y
zK5?S4*|!*EOM_;f!H{)7MmA7YRtZ7)h5u&175#TXeQBdZ>E9vn#4;Z)CQDw^jiL1I
zT8SxrAO-mgBw6WI<z#dupil974N*g!WFuj^DUC~Pry+m5<F8-+5P5MqaGgSmoW5V_
zk%$m+4~eI`jh=qJzW&Q{_0T0hL~=&pollhg>(M}U%(I+!8m=zUJwU6Z8T|Q_?66^0
zZZF~I>G*~zZYVXJ>X}`;91Xw2?x91myACrOsCj@5@u=|AQs3m|G1uvUtQ;QZvxkxU
zPA&%3X8@;(7KKD>L*Iy*4{>$@!Gnw*$5)tY*95<I48N!@{raZxYyI^SmdgXbq>Hbz
z>H)rUz6{OqePbz|Q0<w;8|rm50QSg;ocd8H-ou-wj@iSGMb_Q6Ry%%l^G*rhIHq04
zW85qxLCnL9sMM(`BS#%wyL<QyweQGY*{<;mCX}Ye*j4k_QzVTH>(s66P|@L0VWY(M
zaa#Z=+jA@J*R7me&Rig`R=vWFU3cTIU6H$3mG{faQcwg_sLTpR?;_Qi$VV+4;ZhrZ
z;^c_KH>QKyb>4Za==DLZ2CKY%_<26V_s)=t1o>Tf!>mXuSYK0aZs*nJs)aYznGnrd
z`#r0E5&KmebwtFBL#omfS~r=sZ{Mf*t}VZJ`FCVSM_W8c{ZIctT!F!8dZ#2%sdy!V
zF~0koB(XbHiZ|}2_L(xAhgrx%Jg@H)C7SR?U$h0y{FR*z04xitB&vF{=xk>vLAEEF
zDHWr8_O&ipfA`CFNR5Gckw<OaxcYUc&v1evn%m{`tX&3LVBtCLr;qt}a)>3y5G)zh
zoK}M>#u-ir6(Ezvd<>X&n@7p(oaniK%?CNs;~%E$WNjXt%^opB7hTdb@_SiTpeW<I
z{qKa>iJqj5nGp)j$4Afs8kLQpkJMh`Pdwjtt|4ACPu&yhsphQ79pxP2`m3p};g-{}
zvCz?B@;ZpdWk}VkFU^|pNYw-`ex*VdK)m+ZELF$drTC-bQ@_}sxeEHQ^zTc!bo<J2
z;UdxVmLEby4#^9Th`~DWxzcjx#K0RyGjRAL>VPM(ka62UxPyy&4}y@gfNyTpG6w00
z>qS+$UB}D2It3sgpkWEAO-lb_O<Hy^6_L6JxH}aQXB;z6zZRs%T>?F6ztLGvuAV!z
zN+_&oh8gCUmK2$@(WZ7K^2jbehg-KU_ZtSg8`MLy>r~j`BPsxfcrNav;G(uMbRkja
zdc(X6U&r^GeD@gT&s{T1n0r3}7w$TauDp=X+C+a)PErZo5r~<VkO$0%n!^lnsJ?0p
z=*!6qwUSC>_4$ea_!<{oTcOmR0&y>TQ6Uj8%wB)d6W5NGoX;*^<@X@d`avgMm-;4B
zj4ewB)Hq?N?@&}2%_>lHfY0X%tbJ}I+V)*}mUoQ6-rYS9@i5=+xYnRNpH%j)U_B&V
z(1jbOCFmKddpDA`rXJRSgL8|707XuTvjbPuf2=5}UQLa>y+W589%t!Ye>2!Eg#
zOij&?!zjkct`dPkZ|@?zY}L@-%^_7^oaR2gWNeY|?&9oS%Kh;0^m@_D$;&xGzfY1R
za<nY!iRqieD3j6!ErK%3C&O~x)F}<2w8Fi)G?C{OSXS%a9@Z8Pe5pzBn>5N#s|?Ft
zPKm_JjuBIUe1AfFBD%Em@ElU+#a78!sv}XCgpXcNx<Fs`*~iivM;yfHEolc|f^1x<
z`XZAE^hbTeQ~U1D$^@u=8)3T<Uo5pxre+rQx7?+{Lei@P?~b$1gu`er&3q2TYvZnz
zHrdO<r&=#XA(5g^sn?WCA?HV@$ZcIQ$1hVl*DqZvzD}y>v{UUGLGOE0+i`Kl`CDvY
z$yl7M4vnq0*79mBS6ohA%nYP7LgR8gGFIFpfmV~;qCeVf!s=1D;s1ZEXfvfKJYD>Y
z%v{-C19dHVL2>Vfzp?{Z^>kH|HkcwO=tb8bR6^Hv8G@_d(DDNK4a7J&w@sx?cEG=(
zeb;qT4!ucX%VU2#{KeOI@&&~~X9nImyRXlmf6^vJzx)Gg+9j~-^z+Tsl~U;?HLbaH
zw4GhqC$OMoH)l+EzldSZ^ZQ3~9*xGk?;%aPy;`bQ*F4gz+sM+5)aY2R&y=?Gr5zJC
zro)#nz6}=*|HB9jKrsupF+PT-5uhUvJCpzp90{=4c*a)ajG$F3dbA(BEaEaw+G?OF
z1BY>YJWHI;)CW|`%N`p-&W|#)lSbQi3@ul5<{NNyR20$|M<vk!o1ULImYwN^hxT_c
zEnk|GA;r4+9vZ2kp&^-BSZ5txfBjxuykA_Ud*|Q(cD=YVX%g5PYuR2vw!UrQeyUq4
ztR1YBQ4h@Gw}2AeD#CO|c)W3uwZz=lz%h>gmu7?G3Tx|aJt%A>Hn5<-LM-*}Gm3}M
z_Zu4irPY6RTo6K0pc3LS23&@Z=u}A*Eq3>e#I2164r*3@qa|^Z^}25k+WC?r(Orgi
zBn5^)?~MQHw3Ro>9R3<|*#z-p)2(Pa0~yoYd589qZUIK0rgYNstON59`Cd%XZ;QHA
ze{7-<^H-?_-#}Ctr);wmUElPP+L!p1mKs(X@2Dzszt~Z~a+>j=$j~tZ8!}N-LCD=S
z1v|W`g?6c5N*(C<%GRiVx2uNLEPdyF?4qZoD@R#qE=xIF>pDdp4NkI;t@%upm7=`Y
zO0ncrYU?n4RNgKP*ILLcwflncq#!^qq^TsDr{lsTu8lfV+ve`@K~W#CG$KTWDqm7G
zI#xKZF!rq)H&Rc4gex$vsL5`pUPU%8eT1magKdYtB_j2X3^s`ESCEmdE({S}XjlBv
zykmG6QvC)F8h&f{JvrOfJ2zQF)shf*Pr^8sM}av9^K|LiXQJ;xYIchL?xmcw6o%ke
zc02S@>#s7ATmxiF*kngx^tjCANKE3oH1{ao(fs-a_OBgD?~7Tg@XE~T!)u!xj^eU@
zox3`t;#QNhBCqUhSYPEs(v!}bJX6BBI)X$!y(LhANf%7v0yldR#g7ZS9PUX(Q4HUS
z*6D{*sFC>F+=ZJLMARzW?~7q@EQkEG?~_wK<ejouOHd@iWV?cp@z&|4slH^QwB%@q
z|4?%Po8S>KbaHvK{&=(1v;eEfo4kJUHF3r@<`)pweR!*>TA$;^%fm((|L8&3^(TUl
zk|<#I&xE_ApDT|K?X>-oNg9v^NP4LDQsuSRqgQzqZq9nJ1UA8^;&YP;TaJE;TP4jC
zM!U2Xc@-h~&mJr$Gl$mS$Q^3y@8z~h+$Gum?6Up!vfS+-Mk#yEZ)n<*s2>S+K;GUE
z-^`~o&8EZ_oxxWQCy~PA*(Nx^l1#yz-fp+Dy%Kj^s5|k#uKEhJJdjtC;}Yjp9%lqC
zu5Wd16p|*zSxlZ51{(7(@o@5MP;jafLD!rf)7P5U?9A8eYW4d}@~-*8r-8h;cT^R4
z^H~vcgkkGhB_UpNY=OzPcZ@yv?<*QL7R~edRk+7^^R{9b)<U0t+<uqc&_90^-E4Cw
zo!nB5T~%x!eDR}X)0pIjaW(7O>7iG2Ar<qX1<wR$iK6j+@Cq6{0mB2UN$>`6f4F#2
z@jg4BBK2i9X{ZdlgD;hE<}7y57G};gY^18f)@`iiXI6T=?j64iltNj~x5iBL`y#Mz
zbjDFbAgMlatcaa&oe4t;_uQKcm^CHbkMDqr4FAJlt=xKx66>(TgGL-LMLoWBBVTUn
zBNh9j`5m=RK=8!7{zb#C6V%Rnir6gJ!~y-#$MD}N7L?!!=Fju`ctlo({a$p@w|YoI
z66F96j}wwcwEoF0xeUK-1k9jV#L9%_@iscC^i{`XN5<k0FouxO_O_(_VYRxXZ}VF|
z<41k*<KQo~%do|o%_9Lixre?TNZe?wi$ZQWY~^TykeVnQJ2@^pSu`4%o3sm`fE))A
z+g>RuqIv-z>%lptw%f8)(=6n3qw{3&=80*E9MA7aZ=yGWg_8z8-(0K;vKz;xG&mc9
z8QuzI8*y{bPsp7aRXU16cwdsMr9yA?(5*ilAQH}#cQ1x}B`L1b3IjL{I-bAS(mtFu
z;}guX1h-6U%gEXK=54a<%#p2=6H*+UEWP7EPo=7!*njLSd2>{ts?T>c%?H3K4rH~F
z0cbeepg=9Es=G(R;F!-z-oe_oF}p!hzh3Fw#j_c4yk_w+cyTfCYiibdtLzRXJz+^e
zn!Q6n@F;wHWBu*A@HZN+h6<Llin5}jGBZD(kF)i{V+_`!hqN(tKRfb{Q^dIIg?HG>
z_ZaFI_icATIeb;I0*c;|_Ui|y=q=*t7LZpZU54+y2J~!`8<}2|!*KV+E&HbRT792H
zZ@8D;8MEUixSgzc^6GDZ!!SS1<1h|yRq!jP2j&;sF8E7P(erjCM0<AJA>F89fkL?N
ziqpM|s(E{!H8RmR+**=io|oB^F!k?4rqWXq$C>7-m)db%QHdLL1w;6LQRA*6qQc*v
zSpB&~GHGZNeWrz5bW!$UO{OYPcR6ycv-459(RS!V1Lw7DdQq?FVDf2-1jU7Kxoyj<
zg>DCEUsZRCus`6en!g-<vAkMg94?R*YkLJ#8t&$-6?i2$ay>^OCGP^gl2cQh;@bw<
zshU$YgLNH{(wrQQNoPhBv%-C7@OUFHG;{^#JXtpW&e*(W3d{~kNgO5PP}yCHMKM*;
zG4Y2LhpiLeI6||(4spdlTgApnTjyc$z&(Gk<TAib|5Ao;+u?0yzt4$E0U=lGr{Q5(
z)BSk<PXkVr_hl`*<+X`=gy?8XoZR^M@62Emx|)(2&+3$w!Lsv|u_oZqhdh<2a7L@r
z`eF6t%U?Riv%jIKP=L?aSFS7ad=r1-;N5QAjYRm1sV)7aADa@<X-5RiiE7t;V7;aQ
ztJRw|`rwNao!%?ehq3s})rjE8R5G<{PuC_dn}z46CkxcdwFEtGnd|lITQkr#=6nZB
zG>)=ql2Y!CTAxhmLP^bxWNoo3eQYl|Mvr=$|A%i`@h{&p8R9_A?@p~ltt6OR8hkRm
zxZxeo*U&qv?qsOyaPhAkj*g{W>z+SQhPbx#o1t5DT2w@K=f}QtK8IBpyK6_ZdG{mV
zOu|t;sf7-wz9^+LzF#emFNv`Jw#3@tKjo*p=+*XP)ifkJ{<0GOJ_MaYC0^gyxp`L3
zyR(<ye%m$(2NWsR7th-|*=-%-ow%U9TaF_Lidc}o$s%NkyMw*<KXQv+X2`@oHR5!<
z?0U}6IS9MmygD{KrPur!^}0$@Oy=R=mfGKk5KdM2{*^6)r0gqI%x%MV?Cy#Hz(5TZ
zY>NwY(NRyiP^=Y|`F)!uaPwjgVU?cnJU~7yfl4{NEv~1>CH5QCM}dXmyZ0TQZPrn?
zp+DPJ0_B+q6DiQ`okd*2r*A%xe<8hsr1c><+fAA=zm&v_&=54xmvEx1boo8Hf{^T@
zDdj6^tPv$F&$my}3E>c;9=!4NS!;xz!U6o&Ara>w3h{2QC140xr;g$_rqaYNKCyZG
z3*`>t7vC~fG0k-qe7XL~d5Ue^M!E=;+q^Z+x7~&PWVwgk=Z%-`{(LzjEo1q6w7;h+
zc4#P~RPegVQ&`u@$=zId{F6QBSeqrRN-)EHc=EBcuGWP1tn!a^GUOFsB;#hZC!bK}
z4`K&if}{%a%-0GoCYs}q4cjXxd3}Lx$9BBYkaeDBA2oHUGQRu9eUc+vI;slF>pH;}
zUzb(U<%eCub`dFiD!HK6wDfrgytWK?2FLaJ3>EsvQ|=@k<K6U`PY4|eP$^I_FX8mP
zK2_Xcf2Ux>0g8UIy6Puw!PzicSyBHMQai1!@PrtLO(^rJY(Me=<WY4hS~F4lwW_wB
z=A;6nG1ZLeL11mNfz>o_5M?16zK_UE9kpu}a}BqFJ1M0<K!#sT#)3da{cw)Xx7+XY
z1%Ep-BPY#nnNzn7Kwi<JBY@E&ThjspXJ0#Gn^VRkX>v;|4*PqZ5h3Bp@hcii#`BK+
zQKg0ceB<a31)D{2);@KYHhfL3GR@bOU|7Y@F6wQ!r8LgEIGygap4KMy5Ce#EmS!7&
zi#Mctmx-G&T7S@*pt9F$umfVWKaAmmYpRi(&%NkwlwW@EZF_G=D;3HUsU`~4P64{x
zCvi{dX+ifq8xk-I?QR5xo<C{=2Yqv5)v}nbzewpQ)Y9skTMPMV9w89PUunMeAlDtO
zs)0DOU(2Qs#rZA`3#0!#_v3Frh4CVf@5W7;xyE}$@@~D;J*5Rl?uG{?HFP~6(<~<T
zqx$~4Y{}|xXr?EfIVC45K-|RN(0+P#N%$*mPE6AH*nE)e(nQD%@7RdU*n9d*Df_ty
z?wOeM>YrZ=By8$ma^#z#BmKF*Vo@_}SKSL*4VoYYlGz7TN3+r5LV+|A)k3AEJMSXW
zqtjVvqdNLDxVWQE`I{fObCEz$ls<V;Z7B`k+=-PW<S$$uPK_}&tMb+f7zIU$q^XP^
zwIxx!#lVOxmM0_5M)Os3{YEtlQ&1}1N4d&s4erRwiR(Ne>J@Ve+c5C`>=|V6^rPNv
zlg~;xMam}V-u2lY3+dmMuP5Y3Tv>o@&Ma+qmCWtfle0-f`)ts9M6tLkisw3Tl+gDm
zXnfSCC-UyEBbommj&Tf%5(VWI`7htz+KdQ-Rt${s31U|Tv0OgN@icX-{~vzppi~sq
zD^yZ*enWeMN_z!l?Jrkr+GZr;7S)4%_Q*GnR4n^?skB#P8lTGEP}7G>Ng$D$l#Kbw
zBi2obU8P9ASOKP%rSlpn(!6LOToQIdJk$oV6Em*u%%(I(OEv)MQ)WHlniVd5=;cN{
zyJt*A`}4j~;86)AGfC!5%e4%Rkd#ELJ_a55vmH;fhL2yA2s(o=iR~goed|#xgdpp$
zm!Uy>g!V+NTiu`X*JQ;9AzSeXexF;?A8ev~&<XxT3ZTlko1al-(P2nBee4U~Z?w-v
z&>rWYY21k?PG2jb$_d=*F0Db*0=3lMTxm(EzUY&sZ1(&j_s}?r66HElca|5(tLwfQ
z=oDf5!jM&v$~^{H5vP+lt0;zn3)>7|aS+9$f72qgi0X|&$6oy*$4!m-h1P&Oy?n`M
zCb2bSSImOwKH^rS<?UR78;AKw*wTaCCbAEoEfo*byOfP>#~7a+h2;A^r;oO3fj-Kt
z_dlUF(`|ET4ZBzpW6)vWTyih492RJH5=d7;;;Q2U?7oP2!y8e+3)(4?{UVZ0{$#|S
zr@9jUgE3qoY%39=hiH3}_S3deKqW?P@Uo4$Kd&GXH!UdM@oJTGV{tPR`vRh8r@}H~
zug7c(IV_AjvH+7KD3DEA1<c{pFLf?Rl#~~2+B<!XIquk<r_tU{!J*e^$c@yto^}sV
zNu{eTbwM~Fv6{eyF_3l#u{xM(oXkgqMiVPMVZ^iNFGi&8s^FDx$9fGUOG~>lzIJQ^
z$GFG)kaUoIg^^;GryH=%5KB++L*s>t@SN?u2XT-Cs-#<#{>0Q)!SkE$Ts-gG^-F-O
z&&~WgroFFA3fY`Y^&OJ$E$e(TjM=qks@gD=Ky&n*#g2k!WI_$O8{L>#s?=u1R*lm}
z@7pyy<DUr&m)M;RE=8{Ofx#E0@DfBoW-S6T6ARax5$Qzn11XuEx5FPX#6i*4DmN0Q
zyjW-g?M>hw#Z&MjUx3?VeD1a()D{mN2i;-;Fi5j&fEPB-g9p<QX;Xn|Xu_2|iZ@x6
zf`RFWzYM{ho4u~akuE(msM;!mPB7P%CFc-Zl0dQ_nJ<Q4r^=4{pNeu%PUVx%@Az6E
z)*2?mj}IE<v9=RylarIi83woOpWi$a!XX<JRfIt9V+B4m{3wZwar2B=Oy;WPIfz>C
zk3XD{U*&NQ9Icp!M``7)mRePYjIh_hltfRUOFInRaTD?Du<S^11!nE3ZNr3|p0R5n
z8HNp^^3_+-xVUKhgz=B1V|H?i_a7IS+(lKB*;GpV&$^9zQ20v_lAH?9U`K13BC2{0
zWOrf~q!JD|_~1LzjDxIy(b+BP6NnYDRBG=jqENn5m00(U#9N=7O+JR^H?-v&Jpl)B
z!Rlu<ro1Kr`d8uAymh#~D76w%muv=S%*N(PIhn?NIkTF4U{SV{MJ}47JRBYEI@&z*
z!KONd@_p@49iUKK!J*h~G<h2?{~iQ3#0DPVFsJgJlI=>~s_wHf*3K$W_NMO%8_n_s
zVz4vd%L%cP7S%h(mcdA#Az>bAmj112<Gwp<;LHs&hIqrir0TrQc$GwhFN+E!)}OMA
z8@lnhG!LndlvIBy72R@G-!NaZ-E?BUYI_i|QO415O;K6~IMbECwPh9f=uPJvtNKX4
zH}_#R7E?+MsGMXH!9rgWKH$BH(n`a&Jn~SAiBfb%k&CW}|4iG?{yS|e*PxPYIFp<o
zPo9Az;im;tTvaj@1NOzGm>;`x`C%|g5`R#sHj8*ky*}cZSK;`$rZK`c^-HU=X7_Bv
z*dCjCBT4qJ^26Jzx*6I`CZZRAo6PnAv3s3`OJnPDNx`18Y#M`S@3&~iu7ukTgutF5
zJg^D5Hz8L&u$39(E*-c};bCw|S9x1NMdhVDU5&k-YOn0AP&Mhc*6R;GB(o&_p8eFx
zA*;v|h(Y6szgXjvjHD_CN-jX?{o~CL*@?-7b<9@_SZW`1Jnr@M_Y(eI25lx?(EolG
zrY&8Azf#7Amy{9(ZkCNB{M(&{C(%zQ##N^_#<~~|&EGDbH)ms6E9%=q1O^%#<yVaL
zbi^#}3dWg7rh(pLR$fQ-W(Cz43>CT1%TC&s{Xd!@mfxwtY-73i)k*<iL-E)OY!=<t
zMm;@!^YlPMe&Z(&05^OjRYh4L9(NFYdlL_Hf8L!j`BEN{PBB*qI-WD4WKi9;h!izg
zo5I9B<D?l3y@dzFs{X5yJoqwD`|?*qP9fpH8ho%N3{GAlW8WA-I)mP@?kPzgE7lHO
zrWYn#)id+Dl70=Zy9o67SA%C^A{K{tS$R*J^{*yq9`p1d>;uGl_ep<;tsx*jZiaZK
z<|~+oYjxMsd)vaE%4lQaA;$7Q^VNAiB=d$+<~({*gER1%=~*>g@Q`@96m5){!{bM5
zTGEe22fup9YTo`w?zsp-zhE;<L2)mLX*C95pQ5=E*T#P)&P=$eJ1Z!%dG=Y=4KOpg
zu|blYA^M9Upn5G)+5}uEE&Tv0Y8K$wv1=YML6L3iK?7~vGb}RZcJh;A5-pJB@oEZt
zl=-ns3eE$$m}-poTFY!Ya8)2rf{0mu8XeD)x^PTs-<>q1*0}|KCg$hWZYhqGIOXdT
z?h}$<YxTMoI)l_7w&^!sNN)>y)U{i=1b;A_F0iTHHIQ18lc97ZjT^;2$r>~lMeEHJ
zJRJ*;N_IhzOv@RMqX5FJU+dxFMN`v)VE{rNVLRK+tXc)!yZ7krG0tLbWAC6s!QE4B
zzz)!oq-z_F8nr_6s6|!y#e={%CMHT)mPfb>0}s(P;Z7y|(_yJ$sgZI6tncS5TPQ^;
z+{bMw-&9q;xEc0dFAnu`iFn#EwglQice4cPZ}<n<BSInq=~(OlS!n<uuz!$(8dX42
zsSc@S82vdby$BKC>q)Y=Td-Ieb>ez)NgqneC;XX)N}df;!k61%#Gz+9e643}_eJ_r
zmYdL!5;(X1j@iB7QDJ<(lL>ETADrHuTYrsge>><v^X*Zi;o*9Phwa{7J*2`Hf%Qeo
zu#NoJ4(_UOb16J9?#h_0fph_3?oQm(RMYD{Kh(cE^?C$abg{tGGGFaJ(`v1wVpmuh
za4*CBzBVuS{5~d8i0Y@1g_oY1?7_iqlgZ=j*7O~=?WA+95lTTChQZO#fk>hHQ`(O{
ziO?d^n-yeun6$2!EdCOIq1~mx*kK~KDGQ}jMKQ?t$<vFdRGP!@cRwv~sf>e>^%N|J
zcf<}vo-a*?L9f;v)XDG&Mh&CE%Nw49O=SW=mxdYb?^f_@RxD%bj44fNSSLDmNV_O@
zT(2+rfI+e?B<GH|nB`*YNe|GylYk5?Bgk=$(Oi#CP9804+#RodJR49qWhGcQLMCWU
zxP8f-{2SU8Cg=Bc6w;EEV@$zR&Y`%t3KCszlS)2POCuo$L3?P}`Af`#%8OLPRZVyU
zj%d%7mU)JX;AxoN^MS?(>pm=31uIO-bKF^`zXg_7UL_D!Q%NLCMUB63^BX=e*_7^2
z{;Vbhi>W5X1DbsJA0SX^X_P8&_ny8qS@)hYZc*$rAxtrw85A{HLrcxR4W^@nwj37+
zWWe5_|2Q~~{rNdIZejPHOn03vMA$FAm{JFkUL}vl)5vV`QI&@mD#C;Bc_NbVsO%Zq
zb9uCf3ZiI_q7_a!a5A((3;TQewryHEt=O)RsCfYTM^Tr!H4NY!wZf-qlpOHyzdrt3
zBWKF+>pi5?Gz&eSj<&M#`#sf4*V>1$_lJLHQ<J9vT1)j}x6w~i6hVEFHsl;!LMUY;
z{iSZBB^-~EHV}|snG@Y3S%`sr$Ue57D`-t<JjreM7wM%M{N?ZN_4B^B`nu}U(q!ts
z32*OncemvywnfHVaY5T)rGm%aZ!%eo9lux_-?B|k3zqKX+s&gzE4ol=4E5Dix-pRa
zhL*voJ3qh<F|y9ljLmIcx&SO_+q4SE-`H)M)e2dJh!=*SBSq27pgxGU+oN#>^R|P)
z8AWt@rMEv2&QDLDzcD(GP60Cf(1GccIOyozxu3laugnj5o9iKabkM<p`t)J;4C~jn
z)385UDXnsA!rY(PQBZm5&qkL{HvfPDcwipSoQca2U(v>Wxbe-a-b$p|MY?fZXHX?S
zSc4AXWOn)Sx=>a>>iE8Bq^ODY?bgI4VKa?EdMA1}ijp$!0$LjQq~_S_y5v(U4)fTu
zqXWxYCVo}w<PCoiRrz2;6oYKvh{E{6n{jjVs<tH#?Z#{V>BI(C+4trd->L#OC`=5m
z+Xfym)eRuR>YcCr)q#g@M~INovLh%}Y-6JlFcq#m`<3Rke<ysSr;XxB04L9WN@aP!
z*2?ipga?;sR&Qs72~rS(m0)Qf+un(pYDCVi>LK`5o*uV*@TIK9yh=F=mZWDI(50)b
z5wFiT6Y6*V4*fy$gUD-9HG`-HmuNp%nS#(3s$>OQk8$t(^h-UbcqJ84H_p#r$tfs?
zsL8e{jyy^6(KXZbQ6ew{m3yom$<<|TdXq{FqZyvK;Z=6ta!=9F2|{l4I;-d5Su^$p
z?q+2n`AMH*XQY_tJ<;)JQ;wY?Pd5g{*ucs=6}st#kmwMfChZx#y4lgIA$55&(33Gh
zFE|#1zMA!Y9pQ+mhCq0<|JyfLW=AO~4tS>1twPdZ9)**X`tCwhPh<R{Thiqexow&T
z0}qcruIgRWd(dN2!tNN%3^q+B`sZJil}{`Qh?59N@MSOm7l+?jAjKnOzJO!l=#Eia
zHkrh&<LpG}RFF}H&$7x;HMw?TbZXwLAW|N7T}|)ZJE%(R{^6-u(=Sq3jJW@h2pxyD
z#DDYg!+w9}Qc?QbC=u>IAHo0C#9|4f{#&{xkAnBUK=+sPv_FxpqxK6W0yW>63yw9~
zRsl%YazrtSS?_OXV2m@izYv{CGNQy>N{>%!-xivgZ}>{3Z?}EIMgN3e$hwV_qQ8S3
zRljuXG05PXy=SY~Gv|8b$G^7F$^BhFthAOHHv*<HUjblRo_|&TW5%`0EnfBf`b>V^
z$aosun+LYJ@&}c~Bdn`h^rW0(6=YO&G=`<H7QR)XJ!pR`#E1IQ#PkcJov=}I5HBe0
zs_opGuj3z!>n{Lsx20t?_wNT>xB+~1#{rGu9JP~+Rh7x>cou`Uo|)GP*;<V4s7fCd
zPw)fu5G0vXJ_ad@^JdM%!`_?|YW$)N`rL1PQwA5!M$xMwCIUDB^N=dGMLo=nLg?ql
z^v2?nT2DGpX$DVPns}k?2ElF#v~3Kwh^Q2h;+LfUn$wvOczb7gQWB@7X!YxW9fSn4
zsIwP)n<YXCvFPzsQj406l~R2`Aa7e%aiz;HD;748ip@rjubV{4Hq}6!s1to~H4W?E
zSpu>#+Sj4S8(GFuBMB1{;-(u*1*{7Xe~mV#CtLNp2A`^-bDZPb2jK#&oSzN&Lq&)K
z!&s5_IjSP#2U-;z(4v>04&2S5cXYy0p9wzp(*Pc!5zkdk2-xniY4eU7&Xa7UE1n9l
zuJ5cd2}Qc$zsW3qh>_GKKcPNms*RFktu7CZ^Y@zyRh=8)C6mB0m)!U${G*B*cN8T*
zn^9Di-MBMsaGsv*p#a=kq;WOOK5+JYi;|WN(bz=*gp1e!^_tTn*&^PfZ$QFty0;Tr
zVV@R}X-+#Ut_GfG#+;ME*X8@>xiG!-l1z-9V)_u*^(l(UHHK9{mY5vllMt93ZSQJc
zAal$y_ebInKYl|iGaWne_@`Q6{+OGz#N+7qa$#%M-pe=3u3y7=+mHQ@g;kKgNblhu
zTIhMldHa@N)^Qe+4I>B$y@sAAE_-%*W>(T+9|Ko_P_2Itdz=7OI8Bt6Fn;O@Iejwz
zNAvGelNxr#5mS0T30kIRx!Km9Q=KF!ZT)L~H`+z-&S?X$P-2B74l4{<m2T+YGdzbl
zAZNAbGQ>J6Y#?8n?5K0mVJahJ6SJFR+^0{_b{of;N!T|Xus=NrSrUFKLVL1$jkDgf
zypv7kDw1prc)w6bNbSAnF>3~I{A{N?U9Y^(Mwp>|W!{j77?AMOZ}N-x`1c9h2GsQ>
zKU4e&7<p726W&|!jsqO}@xefux35KGYiD3o40uWBS-N0Io2Rogy3nrfF5lfHGTOg#
z<NX5j>mP`AHh~TOXkw`K&c>fJ{&fjOM_bMXRdwG~-z`>_Zkm`(87)3MXnO31o78}t
zUo)mbEUL%qIl>SV6^T2<X)SbGx(n*C9qm(A6@masU=zE0v#L&paEI+aC|w;luUKZ$
zw?p$>arT8y1>oBqye|UB@y2rvfDqf#-GUaFIEZSymg~gG2<oz7QnP%hDUdc+85zFq
z#!VwO9VG;y68?#4uBGa2(#dLQfhtdCkErPt1#vI@Vx<0aRyT+NrvifYiA*O-hD_+#
z(gJ|z6h07k1{je!i#R}}XgMAA0t*<&0MKLX(?>;~Iu*7EIy-J|G3RkTIXyW|gin3C
zN&7x`_$LCQIsyW8EKSh9M}FP(0$W;Y5fv41XBjx#)Pq^N>xdFpmXSqZWu@CKb-rv<
zGgL@XoEzYZYi9nqe_pXA^y=Kfcw`D-ge061AChGj4)41vqgjBTenU9k;>jPlj3ZSS
zu2#OJtjN7EXlrJEk|SB`lXg=Cyj}WnqAAvN*hR|O87*Fa*yZq}#s9+PvZ6(Z`Hw>i
zSK!C@L@^F`PTxn43t}KZr-c9xQ-3Od+oQK@@T{jpd)C_tAN0CtFqInbo7T6kCkNnJ
zf6mw7N#{n%T$Yora{oILTK;OK@uyMet<Wv(uVbr@p7laRa1y4+$C!RK1&IFdr&4`3
zVV_+b01~`xJ6$dG{c{bV1)qge*SnpKeLc^|tA8%W5VaV&zfSPKF6O7#E1JLVhsU3*
znpx<DSO@;civN0THWJZgw8v$0v7J($_uP}CS?>|0IS2`sBpW=j_(8n?jc8WMs<N*?
zhU_pcmC4=u^B&447$Yv&<%2+`50YRrs=surik2>FX>#y)wD@Ga)9Ob@QO~`!EG=r!
zO&WQ>dK!GtZhed%Njr@qF&VKQY7{%bTC-d49g0)I-}#m8y~Yg{1`Pt1-PHOk1dC-Z
zbK_Nrz*6j*7PYd%(P**GYe9j+NjiA~Dvp!05p9Wj3VS&WxFJl!pFTzU21Q@txp|qF
zDf_qE<V2w$Pha-coG6$#bTVLcw-fT^p!Kri>}+*!;e0=*Z{L=DJyr1}zv%>gnpb%m
z*)pp)08Xz`c+b^G^^Gi=M^gA35V|%#TC}{(_wS{YG({1fqH1-=`P%?5>to@QI+`jS
zL(^}56fOZv+z*!+XaXyYa}H`lW#F@L9wfl1ZeWPlJCJMeydx;k^@wUu?{Gu<r)`~&
zg{gtB*W_!8%H=dtc%Wtk;QyunwOsi{gS*tLoy#Y+`PP{NEae5hi+*TSIdrkK|IP8*
z2@4Zf6Di{GVbk1ggXk>Cp7BU(9^O_c7xG7Y8cD~ZXPW03msTr{F}XyGuKUb1yr29o
zL!G-9rn)5y<@C#?o@Jo9B3z{tbUv%}=<h;_oQs5RZeA*0$yBSD>d^3%$lR9n5UJVQ
zq1-KSX@IJlc2-R_3OWzXyAc-C?1&Sw^(j3~$j`p`@h1E*>ccOnJKoR`Dg=ZQ{kjvL
ze$C8Wj^a0}sG(+Z(^|>F&=C9A=-l5&|Ht{Hcgyw)`c)%*&(|=S|2-U4c&A)-4wW!I
zK&t=D%q}w-%;Fc*_8OX03-Eg>ef9Tp6&6tZ$otH_7YPY7Z1aT0CFL>Xax!AOC&7gO
zc!l{NS5a-Dnx0)QYAHr^{eSKHmjAxKKkm-p>}}PDnyG{B^Wkh9-cZ?YHGS@;&_uQw
z!s2Sw0!27y#PN$OMd*G*^X$+vy^M?_e+9iHuBD?U!i7qDlRpj`_#`Z<phv4OlXPqc
zwO%6_CWXAO2_qoTF#B(r$lswUkC|;e?Jf)C7wsw&kCJP})jYAcuqcopcLljTzltvI
zC)HMLmvrog>X@$i+CDLyC#nvUwhTk_Y?7cFpci8up%PA3V9wlnOloue<vv4xR!{%c
zXp+63xfgFD_t&=81m~d40H}LG?ZR?V$F8ofX&%@XM{0p6Iwqc{53P4Z;!zGgeb(F6
zxY1e#Q6vl7eX&UcPJ+TTd~SC%NhO^N8P-?KGVXUjh3nH!wNJ^@zQ+bnD6Z`6*`5*6
zrx<7zmmk4DHZedO(Dl&?d`2~Z@%t=XziSA6`nv)ECVfDi-jKeEcfGj4Vp#!q>ZVXc
zIXd+Q_GcH+I0^7r?UPcRvU1-x0e2#i-5oy{cDt0mZ7CHsu{Pe)AQBZA-&qz3V-u@&
z6YR${1$Gt*%h<!(#9v!@FV(CDc??Z-k-hRex=m<Q4gT>>3F$dq!je|vvHaQ`dKmMV
z@~_^kS~t#rkCz?;HlE(mc-ni>F8$eCc$knEz@>S!bopwS3AEG{Gk4x*{_W{sz0CGm
zSf_z0(Bm>y4PMp5_JDz`1sV*&zj}cdJEoCDou2-RuHosP4jWgZM{_5VZGZMEEHJ<M
z`L5`^ZBHvv8P?|Xq6X<P5QwwDEamq{uj(8^?0!sabb8QtZZ|jGv-$FA|CB50N?=C|
z0|&ofY4t{7>z>cBVn!0-j)V48qm50`0H+q4P_06*0=79GNu4lrxYp@ZZA6{$fVLcq
zvg|(vvho0^&7rh3h3B*K+}z6aWLyKU-Ay;{4{xvPlbeQh_-n=VtDI(<QZJu~hG3))
z$kCVeQDvrmi+qQ@>7BHWdT(qdQth{2*2614UuggA&~~fs#PI(a1p+vQG8YtSQ_{}(
ztf;H_kp9Si_n9|7X#zvgk|Bt!n|!VBlC8rc-g}5em~<~Am@$4=!>O2e=DPyh?%E^Z
z8Gm8DdC7O!Xn9tQEyS)=W@lyHH!pbdj8NnOE{(!+<U6#32MIG<D84+ydAvI60YV97
z|4(?=0|I=P25cSPc@8cutxk|tiJ!f>5&YCw$yI5PjGC2G&%VurDZR|H<7`L<D?d9S
z$&PxdpUh<TQDhUfpQJ7(dv$@~DC(;(EV`;}q|53oq-tDos?`Tf;A_a+k+xE`Iq)o+
zEW3&ox>0gOoIGqR58&4H05X+Fa@8CXKKBIuXbTHay*XAqXk;6m{Q~GwGEa*TUMn?A
z%6Si79C*~7+0?QYnZzrDVzv{eHgs`XZ*5H@mi1;k=o%-dGToZfmeYPi^I!rD_%0+$
zscSAWx4g9|$xXJ|Egyx6iVLigB(I`3Klj>_8!JDdHJ2$?Un>o^{(v$1@^1e4=5(U+
z@??7pkY{KB&oJaYy7utJ!DF+t*#&`S<rK|Txe0;u*}RTIIkr^=d1cLV`U*I>6iZ5c
z{iVrIYid;5T?Tx;Hr$*IIT}q3c4$eOgk$$ebzSq{cKd0HjgLrrcsaSC(>xK*Yt)z!
z(ADgww~yiUdYsvO-n^O3Tv!#mtz9)n7Ks2ys=of|W_#m!54Z(TsAgXvYP=dfi@AAw
z7Jr3xW))T!Ug@$%m{S_Nl%>BCM6A&>#kS)=mG4GEiSh{CG}{^?`bIYzHXSIg5d75@
zw(vSfUScTk=^%=Aj0)Ky*{FUj!w0uXA3j=$Y!aiVjf}x8cbmRVKi4bW-I{LTzIyWQ
zVj>v^qu!2O?czQaXJ@l1ua;1t<VfE-a<(({jg41DdqmIZ^GmJIUR<k7uEcJtRZF3P
z%{x4!&v`j~8~Q7Wo;O;|VT7ij4Q30fpSkE|lnhNSs0hzYEseCu+O}9*#1q7QqJ&%c
zRbU;^e<;s7a{ZX9!t?t6NbEW&OSebP7EmCtWlN{1q|+&HtoeX@2pH7A=}1K-`y1Me
z=h5>S#Z@9C@!7k6l@^J8<fW-U=3iSj3>-Qvt$-Ji&KrH_)p~|Qh644wd&?=X`du5@
z#_S|8-}KD#MqBs*X5U6AKixTbw4XJhSZrHW${l0TWaApRxES1Tz!=LHD?}JHA##&4
zeLVsI?#`nUt%7Rg@wB@Jf^!rmCX3ksG;7h}uMs}<l?_qUQ^$<h2_E9B98r<U8SzVK
z<OXs$8{IU1Ri-rt4ozZNTCjerrq=vc0R^o<D|7PHA1BLJ*It<0C2@`Rp#GxEa}jEG
zM8lW^VSz|H(|aH{6nvnjAf`cedf78i5izf0TV2(NDsvlQQ|N*}NF$g!wTfb3IalmE
znB;eWm`xng^A#MQ;%X|&_G0CmcQ14Cx3!HqZ{sq@h+KvU0VvM3;Oek?E!bQ^dO1r7
z<wzj%>8i8c7X!RQBZy21#0_575S`ZI@fcFVj~?%}$wYl>CEOIg);6k!&5@O0Id{?U
zs^sl}iUXF-p6%|eW=jKj(pHw4Kp2Tpk1!WY3lGcmGjp6VwgDt+OdHwJm6+i;{;a|t
z3EL(|ia)tj^Qxa-7(>;o;7k1Y+?JAF`JG@62lT0kj-E?PLb)461zx4(%W5C9x#dU!
z*OoUhnX<se8Qeu;#ra2kcW4^n@9eC~58D$_sH&^4mG8}*6*}`R@O=5bsF!Tp2w@@(
zYq!yzosLp5GGJ<0E*31Vdz%Sf>x~hAmZiTjLa^TSu5E$SEy=#YB;PI4iJaEWRh%A*
zyWbm1<vh4vAi}1pRVSlwckJnv#wf>%J;T!weDoZMhAJ}qU~Ib6Ar>@it2?W?Y+YR)
zzd~=aJw&--PuuiVRT=xa@8T&^XZdr5e@nWqVeg~EbJ!4dqj?-PzZ~oR8ohVZ%EYfv
z-GGaq8Fee~5xa^j#GTQFx-(%jIlNjvNoirD&f^>!LxkST)f~-N;Lx40;s~2Gc1`|+
z-veBkp^y6TeUhA<%etuDRcs>ev~U<@It?lXC|tLNqj7LRZq_Xuuz{Yo6xsdg@x%pV
z8=_QeCg$g7?MrY^FEEO5_$#;xr*L7{m(`2vj#%P(_t`*wN+iDA*i>_ST3(T{v69Ix
z38YcQ(1*KB#J6Eoxo<$o;9Mv=Akmjvh4Vu@P-}(nvL|1pPP%`D+MJA@v3kJysww1T
zd1sH!3MJRwp=sLzP@}eR$geC<7Jg~})_Ze}^C(+ka9rYnOQSctKtx-1R&^kYW6iK7
z??=yy0uT8V?|BaAUDWo}SVjM+NfL#FIWGT2Rh4B-jd^3P8<(dtG<V6w>>=pRUBF9`
z6s?gK*)L4T<Rg@Mx*QWqqlC?JiHN_}GnGXE6L!k<iK?<r2Z&<gHtV?ylI&_e#jBEz
zo!BNYzWxerdg|Dge2{wvj%#acnT*_$;aAP;)K~yC8U)DP25wH0aaqXWi&C>JucPgp
zUvToio9A!fcVkw(6NC8gEOi1}$TF8Fxx>Pug-zgL;ZQGs1CNF1+~)mf4p(>g%2#{X
z9)4%Ns-9cp2y^zR<~`<cq}E+X!B<0Day4W3!jiOZ{2@j=RXlFtZS>rv?~R)C^~Mp=
zF^P{`<q`7qiP<0{GNT8=qH3`$I4yA7GWVj^Yv1^21rGP8#mwRY0`f)^6x(SOs$5)L
zUbvRK3s&=us5_>(YtSYTY^Mm#&eXlle9v@F9OHBq%*!7Zc>@yzkIXghb6$zOGA7o6
z$CFbMB#rt(>^_@QPd+}O@}3=&&HoD1)Y4ILFSH=WSq_n6bD`~bg^KzK>A3UPj&oE`
zo(iN*!6*Sr1qa1}*CDZF$RMbv8ukUpSmA(DeZ_aGI00IK+dAS~NK>pM)&kj!mH(%@
z^A2kw>lZ&rb45UUF@OltS)_-m2na}%4xtI5htL9qz5;@wg(gUi(rZ9MLKOr-dhboT
zROwAX-5b68th;w#-{1Q@zd!DC^T)|#a^}n=naugl%=vyk{dYG_thxej3A{ZY$N4}Y
z(?DYp#`S%`zI^b??u@);iUR(!InE3BY#;B|0StD|V$@~<9p8MK)%1|6a~O$bxeL=r
zDtlYH>^ebWanFn_rnv==kz_kzVb`gxDkvx&Km4_lJ~eF-h*hannC!ph-w&a=d2_|&
zJJ*^Kv;Qr_GE7$mmj(6aev$fcpmWU7KyRp3Qq;!Vyzj|tUl2fTulT{!t>5Z==6l9p
zEKP<r;&W?!M%22UH7sO7vTOB{P3o+}XKV`^nf~e)cWlrv9_t4t1?LZ54pW-Ua9E(5
z=bA5;kE{+R)H={QPdUFac)~sPiA1VPYE#Ds`bXs^g!rFTlKx!EEr){Y&nj_0T2`jM
zNO?X|Bcsk&3Z+X@K8aV1d>M0uYb7Zx3X9M6XDKf+GlbF`Dksx`c9M<u<(`Ua04Oi6
zqx>!E@ABl8QoP^T=byNDxJA{UzMF>N`9qKNSG6I2{PFie$p5YwE!ypfgrXlHKl{e}
z7M;9&BRSZumYtV~X~L+gs;FKMV--u6%GAheDRW#}W3%IUIFY!W51QWLNcXJVCd=+G
zenKP1b>l!}TfMFBl@p?6)hV%fg)(R1`U_D{S%cGbtD};!c!WT(sx#_P<7+bL|8r&s
zCr-yNAI}R!oATm^dwwbYcvJdVqG^7TGNCN7KGYPz7mc9s8tNsS<=Tg-cc|(2f<u=e
z1y3Ct9|8#3TE}6ZI6O})8xKsjsRANlMSMMxYh3N34=4+NKqh|rZ3+Frc^R;5rNJ8p
zr`B(kqvNZ&T_3XyuQl!hAxuN>20RuBEF><E#=6uOD(ZJi<x0uaY3N9P7LS8b#jtUZ
zbvA9KHFfD^d(hTaVO({U_{dW0Vr)YSTQZ-VfF18pZ@e+98WZ5f1NlK0B3O3B(L8zz
zPpyr8`B}B#i|c@1S>DgyD0}j=cYd;n0lqC$^-|%Kc9vMheD0iVSLp}!{sl(W)TnbK
zi85cuwO<JqwNqE+(J;0NiDrhn!W&`ujtF6P@D5Pf#K$zzev;By&I}1zP$YX<vSy#8
z{%hz+gz9sKA<|1hA6;QAa*qi@J^zV1_#2`A4`6**zhiDX&pSbApqmq9axtYY?@=ff
zkYC|FYu>aXi|6QN>CXIU=|jGoLSDzmM>${}qoc?*dTe_jwFqrL$0CK?ZRN@A$b|N}
z;}}PXDuSe!#i#98h0bU#c6)~aj5LF1#@s~!^T5+Ap9G`&dTd6Yw=k_^Dz>fHo~I;0
zQ~4NpDnOF5`RRo_ZrD&pVShw<irn8_Dr9ltVV|*GY3=;cOosKxhM-?wJh%4ZK)MX=
zh)cw|?_M5I4Kalf|C;sOZCVmCe4JLjEetXmaWT$|EbFxa)4pRU1IZ~M?S#_D)K!I8
zC5Wl@dm6j%w-Ze4#?X9(B}#XhudaU)oK7*QZoPX85|+M5L<*43iUD(?)phMGN}bB)
zAXw+Nnc-CI{^?1fPh<R=xscIT)*bM~kfJ`r$;nC?6~S@LA^VkHqf#$%`4D;vSw1O^
z0KokrhK;rBuO|gwMgzyjqEuuwcHY(G)MYB4EMwbzfL_ziEgI^&>LjQr8NW_3<w+A}
zZt0r#+a5#7t6l|ZAA>tiF3ofvWES3<9NKYPzCKgi?$OGBH(KY|%*g(?QRh_$G1<d*
zKZiNj2@K28(JQ?c0NoyjH`fuu3049P$`Am0lDJbxForCJQ$jmM!t-J>C@~HnSmW#a
zutkd%gMw<D5JcbTIKy9`AvNtZHFDDvQsx7RsqC?U<Q6B2L?}3#a;A%Air3OGX4z-G
zGS=xCH(ht;ZU*GN64`BDWp?KY-M)$QiOp$fs6S6=prwCTAVNDp%86kotYso1D)tl*
zUwu)YHAbJ}d?gY=&?9&?pcByQ*PKZ*t)eBbr6u6zv<a$;v9A)jqui@}_#~KuCx2rV
z=_trB`60HYH{sb34j(fM-LR$KHY;>7zEZSV3KjRJ?TGEN3y<^dkfM>1VRT|h!a?<Y
zUvINC3^7H!^?S&h-ro-3=y;(sxhbIHGM>)IkN-g*eq!1nbnsU~3{ZxjdSXDXu`$Lo
z8zp|C8qy}y2XFmO)mI0!84c;dR+ijJEYk_%F?#Sqi8u#q#PVApZe!zRK?IO*5y_j&
zWb1*IK(pSZBy_ncSYZF{;gE@kU)}wCC#ZD%X12lY!<Npzi#`d}`0oUs+i#wu@4Txd
z38lVtLpbsll6Rgf4#L#_T)H1fK@^GiATv(qRv*Jl@`t^uryUr&ywG;C2%uc*4uWY5
zNY)&xC^>-*ARbZq7_I^k7EEtqk+#yf9@5UrtzZX!IDxlDY;5ta*^VCGXQzvihNSx;
z4Cl)7Yn+0fS@Pz9O^F%&_)N$Mti=3o=sc;LQlLj;?g<45V|pxjBP12&cD%BBOlk9B
zEnG)nWFW6l%o9U-%dvH9T%Ye#?YTni{Vx;7)x47(m*7gvE^(0AxBhB`rbphIrFn(L
z5VrOnS}qFT*2lh-_z0dF#Ve_crwM&`J_swk`n*womReQ_FKjEdARj2ZBLiu&zwuA#
z?sp#d|Eu^P?D@iTt(st{;qL_WG-<p}Uz4Eo8HT^TQx0v#U&ildvtt?UAI*v2ExSF!
zlICFRmJWy0?W4{u=JB=@DKv2shr^AEKF}R==#}3I^aDmllSW3z^^Mh7eN(PY-Y9eu
zBJ*fGoK<yKz>5~XvO?$!@|^2KZdsQmB{j!gqJBJ*`U$Se<q-ADG`BAP!p#4&G6u|H
zXFQ`aMlX4t)20U7<x|_uCp2``wvUJ6tNc|mdDHfXeh;DiJyzxXM`&>|1%D6jFL#Aj
zYL=M;$N(P-L-xYK!aY6~5*m3YExFsewbDDU<VLkR#I(PfG_J|py6;&B=dIsWi3$J4
zB{z)d`O=J6*kv7+8~Oi5((=o}KLL^dN$m5F@aVe&lYHts(ps@7`+R=KqUPYZ@KZHk
z=wD*T(3Z<#`Pb-w!&=aId!sIMl+lenOBO21Pp$FG-e!95zImt81fQ?lH=?v9Z$8a0
zZ|GB_0u9v_#GZ_+O&HYW5(OQc<~B1TCzUd6My7+GdD5K<Gz!s$Dy&FSpXTNQ$kHr)
z@p%yW==zko?gt%O%uzl%#Cx@(CU!BW!e9iDmlITBFyaITW5smpF)RnuGA6l!nywe_
z<L#i&?kxbn&`K~@<&zq(_+Q)<<N)+=%KnU7=L3HA&eyZLbEenQeRMjjIhx+j?zFd`
znzuDbbCG~|UgEKut$#Cb(m(r~iENZM|G%Z#<B9K|ZbJ_~ugm|C>ixT^?|Jmq<KO&E
z_+*d2cmwrsQQR4ZHXJ%vd@71JaYQ_>t&dur(Tdt|hdurXQnzQ`0;?1CH)!ZJ&8v9i
z;bjge>4oG5jLMBUNCYhOntlTb&WAf33hS6Emq^lHqYed)bP+D?sIy6MjGyOhYk5{}
zH2e}<1Hp${o$pVEn|pUPLB6!j3v2-TFcl?rx4Z~E9~k&3vZ3<bbvS5fl)wOeP@bf{
z?U{b;7e6wy>5>(#V{lU2Hr0AyvPJ;c7WI9ZRHeSTDexh^B*|oAboiiL3Ru#sP37pS
zdUL#;NKx+cI^dltdeuNOzOJX(C#y(+*Nsuy1^ZBWJx78D!G*GpUFZOR3}g-ILvdJf
z;H4SFX66^sW9$iA!QnldEvJ`y&J;4%-=0k<EFG(^_~SW>=dXgAF<*5G&TogIe_ZeX
zACjLRFUdi<yK<#=-xH`w>;I~F%HaKr{pn?8$8BXi&n-~lz6dg4mSsHDe94^vu!71z
z+Z=K$o4#LE>+I-y>_unPWufYnNcyU7mP&xf=kiX~Kz{}Kdt~StH2uB#EpNHn56plH
zL@ib0ttT{8YUYh1IoPkscA7p2?g;4~jb*O`wceUMiIvCxook9p7TY*UdF*<EzJF=0
zf(elyD68)T*M6Tgws|Nf*$)D>*2x#_E%BBu;V(?X9(k4R7G!<y+oQzPomxD1BF9Z@
zprH~5$w*)K49uF7wNvM8YeT#Y!KyB6PLzqnYM=A3des6h^z<qt-5*7gBx1b+cI4Vp
zVrUl?CyEQFS8fj)VK$)YPCVf_$yGf<I+4anScX8}oX^7A>cG9~dj+ok>1$Tl9(iO(
zvDsuq+Q_U;6p))5frKmdm@B>LRg|Oe{g&)Z{}%;gGOCo~`9;Xce6;L_d1&B&7U}-0
z==X2){&Y6QRep-1P+=dFOwYh2=HT<URgJnhit+>6O?V38HT!mV5@*>7^@tU(ggF@@
zZbF0&jIUcfS`?CdmefmB59bO;LS{x)ftHO}FRR64%Mjzu(Kbd(!Ztr6`222M7O_+{
zGU~HJ=^+0Xkk8PN)zdM5601^uq0@`yHLY)jBE@!Y&Ks(dqbqNWvanvpf3(pP^!3x(
z$hTrpDZp{PqII+JQpH#yl$HKdknu~ybDZe>Z%qnb--~N=(=q~k=M{HLkDX>zRf5?K
z*Xe`Nnl<0nFZF#R_$>;YHcU*Rp&#6f<v0r?BC^Xp<eKY^@R5!!iX4U?XtABr)#t`D
zg~L@%7*^v2_8*FT{3KEFEfH&lS00)#-8K*0x=jAxZeaY$@3l6lBL430kH5rEr~d5H
z$-KTDn0|$evgVsw2!tu0Tv@jsnD6XbipTmY`4;Ca%?lbBmzZQ{9jb7NMmlXi@>v;F
zBPCjf0|4$f_BgYMO9iA2Ut+dSD8{#n%*C3!oDdD&W}KvfAwdCDSoS!&Hzmwl@ut$6
zB{P#jFF*U{e|b1yj%wW|TYe|J8R5UeaIb~gu;bN*;-`I$^K4X|{L^Wwjwq|KtH+&!
zfxhF0ZXXo}gXQ$T7CDsbSf7OLFFik2lJ_L%!J|`uw4d~&=`dVHVH7KM2|H)2*+(ri
zPi<iR%|SWaOp*rs2sOczT07T|2}5@~YKr^t!Wc{WTb}5mP%V|B{CX8)bPB(uJ|;0E
zC{rm9LY~D<b?ujSf4ViUm1mUSs2=@9TvS)q@$kN%^sYb7keduxHmQpc_UJ)T*)Wo~
zxU}`TpzE!w$yyT(7q<D0gFb=>>a=MB+@Zcmu29E*Q_f#D*s(W~iJE;=3|(X$n~62c
zN0PN35$Fg?T<iQyd22hi-;t-K#UW+7(DL~q{@bQD`dmFGbMz)1Ee$R4-uO)dM9$$f
zVYco{w_AYDi^w4Z`}3tvF?qDvl@s%_3*odIg;z_p&78CRt@?~YtrZK)Bqwl33{fn`
z5=gMc)vGZPwJVQ7WS8zg_-Oqvnx=Q_f$CRioRy3`|6>a(dmi^|lZqvqetd^?4H?Pk
z;}j2XmDdi)q<TibukSP=)yb9p`aSd+mWE<#$~DT;(zlai=pYFoQa(UKYOsnzT><$z
zEkstfUWFogr*Dsogn6Uc2rg0C4LbPGUo-zO<c5F3^ECdZN5uz0-)Xo1L1A)(I&2t&
z5NCTkval|&==HpRnQAUhl!DmoBIY#qP&l!jXs)I=Or0^-Vt8Id_C~OUY^o&(QjGId
zm12p7k}N!6$Vk`tE>A(CG$&U~NU!Rp%W{gWH%i`>ib+J@4`At!z<Dj}c~#J%jM|o9
z+tv&{F<Q(%3(Q1FG8%Wetx?H4{`0qu>>?d==4RvYYkJ*+c#U<X5lLv}l<Tws71f+_
zo}v%Am*tlOJH;6ol{`>Ken}o-yQ*oVnI6v%_gEpm|A^0ivf~{lWVEu%<9Xe%P9eGb
zjNKd8sASG&9U9qe0Y?@T?E&p)&wJ9Fhv8&|gV!8$J}8xlf35(NJaqD!jn-I(vDo%Y
zi7t?yhNy*^qK=y$m70yu#pVQ!q)g8!3}uV3OiSer2yOPkmWEZ{)Uh|ZrAd9;Z~+m=
zoAcj4Slxt1EJb<pn4z@GT`bKwV`lAwyQ4fmx6Ms^2Wr5FAbHtMOKd*(IJV8Gk~uAH
z^XahAUVFg!SqhvP&l=auMMY=V4*1TCcH;3BmnD{B!d?eP+x;8ud>}rH<L!kqV2NCt
ziX?nUh%D1C&{O1Mltn-Qo)9;O=FnG$SlnkDk+q>o@rt0Wr^-_9y*GwNXHEAmi2*l}
zLky4-K3*rDk{3^OZ#S-7S|V6m048r}Z~7x_(iH>~Vgq3Kfkg?;1z_L+z=8C`DW|?C
zoO^Pv<LZfAf~%*lckrl)vJ6?)1GKoAkjt%pw@YR*G5gG`-4`o4n_r4-0$3btq<QP#
zIDfCoVxrR6*|BS+tQ*&;h^Dh^qwT%pJgfP$BgjvF;eYH2!q0yj3c7h&>lp&4osSHr
z?Ox}4$`k$aYV-R&iKzj-7%g3K`ufl&B)sFn)_WqR6WOb<hSW7;uTUL)YW<alAPW11
zlDyDIZ{f-bxQn{A_C27fHwA4m31_jj_(j9(NU+9j>4+VX@E$0+rj1aHRsm0i<iJ@#
zx~1VzLEfg>eW=vP(C}#9G93N@k`{B^zuOvxsWnJP4MaUSv!G*1Pl&x~BgN^n$jO;q
z2pkZxlDbk_rZq-ScUoWZMG^$p>qx1?xV24?Hbj`SW>U%-#tWV#&?S(2<8kSZ37JV!
z=GWUUiFB}%$0`+0u`aDy8B%Z+_~j<jc7518fL<kFq|8RK3dlM-+XD~NdfS!(zZ3LS
zDRs}#>79)%7Cz{6avq;KY%EM&?zR_@erB`pU7A-g8dAdtPC+f+e?+P+<kAw}M{rmZ
zT`TBjpk!7`A>jno*tw=kdn>gjP&&o~tTUG=n}Q0rHUL4rMVn05`SKFBDPZ%o=4*t#
zzi=WJs)PzA_@4DBY94ZeCU)_6-NxZBS3HPvi!FVE)Uo}aVT%JZUrjd7tZWOCAzx8b
z=@Y>o=9(R<tuxGd1Mj+q$B@M}Jx%8*J^o^w<fQnuwiA@dF6AdFAmxUh_aX_NZBfn3
zVe7)&$}~70lbK1-IH4jSk#FN5M%}jr1!2dgCA|48rl&_lEPD}%^5*~Gc=)4=Qg1XR
z#GKrmkoZy9aA;!EvqYqaF=tSO_qm73`b--0`w#j3Tp`TxOLvL+gf>6u3ym*o_w;(*
zykcUX4@2E`_c7nN4O9cV?iBY*W|&iJ(TURyVRR#zCR4{>djknOx|`&mVr?=5STzvA
zqtXmPamZ6x>r*y4Mu5wCf++&)(e687tiRzcSB0@Ms>vd^X_$E}a8|(MZv(qND<c1@
zViz{|vaBMfu&mVUIKEZi?W%{PQw$0uSL@ES99qrplUNcZ`$S?)q}9q;heFV7at>nl
zp5PP=^PAmSYhLUx1Jh|ICo)Z2j@O|*h;GO-6MXV`2ho7m^l9?h<%aBCx*R!#eMS9c
z_%>RGv9CY^sKblD`_?#MCE)UfEf$JtKZe86Ov}{Nw5{v~3XLVhiA~EEB*+(2#kpS3
zuXH<E(ZvL0wm(hDS^}chLOQ}BR?fC1IA;-E_YD6C3@RO{(M<VBQ1*auo-t875I~O-
z9FN`mod8@6&*1Qd-|T&gf)gQw0b3H10a^y_&e7h2m}`UqOW@4AtIVAINmb5T+zn@G
zF)&oGjME1+GD91M_HjZ(@Fs7xjg7y>+444$txZ8T+)P4@_*gXE55g6NQnRIel2Wxz
z)6qX6MKbfAzs0GO{N8oDYUW<Nw;rQEzzK#}bUXzzTaXOpYZwRk!!k5m+h=@YSpyus
zKmnCnym`m=;4)>EQpAt_<X=y*>B(2(b^}^LgBqE>1eZ#9QmRwR;|zK<nQ1o_`h@wC
zCiPDRNow(u=k5u7Cy#hRw=b$TdwW$ryHDY^QNwoi+At>h=%EbhvJdBV4N~b>v({jA
zAym`G11Yk*=^v~;<5jKoWn21<x@>v^o>eCz;)s;{K=@|7%ha%FeFdF};@8mOBVyWa
z;Y-M?zZd+8C}KIyuglET^@QJK4W;JFP(3oz#s+6Lt{?0Lr^;63UV-0A9}uv1Ntsry
z=H6*zCBOV=(^Zvl$xJgh4{yiq_D%29wsCw!_~er4(9pnO)w-}Gc6SN(Hu%^2Gkv>)
zl$1=DL+5c3XYHFjz3+Q<<a*ofK$bfaDQ7ED<k($rsz;KlYJ1IB<92F72KYA!yB3I4
zMNDdqXLI5nj$?Kos?d*Ty=o)(6YaYC2sbNg_7rAkGR9D9r&$1sVsWw+oD~k#f<^md
zRHZ`vWV-C!<7KAqD|NyS$tm{%ZF@`i(A7ce88)Agz-2k<<qO>KLDM_X`tHY>@$#L|
zeSEUB5Xm@u4+Z}72N4g)oC~94mGxxSv}g%}FS5ETpL#U3k?z_)UY-j-WZhYsfhy}6
z+o}|Wi)U21X-uw>dBiQO0rmzI2#u6e8f-JGzfg$P8R0PY+*v18sj{31R%UaJ>Wqj2
zpvraLg_RGYGCU)aYId^WVb2`j^LVjc5y~!QPM@iH65t>tE?4}@SvyMtyUO$B_1r!!
zb)8y;fdi5nX6Bn$So6-*@<hqhGc6N~iP*W@tf?s+*9be;h7G>nf|O%VHr-t-(8$Xr
zct~-@%Ia0{V_J$G8pJ1DYhH19h1QV1zM-nFjyjL6+C&$fJLz5W`=ncxr|eV@Hq{-m
zos*!8Ab|{8xD6@ywU*IYBvD&JcB#Zs0nkQFI#uO!>8laTDi-?JMu(E=!vbdZJTc1q
xF%E!p%uJqdBAyraoJ=GSxYw^LGigFDP|YqOmX_9xK!kiB3if}sAp3plzW|P3^f3Sc

literal 0
HcmV?d00001


From f9485de91f9a1676c66be5e54a0f85fcfb85f3f8 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Sun, 1 Jun 2025 13:26:15 +0300
Subject: [PATCH 132/167] feat: add romanian translated chapter12 content

---
 chapters/rum/_toctree.yml     |  21 ++
 chapters/rum/chapter12/1.mdx  |  93 +++++++++
 chapters/rum/chapter12/2.mdx  | 205 ++++++++++++++++++
 chapters/rum/chapter12/3.mdx  | 199 ++++++++++++++++++
 chapters/rum/chapter12/3a.mdx | 197 ++++++++++++++++++
 chapters/rum/chapter12/4.mdx  | 233 +++++++++++++++++++++
 chapters/rum/chapter12/5.mdx  | 238 +++++++++++++++++++++
 chapters/rum/chapter12/6.mdx  | 379 ++++++++++++++++++++++++++++++++++
 chapters/rum/chapter12/7.mdx  |  18 ++
 9 files changed, 1583 insertions(+)
 create mode 100644 chapters/rum/chapter12/1.mdx
 create mode 100644 chapters/rum/chapter12/2.mdx
 create mode 100644 chapters/rum/chapter12/3.mdx
 create mode 100644 chapters/rum/chapter12/3a.mdx
 create mode 100644 chapters/rum/chapter12/4.mdx
 create mode 100644 chapters/rum/chapter12/5.mdx
 create mode 100644 chapters/rum/chapter12/6.mdx
 create mode 100644 chapters/rum/chapter12/7.mdx

diff --git a/chapters/rum/_toctree.yml b/chapters/rum/_toctree.yml
index 25730606c..2346836c6 100644
--- a/chapters/rum/_toctree.yml
+++ b/chapters/rum/_toctree.yml
@@ -26,3 +26,24 @@
   - local: chapter1/10
     title: Quiz de final de capitol
     quiz: 1
+
+- title: 12. Construiește Modele de Raționament
+  subtitle: Învață cum să construiești modele de raționament precum DeepSeek R1
+  new: true
+  sections:
+  - local: chapter12/1
+    title: Introducere
+  - local: chapter12/2
+    title: Învățarea prin Întărire pe LLM-uri
+  - local: chapter12/3
+    title: Momentul Aha în Lucrarea DeepSeek R1
+  - local: chapter12/3a
+    title: Înțelegerea Avansată a GRPO în DeepSeekMath
+  - local: chapter12/4
+    title: Implementarea GRPO în TRL
+  - local: chapter12/5
+    title: Exercițiu Practic pentru Ajustarea Fină a unui Model cu GRPO
+  - local: chapter12/6
+    title: Exercițiu Practic cu Unsloth
+  - local: chapter12/7
+    title: În curând...
diff --git a/chapters/rum/chapter12/1.mdx b/chapters/rum/chapter12/1.mdx
new file mode 100644
index 000000000..4dbae17fa
--- /dev/null
+++ b/chapters/rum/chapter12/1.mdx
@@ -0,0 +1,93 @@
+# Open R1 pentru Studenți
+
+Bun venit într-o călătorie captivantă în lumea AI-ului open-source cu învățarea prin întărire! Acest capitol este conceput pentru a ajuta studenții să înțeleagă învățarea prin întărire și rolul acesteia în LLM-uri.
+
+De asemenea, vom explora [Open R1](https://github.com/huggingface/open-r1), un proiect comunitar revoluționar care face AI-ul avansat accesibil pentru toată lumea. În mod specific, acest curs este pentru a ajuta studenții și cursanții să folosească și să contribuie la [Open R1](https://github.com/huggingface/open-r1).
+
+## Ce Vei Învăța
+
+În acest capitol, vom descompune concepte complexe în părți ușor de înțeles și îți vom arăta cum poți fi parte din acest proiect captivant de a face LLM-urile să raționeze asupra problemelor complexe.
+
+LLM-urile au demonstrat performanțe excelente pe multe sarcini generative. Cu toate acestea, până recent, au avut dificultăți cu problemele complexe care necesită raționament. De exemplu, le este greu să se descurce cu puzzle-uri sau probleme de matematică care necesită mai mulți pași de raționament.
+
+Open R1 este un proiect care își propune să facă LLM-urile să raționeze asupra problemelor complexe. Face acest lucru folosind învățarea prin întărire pentru a încuraja LLM-urile să 'gândească' și să raționeze.
+
+În termeni simpli, modelul este antrenat să genereze gânduri precum și rezultate, și să structureze aceste gânduri și rezultate astfel încât să poată fi gestionate separat de către utilizator.
+
+Să aruncăm o privire la un exemplu. Dacă ne-am dat nouă înșine sarcina de a rezolva următoarea problemă, am putea gândi astfel:
+
+```sh
+Problemă: "Am 3 mere și 2 portocale. Câte bucăți de fructe am în total?"
+
+Gând: "Trebuie să adun numărul de mere și portocale pentru a obține numărul total de bucăți de fructe."
+
+Răspuns: "5"
+```
+
+Putem apoi să structurăm acest gând și răspuns astfel încât să poată fi gestionate separat de către utilizator. Pentru sarcinile de raționament, LLM-urile pot fi antrenate să genereze gânduri și răspunsuri în următorul format:
+
+```sh
+<think>Trebuie să adun numărul de mere și portocale pentru a obține numărul total de bucăți de fructe.</think>
+5
+```
+
+Ca utilizator, putem apoi să extragem gândul și răspunsul din rezultatul modelului și să le folosim pentru a rezolva problema.
+
+## De Ce Este Important Pentru Studenți
+
+Ca student, înțelegerea Open R1 și a rolului învățării prin întărire în LLM-uri este valoroasă pentru că:
+- Îți arată cum se dezvoltă AI-ul de ultimă generație
+- Îți oferă oportunități practice de a învăța și contribui
+- Te ajută să înțelegi înspre unde se îndreaptă tehnologia AI
+- Îți deschide uși către viitoare oportunități de carieră în AI
+
+## Prezentarea Capitolului
+
+Acest capitol este împărțit în patru secțiuni, fiecare concentrându-se pe un aspect diferit al Open R1:
+
+### 1️⃣ Introducere în Învățarea prin Întărire și rolul acesteia în LLM-uri
+Vom explora elementele de bază ale Învățării prin Întărire (RL) și rolul acesteia în antrenarea LLM-urilor.
+- Ce este RL?
+- Cum este folosit RL în LLM-uri?
+- Ce este DeepSeek R1?
+- Care sunt inovațiile cheie ale DeepSeek R1?
+
+### 2️⃣ Înțelegerea Lucrării DeepSeek R1
+Vom descompune lucrarea de cercetare care a inspirat [Open R1](https://huggingface.co/open-r1):
+- Inovații și descoperiri cheie
+- Procesul de antrenare și arhitectura
+- Rezultate și semnificația lor
+
+### 3️⃣ Implementarea GRPO în TRL
+Vom deveni practici cu exemple de cod:
+- Cum să folosești biblioteca Transformer Reinforcement Learning (TRL)
+- Configurarea antrenamentului GRPO
+
+### 4️⃣ Caz de utilizare practic pentru alinierea unui model
+Vom privi un caz de utilizare practic pentru alinierea unui model folosind Open R1.
+- Cum să antrenezi un model folosind GRPO în TRL
+- Să-ți partajezi modelul pe [Hugging Face Hub](https://huggingface.co/models)
+
+## Cerințe Prealabile
+
+Pentru a obține cel mai mult din acest capitol, este util să ai:
+- Înțelegere solidă a programării Python
+- Familiaritate cu conceptele de machine learning
+- Interes pentru AI și modelele de limbaj
+
+Nu-ți face griji dacă îți lipsesc unele dintre acestea – vom explica conceptele cheie pe măsură ce mergem! 🚀
+
+<Tip>
+
+Dacă nu ai toate cerințele prealabile, consultă acest [curs](/course/chapter1/1) de la unitățile 1 la 11
+
+</Tip>
+
+## Cum să Folosești Acest Capitol
+
+1. **Citește Secvențial**: Secțiunile se construiesc una pe alta, așa că este mai bine să le citești în ordine
+2. **Partajează Notițe**: Scrie conceptele cheie și întrebările și discută-le cu comunitatea în [Discord](https://discord.gg/F3vZujJH)
+3. **Încearcă Codul**: Când ajungem la exemplele practice, încearcă-le singur
+4. **Alătură-te Comunității**: Folosește resursele pe care le oferim pentru a te conecta cu alți cursanți
+
+Să începem explorarea Open R1 și să descoperim cum poți fi parte din a face AI-ul mai accesibil pentru toată lumea! 🚀 
\ No newline at end of file
diff --git a/chapters/rum/chapter12/2.mdx b/chapters/rum/chapter12/2.mdx
new file mode 100644
index 000000000..30be83755
--- /dev/null
+++ b/chapters/rum/chapter12/2.mdx
@@ -0,0 +1,205 @@
+# Introducere în Învățarea prin Întărire și rolul acesteia în LLM-uri
+
+Bun venit la prima pagină!
+
+Vom începe călătoria noastră în lumea captivantă a Învățării prin Întărire (RL) și vom descoperi cum aceasta revoluționează modul în care antrenăm Modelele de Limbaj precum cele pe care le-ai putea folosi în fiecare zi.
+
+<Tip>
+
+În acest capitol, ne concentrăm pe învățarea prin întărire pentru modelele de limbaj. Cu toate acestea, învățarea prin întărire este un domeniu larg cu multe aplicații dincolo de modelele de limbaj. Dacă ești interesat să înveți mai multe despre învățarea prin întărire, ar trebui să consulți [Cursul de Învățare prin Întărire Profundă](https://huggingface.co/courses/deep-rl-course/en/unit1/introduction).
+
+</Tip>
+
+Această pagină îți va oferi o introducere prietenoasă și clară în RL, chiar dacă nu ai întâlnit-o niciodată înainte. Vom descompune ideile principale și vom vedea de ce RL devine atât de important în domeniul Modelelor Mari de Limbaj (LLM-uri).
+
+## Ce este Învățarea prin Întărire (RL)?
+
+Imaginează-ți că antrenezi un câine. Vrei să-l înveți să stea. Ai putea spune "Stai!" și apoi, dacă câinele stă, îi dai o recompensă și îl lauzi. Dacă nu stă, ai putea să-l ghidezi blând sau doar să încerci din nou. De-a lungul timpului, câinele învață să asocieze statul cu recompensa pozitivă (recompensa și lauda) și este mai probabil să stea când spui "Stai!" din nou. În învățarea prin întărire, ne referim la acest feedback ca **recompensă**.
+
+Aceasta, pe scurt, este ideea de bază din spatele Învățării prin Întărire! În loc de un câine, avem un **model de limbaj** (în învățarea prin întărire, îl numim **agent**), și în loc de tine, avem **mediul** care oferă feedback.
+
+![RL terms Process](https://huggingface.co/reasoning-course/images/resolve/main/grpo/3.jpg)
+
+Să descompunem elementele cheie ale RL:
+
+### Agent
+
+Acesta este cel care învață. În exemplul cu câinele, câinele este agentul. În contextul LLM-urilor, LLM-ul însuși devine agentul pe care vrem să-l antrenăm. Agentul este cel care ia decizii și învață din mediu și din recompensele sale.
+
+### Mediu
+
+Acesta este lumea în care trăiește și interacționează agentul. Pentru câine, mediul este casa ta și tu. Pentru un LLM, mediul este puțin mai abstract – ar putea fi utilizatorii cu care interacționează, sau un scenariu simulat pe care îl configurăm pentru el. Mediul oferă feedback agentului.
+
+### Acțiune
+
+Acestea sunt alegerile pe care agentul le poate face în mediu. Acțiunile câinelui sunt lucruri precum "stai", "ridică-te", "latră", etc. Pentru un LLM, acțiunile ar putea fi generarea de cuvinte într-o propoziție, alegerea ce răspuns să dea la o întrebare, sau deciderea cum să răspundă într-o conversație.
+
+### Recompensă
+
+Acesta este feedback-ul pe care mediul îl oferă agentului după ce acesta întreprinde o acțiune. Recompensele sunt de obicei numere.
+
+**Recompensele pozitive** sunt ca recompensele și laudele – îi spun agentului "bună treabă, ai făcut ceva corect!".
+
+**Recompensele negative** (sau penalitățile) sunt ca un "nu" blând – îi spun agentului "nu a fost tocmai corect, încearcă altceva". Pentru câine, recompensa este răsplata.
+
+Pentru un LLM, recompensele sunt concepute să reflecte cât de bine se descurcă LLM-ul la o sarcină specifică – poate fi cât de util, adevărat sau inofensiv este răspunsul său.
+
+### Politică
+
+Aceasta este strategia agentului pentru alegerea acțiunilor. Este ca înțelegerea câinelui despre ce ar trebui să facă când spui "Stai!". În RL, politica este ceea ce încercăm cu adevărat să învățăm și să îmbunătățim. Este un set de reguli sau o funcție care îi spune agentului ce acțiune să întreprindă în diferite situații. Inițial, politica ar putea fi aleatorie, dar pe măsură ce agentul învață, politica devine mai bună la alegerea acțiunilor care duc la recompense mai mari.
+
+## Procesul RL: Încercări și Erori
+
+![RL Process](https://huggingface.co/reasoning-course/images/resolve/main/grpo/1.jpg)
+
+Învățarea prin Întărire se întâmplă printr-un proces de încercări și erori:
+
+| Pas | Proces | Descriere |
+|------|---------|-------------|
+| 1. Observație | Agentul observă mediul | Agentul preia informații despre starea sa actuală și împrejurimile |
+| 2. Acțiune | Agentul întreprinde o acțiune bazată pe politica sa actuală | Folosind strategia sa învățată (politica), agentul decide ce să facă în continuare |
+| 3. Feedback | Mediul îi oferă agentului o recompensă | Agentul primește feedback despre cât de bună sau rea a fost acțiunea sa |
+| 4. Învățare | Agentul își actualizează politica bazată pe recompensă | Agentul își ajustează strategia - întărind acțiunile care au dus la recompense mari și evitând pe cele care au dus la recompense mici |
+| 5. Iterație | Repetă procesul | Acest ciclu continuă, permițând agentului să-și îmbunătățească continuu luarea deciziilor |
+
+Gândește-te la învățarea mersului pe bicicletă. Ai putea să te legeni și să cazi la început (recompensă negativă!). Dar când reușești să te echilibrezi și să pedalezi lin, te simți bine (recompensă pozitivă!). Îți ajustezi acțiunile bazat pe acest feedback – înclinându-te puțin, pedalând mai repede, etc. – până când înveți să mergi bine. RL este similar – se referă la învățarea prin interacțiune și feedback.
+
+## Rolul RL în Modelele Mari de Limbaj (LLM-uri)
+
+Acum, de ce este RL atât de important pentru Modelele Mari de Limbaj?
+
+Ei bine, antrenarea LLM-urilor cu adevărat bune este complicată. Le putem antrena pe cantități masive de text de pe internet, și devin foarte bune la prezicerea următorului cuvânt într-o propoziție. Astfel învață să genereze text fluent și corect din punct de vedere gramatical, după cum am învățat în [capitolul 2](/course/chapter2/1).
+
+Cu toate acestea, a fi doar fluent nu este suficient. Vrem ca LLM-urile noastre să fie mai mult decât bune la înșiruirea cuvintelor. Vrem ca ele să fie:
+
+* **Utile:** Să ofere informații utile și relevante.  
+* **Inofensive:** Să evite generarea de conținut toxic, părtinitor sau dăunător.  
+* **Aliniate cu Preferințele Umane:** Să răspundă în moduri pe care oamenii le găsesc naturale, utile și captivante.
+
+Metodele de pre-antrenare LLM, care se bazează în principal pe prezicerea următorului cuvânt din datele text, uneori nu reușesc în aceste aspecte.
+
+În timp ce antrenamentul supervizat este excelent la producerea de rezultate structurate, poate fi mai puțin eficient la producerea de răspunsuri utile, inofensive și aliniate. Explorăm antrenamentul supervizat în [capitolul 11](/course/chapter11/1).
+
+Modelele ajustate fin ar putea genera text fluent și structurat care este încă factual incorect, părtinitor, sau nu răspunde cu adevărat la întrebarea utilizatorului într-un mod util.
+
+**Intră Învățarea prin Întărire!** RL ne oferă o modalitate de a ajusta fin aceste LLM-uri pre-antrenate pentru a atinge mai bine aceste calități dorite. Este ca să-i dai câinelui nostru LLM antrenament suplimentar pentru a deveni un companion bine comportat și util, nu doar un câine care știe să latre fluent!
+
+## Învățarea prin Întărire din Feedback Uman (RLHF)
+
+O tehnică foarte populară pentru alinierea modelelor de limbaj este **Învățarea prin Întărire din Feedback Uman (RLHF)**. În RLHF, folosim feedback-ul uman ca proxy pentru semnalul de "recompensă" în RL. Iată cum funcționează:
+
+1. **Obține Preferințe Umane:** Am putea cere oamenilor să compare diferite răspunsuri generate de LLM pentru aceeași intrare și să ne spună ce răspuns preferă. De exemplu, am putea arăta unui om două răspunsuri diferite la întrebarea "Care este capitala Franței?" și să îl întrebăm "Care răspuns este mai bun?".
+
+2. **Antrenează un Model de Recompensă:** Folosim aceste date de preferință umană pentru a antrena un model separat numit **model de recompensă**. Acest model de recompensă învață să prezică ce fel de răspunsuri vor prefera oamenii. Învață să evalueze răspunsurile bazat pe utilitate, inofensivitate și alinierea cu preferințele umane.
+
+3. **Ajustează fin LLM-ul cu RL:** Acum folosim modelul de recompensă ca mediu pentru agentul nostru LLM. LLM-ul generează răspunsuri (acțiuni), și modelul de recompensă evaluează aceste răspunsuri (oferă recompense). În esență, antrenăm LLM-ul să producă text pe care modelul nostru de recompensă (care a învățat din preferințele umane) îl consideră bun.
+
+![RL Basic Concept](https://huggingface.co/reasoning-course/images/resolve/main/grpo/2.jpg)  
+
+Dintr-o perspectivă generală, să privim beneficiile folosirii RL în LLM-uri:
+
+| Beneficiu | Descriere |
+|---------|-------------|
+| Control Îmbunătățit | RL ne permite să avem mai mult control asupra tipului de text pe care îl generează LLM-urile. Le putem ghida să producă text care este mai aliniat cu obiective specifice, cum ar fi a fi util, creativ sau concis. |
+| Alinierea Îmbunătățită cu Valorile Umane | RLHF, în particular, ne ajută să aliniată LLM-urile cu preferințele umane complexe și adesea subiective. Este greu să scrii reguli pentru "ce face un răspuns bun," dar oamenii pot judeca și compara ușor răspunsurile. RLHF permite modelului să învețe din aceste judecăți umane. |
+| Reducerea Comportamentelor Nedorite | RL poate fi folosit pentru a reduce comportamentele negative în LLM-uri, cum ar fi generarea de limbaj toxic, răspândirea dezinformării sau exhibarea prejudecăților. Prin conceperea recompenselor care penalizează aceste comportamente, putem îndemna modelul să le evite. |
+
+Învățarea prin Întărire din Feedback Uman a fost folosită pentru a antrena multe dintre cele mai populare LLM-uri de astăzi, cum ar fi GPT-4 de la OpenAI, Gemini de la Google și R1 de la DeepSeek. Există o gamă largă de tehnici pentru RLHF, cu grade variate de complexitate și sofisticare. În acest capitol, ne vom concentra pe Optimizarea Relativă a Politicii de Grup (GRPO), care este o tehnică pentru RLHF care s-a dovedit eficientă la antrenarea LLM-urilor care sunt utile, inofensive și aliniate cu preferințele umane.
+
+## De ce ar trebui să ne pese de GRPO (Optimizarea Relativă a Politicii de Grup)?
+
+Există multe tehnici pentru RLHF, dar acest curs se concentrează pe GRPO pentru că reprezintă un progres semnificativ în învățarea prin întărire pentru modelele de limbaj.
+
+Să considerăm pe scurt două dintre celelalte tehnici populare pentru RLHF:
+
+- Optimizarea Politicii Proximale (PPO)
+- Optimizarea Directă a Preferinței (DPO)
+
+Optimizarea Politicii Proximale (PPO) a fost una dintre primele tehnici foarte eficiente pentru RLHF. Folosește o metodă de gradient de politică pentru a actualiza politica bazată pe recompensa de la un model de recompensă separat.
+
+Optimizarea Directă a Preferinței (DPO) a fost dezvoltată mai târziu ca o tehnică mai simplă care elimină nevoia unui model de recompensă separat folosind datele de preferință direct. În esență, încadrează problema ca o sarcină de clasificare între răspunsurile alese și respinse.
+
+<Tip>
+
+DPO și PPO sunt algoritmi complecși de învățare prin întărire în sine, pe care nu îi vom acoperi în acest curs. Dacă ești interesat să înveți mai multe despre ei, poți consulta următoarele resurse:
+
+- [Optimizarea Politicii Proximale](https://huggingface.co/docs/trl/main/en/ppo_trainer)
+- [Optimizarea Directă a Preferinței](https://huggingface.co/docs/trl/main/en/dpo_trainer)
+
+</Tip>
+
+Spre deosebire de DPO și PPO, GRPO grupează eșantioane similare împreună și le compară ca grup. Abordarea bazată pe grup oferă gradienți mai stabili și proprietăți de convergență mai bune comparativ cu alte metode.
+
+GRPO nu folosește date de preferință cum face DPO, ci în schimb compară grupuri de eșantioane similare folosind un semnal de recompensă de la un model sau funcție.
+
+GRPO este flexibil în modul în care obține semnalele de recompensă - poate funcționa cu un model de recompensă (cum face PPO) dar nu necesită în mod strict unul. Aceasta pentru că GRPO poate încorpora semnale de recompensă de la orice funcție sau model care poate evalua calitatea răspunsurilor.
+
+De exemplu, am putea folosi o funcție de lungime pentru a recompensa răspunsuri mai scurte, un rezolvitor matematic pentru a verifica corectitudinea soluției, sau o funcție de corectitudine factuală pentru a recompensa răspunsurile care sunt mai precise din punct de vedere factual. Această flexibilitate face GRPO deosebit de versatil pentru diferite tipuri de sarcini de aliniere.
+
+---
+
+Felicitări pentru completarea Modulului 1! Acum ai o introducere solidă în Învățarea prin Întărire și rolul său crucial în modelarea viitorului Modelelor Mari de Limbaj. Înțelegi conceptele de bază ale RL, de ce este folosit pentru LLM-uri, și ai fost introdus la GRPO, un algoritm cheie în acest domeniu.
+
+În următorul modul, ne vom murdări mâinile și ne vom scufunda în lucrarea DeepSeek R1 pentru a vedea aceste concepte în acțiune!
+
+## Quiz
+
+### 1. Care sunt componentele cheie ale Învățării prin Întărire?
+
+<Question
+    choices={[
+        {
+            text: "Agent, Mediu, Acțiune, Recompensă și Politică",
+            explain: "Corect! Acestea sunt componentele fundamentale care alcătuiesc un sistem de învățare prin întărire.",
+            correct: true
+        },
+        {
+            text: "Model, Date, Funcție de Pierdere și Optimizator",
+            explain: "Acestea sunt componente mai des asociate cu învățarea supervizată."
+        },
+        {
+            text: "Intrare, Ieșire și Straturi Ascunse",
+            explain: "Acestea sunt componente ale arhitecturii rețelelor neuronale, nu specific componente RL."
+        }
+    ]}
+/>
+
+### 2. Care este principalul avantaj al RLHF pentru antrenarea modelelor de limbaj?
+
+<Question
+    choices={[
+        {
+            text: "Ajută la alinierea modelelor cu preferințele și valorile umane",
+            explain: "Corect! RLHF folosește feedback-ul uman pentru a ghida modelele către un comportament mai util, inofensiv și aliniat.",
+            correct: true
+        },
+        {
+            text: "Face modelele să genereze text mai rapid",
+            explain: "RLHF nu se concentrează în principal pe îmbunătățirea vitezei de generare."
+        },
+        {
+            text: "Reduce utilizarea memoriei modelului",
+            explain: "RLHF nu se concentrează pe eficiența modelului sau optimizarea memoriei."
+        }
+    ]}
+/>
+
+### 3. În contextul RL pentru LLM-uri, ce reprezintă o "acțiune"?
+
+<Question
+    choices={[
+        {
+            text: "Generarea de cuvinte sau alegerea răspunsurilor într-o conversație",
+            explain: "Corect! Pentru LLM-uri, acțiunile implică de obicei decizii de generare a textului.",
+            correct: true
+        },
+        {
+            text: "Actualizarea greutăților modelului",
+            explain: "Aceasta este parte din procesul de antrenare, nu o acțiune în contextul RL."
+        },
+        {
+            text: "Încărcarea datelor de antrenare",
+            explain: "Aceasta este o operațiune de gestionare a datelor, nu o acțiune RL."
+        }
+    ]}
+/> 
\ No newline at end of file
diff --git a/chapters/rum/chapter12/3.mdx b/chapters/rum/chapter12/3.mdx
new file mode 100644
index 000000000..d1c2314fb
--- /dev/null
+++ b/chapters/rum/chapter12/3.mdx
@@ -0,0 +1,199 @@
+# Înțelegerea Lucrării DeepSeek R1
+
+Acest capitol este un curs intensiv de citire a unei lucrări. Vom parcurge lucrarea în termeni simpli, și apoi vom descompune conceptele cheie și concluziile.
+
+DeepSeek R1 reprezintă un progres semnificativ în antrenarea modelelor de limbaj, în special în dezvoltarea capacităților de raționament prin învățarea prin întărire. Lucrarea introduce un nou algoritm de învățare prin întărire numit Optimizarea Relativă a Politicii de Grup (GRPO).
+
+![DeepSeek R1 Overview](https://huggingface.co/reasoning-course/images/resolve/main/grpo/4.png)
+
+În următorul capitol, vom construi pe această cunoaștere și vom implementa GRPO în practică.
+
+Obiectivul inițial al lucrării a fost să exploreze dacă învățarea prin întărire pură ar putea dezvolta capacități de raționament fără ajustarea fină supervizată.
+
+<Tip>
+
+Până la acel moment, toate LLM-urile populare necesitau o anumită ajustare fină supervizată, pe care am explorat-o în [capitolul 11](/course/chapter11/1).
+
+</Tip>
+
+## Momentul Revoluționar 'Aha'
+
+![The 'Aha Moment'](https://huggingface.co/reasoning-course/images/resolve/main/grpo/9.png)
+
+Una dintre cele mai remarcabile descoperiri în antrenarea R1-Zero a fost apariția unui fenomen cunoscut ca "Momentul Aha." Acest fenomen este oarecum similar cu modul în care oamenii experimentează realizări bruște în timpul rezolvării problemelor. Iată cum funcționează:
+
+1. Încercare Inițială: Modelul face o încercare inițială de a rezolva o problemă
+2. Recunoaștere: Recunoaște erori potențiale sau inconsistențe
+3. Auto-Corecție: Își ajustează abordarea bazat pe această recunoaștere
+4. Explicație: Poate explica de ce noua abordare este mai bună
+
+Această descoperire rezonează cu cursanții și se simte ca un moment "Eureka". Demonstrează învățarea mai degrabă decât memorarea simplă, așa că să ne luăm un moment să ne imaginăm cum se simte să ai un moment "Aha".
+
+De exemplu, imaginează-ți că încerci să rezolvi un puzzle:
+- Prima încercare: "Această piesă ar trebui să meargă aici bazat pe culoare"
+- Recunoaștere: "Dar stai, forma nu se potrivește destul de bine"
+- Corecție: "Ah, de fapt merge acolo"
+- Explicație: "Pentru că atât culoarea cât și modelul de formă se potrivesc în această poziție"
+
+Această abilitate a apărut natural din antrenamentul RL, fără a fi programată explicit, demonstrând învățarea mai degrabă decât memorarea simplă a unui proces din datele de antrenare.
+
+Cel mai ușor mod de a înțelege momentul 'Aha' este să-l vezi în acțiune. Să aruncăm o privire la un exemplu. În chat-ul de mai jos, întrebăm modelul să rezolve o problemă și UI-ul arată procesul de gândire al modelului pe măsură ce rezolvă problema.
+
+<iframe
+    src="https://reasoning-course-deepseek-ai-deepseek-r1-distill-0f5fad4.hf.space/"
+	frameborder="0"
+	width="850"
+	height="450"
+></iframe>
+
+Dacă vrei să încerci Deepseek's R1, poți de asemenea să consulți [Hugging Chat](https://huggingface.co/chat/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-32B).
+
+## Procesul de Antrenare
+
+Antrenarea R1 a fost un proces cu mai multe faze. Să descompunem fazele și inovațiile cheie în fiecare fază.
+
+Procesul final rezultă în două modele:
+- DeepSeek-R1-Zero: Un model antrenat pur folosind învățarea prin întărire.
+- DeepSeek-R1: Un model care construiește pe fundația DeepSeek-R1-Zero și adaugă ajustare fină supervizată.
+
+| Caracteristică | DeepSeek-R1-Zero | DeepSeek-R1 |
+|---------|------------------|--------------|
+| Abordarea de Antrenare | RL Pur | Multi-fază (SFT + RL) |
+| Ajustare Fină | Niciuna | Ajustare fină supervizată |
+| Capacitate de Raționament | Emergentă | Îmbunătățită |
+| Performanța AIME | 71.0% | 79.8% |
+| Caracteristici Cheie | Raționament puternic dar probleme de lizibilitate | Consistență și lizibilitate mai bună a limbajului |
+
+În timp ce DeepSeek-R1-Zero demonstrează potențialul învățării prin întărire pure pentru dezvoltarea capacităților de raționament, DeepSeek-R1 construiește pe această fundație cu o abordare mai echilibrată care prioritizează atât performanța de raționament cât și utilizabilitatea.
+
+Procesul de antrenare implică patru faze:
+
+1. Faza de Pornire la Rece
+2. Faza RL de Raționament
+3. Faza de Eșantionare prin Respingere
+4. Faza RL Diversă
+
+Să descompunem fiecare fază:
+
+### Faza de Pornire la Rece (Fundația Calității)
+
+![Cold Start Phase](https://huggingface.co/reasoning-course/images/resolve/main/grpo/5.png)
+
+Această fază este concepută pentru a stabili o fundație solidă pentru lizibilitatea și calitatea răspunsurilor modelului. Folosește un set de date mic de eșantioane de înaltă calitate de la R1-Zero pentru a ajusta fin modelul V3-Base. Începând cu modelul DeepSeek-V3-Base, echipa a folosit mii de eșantioane validate, de înaltă calitate de la R1-Zero pentru ajustarea fină supervizată. Această abordare inovatoare folosește un set de date mic dar de înaltă calitate pentru a stabili o lizibilitate de bază puternică și calitatea răspunsurilor.
+
+### Faza RL de Raționament (Construirea Capacităților)
+
+![Reasoning RL Phase](https://huggingface.co/reasoning-course/images/resolve/main/grpo/6.png)
+
+Faza RL de Raționament se concentrează pe dezvoltarea capacităților de raționament de bază în domenii incluzând matematica, codarea, știința și logica. Această fază folosește învățarea prin întărire bazată pe reguli, cu recompense direct legate de corectitudinea soluției.
+
+Crucial, toate sarcinile din această fază sunt 'verificabile' deci putem verifica dacă răspunsul modelului este corect sau nu. De exemplu, în cazul matematicii, putem verifica dacă răspunsul modelului este corect folosind un rezolvitor matematic.
+
+Ceea ce face această fază deosebit de inovatoare este abordarea sa de optimizare directă care elimină nevoia unui model de recompensă separat, simplificând procesul de antrenare.
+
+### Faza de Eșantionare prin Respingere (Controlul Calității)
+
+![Rejection Sampling Phase](https://huggingface.co/reasoning-course/images/resolve/main/grpo/7.png)
+
+În timpul Fazei de Eșantionare prin Respingere, modelul generează eșantioane care sunt apoi filtrate printr-un proces de control al calității. DeepSeek-V3 servește ca judecător al calității, evaluând rezultatele într-un domeniu larg care se extinde dincolo de sarcinile pure de raționament. Datele filtrate sunt apoi folosite pentru ajustarea fină supervizată. Inovația acestei faze constă în abilitatea sa de a combina multiple semnale de calitate pentru a asigura rezultate de înalt standard.
+
+### Faza RL Diversă (Alinierea Largă)
+
+![Diverse RL Phase](https://huggingface.co/reasoning-course/images/resolve/main/grpo/8.png)
+
+Faza finală RL Diversă abordează multiple tipuri de sarcini folosind o abordare hibridă sofisticată. Pentru sarcinile deterministe, folosește recompense bazate pe reguli, în timp ce sarcinile subiective sunt evaluate prin feedback LLM. Această fază își propune să atingă alinierea preferințelor umane prin abordarea sa inovatoare de recompense hibride, combinând precizia sistemelor bazate pe reguli cu flexibilitatea evaluării modelelor de limbaj.
+
+## Algoritmul: Optimizarea Relativă a Politicii de Grup (GRPO)
+
+Acum că avem o înțelegere bună a procesului de antrenare, să privim algoritmul care a fost folosit pentru a antrena modelul.
+
+Autorii descriu GRPO ca o descoperire în ajustarea fină a modelelor:
+
+![GRPO Process](https://huggingface.co/reasoning-course/images/resolve/main/grpo/10.png)
+
+Noutatea GRPO constă în capacitatea sa de a "optimiza direct pentru rectificarea preferințelor." Aceasta semnifică o rută mai directă și eficientă către alinierea modelului cu rezultatele dorite, contrastând cu algoritmii tradiționali de Învățare prin Întărire precum PPO. Să descompunem cum funcționează GRPO prin cele trei componente principale ale sale.
+
+### Formarea Grupurilor: Crearea de Multiple Soluții
+
+Primul pas în GRPO este remarcabil de intuitiv - este similar cu modul în care un student ar putea rezolva o problemă dificilă încercând multiple abordări. Când primește o comandă, modelul nu generează doar un răspuns; în schimb, creează multiple încercări de a rezolva aceeași problemă (de obicei 4, 8 sau 16 încercări diferite).
+
+Imaginează-ți că înveți un model să rezolve probleme de matematică. Pentru o întrebare despre numărarea puilor de pe o fermă, modelul ar putea genera mai multe soluții diferite:
+- O soluție ar putea descompune problema pas cu pas: prima numărarea puilor totali, apoi scăderea cocoșilor, și în final contabilizarea găinilor care nu produc ouă
+- Altă soluție ar putea folosi o abordare diferită dar la fel de validă
+- Unele încercări ar putea conține greșeli sau soluții mai puțin eficiente
+
+Toate aceste încercări sunt păstrate împreună ca grup, aproape ca să ai mai mulți studenti cu soluții de comparat și din care să înveți.
+
+![Group Formation](https://huggingface.co/reasoning-course/images/resolve/main/grpo/11.jpg)
+
+### Învățarea Preferințelor: Înțelegerea Ce Face o Soluție Bună
+
+Aici este unde GRPO cu adevărat strălucește în simplitatea sa. Spre deosebire de alte metode pentru RLHF care întotdeauna necesită un model de recompensă separat pentru a prezice cât de bună ar putea fi o soluție, GRPO poate folosi orice funcție sau model pentru a evalua calitatea unei soluții. De exemplu, am putea folosi o funcție de lungime pentru a recompensa răspunsuri mai scurte sau un rezolvitor matematic pentru a recompensa soluții matematice precise.
+
+Procesul de evaluare privește la diverse aspecte ale fiecărei soluții:
+- Este răspunsul final corect?
+- A urmat soluția formatarea corespunzătoare (cum ar fi folosirea tag-urilor XML corecte)?
+- Se potrivește raționamentul cu răspunsul oferit?
+
+Ceea ce face această abordare deosebit de inteligentă este modul în care gestionează evaluarea. În loc să dea doar scoruri absolute, GRPO normalizează recompensele în cadrul fiecărui grup. Folosește o formulă simplă dar eficientă pentru estimarea avantajului relativ al grupului:
+
+```
+Avantaj = (recompensă - mean(recompense_grup)) / std(recompense_grup)
+```
+
+![Preference Learning](https://huggingface.co/reasoning-course/images/resolve/main/grpo/12.jpg)
+
+Această normalizare este ca să notezi pe o curbă, dar pentru AI. Ajută modelul să înțeleagă care soluții din cadrul grupului au fost mai bune sau mai rele comparativ cu colegii lor, mai degrabă decât să se uite doar la scoruri absolute.
+
+### Optimizarea: Învățarea din Experiență
+
+Pasul final este unde GRPO îi învață modelul să se îmbunătățească bazat pe ceea ce a învățat din evaluarea grupului de soluții. Acest proces este atât puternic cât și stabil, folosind două principii principale:
+
+1. Încurajează modelul să producă mai multe soluții ca cele de succes în timp ce se îndepărtează de abordările mai puțin eficiente
+2. Include un mecanism de siguranță (numit penalitate de divergență KL) care previne modelul să se schimbe prea drastic dintr-o dată
+
+Această abordare se dovedește mai stabilă decât metodele tradiționale pentru că:
+- Se uită la multiple soluții împreună mai degrabă decât să compare doar două pe rând
+- Normalizarea bazată pe grup ajută la prevenirea problemelor cu scalarea recompenselor
+- Penalitatea KL acționează ca o plasă de siguranță, asigurându-se că modelul nu uită ce știa deja în timp ce învață lucruri noi
+
+<Tip>
+
+Inovațiile cheie ale GRPO sunt:
+- Învățarea direct din orice funcție sau model, eliminând dependența de un model de recompensă separat.
+- Învățarea bazată pe grup, care este mai stabilă și eficientă decât metodele tradiționale cum ar fi comparațiile perechi.
+
+</Tip>
+
+Această descompunere este complexă, dar concluzia cheie este că GRPO este o modalitate mai eficientă și stabilă de a antrena un model să raționeze.
+
+### Algoritmul GRPO în Pseudocod
+
+Acum că înțelegem componentele cheie ale GRPO, să privim algoritmul în pseudocod. Aceasta este o versiune simplificată a algoritmului, dar surprinde ideile cheie.
+
+```
+Input: 
+- initial_policy: Modelul de început care va fi antrenat
+- reward_function: Funcția care evaluează rezultatele
+- training_prompts: Set de exemple de antrenare
+- group_size: Numărul de rezultate per comandă (de obicei 4-16)
+
+Algoritm GRPO:
+1. Pentru fiecare iterație de antrenare:
+   a. Setează reference_policy = initial_policy (captura politica actuală)
+   b. Pentru fiecare comandă în lot:
+      i. Generează group_size rezultate diferite folosind initial_policy
+      ii. Calculează recompensele pentru fiecare rezultat folosind reward_function
+      iii. Normalizează recompensele în cadrul grupului:
+           normalized_advantage = (recompensă - mean(recompense)) / std(recompense)
+      iv. Actualizează politica maximizând rația tăiată:
+          min(prob_ratio * normalized_advantage, 
+              clip(prob_ratio, 1-epsilon, 1+epsilon) * normalized_advantage)
+          - kl_weight * KL(initial_policy || reference_policy)
+          
+          unde prob_ratio este current_prob / reference_prob
+
+Output: Model de politică optimizat
+```
+
+Acest algoritm arată cum GRPO combină estimarea avantajului bazat pe grup cu optimizarea politicii menținând în același timp stabilitatea prin tăiere și constrângeri de divergență KL. 
\ No newline at end of file
diff --git a/chapters/rum/chapter12/3a.mdx b/chapters/rum/chapter12/3a.mdx
new file mode 100644
index 000000000..f33035691
--- /dev/null
+++ b/chapters/rum/chapter12/3a.mdx
@@ -0,0 +1,197 @@
+# Înțelegerea Avansată a Optimizării Relative a Politicii de Grup (GRPO) în DeepSeekMath
+
+<Tip>
+
+Această secțiune se scufundă în detaliile tehnice și matematice ale GRPO. A fost scrisă de [Shirin Yamani](https://github.com/shirinyamani).
+
+</Tip>
+
+Să ne aprofundăm înțelegerea GRPO astfel încât să putem îmbunătăți procesul de antrenare al modelului nostru.
+
+GRPO evaluează direct răspunsurile generate de model comparându-le în cadrul grupurilor de generare pentru a optimiza modelul de politică, în loc să antreneze un model de valoare separat (Critic). Această abordare duce la o reducere semnificativă a costului computațional!
+
+GRPO poate fi aplicat la orice sarcină verificabilă unde corectitudinea răspunsului poate fi determinată. De exemplu, în raționamentul matematic, corectitudinea răspunsului poate fi ușor verificată prin compararea acestuia cu adevărul de bază.
+
+Înainte de a ne scufunda în detaliile tehnice, să vizualizăm cum funcționează GRPO la un nivel înalt:
+
+![deep](./img/2.jpg)
+
+Acum că avem o prezentare vizuală, să descompunem cum funcționează GRPO pas cu pas.
+
+## Algoritmul GRPO
+
+Inovația principală a GRPO este abordarea sa de evaluare și învățare din multiple răspunsuri generate simultan. În loc să se bazeze pe un model de recompensă separat, compară rezultatele din același grup pentru a determina care ar trebui să fie întărite.
+
+Să parcurgem fiecare pas al algoritmului în detaliu:
+
+### Pasul 1: Eșantionarea Grupului
+
+Primul pas este să genereze multiple răspunsuri posibile pentru fiecare întrebare. Aceasta creează un set divers de rezultate care pot fi comparate între ele.
+
+Pentru fiecare întrebare $q$, modelul va genera $G$ rezultate (dimensiunea grupului) din politica antrenată: ${o_1, o_2, o_3, \dots, o_G}\pi_{\theta_{\text{old}}}$, $G=8$ unde fiecare $o_i$ reprezintă o completare din model.
+
+#### Exemplu:
+
+Pentru a face acest lucru concret, să ne uităm la o problemă aritmetică simplă:
+
+- **Întrebarea** $q$ : $\text{Calculează}\space2 + 2 \times 6$
+- **Rezultatele** $(G = 8)$: $\{o_1:14 \text{ (corect)}, o_2:16 \text{ (greșit)}, o_3:10 \text{ (greșit)}, \ldots, o_8:14 \text{ (corect)}\}$
+
+Observă cum unele dintre răspunsurile generate sunt corecte (14) în timp ce altele sunt greșite (16 sau 10). Această diversitate este crucială pentru următorul pas.
+
+### Pasul 2: Calculul Avantajului
+
+Odată ce avem multiple răspunsuri, avem nevoie de o modalitate de a determina care sunt mai bune decât altele. Aici intervine calculul avantajului.
+
+#### Distribuția Recompenselor:
+
+În primul rând, atribuim un scor de recompensă fiecărui răspuns generat. În acest exemplu, vom folosi un model de recompensă, dar după cum am învățat în secțiunea anterioară, putem folosi orice funcție care returnează recompense.
+
+Atribuie un scor RM fiecăruia dintre răspunsurile generate bazat pe corectitudine $r_i$ *(de exemplu, 1 pentru răspuns corect, 0 pentru răspuns greșit)* apoi pentru fiecare dintre $r_i$ calculează următoarea valoare de Avantaj
+
+#### Formula Valorii Avantajului:
+
+Ideea cheie a GRPO este că nu avem nevoie de măsuri absolute ale calității - putem compara rezultatele în cadrul aceluiași grup. Aceasta se face folosind standardizarea:
+
+$$A_i = \frac{r_i - \text{mean}(\{r_1, r_2, \ldots, r_G\})}{\text{std}(\{r_1, r_2, \ldots, r_G\})}$$
+
+#### Exemplu:
+
+Continuând cu exemplul nostru aritmetic pentru același exemplu de mai sus, imaginează-ți că avem 8 răspunsuri, 4 dintre care sunt corecte și restul greșite, prin urmare:
+- Media Grupului: $mean(r_i) = 0.5$
+- Std: $std(r_i) = 0.53$
+- Valoarea Avantajului:
+	- Răspuns corect: $A_i = \frac{1 - 0.5}{0.53}= 0.94$
+	- Răspuns greșit: $A_i = \frac{0 - 0.5}{0.53}= -0.94$
+
+#### Interpretarea:  
+
+Acum că am calculat valorile avantajului, să înțelegem ce înseamnă:
+
+Această standardizare (adică ponderarea $A_i$) permite modelului să evalueze performanța relativă a fiecărui răspuns, ghidând procesul de optimizare să favorizeze răspunsurile care sunt mai bune decât media (recompensă mare) și să descurajeze pe cele care sunt mai rele.  De exemplu, dacă $A_i > 0$, atunci $o_i$ este un răspuns mai bun decât nivelul mediu din grupul său; și dacă $A_i < 0$, atunci $o_i$ atunci calitatea răspunsului este mai mică decât media (adică calitate/performanță slabă).
+
+Pentru exemplul de mai sus, dacă $A_i = 0.94 \text{(rezultat corect)}$ atunci în timpul pașilor de optimizare probabilitatea sa de generare va fi crescută.
+
+Cu valorile avantajului noastre calculate, suntem acum gata să actualizăm politica.
+
+### Pasul 3: Actualizarea Politicii
+
+Pasul final este să folosim aceste valori ale avantajului pentru a actualiza modelul nostru astfel încât să devină mai probabil să genereze răspunsuri bune în viitor.
+
+Funcția țintă pentru actualizarea politicii este:
+
+$$J_{GRPO}(\theta) = \left[\frac{1}{G} \sum_{i=1}^{G} \min \left( \frac{\pi_{\theta}(o_i|q)}{\pi_{\theta_{old}}(o_i|q)} A_i, \text{clip}\left( \frac{\pi_{\theta}(o_i|q)}{\pi_{\theta_{old}}(o_i|q)}, 1 - \epsilon, 1 + \epsilon \right) A_i \right)\right]- \beta D_{KL}(\pi_{\theta} || \pi_{ref})$$
+
+Această formulă ar putea părea intimidantă la început, dar este construită din mai multe componente care fiecare servesc un scop important. Să le descompunem una câte una.
+
+## Componentele Cheie ale Funcției Țintă
+
+Funcția de actualizare GRPO combină mai multe tehnici pentru a asigura o învățare stabilă și eficientă. Să examinăm fiecare componentă:
+
+### 1. Raportul de Probabilitate
+
+Raportul de probabilitate este definit ca:
+
+$\left(\frac{\pi_{\theta}(o_i|q)}{\pi_{\theta_{old}}(o_i|q)}\right)$ 
+
+Intuitiv, formula compară cât de mult diferă probabilitatea de răspuns a modelului nou de probabilitatea de răspuns a modelului vechi în timp ce încorporează o preferință pentru răspunsuri care îmbunătățesc rezultatul așteptat.
+
+#### Interpretarea:
+- Dacă $\text{raport} > 1$, modelul nou atribuie o probabilitate mai mare răspunsului $o_i$​ decât modelul vechi.
+- Dacă $\text{raport} < 1$, modelul nou atribuie o probabilitate mai mică lui $o_i$​ 
+
+Acest raport ne permite să controlăm cât de mult se schimbă modelul la fiecare pas, ceea ce ne duce la următoarea componentă.
+
+### 2. Funcția de Tăiere
+
+Funcția de tăiere este definită ca:
+
+$\text{clip}\left( \frac{\pi_{\theta}(o_i|q)}{\pi_{\theta_{old}}(o_i|q)}, 1 - \epsilon, 1 + \epsilon\right)$ 
+
+Limitează raportul discutat mai sus să fie în intervalul $[1 - \epsilon, 1 + \epsilon]$ pentru a evita/controla schimbări drastice sau actualizări nebunești și să nu pășească prea departe de politica veche. Cu alte cuvinte, limitează cât de mult poate crește raportul de probabilitate pentru a ajuta la menținerea stabilității prin evitarea actualizărilor care împing modelul nou prea departe de cel vechi.
+
+#### Exemplu $\space \text{să presupunem}(\epsilon = 0.2)$
+Să ne uităm la două scenarii diferite pentru a înțelege mai bine această funcție de tăiere:
+
+- **Cazul 1**: dacă noua politică are o probabilitate de 0.9 pentru un răspuns specific și vechea politică are o probabilitate de 0.5, înseamnă că acest răspuns este întărit de noua politică să aibă o probabilitate mai mare, dar într-o limită controlată care este tăierea pentru a-și strânge mâinile să nu devină drastică 
+	- $\text{Raport}: \frac{\pi_{\theta}(o_i|q)}{\pi_{\theta_{old}}(o_i|q)} = \frac{0.9}{0.5} = 1.8  → \text{Clip}\space1.2$ (limita superioară 1.2) 
+- **Cazul 2**: Dacă noua politică nu este în favoarea unui răspuns (probabilitate mai mică de exemplu 0.2), însemnând dacă răspunsul nu este benefic creșterea ar putea fi incorectă, și modelul ar fi penalizat.
+	- $\text{Raport}: \frac{\pi_{\theta}(o_i|q)}{\pi_{\theta_{old}}(o_i|q)} = \frac{0.2}{0.5} = 0.4  →\text{Clip}\space0.8$ (limita inferioară 0.8)
+#### Interpretarea:
+- Formula încurajează modelul nou să favorizeze răspunsuri pe care modelul vechi le-a subponderat **dacă ele îmbunătățesc rezultatul**.
+- Dacă modelul vechi deja favoriza un răspuns cu o probabilitate mare, modelul nou poate totuși să-l întărească **dar doar într-o limită controlată $[1 - \epsilon, 1 + \epsilon]$, $\text{(de exemplu, }\epsilon = 0.2, \space \text{deci} \space [0.8-1.2])$**.
+- Dacă modelul vechi a supraestimat un răspuns care performează prost, modelul nou este **descurajat** să mențină acea probabilitate mare.
+- Prin urmare, intuitiv, prin încorporarea raportului de probabilitate, funcția obiectiv asigură că actualizările politicii sunt proporționale cu avantajul $A_i$ în timp ce sunt moderate pentru a preveni schimbări drastice.
+
+În timp ce funcția de tăiere ajută la prevenirea schimbărilor drastice, avem nevoie de încă o măsură de protecție pentru a ne asigura că modelul nostru nu deviază prea departe de comportamentul său original.
+
+### 3. Divergența KL
+
+Termenul de divergență KL este:
+
+$\beta D_{KL}(\pi_{\theta} || \pi_{ref})$
+
+În termenul de divergență KL, $\pi_{ref}$ este practic rezultatul modelului pre-actualizare, `per_token_logps` și $\pi_{\theta}$ este rezultatul modelului nou, `new_per_token_logps`. Teoretic, divergența KL este minimizată pentru a preveni modelul să devieze prea departe de comportamentul său original în timpul optimizării. Aceasta ajută să găsească un echilibru între îmbunătățirea performanței bazată pe semnalul de recompensă și menținerea coerenței. În acest context, minimizarea divergenței KL reduce riscul ca modelul să genereze text fără sens sau, în cazul raționamentului matematic, să producă răspunsuri extrem de incorecte.
+
+#### Interpretarea
+- O penalitate de divergență KL păstrează rezultatele modelului aproape de distribuția sa originală, prevenind schimbări extreme.
+- În loc să derive către rezultate complet iraționale, modelul și-ar rafina înțelegerea în timp ce încă permite unele explorări
+
+#### Definiția Matematică
+Pentru cei interesați de detaliile matematice, să ne uităm la definiția formală:
+
+Să ne amintim că distanța KL este definită după cum urmează:
+$$D_{KL}(P || Q) = \sum_{x \in X} P(x) \log \frac{P(x)}{Q(x)}$$
+În RLHF, cele două distribuții de interes sunt adesea distribuția versiunii noului model, P(x), și o distribuție a politicii de referință, Q(x).
+
+#### Rolul Parametrului $\beta$
+
+Coeficientul $\beta$ controlează cât de puternic impunem constrângerea divergenței KL:
+
+-  **$\beta$ Mai Mare (Penalitate KL Mai Puternică)**
+    - Mai multă constrângere asupra actualizărilor politicii. Modelul rămâne aproape de distribuția sa de referință.
+    - Poate încetini adaptarea: Modelul ar putea avea dificultăți să exploreze răspunsuri mai bune.
+- **$\beta$ Mai Mic (Penalitate KL Mai Slabă)**
+    - Mai multă libertate să actualizeze politica: Modelul poate devia mai mult de la referință.
+    - Adaptare mai rapidă dar risc de instabilitate: Modelul ar putea învăța comportamente de hack-uire a recompenselor.
+	- Risc de supra-optimizare: Dacă modelul de recompensă este defectuos, politica ar putea genera rezultate fără sens.
+- **Originala** [DeepSeekMath](https://arxiv.org/abs/2402.03300) lucrare a setat acest $\beta= 0.04$
+
+Acum că înțelegem componentele GRPO, să vedem cum funcționează împreună într-un exemplu complet.
+
+## Exemplu Lucrat cu GRPO
+
+Pentru a ne solidifica înțelegerea GRPO, să parcurgem un exemplu complet de la început la sfârșit.
+
+### Problema Exemplu
+
+$$\text{Î: Calculează}\space2 + 2 \times 6$$
+
+### Pasul 1: Eșantionarea Grupului
+
+În primul rând, generăm multiple răspunsuri din modelul nostru:
+
+Generează $(G = 8)$ răspunsuri, $4$ dintre care sunt răspunsul corect ($14, \text{recompensă=} 1$) și $4$ incorecte $\text{(recompensă= 0)}$, Prin urmare:
+
+$${o_1:14(corect), o_2:10 (greșit), o_3:16 (greșit), ... o_G:14(corect)}$$
+
+### Pasul 2: Calculul Avantajului
+
+Apoi, calculăm valorile avantajului pentru a determina care răspunsuri sunt mai bune decât media:
+
+- Media Grupului: 
+$$mean(r_i) = 0.5$$
+- Std: $$std(r_i) = 0.53$$
+- Valoarea Avantajului:
+	- Răspuns corect: $A_i = \frac{1 - 0.5}{0.53}= 0.94$
+	- Răspuns greșit: $A_i = \frac{0 - 0.5}{0.53}= -0.94$
+
+### Pasul 3: Actualizarea Politicii
+
+În final, actualizăm modelul nostru pentru a întări răspunsurile corecte:
+
+- Presupunând că probabilitatea vechii politici ($\pi_{\theta_{old}}$) pentru un rezultat corect $o_1$ este $0.5$ și noua politică o crește la $0.7$ atunci:
+$$\text{Raport}: \frac{0.7}{0.5} = 1.4  →\text{după Clip}\space1.2 \space (\epsilon = 0.2)$$
+- Apoi când funcția țintă este re-ponderată, modelul tinde să întărească generarea rezultatului corect, și $\text{Divergența KL}$ limitează deviația de la politica de referință.
+
+Cu înțelegerea teoretică la locul ei, să vedem cum poate fi implementat GRPO în cod. 
\ No newline at end of file
diff --git a/chapters/rum/chapter12/4.mdx b/chapters/rum/chapter12/4.mdx
new file mode 100644
index 000000000..bc50b2c7b
--- /dev/null
+++ b/chapters/rum/chapter12/4.mdx
@@ -0,0 +1,233 @@
+# Implementarea GRPO în TRL
+
+În această pagină, vom învăța cum să implementăm Optimizarea Relativă a Politicii de Grup (GRPO) folosind biblioteca Transformer Reinforcement Learning (TRL). Ne vom concentra pe implementarea practică cu cod minimal.
+
+Vom explora conceptele centrale ale GRPO așa cum sunt întruchipate în GRPOTrainer din TRL, folosind fragmente din documentația oficială TRL pentru a ne ghida.
+
+<Tip>
+
+Acest capitol este destinat începătorilor TRL. Dacă ești deja familiar cu TRL, ai putea de asemenea să consulți [implementarea Open R1](https://github.com/huggingface/open-r1/blob/main/src/open_r1/grpo.py) a GRPO.
+
+</Tip>
+
+În primul rând, să ne reamintim unele dintre conceptele importante ale algoritmului GRPO:
+
+- Formarea Grupului: Modelul generează multiple completări pentru fiecare prompt.
+- Învățarea Preferințelor: Modelul învață dintr-o funcție de recompensă care compară grupuri de completări.
+- Configurația Antrenamentului: Modelul folosește o configurație pentru a controla procesul de antrenare.
+
+Ce trebuie să facem pentru a implementa GRPO?
+
+- Să definim un set de date de prompt-uri.
+- Să definim o funcție de recompensă care ia o listă de completări și returnează o listă de recompense.
+- Să configurăm procesul de antrenare cu un GRPOConfig.
+- Să antrenăm modelul folosind GRPOTrainer.
+
+Iată un exemplu minimal pentru a începe antrenamentul GRPO:
+
+```python
+from trl import GRPOTrainer, GRPOConfig
+from datasets import load_dataset
+
+# 1. Încarcă setul tău de date
+dataset = load_dataset("setul_tau_de_date", split="train")
+
+
+# 2. Definește o funcție de recompensă simplă
+def reward_func(completions, **kwargs):
+    """Exemplu: Recompensează completările mai lungi"""
+    return [float(len(completion)) for completion in completions]
+
+
+# 3. Configurează antrenamentul
+training_args = GRPOConfig(
+    output_dir="output",
+    num_train_epochs=3,
+    per_device_train_batch_size=4,
+    gradient_accumulation_steps=2,
+    logging_steps=10,
+)
+
+# 4. Inițializează și antrenează
+trainer = GRPOTrainer(
+    model="modelul_tau",  # de exemplu "Qwen/Qwen2-0.5B-Instruct"
+    args=training_args,
+    train_dataset=dataset,
+    reward_funcs=reward_func,
+)
+trainer.train()
+```
+
+## Componentele Cheie
+
+### 1. Formatul Setului de Date
+
+Setul tău de date ar trebui să conțină prompt-uri la care modelul va răspunde. Antrenorul GRPO va genera multiple completări pentru fiecare prompt și va folosi funcția de recompensă pentru a le compara.
+
+### 2. Funcția de Recompensă
+
+Funcția de recompensă este crucială - determină cum învață modelul. Iată două exemple practice:
+
+```python
+# Exemplul 1: Recompensă bazată pe lungimea completării
+def reward_length(completions, **kwargs):
+    return [float(len(completion)) for completion in completions]
+
+
+# Exemplul 2: Recompensă bazată pe potrivirea unui model
+import re
+
+
+def reward_format(completions, **kwargs):
+    pattern = r"^<think>.*?</think><answer>.*?</answer>$"
+    return [1.0 if re.match(pattern, c) else 0.0 for c in completions]
+```
+
+### 3. Configurația Antrenamentului
+
+Parametrii cheie de considerat în `GRPOConfig`:
+
+```python
+training_args = GRPOConfig(
+    # Parametrii esențiali
+    output_dir="output",
+    num_train_epochs=3,
+    num_generation=4,  # Numărul de completări de generat pentru fiecare prompt
+    per_device_train_batch_size=4,  # Vrem să obținem toate generările într-un lot de dispozitiv
+    # Opțional dar util
+    gradient_accumulation_steps=2,
+    learning_rate=1e-5,
+    logging_steps=10,
+    # Specific GRPO (opțional)
+    use_vllm=True,  # Accelerează generarea
+)
+```
+
+Parametrul `num_generation` este deosebit de important pentru GRPO deoarece definește dimensiunea grupului - câte completări diferite va genera modelul pentru fiecare prompt. Acesta este un diferențiator cheie de alte metode RL:
+
+- Prea mic (de exemplu, 2-3): S-ar putea să nu ofere suficientă diversitate pentru comparații semnificative
+- Recomandat (4-16): Oferă un echilibru bun între diversitate și eficiența computațională
+- Valori mai mari: Pot îmbunătăți învățarea dar cresc semnificativ costul computațional
+
+Dimensiunea grupului ar trebui aleasă în funcție de resursele tale computaționale și complexitatea sarcinii tale. Pentru sarcini simple, grupuri mai mici (4-8) pot fi suficiente, în timp ce sarcinile de raționament mai complexe ar putea beneficia de grupuri mai mari (8-16).
+
+## Sfaturi pentru Succes
+
+1. **Gestionarea Memoriei**: Ajustează `per_device_train_batch_size` și `gradient_accumulation_steps` în funcție de memoria GPU-ului tău.
+2. **Viteza**: Activează `use_vllm=True` pentru generare mai rapidă dacă modelul tău este suportat.
+3. **Monitorizarea**: Urmărește metricile înregistrate în timpul antrenamentului:
+   - `reward`: Recompensa medie pe completări
+   - `reward_std`: Deviația standard în cadrul grupurilor de recompense
+   - `kl`: Divergența KL de la modelul de referință
+
+## Designul Funcției de Recompensă
+
+Lucrarea DeepSeek R1 demonstrează mai multe abordări eficiente pentru designul funcției de recompensă pe care le poți adapta pentru propria ta implementare GRPO:
+
+### 1. Recompense Bazate pe Lungime
+
+Una dintre cele mai ușoare recompense de implementat este o recompensă bazată pe lungime. Poți recompensa completări mai lungi:
+
+```python
+def reward_len(completions, **kwargs):
+    ideal_length = 20
+    return [-abs(ideal_length - len(completion)) for completion in completions]
+```
+
+Această funcție de recompensă penalizează completările care sunt prea scurte sau prea lungi, încurajând modelul să genereze completări care sunt aproape de lungimea ideală de 20 de token-uri.
+
+<!-- # TODO: update links when PR is merged -->
+
+<iframe 
+    src="https://marimo.app/gh/huggingface/notebooks/main/e?entrypoint=course%2Fen%2Fchapter13%2Fgrpo_length.py&embed=true&show-chrome=false"
+    title="Marimo Notebook"
+    width="100%"
+    height="800px"
+    frameBorder="0"
+    allow="clipboard-write"
+></iframe>
+
+## 2. Recompense Bazate pe Reguli pentru Sarcini Verificabile
+
+Pentru sarcini cu răspunsuri obiectiv corecte (cum ar fi matematica sau codarea), poți implementa funcții de recompensă bazate pe reguli:
+
+```python
+def problem_reward(completions, answers, **kwargs):
+    """Funcție de recompensă pentru probleme de matematică cu răspunsuri verificabile
+    completions: lista de completări de evaluat
+    answers: lista de răspunsuri la problemele din setul de date
+    """
+
+    rewards = []
+    for completion, correct_answer in zip(completions, answers):
+        # Extrage răspunsul din completare
+        try:
+            # Acesta este un exemplu simplificat - ai avea nevoie de parsing corespunzător
+            answer = extract_final_answer(completion)
+            # Recompensă binară: 1 pentru corect, 0 pentru incorect
+            reward = 1.0 if answer == correct_answer else 0.0
+            rewards.append(reward)
+        except:
+            # Dacă nu putem parsa un răspuns, dăm o recompensă mică
+            rewards.append(0.0)
+
+    return rewards
+```
+
+<!-- # TODO: update links when PR is merged -->
+
+<iframe 
+    src="https://marimo.app/gh/huggingface/notebooks/main/e?entrypoint=course%2Fen%2Fchapter13%2Fgrpo_math.py&embed=true&show-chrome=false"
+    title="Marimo Notebook"
+    width="100%"
+    height="800px"
+    frameBorder="0"
+    allow="clipboard-write"
+></iframe>
+
+## 3. Recompense Bazate pe Format
+
+Poți de asemenea să recompensezi formatarea corespunzătoare, care a fost importantă în antrenamentul DeepSeek R1:
+
+```python
+def format_reward(completions, **kwargs):
+    """Recompensează completările care urmează formatul dorit"""
+    # Exemplu: Verifică dacă completarea urmează un format gândește-apoi-răspunde
+    pattern = r"<think>(.*?)</think>\s*<answer>(.*?)</answer>"
+
+    rewards = []
+    for completion in completions:
+        match = re.search(pattern, completion, re.DOTALL)
+        if match:
+            # Verifică dacă există conținut substanțial în ambele secțiuni
+            think_content = match.group(1).strip()
+            answer_content = match.group(2).strip()
+
+            if len(think_content) > 20 and len(answer_content) > 0:
+                rewards.append(1.0)
+            else:
+                rewards.append(
+                    0.5
+                )  # Recompensă parțială pentru format corect dar conținut limitat
+        else:
+            rewards.append(0.0)  # Nicio recompensă pentru format incorect
+
+    return rewards
+```
+
+<!-- # TODO: update links when PR is merged -->
+
+<iframe 
+    src="https://marimo.app/gh/huggingface/notebooks/main/e?entrypoint=course%2Fen%2Fchapter13%2Fgrpo_format.py&embed=true&show-chrome=false"
+    title="Marimo Notebook"
+    width="100%"
+    height="800px"
+    frameBorder="0"
+    allow="clipboard-write"
+></iframe>
+
+Aceste exemple demonstrează cum poți implementa funcții de recompensă inspirate din procesul de antrenare DeepSeek R1, concentrându-se pe corectitudine, formatare și semnale combinate.
+
+## Asta e tot!
+
+În următoarea secțiune, vei urma un exercițiu pentru a implementa GRPO în TRL. 
\ No newline at end of file
diff --git a/chapters/rum/chapter12/5.mdx b/chapters/rum/chapter12/5.mdx
new file mode 100644
index 000000000..39965eb1b
--- /dev/null
+++ b/chapters/rum/chapter12/5.mdx
@@ -0,0 +1,238 @@
+<CourseFloatingBanner chapter={2}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/main/course/en/chapter12/grpo_finetune.ipynb"},
+]} />
+
+# Exercițiu Practic: Ajustează fin un model cu GRPO
+
+Acum că ai văzut teoria, să o punem în practică! În acest exercițiu, vei ajusta fin un model cu GRPO.
+
+<Tip>
+
+Acest exercițiu a fost scris de expertul în ajustarea fină LLM [@mlabonne](https://huggingface.co/mlabonne).
+
+</Tip>
+
+## Instalează dependențele
+
+În primul rând, să instalăm dependențele pentru acest exercițiu.
+
+```bash
+!pip install -qqq datasets==3.2.0 transformers==4.47.1 trl==0.14.0 peft==0.14.0 accelerate==1.2.1 bitsandbytes==0.45.2 wandb==0.19.7 --progress-bar off
+!pip install -qqq flash-attn --no-build-isolation --progress-bar off
+```
+
+Acum vom importa bibliotecile necesare.
+
+```python
+import torch
+from datasets import load_dataset
+from peft import LoraConfig, get_peft_model
+from transformers import AutoModelForCausalLM, AutoTokenizer
+from trl import GRPOConfig, GRPOTrainer
+```
+
+## Importă și loghează în Weights & Biases
+
+Weights & Biases este un instrument pentru înregistrarea și monitorizarea experimentelor tale. Îl vom folosi pentru a înregistra procesul nostru de ajustare fină.
+
+```python
+import wandb
+
+wandb.login()
+```
+
+Poți face acest exercițiu fără să te loghezi în Weights & Biases, dar este recomandat să faci asta pentru a-ți urmări experimentele și pentru a interpreta rezultatele.
+
+## Încarcă setul de date
+
+Acum, să încărcăm setul de date. În acest caz, vom folosi setul de date [`mlabonne/smoltldr`](https://huggingface.co/datasets/mlabonne/smoltldr), care conține o listă de povești scurte.
+
+```python
+dataset = load_dataset("mlabonne/smoltldr")
+print(dataset)
+```
+
+## Încarcă modelul
+
+Acum, să încărcăm modelul.
+
+Pentru acest exercițiu, vom folosi modelul [`SmolLM2-135M`](https://huggingface.co/HuggingFaceTB/SmolLM2-135M).
+
+Acesta este un model mic de 135M parametri care rulează pe hardware limitat. Aceasta face modelul ideal pentru învățare, dar nu este cel mai puternic model de acolo. Dacă ai acces la hardware mai puternic, poți încerca să ajustezi fin un model mai mare precum [`SmolLM2-1.7B`](https://huggingface.co/HuggingFaceTB/SmolLM2-1.7B).
+
+```python
+model_id = "HuggingFaceTB/SmolLM-135M-Instruct"
+model = AutoModelForCausalLM.from_pretrained(
+    model_id,
+    torch_dtype="auto",
+    device_map="auto",
+    attn_implementation="flash_attention_2",
+)
+tokenizer = AutoTokenizer.from_pretrained(model_id)
+```
+
+## Încarcă LoRA
+
+Acum, să încărcăm configurația LoRA. Vom profita de LoRA pentru a reduce numărul de parametri antrenabili, și prin urmare amprenta de memorie de care avem nevoie pentru a ajusta fin modelul.
+
+Dacă nu ești familiar cu LoRA, poți citi mai multe despre aceasta în [Capitolul 11](https://huggingface.co/learn/course/en/chapter11/3).
+
+```python
+# Încarcă LoRA
+lora_config = LoraConfig(
+    task_type="CAUSAL_LM",
+    r=16,
+    lora_alpha=32,
+    target_modules="all-linear",
+)
+model = get_peft_model(model, lora_config)
+print(model.print_trainable_parameters())
+```
+
+```sh
+Parametri antrenabili totali: 135M
+```
+
+## Definește funcția de recompensă
+
+După cum s-a menționat în secțiunea anterioară, GRPO poate folosi orice funcție de recompensă pentru a îmbunătăți modelul. În acest caz, vom folosi o funcție de recompensă simplă care încurajează modelul să genereze text lung de 50 de token-uri.
+
+```python
+# Funcția de recompensă
+ideal_length = 50
+
+
+def reward_len(completions, **kwargs):
+    return [-abs(ideal_length - len(completion)) for completion in completions]
+```
+
+## Definește argumentele de antrenament
+
+Acum, să definim argumentele de antrenament. Vom folosi clasa `GRPOConfig` pentru a defini argumentele de antrenament într-un stil tipic `transformers`.
+
+Dacă aceasta este prima dată când definești argumente de antrenament, poți verifica clasa [TrainingArguments](https://huggingface.co/docs/transformers/en/main_classes/trainer#trainingarguments) pentru mai multe informații, sau [Capitolul 2](https://huggingface.co/learn/course/en/chapter2/1) pentru o introducere detaliată.
+
+```python
+# Argumentele de antrenament
+training_args = GRPOConfig(
+    output_dir="GRPO",
+    learning_rate=2e-5,
+    per_device_train_batch_size=8,
+    gradient_accumulation_steps=2,
+    max_prompt_length=512,
+    max_completion_length=96,
+    num_generations=8,
+    optim="adamw_8bit",
+    num_train_epochs=1,
+    bf16=True,
+    report_to=["wandb"],
+    remove_unused_columns=False,
+    logging_steps=1,
+)
+```
+
+Acum, putem inițializa antrenorul cu modelul, setul de date și argumentele de antrenament și să începem antrenamentul.
+
+```python
+# Antrenorul
+trainer = GRPOTrainer(
+    model=model,
+    reward_funcs=[reward_len],
+    args=training_args,
+    train_dataset=dataset["train"],
+)
+
+# Antrenează modelul
+wandb.init(project="GRPO")
+trainer.train()
+```
+
+Antrenamentul durează aproximativ 1 oră pe un singur GPU A10G care este disponibil pe Google Colab sau prin Hugging Face Spaces.
+
+## Împinge modelul pe Hub în timpul antrenamentului
+
+Dacă setăm argumentul `push_to_hub` la `True` și argumentul `model_id` la un nume de model valid, modelul va fi împins pe Hugging Face Hub în timp ce antrenăm. Aceasta este utilă dacă vrei să începi să testezi modelul imediat!
+
+## Interpretează rezultatele antrenamentului
+
+`GRPOTrainer` înregistrează recompensa din funcția ta de recompensă, pierderea, și o gamă de alte metrici.
+
+Ne vom concentra pe recompensa din funcția de recompensă și pierderea.
+
+După cum poți vedea, recompensa din funcția de recompensă se apropie de 0 pe măsură ce modelul învață. Acesta este un semn bun că modelul învață să genereze text de lungimea corectă.
+
+![Recompensa din funcția de recompensă](https://huggingface.co/reasoning-course/images/resolve/main/grpo/13.png)
+
+Ai putea observa că pierderea începe de la zero și apoi crește în timpul antrenamentului, ceea ce poate părea contraontuitiv. Acest comportament este așteptat în GRPO și este direct legat de formularea matematică a algoritmului. Pierderea în GRPO este proporțională cu divergența KL (capsula relativă la politica originală). Pe măsură ce antrenamentul progresează, modelul învață să genereze text care se potrivește mai bine cu funcția de recompensă, făcându-l să devieze mai mult de la politica sa inițială. Această divergență crescândă se reflectă în valoarea pierderii în creștere, care de fapt indică că modelul se adaptează cu succes pentru a optimiza funcția de recompensă.
+
+![Pierderea](https://huggingface.co/reasoning-course/images/resolve/main/grpo/14.png)
+
+## Salvează și publică modelul
+
+Să partajăm modelul cu comunitatea!
+
+```python
+merged_model = trainer.model.merge_and_unload()
+merged_model.push_to_hub(
+    "SmolGRPO-135M", private=False, tags=["GRPO", "Reasoning-Course"]
+)
+```
+
+## Generează text
+
+🎉 Ai ajustat fin cu succes un model cu GRPO! Acum, să generăm puțin text cu modelul.
+
+În primul rând, vom defini un document foarte lung!
+
+```python
+prompt = """
+# Un document lung despre pisică
+
+Pisica (Felis catus), numită și pisica domestică sau pisica de casă, este un mamifer carnivor 
+mic domesticit. Este singura specie domesticită din familia Felidae. Progresele în arheologie 
+și genetică au arătat că domesticirea pisicii a avut loc în Orientul Apropiat în jurul anului 
+7500 î.Hr. Este ținută în mod obișnuit ca animal de companie și pisică de fermă, dar se află 
+și în libertate ca pisică sălbatică evitând contactul uman. Este prețuită de oameni pentru 
+companie și capacitatea sa de a ucide dăunători. Ghearele sale retractabile sunt adaptate 
+pentru uciderea speciilor de pradă mici precum șoarecii și șobolanii. Are un corp puternic 
+și flexibil, reflexe rapide și dinți ascuțiți, iar vederea nocturnă și simțul mirosului sunt 
+bine dezvoltate. Este o specie socială, dar un vânător solitar și un prădător crepuscular. 
+Comunicarea pisicii include vocalizări—incluzând mieunat, tors, triluri, șuierat, mormăit 
+și grunțit—precum și limbajul corpului. Poate auzi sunete prea slabe sau prea înalte în 
+frecvență pentru urechile umane, cum ar fi cele făcute de mamiferele mici. Secretă și 
+percep feromoni.
+"""
+```
+
+messages = [
+    {"role": "user", "content": prompt},
+]
+
+Acum, putem genera text cu modelul.
+
+```python
+# Generează text
+from transformers import pipeline
+
+generator = pipeline("text-generation", model="SmolGRPO-135M")
+
+## Sau folosește modelul și tokenizer-ul pe care le-am definit mai devreme
+# generator = pipeline("text-generation", model=model, tokenizer=tokenizer)
+
+generate_kwargs = {
+    "max_new_tokens": 256,
+    "do_sample": True,
+    "temperature": 0.5,
+    "min_p": 0.1,
+}
+
+generated_text = generator(messages, generate_kwargs=generate_kwargs)
+
+print(generated_text)
+```
+
+# Concluzie
+
+În acest capitol, am văzut cum să ajustăm fin un model cu GRPO. Am văzut de asemenea cum să interpretăm rezultatele antrenamentului și să generăm text cu modelul.
diff --git a/chapters/rum/chapter12/6.mdx b/chapters/rum/chapter12/6.mdx
new file mode 100644
index 000000000..e95a488d6
--- /dev/null
+++ b/chapters/rum/chapter12/6.mdx
@@ -0,0 +1,379 @@
+<CourseFloatingBanner chapter={2}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/unslothai/notebooks/blob/main/nb/HuggingFace%20Course-Gemma3_(1B)-GRPO.ipynb"},
+]} />
+
+# Exercițiu Practic: GRPO cu Unsloth
+
+În acest exercițiu, vei ajusta fin un model cu GRPO (Optimizarea Relativă a Politicii de Grup) folosind Unsloth, pentru a îmbunătăți capacitățile de raționament ale unui model. Am acoperit GRPO în [Capitolul 3](/course/chapter3/3).
+
+Unsloth este o bibliotecă care accelerează ajustarea fină LLM, făcând posibilă antrenarea modelelor mai repede și cu mai puține resurse computaționale. Unsloth se conectează la TRL, deci vom construi pe ceea ce am învățat în secțiunile anterioare, și o vom adapta pentru specificațiile Unsloth.
+
+<Tip>
+
+Acest exercițiu poate fi rulat pe un GPU T4 Google Colab gratuit. Pentru cea mai bună experiență, urmărește notebook-ul legat mai sus și încearcă-l singur.
+
+</Tip>
+
+## Instalează dependențele
+
+În primul rând, să instalăm bibliotecile necesare. Vom avea nevoie de Unsloth pentru ajustarea fină accelerată și vLLM pentru inferența rapidă.
+
+```bash
+pip install unsloth vllm
+pip install --upgrade pillow
+```
+
+## Configurarea Unsloth
+
+Unsloth oferă o clasă (`FastLanguageModel`) care integrează transformers cu optimizările Unsloth. Să o importăm:
+
+```python
+from unsloth import FastLanguageModel
+```
+
+Acum, să încărcăm modelul Google Gemma 3 1B Instruct și să-l configurăm pentru ajustarea fină:
+
+```python
+from unsloth import FastLanguageModel
+import torch
+
+max_seq_length = 1024  # Poate crește pentru urme de raționament mai lungi
+lora_rank = 32  # Rang mai mare = mai inteligent, dar mai lent
+
+model, tokenizer = FastLanguageModel.from_pretrained(
+    model_name="google/gemma-3-1b-it",
+    max_seq_length=max_seq_length,
+    load_in_4bit=True,  # False pentru LoRA 16bit
+    fast_inference=True,  # Activează inferența rapidă vLLM
+    max_lora_rank=lora_rank,
+    gpu_memory_utilization=0.6,  # Reduce dacă rămâi fără memorie
+)
+
+model = FastLanguageModel.get_peft_model(
+    model,
+    r=lora_rank,  # Alege orice număr > 0 ! Sugerat 8, 16, 32, 64, 128
+    target_modules=[
+        "q_proj",
+        "k_proj",
+        "v_proj",
+        "o_proj",
+        "gate_proj",
+        "up_proj",
+        "down_proj",
+    ],  # Elimină QKVO dacă rămâi fără memorie
+    lora_alpha=lora_rank,
+    use_gradient_checkpointing="unsloth",  # Activează ajustarea fină pentru context lung
+    random_state=3407,
+)
+```
+
+Acest cod încarcă modelul în cuantizare 4-bit pentru a economisi memoria și aplică LoRA (Adaptarea de Rang Mic) pentru ajustarea fină eficientă. Parametrul `target_modules` specifică care straturi ale modelului să fie ajustate fin, și `use_gradient_checkpointing` permite antrenarea cu contexte mai lungi.
+
+<Tip>
+
+Nu vom acoperi detaliile LoRA în acest capitol, dar poți învăța mai multe în [Capitolul 11](/course/chapter11/3).
+
+</Tip>
+
+## Pregătirea Datelor
+
+Pentru acest exercițiu, vom folosi setul de date GSM8K, care conține probleme de matematică de gimnaziu. Vom formata datele pentru a încuraja modelul să-și arate raționamentul înainte de a oferi un răspuns.
+
+În primul rând, vom defini formatul prompt-urilor și răspunsurilor:
+
+```python
+# Definește prompt-ul de sistem care instruiește modelul să folosească un format specific
+SYSTEM_PROMPT = """
+Răspunde în următorul format:
+<reasoning>
+...
+</reasoning>
+<answer>
+...
+</answer>
+"""
+
+XML_COT_FORMAT = """\
+<reasoning>
+{reasoning}
+</reasoning>
+<answer>
+{answer}
+</answer>
+"""
+```
+
+Acum, să pregătim setul de date:
+
+```python
+import re
+from datasets import load_dataset, Dataset
+
+
+# Funcții helper pentru a extrage răspunsuri din formate diferite
+def extract_xml_answer(text: str) -> str:
+    answer = text.split("<answer>")[-1]
+    answer = answer.split("</answer>")[0]
+    return answer.strip()
+
+
+def extract_hash_answer(text: str) -> str | None:
+    if "####" not in text:
+        return None
+    return text.split("####")[1].strip()
+
+
+# Funcție pentru a pregăti setul de date GSM8K
+def get_gsm8k_questions(split="train") -> Dataset:
+    data = load_dataset("openai/gsm8k", "main")[split]
+    data = data.map(
+        lambda x: {
+            "prompt": [
+                {"role": "system", "content": SYSTEM_PROMPT},
+                {"role": "user", "content": x["question"]},
+            ],
+            "answer": extract_hash_answer(x["answer"]),
+        }
+    )
+    return data
+
+
+dataset = get_gsm8k_questions()
+```
+
+Setul de date este pregătit prin extragerea răspunsului din setul de date și formatarea acestuia ca șir de caractere.
+
+## Definirea Funcțiilor de Recompensă
+
+După cum am discutat într-o [pagină anterioară](/course/chapter13/4), GRPO poate folosi funcții de recompensă pentru a ghida învățarea modelului bazată pe criterii verificabile precum lungimea și formatarea.
+
+În acest exercițiu, vom defini mai multe funcții de recompensă care încurajează diferite aspecte ale unui raționament bun. De exemplu, vom recompensa modelul pentru oferirea unui răspuns întreg, și pentru urmarea formatului strict.
+
+```python
+# Funcția de recompensă care verifică dacă răspunsul este corect
+def correctness_reward_func(prompts, completions, answer, **kwargs) -> list[float]:
+    responses = [completion[0]["content"] for completion in completions]
+    q = prompts[0][-1]["content"]
+    extracted_responses = [extract_xml_answer(r) for r in responses]
+    print(
+        "-" * 20,
+        f"Întrebare:\n{q}",
+        f"\nRăspuns:\n{answer[0]}",
+        f"\nRăspuns model:\n{responses[0]}",
+        f"\nExtras:\n{extracted_responses[0]}",
+    )
+    return [2.0 if r == a else 0.0 for r, a in zip(extracted_responses, answer)]
+
+
+# Funcția de recompensă care verifică dacă răspunsul este un întreg
+def int_reward_func(completions, **kwargs) -> list[float]:
+    responses = [completion[0]["content"] for completion in completions]
+    extracted_responses = [extract_xml_answer(r) for r in responses]
+    return [0.5 if r.isdigit() else 0.0 for r in extracted_responses]
+
+
+# Funcția de recompensă care verifică dacă completarea urmează formatul strict
+def strict_format_reward_func(completions, **kwargs) -> list[float]:
+    pattern = r"^<reasoning>\n.*?\n</reasoning>\n<answer>\n.*?\n</answer>\n$"
+    responses = [completion[0]["content"] for completion in completions]
+    matches = [re.match(pattern, r) for r in responses]
+    return [0.5 if match else 0.0 for match in matches]
+
+
+# Funcția de recompensă care verifică dacă completarea urmează un format mai relaxat
+def soft_format_reward_func(completions, **kwargs) -> list[float]:
+    pattern = r"<reasoning>.*?</reasoning>\s*<answer>.*?</answer>"
+    responses = [completion[0]["content"] for completion in completions]
+    matches = [re.match(pattern, r) for r in responses]
+    return [0.5 if match else 0.0 for match in matches]
+
+
+# Funcția de recompensă care numără tag-urile XML și penalizează conținutul extra
+def count_xml(text) -> float:
+    count = 0.0
+    if text.count("<reasoning>\n") == 1:
+        count += 0.125
+    if text.count("\n</reasoning>\n") == 1:
+        count += 0.125
+    if text.count("\n<answer>\n") == 1:
+        count += 0.125
+        count -= len(text.split("\n</answer>\n")[-1]) * 0.001
+    if text.count("\n</answer>") == 1:
+        count += 0.125
+        count -= (len(text.split("\n</answer>")[-1]) - 1) * 0.001
+    return count
+
+
+def xmlcount_reward_func(completions, **kwargs) -> list[float]:
+    contents = [completion[0]["content"] for completion in completions]
+    return [count_xml(c) for c in contents]
+```
+
+Aceste funcții de recompensă servesc diferite scopuri:
+
+| Funcția de Recompensă | Scopul |
+|-----------------|---------|
+| `correctness_reward_func` | Recompensează modelul când răspunsul său se potrivește cu răspunsul corect |
+| `int_reward_func` | Recompensează modelul pentru oferirea unui răspuns numeric |
+| `strict_format_reward_func` și `soft_format_reward_func` | Recompensează modelul pentru urmarea formatului specificat |
+| `xmlcount_reward_func` | Recompensează utilizarea corectă a tag-urilor XML și penalizează conținutul extra după tag-urile de închidere |
+
+## Antrenarea cu GRPO
+
+Acum vom configura antrenorul GRPO cu modelul nostru, tokenizer-ul și funcțiile de recompensă. Această parte urmează aceeași abordare ca [exercițiul anterior](/course/chapter12/5).
+
+```python
+from trl import GRPOConfig, GRPOTrainer
+
+max_prompt_length = 256
+
+training_args = GRPOConfig(
+    learning_rate=5e-6,
+    adam_beta1=0.9,
+    adam_beta2=0.99,
+    weight_decay=0.1,
+    warmup_ratio=0.1,
+    lr_scheduler_type="cosine",
+    optim="paged_adamw_8bit",
+    logging_steps=1,
+    per_device_train_batch_size=1,
+    gradient_accumulation_steps=1,  # Crește la 4 pentru antrenare mai lină
+    num_generations=6,  # Scade dacă rămâi fără memorie
+    max_prompt_length=max_prompt_length,
+    max_completion_length=max_seq_length - max_prompt_length,
+    # num_train_epochs = 1, # Setează la 1 pentru o rulare completă de antrenare
+    max_steps=250,
+    save_steps=250,
+    max_grad_norm=0.1,
+    report_to="none",  # Poate folosi Weights & Biases
+    output_dir="outputs",
+)
+
+trainer = GRPOTrainer(
+    model=model,
+    processing_class=tokenizer,
+    reward_funcs=[
+        xmlcount_reward_func,
+        soft_format_reward_func,
+        strict_format_reward_func,
+        int_reward_func,
+        correctness_reward_func,
+    ],
+    args=training_args,
+    train_dataset=dataset,
+)
+```
+
+`GRPOConfig` setează diferiți hiperparametri pentru antrenare:
+- `use_vllm`: Activează inferența rapidă cu vLLM
+- `learning_rate`: Controlează cât de repede învață modelul
+- `num_generations`: Numărul de completări de generat pentru fiecare prompt
+- `max_steps`: Numărul total de pași de antrenare de efectuat
+
+Acum să începem antrenarea:
+
+```python
+trainer.train()
+```
+
+<Tip warning={true}>
+
+Antrenarea poate dura ceva timp. S-ar putea să nu vezi recompensele crescând imediat - poate dura 150-200 de pași înainte să începi să vezi îmbunătățiri. Fii răbdător!
+
+</Tip>
+
+## Testarea Modelului
+
+După antrenare, să testăm modelul nostru pentru a vedea cum performează. În primul rând, vom salva greutățile LoRA:
+
+```python
+model.save_lora("grpo_saved_lora")
+```
+
+Acum, să testăm modelul cu o întrebare nouă:
+
+```python
+from vllm import SamplingParams
+
+text = tokenizer.apply_chat_template(
+    [
+        {"role": "system", "content": SYSTEM_PROMPT},
+        {"role": "user", "content": "Calculează pi."},
+    ],
+    tokenize=False,
+    add_generation_prompt=True,
+)
+
+sampling_params = SamplingParams(
+    temperature=0.8,
+    top_p=0.95,
+    max_tokens=1024,
+)
+output = (
+    model.fast_generate(
+        text,
+        sampling_params=sampling_params,
+        lora_request=model.load_lora("grpo_saved_lora"),
+    )[0]
+    .outputs[0]
+    .text
+)
+
+print(output)
+```
+
+Ar trebui să vezi că modelul urmează acum formatul specificat, arătându-și raționamentul înainte de a oferi un răspuns.
+
+## Salvarea Modelului
+
+Unsloth oferă mai multe opțiuni pentru salvarea modelului tău ajustat fin, dar ne vom concentra pe cea mai comună.
+
+```python
+# Salvează la precizie 16-bit
+model.save_pretrained_merged("model", tokenizer, save_method="merged_16bit")
+```
+
+## Încărcarea pe Hugging Face Hub
+
+Vom încărca modelul pe Hugging Face Hub folosind metoda `push_to_hub_merged`. Această metodă ne permite să încărcăm modelul în multiple formate de cuantizare.
+```python
+# Încarcă pe Hugging Face Hub (necesită un token)
+model.push_to_hub_merged(
+    "numele-tau/numele-modelului",
+    tokenizer,
+    save_method="merged_16bit",
+    token="token-ul-tau",
+)
+```
+
+Unsloth suportă de asemenea salvarea în format GGUF pentru utilizare cu llama.cpp:
+
+```python
+model.push_to_hub_gguf(
+    "numele-tau/numele-modelului",
+    tokenizer,
+    quantization_method=["q4_k_m", "q8_0", "q5_k_m"],
+    token="token-ul-tau",
+)
+```
+
+Fișierele GGUF pot fi folosite cu llama.cpp sau sisteme bazate pe UI precum Jan sau Open WebUI.
+
+## Concluzie
+
+În acest exercițiu, ai învățat cum să:
+1. Configurezi Unsloth pentru ajustarea fină accelerată
+2. Pregătești datele pentru antrenarea GRPO
+3. Definești funcții de recompensă personalizate pentru a ghida învățarea modelului
+4. Antrenezi un model folosind GRPO
+5. Testezi modelul ajustat fin
+6. Salvezi modelul în diverse formate
+
+GRPO este o tehnică puternică pentru alinierea modelelor de limbaj cu comportamente specifice, iar Unsloth o face accesibilă chiar și pe hardware limitat. Prin combinarea mai multor funcții de recompensă, poți ghida modelul să urmeze un format specific în timp ce îi îmbunătățești și capacitățile de raționament.
+
+Pentru mai multe informații și resurse, verifică:
+- [Documentația Unsloth](https://docs.unsloth.ai/)
+- [Discord Unsloth](https://discord.gg/unsloth)
+- [GitHub Unsloth](https://github.com/unslothai/unsloth) 
\ No newline at end of file
diff --git a/chapters/rum/chapter12/7.mdx b/chapters/rum/chapter12/7.mdx
new file mode 100644
index 000000000..9f4ec8722
--- /dev/null
+++ b/chapters/rum/chapter12/7.mdx
@@ -0,0 +1,18 @@
+# În curând...
+
+Acest capitol se desfășoară acum ca o cohortă live! Dacă ai terminat materialul până acum, iată la ce să te aștepți:
+
+## Programul Cursului
+
+| Data | Unitatea |
+|------|------|
+| ~7 Martie, 2025~ | ~Examen Fără Cod și Certificare~ |
+| ~14 Martie, 2025~ | ~Următorul Exercițiu Practic~ |
+| 21 Martie, 2025 | Revizuirea interactivă a codului |
+| Aprilie 2025 | Mai mult material scris despre construirea modelelor de raționament |
+| Aprilie 2025 | Sesiuni live despre construirea Open R1 |
+| Aprilie 2025 | Examen de Cod și Certificare |
+
+## Să Rămâi la Curent
+
+Dacă vrei să urmezi cursul, urmărește [The Reasoning Course](https://huggingface.co/reasoning-course) și alătură-te [comunității Discord](https://discord.gg/F3vZujJH)! 
\ No newline at end of file

From a205f2ed1a339a79feca9b9e18eade78e0cf951d Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Tue, 3 Jun 2025 10:12:27 +0300
Subject: [PATCH 133/167] fix: apply all PR recommendations

---
 chapters/rum/_toctree.yml   | 2 +-
 chapters/rum/chapter2/1.mdx | 2 +-
 chapters/rum/chapter2/2.mdx | 4 ++--
 chapters/rum/chapter2/3.mdx | 2 +-
 chapters/rum/chapter2/4.mdx | 4 ++--
 chapters/rum/chapter2/5.mdx | 4 ++--
 chapters/rum/chapter2/7.mdx | 2 +-
 chapters/rum/chapter2/8.mdx | 2 +-
 8 files changed, 11 insertions(+), 11 deletions(-)

diff --git a/chapters/rum/_toctree.yml b/chapters/rum/_toctree.yml
index a833b1184..ef403e57e 100644
--- a/chapters/rum/_toctree.yml
+++ b/chapters/rum/_toctree.yml
@@ -27,7 +27,7 @@
     title: Quiz de final de capitol
     quiz: 1
 
-- title: 2. Using 🤗 Transformers
+- title: 2. Folosirea 🤗 Transformers
   sections:
   - local: chapter2/1
     title: Introducere
diff --git a/chapters/rum/chapter2/1.mdx b/chapters/rum/chapter2/1.mdx
index 86e4cdc6a..3adddcc0b 100644
--- a/chapters/rum/chapter2/1.mdx
+++ b/chapters/rum/chapter2/1.mdx
@@ -13,7 +13,7 @@ Biblioteca 🤗 Transformers a fost creată pentru a rezolva această problemă.
 - **Flexibilitate**: În esența lor, toate modelele sunt simple clase PyTorch `nn.Module` sau TensorFlow `tf.keras.Model` și pot fi manipulate ca orice alte modele în framework-urile lor respective de învățare automată (ML).
 - **Simplitate**: Aproape că nu se fac abstractizări în întreaga bibliotecă. "All in one file" este un concept de bază: trecerea înainte a unui model este definită în întregime într-un singur fișier, astfel încât codul în sine să fie ușor de înțeles și de modificat.
 
-Această ultimă caracteristică face 🤗 Transformers destul de diferită de alte biblioteci ML. Modelele nu sunt construite pe module 
+Această ultimă caracteristică face "🤗 Transformers" destul de diferită de alte biblioteci ML. Modelele nu sunt construite pe module 
 care sunt partajate între fișiere; în schimb, fiecare model are propriile sale straturi. În plus, pe lângă faptul că modelele sunt mai ușor de abordat și de înțeles, acest lucru vă permite să experimentați cu ușurință pe un model fără a le afecta pe celelalte.
 
 Acest capitol va începe cu un exemplu end-to-end în care folosim împreună un model și un tokenizer pentru a replica funcția `pipeline()` introdusă în [Capitolul 1](/course/chapter1). În continuare, vom discuta despre API-ul modelului: vom analiza clasele de model și de configurare și vă vom arăta cum să încărcați un model și cum acesta procesează intrările numerice pentru a genera predicții. 
diff --git a/chapters/rum/chapter2/2.mdx b/chapters/rum/chapter2/2.mdx
index 5649d0b45..a244194e8 100644
--- a/chapters/rum/chapter2/2.mdx
+++ b/chapters/rum/chapter2/2.mdx
@@ -72,7 +72,7 @@ La fel ca alte rețele neuronale, modelele Transformer nu pot procesa direct tex
 - Maparea fiecărui token într-un număr întreg
 - Adăugarea de intrări suplimentare care pot fi utile pentru model
 
-Toată această preprocesare trebuie efectuată exact în același mod ca atunci când modelul a fost preantrenat, așa că mai întâi trebuie să descărcăm aceste informații din [Model Hub] (https://huggingface.co/models). Pentru a face acest lucru, folosim clasa `AutoTokenizer` și metoda sa `from_pretrained()`. Folosind numele checkpoint-ului modelului nostru, aceasta va prelua automat datele asociate cu tokenizer-ul modelului și le va stoca în cache (astfel încât acestea să fie descărcate doar prima dată când executați codul de mai jos).
+Toată această preprocesare trebuie efectuată exact în același mod ca atunci când modelul a fost preantrenat, așa că mai întâi trebuie să descărcăm aceste informații din [Model Hub](https://huggingface.co/models). Pentru a face acest lucru, folosim clasa `AutoTokenizer` și metoda sa `from_pretrained()`. Folosind numele checkpoint-ului modelului nostru, aceasta va prelua automat datele asociate cu tokenizer-ul modelului și le va stoca în cache (astfel încât acestea să fie descărcate doar prima dată când executați codul de mai jos).
 
 Deoarece punctul de control implicit al pipeline-ului `sentiment-analysis` este `distilbert-base-uncased-finetuned-sst-2-english` (puteți vedea fișa modelului [aici](https://huggingface.co/distilbert-base-uncased-finetuned-sst-2-english)), executăm următoarele:
 
@@ -111,7 +111,7 @@ print(inputs)
 {/if}
 
  
-Nu vă faceți încă griji cu privire la padding și trunchiere; le vom explica mai târziu. Principalele lucruri de reținut aici sunt că puteți trece o propoziție sau o listă de propoziții, precum și specificarea tipului de tensori pe care doriți să îi primiți înapoi (dacă nu este trecut niciun tip, veți primi o listă de liste ca rezultat).
+Nu vă faceți încă griji cu privire la padding și trunchiere; le vom explica mai târziu. Principalele lucruri de reținut aici sunt că puteți trece o propoziție sau o listă de propoziții, precum și specificarea tipului de tensori pe care doriți să îi primiți înapoi (dacă nu este specificat niciun tip, veți primi o listă de liste ca rezultat).
 {#if fw === 'pt'}
 
 Iată cum arată rezultatele ca tensori PyTorch:
diff --git a/chapters/rum/chapter2/3.mdx b/chapters/rum/chapter2/3.mdx
index 59dcc330f..27407ca22 100644
--- a/chapters/rum/chapter2/3.mdx
+++ b/chapters/rum/chapter2/3.mdx
@@ -143,7 +143,7 @@ După cum ați văzut mai devreme, am putea înlocui `BertModel` cu clasa `AutoM
 
 Acest model este acum inițializat cu toate weight-urile din checkpoint. Acesta poate fi utilizat direct pentru inferență pe sarcinile pe care a fost antrenat și poate fi, de asemenea, ajustat pe o sarcină nouă. Prin antrenarea cu weight-uri preantrenate în prealabil, putem obține rapid rezultate bune.
 
-Greutățile au fost descărcate și stocate în cache (astfel încât apelurile viitoare la metoda `from_pretrained()` nu le vor descărca din nou) în folderul cache, care are ca valoare implicită *~/.cache/huggingface/transformers*. Puteți personaliza folderul cache prin setarea variabilei de mediu `HF_HOME`.
+Greutățile au fost descărcate și stocate în memorie cache (astfel încât apelurile viitoare la metoda `from_pretrained()` nu le vor descărca din nou) în folderul cache, care are ca valoare implicită *~/.cache/huggingface/transformers*. Puteți personaliza folderul cache prin setarea variabilei de mediu `HF_HOME`.
 
 Identificatorul utilizat pentru încărcarea modelului poate fi identificatorul oricărui model de pe Model Hub, atâta timp cât acesta este compatibil cu arhitectura BERT. Lista completă a checkpoint-urilor BERT disponibile poate fi găsită [aici](https://huggingface.co/models?filter=bert).
 
diff --git a/chapters/rum/chapter2/4.mdx b/chapters/rum/chapter2/4.mdx
index e861dff98..365db17b3 100644
--- a/chapters/rum/chapter2/4.mdx
+++ b/chapters/rum/chapter2/4.mdx
@@ -69,11 +69,11 @@ Există, de asemenea, variații ale tokenizatoarelor de cuvinte care au reguli s
 
 Fiecărui cuvânt i se atribuie un ID, începând de la 0 și mergând până la dimensiunea vocabularului. Modelul utilizează aceste ID-uri pentru a identifica fiecare cuvânt.
 
-Dacă dorim să acoperim complet o limbă cu un tokenizer bazat pe cuvinte, va trebui să avem un identificator pentru fiecare cuvânt din limbă, ceea ce va genera o cantitate uriașă de token-uri. De exemplu, există peste 500 000 de cuvinte în limba engleză, astfel încât, pentru a construi o hartă de la fiecare cuvânt la un ID de intrare, ar trebui să ținem evidența unui număr atât de mare de ID-uri. În plus, cuvinte precum "dog" sunt reprezentate diferit de cuvinte precum "dogs", iar modelul nu va avea inițial nicio modalitate de a ști că "dog" și "dogs" sunt similare: va identifica cele două cuvinte ca neavând legătură. Același lucru este valabil și pentru alte cuvinte similare, precum "run" și "running", pe care modelul nu le va vedea inițial ca fiind similare.
+Dacă dorim să acoperim complet o limbă cu un tokenizator bazat pe cuvinte, va trebui să avem un identificator pentru fiecare cuvânt din limbă, ceea ce va genera o cantitate uriașă de token-uri. De exemplu, există peste 500 000 de cuvinte în limba engleză, astfel încât, pentru a construi o hartă de la fiecare cuvânt la un ID de intrare, ar trebui să ținem evidența unui număr atât de mare de ID-uri. În plus, cuvinte precum "dog" sunt reprezentate diferit de cuvinte precum "dogs", iar modelul nu va avea inițial nicio modalitate de a ști că "dog" și "dogs" sunt similare: va identifica cele două cuvinte ca neavând legătură. Același lucru este valabil și pentru alte cuvinte similare, precum "run" și "running", pe care modelul nu le va vedea inițial ca fiind similare.
 
 În cele din urmă, avem nevoie de un token personalizat pentru a reprezenta cuvintele care nu se află în vocabularul nostru. Acesta este cunoscut sub numele de token "necunoscut", adesea reprezentat ca "[UNK]" sau "&lt;unk&gt;". În general, este un indiciu rău dacă vedeți că tokenizatorul produce o mulțime de astfel de token-uri, deoarece nu a fost capabil să recupereze reprezentarea sensibilă a unui cuvânt și veți pierde informații pe parcurs. Scopul elaborării vocabularului este de a face în așa fel încât tokenizatorul să tokenizeze cât mai puține cuvinte posibil în tokenul necunoscut.
 
-O modalitate de a reduce numărul de token-uri necunoscute este de a merge un nivel mai adânc, folosind un tokenizer _character-based_.
+O modalitate de a reduce numărul de token-uri necunoscute este de a merge un nivel mai adânc, folosind un tokenizator _character-based_.
 
 ## Character-based[[character-based]]
 
diff --git a/chapters/rum/chapter2/5.mdx b/chapters/rum/chapter2/5.mdx
index 14d9551f6..9bd200369 100644
--- a/chapters/rum/chapter2/5.mdx
+++ b/chapters/rum/chapter2/5.mdx
@@ -28,7 +28,7 @@
 <Youtube id="ROxrFOEbsQE"/>
 {/if}
 
-În secțiunea anterioară, am explorat cel mai simplu caz de utilizare: realizarea de inferențe pe o singură secvență de lungime mică. Cu toate acestea, apar deja unele întrebări:
+În secțiunea anterioară, am explorat cel mai simplu caz de utilizare: realizarea de inferențe pe o singură secvență scurtă. Cu toate acestea, apar deja unele întrebări:
 
 - Cum gestionăm secvențe multiple?
 - Cum gestionăm secvențe multiple *de lungimi diferite*?
@@ -77,7 +77,7 @@ sequence = "I've been waiting for a HuggingFace course my whole life."
 tokens = tokenizer.tokenize(sequence)
 ids = tokenizer.convert_tokens_to_ids(tokens)
 input_ids = tf.constant(ids)
-# Aceasă linie va eșua.
+# Această linie va eșua.
 model(input_ids)
 ```
 
diff --git a/chapters/rum/chapter2/7.mdx b/chapters/rum/chapter2/7.mdx
index a9f4de595..8178de24b 100644
--- a/chapters/rum/chapter2/7.mdx
+++ b/chapters/rum/chapter2/7.mdx
@@ -15,4 +15,4 @@ Ați făcut o treabă excelentă dacă ați urmat cursul până aici! Pentru a s
 - Am învățat limitările ID-urilor de intrare și am învățat despre attention masks.
 - Ne-am antrenat cu ajutorul metodelor versatile și configurabile ale tokenizatorului.
 
-De acum înainte, ar trebui să puteți naviga liber prin documentele 🤗 Transformers: vocabularul va suna familiar și ați văzut deja metodele pe care le veți utiliza în majoritatea timpului.
\ No newline at end of file
+De acum înainte, ar trebui să puteți naviga liber prin documentația 🤗 Transformers: vocabularul va suna familiar și ați văzut deja metodele pe care le veți utiliza în majoritatea timpului.
\ No newline at end of file
diff --git a/chapters/rum/chapter2/8.mdx b/chapters/rum/chapter2/8.mdx
index 300078152..248d9286b 100644
--- a/chapters/rum/chapter2/8.mdx
+++ b/chapters/rum/chapter2/8.mdx
@@ -302,7 +302,7 @@ result = model(**encoded)
 		},
 		{
 			text: "Este o bună practică să folosiți trunchierea și padding-ul cu tokenizatorul, întrucât fiecare intrare este un lot.",
-			explain: "Este adevărat că orice intrare de model are nevoie să fie sub formă de lot. Totuși, trunchierea sau padding-ul acestei secvențe nu ar avea neapărat sens deoarece este singura intrare, iar aceste tehnici se folosesc pentru a trata o listă de propoziții."
+			explain: "Este adevărat că orice intrare de model trebuie să fie sub formă de batch. Totuși, trunchierea sau padding-ul acestei secvențe nu ar avea neapărat sens deoarece este singura intrare, iar aceste tehnici se folosesc pentru a grupa o listă de propoziții într-un batch."
 		}
 	]}
 />

From 4347d664cb1c24993f4ca3a19866f32e3a2ec02a Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Tue, 3 Jun 2025 10:37:14 +0300
Subject: [PATCH 134/167] feat: add new file from chapter2

---
 chapters/rum/_toctree.yml   |   2 +
 chapters/rum/chapter2/8.mdx | 310 ------------------------------------
 chapters/rum/chapter2/9.mdx | 310 ++++++++++++++++++++++++++++++++++++
 3 files changed, 312 insertions(+), 310 deletions(-)
 create mode 100644 chapters/rum/chapter2/9.mdx

diff --git a/chapters/rum/_toctree.yml b/chapters/rum/_toctree.yml
index ef403e57e..cf1353fe3 100644
--- a/chapters/rum/_toctree.yml
+++ b/chapters/rum/_toctree.yml
@@ -44,5 +44,7 @@
   - local: chapter2/7
     title: Utilizarea de bază este completă!
   - local: chapter2/8
+    title: Implementarea optimizată a inferenței
+  - local: chapter2/9
     title: Quiz la final de capitol
     quiz: 2
diff --git a/chapters/rum/chapter2/8.mdx b/chapters/rum/chapter2/8.mdx
index 248d9286b..e69de29bb 100644
--- a/chapters/rum/chapter2/8.mdx
+++ b/chapters/rum/chapter2/8.mdx
@@ -1,310 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-<!-- DISABLE-FRONTMATTER-SECTIONS -->
-
-# Quiz la final de capitol [[quiz-la-final-de-capitol]]
-
-<CourseFloatingBanner
-    chapter={2}
-    classNames="absolute z-10 right-0 top-0"
-/>
-
-### 1. Care este ordinea pipeline-ului de modelare a limbajului?
-
-<Question
-	choices={[
-		{
-			text: "Primul, modelul, care gestionează textul și returnează predicții brute. Apoi, tokenizatorul interpretează aceste predicții și le convertește înapoi în text atunci când este necesar.",
-			explain: "Modelul nu poate înțelege textul! Tokenizatorul trebuie mai întâi să tokenizeze textul și să îl convertească în ID-uri, astfel încât să poată fi înțeles de model."
-		},
-		{
-			text: "Primul este tokenizatorul, care gestionează textul și returnează ID-uri. Modelul gestionează aceste ID-uri și generează o predicție, care poate fi un text.",
-			explain: "Predicția modelului nu poate fi transformată imediat în text. Trebuie utilizat tokenizatorul pentru a converti predicția înapoi în text!"
-		},
-		{
-			text: "Tokenizatorul gestionează textul și returnează ID-uri. Modelul gestionează aceste ID-uri și generează o predicție. Tokenizatorul poate fi apoi utilizat din nou pentru a converti aceste predicții înapoi în text.",
-			explain: "Corect! Tokenizatorul poate fi utilizat atât pentru tokenizare, cât și pentru de-tokenizare.",
-            correct: true
-		}
-	]}
-/>
-
-### 2. Câte dimensiuni are tensorul generat de modelul Transformer și care sunt acestea?
-
-<Question
-	choices={[
-		{
-			text: "2: Lungimea secvenței și mărimea lotului",
-			explain: "Fals! Tensor-ul generat de model are a treia dimensiune: mărimea ascunsă."
-		},
-		{
-			text: "2: Lungimea secvenței și mărimea ascunsă",
-			explain: "Fals! Toate modelele Transformer gestionează loturi, chiar și cu o singură secvență; aceasta ar fi o dimensiune a lotului de 1!"
-		},
-		{
-			text: "3: Lungimea secvenței, dimensiunea lotului și dimensiunea ascunsă",
-			explain: "Corect!",
-            correct: true
-		}
-	]}
-/>
-
-### 3. Care dintre următoarele este un exemplu de tokenizare a cuvintelor secundare?
-
-<Question
-	choices={[
-		{
-			text: "WordPiece",
-			explain: "Da, acesta este un exemplu de tokenizare a cuvintelor secundare!",
-            correct: true
-		},
-		{
-			text: "Tokenizare bazată pe caractere",
-			explain: "Tokenizarea bazată pe caractere nu este un tip de tokenizare a cuvintelor secundare."
-		},
-		{
-			text: "Separarea pe baza spațiului și a punctuației",
-			explain: "Corect, aceasta este o schemă de tokenizare bazată pe cuvinte!"
-		},
-		{
-			text: "BPE",
-			explain: "Da, acesta este un exemplu de tokenizare a cuvintelor secundare!",
-            correct: true
-        },
-		{
-			text: "Unigram",
-			explain: "Da, acesta este un exemplu de tokenizare a cuvintelor secundare!",
-            correct: true
-        },
-		{
-			text: "Nimic din cele de mai sus",
-			explain: "Incorect!"
-        }
-	]}
-/>
-
-### 4. Ce este un model head?
-
-<Question
-	choices={[
-		{
-			text: "O componentă a rețelei Transformer de bază care redirecționează tensorii către straturile lor corecte",
-			explain: "Incorect! Nu există o astfel de componentă."
-		},
-		{
-			text: "Cunoscut și sub denumirea de mecanism de auto-atenție, acesta adaptează reprezentarea unui token în funcție de celelalte token-uri din secvență",
-			explain: "Incorect! Layerul de auto-atenție conține „heads” de atenție, dar nu acestea sunt adaptation heads."
-		},
-		{
-			text: "O componentă suplimentară, alcătuită de obicei din unul sau mai multe straturi, pentru a converti predicțiile transformatorului într-o sarcină specifică de ieșire",
-			explain: "Corect. Adaptation heads (sau simplu heads) apar în diverse forme: language modeling heads, question answering heads, sequence classification heads...",
-			correct: true
-		} 
-	]}
-/>
-
-{#if fw === 'pt'}
-### 5. Ce este un AutoModel?
-
-<Question
-	choices={[
-		{
-			text: "Un model care se antrenează automat pe baza datelor dumneavoastră",
-			explain: "Incorect. Poate îl confundați cu produsul nostru <a href='https://huggingface.co/autotrain'>AutoTrain</a>?"
-		},
-		{
-			text: "Un obiect care returnează arhitectura corespunzătoare bazată pe checkpoint.",
-			explain: "Exact: <code>AutoModel</code> are nevoie doar să știe checkpoint-ul din care să se inițializeze pentru a returna arhitectura corectă.",
-			correct: true
-		},
-		{
-			text: "Un model care detectează automat limba utilizată pentru intrările sale pentru a încărca ponderile corecte",
-			explain: "Incorect; deși unele checkpoint-uri și modele pot gestiona mai multe limbi, nu există instrumente integrate pentru selectarea automată a checkpoint-ului în funcție de limbă. Ar trebui să consultați <a href='https://huggingface.co/models'>Model Hub</a> pentru a găsi cel mai bun checkpoint pentru sarcina dumneavoastră!"
-		} 
-	]}
-/>
-
-{:else}
-### 5. Ce este un TFAutoModel?
-
-<Question
-	choices={[
-		{
-			text: "Un model care se antrenează automat pe baza datelor dumneavoastră",
-			explain: "Incorect. Poate îl confundați cu produsul nostru <a href='https://huggingface.co/autotrain'>AutoTrain</a>?"
-		},
-		{
-			text: "Un obiect care returnează arhitectura corespunzătoare bazată pe checkpoint",
-			explain: "Exact: <code>TFAutoModel</code> are nevoie doar să știe checkpoint-ul din care să se inițializeze pentru a returna arhitectura corectă.",
-			correct: true
-		},
-		{
-			text: "Un model care detectează automat limba utilizată pentru intrările sale pentru a încărca ponderile corecte",
-			explain: "Incorect; deși unele checkpoint-uri și modele pot gestiona mai multe limbi, nu există instrumente integrate pentru selectarea automată a checkpoint-ului în funcție de limbă. Ar trebui să consultați <a href='https://huggingface.co/models'>Model Hub</a> pentru a găsi cel mai bun checkpoint pentru sarcina dumneavoastră!"
-		} 
-	]}
-/>
-
-{/if}
-
-### 6. Care sunt tehnicile de care trebuie să țineți cont atunci când grupați secvențe de diferite lungimi?
-
-<Question
-	choices={[
-		{
-			text: "Trunchierea",
-			explain: "Da, trunchierea este o modalitate corectă de a uniformiza secvențele astfel încât acestea să se încadreze într-o formă dreptunghiulară. Este totuși singura modalitate?",
-			correct: true
-		},
-		{
-			text: "Returning tensors",
-			explain: "Deși celelalte tehnici vă permit să returnați tensori dreptunghiulari, doar a returna tensori nu ajută când combinați secvențele într-un lot."
-		},
-		{
-			text: "Padding",
-			explain: "Da, padding-ul este o modalitate corectă de a egaliza secvențele, astfel încât să se potrivească într-o formă dreptunghiulară. Este, însă, singura?",
-			correct: true
-		}, 
-		{
-			text: "Attention masking",
-			explain: "Absolut! Măștile de atenție sunt extrem de importante atunci când gestionați secvențe de lungimi diferite. Totuși, nu este singura tehnică de care trebuie să țineți cont.",
-			correct: true
-		} 
-	]}
-/>
-
-### 7. Care este scopul aplicării unei funcții SoftMax asupra logit-urilor produse de un model de clasificare a secvențelor?
-
-<Question
-	choices={[
-		{
-			text: "Le atenuează logiturile pentru a fi mai de încredere.",
-			explain: "Nu, funcția SoftMax nu afectează fiabilitatea rezultatelor."
-		},
-		{
-			text: "Aplică o limită inferioară și superioară astfel încât valorile să fie inteligibile.",
-			explain: "Corect! Valorile rezultate sunt cuprinse între 0 și 1. Totuși, nu este singurul motiv pentru care folosim o funcție SoftMax.",
-            correct: true
-		},
-		{
-			text: "Suma totală a ieșirii devine 1, ducând la o interpretare probabilistică posibilă.",
-			explain: "Corect! Totuși, nu este singurul motiv pentru care folosim o funcție SoftMax.",
-            correct: true
-		}
-	]}
-/>
-
-### 8. În jurul cărei metode se concentrează cea mai mare parte a API-ului tokenizer?
-
-<Question
-	choices={[
-		{
-			text: "<code>encode</code>, deoarece poate codifica textul în ID-uri și ID-urile în predicții",
-			explain: "Greșit! Deși metoda <code>encode</code> există pe tokenizers, ea nu există pe modele."
-		},
-		{
-			text: "Apelarea directă a obiectului tokenizer.",
-			explain: "Exact! Metoda <code>__call__</code> a tokenizatorului este foarte puternică și poate gestiona aproape orice. Este și metoda folosită pentru a obține predicții de la un model.",
-			correct: true
-		},
-		{
-			text: "<code>pad</code>",
-			explain: "Greșit! Padding-ul este foarte util, dar este doar o parte a API-ului tokenizer."
-		},
-		{
-			text: "<code>tokenize</code>",
-			explain: "Metoda <code>tokenize</code> este, fără îndoială, una dintre cele mai utile, dar nu reprezintă nucleul API-ului tokenizer."
-		}
-	]}
-/>
-
-### 9. Ce conține variabila `result` în acest exemplu de cod?
-
-```py
-from transformers import AutoTokenizer
-
-tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
-result = tokenizer.tokenize("Hello!")
-```
-
-<Question
-	choices={[
-		{
-			text: "O listă de șiruri de caractere, fiecare șir fiind un token",
-			explain: "Desigur! Convertiți aceste șiruri în ID-uri și transmiteți-le către un model!",
-            correct: true
-		},
-		{
-			text: "O listă de ID-uri",
-			explain: "Incorect; pentru asta folosim metoda <code>__call__</code> sau <code>convert_tokens_to_ids</code>!"
-		},
-		{
-			text: "Un șir care conține toate token-urile",
-			explain: "Nu ar fi optim, deoarece scopul este de a separa șirul inițial în mai multe token-uri."
-		}
-	]}
-/>
-
-{#if fw === 'pt'}
-### 10. Este ceva greșit în următorul cod?
-
-```py
-from transformers import AutoTokenizer, AutoModel
-
-tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
-model = AutoModel.from_pretrained("gpt2")
-
-encoded = tokenizer("Hey!", return_tensors="pt")
-result = model(**encoded)
-```
-
-<Question
-	choices={[
-		{
-			text: "Nu, pare corect.",
-			explain: "Din păcate, asocierea unui model cu un tokenizator care a fost antrenat cu un alt checkpoint rareori este o idee bună. Modelul nu a fost antrenat să interpreteze ieșirea acestui tokenizator, așa că ieșirea modelului (dacă va rula chiar!) nu va avea sens."
-		},
-		{
-			text: "Tokenizerul și modelul trebuie să provină întotdeauna din același checkpoint.",
-			explain: "Corect!",
-            correct: true
-		},
-		{
-			text: "Este o bună practică să folosiți trunchierea și padding-ul cu tokenizatorul, întrucât fiecare intrare este un lot.",
-			explain: "Este adevărat că orice intrare de model are nevoie să fie sub formă de lot. Totuși, trunchierea sau padding-ul acestei secvențe nu ar avea neapărat sens deoarece este singura intrare, iar aceste tehnici se folosesc pentru a trata o listă de propoziții."
-		}
-	]}
-/>
-
-{:else}
-### 10. Este ceva greșit în următorul cod?
-
-```py
-from transformers import AutoTokenizer, TFAutoModel
-
-tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
-model = TFAutoModel.from_pretrained("gpt2")
-
-encoded = tokenizer("Hey!", return_tensors="pt")
-result = model(**encoded)
-```
-
-<Question
-	choices={[
-		{
-			text: "Nu, pare corect.",
-			explain: "Din păcate, asocierea unui model cu un tokenizator care a fost antrenat cu un alt checkpoint rareori este o idee bună. Modelul nu a fost antrenat să interpreteze ieșirea acestui tokenizator, așa că ieșirea modelului (dacă va rula chiar!) nu va avea sens."
-		},
-		{
-			text: "Tokenizerul și modelul trebuie să provină întotdeauna din același checkpoint.",
-			explain: "Corect!",
-            correct: true
-		},
-		{
-			text: "Este o bună practică să folosiți trunchierea și padding-ul cu tokenizatorul, întrucât fiecare intrare este un lot.",
-			explain: "Este adevărat că orice intrare de model trebuie să fie sub formă de batch. Totuși, trunchierea sau padding-ul acestei secvențe nu ar avea neapărat sens deoarece este singura intrare, iar aceste tehnici se folosesc pentru a grupa o listă de propoziții într-un batch."
-		}
-	]}
-/>
-
-{/if}
\ No newline at end of file
diff --git a/chapters/rum/chapter2/9.mdx b/chapters/rum/chapter2/9.mdx
new file mode 100644
index 000000000..248d9286b
--- /dev/null
+++ b/chapters/rum/chapter2/9.mdx
@@ -0,0 +1,310 @@
+<FrameworkSwitchCourse {fw} />
+
+<!-- DISABLE-FRONTMATTER-SECTIONS -->
+
+# Quiz la final de capitol [[quiz-la-final-de-capitol]]
+
+<CourseFloatingBanner
+    chapter={2}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+### 1. Care este ordinea pipeline-ului de modelare a limbajului?
+
+<Question
+	choices={[
+		{
+			text: "Primul, modelul, care gestionează textul și returnează predicții brute. Apoi, tokenizatorul interpretează aceste predicții și le convertește înapoi în text atunci când este necesar.",
+			explain: "Modelul nu poate înțelege textul! Tokenizatorul trebuie mai întâi să tokenizeze textul și să îl convertească în ID-uri, astfel încât să poată fi înțeles de model."
+		},
+		{
+			text: "Primul este tokenizatorul, care gestionează textul și returnează ID-uri. Modelul gestionează aceste ID-uri și generează o predicție, care poate fi un text.",
+			explain: "Predicția modelului nu poate fi transformată imediat în text. Trebuie utilizat tokenizatorul pentru a converti predicția înapoi în text!"
+		},
+		{
+			text: "Tokenizatorul gestionează textul și returnează ID-uri. Modelul gestionează aceste ID-uri și generează o predicție. Tokenizatorul poate fi apoi utilizat din nou pentru a converti aceste predicții înapoi în text.",
+			explain: "Corect! Tokenizatorul poate fi utilizat atât pentru tokenizare, cât și pentru de-tokenizare.",
+            correct: true
+		}
+	]}
+/>
+
+### 2. Câte dimensiuni are tensorul generat de modelul Transformer și care sunt acestea?
+
+<Question
+	choices={[
+		{
+			text: "2: Lungimea secvenței și mărimea lotului",
+			explain: "Fals! Tensor-ul generat de model are a treia dimensiune: mărimea ascunsă."
+		},
+		{
+			text: "2: Lungimea secvenței și mărimea ascunsă",
+			explain: "Fals! Toate modelele Transformer gestionează loturi, chiar și cu o singură secvență; aceasta ar fi o dimensiune a lotului de 1!"
+		},
+		{
+			text: "3: Lungimea secvenței, dimensiunea lotului și dimensiunea ascunsă",
+			explain: "Corect!",
+            correct: true
+		}
+	]}
+/>
+
+### 3. Care dintre următoarele este un exemplu de tokenizare a cuvintelor secundare?
+
+<Question
+	choices={[
+		{
+			text: "WordPiece",
+			explain: "Da, acesta este un exemplu de tokenizare a cuvintelor secundare!",
+            correct: true
+		},
+		{
+			text: "Tokenizare bazată pe caractere",
+			explain: "Tokenizarea bazată pe caractere nu este un tip de tokenizare a cuvintelor secundare."
+		},
+		{
+			text: "Separarea pe baza spațiului și a punctuației",
+			explain: "Corect, aceasta este o schemă de tokenizare bazată pe cuvinte!"
+		},
+		{
+			text: "BPE",
+			explain: "Da, acesta este un exemplu de tokenizare a cuvintelor secundare!",
+            correct: true
+        },
+		{
+			text: "Unigram",
+			explain: "Da, acesta este un exemplu de tokenizare a cuvintelor secundare!",
+            correct: true
+        },
+		{
+			text: "Nimic din cele de mai sus",
+			explain: "Incorect!"
+        }
+	]}
+/>
+
+### 4. Ce este un model head?
+
+<Question
+	choices={[
+		{
+			text: "O componentă a rețelei Transformer de bază care redirecționează tensorii către straturile lor corecte",
+			explain: "Incorect! Nu există o astfel de componentă."
+		},
+		{
+			text: "Cunoscut și sub denumirea de mecanism de auto-atenție, acesta adaptează reprezentarea unui token în funcție de celelalte token-uri din secvență",
+			explain: "Incorect! Layerul de auto-atenție conține „heads” de atenție, dar nu acestea sunt adaptation heads."
+		},
+		{
+			text: "O componentă suplimentară, alcătuită de obicei din unul sau mai multe straturi, pentru a converti predicțiile transformatorului într-o sarcină specifică de ieșire",
+			explain: "Corect. Adaptation heads (sau simplu heads) apar în diverse forme: language modeling heads, question answering heads, sequence classification heads...",
+			correct: true
+		} 
+	]}
+/>
+
+{#if fw === 'pt'}
+### 5. Ce este un AutoModel?
+
+<Question
+	choices={[
+		{
+			text: "Un model care se antrenează automat pe baza datelor dumneavoastră",
+			explain: "Incorect. Poate îl confundați cu produsul nostru <a href='https://huggingface.co/autotrain'>AutoTrain</a>?"
+		},
+		{
+			text: "Un obiect care returnează arhitectura corespunzătoare bazată pe checkpoint.",
+			explain: "Exact: <code>AutoModel</code> are nevoie doar să știe checkpoint-ul din care să se inițializeze pentru a returna arhitectura corectă.",
+			correct: true
+		},
+		{
+			text: "Un model care detectează automat limba utilizată pentru intrările sale pentru a încărca ponderile corecte",
+			explain: "Incorect; deși unele checkpoint-uri și modele pot gestiona mai multe limbi, nu există instrumente integrate pentru selectarea automată a checkpoint-ului în funcție de limbă. Ar trebui să consultați <a href='https://huggingface.co/models'>Model Hub</a> pentru a găsi cel mai bun checkpoint pentru sarcina dumneavoastră!"
+		} 
+	]}
+/>
+
+{:else}
+### 5. Ce este un TFAutoModel?
+
+<Question
+	choices={[
+		{
+			text: "Un model care se antrenează automat pe baza datelor dumneavoastră",
+			explain: "Incorect. Poate îl confundați cu produsul nostru <a href='https://huggingface.co/autotrain'>AutoTrain</a>?"
+		},
+		{
+			text: "Un obiect care returnează arhitectura corespunzătoare bazată pe checkpoint",
+			explain: "Exact: <code>TFAutoModel</code> are nevoie doar să știe checkpoint-ul din care să se inițializeze pentru a returna arhitectura corectă.",
+			correct: true
+		},
+		{
+			text: "Un model care detectează automat limba utilizată pentru intrările sale pentru a încărca ponderile corecte",
+			explain: "Incorect; deși unele checkpoint-uri și modele pot gestiona mai multe limbi, nu există instrumente integrate pentru selectarea automată a checkpoint-ului în funcție de limbă. Ar trebui să consultați <a href='https://huggingface.co/models'>Model Hub</a> pentru a găsi cel mai bun checkpoint pentru sarcina dumneavoastră!"
+		} 
+	]}
+/>
+
+{/if}
+
+### 6. Care sunt tehnicile de care trebuie să țineți cont atunci când grupați secvențe de diferite lungimi?
+
+<Question
+	choices={[
+		{
+			text: "Trunchierea",
+			explain: "Da, trunchierea este o modalitate corectă de a uniformiza secvențele astfel încât acestea să se încadreze într-o formă dreptunghiulară. Este totuși singura modalitate?",
+			correct: true
+		},
+		{
+			text: "Returning tensors",
+			explain: "Deși celelalte tehnici vă permit să returnați tensori dreptunghiulari, doar a returna tensori nu ajută când combinați secvențele într-un lot."
+		},
+		{
+			text: "Padding",
+			explain: "Da, padding-ul este o modalitate corectă de a egaliza secvențele, astfel încât să se potrivească într-o formă dreptunghiulară. Este, însă, singura?",
+			correct: true
+		}, 
+		{
+			text: "Attention masking",
+			explain: "Absolut! Măștile de atenție sunt extrem de importante atunci când gestionați secvențe de lungimi diferite. Totuși, nu este singura tehnică de care trebuie să țineți cont.",
+			correct: true
+		} 
+	]}
+/>
+
+### 7. Care este scopul aplicării unei funcții SoftMax asupra logit-urilor produse de un model de clasificare a secvențelor?
+
+<Question
+	choices={[
+		{
+			text: "Le atenuează logiturile pentru a fi mai de încredere.",
+			explain: "Nu, funcția SoftMax nu afectează fiabilitatea rezultatelor."
+		},
+		{
+			text: "Aplică o limită inferioară și superioară astfel încât valorile să fie inteligibile.",
+			explain: "Corect! Valorile rezultate sunt cuprinse între 0 și 1. Totuși, nu este singurul motiv pentru care folosim o funcție SoftMax.",
+            correct: true
+		},
+		{
+			text: "Suma totală a ieșirii devine 1, ducând la o interpretare probabilistică posibilă.",
+			explain: "Corect! Totuși, nu este singurul motiv pentru care folosim o funcție SoftMax.",
+            correct: true
+		}
+	]}
+/>
+
+### 8. În jurul cărei metode se concentrează cea mai mare parte a API-ului tokenizer?
+
+<Question
+	choices={[
+		{
+			text: "<code>encode</code>, deoarece poate codifica textul în ID-uri și ID-urile în predicții",
+			explain: "Greșit! Deși metoda <code>encode</code> există pe tokenizers, ea nu există pe modele."
+		},
+		{
+			text: "Apelarea directă a obiectului tokenizer.",
+			explain: "Exact! Metoda <code>__call__</code> a tokenizatorului este foarte puternică și poate gestiona aproape orice. Este și metoda folosită pentru a obține predicții de la un model.",
+			correct: true
+		},
+		{
+			text: "<code>pad</code>",
+			explain: "Greșit! Padding-ul este foarte util, dar este doar o parte a API-ului tokenizer."
+		},
+		{
+			text: "<code>tokenize</code>",
+			explain: "Metoda <code>tokenize</code> este, fără îndoială, una dintre cele mai utile, dar nu reprezintă nucleul API-ului tokenizer."
+		}
+	]}
+/>
+
+### 9. Ce conține variabila `result` în acest exemplu de cod?
+
+```py
+from transformers import AutoTokenizer
+
+tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
+result = tokenizer.tokenize("Hello!")
+```
+
+<Question
+	choices={[
+		{
+			text: "O listă de șiruri de caractere, fiecare șir fiind un token",
+			explain: "Desigur! Convertiți aceste șiruri în ID-uri și transmiteți-le către un model!",
+            correct: true
+		},
+		{
+			text: "O listă de ID-uri",
+			explain: "Incorect; pentru asta folosim metoda <code>__call__</code> sau <code>convert_tokens_to_ids</code>!"
+		},
+		{
+			text: "Un șir care conține toate token-urile",
+			explain: "Nu ar fi optim, deoarece scopul este de a separa șirul inițial în mai multe token-uri."
+		}
+	]}
+/>
+
+{#if fw === 'pt'}
+### 10. Este ceva greșit în următorul cod?
+
+```py
+from transformers import AutoTokenizer, AutoModel
+
+tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
+model = AutoModel.from_pretrained("gpt2")
+
+encoded = tokenizer("Hey!", return_tensors="pt")
+result = model(**encoded)
+```
+
+<Question
+	choices={[
+		{
+			text: "Nu, pare corect.",
+			explain: "Din păcate, asocierea unui model cu un tokenizator care a fost antrenat cu un alt checkpoint rareori este o idee bună. Modelul nu a fost antrenat să interpreteze ieșirea acestui tokenizator, așa că ieșirea modelului (dacă va rula chiar!) nu va avea sens."
+		},
+		{
+			text: "Tokenizerul și modelul trebuie să provină întotdeauna din același checkpoint.",
+			explain: "Corect!",
+            correct: true
+		},
+		{
+			text: "Este o bună practică să folosiți trunchierea și padding-ul cu tokenizatorul, întrucât fiecare intrare este un lot.",
+			explain: "Este adevărat că orice intrare de model are nevoie să fie sub formă de lot. Totuși, trunchierea sau padding-ul acestei secvențe nu ar avea neapărat sens deoarece este singura intrare, iar aceste tehnici se folosesc pentru a trata o listă de propoziții."
+		}
+	]}
+/>
+
+{:else}
+### 10. Este ceva greșit în următorul cod?
+
+```py
+from transformers import AutoTokenizer, TFAutoModel
+
+tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
+model = TFAutoModel.from_pretrained("gpt2")
+
+encoded = tokenizer("Hey!", return_tensors="pt")
+result = model(**encoded)
+```
+
+<Question
+	choices={[
+		{
+			text: "Nu, pare corect.",
+			explain: "Din păcate, asocierea unui model cu un tokenizator care a fost antrenat cu un alt checkpoint rareori este o idee bună. Modelul nu a fost antrenat să interpreteze ieșirea acestui tokenizator, așa că ieșirea modelului (dacă va rula chiar!) nu va avea sens."
+		},
+		{
+			text: "Tokenizerul și modelul trebuie să provină întotdeauna din același checkpoint.",
+			explain: "Corect!",
+            correct: true
+		},
+		{
+			text: "Este o bună practică să folosiți trunchierea și padding-ul cu tokenizatorul, întrucât fiecare intrare este un lot.",
+			explain: "Este adevărat că orice intrare de model trebuie să fie sub formă de batch. Totuși, trunchierea sau padding-ul acestei secvențe nu ar avea neapărat sens deoarece este singura intrare, iar aceste tehnici se folosesc pentru a grupa o listă de propoziții într-un batch."
+		}
+	]}
+/>
+
+{/if}
\ No newline at end of file

From fb5ac78d4d840310d705c16b2ed6f8e33ec9a93d Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Tue, 3 Jun 2025 10:57:28 +0300
Subject: [PATCH 135/167] feat: add new translated file about optimized
 inference deployment

---
 chapters/rum/chapter2/8.mdx | 817 ++++++++++++++++++++++++++++++++++++
 1 file changed, 817 insertions(+)

diff --git a/chapters/rum/chapter2/8.mdx b/chapters/rum/chapter2/8.mdx
index e69de29bb..f8456b6d7 100644
--- a/chapters/rum/chapter2/8.mdx
+++ b/chapters/rum/chapter2/8.mdx
@@ -0,0 +1,817 @@
+# Implementarea Optimizată a Inferenței
+
+În această secțiune, vom explora framework-uri avansate pentru optimizarea implementărilor LLM: Text Generation Inference (TGI), vLLM și llama.cpp. Aceste aplicații sunt utilizate în principal în medii de producție pentru a servi LLM-uri utilizatorilor. Această secțiune se concentrează pe modul de implementare a acestor framework-uri în producție, mai degrabă decât pe modul de utilizare pentru inferență pe o singură mașină.
+
+Vom acoperi modul în care aceste instrumente maximizează eficiența inferenței și simplifică implementările de producție ale Modelelor de Limbaj de Mari Dimensiuni.
+
+## Ghid de Selecție a Framework-ului
+
+TGI, vLLM și llama.cpp servesc scopuri similare, dar au caracteristici distincte care le fac mai potrivite pentru diferite cazuri de utilizare. Să ne uităm la diferențele cheie dintre ele, concentrându-ne pe performanță și integrare.
+
+### Gestionarea Memoriei și Performanța
+
+**TGI** este proiectat să fie stabil și previzibil în producție, folosind lungimi fixe de secvență pentru a menține utilizarea memoriei consistentă. TGI gestionează memoria folosind Flash Attention 2 și tehnici de procesare continuă în loturi. Aceasta înseamnă că poate procesa calculele de atenție foarte eficient și poate menține GPU-ul ocupat prin alimentarea constantă cu lucru. Sistemul poate muta părți ale modelului între CPU și GPU când este necesar, ceea ce ajută la gestionarea modelelor mai mari.
+
+<img src="https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/tgi/flash-attn.png" alt="Flash Attention" />
+
+<Tip title="Cum Funcționează Flash Attention">
+Flash Attention este o tehnică care optimizează mecanismul de atenție în modelele transformer prin abordarea blocajelor de lățime de bandă a memoriei. Așa cum s-a discutat mai devreme în [Capitolul 1.8](/course/chapter1/8), mecanismul de atenție are complexitate și utilizare de memorie pătratică, făcându-l ineficient pentru secvențe lungi.
+
+Inovația cheie constă în modul în care gestionează transferurile de memorie între High Bandwidth Memory (HBM) și cache-ul SRAM mai rapid. Atenția tradițională transferă în mod repetat date între HBM și SRAM, creând blocaje prin lăsarea GPU-ului inactiv. Flash Attention încarcă datele o dată în SRAM și efectuează toate calculele acolo, minimizând transferurile costisitoare de memorie.
+
+Deși beneficiile sunt cele mai semnificative în timpul antrenamentului, utilizarea redusă de VRAM și eficiența îmbunătățită a Flash Attention o fac valoroasă și pentru inferență, permițând servirea LLM mai rapidă și mai scalabilă.
+</Tip>
+
+**vLLM** adoptă o abordare diferită prin utilizarea PagedAttention. La fel cum un computer își gestionează memoria în pagini, vLLM împarte memoria modelului în blocuri mai mici. Acest sistem inteligent înseamnă că poate gestiona cereri de dimensiuni diferite mai flexibil și nu risipește spațiul de memorie. Este deosebit de bun la partajarea memoriei între diferite cereri și reduce fragmentarea memoriei, ceea ce face întregul sistem mai eficient.
+
+<Tip title="Cum Funcționează PagedAttention">
+PagedAttention este o tehnică care abordează un alt blocaj critic în inferența LLM: gestionarea memoriei cache KV. Așa cum s-a discutat în [Capitolul 1.8](/course/chapter1/8), în timpul generării de text, modelul stochează cheile și valorile de atenție (cache KV) pentru fiecare token generat pentru a reduce calculele redundante. Cache-ul KV poate deveni enorm, în special cu secvențe lungi sau multiple cereri concurente.
+
+Inovația cheie a vLLM constă în modul în care gestionează acest cache:
+
+1. **Paginarea Memoriei**: În loc să trateze cache-ul KV ca un bloc mare, este împărțit în "pagini" de dimensiune fixă (similar cu memoria virtuală în sistemele de operare).
+2. **Stocare Non-Contigua**: Paginile nu trebuie să fie stocate contiguu în memoria GPU, permițând o alocare mai flexibilă a memoriei.
+3. **Gestionarea Tabelului de Pagini**: Un tabel de pagini urmărește care pagini aparțin cărei secvențe, permițând căutare și acces eficient.
+4. **Partajarea Memoriei**: Pentru operații precum eșantionarea paralelă, paginile care stochează cache-ul KV pentru prompt pot fi partajate între multiple secvențe.
+
+Abordarea PagedAttention poate duce la un throughput de până la 24 de ori mai mare comparativ cu metodele tradiționale, făcând-o o schimbare de paradigmă pentru implementările LLM de producție. Dacă vrei să înțelegi cu adevărat în profunzime cum funcționează PagedAttention, poți citi [ghidul din documentația vLLM](https://docs.vllm.ai/en/latest/design/kernel/paged_attention.html).
+</Tip>
+
+**llama.cpp** este o implementare C/C++ extrem de optimizată proiectată inițial pentru rularea modelelor LLaMA pe hardware de consum. Se concentrează pe eficiența CPU cu accelerație GPU opțională și este ideal pentru medii cu resurse limitate. llama.cpp folosește tehnici de cuantificare pentru a reduce dimensiunea modelului și cerințele de memorie menținând în același timp performanță bună. Implementează kerneluri optimizate pentru diverse arhitecturi CPU și suportă gestionarea de bază a cache-ului KV pentru generarea eficientă de token-uri.
+
+<Tip title="Cum Funcționează Cuantificarea llama.cpp">
+Cuantificarea în llama.cpp reduce precizia ponderilor modelului de la puncte mobile pe 32-bit sau 16-bit la formate de precizie mai mică precum întregi pe 8-bit (INT8), 4-bit sau chiar mai mic. Aceasta reduce semnificativ utilizarea memoriei și îmbunătățește viteza de inferență cu pierderi minime de calitate.
+
+Caracteristicile cheie de cuantificare în llama.cpp includ:
+1. **Multiple Niveluri de Cuantificare**: Suportă cuantificare pe 8-bit, 4-bit, 3-bit și chiar 2-bit
+2. **Format GGML/GGUF**: Folosește formate tensoriale personalizate optimizate pentru inferența cuantificată
+3. **Precizie Mixtă**: Poate aplica diferite niveluri de cuantificare la diferite părți ale modelului
+4. **Optimizări Specifice Hardware**: Include căi de cod optimizate pentru diverse arhitecturi CPU (AVX2, AVX-512, NEON)
+
+Această abordare permite rularea modelelor cu miliarde de parametri pe hardware de consum cu memorie limitată, făcând-o perfectă pentru implementări locale și dispozitive de margine.
+</Tip>
+
+### Implementarea și Integrarea
+
+Să trecem la diferențele de implementare și integrare între framework-uri.
+
+**TGI** excelează în implementarea la nivel enterprise cu caracteristicile sale gata pentru producție. Vine cu suport Kubernetes integrat și include tot ce ai nevoie pentru rularea în producție, precum monitorizarea prin Prometheus și Grafana, scalarea automată și caracteristici cuprinzătoare de siguranță. Sistemul include, de asemenea, logare de nivel enterprise și diverse măsuri de protecție precum filtrarea conținutului și limitarea ratei pentru a menține implementarea sigură și stabilă.
+
+**vLLM** adoptă o abordare mai flexibilă, prietenoasă cu dezvoltatorii pentru implementare. Este construit cu Python în nucleu și poate înlocui cu ușurință API-ul OpenAI în aplicațiile tale existente. Framework-ul se concentrează pe livrarea performanței brute și poate fi personalizat pentru a se potrivi nevoilor tale specifice. Funcționează deosebit de bine cu Ray pentru gestionarea clusterelor, făcându-l o alegere excelentă când ai nevoie de performanță înaltă și adaptabilitate.
+
+**llama.cpp** prioritizează simplitatea și portabilitatea. Implementarea sa de server este ușoară și poate rula pe o gamă largă de hardware, de la servere puternice la laptopuri de consum și chiar unele dispozitive mobile de înaltă performanță. Cu dependențe minime și un nucleu C/C++ simplu, este ușor de implementat în medii unde instalarea framework-urilor Python ar fi provocatoare. Serverul oferă un API compatibil cu OpenAI menținând în același timp un amprentă de resurse mult mai mică decât alte soluții.
+
+## Începerea
+
+Să explorăm cum să folosim aceste framework-uri pentru implementarea LLM-urilor, începând cu instalarea și configurarea de bază.
+
+### Instalarea și Configurarea de Bază
+
+<hfoptions id="inference-frameworks" >
+
+<hfoption value="tgi" label="TGI">
+
+TGI este ușor de instalat și utilizat, cu integrare profundă în ecosistemul Hugging Face.
+
+Mai întâi, lansează serverul TGI folosind Docker:
+
+```sh
+docker run --gpus all \
+    --shm-size 1g \
+    -p 8080:80 \
+    -v ~/.cache/huggingface:/data \
+    ghcr.io/huggingface/text-generation-inference:latest \
+    --model-id HuggingFaceTB/SmolLM2-360M-Instruct
+```
+
+Apoi interacționează cu acesta folosind InferenceClient de la Hugging Face:
+
+```python
+from huggingface_hub import InferenceClient
+
+# Inițializează clientul pointând către endpoint-ul TGI
+client = InferenceClient(
+    model="http://localhost:8080",  # URL către serverul TGI
+)
+
+# Generarea de text
+response = client.text_generation(
+    "Spune-mi o poveste",
+    max_new_tokens=100,
+    temperature=0.7,
+    top_p=0.95,
+    details=True,
+    stop_sequences=[],
+)
+print(response.generated_text)
+
+# Pentru format de chat
+response = client.chat_completion(
+    messages=[
+        {"role": "system", "content": "Ești un asistent util."},
+        {"role": "user", "content": "Spune-mi o poveste"},
+    ],
+    max_tokens=100,
+    temperature=0.7,
+    top_p=0.95,
+)
+print(response.choices[0].message.content)
+```
+
+Alternativ, poți folosi clientul OpenAI:
+
+```python
+from openai import OpenAI
+
+# Inițializează clientul pointând către endpoint-ul TGI
+client = OpenAI(
+    base_url="http://localhost:8080/v1",  # Asigură-te să incluzi /v1
+    api_key="not-needed",  # TGI nu necesită o cheie API în mod implicit
+)
+
+# Completarea de chat
+response = client.chat.completions.create(
+    model="HuggingFaceTB/SmolLM2-360M-Instruct",
+    messages=[
+        {"role": "system", "content": "Ești un asistent util."},
+        {"role": "user", "content": "Spune-mi o poveste"},
+    ],
+    max_tokens=100,
+    temperature=0.7,
+    top_p=0.95,
+)
+print(response.choices[0].message.content)
+```
+</hfoption>
+<hfoption value="llama.cpp" label="llama.cpp">
+
+llama.cpp este ușor de instalat și utilizat, necesitând dependențe minime și suportând atât inferența CPU cât și GPU.
+
+Mai întâi, instalează și construiește llama.cpp:
+
+```sh
+# Clonează depozitul
+git clone https://github.com/ggerganov/llama.cpp
+cd llama.cpp
+
+# Construiește proiectul
+make
+
+# Descarcă modelul SmolLM2-1.7B-Instruct-GGUF
+curl -L -O https://huggingface.co/HuggingFaceTB/SmolLM2-1.7B-Instruct-GGUF/resolve/main/smollm2-1.7b-instruct.Q4_K_M.gguf
+```
+
+Apoi, lansează serverul (cu compatibilitate API OpenAI):
+
+```sh
+# Pornește serverul
+./server \
+    -m smollm2-1.7b-instruct.Q4_K_M.gguf \
+    --host 0.0.0.0 \
+    --port 8080 \
+    -c 4096 \
+    --n-gpu-layers 0  # Setează la un număr mai mare pentru a folosi GPU
+```
+
+Interacționează cu serverul folosind InferenceClient de la Hugging Face:
+
+```python
+from huggingface_hub import InferenceClient
+
+# Inițializează clientul pointând către serverul llama.cpp
+client = InferenceClient(
+    model="http://localhost:8080/v1",  # URL către serverul llama.cpp
+    token="sk-no-key-required",  # serverul llama.cpp necesită acest placeholder
+)
+
+# Generarea de text
+response = client.text_generation(
+    "Spune-mi o poveste",
+    max_new_tokens=100,
+    temperature=0.7,
+    top_p=0.95,
+    details=True,
+)
+print(response.generated_text)
+
+# Pentru format de chat
+response = client.chat_completion(
+    messages=[
+        {"role": "system", "content": "Ești un asistent util."},
+        {"role": "user", "content": "Spune-mi o poveste"},
+    ],
+    max_tokens=100,
+    temperature=0.7,
+    top_p=0.95,
+)
+print(response.choices[0].message.content)
+```
+
+Alternativ, poți folosi clientul OpenAI:
+
+```python
+from openai import OpenAI
+
+# Inițializează clientul pointând către serverul llama.cpp
+client = OpenAI(
+    base_url="http://localhost:8080/v1",
+    api_key="sk-no-key-required",  # serverul llama.cpp necesită acest placeholder
+)
+
+# Completarea de chat
+response = client.chat.completions.create(
+    model="smollm2-1.7b-instruct",  # Identificatorul modelului poate fi orice deoarece serverul încarcă doar un model
+    messages=[
+        {"role": "system", "content": "Ești un asistent util."},
+        {"role": "user", "content": "Spune-mi o poveste"},
+    ],
+    max_tokens=100,
+    temperature=0.7,
+    top_p=0.95,
+)
+print(response.choices[0].message.content)
+```
+</hfoption>
+<hfoption value="vllm" label="vLLM">
+
+vLLM este ușor de instalat și utilizat, cu atât compatibilitatea API OpenAI cât și o interfață Python nativă.
+
+Mai întâi, lansează serverul compatibil OpenAI vLLM:
+
+```sh
+python -m vllm.entrypoints.openai.api_server \
+    --model HuggingFaceTB/SmolLM2-360M-Instruct \
+    --host 0.0.0.0 \
+    --port 8000
+```
+
+Apoi interacționează cu acesta folosind InferenceClient de la Hugging Face:
+
+```python
+from huggingface_hub import InferenceClient
+
+# Inițializează clientul pointând către endpoint-ul vLLM
+client = InferenceClient(
+    model="http://localhost:8000/v1",  # URL către serverul vLLM
+)
+
+# Generarea de text
+response = client.text_generation(
+    "Spune-mi o poveste",
+    max_new_tokens=100,
+    temperature=0.7,
+    top_p=0.95,
+    details=True,
+)
+print(response.generated_text)
+
+# Pentru format de chat
+response = client.chat_completion(
+    messages=[
+        {"role": "system", "content": "Ești un asistent util."},
+        {"role": "user", "content": "Spune-mi o poveste"},
+    ],
+    max_tokens=100,
+    temperature=0.7,
+    top_p=0.95,
+)
+print(response.choices[0].message.content)
+```
+
+Alternativ, poți folosi clientul OpenAI:
+
+```python
+from openai import OpenAI
+
+# Inițializează clientul pointând către endpoint-ul vLLM
+client = OpenAI(
+    base_url="http://localhost:8000/v1",
+    api_key="not-needed",  # vLLM nu necesită o cheie API în mod implicit
+)
+
+# Completarea de chat
+response = client.chat.completions.create(
+    model="HuggingFaceTB/SmolLM2-360M-Instruct",
+    messages=[
+        {"role": "system", "content": "Ești un asistent util."},
+        {"role": "user", "content": "Spune-mi o poveste"},
+    ],
+    max_tokens=100,
+    temperature=0.7,
+    top_p=0.95,
+)
+print(response.choices[0].message.content)
+```
+</hfoption>
+
+</hfoptions>
+
+### Generarea de Bază a Textului
+
+Să ne uităm la exemple de generare de text cu framework-urile:
+
+<hfoptions id="inference-frameworks" >
+
+<hfoption value="tgi" label="TGI">
+
+Mai întâi, implementează TGI cu parametri avansați:
+```sh
+docker run --gpus all \
+    --shm-size 1g \
+    -p 8080:80 \
+    -v ~/.cache/huggingface:/data \
+    ghcr.io/huggingface/text-generation-inference:latest \
+    --model-id HuggingFaceTB/SmolLM2-360M-Instruct \
+    --max-total-tokens 4096 \
+    --max-input-length 3072 \
+    --max-batch-total-tokens 8192 \
+    --waiting-served-ratio 1.2
+```
+
+Folosește InferenceClient pentru generarea flexibilă de text:
+```python
+from huggingface_hub import InferenceClient
+
+client = InferenceClient(model="http://localhost:8080")
+
+# Exemplu de parametri avansați
+response = client.chat_completion(
+    messages=[
+        {"role": "system", "content": "Ești un povestitor creativ."},
+        {"role": "user", "content": "Scrie o poveste creativă"},
+    ],
+    temperature=0.8,
+    max_tokens=200,
+    top_p=0.95,
+)
+print(response.choices[0].message.content)
+
+# Generarea brută de text
+response = client.text_generation(
+    "Scrie o poveste creativă despre explorarea spațiului",
+    max_new_tokens=200,
+    temperature=0.8,
+    top_p=0.95,
+    repetition_penalty=1.1,
+    do_sample=True,
+    details=True,
+)
+print(response.generated_text)
+```
+
+Sau folosește clientul OpenAI:
+```python
+from openai import OpenAI
+
+client = OpenAI(base_url="http://localhost:8080/v1", api_key="not-needed")
+
+# Exemplu de parametri avansați
+response = client.chat.completions.create(
+    model="HuggingFaceTB/SmolLM2-360M-Instruct",
+    messages=[
+        {"role": "system", "content": "Ești un povestitor creativ."},
+        {"role": "user", "content": "Scrie o poveste creativă"},
+    ],
+    temperature=0.8,  # Mai mare pentru mai multă creativitate
+)
+print(response.choices[0].message.content)
+```
+</hfoption>
+<hfoption value="llama.cpp" label="llama.cpp">
+
+Pentru llama.cpp, poți seta parametri avansați când lansezi serverul:
+
+```sh
+./server \
+    -m smollm2-1.7b-instruct.Q4_K_M.gguf \
+    --host 0.0.0.0 \
+    --port 8080 \
+    -c 4096 \            # Dimensiunea contextului
+    --threads 8 \        # Thread-uri CPU de folosit
+    --batch-size 512 \   # Dimensiunea lotului pentru evaluarea prompt-ului
+    --n-gpu-layers 0     # Straturi GPU (0 = doar CPU)
+```
+
+Folosește InferenceClient:
+
+```python
+from huggingface_hub import InferenceClient
+
+client = InferenceClient(model="http://localhost:8080/v1", token="sk-no-key-required")
+
+# Exemplu de parametri avansați
+response = client.chat_completion(
+    messages=[
+        {"role": "system", "content": "Ești un povestitor creativ."},
+        {"role": "user", "content": "Scrie o poveste creativă"},
+    ],
+    temperature=0.8,
+    max_tokens=200,
+    top_p=0.95,
+)
+print(response.choices[0].message.content)
+
+# Pentru generarea directă de text
+response = client.text_generation(
+    "Scrie o poveste creativă despre explorarea spațiului",
+    max_new_tokens=200,
+    temperature=0.8,
+    top_p=0.95,
+    repetition_penalty=1.1,
+    details=True,
+)
+print(response.generated_text)
+```
+
+Sau folosește clientul OpenAI pentru generare cu control asupra parametrilor de eșantionare:
+
+```python
+from openai import OpenAI
+
+client = OpenAI(base_url="http://localhost:8080/v1", api_key="sk-no-key-required")
+
+# Exemplu de parametri avansați
+response = client.chat.completions.create(
+    model="smollm2-1.7b-instruct",
+    messages=[
+        {"role": "system", "content": "Ești un povestitor creativ."},
+        {"role": "user", "content": "Scrie o poveste creativă"},
+    ],
+    temperature=0.8,  # Mai mare pentru mai multă creativitate
+    top_p=0.95,  # Probabilitatea eșantionării nucleus
+    frequency_penalty=0.5,  # Reduce repetarea token-urilor frecvente
+    presence_penalty=0.5,  # Reduce repetarea prin penalizarea token-urilor deja prezente
+    max_tokens=200,  # Lungimea maximă de generare
+)
+print(response.choices[0].message.content)
+```
+
+Poți folosi, de asemenea, biblioteca nativă llama.cpp pentru un control și mai mare:
+
+```python
+# Folosind pachetul llama-cpp-python pentru accesul direct la model
+from llama_cpp import Llama
+
+# Încarcă modelul
+llm = Llama(
+    model_path="smollm2-1.7b-instruct.Q4_K_M.gguf",
+    n_ctx=4096,  # Dimensiunea ferestrei de context
+    n_threads=8,  # Thread-uri CPU
+    n_gpu_layers=0,  # Straturi GPU (0 = doar CPU)
+)
+
+# Formatează prompt-ul conform formatului așteptat al modelului
+prompt = """<|im_start|>system
+Ești un povestitor creativ.
+<|im_end|>
+<|im_start|>user
+Scrie o poveste creativă
+<|im_end|>
+<|im_start|>assistant
+"""
+
+# Generează răspunsul cu control precis al parametrilor
+output = llm(
+    prompt,
+    max_tokens=200,
+    temperature=0.8,
+    top_p=0.95,
+    frequency_penalty=0.5,
+    presence_penalty=0.5,
+    stop=["<|im_end|>"],
+)
+
+print(output["choices"][0]["text"])
+```
+</hfoption>
+<hfoption value="vllm" label="vLLM">
+
+Pentru utilizarea avansată cu vLLM, poți folosi InferenceClient:
+
+```python
+from huggingface_hub import InferenceClient
+
+client = InferenceClient(model="http://localhost:8000/v1")
+
+# Exemplu de parametri avansați
+response = client.chat_completion(
+    messages=[
+        {"role": "system", "content": "Ești un povestitor creativ."},
+        {"role": "user", "content": "Scrie o poveste creativă"},
+    ],
+    temperature=0.8,
+    max_tokens=200,
+    top_p=0.95,
+)
+print(response.choices[0].message.content)
+
+# Pentru generarea directă de text
+response = client.text_generation(
+    "Scrie o poveste creativă despre explorarea spațiului",
+    max_new_tokens=200,
+    temperature=0.8,
+    top_p=0.95,
+    details=True,
+)
+print(response.generated_text)
+```
+
+Poți folosi, de asemenea, clientul OpenAI:
+
+```python
+from openai import OpenAI
+
+client = OpenAI(base_url="http://localhost:8000/v1", api_key="not-needed")
+
+# Exemplu de parametri avansați
+response = client.chat.completions.create(
+    model="HuggingFaceTB/SmolLM2-360M-Instruct",
+    messages=[
+        {"role": "system", "content": "Ești un povestitor creativ."},
+        {"role": "user", "content": "Scrie o poveste creativă"},
+    ],
+    temperature=0.8,
+    top_p=0.95,
+    max_tokens=200,
+)
+print(response.choices[0].message.content)
+```
+
+vLLM oferă, de asemenea, o interfață Python nativă cu control fin:
+
+```python
+from vllm import LLM, SamplingParams
+
+# Inițializează modelul cu parametri avansați
+llm = LLM(
+    model="HuggingFaceTB/SmolLM2-360M-Instruct",
+    gpu_memory_utilization=0.85,
+    max_num_batched_tokens=8192,
+    max_num_seqs=256,
+    block_size=16,
+)
+
+# Configurează parametrii de eșantionare
+sampling_params = SamplingParams(
+    temperature=0.8,  # Mai mare pentru mai multă creativitate
+    top_p=0.95,  # Consideră masa de probabilitate de top 95%
+    max_tokens=100,  # Lungimea maximă
+    presence_penalty=1.1,  # Reduce repetarea
+    frequency_penalty=1.1,  # Reduce repetarea
+    stop=["\n\n", "###"],  # Secvențe de oprire
+)
+
+# Generează text
+prompt = "Scrie o poveste creativă"
+outputs = llm.generate(prompt, sampling_params)
+print(outputs[0].outputs[0].text)
+
+# Pentru interacțiuni în stil chat
+chat_prompt = [
+    {"role": "system", "content": "Ești un povestitor creativ."},
+    {"role": "user", "content": "Scrie o poveste creativă"},
+]
+formatted_prompt = llm.get_chat_template()(chat_prompt)  # Folosește șablonul de chat al modelului
+outputs = llm.generate(formatted_prompt, sampling_params)
+print(outputs[0].outputs[0].text)
+```
+</hfoption>
+
+</hfoptions>
+
+## Controlul Avansat al Generării
+
+### Selecția Token-urilor și Eșantionarea
+
+Procesul de generare a textului implică selectarea următorului token la fiecare pas. Acest proces de selecție poate fi controlat prin diverși parametri:
+
+1. **Logit-uri Brute**: Probabilitățile inițiale de ieșire pentru fiecare token
+2. **Temperatura**: Controlează aleatoriul în selecție (mai mare = mai creativ)
+3. **Eșantionarea Top-p (Nucleus)**: Filtrează la token-urile de top care alcătuiesc X% din masa de probabilitate
+4. **Filtrarea Top-k**: Limitează selecția la k token-uri cele mai probabile
+
+Iată cum să configurezi acești parametri:
+
+<hfoptions id="inference-frameworks" >
+
+<hfoption value="tgi" label="TGI">
+
+```python
+client.generate(
+    "Scrie o poveste creativă",
+    temperature=0.8,  # Mai mare pentru mai multă creativitate
+    top_p=0.95,  # Consideră masa de probabilitate de top 95%
+    top_k=50,  # Consideră top 50 de token-uri
+    max_new_tokens=100,  # Lungimea maximă
+    repetition_penalty=1.1,  # Reduce repetarea
+)
+```
+</hfoption>
+<hfoption value="llama.cpp" label="llama.cpp">
+
+```python
+# Prin compatibilitatea API OpenAI
+response = client.completions.create(
+    model="smollm2-1.7b-instruct",  # Numele modelului (poate fi orice string pentru serverul llama.cpp)
+    prompt="Scrie o poveste creativă",
+    temperature=0.8,  # Mai mare pentru mai multă creativitate
+    top_p=0.95,  # Consideră masa de probabilitate de top 95%
+    frequency_penalty=1.1,  # Reduce repetarea
+    presence_penalty=0.1,  # Reduce repetarea
+    max_tokens=100,  # Lungimea maximă
+)
+
+# Prin accesul direct llama-cpp-python
+output = llm(
+    "Scrie o poveste creativă",
+    temperature=0.8,
+    top_p=0.95,
+    top_k=50,
+    max_tokens=100,
+    repeat_penalty=1.1,
+)
+```
+</hfoption>
+<hfoption value="vllm" label="vLLM">
+
+```python
+params = SamplingParams(
+    temperature=0.8,  # Mai mare pentru mai multă creativitate
+    top_p=0.95,  # Consideră masa de probabilitate de top 95%
+    top_k=50,  # Consideră top 50 de token-uri
+    max_tokens=100,  # Lungimea maximă
+    presence_penalty=0.1,  # Reduce repetarea
+)
+llm.generate("Scrie o poveste creativă", sampling_params=params)
+```
+</hfoption>
+
+</hfoptions>
+
+### Controlul Repetării
+
+Ambele framework-uri oferă modalități de a preveni generarea repetitivă de text:
+
+<hfoptions id="inference-frameworks" >
+
+<hfoption value="tgi" label="TGI">
+```python
+client.generate(
+    "Scrie un text variat",
+    repetition_penalty=1.1,  # Penalizează token-urile repetate
+    no_repeat_ngram_size=3,  # Previne repetarea de 3-grame
+)
+```
+</hfoption>
+<hfoption value="llama.cpp" label="llama.cpp">
+
+```python
+# Prin API OpenAI
+response = client.completions.create(
+    model="smollm2-1.7b-instruct",
+    prompt="Scrie un text variat",
+    frequency_penalty=1.1,  # Penalizează token-urile frecvente
+    presence_penalty=0.8,  # Penalizează token-urile deja prezente
+)
+
+# Prin biblioteca directă
+output = llm(
+    "Scrie un text variat",
+    repeat_penalty=1.1,  # Penalizează token-urile repetate
+    frequency_penalty=0.5,  # Penalitate de frecvență adițională
+    presence_penalty=0.5,  # Penalitate de prezență adițională
+)
+```
+</hfoption>
+<hfoption value="vllm" label="vLLM">
+
+```python
+params = SamplingParams(
+    presence_penalty=0.1,  # Penalizează prezența token-urilor
+    frequency_penalty=0.1,  # Penalizează frecvența token-urilor
+)
+```
+</hfoption>
+
+</hfoptions>
+
+### Controlul Lungimii și Secvențele de Oprire
+
+Poți controla lungimea generării și specifica când să se oprească:
+
+<hfoptions id="inference-frameworks" >
+
+<hfoption value="tgi" label="TGI">
+```python
+client.generate(
+    "Generează un paragraf scurt",
+    max_new_tokens=100,
+    min_new_tokens=10,
+    stop_sequences=["\n\n", "###"],
+)
+```
+</hfoption>
+<hfoption value="llama.cpp" label="llama.cpp">
+
+```python
+# Prin API OpenAI
+response = client.completions.create(
+    model="smollm2-1.7b-instruct",
+    prompt="Generează un paragraf scurt",
+    max_tokens=100,
+    stop=["\n\n", "###"],
+)
+
+# Prin biblioteca directă
+output = llm("Generează un paragraf scurt", max_tokens=100, stop=["\n\n", "###"])
+```
+</hfoption>
+<hfoption value="vllm" label="vLLM">
+
+```python
+params = SamplingParams(
+    max_tokens=100,
+    min_tokens=10,
+    stop=["###", "\n\n"],
+    ignore_eos=False,
+    skip_special_tokens=True,
+)
+```
+</hfoption>
+
+</hfoptions>
+
+## Gestionarea Memoriei
+
+Ambele framework-uri implementează tehnici avansate de gestionare a memoriei pentru inferența eficientă.
+
+<hfoptions id="inference-frameworks" >
+
+<hfoption value="tgi" label="TGI">
+TGI folosește Flash Attention 2 și procesarea continuă în loturi:
+
+```sh
+# Implementarea Docker cu optimizarea memoriei
+docker run --gpus all -p 8080:80 \
+    --shm-size 1g \
+    ghcr.io/huggingface/text-generation-inference:latest \
+    --model-id HuggingFaceTB/SmolLM2-1.7B-Instruct \
+    --max-batch-total-tokens 8192 \
+    --max-input-length 4096
+```
+</hfoption>
+<hfoption value="llama.cpp" label="llama.cpp">
+
+llama.cpp folosește cuantificarea și dispunerea optimată a memoriei:
+
+```sh
+# Server cu optimizări de memorie
+./server \
+    -m smollm2-1.7b-instruct.Q4_K_M.gguf \
+    --host 0.0.0.0 \
+    --port 8080 \
+    -c 2048 \               # Dimensiunea contextului
+    --threads 4 \           # Thread-uri CPU
+    --n-gpu-layers 32 \     # Folosește mai multe straturi GPU pentru modele mai mari
+    --mlock \               # Blochează memoria pentru a preveni swapping-ul
+    --cont-batching         # Activează procesarea continuă în loturi
+```
+
+Pentru modele prea mari pentru GPU-ul tău, poți folosi offloading-ul CPU:
+
+```sh
+./server \
+    -m smollm2-1.7b-instruct.Q4_K_M.gguf \
+    --n-gpu-layers 20 \     # Păstrează primele 20 de straturi pe GPU
+    --threads 8             # Folosește mai multe thread-uri CPU pentru straturile CPU
+```
+</hfoption>
+<hfoption value="vllm" label="vLLM">
+
+vLLM folosește PagedAttention pentru gestionarea optimă a memoriei:
+
+```python
+from vllm.engine.arg_utils import AsyncEngineArgs
+
+engine_args = AsyncEngineArgs(
+    model="HuggingFaceTB/SmolLM2-1.7B-Instruct",
+    gpu_memory_utilization=0.85,
+    max_num_batched_tokens=8192,
+    block_size=16,
+)
+
+llm = LLM(engine_args=engine_args)
+```
+</hfoption>
+
+</hfoptions>
+
+## Resurse
+
+- [Documentația Text Generation Inference](https://huggingface.co/docs/text-generation-inference)
+- [Depozitul GitHub TGI](https://github.com/huggingface/text-generation-inference)
+- [Documentația vLLM](https://vllm.readthedocs.io/)
+- [Depozitul GitHub vLLM](https://github.com/vllm-project/vllm)
+- [Lucrarea PagedAttention](https://arxiv.org/abs/2309.06180)
+- [Depozitul GitHub llama.cpp](https://github.com/ggerganov/llama.cpp)
+- [Depozitul llama-cpp-python](https://github.com/abetlen/llama-cpp-python)
\ No newline at end of file

From b7794d46905fa04014b3e4e14699a0bc2baecec4 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Tue, 3 Jun 2025 11:06:56 +0300
Subject: [PATCH 136/167] feat: apply styling

---
 chapters/rum/chapter2/8.mdx | 4 +++-
 1 file changed, 3 insertions(+), 1 deletion(-)

diff --git a/chapters/rum/chapter2/8.mdx b/chapters/rum/chapter2/8.mdx
index f8456b6d7..13563203d 100644
--- a/chapters/rum/chapter2/8.mdx
+++ b/chapters/rum/chapter2/8.mdx
@@ -571,7 +571,9 @@ chat_prompt = [
     {"role": "system", "content": "Ești un povestitor creativ."},
     {"role": "user", "content": "Scrie o poveste creativă"},
 ]
-formatted_prompt = llm.get_chat_template()(chat_prompt)  # Folosește șablonul de chat al modelului
+formatted_prompt = llm.get_chat_template()(
+    chat_prompt
+)  # Folosește șablonul de chat al modelului
 outputs = llm.generate(formatted_prompt, sampling_params)
 print(outputs[0].outputs[0].text)
 ```

From f77a6944855ad60b952fb339a81d895297783c3e Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Tue, 3 Jun 2025 11:12:39 +0300
Subject: [PATCH 137/167] feat: add grumpycatyo-collab as contributor for
 reviewing

---
 README.md | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/README.md b/README.md
index 07dadca56..42f187cea 100644
--- a/README.md
+++ b/README.md
@@ -27,7 +27,7 @@ This repo contains the content that's used to create the **[Hugging Face course]
 | [Vietnamese](https://huggingface.co/course/vi/chapter1/1)               | [`chapters/vi`](https://github.com/huggingface/course/tree/main/chapters/vi)       | [@honghanhh](https://github.com/honghanhh)                                                                                                                                                                                                                                                                                                               |
 | [Chinese (simplified)](https://huggingface.co/course/zh-CN/chapter1/1)  | [`chapters/zh-CN`](https://github.com/huggingface/course/tree/main/chapters/zh-CN) | [@zhlhyx](https://github.com/zhlhyx), [petrichor1122](https://github.com/petrichor1122), [@1375626371](https://github.com/1375626371)                                                                                                                                                                                                                    |
 | [Chinese (traditional)](https://huggingface.co/course/zh-TW/chapter1/1) (WIP) | [`chapters/zh-TW`](https://github.com/huggingface/course/tree/main/chapters/zh-TW) | [@davidpeng86](https://github.com/davidpeng86)                                                                                                                                                                                                                                                                                                           |
-| [Romanian](https://huggingface.co/course/rum/chapter1/1) (WIP) | [`chapters/rum`](https://github.com/huggingface/course/tree/main/chapters/rum) | [@Sigmoid](https://github.com/SigmoidAI), [@eduard-balamatiuc](https://github.com/eduard-balamatiuc), [@FriptuLudmila](https://github.com/FriptuLudmila), [@tokyo-s](https://github.com/tokyo-s), [@hbkdesign](https://github.com/hbkdesign)                                                                                                                                                                                                                                                                                                             |
+| [Romanian](https://huggingface.co/course/rum/chapter1/1) (WIP) | [`chapters/rum`](https://github.com/huggingface/course/tree/main/chapters/rum) | [@Sigmoid](https://github.com/SigmoidAI), [@eduard-balamatiuc](https://github.com/eduard-balamatiuc), [@FriptuLudmila](https://github.com/FriptuLudmila), [@tokyo-s](https://github.com/tokyo-s), [@hbkdesign](https://github.com/hbkdesign), [@grumpycatyo-collab](https://github.com/grumpycatyo-collab)                                                                                                                                                                                                                                                                                                             |
 
 ### Translating the course into your language
 

From d44c2fd796e4b42f135c82bc11c9288049f830ae Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Tue, 3 Jun 2025 11:36:34 +0300
Subject: [PATCH 138/167] fix: solve all PR threads recommendations

---
 chapters/rum/chapter3/2.mdx    | 22 +++++++++++-----------
 chapters/rum/chapter3/3.mdx    |  2 +-
 chapters/rum/chapter3/3_tf.mdx |  9 ++++-----
 chapters/rum/chapter3/4.mdx    | 22 +++++++++++-----------
 chapters/rum/chapter3/6.mdx    | 16 ++++++++--------
 5 files changed, 35 insertions(+), 36 deletions(-)

diff --git a/chapters/rum/chapter3/2.mdx b/chapters/rum/chapter3/2.mdx
index 9292cd061..e6f391072 100644
--- a/chapters/rum/chapter3/2.mdx
+++ b/chapters/rum/chapter3/2.mdx
@@ -23,7 +23,7 @@
 {/if}
 
 {#if fw === 'pt'}
-Continuând cu exemplul din [capitolul anterior](/course/chapter2), iată cum am antrena un clasificator de secvențe pe un lot în PyTorch:
+Continuând cu exemplul din [capitolul anterior](/course/chapter2), iată cum am antrena un clasificator de secvențe pe un batch în PyTorch:
 
 ```python
 import torch
@@ -48,7 +48,7 @@ loss.backward()
 optimizer.step()
 ```
 {:else}
-Continuând cu exemplul din [capitolul anterior](/course/chapter2), iată cum am antrena un clasificator de secvențe pe un lot în TensorFlow:
+Continuând cu exemplul din [capitolul anterior](/course/chapter2), iată cum am antrena un clasificator de secvențe pe un batch în TensorFlow:
 
 ```python
 import tensorflow as tf
@@ -246,9 +246,9 @@ def tokenize_function(example):
     return tokenizer(example["sentence1"], example["sentence2"], truncation=True)
 ```
 
-Această funcție acceptă un dicționar (precum elementele din setul nostru de date) și returnează un nou dicționar cu cheile `input_ids`, `attention_mask` și `token_type_ids`. Rețineți că funcționează și în cazul în care dicționarul `example` conține mai multe eșantioane (fiecare cheie fiind o listă de propoziții), deoarece `tokenizer` funcționează pe liste de perechi de propoziții, așa cum am văzut anterior. Acest lucru ne va permite să folosim opțiunea `batched=True` în apelul nostru la `map()`, ceea ce va accelera foarte mult tokenizarea. `tokenizer` este susținut de un tokenizer scris în Rust din biblioteca [🤗 Tokenizers](https://github.com/huggingface/tokenizers). Acest tokenizator poate fi foarte rapid, dar numai dacă îi oferim o mulțime de intrări deodată.
+Această funcție acceptă un dicționar (precum elementele din setul nostru de date) și returnează un nou dicționar cu cheile `input_ids`, `attention_mask` și `token_type_ids`. Rețineți că funcționează și în cazul în care dicționarul `example` conține mai multe eșantioane (fiecare cheie fiind o listă de propoziții), deoarece `tokenizer` funcționează pe liste de perechi de propoziții, așa cum am văzut anterior. Acest lucru ne va permite să folosim opțiunea `batched=True` în apelul nostru la `map`, ceea ce va accelera foarte mult tokenizarea. `tokenizer` este susținut de un tokenizer scris în Rust din biblioteca [🤗 Tokenizers](https://github.com/huggingface/tokenizers). Acest tokenizator poate fi foarte rapid, dar numai dacă îi oferim o mulțime de intrări deodată.
 
-Rețineți că am omis deocamdată argumentul `padding` în funcția noastră de tokenizare. Acest lucru se datorează faptului că umplerea tuturor eșantioanelor la lungimea maximă nu este eficientă: este mai bine să umplem eșantioanele atunci când construim un lot, deoarece atunci trebuie să umplem doar la lungimea maximă din acel lot, și nu la lungimea maximă din întregul set de date. Acest lucru poate economisi mult timp și putere de procesare atunci când intrările au lungimi variate! 
+Rețineți că am omis deocamdată argumentul `padding` în funcția noastră de tokenizare. Acest lucru se datorează faptului că umplerea tuturor eșantioanelor la lungimea maximă nu este eficientă: este mai bine să umplem eșantioanele atunci când construim un batch, deoarece atunci trebuie să umplem doar la lungimea maximă din acel batch, și nu la lungimea maximă din întregul set de date. Acest lucru poate economisi mult timp și putere de procesare atunci când intrările au lungimi variate! 
 
 Iată cum aplicăm funcția de tokenizare la toate seturile noastre de date simultan. Utilizăm `batched=True` în apelul către `map`, astfel încât funcția să fie aplicată la mai multe elemente ale setului nostru de date simultan, și nu la fiecare element în parte. Acest lucru permite o preprocesare mai rapidă.
 
@@ -287,15 +287,15 @@ Ultimul lucru pe care va trebui să îl facem este să umplem toate exemplele la
 <Youtube id="7q5NyFT8REg"/>
 
 {#if fw === 'pt'}
-Funcția care este responsabilă de combinarea eșantioanelor în cadrul unui lot se numește *funcție de concatenare*. Este un argument pe care îl puteți trece atunci când construiți un `DataLoader`, implicit fiind o funcție care va converti eșantioanele în tensori PyTorch și le va concatena (recursiv dacă elementele sunt liste, tupluri sau dicționare). Acest lucru nu va fi posibil în cazul nostru, deoarece intrările pe care le avem nu vor fi toate de aceeași dimensiune. Am amânat în mod deliberat umplerea, pentru a o aplica doar în funcție de necesități la fiecare lot și pentru a evita să avem intrări prea lungi cu o mulțime de umpluturi. Acest lucru va accelera antrenamentul destul de mult, dar rețineți că, dacă vă antrenați pe o TPU, acest lucru poate cauza probleme - TPU preferă formele fixe, chiar și atunci când acest lucru necesită o umplutură suplimentară.
+Funcția care este responsabilă de combinarea eșantioanelor în cadrul unui batch se numește *funcție de colaționare*. Este un argument pe care îl puteți trece atunci când construiți un `DataLoader`, implicit fiind o funcție care va converti eșantioanele în tensori PyTorch și le va concatena (recursiv dacă elementele dvs. sunt liste, tupluri sau dicționare). În cazul nostru, va fi de asemenea să aplicați umplutură pentru a avea toate intrările de aceeași lungime. Clasa `DataCollatorWithPadding` face exact acest lucru (și un pic mai mult, după cum am văzut anterior). Ia un tokenizer atunci când este instanțiat (pentru a știi ce token de completare să folosească și dacă modelul se așteaptă la padding în stânga sau în dreapta) și va face tot ce aveți nevoie. Umplerea dinamică poate fi aplicată în funcție de necesități la fiecare batch și pentru a evita să avem intrări prea lungi cu o mulțime de umpluturi. Acest lucru va accelera antrenamentul destul de mult, dar rețineți că, dacă vă antrenați pe o TPU, acest lucru poate cauza probleme - TPU-urile preferă forme fixe, chiar și atunci când ar putea necesita padding suplimentar.
 
 {:else}
 
-Funcția care este responsabilă de reunirea eșantioanelor în cadrul unui lot se numește *funcție de colaționare*. Funcția de colaționare implicită este o funcție care va converti eșantioanele în tf.Tensor și le va concatena (recursiv dacă elementele dvs. sunt liste, tuples sau dicționare). Acest lucru nu va fi posibil în cazul nostru, deoarece intrările pe care le avem nu vor fi toate de aceeași dimensiune. Am amânat în mod deliberat umplerea, pentru a o aplica doar în funcție de necesități la fiecare lot și pentru a evita să avem intrări prea lungi cu o mulțime de umpluturi. Acest lucru va accelera antrenamentul destul de mult, dar rețineți că, dacă vă antrenați pe o TPU, acest lucru poate cauza probleme - TPU preferă formele fixe, chiar și atunci când acest lucru necesită o umplutură suplimentară.
+Funcția care este responsabilă de reunirea eșantioanelor în cadrul unui batch se numește *funcție de colaționare*. Funcția de colaționare implicită este o funcție care va converti eșantioanele în tf.Tensor și le va concatena (recursiv dacă elementele dvs. sunt liste, tuples sau dicționare). În cazul nostru, va fi de asemenea să aplicați umplutură pentru a avea toate intrările de aceeași lungime. Clasa `DataCollatorWithPadding` face exact acest lucru (și un pic mai mult, după cum am văzut anterior). Ia un tokenizer atunci când este instanțiat (pentru a știi ce token de completare să folosească și dacă modelul se așteaptă la padding în stânga sau în dreapta) și va face tot ce aveți nevoie. Umplerea dinamică poate fi aplicată în funcție de necesități la fiecare batch și pentru a evita să avem intrări prea lungi cu o mulțime de umpluturi. Acest lucru va accelera antrenamentul destul de mult, dar rețineți că, dacă vă antrenați pe o TPU, acest lucru poate cauza probleme - TPU-urile preferă forme fixe, chiar și atunci când ar putea necesita padding suplimentar.
 
 {/if}
 
-Pentru a face acest lucru în practică, trebuie să definim o funcție de colaționare care va aplica cantitatea corectă de umplutură elementelor din setul de date pe care dorim să le grupăm. Din fericire, biblioteca 🤗 Transformers ne oferă o astfel de funcție prin `DataCollatorWithPadding`. Aceasta preia un tokenizer atunci când o instanțiați (pentru a ști ce token de umplutură să utilizați și dacă modelul se așteaptă ca umplutura să fie la stânga sau la dreapta intrărilor) și va face tot ceea ce aveți nevoie:
+Pentru a face acest lucru în practică, trebuie să definim o funcție de colaționare care va aplica cantitatea corectă de umplutură elementelor din setul de date pe care dorim să le grupăm. Din fericire, biblioteca 🤗 Transformers ne oferă o astfel de funcție prin `DataCollatorWithPadding`. Aceasta preia un tokenizer atunci când o instanțiați (pentru a știi ce token de umplutură să utilizați și dacă modelul se așteaptă ca umplutura să fie la stânga sau la dreapta intrărilor) și va face tot ceea ce aveți nevoie:
 
 {#if fw === 'pt'}
 ```py
@@ -311,7 +311,7 @@ data_collator = DataCollatorWithPadding(tokenizer=tokenizer, return_tensors="tf"
 ```
 {/if}
 
-Pentru a testa această nouă opțiune, să luăm câteva eșantioane din setul nostru de formare pe care dorim să le grupăm. Aici, eliminăm coloanele `idx`, `sentence1` și `sentence2` deoarece nu vor fi necesare și conțin șiruri de caractere (și nu putem crea tensori cu șiruri de caractere) și aruncăm o privire la lungimile fiecărei intrări din lot:
+Pentru a testa această nouă opțiune, să luăm câteva eșantioane din setul nostru de formare pe care dorim să le grupăm. Aici, eliminăm coloanele `idx`, `sentence1` și `sentence2` deoarece nu vor fi necesare și conțin șiruri de caractere (și nu putem crea tensori cu șiruri de caractere) și aruncăm o privire la lungimile fiecărei intrări din batch:
 
 ```py
 samples = tokenized_datasets["train"][:8]
@@ -323,7 +323,7 @@ samples = {k: v for k, v in samples.items() if k not in ["idx", "sentence1", "se
 [50, 59, 47, 67, 59, 50, 62, 32]
 ```
 
-Nici o surpriză, obținem eșantioane de diferite lungimi, de la 32 la 67. Umplerea dinamică înseamnă că toate eșantioanele din acest lot ar trebui să fie umplute la o lungime de 67, lungimea maximă din cadrul lotului. Fără umplutură dinamică, toate eșantioanele ar trebui să fie umplute la lungimea maximă din întregul set de date sau la lungimea maximă pe care modelul o poate accepta. Să verificăm de două ori dacă `data_collator` completează dinamic lotul în mod corespunzător:
+Nici o surpriză, obținem eșantioane de diferite lungimi, de la 32 la 67. Umplerea dinamică înseamnă că toate eșantioanele din acest batch ar trebui să fie umplute la o lungime de 67, lungimea maximă din cadrul batch-ului. Fără umplutură dinamică, toate eșantioanele ar trebui să fie umplute la lungimea maximă din întregul set de date sau la lungimea maximă pe care modelul o poate accepta. Să verificăm de două ori dacă `data_collator` completează dinamic batch-ul în mod corespunzător:
 
 ```py
 batch = data_collator(samples)
@@ -348,7 +348,7 @@ batch = data_collator(samples)
  'labels': torch.Size([8])}
 ```
 
-Perfect! Acum că am trecut de la text brut la loturi cu care modelul nostru se poate descurca, suntem gata să îl ajustăm!
+Perfect! Acum că am trecut de la text brut la batch-uri cu care modelul nostru se poate descurca, suntem gata să îl ajustăm!
 
 {/if}
 
@@ -360,7 +360,7 @@ Perfect! Acum că am trecut de la text brut la loturi cu care modelul nostru se
 
 {#if fw === 'tf'}
 
-Acum că avem setul nostru de date și un compilator de date, trebuie să le punem împreună. Am putea încărca manual loturi și să le asamblăm, dar este mult de lucru și probabil nici nu este foarte eficient. În schimb, există o metodă simplă care oferă o soluție performantă la această problemă: `to_tf_dataset()`. Aceasta va înfășura un `tf.data.Dataset` în jurul setului dvs. de date, cu o funcție de colaționare opțională. `tf.data.Dataset` este un format TensorFlow nativ pe care Keras îl poate utiliza pentru `model.fit()`, astfel încât această metodă convertește imediat un set de date 🤗 într-un format care este pregătit pentru antrenament. Să o vedem în acțiune cu setul nostru de date!
+Acum că avem setul nostru de date și un compilator de date, trebuie să le punem împreună. Am putea încărca manual batch-uri și să le asamblăm, dar este mult de lucru și probabil nici nu este foarte eficient. În schimb, există o metodă simplă care oferă o soluție performantă la această problemă: `to_tf_dataset()`. Aceasta va împacheta un `tf.data.Dataset` cu funcția de colaționare încorporată. Dacă utilizați `DataCollatorWithPadding`, acest lucru nu va fi o problemă deoarece ea funcționează cu dicționare, liste și tensori NumPy, precum și cu tensori TensorFlow!
 
 ```py
 tf_train_dataset = tokenized_datasets["train"].to_tf_dataset(
diff --git a/chapters/rum/chapter3/3.mdx b/chapters/rum/chapter3/3.mdx
index eb50bf596..5da0fc0dd 100644
--- a/chapters/rum/chapter3/3.mdx
+++ b/chapters/rum/chapter3/3.mdx
@@ -44,7 +44,7 @@ training_args = TrainingArguments("test-trainer")
 
 <Tip>
 
-💡 Dacă doriți să încărcați automat modelul în Hub în timpul instruirii, treceți `push_to_hub=True` în `TrainingArguments`. Vom afla mai multe despre acest lucru în [Capitolul 4](/course/chapter4/3)
+💡 Dacă doriți să încărcați automat modelul în Hub în timpul instruirii, treceți `push_to_hub=True` în `TrainingArguments`. Vom afla mai multe despre acest lucru în [Capitolul 4](/course/chapter4/3).
 
 </Tip>
 
diff --git a/chapters/rum/chapter3/3_tf.mdx b/chapters/rum/chapter3/3_tf.mdx
index ede281693..73d2fa64b 100644
--- a/chapters/rum/chapter3/3_tf.mdx
+++ b/chapters/rum/chapter3/3_tf.mdx
@@ -9,7 +9,7 @@
     {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter3/section3_tf.ipynb"},
 ]} />
 
-După ce ați efectuat toate lucrările de preprocesare a datelor din ultima secțiune, mai aveți doar câțiva pași de făcut pentru a antrena modelul. Rețineți, totuși, că comanda `model.fit()` va rula foarte lent pe un CPU. Dacă nu aveți un GPU configurat, puteți obține acces gratuit la GPU sau TPU pe [Google Colab] (https://colab.research.google.com/).
+După ce ați efectuat toate lucrările de preprocesare a datelor din ultima secțiune, mai aveți doar câțiva pași de făcut pentru a antrena modelul. Rețineți, totuși, că comanda `model.fit()` va rula foarte lent pe un CPU. Dacă nu aveți un GPU configurat, puteți obține acces gratuit la GPU sau TPU pe [Google Colab](https://colab.research.google.com/).
 
 Exemplele de cod de mai jos presupun că ați executat deja exemplele din secțiunea anterioară. Iată un scurt rezumat care recapitulează ceea ce aveți nevoie:
 
@@ -68,7 +68,7 @@ model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint, num_lab
 
 Veți observa că, spre deosebire de [Capitolul 2](/course/chapter2), veți primi un avertisment după instanțierea acestui model preinstruit. Acest lucru se datorează faptului că BERT nu a fost preinstruit pentru clasificarea perechilor de propoziții, astfel încât head-ul modelului preinstruit a fost eliminat și a fost introdus în schimb un nou head adecvat pentru clasificarea secvențelor. Avertizările indică faptul că unele ponderi nu au fost utilizate (cele corespunzătoare head-ului de preformare eliminat) și că altele au fost inițializate aleatoriu (cele pentru noul head). În încheiere, vă încurajează să antrenați modelul, ceea ce vom face acum.
 
-Pentru reglarea fină a modelului pe setul nostru de date, trebuie doar să `compilăm()` modelul nostru și apoi să transmitem datele noastre metodei `fit()`. Aceasta va începe procesul de reglare fină (care ar trebui să dureze câteva minute pe un GPU) și va raporta pierderea de formare pe parcurs, plus pierderea de validare la sfârșitul fiecărei epoci.
+Pentru a realiza fine-tuning-ul modelului pe setul nostru de date, trebuie doar să `compilăm()` modelul nostru și apoi să transmitem datele noastre metodei `fit()`. Aceasta va începe procesul de `fine-tuning` (care ar trebui să dureze câteva minute pe un GPU) și va raporta pierderea de formare pe parcurs, plus pierderea de validare la sfârșitul fiecărei epoci.
 
 <Tip>
 
@@ -119,9 +119,8 @@ from tensorflow.keras.optimizers.schedules import PolynomialDecay
 
 batch_size = 8
 num_epochs = 3
-# Numărul etapelor de formare este numărul de eșantioane din setul de date, împărțit la dimensiunea lotului, apoi înmulțit
-# cu numărul total de epoci. Rețineți că setul de date tf_train_dataset de aici este un set de date tf.data.Dataset în loturi,
-# nu setul de date original Hugging Face, deci len() este deja num_samples // batch_size.
+# Numărul etapelor de formare este numărul de eșantioane din setul de date, împărțit la dimensiunea batch-ului, apoi înmulțit
+# cu numărul total de epoci. Rețineți că setul de date tf_train_dataset de aici este un set de date tf.data.Dataset în batch-uri,
 num_train_steps = len(tf_train_dataset) * num_epochs
 lr_scheduler = PolynomialDecay(
     initial_learning_rate=5e-5, end_learning_rate=0.0, decay_steps=num_train_steps
diff --git a/chapters/rum/chapter3/4.mdx b/chapters/rum/chapter3/4.mdx
index 9477601a0..797e7d9c9 100644
--- a/chapters/rum/chapter3/4.mdx
+++ b/chapters/rum/chapter3/4.mdx
@@ -30,7 +30,7 @@ data_collator = DataCollatorWithPadding(tokenizer=tokenizer)
 
 ### Pregătirea pentru antrenament[[pregătirea-pentru-antrenament]]
 
-Înainte de a scrie efectiv bucla de antrenament, va trebui să definim câteva obiecte. Primele sunt încărcătoarele de date (dataloaders) pe care le vom folosi pentru a itera pe loturi (batches). Dar, înainte de a putea defini acele încărcătoare de date, trebuie să aplicăm un pic de postprocesare dataset-urilor noastre `tokenized_datasets`, pentru a ne ocupa de câteva lucruri pe care `Trainer` le făcea automat pentru noi. Mai exact, trebuie să:
+Înainte de a scrie efectiv bucla de antrenament, va trebui să definim câteva obiecte. Primele sunt încărcătoarele de date (dataloaders) pe care le vom folosi pentru a itera pe batch-uri. Dar, înainte de a putea defini acele dataloaders, trebuie să aplicăm un pic de postprocesare dataset-urilor noastre `tokenized_datasets`, pentru a ne ocupa de câteva lucruri pe care `Trainer` le făcea automat pentru noi. Mai exact, trebuie să:
 
 - Eliminăm coloanele care corespund valorilor pe care modelul nu le așteaptă (cum ar fi coloanele `sentence1` și `sentence2`).
 - Redenumim coloana `label` în `labels` (pentru că modelul se așteaptă ca argumentul să se numească `labels`).
@@ -51,7 +51,7 @@ Putem apoi să verificăm că rezultatul are doar coloanele pe care modelul le v
 ["attention_mask", "input_ids", "labels", "token_type_ids"]
 ```
 
-Acum, după ce am terminat acest pas, putem defini foarte ușor încărcătoarele de date:
+Acum, după ce am terminat acest pas, putem defini foarte ușor dataloader-urile noastre:
 
 ```py
 from torch.utils.data import DataLoader
@@ -79,7 +79,7 @@ for batch in train_dataloader:
  'token_type_ids': torch.Size([8, 65])}
 ```
 
-Observați că formele reale ar putea fi ușor diferite pentru voi, pentru că am setat `shuffle=True` în încărcătorul de date de antrenament și pentru că împachetăm (padding) la lungimea maximă în interiorul lotului.
+Observați că formele reale ar putea fi ușor diferite pentru voi, pentru că am setat `shuffle=True` în dataloader-ul nostru de antrenament și pentru că împachetăm (padding) la lungimea maximă în interiorul batch-ului.
 
 Acum că am terminat complet procesarea datelor (un obiectiv satisfăcător, dar uneori greu de atins pentru orice practician ML), să trecem la model. Îl instanțiem exact ca în secțiunea anterioară:
 
@@ -89,7 +89,7 @@ from transformers import AutoModelForSequenceClassification
 model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
 ```
 
-Pentru a ne asigura că totul va decurge fără probleme în timpul antrenamentului, trecem lotul nostru prin model:
+Pentru a ne asigura că totul va decurge fără probleme în timpul antrenamentului, trecem batch-ul nostru prin model:
 
 ```py
 outputs = model(**batch)
@@ -100,7 +100,7 @@ print(outputs.loss, outputs.logits.shape)
 tensor(0.5441, grad_fn=<NllLossBackward>) torch.Size([8, 2])
 ```
 
-Toate modelele 🤗 Transformers vor returna pierderea (loss) când `labels` sunt furnizate, și, de asemenea, obținem logits (două pentru fiecare intrare în lot, deci un tensor de mărimea 8 x 2).
+Toate modelele 🤗 Transformers vor returna pierderea (loss) când `labels` sunt furnizate, și, de asemenea, obținem logits (două pentru fiecare intrare în batch, deci un tensor de mărimea 8 x 2).
 
 Suntem aproape gata să scriem bucla de antrenament! Ne mai lipsesc două lucruri: un optimizer și un scheduler pentru rata de învățare. Pentru că încercăm să reproducem ceea ce făcea `Trainer`, vom folosi aceleași valori implicite. Optimizer-ul folosit de `Trainer` este `AdamW`, care este același cu Adam, dar cu o abordare particulară pentru regularizarea weight decay (vedeți lucrarea ["Decoupled Weight Decay Regularization"](https://arxiv.org/abs/1711.05101) de Ilya Loshchilov și Frank Hutter):
 
@@ -110,7 +110,7 @@ from transformers import AdamW
 optimizer = AdamW(model.parameters(), lr=5e-5)
 ```
 
-În final, scheduler-ul pentru rata de învățare folosit implicit este doar o descreștere liniară de la valoarea maximă (5e-5) la 0. Pentru a-l defini corect, trebuie să știm numărul de pași de antrenament pe care îi vom face, care este numărul de epoci dorit înmulțit cu numărul de loturi de antrenament (care este lungimea dataloader-ului nostru de antrenament). `Trainer` folosește trei epoci implicit, așa că vom urma acest exemplu:
+În final, scheduler-ul pentru rata de învățare folosit implicit este doar o descreștere liniară de la valoarea maximă (5e-5) la 0. Pentru a-l defini corect, trebuie să știm numărul de pași de antrenament pe care îi vom face, care este numărul de epoci dorit înmulțit cu numărul de batch-uri de antrenament (care este lungimea dataloader-ului nostru de antrenament). `Trainer` folosește trei epoci implicit, așa că vom urma acest exemplu:
 
 ```py
 from transformers import get_scheduler
@@ -132,7 +132,7 @@ print(num_training_steps)
 
 ### Bucla de antrenament[[bucla-de-antrenament]]
 
-Încă un lucru: vom dori să folosim GPU-ul dacă avem acces la unul (pe un CPU, antrenamentul poate dura câteva ore în loc de câteva minute). Pentru asta, definim un `device` pe care vom pune modelul și loturile noastre:
+Încă un lucru: vom dori să folosim GPU-ul dacă avem acces la unul (pe un CPU, antrenamentul poate dura câteva ore în loc de câteva minute). Pentru asta, definim un `device` pe care vom pune modelul și batch-urile noastre:
 
 ```py
 import torch
@@ -170,9 +170,9 @@ for epoch in range(num_epochs):
 Observați că partea principală a buclei de antrenament arată foarte asemănător cu cea din introducere. Nu am cerut niciun raport, așa că această buclă de antrenament nu ne va spune nimic despre performanța modelului. Pentru a avea feedback, trebuie să adăugăm o buclă de evaluare.
 
 
-### Bucla de evaluare[[ bucla-de-evaluare]]
+### Bucla de evaluare [[bucla-de-evaluare]]
 
-Ca și înainte, vom folosi o metrică oferită de biblioteca 🤗 Evaluate. Am văzut deja metoda `metric.compute()`, dar metricle pot de fapt să acumuleze loturi pentru noi în timp ce parcurgem bucla de predicție, cu metoda `add_batch()`. Odată ce am acumulat toate loturile, putem obține rezultatul final cu `metric.compute()`. Iată cum să implementăm toate acestea într-o buclă de evaluare:
+Ca și înainte, vom folosi o metrică oferită de biblioteca 🤗 Evaluate. Am văzut deja metoda `metric.compute()`, dar metricle pot de fapt să acumuleze batch-uri pentru noi în timp ce parcurgem bucla de predicție, cu metoda `add_batch()`. Odată ce am acumulat toate batch-urile, putem obține rezultatul final cu `metric.compute()`. Iată cum să implementăm toate acestea într-o buclă de evaluare:
 
 ```py
 import evaluate
@@ -207,7 +207,7 @@ Din nou, rezultatele voastre vor fi ușor diferite din cauza aleatorietății î
 
 <Youtube id="s7dy8QRgjJ0" />
 
-Bucla de antrenament pe care am definit-o anterior funcționează bine pe un singur CPU sau GPU. Dar, folosind biblioteca [🤗 Accelerate](https://github.com/huggingface/accelerate), cu doar câteva ajustări putem activa antrenarea distribuită pe mai multe GPU-uri sau TPU-uri. Pornind de la crearea încărcătoarelor de date de antrenament și validare, iată cum arată bucla noastră manuală de antrenament:
+Bucla de antrenament pe care am definit-o anterior funcționează bine pe un singur CPU sau GPU. Dar, folosind biblioteca [🤗 Accelerate](https://github.com/huggingface/accelerate), cu doar câteva ajustări putem activa antrenarea distribuită pe mai multe GPU-uri sau TPU-uri. Pornind de la crearea dataloader-urilor de antrenament și validare, iată cum arată bucla noastră manuală de antrenament:
 
 ```py
 from transformers import AdamW, AutoModelForSequenceClassification, get_scheduler
@@ -289,7 +289,7 @@ Iar aici sunt modificările:
 
 Prima linie de adăugat este linia de import. A doua linie instanțiază un obiect `Accelerator` care va examina mediul și va inițializa setarea distribuită corespunzătoare. 🤗 Accelerate se ocupă de plasarea pe device pentru voi, așa că puteți elimina liniile care pun modelul pe device (sau, dacă preferați, le puteți schimba să folosească `accelerator.device` în loc de `device`).
 
-Apoi, partea principală a muncii este făcută în linia care trimite dataloaders, modelul și optimizer-ul la `accelerator.prepare()`. Aceasta va împacheta acele obiecte în containerul potrivit pentru a vă asigura că antrenarea distribuită funcționează corespunzător. Restul modificărilor constau în eliminarea liniei care mută lotul pe `device` (din nou, dacă doriți să o păstrați puteți doar să o schimbați să folosească `accelerator.device`) și înlocuirea `loss.backward()` cu `accelerator.backward(loss)`.
+Apoi, partea principală a muncii este făcută în linia care trimite dataloaders, modelul și optimizer-ul la `accelerator.prepare()`. Aceasta va împacheta acele obiecte în containerul potrivit pentru a vă asigura că antrenarea distribuită funcționează corespunzător. Restul modificărilor constau în eliminarea liniei care mută batch-ul pe `device` (din nou, dacă doriți să o păstrați puteți doar să o schimbați să folosească `accelerator.device`) și înlocuirea `loss.backward()` cu `accelerator.backward(loss)`.
 
 <Tip>
 ⚠️ Pentru a beneficia de creșterea vitezei oferită de Cloud TPU-uri, vă recomandăm să împachetați mostrele la o lungime fixă folosind argumentele `padding="max_length"` și `max_length` ale tokenizer-ului.
diff --git a/chapters/rum/chapter3/6.mdx b/chapters/rum/chapter3/6.mdx
index 225615087..1a43e2918 100644
--- a/chapters/rum/chapter3/6.mdx
+++ b/chapters/rum/chapter3/6.mdx
@@ -111,12 +111,12 @@ Testați-vă cunoștințele din acest capitol!
 <Question
 	choices={[
 		{
-			text: "E atunci când împachetezi intrările pentru fiecare lot la lungimea maximă din întregul dataset.",
-			explain: "Este adevărat că împachetăm când creăm lotul, dar nu până la lungimea maximă din întregul set de date."
+			text: "E atunci când împachetezi intrările pentru fiecare batch la lungimea maximă din întregul dataset.",
+			explain: "Este adevărat că împachetăm când creăm batch-ul, dar nu până la lungimea maximă din întregul set de date."
 		},
 		{
-			text: "E atunci când împachetezi intrările în momentul creării lotului, la lungimea maximă a propozițiilor din acel lot.",
-			explain: "Corect! Partea „dinamică” vine din faptul că mărimea fiecărui lot este stabilită în momentul creării, iar ca urmare, toate loturile ar putea avea forme diferite.",
+			text: "E atunci când împachetezi intrările în momentul creării batch-ului, la lungimea maximă a propozițiilor din acel batch.",
+			explain: "Corect! Partea „dinamică" vine din faptul că mărimea fiecărui batch este stabilită în momentul creării, iar ca urmare, toate batch-urile ar putea avea forme diferite.",
             correct: true
 		},
 		{
@@ -132,11 +132,11 @@ Testați-vă cunoștințele din acest capitol!
 	choices={[
 		{
 			text: "Asigură că toate secvențele din setul de date au aceeași lungime.",
-			explain: "O funcție de collate se ocupă de manipularea loturilor individuale, nu a întregului set de date. În plus, vorbim despre funcțiile de collate în general, nu despre <code>DataCollatorWithPadding</code> în mod specific."
+			explain: "O funcție de collate se ocupă de manipularea batch-urilor individuale, nu a întregului set de date. În plus, vorbim despre funcțiile de collate în general, nu despre <code>DataCollatorWithPadding</code> în mod specific."
 		},
 		{
-			text: "Reunește toate probele într-un lot.",
-			explain: "Corect! Puteți transmite funcția de collate ca argument al unui <code>DataLoader</code>. Noi am folosit funcția <code>DataCollatorWithPadding</code>, care împachetează toate elementele dintr-un lot astfel încât să aibă aceeași lungime.",
+			text: "Reunește toate probele într-un batch.",
+			explain: "Corect! Funcția de colaționare se ocupă de reunirea sau „colaționarea" eșantioanelor într-un batch. În plus, împachetează toate elementele dintr-un batch astfel încât să aibă aceeași lungime.",
             correct: true
 		},
 		{
@@ -145,7 +145,7 @@ Testați-vă cunoștințele din acest capitol!
 		},
         {
 			text: "Trunchiază secvențele din setul de date.",
-			explain: "O funcție de collate se ocupă de manipularea loturilor individuale, nu a întregului set de date. Dacă sunteți interesați de trunchiere, puteți folosi argumentul <code>truncate</code> al <code>tokenizer</code>."
+			explain: "O funcție de collate se ocupă de manipularea batch-urilor individuale, nu a întregului set de date. Dacă sunteți interesați de trunchiere, puteți folosi argumentul <code>truncate</code> al <code>tokenizer</code>."
 		}
 	]}
 />

From 6da5ddece872015a00234bf11f3b73cda0c485c9 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Tue, 3 Jun 2025 12:06:55 +0300
Subject: [PATCH 139/167] fix: solve chapter3 romanian translation file 6
 formatting issues

---
 chapters/rum/chapter3/6.mdx | 8 ++++----
 1 file changed, 4 insertions(+), 4 deletions(-)

diff --git a/chapters/rum/chapter3/6.mdx b/chapters/rum/chapter3/6.mdx
index 1a43e2918..3feba0bfa 100644
--- a/chapters/rum/chapter3/6.mdx
+++ b/chapters/rum/chapter3/6.mdx
@@ -116,7 +116,7 @@ Testați-vă cunoștințele din acest capitol!
 		},
 		{
 			text: "E atunci când împachetezi intrările în momentul creării batch-ului, la lungimea maximă a propozițiilor din acel batch.",
-			explain: "Corect! Partea „dinamică" vine din faptul că mărimea fiecărui batch este stabilită în momentul creării, iar ca urmare, toate batch-urile ar putea avea forme diferite.",
+			explain: "Corect! Partea \"dinamică\" vine din faptul că mărimea fiecărui batch este stabilită în momentul creării, iar ca urmare, toate batch-urile ar putea avea forme diferite.",
             correct: true
 		},
 		{
@@ -126,7 +126,7 @@ Testați-vă cunoștințele din acest capitol!
 	]}
 />
 
-### 6. Care este scopul unei funcții de „collate”?
+### 6. Care este scopul unei funcții de „collate"?
 
 <Question
 	choices={[
@@ -135,8 +135,8 @@ Testați-vă cunoștințele din acest capitol!
 			explain: "O funcție de collate se ocupă de manipularea batch-urilor individuale, nu a întregului set de date. În plus, vorbim despre funcțiile de collate în general, nu despre <code>DataCollatorWithPadding</code> în mod specific."
 		},
 		{
-			text: "Reunește toate probele într-un batch.",
-			explain: "Corect! Funcția de colaționare se ocupă de reunirea sau „colaționarea" eșantioanelor într-un batch. În plus, împachetează toate elementele dintr-un batch astfel încât să aibă aceeași lungime.",
+			text: "Reunește toate eșantioanele într-un batch.",
+			explain: "Corect! Poți transmite funcția de collate ca argument al unui <code>DataLoader</code>. Am folosit funcția <code>DataCollatorWithPadding</code>, care împachetează toate elementele dintr-un batch astfel încât să aibă aceeași lungime.",
             correct: true
 		},
 		{

From dc3c3d2418a8d2b563caf6c6efaf081f3085c6d2 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Tue, 3 Jun 2025 12:23:10 +0300
Subject: [PATCH 140/167] fix: resolve all thread suggestions from chapter 4
 romanian translation

---
 chapters/rum/chapter4/3.mdx | 14 +++++++-------
 chapters/rum/chapter4/4.mdx |  8 ++++----
 chapters/rum/chapter4/6.mdx |  2 +-
 3 files changed, 12 insertions(+), 12 deletions(-)

diff --git a/chapters/rum/chapter4/3.mdx b/chapters/rum/chapter4/3.mdx
index d05cc3387..dc0a68d61 100644
--- a/chapters/rum/chapter4/3.mdx
+++ b/chapters/rum/chapter4/3.mdx
@@ -81,7 +81,7 @@ training_args = TrainingArguments(
 )
 ```
 
-Când chemați `trainer.train()`, `Trainer` va încărca modelul pe Hub de fiecare dată când este salvat (aici, la fiecare epocă) într-un repository namespaceul tău. Acest repository va fi numit după output directory-ul ales (aici `bert-finetuned-mrpc`), dar puteți alege un alt nume cu `hub_model_id = "un_nume_diferit"`.
+Când chemați `trainer.train()`, `Trainer` va încărca modelul pe Hub de fiecare dată când este salvat (aici, la fiecare epocă) într-un repository namespace-ul tău. Acest repository va fi numit după output directory-ul ales (aici `bert-finetuned-mrpc`), dar puteți alege un alt nume cu `hub_model_id = "un_nume_diferit"`.
 
 Pentru a încărca modelul într-o organizație din care faceți parte, este suficient să introduceți aceasta în `hub_model_id = "organizația_mea/numele_repositoriului"`.
 
@@ -103,7 +103,7 @@ callback = PushToHubCallback(
 )
 ```
 
-Apoi, adăugați `callbacks=[callback]` în apelul la `model.fit()`. Callback-ul va încărca apoi modelul pe Hub de fiecare dată când se salvează (aici, la fiecare epocă) într-un repository din namespaceul tău. Acest repository va fi numit după output directory ales (aici `bert-finetuned-mrpc`), dar puteți alege un alt nume cu `hub_model_id = "un_nume_diferit"`.
+Apoi, adăugați `callbacks=[callback]` în apelul la `model.fit()`. Callback-ul va încărca apoi modelul pe Hub de fiecare dată când se salvează (aici, la fiecare epocă) într-un repository din namespace-ul tău. Acest repository va fi numit după output directory ales (aici `bert-finetuned-mrpc`), dar puteți alege un alt nume cu `hub_model_id = "un_nume_diferit"`.
 
 Pentru a încărca modelul într-o organizație din care faceți parte, este suficient să introduceți aceasta în `hub_model_id = "organizația_mea/numele_repositoriului"`.
 
@@ -145,7 +145,7 @@ Acest lucru va crea un nou repository `dummy-model` în profilul tău și o va p
 tokenizer.push_to_hub("dummy-model")
 ```
 
-Dacă apartineți unei organizații, specificați doar argumentul `organization` pentru a încărca în namespaceul acestei organizații:
+Dacă aparțineți unei organizații, specificați doar argumentul `organization` pentru a încărca în namespace-ul acestei organizații:
 
 ```py
 tokenizer.push_to_hub("dummy-model", organization="huggingface")
@@ -173,7 +173,7 @@ Apăsați pe tabul "Files and versions", iar acum ar trebui să vedeți fișiere
 
 <Tip>
 
-✏️ **Încercați!** Luați modelul și tokenizerul asociat cu checkpointul `bert-base-cased` și încărcați-l pe un repo în namespaceul tău folosind metoda `push_to_hub()`. Verificați că repo-ul apare  în pagina dumneavoastră înainte de a-l șterge.
+✏️ **Încercați!** Luați modelul și tokenizerul asociat cu checkpointul `bert-base-cased` și încărcați-l pe un repo în namespace-ul tău folosind metoda `push_to_hub()`. Verificați că repo-ul apare  în pagina dumneavoastră înainte de a-l șterge.
 
 </Tip>
 
@@ -232,7 +232,7 @@ from huggingface_hub import create_repo
 create_repo("dummy-model")
 ```
 
-Acesta va crea repositarul `dummy-model` în namespaceul tău. Dacă doriți, puteți specifica care organizație să aparțină repositoriului folosind argumentul `organization`:
+Acesta va crea repositarul `dummy-model` în namespace-ul tău. Dacă doriți, puteți specifica care organizație să aparțină repositoriului folosind argumentul `organization`:
 
 ```py
 from huggingface_hub import create_repo
@@ -259,7 +259,7 @@ Pentru a crea un nou repositoriu, vizitați [huggingface.co/new](https://hugging
 <img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/new_model.png" alt="Pagină care prezintă modelul utilizat pentru crearea unui nou repository." width="80%"/>
 </div>
 
-În primul rând, specificați deținătorul repositoriului: acesta puteți fi dumneavoastră, fie orice organizație cu care sunteți afiliat. Dacă alegeți o organizație, modelul va fi prezent pe pagina organizației și toți membrii acesteia vor avea posibilitatea să contribuie la repositoriu.
+În primul rând, specificați deținătorul repositoriului: acesta puteți fi fie dumneavoastră, fie orice organizație cu care sunteți afiliat. Dacă alegeți o organizație, modelul va fi prezent pe pagina organizației și toți membrii acesteia vor avea posibilitatea să contribuie la repositoriu.
 
 În al doilea rând, introduceți numele modelului dumneavoastră. Acest lucru va fi și denumirea repositoriului. În final, puteți specifica dacă doriți ca modelul dumneavoastră să fie public sau privat. Modelele private nu sunt vizibile ceilorlalți.
 
@@ -369,7 +369,7 @@ Felicitări! Ați reușit să încărcați primele fișiere în hub.
 
 ### Folosirea Git[[the-git-based-approach]]
 
-Acesta este abordarea cea mai de bază pentru încărcarea fișierelor: vom face ast cu ajutorul git și git-lfs direct. Cea mai grea parte este abstractizată prin abordări anterioare, dar există câteva excepții cu metoda următoare, așadar ne vom referi la un use-case mai complicat.
+Acesta este abordarea cea mai de bază pentru încărcarea fișierelor: vom face asta cu ajutorul git și git-lfs direct. Cea mai grea parte este abstractizată prin abordări anterioare, dar există câteva excepții cu metoda următoare, așadar ne vom referi la un use-case mai complicat.
 
 Pentru această clasă se cere să aveți instalate git și git-lfs, așadar asigurați-vă că aveți [git-lfs](https://git-lfs.github.com/) instalat (vedeți aici instrucțiunile de instalare) și configurat înainte să începeți.
 
diff --git a/chapters/rum/chapter4/4.mdx b/chapters/rum/chapter4/4.mdx
index 98e128f1f..cf20e2bb4 100644
--- a/chapters/rum/chapter4/4.mdx
+++ b/chapters/rum/chapter4/4.mdx
@@ -6,9 +6,9 @@
     classNames="absolute z-10 right-0 top-0"
 />
 
-Model card este un fișier care este, probabil, la fel de important ca și fișierele de model si tokenizer dintr-o repositoriul modelului. Este definiția centrală a modelului, asigurând reutilizarea de către membrii comunității și reproducerea rezultatelor, oferind o platformă pe care alți membri pot construi artefecatele lor.
+Model card-ul este un fișier care este la fel de important ca și fișierele de model si tokenizer dintr-un repositoriu. Este definiția centrală a modelului, asigurând reutilizarea de către membrii comunității și reproducerea rezultatelor, oferind o platformă pe care alți membri pot construi artefactele lor.
 
-Documentarea procesului de antrenare și evaluare ajută celorlați să înțeleagă la ce să aștepte de la un model - iar oferirea informațiilor suficiente referitoare la datele folosite si preprocesarea acestora (înainte și după antrenare) vor ajuta la identificarea și înțelegerea limitelor, biaseruile și contextului în care modelul este și nu este folositor.
+Documentarea procesului de antrenare și evaluare ajută pe ceilalți să înțeleagă la ce să aștepte de la un model - iar oferirea informațiilor suficiente referitoare la datele folosite si preprocesarea acestora (înainte și după antrenare) vor ajuta la identificarea și înțelegerea limitelor, biasurile și contextului în care modelul este și nu este folositor.
 
 Prin urmare, crearea unui model card care definește modelul dvs. este un pas foarte important. Aici, oferim câteva sfaturi care v-ar putea ajuta în acest sens. Crearea model cardului se face prin intermediul fișierului `README.md`, pe care l-ați văzut anterior, care este un fișier Markdown.
 
@@ -44,7 +44,7 @@ Această secțiune trebuie să indice datasetul(urile) folosit pentru instruirea
 
 ### Procedura de antrenare[[training-procedure]]
 
-Aici descrieți toate aspectele relevante ale antrenarii care sunt utile din punct de vedere al reproducerii. Acest lucru include orice preprocessing sau postprocessing efectuat pe date, precum și detalii ca numărul de epoci pe care a fost antrenat modelul, dimensiunea batch-ului, learning rateul si alte astfel de detalii.
+Aici descrieți toate aspectele relevante ale antrenarii care sunt utile din punct de vedere al reproducerii. Acest lucru include orice preprocessing sau postprocessing efectuat pe date, precum și detalii ca numărul de epoci pe care a fost antrenat modelul, dimensiunea batch-ului, learning rateul și alte astfel de detalii.
 
 ### Variabilele si metrice[[variable-and-metrics]]
 
@@ -66,7 +66,7 @@ Câteva exemple din alte organizații și companii pot fi găsite [aici](https:/
 
 ## Notă[[note]]
 
-Model cardurile nu sunt o cerință obligatorie când se publică modelele si nu este necesar să includeți toate secțiunile descrise mai sus în Model Card. Cu toate acestea, documentarea explicită a modelului poate beneficia utilizatorilor viitori, deci vă recomandăm să completați cât mai multe dintre secțiuni.
+Model cardurile nu sunt o cerință obligatorie când se publică modelele și nu este necesar să includeți toate secțiunile descrise mai sus în Model Card. Cu toate acestea, documentarea explicită a modelului poate beneficia utilizatorilor viitori, deci vă recomandăm să completați cât mai multe dintre secțiuni.
 
 ## Metadatele cardului de model[[model-card-metadata]]
 
diff --git a/chapters/rum/chapter4/6.mdx b/chapters/rum/chapter4/6.mdx
index 9208940ac..e5d79271c 100644
--- a/chapters/rum/chapter4/6.mdx
+++ b/chapters/rum/chapter4/6.mdx
@@ -206,7 +206,7 @@ Chapitru 4
 	]}
 />
 
-### 8. Carele operații git poți face cu clasa `Repository`?
+### 8. Ce operații git poți face cu clasa `Repository`?
 
 <Question
 	choices={[

From 4be802f1583005e1fede570a6ba85d8e17706f8c Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Tue, 3 Jun 2025 12:24:35 +0300
Subject: [PATCH 141/167] fix: solve typo in romanian spelling chapter 4 file 4

---
 chapters/rum/chapter4/4.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter4/4.mdx b/chapters/rum/chapter4/4.mdx
index cf20e2bb4..5615a1651 100644
--- a/chapters/rum/chapter4/4.mdx
+++ b/chapters/rum/chapter4/4.mdx
@@ -52,7 +52,7 @@ Aici descrieți metricile utilizate la evaluarea rezultatelor, precum și diferi
 
 ### Rezultatele evaluării[[evaluation-results]]
 
-În sfârșit, indicați cum s-a comportat modelul pe datasetul de evaluare. Dacă modelul foloseste un decision threshold, atunci includeți acest decision threshold în secțiunea respectivă - sau explicați că rezultatele sunt prezentate la diferite thresholduri pentru utilizările preconizate.
+În sfârșit, indicați cum s-a comportat modelul pe datasetul de evaluare. Dacă modelul foloseste un decision threshold, atunci includeți acest decision threshold în secțiunea respectivă - sau explicați că rezultatele sunt prezentate la diferite threshold-uri pentru utilizările preconizate.
 
 ## Exemplu[[example]]
 

From 6f50a71763ac214f191c62e24426203d6a82adf0 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Tue, 3 Jun 2025 12:25:55 +0300
Subject: [PATCH 142/167] feat: add Angroys as one of the contributors to this
 chapters translation

---
 README.md | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/README.md b/README.md
index 07dadca56..b51cbd725 100644
--- a/README.md
+++ b/README.md
@@ -27,7 +27,7 @@ This repo contains the content that's used to create the **[Hugging Face course]
 | [Vietnamese](https://huggingface.co/course/vi/chapter1/1)               | [`chapters/vi`](https://github.com/huggingface/course/tree/main/chapters/vi)       | [@honghanhh](https://github.com/honghanhh)                                                                                                                                                                                                                                                                                                               |
 | [Chinese (simplified)](https://huggingface.co/course/zh-CN/chapter1/1)  | [`chapters/zh-CN`](https://github.com/huggingface/course/tree/main/chapters/zh-CN) | [@zhlhyx](https://github.com/zhlhyx), [petrichor1122](https://github.com/petrichor1122), [@1375626371](https://github.com/1375626371)                                                                                                                                                                                                                    |
 | [Chinese (traditional)](https://huggingface.co/course/zh-TW/chapter1/1) (WIP) | [`chapters/zh-TW`](https://github.com/huggingface/course/tree/main/chapters/zh-TW) | [@davidpeng86](https://github.com/davidpeng86)                                                                                                                                                                                                                                                                                                           |
-| [Romanian](https://huggingface.co/course/rum/chapter1/1) (WIP) | [`chapters/rum`](https://github.com/huggingface/course/tree/main/chapters/rum) | [@Sigmoid](https://github.com/SigmoidAI), [@eduard-balamatiuc](https://github.com/eduard-balamatiuc), [@FriptuLudmila](https://github.com/FriptuLudmila), [@tokyo-s](https://github.com/tokyo-s), [@hbkdesign](https://github.com/hbkdesign)                                                                                                                                                                                                                                                                                                             |
+| [Romanian](https://huggingface.co/course/rum/chapter1/1) (WIP) | [`chapters/rum`](https://github.com/huggingface/course/tree/main/chapters/rum) | [@Sigmoid](https://github.com/SigmoidAI), [@eduard-balamatiuc](https://github.com/eduard-balamatiuc), [@FriptuLudmila](https://github.com/FriptuLudmila), [@tokyo-s](https://github.com/tokyo-s), [@hbkdesign](https://github.com/hbkdesign), [@Angroys](https://github.com/Angroys)                                                                                                                                                                                                                                                                                                             |
 
 ### Translating the course into your language
 

From 39e6d0a4e0d1a084c61611620518138d1170bb43 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Tue, 3 Jun 2025 12:34:06 +0300
Subject: [PATCH 143/167] fix: resolve all threads and solve all mistakes found
 in romanian translation of chapter5

---
 chapters/rum/chapter5/1.mdx | 4 ++--
 chapters/rum/chapter5/2.mdx | 6 +++---
 chapters/rum/chapter5/3.mdx | 8 ++++----
 chapters/rum/chapter5/4.mdx | 4 ++--
 chapters/rum/chapter5/5.mdx | 2 +-
 chapters/rum/chapter5/6.mdx | 2 +-
 chapters/rum/chapter5/8.mdx | 2 +-
 7 files changed, 14 insertions(+), 14 deletions(-)

diff --git a/chapters/rum/chapter5/1.mdx b/chapters/rum/chapter5/1.mdx
index 816cabe1f..99ac985b9 100644
--- a/chapters/rum/chapter5/1.mdx
+++ b/chapters/rum/chapter5/1.mdx
@@ -5,13 +5,13 @@
     classNames="absolute z-10 right-0 top-0"
 />
 
-În [Capitolul 3](/course/chapter3) ați încercat a biblioteca 🤗Datasets și ați văzut că existau trei pași principali atunci când vine vorba de fine-tuningul unui model:
+În [Capitolul 3](/course/chapter3) ați încercat biblioteca 🤗Datasets și ați văzut că existau trei pași principali atunci când vine vorba de fine-tuningul unui model:
 
 1. Încărcați un dataset din Hugging Face Hub.
 2. Preprocesați datele cu `Dataset.map()`.
 3. Încărcați și calculați metricele.
 
-Dar acesta este doar o mică parte a ceea ce poate face 🤗 Datasets! În acest capitol, vom trece mai in deep în această bibliotecă. Pe parcurs, vom găsi răspunsuri la următoarele întrebări:
+Dar aceasta este doar o mică parte a ceea ce poate face 🤗 Datasets! În acest capitol, ne vom aprofunda în această bibliotecă. Pe parcurs, vom găsi răspunsuri la următoarele întrebări:
 
 * Ce faceți atunci când datasetul tău nu este pe Hub?
 * Cum puteți tăia și împărți un dataset? (Și ce dacă tu _really_ trebuie să folosești Pandas?)
diff --git a/chapters/rum/chapter5/2.mdx b/chapters/rum/chapter5/2.mdx
index 72656f3f9..9ed66fd46 100644
--- a/chapters/rum/chapter5/2.mdx
+++ b/chapters/rum/chapter5/2.mdx
@@ -28,7 +28,7 @@ Așa cum se arată în tabel, pentru fiecare format de date trebuie doar să spe
 
 Pentru acest exemplu vom folosi [datasetul SQuAD-it](https://github.com/crux82/squad-it/), care este un dataset la scară largă pentru întrebări și răspunsuri în italiană.
 
-Spliturile de antrenare și test sunt găzduite pe GitHub, deci le putem descărca cu o comandă simplă `wget`:
+Seturile de antrenare și test sunt găzduite pe GitHub, deci le putem descărca cu o comandă simplă `wget`:
 
 ```python
 !wget https://github.com/crux82/squad-it/raw/master/SQuAD_it-train.json.gz
@@ -132,7 +132,7 @@ Argumentul `data_files` al funcției `load_dataset()` este destul de flexibil ș
 
 </Tip>
 
-Scripturile de încărcare din 🤗 Datasets suportă de fapt decomprimarea automată a fișierelor de intrare, deci am fi putut să sărim peste folosirea `gzip` prin pointarea argumentului `data_files` direct către fișierele comprimate:
+Scripturile de încărcare din 🤗 Datasets suportă de fapt decomprimarea automată a fișierelor de intrare, deci am fi putut să sărim peste folosirea `gzip` prin indicarea argumentului `data_files` direct către fișierele comprimate:
 
 ```py
 data_files = {"train": "SQuAD_it-train.json.gz", "test": "SQuAD_it-test.json.gz"}
@@ -156,7 +156,7 @@ data_files = {
 squad_it_dataset = load_dataset("json", data_files=data_files, field="data")
 ```
 
-Aceasta returnează același obiect `DatasetDict` obținut mai sus, dar ne economisește pasul de a descărca și decomprima manual fișierele _SQuAD_it-*.json.gz_. Aceasta încheie incursiunea noastră în diversele modalități de încărcare a dataseturilor care nu sunt găzduite pe Hugging Face Hub. Acum că avem un dataset cu care să ne jucăm, să ne murdărim mâinile cu diverse tehnici de manipulare a datelor!
+Aceasta returnează același obiect `DatasetDict` obținut mai sus, dar ne economisește pasul de a descărca și decomprima manual fișierele _SQuAD_it-*.json.gz_. Aceasta încheie incursiunea noastră în diversele modalități de încărcare a dataseturilor care nu sunt găzduite pe Hugging Face Hub. Acum că avem un dataset cu care să ne jucăm, să explorăm diverse tehnici de manipulare a datelor!
 
 <Tip>
 
diff --git a/chapters/rum/chapter5/3.mdx b/chapters/rum/chapter5/3.mdx
index c7d7f2787..b79c2453a 100644
--- a/chapters/rum/chapter5/3.mdx
+++ b/chapters/rum/chapter5/3.mdx
@@ -279,7 +279,7 @@ new_drug_dataset = drug_dataset.map(
 
 Dacă executați acest cod într-un notebook, veți vedea că această comandă se execută mult mai rapid decât cea anterioră. Și nu pentru că recenziile noastre au fost deja HTML-unescaped – dacă reexecutați instrucția precedentă (fără `batched=True`), ea va lua același timp ca înainte. Acest lucru se datorează faptului că list comprehension sunt  mai rapide decât executarea aceluiași cod într-un `for` loop, și am câștigat, de asemenea, puțină performanțp accesând multe elemente în același timp, în loc unul câte unul.
 
-Folosirea `Dataset.map()` cu `batched=True` este esențială pentru a obține viteza "rapidă" a tokenizerilor pe care îi vom întâlni în [Capitolul 6](/course/chapter6), care pot repede să facă tokenize listelor mari de texte. De exemplu, pentru a face tokenize tuturor recenziilor medicamentelor cu un tokenizer rapid, putem folosi o funcție ca aceasta:
+Folosirea `Dataset.map()` cu `batched=True` este esențială pentru a obține viteza "rapidă" a tokenizerilor pe care îi vom întâlni în [Capitolul 6](/course/chapter6), care pot repede să tokenizeze listelor mari de texte. De exemplu, pentru tokenizarea tuturor recenziilor medicamentelor cu un tokenizer rapid, putem folosi o funcție ca aceasta:
 
 ```py
 from transformers import AutoTokenizer
@@ -316,7 +316,7 @@ Aceasta înseamnă că utilizarea unui tokenizer rapid cu opțiunea `batched=Tru
 
 Parallelization este și motivul pentru care tokenizerul rapid realizează o accelerare de aproape 6 ori cu batching: nu puteți paraleliza o singură operație de tokenizare, dar atunci când doriți să tokenizați multe texte în același timp, puteți să faceți split execuției pe mai multe procese, fiecare răspunzând pentru propriile texte.
 
-`Dataset.map()` are și o capacitate de parallelization proprie. Deoarece nu sunținute de Rust, nu pot să le ofere aceeași accelerație tokenizerilori înceți ca tokenizerilor rapizi, dar pot încă fi utili (în special dacă utilizați un tokenizer care nu are o variantă rapidă). Pentru a activa multiprocessingul, folosiți argumentul `num_proc` și specificați numărul de procese să fie utilizate în apelul `Dataset.map()`:
+`Dataset.map()` are și o capacitate de parallelization proprie. Deoarece nu sunt susținute de Rust, nu pot să le ofere aceeași accelerație tokenizerilori înceți ca tokenizerilor rapizi, dar pot încă fi utili (în special dacă utilizați un tokenizer care nu are o variantă rapidă). Pentru a activa multiprocessingul, folosiți argumentul `num_proc` și specificați numărul de procese să fie utilizate în apelul `Dataset.map()`:
 
 ```py
 slow_tokenizer = AutoTokenizer.from_pretrained("bert-base-cased", use_fast=False)
@@ -453,7 +453,7 @@ există momente în care veți avea nevoie să treceți la Pandas pentru accesul
 
 <Youtube id="tfcY1067A5Q"/>
 
-Pentru a permite conversia între diferite biblioteci, 🤗 Datasets oferă o funcțiune `Dataset.set_format()`. Această funcție schimbă doar _output format_ al datasetului, deci puteți ușor să treceți la un alt format fără a afecta _data format_ de bază, care este Apache Arrow. Formatarea se face direct. Pentru a demonstra acest lucru, hai să convertim datasetul nostru în Pandas:
+Pentru a permite conversia între diferite biblioteci, 🤗 Datasets oferă o funcția `Dataset.set_format()`. Această funcție schimbă doar _output format_ al datasetului, deci puteți ușor să treceți la un alt format fără a afecta _data format_ de bază, care este Apache Arrow. Formatarea se face direct. Pentru a demonstra acest lucru, hai să convertim datasetul nostru în Pandas:
 
 ```py
 drug_dataset.set_format("pandas")
@@ -677,7 +677,7 @@ drug-reviews/
     └── state.json
 ```
 
-unde se poate vedea că fiecare split este asociat cu propriul său tabel `dataset.arrow`, iar unele metadate în `dataset_info.json` și `state.json`. Poți să te gândești la formatul Arrow ca fiind un tabel facny de coloane și rânduri, optimizat pentru construirea aplicațiilor high-performance care procesează și transportă dataseturi mari.
+unde se poate vedea că fiecare split este asociat cu propriul său tabel `dataset.arrow`, iar unele metadate în `dataset_info.json` și `state.json`. Poți să te gândești la formatul Arrow ca fiind un tabel fancy de coloane și rânduri, optimizat pentru construirea aplicațiilor high-performance care procesează și transportă dataseturi mari.
 
 Odată ce setul de date este salvat, putem încărca-o folosind funcția `load_from_disk()` următoarea:
 
diff --git a/chapters/rum/chapter5/4.mdx b/chapters/rum/chapter5/4.mdx
index 8d33eeca8..9375a8af4 100644
--- a/chapters/rum/chapter5/4.mdx
+++ b/chapters/rum/chapter5/4.mdx
@@ -42,11 +42,11 @@ Dataset({
 })
 ```
 
-Putem observa că există 15.518.009 de linii și două colonne în datasetul nostru – e foarte mult!
+Putem observa că există 15.518.009 de linii și două coloane în datasetul nostru – e foarte mult!
 
 <Tip>
 
-✎ De abia acum, 🤗 Datasets va descompresa fișierele necesare pentru încărcarea datasetului. Dacă doriți vreei să salvezi spațiu pe hard driveul tău, puteți transmite `DownloadConfig(delete_extracted=True)` la argumentul `download_config` al `load_dataset()`. Vedeți mai multe detalii în [documentație](https://huggingface.co/docs/datasets/package_reference/builder_classes#datasets.DownloadConfig).
+✎ De abia acum, 🤗 Datasets va descompresa fișierele necesare pentru încărcarea datasetului. Dacă doriți să salvați spațiu pe hard drive-ul dvs. , puteți transmite `DownloadConfig(delete_extracted=True)` la argumentul `download_config` al `load_dataset()`. Vedeți mai multe detalii în [documentație](https://huggingface.co/docs/datasets/package_reference/builder_classes#datasets.DownloadConfig).
 
 </Tip>
 
diff --git a/chapters/rum/chapter5/5.mdx b/chapters/rum/chapter5/5.mdx
index c14f1ed63..ce2dbbbc7 100644
--- a/chapters/rum/chapter5/5.mdx
+++ b/chapters/rum/chapter5/5.mdx
@@ -7,7 +7,7 @@
     {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter5/section5.ipynb"},
 ]} />
 
-Uneori, datasetul necesar pentru a construi o aplicație NLP nu există, astfel încât veți trebui să-l creați singuri. În această secțiune vom arăta cum să creați un corpus de [GitHub issues](https://github.com/features/issues/), care sunt utilizate în mod obișnuit pentru a urmări erorile sau feature-urile din repositoriurile GitHub. Acest corpus poate fi folosit pentru diverse scopuri, inclusiv:
+Uneori, datasetul necesar pentru a construi o aplicație NLP nu există, astfel încât veți trebui să-l creați singuri. În această secțiune vom arăta cum să creați un corpus de [GitHub issues](https://github.com/features/issues/), care sunt utilizate în mod obișnuit pentru a urmări erorile sau feature-urile din repositoriile GitHub. Acest corpus poate fi folosit pentru diverse scopuri, inclusiv:
 
 * Explorarea timpului necesar pentru închiderea unor issues deschise sau pull requesturi
 * Antrenarea unui _multilabel classifier_ care poate eticheta issue-urile cu metadate pe baza descrierii issue-urilor (de exemplu, "bug", "enhancement" sau "question")
diff --git a/chapters/rum/chapter5/6.mdx b/chapters/rum/chapter5/6.mdx
index ee6fdfdeb..2fce7ed1e 100644
--- a/chapters/rum/chapter5/6.mdx
+++ b/chapters/rum/chapter5/6.mdx
@@ -88,7 +88,7 @@ Dataset({
 })
 ```
 
-Pentru a crea embeddedurile noastre, vom completa fiecare comentariu cu titlul și body-ul problemei, deoarece aceste câmpuri adesea includ informații contextuale utile. Deoarece coloana noastră `comments` este în prezent o listă de comentarii pentru fiecare issue, trebuie să "explodăm" coloana, astfel încât fiecare rând să fie format dintr-un tuple `(html_url, title, body, comment)`. În Pandas, putem face acest lucru cu funcția [`DataFrame.explode()`](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.explode.html), care creează un rând nou pentru fiecare element dintr-o coloană asemănătoare cu o listă, în timp ce copiază toate celelalte valori ale coloanelor. Pentru a vedea acest lucru în acțiune, să trecem la formatul pandas `DataFrame` main întâi:
+Pentru a crea embeddedurile noastre, vom completa fiecare comentariu cu titlul și body-ul problemei, deoarece aceste câmpuri adesea includ informații contextuale utile. Deoarece coloana noastră `comments` este în prezent o listă de comentarii pentru fiecare issue, trebuie să "explodăm" coloana, astfel încât fiecare rând să fie format dintr-un tuple `(html_url, title, body, comment)`. În Pandas, putem face acest lucru cu funcția [`DataFrame.explode()`](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.explode.html), care creează un rând nou pentru fiecare element dintr-o coloană asemănătoare cu o listă, în timp ce copiază toate celelalte valori ale coloanelor. Pentru a vedea acest lucru în acțiune, să trecem la formatul pandas `DataFrame` mai întâi:
 
 ```py
 issues_dataset.set_format("pandas")
diff --git a/chapters/rum/chapter5/8.mdx b/chapters/rum/chapter5/8.mdx
index 5f8866c76..fc619da62 100644
--- a/chapters/rum/chapter5/8.mdx
+++ b/chapters/rum/chapter5/8.mdx
@@ -134,7 +134,7 @@ dataset[0]
     choices={[
         {
             text: "Încearcă să facă streaming unui dataset prea mare pentru a încăpea în RAM.",
-            explain: "Acest lucru nu este corect -- streaming datasets sunt decompresate pe loc, și puteți prelucra dataseturi de terabytes cu foarte puțin RAM!",
+            explain: "Acest lucru nu este corect -- streaming datasets sunt decomprimate pe loc, și puteți prelucra dataseturi de terabytes cu foarte puțin RAM!",
         },
         {
             text: "Încearcă să acceseze un <code>IterableDataset</code>.",

From a836cf0f82b9ea2881b8feda426533afffcd35c6 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Tue, 3 Jun 2025 12:59:31 +0300
Subject: [PATCH 144/167] fix: address all threads and grammatical errors in
 the romanian translation of chapter6

---
 chapters/rum/chapter6/1.mdx  | 2 +-
 chapters/rum/chapter6/10.mdx | 2 +-
 chapters/rum/chapter6/2.mdx  | 8 ++++----
 chapters/rum/chapter6/6.mdx  | 4 ++--
 chapters/rum/chapter6/7.mdx  | 8 ++++----
 chapters/rum/chapter6/8.mdx  | 6 +++---
 6 files changed, 15 insertions(+), 15 deletions(-)

diff --git a/chapters/rum/chapter6/1.mdx b/chapters/rum/chapter6/1.mdx
index 9cfd151ed..4140b8b84 100644
--- a/chapters/rum/chapter6/1.mdx
+++ b/chapters/rum/chapter6/1.mdx
@@ -11,7 +11,7 @@
 
 Subiectele pe care le vom acoperi includ:
 
-* Cum să antrenați un tokenizer nou similar celui utilizat de un anumit checkpoint pe un corpus nou de texte
+* Cum să antrenați un tokenizer nou, similar celui utilizat de un anumit checkpoint pe un corpus nou de texte
 * Caracteristicile speciale ale tokenizerilor rapizi
 * Diferențele dintre cei trei algoritmi principali de subword tokenization utilizate în NLP în prezent
 * Cum să construiți un tokenizer de la zero cu biblioteca 🤗 Tokenizers și să îl antrenați pe anumite date
diff --git a/chapters/rum/chapter6/10.mdx b/chapters/rum/chapter6/10.mdx
index f3fcf6dc7..37ed8da60 100644
--- a/chapters/rum/chapter6/10.mdx
+++ b/chapters/rum/chapter6/10.mdx
@@ -101,7 +101,7 @@ Hai să testăm ceea ce ai învățat în acest capitol!
 			correct: true
 		},
         {
-			text: "Atunci când un token are labelul unei entități date, orice alt token următor cu aceeași label este considerat parte a aceleiași entități, cu excepția cazului în care este labeled ca fiind începutul unei noi entități.",
+			text: "Atunci când un token are labelul unei entități date, orice alt token următor cu aceeași label este considerat parte a aceleiași entități, cu excepția cazului în care este etichetat ca fiind începutul unei noi entități.",
 			explain: "Acesta este cel mai comun mod de a grupa entitățile împreună - deși nu este singurul răspuns corect.",
 			correct: true
 		}
diff --git a/chapters/rum/chapter6/2.mdx b/chapters/rum/chapter6/2.mdx
index ef36da15c..955c275c1 100644
--- a/chapters/rum/chapter6/2.mdx
+++ b/chapters/rum/chapter6/2.mdx
@@ -21,7 +21,7 @@ Dacă un model de limbaj nu este disponibil în limba dorită sau dacă corpusul
 
 Există o interfață API foarte simplă în 🤗 Transformers pe care o puteți utiliza pentru a antrena un nou tokenizer cu aceleași caracteristici ca unul existent: `AutoTokenizer.train_new_from_iterator()`. Pentru a vedea acest lucru în acțiune, să zicem că vrem să antrenăm GPT-2 de la zero, dar într-o altă limbă decât engleza. Prima noastră sarcină va fi să adunăm multe date în acea limbă într-un corpus de antrenare. Pentru a oferi exemple pe care toată lumea le poate înțelege, nu vom folosi o limbă ca rusă sau chineza aici, ci mai degrabă o limbă engleză specializată: codul Python.
 
-Biblioteca [🤗 Datasets](https://github.com/huggingface/datasets) ne poate ajuta să asamblăm un corpus de cod sursă Python. Vom folosi funcția obișnuită `load_dataset()` pentru a descărca și a păstra în cache dataseul [CodeSearchNet](https://huggingface.co/datasets/code_search_net). Acest dataset a fost creat pentru [Provocarea CodeSearchNet](https://wandb.ai/github/CodeSearchNet/benchmark) și conține milioane de funcții din biblioteci open-source de pe GitHub în mai multe limbaje de programare. Aici, vom încărca partea Python a acestui dataset:
+Biblioteca [🤗 Datasets](https://github.com/huggingface/datasets) ne poate ajuta să asamblăm un corpus de cod sursă Python. Vom folosi funcția obișnuită `load_dataset()` pentru a descărca și a păstra în cache datasetul [CodeSearchNet](https://huggingface.co/datasets/code_search_net). Acest dataset a fost creat pentru [Provocarea CodeSearchNet](https://wandb.ai/github/CodeSearchNet/benchmark) și conține milioane de funcții din biblioteci open-source de pe GitHub în mai multe limbaje de programare. Aici, vom încărca partea Python a acestui dataset:
 
 ```py
 from datasets import load_dataset
@@ -183,7 +183,7 @@ tokens
  'a', '`', 'Ġand', 'Ġ`', 'b', '`."""', 'ĊĠĠĠ', 'Ġreturn', 'Ġa', 'Ġ+', 'Ġb']
 ```
 
-Aici din nou vedem simboluri speciale ca `Ġ` sau `Ċ` care denotă spații sau linii noi, dar în același timp putem vedea că tokenizerul nostru a învățat câțiva tokens care sunt foarte specifici la corpusul de funcții Python: de exemplu, tokenul `ĊĠĠĠ` care reprezintă indentarea, sau tokenul `Ġ"""` care reprezintă cele trei ghilimele cu care se începe un docstring. Tokenizerul, de asemenea face split corect numelui funției pe `_`. Aceasta chiar este o reprezentare compactă: comparativ, utilizând limba tokenizerul Englez pe același exemplu ne va da o propoziție mai lungă:
+Aici din nou vedem simboluri speciale ca `Ġ` sau `Ċ` care denotă spații sau linii noi, dar în același timp putem vedea că tokenizerul nostru a învățat câțiva tokens care sunt foarte specifici la corpusul de funcții Python: de exemplu, tokenul `ĊĠĠĠ` care reprezintă indentarea, sau tokenul `Ġ"""` care reprezintă cele trei ghilimele cu care se începe un docstring. Tokenizerul, de asemenea face split corect numelui funției pe `_`. Aceasta chiar este o reprezentare compactă: comparativ, utilizând limba tokenizerului englez pe același exemplu ne va da o propoziție mai lungă:
 
 ```py
 print(len(tokens))
@@ -247,10 +247,10 @@ După ce v-ați conectat, puteți face push tokenizerului prin executarea următ
 tokenizer.push_to_hub("code-search-net-tokenizer")
 ```
 
-Acest lucru va crea un nou repositoriu în namespacel tău cu numele `code-search-net-tokenizer`, care va conține fișierul tokenizerului. După aceea, puteți încărca tokenizerul de oriunde cu metoda `from_pretrained()`:
+Acest lucru va crea un nou repositoriu în namespace-ul tău cu numele `code-search-net-tokenizer`, care va conține fișierul tokenizerului. După aceea, puteți încărca tokenizerul de oriunde cu metoda `from_pretrained()`:
 
 ```py
-# Înlocuiți "huggingface-course" mai jos cu namespaceul tău pentru a utiliza propriul tokenizer
+# Înlocuiți "huggingface-course" mai jos cu namespace-ul tău pentru a utiliza propriul tokenizer
 tokenizer = AutoTokenizer.from_pretrained("huggingface-course/code-search-net-tokenizer")
 ```
 
diff --git a/chapters/rum/chapter6/6.mdx b/chapters/rum/chapter6/6.mdx
index c2b0e6450..ffa06beff 100644
--- a/chapters/rum/chapter6/6.mdx
+++ b/chapters/rum/chapter6/6.mdx
@@ -21,7 +21,7 @@ WordPiece este algoritmul de tokenizare dezvoltat de Google pentru preantrenarea
 
 <Tip warning={true}>
 
-⚠️ Google nu a publicat niciodată implementarea sa a algoritmului de formare a WordPiece, astfel încât ceea ce urmează este cea mai bună presupunere a noastră bazată pe literatura publicată. Este posibil să nu fie 100% exactă.
+⚠️ Google nu a publicat niciodată implementarea algoritmului de formare a WordPiece, astfel încât ceea ce urmează este cea mai bună presupunere a noastră bazată pe literatura publicată. Este posibil să nu fie 100% exactă.
 
 </Tip>
 
@@ -248,7 +248,7 @@ Așadar, primul merge de învățat este `('a', '##b') -> 'ab'`, iar noi adăug
 vocab.append("ab")
 ```
 
-Pentru a continua, trebuie să aplicăm aceast merge în dicționarul nostru `splits`. Să scriem o altă funcție pentru acest lucru:
+Pentru a continua, trebuie să aplicăm acest merge în dicționarul nostru `splits`. Să scriem o altă funcție pentru acest lucru:
 
 ```python
 def merge_pair(a, b, splits):
diff --git a/chapters/rum/chapter6/7.mdx b/chapters/rum/chapter6/7.mdx
index 14744a854..3bc245c67 100644
--- a/chapters/rum/chapter6/7.mdx
+++ b/chapters/rum/chapter6/7.mdx
@@ -23,7 +23,7 @@ Algoritmul Unigram este adesea utilizat în SentencePiece, care este algoritmul
 
 La fiecare etapă a antrenării, algoritmul Unigram calculează o pierdere pe corpus oferit, având în vedere vocabularul curent. Apoi, pentru fiecare simbol din vocabular, algoritmul calculează cu cât ar crește pierderea globală dacă simbolul ar fi eliminat și caută simbolurile care ar crește cel mai puțin pierderea. Aceste simboluri au cel mai redus efect asupra pierderii globale din corpus, deci, într-un fel, sunt "mai puțin necesare" și sunt cei mai buni candidați pentru eliminare.
 
-Aceasta este o operațiune foarte costisitoare, așa că nu eliminăm doar simbolul asociat cu cea mai mică creștere a pierderii, ci procentul \\(p\\) (\\(p\\) fiind un hyperparameter pe care îl poți controla, de obicei 10 sau 20) din simbolurile asociate cu cea mai mică creștere a pierderilor. Acest proces este se repetă până când vocabularul atinge dimensiunea dorită.
+Aceasta este o operațiune foarte costisitoare, așa că nu eliminăm doar simbolul asociat cu cea mai mică creștere a pierderii, ci procentul \\(p\\) (\\(p\\) fiind un hyperparametru pe care îl poți controla, de obicei 10 sau 20) din simbolurile asociate cu cea mai mică creștere a pierderilor. Acest proces este se repetă până când vocabularul atinge dimensiunea dorită.
 
 Rețineți că nu eliminăm niciodată caracterele de bază, pentru a ne asigura că orice cuvânt poate fi tokenizat.
 
@@ -45,7 +45,7 @@ iar pentru acest exemplu, vom lua toate substringurile stricte pentru vocabularu
 
 Un model Unigram este un tip de model lingvistic care consideră că fiecare token este independent de tokenii anteriori. Este cel mai simplu model lingvistic, în sensul că probabilitatea simbolului X având în vedere contextul anterior este doar probabilitatea simbolului X. Astfel, dacă am utiliza un model lingvistic Unigram pentru a genera text, am prezice întotdeauna simbolul cel mai frecvent.
 
-Probabilitatea unui token dat este frecvența sa (numărul de ori în care îl găsim) în corpusul original, împărțită la suma tuturor aparițiilor tuturor tokenilor din vocabular (pentru a ne asigura că probabilitățile sunt egale cu 1). De exemplu, `"ug"` este prezent în `"hug"`, `"pug"`, și `"hugs"`, deci are o frecvență de 20 în corpus-ul nostru.
+Probabilitatea unui token dat este frecvența sa (numărul de ori în care îl găsim) în corpusul original, împărțită la suma tuturor aparițiilor tuturor tokenilor din vocabular (pentru a ne asigura că probabilitățile sunt egale cu 1). De exemplu, `"ug"` este prezent în `"hug"`, `"pug"`, și `"hugs"`, deci are o frecvență de 20 în corpusul nostru.
 
 Iată frecvențele tuturor subcuvintelor posibile din vocabular:
 
@@ -230,9 +230,9 @@ total_sum = sum([freq for token, freq in token_freqs.items()])
 model = {token: -log(freq / total_sum) for token, freq in token_freqs.items()}
 ```
 
-Acum funcția principală este cea care tokenizează cuvintele folosind algoritmul Viterbi. După cum am văzut mai devreme, acest algoritm calculează cea mai bună segmentare a fiecărui substringur din cuvânt, pe care o vom stoca într-o variabilă numită `best_segmentations`. Vom stoca un dicționar pentru fiecare poziție din cuvânt (de la 0 la lungimea totală a acestuia), cu două chei: indicele de început al ultimului token din cea mai bună segmentare și scorul celei mai bune segmentări. Cu ajutorul indicelui de început al ultimului token, vom putea extrage segmentarea completă odată ce lista este complet populată.
+Acum funcția principală este cea care tokenizează cuvintele folosind algoritmul Viterbi. După cum am văzut mai devreme, acest algoritm calculează cea mai bună segmentare a fiecărui substring din cuvânt, pe care o vom stoca într-o variabilă numită `best_segmentations`. Vom stoca un dicționar pentru fiecare poziție din cuvânt (de la 0 la lungimea totală a acestuia), cu două chei: indicele de început al ultimului token din cea mai bună segmentare și scorul celei mai bune segmentări. Cu ajutorul indicelui de început al ultimului token, vom putea extrage segmentarea completă odată ce lista este complet populată.
 
-Popularea listei se face cu doar două bucle: bucla principală trece peste fiecare poziție de început, iar a doua bucla încearcă toate subcuvintele care încep la acea poziție de început. Dacă substringul se află în vocabular, avem o nouă segmentare a cuvântului până la acea poziție finală, pe care o comparăm cu cea din `best_segmentations`.
+Popularea listei se face cu doar două bucle: bucla principală trece peste fiecare poziție de început, iar a doua buclă încearcă toate subcuvintele care încep la acea poziție de început. Dacă substringul se află în vocabular, avem o nouă segmentare a cuvântului până la acea poziție finală, pe care o comparăm cu cea din `best_segmentations`.
 
 Odată ce bucla principală este terminată, pornim de la sfârșit și sărim de la o poziție de început la alta, înregistrând tokenii pe parcurs, până când ajungem la începutul cuvântului:
 
diff --git a/chapters/rum/chapter6/8.mdx b/chapters/rum/chapter6/8.mdx
index 4e41c84cb..a1a2be892 100644
--- a/chapters/rum/chapter6/8.mdx
+++ b/chapters/rum/chapter6/8.mdx
@@ -12,7 +12,7 @@ După cum am văzut în secțiunile anterioare, tokenizarea cuprinde mai multe e
 - Normalizare (orice curățare a textului care este considerată necesară, cum ar fi eliminarea spațiilor sau a accentelor, normalizarea Unicode etc.)
 - Pre-tokenizarea (împărțirea inputului în cuvinte)
 - Rularea inputului prin model (utilizarea cuvintelor pre-tokenizate pentru a produce o secvență de tokeni)
-- Post-procesare (adăugarea tokenilor speciali ale tokenizerului, generarea attention maskului și a ID-urilor de tip token)
+- Post-procesare (adăugarea tokenilor speciali ai tokenizerului, generarea attention maskului și a ID-urilor de tip token)
 
 Ca un reminder, iată o altă perspectivă asupra procesului general:
 
@@ -28,7 +28,7 @@ Biblioteca 🤗 Tokenizers a fost construită pentru a oferi mai multe opțiuni
 Mai exact, biblioteca este construită în jurul unei clase centrale `Tokenizer` cu building grupate în submodule:
 
 - `normalizers` conține toate tipurile posibile de `Normalizer` pe care le puteți folosi (lista completă [aici](https://huggingface.co/docs/tokenizers/api/normalizers)).
-- `pre_tokenizers` coține toate tipurile de `PreTokenizer` pe care le poți folosi(lista completă [aici](https://huggingface.co/docs/tokenizers/api/pre-tokenizers)).
+- `pre_tokenizers` conține toate tipurile de `PreTokenizer` pe care le poți folosi(lista completă [aici](https://huggingface.co/docs/tokenizers/api/pre-tokenizers)).
 - `models` conține diferitele tipuri de `Model` pe care le puteți folosi, precum `BPE`, `WordPiece` și `Unigram` (lista completă [aici](https://huggingface.co/docs/tokenizers/api/models)).
 - `trainers` conține toate tipurile diferite de `Trainer` pe care le puteți folosi pentru a vă antrena modelul pe un corpus (unul pentru fiecare tip de model; lista completă [aici](https://huggingface.co/docs/tokenizers/api/trainers)).
 - `post_processors` conține diferitele tipuri de `PostProcessor` pe care le puteți utiliza (lista completă [aici](https://huggingface.co/docs/tokenizers/api/post-processors)).
@@ -282,7 +282,7 @@ new_tokenizer = Tokenizer.from_file("tokenizer.json")
 
 Pentru a utiliza acest tokenizer în 🤗 Transformers, trebuie să îl încorporăm în `PreTrainedTokenizerFast`. Putem fie să folosim clasa generică, fie, dacă tokenizerul nostru corespunde unui model existent, să folosim clasa respectivă (aici, `BertTokenizerFast`). Dacă aplicați această lecție pentru a construi un tokenizer nou, va trebui să utilizați prima opțiune.
 
-Pentru a include tokenizatorul într-un `PreTrainedTokenizerFast`, putem fie să transmitem tokenizerul construit ca `tokenizer_object`, fie să transmitem fișierul tokenizerului salvat ca `tokenizer_file`. Cel mai important lucru de reținut este că trebuie să setăm manual toți tokenii speciali, deoarece această clasă nu poate deduce din obiectul `tokenizer` care tokne este tokenul mască, tokenul `[CLS]`, etc.:
+Pentru a include tokenizatorul într-un `PreTrainedTokenizerFast`, putem fie să transmitem tokenizerul construit ca `tokenizer_object`, fie să transmitem fișierul tokenizerului salvat ca `tokenizer_file`. Cel mai important lucru de reținut este că trebuie să setăm manual toți tokenii speciali, deoarece această clasă nu poate deduce din obiectul `tokenizer` care token este tokenul mască, tokenul `[CLS]`, etc.:
 
 ```python
 from transformers import PreTrainedTokenizerFast

From 53b479b6eb5e1678c169f6acfba139e887421811 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Tue, 3 Jun 2025 13:27:49 +0300
Subject: [PATCH 145/167] fix: add missing questions from romanian translation
 of chapter11

---
 chapters/rum/chapter11/5.mdx | 40 ++++++++++++++++++++++++++++++++++++
 1 file changed, 40 insertions(+)

diff --git a/chapters/rum/chapter11/5.mdx b/chapters/rum/chapter11/5.mdx
index 47ebfcc0a..61ca3c867 100644
--- a/chapters/rum/chapter11/5.mdx
+++ b/chapters/rum/chapter11/5.mdx
@@ -211,4 +211,44 @@ Lighteval include, de asemenea, un API Python pentru sarcini de evaluare mai det
 			explain: "Incorect! Deși evaluarea umană este importantă, o strategie cuprinzătoare necesită mai multe abordări."
 		}
 	]}
+/>
+
+### 5. Care este o limitare a criteriilor de referință automate?
+
+<Question
+	choices={[
+		{
+			text: "Sunt prea scumpe de rulat",
+			explain: "Incorect! Costul nu este de obicei principala limitare a criteriilor de referință automate."
+		},
+		{
+			text: "Performanța la criterii de referință nu se traduce întotdeauna direct în eficacitate din lumea reală",
+			explain: "Corect! Aceasta este o limitare cheie de ținut minte când folosiți criterii de referință automate.",
+			correct: true
+		},
+		{
+			text: "Pot evalua doar modele mici",
+			explain: "Incorect! Criteriile de referință automate pot fi folosite pentru a evalua modele de diverse dimensiuni."
+		}
+	]}
+/>
+
+### 6. Care este scopul creării seturilor de date de evaluare personalizate?
+
+<Question
+	choices={[
+		{
+			text: "Pentru a reflecta cazul dumneavoastră specific de utilizare și a include întrebări reale ale utilizatorilor din domeniul dumneavoastră",
+			explain: "Corect! Seturile de date personalizate ajută să asigure că evaluarea este relevantă pentru nevoile dumneavoastră specifice.",
+			correct: true
+		},
+		{
+			text: "Pentru a înlocui complet criteriile de referință standard",
+			explain: "Incorect! Seturile de date personalizate ar trebui să completeze, nu să înlocuiască, criteriile de referință standard."
+		},
+		{
+			text: "Pentru a face evaluarea mai ușoară",
+			explain: "Incorect! Crearea seturilor de date personalizate necesită efort suplimentar dar oferă evaluare mai relevantă."
+		}
+	]}
 /> 
\ No newline at end of file

From 327939470adf99ee384380f276866a784a5c3a84 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Tue, 3 Jun 2025 13:43:32 +0300
Subject: [PATCH 146/167] fix: add missing parts from romanian translation of
 chapter12

---
 chapters/rum/chapter12/2.mdx  |  44 +++++++-
 chapters/rum/chapter12/3.mdx  | 137 +++++++++++++++++++++++-
 chapters/rum/chapter12/3a.mdx | 196 +++++++++++++++++++++++++++++++++-
 3 files changed, 373 insertions(+), 4 deletions(-)

diff --git a/chapters/rum/chapter12/2.mdx b/chapters/rum/chapter12/2.mdx
index 30be83755..fc76264eb 100644
--- a/chapters/rum/chapter12/2.mdx
+++ b/chapters/rum/chapter12/2.mdx
@@ -198,8 +198,48 @@ Felicitări pentru completarea Modulului 1! Acum ai o introducere solidă în Î
             explain: "Aceasta este parte din procesul de antrenare, nu o acțiune în contextul RL."
         },
         {
-            text: "Încărcarea datelor de antrenare",
-            explain: "Aceasta este o operațiune de gestionare a datelor, nu o acțiune RL."
+            text: "Procesarea token-urilor de intrare",
+            explain: "Aceasta este parte din operațiunea modelului, nu o acțiune în contextul RL."
+        }
+    ]}
+/>
+
+### 4. Care este rolul recompenselor în antrenamentul RL al modelelor de limbaj?
+
+<Question
+    choices={[
+        {
+            text: "Să ofere feedback despre cât de bine se aliniază răspunsurile modelului cu comportamentul dorit",
+            explain: "Corect! Recompensele ghidează modelul către generarea de răspunsuri mai utile, adevărate și apropiate.",
+            correct: true
+        },
+        {
+            text: "Să măsoare dimensiunea vocabularului modelului",
+            explain: "Recompensele nu sunt folosite pentru a evalua cunoștințele vocabularului."
+        },
+        {
+            text: "Să determine viteza de antrenare a modelului",
+            explain: "Recompensele oferă feedback asupra calității răspunsului, nu asupra eficienței antrenamentului."
+        }
+    ]}
+/>
+
+### 5. Ce este o recompensă în contextul RL pentru LLM-uri?
+
+<Question
+    choices={[
+        {
+            text: "Un scor numeric care măsoară calitatea unui răspuns",
+            explain: "Corect! Recompensele oferă feedback asupra calității răspunsului, ghidând modelul către comportamentul dorit.",
+            correct: true
+        },
+        {
+            text: "O funcție care generează răspunsuri",
+            explain: "Recompensele sunt feedback asupra calității răspunsului, nu procesul de generare în sine."
+        },
+        {
+            text: "Un model care evaluează calitatea răspunsurilor",
+            explain: "Recompensele sunt feedback asupra calității răspunsului, nu un model de evaluare."
         }
     ]}
 /> 
\ No newline at end of file
diff --git a/chapters/rum/chapter12/3.mdx b/chapters/rum/chapter12/3.mdx
index d1c2314fb..f44f0402b 100644
--- a/chapters/rum/chapter12/3.mdx
+++ b/chapters/rum/chapter12/3.mdx
@@ -196,4 +196,139 @@ Algoritm GRPO:
 Output: Model de politică optimizat
 ```
 
-Acest algoritm arată cum GRPO combină estimarea avantajului bazat pe grup cu optimizarea politicii menținând în același timp stabilitatea prin tăiere și constrângeri de divergență KL. 
\ No newline at end of file
+Acest algoritm arată cum GRPO combină estimarea avantajului bazat pe grup cu optimizarea politicii menținând în același timp stabilitatea prin tăiere și constrângeri de divergență KL.
+
+## Rezultate și Impact
+
+Acum că am explorat algoritmul, să privim rezultatele. DeepSeek R1 atinge performanțe de ultimă generație în multiple domenii:
+
+| Domeniu | Rezultate Cheie |
+|--------|-------------|
+| Matematică | • 79.8% pe AIME 2024<br>• 97.3% pe MATH-500 |
+| Codare | • Rating Codeforces: 2029<br>• LiveCodeBench: 65.9% |
+| Cunoștințe Generale | • MMLU: 90.8%<br>• GPQA Diamond: 71.5% |
+| Sarcini de Limbaj | • AlpacaEval 2.0: 87.6% rată de câștig<br>• FRAMES: 82.5% |
+
+Impactul practic al modelului se extinde dincolo de benchmark-uri prin prețurile sale cost-eficiente ale API-ului ($0.14 per milion de token-uri de intrare) și distilarea cu succes a modelului în diverse dimensiuni (1.5B la 70B parametri). În mod notabil, chiar și modelul de 7B atinge 55.5% pe AIME 2024, în timp ce versiunea distilată de 70B se apropie de performanța o1-mini pe MATH-500 (94.5%), demonstrând conservarea eficientă a capacităților la diferite scale.
+
+## Limitări și Provocări ale GRPO
+
+În timp ce GRPO reprezintă un progres semnificativ în învățarea prin întărire pentru modelele de limbaj, este important să înțelegem limitările și provocările sale:
+
+- **Costul Generării**: Generarea de multiple completări (4-16) pentru fiecare prompt crește cerințele computaționale comparativ cu metodele care generează doar una sau două completări.
+- **Constrângerile Dimensiunii Lotului**: Nevoia de a procesa grupuri de completări împreună poate limita dimensiunile eficiente ale loturilor, adăugând complexitate procesului de antrenare și potențial încetinind antrenarea.
+- **Designul Funcției de Recompensă**: Calitatea antrenamentului depinde foarte mult de funcții de recompensă bine concepute. Recompensele prost concepute pot duce la comportamente neintenționate sau optimizarea pentru obiectivele greșite.
+- **Compromisurile Dimensiunii Grupului**: Alegerea dimensiunii optime a grupului implică echilibrarea diversității soluțiilor împotriva costului computațional. Prea puține eșantioane s-ar putea să nu ofere suficientă diversitate, în timp ce prea multe cresc timpul de antrenare și cerințele de resurse.
+- **Reglarea Divergenței KL**: Găsirea echilibrului potrivit pentru penalitatea divergenței KL necesită reglare atentă - prea mare și modelul nu va învăța eficient, prea mică și poate devia prea departe de capacitățile sale inițiale.
+
+## Concluzie
+
+Lucrarea DeepSeek R1 reprezintă o piatră de hotar semnificativă în dezvoltarea modelelor de limbaj. Algoritmul Group Relative Policy Optimization (GRPO) a demonstrat că învățarea prin întărire pură poate într-adevăr dezvolta capacități puternice de raționament, provocând presupunerile anterioare despre necesitatea ajustării fine supervizate.
+
+Poate cel mai important, DeepSeek R1 a arătat că este posibil să echilibrezi performanța înaltă cu considerații practice precum cost-eficiența și accesibilitatea. Distilarea cu succes a capacităților modelului în diferite dimensiuni, de la 1.5B la 70B parametri, demonstrează o cale înainte pentru a face capacitățile AI avansate mai larg disponibile.
+
+---
+
+În următoarea secțiune, vom explora implementări practice ale acestor concepte, concentrându-ne pe cum să folosești GRPO și RFTrans în propriile tale proiecte de dezvoltare a modelelor de limbaj.
+
+## Quiz
+
+### 1. Care este principala inovație a lucrării DeepSeek R1?
+
+<Question
+    choices={[
+        {
+            text: "Algoritmul GRPO care permite învățarea din preferințe cu și fără un model de recompensă",
+            explain: "Corect! Inovația cheie a GRPO este capacitatea sa de a optimiza direct pentru rectificarea preferințelor, făcându-l mai eficient decât metodele RL tradiționale.",
+            correct: true
+        },
+        {
+            text: "Folosirea mai multor GPU-uri pentru antrenare decât orice model anterior",
+            explain: "Inovația lucrării este în abordarea sa algoritmică (GRPO) mai degrabă decât în resursele computaționale folosite."
+        },
+        {
+            text: "Crearea unui model de limbaj mai mare decât cele existente",
+            explain: "Inovația constă în metodologia de antrenare și algoritmul GRPO, nu în dimensiunea modelului."
+        }
+    ]}
+/>
+
+### 2. Care sunt cele patru faze ale procesului de antrenare DeepSeek R1?
+
+<Question
+    choices={[
+        {
+            text: "Pornire la Rece, RL de Raționament, Eșantionare prin Respingere și RL Diversă",
+            explain: "Corect! Acestea sunt exact cele patru faze descrise în lucrare, fiecare servind un scop specific în pipeline-ul de antrenare.",
+            correct: true
+        },
+        {
+            text: "Pre-antrenare, Ajustare Fină, Testare și Implementare",
+            explain: "Lucrarea descrie în mod specific patru faze diferite: Pornire la Rece (fundația calității), RL de Raționament (construirea capacităților), Eșantionare prin Respingere (controlul calității) și RL Diversă (alinierea largă)."
+        },
+        {
+            text: "Colectarea Datelor, Antrenarea Modelului, Evaluarea și Optimizarea",
+            explain: "Lucrarea descrie un proces specific cu patru faze care include fazele de Pornire la Rece, RL de Raționament, Eșantionare prin Respingere și RL Diversă."
+        }
+    ]}
+/>
+
+### 3. Ce este fenomenul 'Momentul Aha' în antrenarea R1-Zero?
+
+<Question
+    choices={[
+        {
+            text: "Un proces în care modelul recunoaște erorile, se auto-corectează și explică corecturile sale",
+            explain: "Corect! Lucrarea descrie aceasta ca un proces cu patru pași: încercare inițială, recunoașterea erorilor, auto-corecția și explicația îmbunătățirii.",
+            correct: true
+        },
+        {
+            text: "Punctul în care modelul atinge performanța la nivel uman",
+            explain: "'Momentul Aha' se referă în mod specific la capacitatea modelului de a recunoaște și corecta propriile greșeli, similar cu realizările umane în rezolvarea problemelor."
+        },
+        {
+            text: "Când modelul își completează procesul de antrenare",
+            explain: "'Momentul Aha' se referă la capacitatea emergentă a modelului de a recunoaște erorile și de a se auto-corecta în timpul rezolvării problemelor, nu despre completarea antrenării."
+        }
+    ]}
+/>
+
+### 4. Cum funcționează formarea grupurilor în GRPO?
+
+<Question
+    choices={[
+        {
+            text: "Generează multiple soluții (4-16) pentru aceeași problemă și le evaluează împreună",
+            explain: "Corect! GRPO generează multiple încercări de a rezolva aceeași problemă, de obicei 4, 8 sau 16 încercări diferite, care sunt apoi evaluate ca grup.",
+            correct: true
+        },
+        {
+            text: "Combină multiple modele într-un ansamblu",
+            explain: "GRPO folosește un singur model pentru a genera multiple încercări de soluție, nu un ansamblu de modele diferite."
+        },
+        {
+            text: "Împarte datele de antrenare în grupuri diferite",
+            explain: "Formarea grupurilor în GRPO implică generarea de multiple soluții pentru aceeași problemă, nu împărțirea datelor de antrenare."
+        }
+    ]}
+/>
+
+### 5. Care este diferența cheie între DeepSeek-R1-Zero și DeepSeek-R1?
+
+<Question
+    choices={[
+        {
+            text: "R1-Zero folosește RL pur în timp ce R1 combină RL cu ajustarea fină supervizată",
+            explain: "Corect! După cum se arată în tabelul de comparație, R1-Zero folosește antrenare RL pură în timp ce R1 folosește o abordare multi-fază combinând ajustarea fină supervizată cu RL, rezultând în consistență mai bună a limbajului.",
+            correct: true
+        },
+        {
+            text: "R1-Zero este mai mic decât R1",
+            explain: "Diferența este în abordările lor de antrenare (RL pur vs. multi-fază), nu în dimensiunile modelelor lor."
+        },
+        {
+            text: "R1-Zero a fost antrenat pe mai puține date",
+            explain: "Distincția cheie este metodologia lor de antrenare: RL pur pentru R1-Zero versus o abordare combinată SFT și RL pentru R1."
+        }
+    ]}
+/> 
\ No newline at end of file
diff --git a/chapters/rum/chapter12/3a.mdx b/chapters/rum/chapter12/3a.mdx
index f33035691..9d4522cb6 100644
--- a/chapters/rum/chapter12/3a.mdx
+++ b/chapters/rum/chapter12/3a.mdx
@@ -194,4 +194,198 @@ $$mean(r_i) = 0.5$$
 $$\text{Raport}: \frac{0.7}{0.5} = 1.4  →\text{după Clip}\space1.2 \space (\epsilon = 0.2)$$
 - Apoi când funcția țintă este re-ponderată, modelul tinde să întărească generarea rezultatului corect, și $\text{Divergența KL}$ limitează deviația de la politica de referință.
 
-Cu înțelegerea teoretică la locul ei, să vedem cum poate fi implementat GRPO în cod. 
\ No newline at end of file
+Cu înțelegerea teoretică la locul ei, să vedem cum poate fi implementat GRPO în cod.
+
+## Exemplu de Implementare
+
+Să punem totul împreună într-un exemplu practic. Următorul cod demonstrează cum să implementezi GRPO în PyTorch.
+
+### 1. Încărcarea Modelului și Generarea Răspunsurilor
+
+În primul rând, trebuie să încărcăm un model și să generăm multiple răspunsuri pentru o întrebare dată:
+
+```python
+import torch
+import torch.nn.functional as F
+from transformers import AutoModelForCausalLM, AutoTokenizer
+
+# Încarcă modelul și tokenizer-ul
+model_name = "Qwen/Qwen2-Math-1.5B"
+model = AutoModelForCausalLM.from_pretrained(model_name)
+tokenizer = AutoTokenizer.from_pretrained(model_name)
+model.eval()
+
+# Mută modelul pe GPU dacă este disponibil
+device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
+model.to(device)
+
+# Prompt de intrare
+prompt = "Rezolvă y = 2x + 1 pentru x = 2, y = "  # Răspuns corect: 5
+inputs = tokenizer(prompt, return_tensors="pt", padding=True)
+input_ids = inputs["input_ids"].to(device)  # Forma: (1, prompt_len)
+attention_mask = inputs["attention_mask"].to(device)
+
+# Pasul 1: Generează 8 răspunsuri (B = 2 grupuri, G = 4 răspunsuri per grup)
+batch_size, num_generations = 2, 4
+outputs = model.generate(
+    input_ids=input_ids,  # Forma: (1, prompt_len)
+    attention_mask=attention_mask,
+    max_new_tokens=1,  # seq_len = 1 (un singur token per răspuns)
+    num_return_sequences=batch_size * num_generations,  # 8 răspunsuri în total
+    do_sample=True,
+    top_k=10,
+    temperature=0.7,
+    pad_token_id=tokenizer.eos_token_id,
+    return_dict_in_generate=True,
+    output_scores=True,
+)
+```
+
+această Generare inițială (Înainte de Orice Pași) va produce ceva de genul:
+
+```text
+Rezultatul 1: 5.0
+Rezultatul 2: 6.0
+Rezultatul 3: 7.0
+Rezultatul 4: 5.0
+Rezultatul 5: 10.0
+Rezultatul 6: 2.0
+Rezultatul 7: 5.0
+Rezultatul 8: 5.0
+```
+
+### 2. Calcularea Recompenselor
+
+Acum, trebuie să determinăm care răspunsuri sunt corecte și să atribuim recompense în consecință:
+
+Cu GRPO, cu același prompt de eșantion, generăm multiple completări. Deci, de exemplu, pentru prompt-urile noastre de `"Rezolvă y = 2x + 1 pentru x = 2, y = "` și `Rezolvă y = 2x + 1 pentru x = 4, y = "` avem două grupuri de rezultate generate pentru prompt-ul dat unul este să zicem 
+- `[5, 6, 7, 5]` și celălalt este 
+- `[10, 2, 9, 9]` în timp ce răspunsul corect este 5 și 9. 
+
+Observă că în practică aceste scoruri de recompensă sunt obținute printr-o funcție de recompensă bazată pe reguli care atribuie recompense bazate pe corectitudinea răspunsului sau un model mai complex bazat pe rețele neuronale care poate fi antrenat să atribuie recompense bazate pe corectitudinea răspunsului sau un amestec din ambele. Dar pentru simplitate să spunem că recompensa noastră per răspuns este 1 dacă răspunsul este corect și 0 dacă este greșit, prin urmare:  
+```python
+reward_1 = [1, 0, 0, 1]
+reward_2 = [0, 0, 1, 1]
+```
+apoi obținem media și std-ul grupului de recompense;
+
+```python
+# Forma: (B * G,) = (8,) pentru că avem 2 grupuri de 4 generări pe care le aplatizăm
+rewards = torch.tensor([1, 0, 0, 1, 0, 0, 1, 1], dtype=torch.float32)
+num_generations = 4
+
+# Recompense grupate: Forma (B, G) = 2, 4)
+rewards_grouped = rewards.view(-1, num_generations)
+
+# Media per grup: Forma (B,) = (2,)
+mean_grouped_rewards = rewards_grouped.mean(dim=1)
+
+# Std per grup: Forma (B,) = (2,)
+std_grouped_rewards = rewards_grouped.std(dim=1)
+
+# Difuzează pentru a se potrivi cu recompensele și normalizează: Forma (B * G,) = (8,)
+# de ce avem nevoie să difuzăm? pentru că trebuie să calculăm valorile avantajului pentru fiecare răspuns din grup
+mean_grouped_rewards = mean_grouped_rewards.repeat_interleave(num_generations, dim=0)
+std_grouped_rewards = std_grouped_rewards.repeat_interleave(num_generations, dim=0)
+```
+aceasta va produce:
+```text
+Recompense Grupate: tensor([[1., 0., 0., 1.],
+                        [0., 0., 1., 1.]])
+Media per grup: tensor([0.5000, 0.5000])
+Std per grup: tensor([0.5774, 0.5774])
+Media Difuzată: tensor([0.5000, 0.5000, 0.5000, 0.5000, 0.5000, 0.5000, 0.5000, 0.5000])
+Std Difuzat: tensor([0.5774, 0.5774, 0.5774, 0.5774, 0.5774, 0.5774, 0.5774, 0.5774])
+```
+Acum putem calcula valorile avantajului pentru fiecare răspuns:
+```python
+# Avantaje: Forma (B * G,) = (8,)
+advantages = (rewards - mean_grouped_rewards) / (std_grouped_rewards + 1e-8)
+```
+aceasta va produce:
+```text
+Avantaje: tensor([ 0.8659, -0.8660, -0.8660,  0.8659, -0.8660, -0.8660,  0.8659,  0.8659])
+```
+care vine din formula Avantajului de mai sus, deci:
+```text
+Pentru reward_1 = [1, 0, 0, 1]:
+1 - 0.5 / 0.5774 ≈ 0.8659
+0 - 0.5 / 0.5774 ≈ -0.8660
+Pentru reward_2 = [0, 0, 1, 1]: Același model.
+```
+cu toate acestea, forma aici este `(B*G,) = (8,)` dar în practică, avem nevoie să avem forma de `(B, G) = (2, 4)` pentru a se potrivi cu forma logits, nu? Prin urmare, trebuie să unsqueeze tensor-ul avantajelor pentru a avea forma de `(B*G, 1) = (8, 1)` pentru a se potrivi cu forma logits.
+```python
+# Forma (B * G, 1) = (8, 1) pentru a se potrivi cu forma logits
+advantages = advantages.unsqueeze(1)
+```
+care va produce:
+```text
+Avantaje: tensor([[ 0.8659],
+                    [-0.8660],
+                    [-0.8660],
+                    [ 0.8659],
+                    [-0.8660],
+                    [-0.8660],
+                    [ 0.8659],
+                    [ 0.8659]])
+```
+acum suntem bine, să trecem la următorul pas de actualizare a modelului de politică bazat pe valorile avantajului.
+
+### 3. Actualizarea Politicii
+În final, folosim valorile avantajului pentru a actualiza modelul nostru:
+
+```python
+# Calculează raportul de probabilitate între politicile noi și vechi
+ratio = torch.exp(
+    new_per_token_logps - per_token_logps
+)  # Forma: (B*G, seq_len) seq_len este lungimea rezultatului adică numărul de token-uri generate deci aici pentru simplitate să presupunem că este 1 # (8, 1)
+```
+
+Observă că `per_token_logps` poate fi obținut prin trecerea rezultatelor generate la model și obținerea logits-urilor și apoi aplicarea funcției softmax pentru a obține probabilitățile `F.softmax(logits, dim=-1)`.
+
+```python
+# Funcția de Tăiere
+eps = self.cliprange  # de exemplu 0.2
+pg_losses1 = -advantages * ratio  # Forma: (B*G, seq_len)  #(8, 1)
+pg_losses2 = -advantages * torch.clamp(
+    ratio, 1.0 - eps, 1.0 + eps
+)  # Forma: (B*G, seq_len) #(8, 1)
+pg_loss_max = torch.max(pg_losses1, pg_losses2)  # Forma: (B*G, seq_len) #(8, 1)
+
+
+# Acum Combină cu penalitatea KL # Forma: (B*G, seq_len) #(8, 1)
+per_token_loss = pg_loss_max + self.beta * per_token_kl
+```
+
+`per_token_kl` poate fi de asemenea calculat după cum urmează:
+
+```python
+# Forma: (B*G, seq_len) #(8, 1)
+per_token_kl = F.kl_div(
+    F.log_softmax(new_per_token_logps, dim=-1),
+    F.softmax(per_token_logps, dim=-1),
+    reduction="none",
+).sum(dim=-1, keepdim=True)
+```
+
+Exemplul complet poate fi găsit [aici](./basic_example.py). GRPO este de asemenea implementat de excelenta echipă TRL, poți verifica implementarea [TRL/GRPO_trainer](https://github.com/huggingface/trl/blob/main/trl/trainer/grpo_trainer.py) pentru mai multe detalii.
+
+## Rezumat și Pași Următori
+
+Felicitări! Acum ai învățat despre Optimizarea Relativă a Politicii de Grup (GRPO). Pentru a recapitula ce am acoperit:
+
+1. GRPO compară multiple rezultate în cadrul unui grup pentru a determina care sunt mai bune decât altele, fără a necesita un model de valoare separat.
+2. Calculul avantajului standardizează recompensele pentru a identifica care răspunsuri sunt peste sau sub medie.
+3. Actualizarea politicii folosește o funcție obiectiv tăiată cu o penalitate de divergență KL pentru a asigura învățarea stabilă.
+
+Această abordare este deosebit de puternică pentru sarcinile de raționament matematic, unde corectitudinea poate fi verificată obiectiv. Metoda GRPO permite antrenare mai eficientă comparativ cu abordările RLHF tradiționale care necesită un model critic separat.
+
+Pe măsură ce continui să explorezi GRPO, consideră să experimentezi cu diferite dimensiuni de grup, funcții de recompensă și coeficienți de penalitate KL pentru a vedea cum afectează performanța modelului tău.
+
+Antrenare fericită! 🚀
+
+## Referințe
+
+1. [Cartea RLHF de Nathan Lambert](https://github.com/natolambert/rlhf-book)
+2. [Raportul Tehnic DeepSeek-V3](https://huggingface.co/papers/2412.19437)
+3. [DeepSeekMath](https://huggingface.co/papers/2402.03300) 
\ No newline at end of file

From 3f8f37d732b562f6b95f674e720f2ff32b2777da Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Tue, 3 Jun 2025 23:06:09 +0300
Subject: [PATCH 147/167] fix: resolve all conflicts from threads and solve
 grammatical issues in the romanian translation of chapter7

---
 chapters/rum/_toctree.yml   | 2 +-
 chapters/rum/chapter7/1.mdx | 4 ++--
 chapters/rum/chapter7/2.mdx | 4 ++--
 chapters/rum/chapter7/3.mdx | 2 +-
 chapters/rum/chapter7/5.mdx | 4 ++--
 chapters/rum/chapter7/7.mdx | 2 +-
 chapters/rum/chapter7/9.mdx | 6 +++---
 7 files changed, 12 insertions(+), 12 deletions(-)

diff --git a/chapters/rum/_toctree.yml b/chapters/rum/_toctree.yml
index b7af9af65..700eb930f 100644
--- a/chapters/rum/_toctree.yml
+++ b/chapters/rum/_toctree.yml
@@ -34,7 +34,7 @@
   - local: chapter7/2
     title: Clasificarea tokenilor
   - local: chapter7/3
-    title: Fine-tuningul la un model de limbaj mascat
+    title: Fine-tuningul unui model de limbaj mascat
   - local: chapter7/4
     title: Traducere
   - local: chapter7/5
diff --git a/chapters/rum/chapter7/1.mdx b/chapters/rum/chapter7/1.mdx
index f55a782ab..a5d41cf80 100644
--- a/chapters/rum/chapter7/1.mdx
+++ b/chapters/rum/chapter7/1.mdx
@@ -13,8 +13,8 @@
 - Masked language modeling (precum BERT)
 - Sumarizare
 - Traducere
-- Preantrenare pentru causal language modeling (precum GPT-2)
-- Răspunderea la întrebări
+- Preantrenare pentru `causal language modeling` (precum GPT-2)
+- Răspunsul la întrebări
 
 {#if fw === 'pt'}
 
diff --git a/chapters/rum/chapter7/2.mdx b/chapters/rum/chapter7/2.mdx
index 108806a81..556650e97 100644
--- a/chapters/rum/chapter7/2.mdx
+++ b/chapters/rum/chapter7/2.mdx
@@ -53,7 +53,7 @@ Puteți găsi modelul pe care îl vom antrena și încărca în Hub și puteți
 
 ### Datasetul CoNLL-2003 [[the-conll-2003-dataset]]
 
-Pentru a încărca dataetul CoNLL-2003, folosim metoda `load_dataset()` din biblioteca 🤗 Datasets:
+Pentru a încărca datasetul CoNLL-2003, folosim metoda `load_dataset()` din biblioteca 🤗 Datasets:
 
 ```py
 from datasets import load_dataset
@@ -221,7 +221,7 @@ inputs.word_ids()
 [None, 0, 1, 2, 3, 4, 5, 6, 7, 7, 8, None]
 ```
 
-Cu puțină muncă, putem apoi extinde lista de labeluri pentru a se potrivi cu tokenii. Prima regulă pe care o vom aplica este că tokenii special primesc un label `-100`. Acest lucru se datorează faptului că în mod implicit `-100` este un indice care este ignorat în funcția de pierdere pe care o vom utiliza (cross entropy). Apoi, fiecare token primește același label ca și tokenul care a inițiat cuvântul în care se află, deoarece fac parte din aceeași entitate. Pentru tokenii din interiorul unui cuvânt, dar care nu se află la început, înlocuim `B-` cu `I-` (deoarece tokenul nu începe entitatea):
+Cu puțină muncă, putem apoi extinde lista de labeluri pentru a se potrivi cu tokenii. Prima regulă pe care o vom aplica este că tokenii special primesc un label `-100`. Acest lucru se datorează faptului că în mod implicit `-100` este un indice care este ignorat în funcția de pierdere pe care o vom utiliza (cross-entropy). Apoi, fiecare token primește același label ca și tokenul care a inițiat cuvântul în care se află, deoarece fac parte din aceeași entitate. Pentru tokenii din interiorul unui cuvânt, dar care nu se află la început, înlocuim `B-` cu `I-` (deoarece tokenul nu începe entitatea):
 
 
 ```python
diff --git a/chapters/rum/chapter7/3.mdx b/chapters/rum/chapter7/3.mdx
index a10df56ca..376173cc9 100644
--- a/chapters/rum/chapter7/3.mdx
+++ b/chapters/rum/chapter7/3.mdx
@@ -939,7 +939,7 @@ output_dir = model_name
 repo = Repository(output_dir, clone_from=repo_name)
 ```
 
-Odată făcut acest lucru, este doar o chestiune simplă de scriere a ciclului complet de antrenare și evaluare:
+Odată ce acest lucru este făcut, trebuie doar să scriem ciclul complet de antrenare și evaluare:
 
 ```python
 from tqdm.auto import tqdm
diff --git a/chapters/rum/chapter7/5.mdx b/chapters/rum/chapter7/5.mdx
index 84157cc3f..348265741 100644
--- a/chapters/rum/chapter7/5.mdx
+++ b/chapters/rum/chapter7/5.mdx
@@ -23,7 +23,7 @@
 {/if}
 
 
-În această secțiune vom analiza modul în care modelele Transformer pot fi utilizate pentru a condensa documente lungi în rezumate, o sarcină cunoscută sub numele de _text summarization_. Aceasta este una dintre cele mai dificile sarcini NLP, deoarece necesită o gamă largă de abilități, cum ar fi înțelegerea pasajelor lungi și generarea unui text coerent care integrează principalele subiecte dintr-un document. Cu toate acestea, atunci când este bine realizată, rezumarea textului este un instrument puternic care poate accelera diverse procese de business prin scutirea experților într-u anumit domeniu de a citi documente lungi în detaliu.
+În această secțiune vom analiza modul în care modelele Transformer pot fi utilizate pentru a condensa documente lungi în rezumate, o sarcină cunoscută sub numele de _text summarization_. Aceasta este una dintre cele mai dificile sarcini NLP, deoarece necesită o gamă largă de abilități, cum ar fi înțelegerea pasajelor lungi și generarea unui text coerent care integrează principalele subiecte dintr-un document. Cu toate acestea, atunci când este bine realizată, rezumarea textului este un instrument puternic care poate accelera diverse procese de business prin scutirea experților într-un anumit domeniu de a citi documente lungi în detaliu.
 
 <Youtube id="yHnr5Dk2zCI"/>
 
@@ -126,7 +126,7 @@ book                       3756
 Name: product_category, dtype: int64
 ```
 
-Cele mai populare produse din datasetul în limba engleză sunt despre articole de uz casnic, îmbrăcăminte și electronice fără fir. Cu toate acestea, pentru a rămâne la Amazontheme, să ne concentrăm pe rezumatul recenziilor de cărți - la urma urmei, acesta este motivul pentru care compania a fost fondată! Putem vedea două categorii de produse care se potrivesc (`book` și `digital_ebook_purchase`), deci să filtrăm dataseturile în ambele limbi doar pentru aceste produse. După cum am văzut în [Capitolul 5](/course/chapter5), funcția `Dataset.filter()` ne permite să tăiem un datasetfoarte eficient, deci putem defini o funcție simplă pentru a face acest lucru:
+Cele mai populare produse din datasetul în limba engleză sunt despre articole de uz casnic, îmbrăcăminte și electronice fără fir. Cu toate acestea, pentru a rămâne la Amazontheme, să ne concentrăm pe rezumatul recenziilor de cărți - la urma urmei, acesta este motivul pentru care compania a fost fondată! Putem vedea două categorii de produse care se potrivesc (`book` și `digital_ebook_purchase`), deci să filtrăm dataseturile în ambele limbi doar pentru aceste produse. După cum am văzut în [Capitolul 5](/course/chapter5), funcția `Dataset.filter()` ne permite să tăiem un dataset foarte eficient, deci putem defini o funcție simplă pentru a face acest lucru:
 
 ```python
 def filter_books(example):
diff --git a/chapters/rum/chapter7/7.mdx b/chapters/rum/chapter7/7.mdx
index 37b278a11..619ecf720 100644
--- a/chapters/rum/chapter7/7.mdx
+++ b/chapters/rum/chapter7/7.mdx
@@ -26,7 +26,7 @@ Este timpul să analizăm răspunsul la întrebări! Această sarcină are mai m
 
 <Youtube id="ajPx5LwJD-I"/>
 
-Vom face fine-tuning unuimodel BERT pe [datasetul SQuAD] (https://rajpurkar.github.io/SQuAD-explorer/), care constă din întrebări adresate de mulțimea de lucrători pe un set de articole Wikipedia. Acest lucru ne va oferi un model capabil să calculeze predicții precum aceasta:
+Vom face fine-tuning unui-model BERT pe [datasetul SQuAD] (https://rajpurkar.github.io/SQuAD-explorer/), care constă din întrebări adresate de mulțimea de lucrători pe un set de articole Wikipedia. Acest lucru ne va oferi un model capabil să calculeze predicții precum aceasta:
 
 <iframe src="https://course-demos-bert-finetuned-squad.hf.space" frameBorder="0" height="450" title="Gradio app" class="block dark:hidden container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
 
diff --git a/chapters/rum/chapter7/9.mdx b/chapters/rum/chapter7/9.mdx
index 38e4ee0a0..35b8279a3 100644
--- a/chapters/rum/chapter7/9.mdx
+++ b/chapters/rum/chapter7/9.mdx
@@ -66,7 +66,7 @@ Să testăm ce ați învățat în acest capitol!
 <Question
 	choices={[
 		{
-			text: "Tokenizatorul adaugă tokeni speciali și nu avem labeluri pentru ele.",
+			text: "Tokenizerul adaugă tokeni speciali și nu avem labeluri pentru ele.",
 			explain: "Le etichetăm pe acestea cu <code>-100</code>, astfel încât acestea să fie ignorate în pierdere."
 		},
 		{
@@ -76,7 +76,7 @@ Să testăm ce ați învățat în acest capitol!
 		},
 		{
 			text: "Tokenii adăugați nu au etichete, deci nu există nicio problemă.",
-			explain: "Incorect; avem nevoie de atâtea etichete câțo tokeni avem, altfel modelele noastre vor da erori."
+			explain: "Incorect; avem nevoie de atâtea etichete câți tokeni avem, altfel modelele noastre vor da erori."
 		}
 	]}
 />
@@ -165,7 +165,7 @@ Să testăm ce ați învățat în acest capitol!
 			explain: "Acesta ar putea fi un API pe care îl vom adăuga în viitor, dar nu este disponibil acum."
 		},
 		{
-			text: "Inputurile și targturile trebuie preprocesate, în două apeluri separate către tokenizer.",
+			text: "Inputurile și targeturile trebuie preprocesate, în două apeluri separate către tokenizer.",
 			explain: "Acest lucru este adevărat, dar incomplet. Trebuie să faceți ceva pentru a vă asigura că tokenizerul le procesează pe ambele în mod corespunzător."
 		},
 		{

From 23dfc674e896aecdf5cf3623ff07f1119b05c58e Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Wed, 4 Jun 2025 13:07:41 +0300
Subject: [PATCH 148/167] fix: solve all translation issues and threads on
 chapter8 romanian translation

---
 chapters/rum/chapter8/1.mdx    | 4 ++--
 chapters/rum/chapter8/2.mdx    | 6 +++---
 chapters/rum/chapter8/3.mdx    | 6 +++---
 chapters/rum/chapter8/4.mdx    | 2 +-
 chapters/rum/chapter8/4_tf.mdx | 4 ++--
 chapters/rum/chapter8/5.mdx    | 4 ++--
 6 files changed, 13 insertions(+), 13 deletions(-)

diff --git a/chapters/rum/chapter8/1.mdx b/chapters/rum/chapter8/1.mdx
index ce5924f10..4683d9426 100644
--- a/chapters/rum/chapter8/1.mdx
+++ b/chapters/rum/chapter8/1.mdx
@@ -5,13 +5,13 @@
     classNames="absolute z-10 right-0 top-0"
 />
 
-Acum că știți cum să abordați cele mai frecvente sarcini NLP cu 🤗 Transformers, ar trebui să puteți începe propriile proiecte! În acest capitol vom explora ce să faceți când întâmpinați o problemă. Veți învăța cum să vă depanați cu succes codul sau antrenamentul și cum să cereți ajutor de la comunitate dacă nu reușiți să rezolvați problema singuri. Și dacă credeți că ați găsit o eroare într-una dintre bibliotecile Hugging Face, vă vom arăta cea mai bună modalitate de a o raporta astfel încât problema să fie rezolvată cât mai rapid posibil.
+Acum că știți cum să abordați cele mai frecvente sarcini NLP cu 🤗 Transformers, ar trebui să puteți începe propriile proiecte! În acest capitol vom explora ce să faceți când întâmpinați o problemă. Veți învăța cum să depanați cu succes codul sau antrenamentul și cum să cereți ajutor de la comunitate dacă nu reușiți să rezolvați problema singuri. Și dacă credeți că ați găsit o eroare într-una dintre bibliotecile Hugging Face, vă vom arăta cea mai bună modalitate de a o raporta astfel încât problema să fie rezolvată cât mai rapid posibil.
 
 Mai precis, în acest capitol veți învăța:
 
 - Primul lucru de făcut când primiți o eroare
 - Cum să cereți ajutor pe [forumuri](https://discuss.huggingface.co/)
-- Cum să vă depanați pipeline-ul de antrenament
+- Cum să faceți debugging pipeline-ului de antrenament
 - Cum să scrieți o problemă bună
 
 Nimic din acestea nu este specific 🤗 Transformers sau ecosistemului Hugging Face, desigur; lecțiile din acest capitol sunt aplicabile majorității proiectelor open source! 
\ No newline at end of file
diff --git a/chapters/rum/chapter8/2.mdx b/chapters/rum/chapter8/2.mdx
index ebc0c1b93..5473d60d4 100644
--- a/chapters/rum/chapter8/2.mdx
+++ b/chapters/rum/chapter8/2.mdx
@@ -11,7 +11,7 @@
 
 <Youtube id="DQ-CpJn6Rc4"/>
 
-Am pregătit un [repository model șablon](https://huggingface.co/lewtun/distilbert-base-uncased-finetuned-squad-d5716d28) pentru această secțiune, și dacă doriți să rulați codul din acest capitol va trebui mai întâi să copiați modelul în contul dumneavoastră pe [Hugging Face Hub](https://huggingface.co). Pentru a face acest lucru, mai întâi conectați-vă rulând fie următoarele într-un notebook Jupyter:
+Am pregătit un [repository model șablon](https://huggingface.co/lewtun/distilbert-base-uncased-finetuned-squad-d5716d28) pentru această secțiune, și dacă doriți să rulați codul din acest capitol trebuie mai întâi să copiați modelul în contul dumneavoastră pe [Hugging Face Hub](https://huggingface.co). Pentru a face acest lucru, mai întâi conectați-vă rulând fie următoarele într-un notebook Jupyter:
 
 ```python
 from huggingface_hub import notebook_login
@@ -58,7 +58,7 @@ Pentru a începe călătoria noastră în lumea minunată a depanării modelelor
 
 > Salut! Tocmai am rulat un experiment folosind tehnicile din [Capitolul 7](/course/chapter7/7) al cursului Hugging Face și am obținut rezultate grozave pe SQuAD! Cred că putem folosi acest model ca punct de plecare pentru proiectul nostru. ID-ul modelului pe Hub este "lewtun/distillbert-base-uncased-finetuned-squad-d5716d28". Simte-te liber să îl testezi :)
 
-și primul lucru la care vă gândiți este să încărcați modelul folosind `pipeline` din 🤗 Transformers:
+Iar primul lucru la care vă gândiți este să încărcați modelul folosind `pipeline` din 🤗 Transformers:
 
 ```python
 from transformers import pipeline
@@ -294,7 +294,7 @@ Da, aceasta este cu siguranță o `list` Python. Deci ce a mers prost? Amintiți
 AttributeError: 'list' object has no attribute 'size'
 ```
 
-Se pare că codul nostru a încercat să apeleze `input_ids.size()`, dar aceasta în mod clar nu va funcționa pentru o `list` Python, care este doar un container. Cum putem rezolva această problemă? Căutarea mesajului de eroare pe Stack Overflow dă destul de multe [rezultate](https://stackoverflow.com/search?q=AttributeError%3A+%27list%27+object+has+no+attribute+%27size%27&s=c15ec54c-63cb-481d-a749-408920073e8f) relevante. Făcând clic pe primul afișează o întrebare similară cu a noastră, cu răspunsul arătat în captura de ecran de mai jos:
+Se pare că codul nostru a încercat să apeleze `input_ids.size()`, dar aceasta în mod clar nu va funcționa pentru o `list` Python, care este doar un container. Cum putem rezolva această problemă? Căutarea mesajului de eroare pe Stack Overflow oferă destul de multe [rezultate](https://stackoverflow.com/search?q=AttributeError%3A+%27list%27+object+has+no+attribute+%27size%27&s=c15ec54c-63cb-481d-a749-408920073e8f) relevante. Făcând clic pe primul afișează o întrebare similară cu a noastră, cu răspunsul arătat în captura de ecran de mai jos:
 
 <div class="flex justify-center">
 <img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter8/stack-overflow.png" alt="Un răspuns de pe Stack Overflow." width="100%"/>
diff --git a/chapters/rum/chapter8/3.mdx b/chapters/rum/chapter8/3.mdx
index dc95460e5..449f51fa5 100644
--- a/chapters/rum/chapter8/3.mdx
+++ b/chapters/rum/chapter8/3.mdx
@@ -110,11 +110,11 @@ Deoarece eroarea pare să fie exclusiv despre 🤗 Transformers, vom selecta ace
 
 Deși acest subiect conține mesajul de eroare cu care avem nevoie de ajutor, există câteva probleme cu modul în care este scris:
 
-1. Titlul nu este foarte descriptiv, așa că oricine navighează pe forum nu va putea să spună despre ce este subiectul fără să citească și corpul.
+1. Titlul nu este foarte descriptiv, așa că oricine navighează pe forum nu va putea să spună despre ce este subiectul fără să citească și conținutul.
 2. Corpul nu oferă suficiente informații despre _de unde_ vine eroarea și _cum_ să o reproduci.
 3. Subiectul etichetează câteva persoane direct cu un ton oarecum exigent.
 
-Subiecte ca acesta nu sunt susceptibile să primească un răspuns rapid (dacă primesc unul deloc), așa că să vedem cum îl putem îmbunătăți. Vom începe cu prima problemă de a alege un titlu bun.
+Subiecte ca acesta probabil nu vor primi un răspuns rapid (dacă primesc unul deloc), așa că să vedem cum îl putem îmbunătăți. Vom începe cu prima problemă de a alege un titlu bun.
 
 ### Alegerea unui titlu descriptiv[[alegerea-unui-titlu-descriptiv]]
 
@@ -136,7 +136,7 @@ Citirea codului sursă este destul de grea într-un IDE, dar este și mai grea c
 <img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter8/forum-topic03.png" alt="Subiectul nostru revizuit pe forum, cu formatarea corectă a codului." width="100%"/>
 </div>
 
-Așa cum puteți vedea în captură, înconjurarea blocurilor de cod în backtick-uri convertește textul brut în cod formatat, complet cu stilizare color! De asemenea, rețineți că backtick-urile simple pot fi folosite pentru a formata variabile inline, așa cum am făcut pentru `distilbert-base-uncased`. Acest subiect arată mult mai bine, și cu puțin noroc am putea găsi pe cineva în comunitate care poate ghici despre ce este eroarea. Cu toate acestea, în loc să ne bazăm pe noroc, să facem viața mai ușoară prin includerea traceback-ului în toată splendoarea sa!
+Așa cum puteți vedea în captură, înconjurarea blocurilor de cod în backtick-uri transformă textul brut în cod formatat, complet cu stilizare color! De asemenea, rețineți că backtick-urile simple pot fi folosite pentru a formata variabile inline, așa cum am făcut pentru `distilbert-base-uncased`. Acest subiect arată mult mai bine, și cu puțin noroc am putea găsi pe cineva în comunitate care poate ghici despre ce este eroarea. Cu toate acestea, în loc să ne bazăm pe noroc, să facem viața mai ușoară prin includerea traceback-ului în toată splendoarea sa!
 
 ### Includerea traceback-ului complet[[includerea-traceback-ului-complet]]
 
diff --git a/chapters/rum/chapter8/4.mdx b/chapters/rum/chapter8/4.mdx
index 9c961d5f1..f517bb4f9 100644
--- a/chapters/rum/chapter8/4.mdx
+++ b/chapters/rum/chapter8/4.mdx
@@ -686,7 +686,7 @@ trainer = Trainer(
 trainer.train()
 ```
 
-În acest caz, nu mai sunt probleme, și scriptul nostru va ajusta fin un model care ar trebui să dea rezultate rezonabile. Dar ce putem face când antrenamentul continuă fără nicio eroare, și modelul antrenat nu performează deloc bine? Aceasta este partea cea mai grea a machine learning-ului, și vă vom arăta câteva tehnici care pot ajuta.
+În acest caz, nu mai sunt probleme, și scriptul nostru va ajusta fin un model care ar trebui să dea rezultate rezonabile. Dar ce putem face când antrenamentul continuă fără nicio eroare, și modelul antrenat nu performează deloc bine? Aceasta este partea cea mai dificilă a machine learning-ului, și vă vom arăta câteva tehnici care pot ajuta.
 
 <Tip>
 
diff --git a/chapters/rum/chapter8/4_tf.mdx b/chapters/rum/chapter8/4_tf.mdx
index fa2872d78..2895bcf60 100644
--- a/chapters/rum/chapter8/4_tf.mdx
+++ b/chapters/rum/chapter8/4_tf.mdx
@@ -133,7 +133,7 @@ Oh nu.
 
 ### Verificați modelul vostru[[verificati-modelul-vostru]]
 
-`model.fit()` este o funcție de conveniență foarte grozavă în Keras, dar face multe lucruri pentru voi, și aceasta poate face mai complicat să găsiți exact unde a apărut o problemă. Dacă depanați modelul vostru, o strategie care poate ajuta cu adevărat este să transmiteți doar un singur batch la model, și să vă uitați la ieșirile pentru acel batch în detaliu. Un alt sfat foarte util dacă modelul aruncă erori este să `compile()` modelul cu `run_eagerly=True`. Aceasta îl va face mult mai lent, dar va face mesajele de eroare mult mai comprehensibile, deoarece vor indica exact unde în codul modelului vostru a apărut problema.
+`model.fit()` este o funcție de conveniență foarte grozavă în Keras, dar face multe lucruri pentru voi, și aceasta poate face mai complicat să găsiți exact unde a apărut o problemă. Dacă depanați modelul vostru, o strategie care poate ajuta cu adevărat este să trimitieți doar un singur batch la model, și să vă uitați la ieșirile pentru acel batch în detaliu. Un alt sfat foarte util dacă modelul aruncă erori este să `compile()` modelul cu `run_eagerly=True`. Aceasta îl va face mult mai lent, dar va face mesajele de eroare mult mai comprehensibile, deoarece vor indica exact unde în codul modelului vostru a apărut problema.
 
 Pentru moment, totuși, nu avem nevoie de `run_eagerly` încă. Să rulăm `batch`-ul pe care l-am primit înainte prin model și să vedem cum arată ieșirile:
 
@@ -248,7 +248,7 @@ model.config.num_labels
 2
 ```
 
-Acum vedem problema: modelul crede că sunt doar două clase, dar etichetele merg până la 2, ceea ce înseamnă că există de fapt trei clase (deoarece 0 este de asemenea o clasă). Așa am primit un `nan` -- prin încercarea de a calcula loss-ul pentru o clasă inexistentă! Să încercăm să schimbăm asta și să încadrăm din nou modelul:
+Acum vedem problema: modelul crede că sunt doar două clase, dar etichetele merg până la 2, ceea ce înseamnă că există de fapt trei clase (deoarece 0 este de asemenea o clasă). Așa am primit un `nan` -- prin încercarea de a calcula loss-ul pentru o clasă inexistentă! Să încercăm să schimbăm asta și să reîncadrăm modelul:
 
 ```
 model = TFAutoModelForSequenceClassification.from_pretrained(model_checkpoint, num_labels=3)
diff --git a/chapters/rum/chapter8/5.mdx b/chapters/rum/chapter8/5.mdx
index 6937b9a7e..6a1adfeda 100644
--- a/chapters/rum/chapter8/5.mdx
+++ b/chapters/rum/chapter8/5.mdx
@@ -31,7 +31,7 @@ Dacă vă simțiți suficient de confortabil, mergeți să inspectați codul sur
 
 Când depuneți un issue, veți observa că există un șablon de completat. Vom urma pe cel pentru [problemele 🤗 Transformers](https://github.com/huggingface/transformers/issues/new/choose) aici, dar același tip de informații va fi necesar dacă raportați o problemă într-un alt repository. Nu lăsați șablonul gol: luarea timpului pentru a-l completa va maximiza șansele voastre de a primi un răspuns și de a vă rezolva problema.
 
-În general, când depuneți un issue, rămâneți întotdeauna curtenitori. Acesta este un proiect open source, deci folosiți software gratuit, și nimeni nu are nicio obligație să vă ajute. Puteți include ceea ce simțiți că este critică justificată în problema voastră, dar atunci întreținătorii s-ar putea să o ia prost și să nu se grăbească să vă ajute. Asigurați-vă că citiți [codul de conduită](https://github.com/huggingface/transformers/blob/master/CODE_OF_CONDUCT.md) al proiectului.
+În general, când depuneți un issue, rămâneți întotdeauna politicoși. Acesta este un proiect open source, deci folosiți software gratuit, și nimeni nu are nicio obligație să vă ajute. Puteți include ceea ce simțiți că este critică justificată în problema voastră, dar atunci întreținătorii s-ar putea să o ia prost și să nu se grăbească să vă ajute. Asigurați-vă că citiți [codul de conduită](https://github.com/huggingface/transformers/blob/master/CODE_OF_CONDUCT.md) al proiectului.
 
 ### Includerea informațiilor despre mediul vostru[[includerea-informatiilor-despre-mediul-vostru]]
 
@@ -74,7 +74,7 @@ Dacă ați reușit să creați un exemplu autonom care produce bug-ul, acum este
 ```python
 ```
 
-apoi lipiți exemplul vostru minimal reproductibil și tastați o linie nouă cu trei backtick-uri. Aceasta va asigura că codul vostru este formatat corespunzător.
+Apoi lipiți exemplul vostru minimal reproductibil și tastați o linie nouă cu trei backtick-uri. Aceasta va asigura că codul vostru este formatat corespunzător.
 
 Dacă nu ați reușit să creați un exemplu reproductibil, explicați în pași clari cum ați ajuns la problema voastră. Includeți un link către un notebook Google Colab unde ați primit eroarea dacă puteți. Cu cât mai multe informații partajați, cu atât mai bine vor putea întreținătorii să vă răspundă.
 

From b1f958d95fe980da12d730098736009a5fec83c7 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Wed, 4 Jun 2025 13:11:21 +0300
Subject: [PATCH 149/167] fix: solve all threads and grmmatical issues on
 romanian translation of chapter9

---
 chapters/rum/chapter9/2.mdx | 2 +-
 chapters/rum/chapter9/3.mdx | 6 +++---
 chapters/rum/chapter9/4.mdx | 2 +-
 chapters/rum/chapter9/6.mdx | 2 +-
 chapters/rum/chapter9/8.mdx | 2 +-
 chapters/rum/chapter9/9.mdx | 4 ++--
 6 files changed, 9 insertions(+), 9 deletions(-)

diff --git a/chapters/rum/chapter9/2.mdx b/chapters/rum/chapter9/2.mdx
index a81512834..718455033 100644
--- a/chapters/rum/chapter9/2.mdx
+++ b/chapters/rum/chapter9/2.mdx
@@ -31,7 +31,7 @@ demo.launch()
 
 Să parcurgem codul de mai sus:
 
-- Primul, definim o funcție numită `greet()`. În acest caz, este o funcție simplă care adaugă "Hello" înaintea numelui tău, dar poate fi *orice* funcție Python în general. De exemplu, în aplicațiile de machine learning, această funcție ar *apela un model pentru a face o predicție* pe o intrare și ar returna ieșirea.
+- Mai întâi, definim o funcție numită `greet()`. În acest caz, este o funcție simplă care adaugă "Hello" înaintea numelui tău, dar poate fi *orice* funcție Python în general. De exemplu, în aplicațiile de machine learning, această funcție ar *apela un model pentru a face o predicție* pe o intrare și ar returna ieșirea.
 - Apoi, creăm o `Interface` Gradio cu trei argumente, `fn`, `inputs`, și `outputs`. Aceste argumente definesc funcția de predicție, precum și _tipul_ componentelor de intrare și ieșire pe care le-am dori. În cazul nostru, ambele componente sunt cutii de text simple.
 - Apoi apelăm metoda `launch()` pe `Interface`-ul pe care l-am creat.
 
diff --git a/chapters/rum/chapter9/3.mdx b/chapters/rum/chapter9/3.mdx
index 9c723cb5c..be640d50d 100644
--- a/chapters/rum/chapter9/3.mdx
+++ b/chapters/rum/chapter9/3.mdx
@@ -68,7 +68,7 @@ mic = gr.Audio(source="microphone", type="numpy", label="Vorbiți aici...")
 gr.Interface(reverse_audio, mic, "audio").launch()
 ```
 
-Codul de mai sus va produce o interfață ca cea de mai jos (dacă browser-ul dvs. nu
+Codul de mai sus va produce o interfață ca cea de mai jos (dacă browserul dvs. nu
 vă cere permisiuni pentru microfon, <a href="https://huggingface.co/spaces/course-demos/audio-reverse" target="_blank">deschideți demo-ul într-o filă separată</a>.)
 
 <iframe src="https://course-demos-audio-reverse.hf.space" frameBorder="0" height="250" title="Gradio app" class="container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
@@ -133,7 +133,7 @@ Gradio va incorpora interfața GUI demo în notebook pentru a o putea folosi cu
 Puteți personaliza comportamentul `launch()` prin parametri diferiți:
 
   - `inline` - dacă să afișeze interfața inline în notebook-urile Python.
-  - `inbrowser` - dacă să lanseze automat interfața într-o filă nouă în browser-ul implicit.
+  - `inbrowser` - dacă să lanseze automat interfața într-o filă nouă în browserul implicit.
   - `share` - dacă să creeze un link partajabil public de pe calculatorul dvs. pentru interfață. Cam ca un link Google Drive!
 
 Vom acoperi parametrul `share` în mult mai multe detalii în următoarea secțiune!
@@ -165,7 +165,7 @@ gr.Interface(
 ).launch()
 ```
 
-Dacă browser-ul dvs. nu vă cere permisiuni pentru microfon, <a href="https://huggingface.co/spaces/course-demos/audio-reverse" target="_blank">deschideți demo-ul într-o filă separată</a>.
+Dacă browserul dvs. nu vă cere permisiuni pentru microfon, <a href="https://huggingface.co/spaces/course-demos/audio-reverse" target="_blank">deschideți demo-ul într-o filă separată</a>.
 
 <iframe src="https://course-demos-asr.hf.space" frameBorder="0" height="550" title="Gradio app" class="container p-0 flex-grow space-iframe" allow="accelerometer; ambient-light-sensor; autoplay; battery; camera; document-domain; encrypted-media; fullscreen; geolocation; gyroscope; layout-animations; legacy-image-formats; magnetometer; microphone; midi; oversized-images; payment; picture-in-picture; publickey-credentials-get; sync-xhr; usb; vr ; wake-lock; xr-spatial-tracking" sandbox="allow-forms allow-modals allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-downloads"></iframe>
 
diff --git a/chapters/rum/chapter9/4.mdx b/chapters/rum/chapter9/4.mdx
index 1c00af570..03cf14cb9 100644
--- a/chapters/rum/chapter9/4.mdx
+++ b/chapters/rum/chapter9/4.mdx
@@ -60,7 +60,7 @@ Interfețele pot fi partajate public cu ușurință prin setarea `share=True` î
 gr.Interface(classify_image, "image", "label").launch(share=True)
 ```
 
-Aceasta generează un link public, partajabil pe care îl puteți trimite oricui! Când trimiteți acest link, utilizatorul din cealaltă parte poate încerca modelul în browser-ul lor timp de până la 72 de ore. Deoarece procesarea se întâmplă pe dispozitivul dvs. (atâta timp cât dispozitivul dvs. rămâne pornit!), nu trebuie să vă faceți griji cu privire la împachetarea dependențelor. Dacă lucrați dintr-un notebook Google Colab, un link de partajare este întotdeauna creat automat. De obicei arată cam așa: **XXXXX.gradio.app**. Deși link-ul este servit printr-un link Gradio, suntem doar un proxy pentru server-ul dvs. local și nu stocăm datele trimise prin interfețe.
+Aceasta generează un link public, partajabil pe care îl puteți trimite oricui! Când trimiteți acest link, utilizatorul din cealaltă parte poate încerca modelul în browserul lor timp de până la 72 de ore. Deoarece procesarea se întâmplă pe dispozitivul dvs. (atâta timp cât dispozitivul dvs. rămâne pornit!), nu trebuie să vă faceți griji cu privire la împachetarea dependențelor. Dacă lucrați dintr-un notebook Google Colab, un link de partajare este întotdeauna creat automat. De obicei arată cam așa: **XXXXX.gradio.app**. Deși link-ul este servit printr-un link Gradio, suntem doar un proxy pentru serverul dvs. local și nu stocăm datele trimise prin interfețe.
 
 Rețineți totuși că aceste link-uri sunt accesibile public, ceea ce înseamnă că oricine poate folosi modelul dvs. pentru predicție! Prin urmare, asigurați-vă să nu expuneți informații sensibile prin funcțiile pe care le scrieți sau să permiteți modificări critice pe dispozitivul dvs. Dacă setați `share=False` (implicit), doar un link local este creat.
 
diff --git a/chapters/rum/chapter9/6.mdx b/chapters/rum/chapter9/6.mdx
index 91c8d65f0..70bb2a2ae 100644
--- a/chapters/rum/chapter9/6.mdx
+++ b/chapters/rum/chapter9/6.mdx
@@ -11,7 +11,7 @@ Acum că putem construi și partaja o interfață de bază, să explorăm câtev
 
 ### Folosirea stării pentru a persista datele[[using-state-to-persist-data]]
 
-Gradio suportă *starea sesiunii*, unde datele persistă prin multiple trimiteri într-o
+Gradio are suport pentru *starea sesiunii*, unde datele persistă prin multiple trimiteri într-o
 încărcare de pagină. Starea sesiunii este utilă pentru construirea demo-urilor, de exemplu, chatbot-uri unde doriți să
 persistați datele pe măsură ce utilizatorul interacționează cu modelul. Rețineți că starea sesiunii nu partajează datele între diferiți utilizatori ai modelului dvs.
 
diff --git a/chapters/rum/chapter9/8.mdx b/chapters/rum/chapter9/8.mdx
index 6ad5509f7..39a36377b 100644
--- a/chapters/rum/chapter9/8.mdx
+++ b/chapters/rum/chapter9/8.mdx
@@ -10,7 +10,7 @@ Aceasta încheie capitolul despre construirea demo-urilor cool ML cu Gradio - sp
 - Cum să creați demo-uri Gradio cu API-ul de nivel înalt `Interface`, și cum să configurați diferite modalități de intrare și ieșire.
 - Diferite moduri de a partaja demo-urile Gradio, prin link-uri temporare și găzduire pe [Hugging Face Spaces](https://huggingface.co/spaces).
 - Cum să integrați demo-urile Gradio cu modelele și Spaces de pe Hugging Face Hub.
-- Caracteristici avansate precum stocarea stării într-un demo sau furnizarea autentificării.
+- Caracteristici avansate precum păstrarea stării într-un demo sau furnizarea autentificării.
 - Cum să aveți control complet asupra fluxului de date și layout-ului demo-ului dvs. cu Gradio Blocks.
 
 Dacă doriți să vă testați înțelegerea conceptelor acoperite în acest capitol, consultați quiz-ul din următoarea secțiune!
diff --git a/chapters/rum/chapter9/9.mdx b/chapters/rum/chapter9/9.mdx
index 318d2da7e..71c4bc39b 100644
--- a/chapters/rum/chapter9/9.mdx
+++ b/chapters/rum/chapter9/9.mdx
@@ -73,7 +73,7 @@ Să testăm ce ați învățat în acest capitol!
 	]}
 />
 
-### 4. Gradio este conceput în primul rând pentru modele NLP
+### 4. Gradio este construit în primul rând pentru modele NLP
 
 <Question
 	choices={[
@@ -105,7 +105,7 @@ Să testăm ce ați învățat în acest capitol!
         },
         {
 			text: "Autentificare cu nume de utilizator și parole",
-			explain: "Transmiteți o listă de tuple nume de utilizator/parolă la metoda launch pentru a adăuga autentificare.",
+			explain: "Transmiteți o listă de tuple nume de utilizator/parolă la metoda `launch` pentru a adăuga autentificare.",
 			correct: true
         },
         {

From 82f1d4a93559b44b47dbd7524a7ee4c363801506 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Wed, 4 Jun 2025 13:22:56 +0300
Subject: [PATCH 150/167] fix: solve all threads on translation of chapter10

---
 chapters/rum/_toctree.yml    |  2 +-
 chapters/rum/chapter10/1.mdx |  6 +++---
 chapters/rum/chapter10/2.mdx | 10 +++++-----
 chapters/rum/chapter10/3.mdx |  2 +-
 chapters/rum/chapter10/4.mdx |  2 +-
 chapters/rum/chapter10/7.mdx |  4 ++--
 6 files changed, 13 insertions(+), 13 deletions(-)

diff --git a/chapters/rum/_toctree.yml b/chapters/rum/_toctree.yml
index ba02215af..2015e1577 100644
--- a/chapters/rum/_toctree.yml
+++ b/chapters/rum/_toctree.yml
@@ -27,7 +27,7 @@
     title: Quiz de final de capitol
     quiz: 1
 
-- title: 10. Curați seturi de date de înaltă calitate
+- title: 10. Curățați seturi de date de înaltă calitate
   subtitle: Cum să folosiți Argilla pentru a crea seturi de date uimitoare
   sections:
   - local: chapter10/1
diff --git a/chapters/rum/chapter10/1.mdx b/chapters/rum/chapter10/1.mdx
index 380ddd93c..07298d5f6 100644
--- a/chapters/rum/chapter10/1.mdx
+++ b/chapters/rum/chapter10/1.mdx
@@ -5,9 +5,9 @@
     classNames="absolute z-10 right-0 top-0"
 />
 
-În Capitolul 5 ați învățat cum să construiți un set de date folosind biblioteca 🤗 Datasets și în Capitolul 6 ați explorat cum să ajustați modele pentru unele sarcini NLP comune. În acest capitol, veți învăța cum să folosiți [Argilla](https://argilla.io) pentru a **anota și cura seturi de date** pe care le puteți folosi pentru a antrena și evalua modelele dumneavoastră.
+În Capitolul 5 ați învățat cum să construiți un set de date folosind biblioteca 🤗 Datasets și în Capitolul 6 ați explorat cum să ajustați modele pentru unele sarcini NLP comune. În acest capitol, veți învăța cum să folosiți [Argilla](https://argilla.io) pentru a **anota și cura seturi de date** pe care le puteți folosi pentru a antrena și evalua modelele dvs. .
 
-Cheia pentru antrenarea modelelor care funcționează bine este să aveți date de înaltă calitate. Deși există unele seturi de date bune în Hub pe care le-ați putea folosi pentru a antrena și evalua modelele dumneavoastră, acestea s-ar putea să nu fie relevante pentru aplicația sau cazul de utilizare specific. În acest scenariu, s-ar putea să doriți să construiți și să curați un set de date propriu. Argilla vă va ajuta să faceți acest lucru eficient.
+Cheia pentru antrenarea modelelor care funcționează bine este să aveți date de înaltă calitate. Deși există unele seturi de date bune în Hub pe care le-ați putea folosi pentru a antrena și evalua modelele dvs. , acestea s-ar putea să nu fie relevante pentru aplicația sau cazul de utilizare specific. În acest scenariu, s-ar putea să doriți să construiți și să curați un set de date propriu. Argilla vă va ajuta să faceți acest lucru eficient.
 
 <img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter10/signin-hf-page.png" alt="Pagina de autentificare Argilla."/>
 
@@ -16,7 +16,7 @@ Cu Argilla puteți:
 - transforma datele nestructurate în **date structurate** care să fie folosite în sarcini NLP.
 - cura un set de date pentru a trece de la un set de date de calitate scăzută la un **set de date de înaltă calitate**.
 - aduna **feedback uman** pentru LLM-uri și modele multi-modale.
-- invita experți să colaboreze cu dumneavoastră în Argilla, sau să aduceți adnotări de la mulțime!
+- invita experți să colaboreze cu dvs. în Argilla, sau să aduceți adnotări de la mulțime!
 
 Iată câteva dintre lucrurile pe care le veți învăța în acest capitol:
 
diff --git a/chapters/rum/chapter10/2.mdx b/chapters/rum/chapter10/2.mdx
index e4505b45c..940b6263c 100644
--- a/chapters/rum/chapter10/2.mdx
+++ b/chapters/rum/chapter10/2.mdx
@@ -16,21 +16,21 @@ Cea mai ușoară modalitate de a configura instanța Argilla este prin Hugging F
 
 >[!WARNING]
 > ⚠️ S-ar putea să doriți să activați **Persistent storage** astfel încât datele să nu se piardă dacă Space-ul este pus în pauză sau repornit.
-> Puteți face asta din Settings-urile Space-ului dumneavoastră.
+> Puteți face asta din Settings-urile Space-ului dvs. .
 
-Odată ce Argilla este operațională, vă puteți autentifica cu acreditările dumneavoastră.
+Odată ce Argilla este operațională, vă puteți autentifica cu acreditările dvs. .
 
 ## Instalați și conectați SDK-ul Python
 
-Acum puteți merge în mediul Python sau notebook-ul dumneavoastră și instala biblioteca argilla:
+Acum puteți merge în mediul Python sau notebook-ul dvs. și instala biblioteca argilla:
 
 `!pip install argilla`
 
 Să ne conectăm cu instanța noastră Argilla. Pentru asta veți avea nevoie de următoarele informații:
 
-- **URL-ul API-ului dumneavoastră**: Acesta este URL-ul unde rulează Argilla. Dacă folosiți un Space, puteți deschide Space-ul, face clic pe cele trei puncte din colțul din dreapta sus, apoi "Embed this Space" și copiați **Direct URL**. Ar trebui să arate ca `https://<numele-utilizatorului>.<numele-space-ului>.hf.space`.
+- **URL-ul API-ului dvs. **: Acesta este URL-ul unde rulează Argilla. Dacă folosiți un Space, puteți deschide Space-ul, face clic pe cele trei puncte din colțul din dreapta sus, apoi "Embed this Space" și copiați **Direct URL**. Ar trebui să arate ca `https://<numele-utilizatorului>.<numele-space-ului>.hf.space`.
 - **Cheia API**: Pentru a obține cheia, autentificați-vă în instanța Argilla și mergeți la "My Settings", apoi copiați cheia API.
-- **Token-ul HF**: Dacă Space-ul dumneavoastră este privat, veți avea nevoie de un Access Token în contul Hugging Face Hub cu permisiuni de scriere.
+- **Token-ul HF**: Dacă Space-ul dvs. este privat, veți avea nevoie de un Access Token în contul Hugging Face Hub cu permisiuni de scriere.
 
 ```python
 import argilla as rg
diff --git a/chapters/rum/chapter10/3.mdx b/chapters/rum/chapter10/3.mdx
index 7a10d6612..e2b6ec324 100644
--- a/chapters/rum/chapter10/3.mdx
+++ b/chapters/rum/chapter10/3.mdx
@@ -7,7 +7,7 @@
     {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter10/section3.ipynb"},
 ]} />
 
-În funcție de sarcina NLP cu care lucrați și cazul de utilizare sau aplicația specifică, datele dumneavoastră și sarcina de adnotare vor arăta diferit. Pentru această secțiune a cursului, vom folosi [un set de date care colectează știri](https://huggingface.co/datasets/SetFit/ag_news) pentru a completa două sarcini: o clasificare de text asupra subiectului fiecărui text și o clasificare de token-uri pentru a identifica entitățile numite menționate.
+În funcție de sarcina NLP cu care lucrați și cazul de utilizare sau aplicația specifică, datele dvs. și sarcina de adnotare vor arăta diferit. Pentru această secțiune a cursului, vom folosi [un set de date care colectează știri](https://huggingface.co/datasets/SetFit/ag_news) pentru a completa două sarcini: o clasificare de text asupra subiectului fiecărui text și o clasificare de token-uri pentru a identifica entitățile numite menționate.
 
 <iframe
   src="https://huggingface.co/datasets/SetFit/ag_news/embed/viewer/default/train"
diff --git a/chapters/rum/chapter10/4.mdx b/chapters/rum/chapter10/4.mdx
index 27ed77fce..10628c154 100644
--- a/chapters/rum/chapter10/4.mdx
+++ b/chapters/rum/chapter10/4.mdx
@@ -21,7 +21,7 @@ Dacă doriți să aprofundați subiectul despre cum să scrieți îndrumări bun
 
 În pagina de setări a setului de date, puteți de asemenea să schimbați setările de distribuire a setului de date. Aceasta vă va ajuta să adnotați mai eficient când lucrați ca parte dintr-o echipă. Valoarea implicită pentru răspunsurile minime trimise este 1, ceea ce înseamnă că de îndată ce o înregistrare are 1 răspuns trimis va fi considerată completă și va conta către progresul din setul de date.
 
-Uneori, doriți să aveți mai mult de un răspuns trimis per înregistrare, de exemplu, dacă doriți să analizați acordul între adnotatori în sarcina dumneavoastră. În acel caz, asigurați-vă că schimbați această setare la un număr mai mare, dar întotdeauna mai mic sau egal cu numărul total de adnotatori. Dacă lucrați singur la sarcină, doriți ca această setare să fie 1.
+Uneori, doriți să aveți mai mult de un răspuns trimis per înregistrare, de exemplu, dacă doriți să analizați acordul între adnotatori în sarcina dvs. . În acel caz, asigurați-vă că schimbați această setare la un număr mai mare, dar întotdeauna mai mic sau egal cu numărul total de adnotatori. Dacă lucrați singur la sarcină, doriți ca această setare să fie 1.
 
 ## Adnotați înregistrări
 
diff --git a/chapters/rum/chapter10/7.mdx b/chapters/rum/chapter10/7.mdx
index 6ed08d5a9..cebd5f3cd 100644
--- a/chapters/rum/chapter10/7.mdx
+++ b/chapters/rum/chapter10/7.mdx
@@ -145,7 +145,7 @@ Să testăm ce ați învățat în acest capitol!
 	choices={[
         {
 			text: "Adevărat",
-			explain: "Puteți adăuga sugestii la înregistrările dumneavoastră (sau să le actualizați) în orice moment al proiectului.",
+			explain: "Puteți adăuga sugestii la înregistrările dvs. (sau să le actualizați) în orice moment al proiectului.",
             correct: true
         },
         {
@@ -175,7 +175,7 @@ Să testăm ce ați învățat în acest capitol!
         },
         {
 			text: "Convertiți setul de date Argilla într-un set de date Datasets: <code>dataset = dataset.to_datasets()</code>",
-			explain: "Aceasta nu este necesară dacă exportați setul de date complet. Argilla se va ocupa de aceasta pentru dumneavoastră. Cu toate acestea, s-ar putea să aveți nevoie de ea dacă lucrați cu un subset de înregistrări."
+			explain: "Aceasta nu este necesară dacă exportați setul de date complet. Argilla se va ocupa de aceasta pentru dvs. . Cu toate acestea, s-ar putea să aveți nevoie de ea dacă lucrați cu un subset de înregistrări."
         },
         {
 			text: "Folosiți metoda </code>to_hub</code> pentru a exporta setul de date: <code>dataset.to_hub(repo_id='my_username/dataset_name')</code>",

From d897df33f51ea17b6bebfd8621d576c85e602680 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Thu, 5 Jun 2025 14:50:07 +0300
Subject: [PATCH 151/167] fix: solve threads an grammatical issues

---
 chapters/rum/chapter11/4.mdx | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/chapters/rum/chapter11/4.mdx b/chapters/rum/chapter11/4.mdx
index 9781706e1..f243b94e3 100644
--- a/chapters/rum/chapter11/4.mdx
+++ b/chapters/rum/chapter11/4.mdx
@@ -10,7 +10,7 @@ Fine-tuningul modelelor mari de limbaj este un proces intensiv în resurse. LoRA
 
 ## Înțelegerea LoRA
 
-LoRA (Adaptarea de rang scăzut) este o tehnică de fine-tuning eficientă din punct de vedere al parametrilor care înghețează greutățile modelului pre-antrenat și injectează matrice de descompunere de rang antrenabile în straturile modelului. În loc să antreneze toți parametrii modelului în timpul fine-tuningului, LoRA descompune actualizările greutăților în matrice mai mici prin descompunere de rang scăzut, reducând semnificativ numărul de parametri antrenabili menținând în același timp performanța modelului. De exemplu, când este aplicat la GPT-3 175B, LoRA a redus parametrii antrenabili de 10.000 de ori și cerințele de memorie GPU de 3 ori comparativ cu fine-tuningul complet. Puteți citi mai multe despre LoRA în [lucrarea LoRA](https://arxiv.org/pdf/2106.09685).
+LoRA (Adaptarea de rang scăzut) este o tehnică de fine-tuning eficientă din punct de vedere al parametrilor care îngheață greutățile modelului pre-antrenat și injectează matrice de descompunere de rang antrenabile în straturile modelului. În loc să antreneze toți parametrii modelului în timpul fine-tuningului, LoRA descompune actualizările greutăților în matrice mai mici prin descompunere de rang scăzut, reducând semnificativ numărul de parametri antrenabili menținând în același timp performanța modelului. De exemplu, când este aplicat la GPT-3 175B, LoRA a redus parametrii antrenabili de 10.000 de ori și cerințele de memorie GPU de 3 ori comparativ cu fine-tuningul complet. Puteți citi mai multe despre LoRA în [lucrarea LoRA](https://arxiv.org/pdf/2106.09685).
 
 LoRA funcționează prin adăugarea de perechi de matrice de descompunere de rang la straturile transformer, concentrându-se de obicei pe greutățile atenției. În timpul inferenței, aceste greutăți ale adaptorului pot fi îmbinate cu modelul de bază, rezultând în nicio latență suplimentară. LoRA este deosebit de util pentru adaptarea modelelor mari de limbaj la sarcini sau domenii specifice menținând în același timp cerințele de resurse gestionabile.
 
@@ -124,7 +124,7 @@ După antrenarea cu LoRA, s-ar putea să doriți să îmbinați greutățile ada
 
 Procesul de îmbinare necesită atenție la gestionarea memoriei și precizie. Deoarece va trebui să încărcați atât modelul de bază, cât și greutățile adaptorului simultan, asigurați-vă că există memorie GPU/CPU suficientă disponibilă. Folosirea `device_map="auto"` în `transformers` va găsi dispozitivul corect pentru model bazat pe hardware-ul dumneavoastră.
 
-Mențineți precizia consistentă (de ex., float16) pe tot parcursul procesului, potrivind precizia folosită în timpul antrenamentului și salvând modelul îmbinat în același format pentru implementare.
+Mențineți precizia consistentă (de ex. float16) pe tot parcursul procesului, potrivind precizia folosită în timpul antrenamentului și salvând modelul îmbinat în același format pentru implementare.
 
 ## Implementarea îmbinării
 

From 78531f6010fdaa0e951838e0402230995ef27c79 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Thu, 5 Jun 2025 16:47:55 +0300
Subject: [PATCH 152/167] fix: solve all thread suggestions and grammar issues

---
 chapters/rum/chapter12/3.mdx | 2 +-
 chapters/rum/chapter12/6.mdx | 4 ++--
 2 files changed, 3 insertions(+), 3 deletions(-)

diff --git a/chapters/rum/chapter12/3.mdx b/chapters/rum/chapter12/3.mdx
index f44f0402b..1cd3a12e2 100644
--- a/chapters/rum/chapter12/3.mdx
+++ b/chapters/rum/chapter12/3.mdx
@@ -1,6 +1,6 @@
 # Înțelegerea Lucrării DeepSeek R1
 
-Acest capitol este un curs intensiv de citire a unei lucrări. Vom parcurge lucrarea în termeni simpli, și apoi vom descompune conceptele cheie și concluziile.
+Acest capitol este un curs intensiv de lectură a unei lucrări. Vom parcurge lucrarea în termeni simpli, și apoi vom descompune conceptele cheie și concluziile.
 
 DeepSeek R1 reprezintă un progres semnificativ în antrenarea modelelor de limbaj, în special în dezvoltarea capacităților de raționament prin învățarea prin întărire. Lucrarea introduce un nou algoritm de învățare prin întărire numit Optimizarea Relativă a Politicii de Grup (GRPO).
 
diff --git a/chapters/rum/chapter12/6.mdx b/chapters/rum/chapter12/6.mdx
index e95a488d6..5be72a1ee 100644
--- a/chapters/rum/chapter12/6.mdx
+++ b/chapters/rum/chapter12/6.mdx
@@ -8,7 +8,7 @@
 
 În acest exercițiu, vei ajusta fin un model cu GRPO (Optimizarea Relativă a Politicii de Grup) folosind Unsloth, pentru a îmbunătăți capacitățile de raționament ale unui model. Am acoperit GRPO în [Capitolul 3](/course/chapter3/3).
 
-Unsloth este o bibliotecă care accelerează ajustarea fină LLM, făcând posibilă antrenarea modelelor mai repede și cu mai puține resurse computaționale. Unsloth se conectează la TRL, deci vom construi pe ceea ce am învățat în secțiunile anterioare, și o vom adapta pentru specificațiile Unsloth.
+Unsloth este o bibliotecă care accelerează ajustarea fină a LLM-urilor, făcând posibilă antrenarea modelelor mai repede și cu mai puține resurse computaționale. Unsloth se conectează la TRL, deci vom construi pe ceea ce am învățat în secțiunile anterioare, și o vom adapta pentru specificațiile Unsloth.
 
 <Tip>
 
@@ -331,7 +331,7 @@ Ar trebui să vezi că modelul urmează acum formatul specificat, arătându-și
 Unsloth oferă mai multe opțiuni pentru salvarea modelului tău ajustat fin, dar ne vom concentra pe cea mai comună.
 
 ```python
-# Salvează la precizie 16-bit
+# Salvează cu precizie de 16 biți
 model.save_pretrained_merged("model", tokenizer, save_method="merged_16bit")
 ```
 

From 023122dd97cf5ee9a85a2a9dc6896c0ccdb5e929 Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Thu, 5 Jun 2025 16:54:37 +0300
Subject: [PATCH 153/167] fix: solve grammatical tautology on romanian
 translation of chapter12

---
 chapters/rum/chapter12/5.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/chapter12/5.mdx b/chapters/rum/chapter12/5.mdx
index 39965eb1b..80b961e2e 100644
--- a/chapters/rum/chapter12/5.mdx
+++ b/chapters/rum/chapter12/5.mdx
@@ -163,7 +163,7 @@ Ne vom concentra pe recompensa din funcția de recompensă și pierderea.
 
 După cum poți vedea, recompensa din funcția de recompensă se apropie de 0 pe măsură ce modelul învață. Acesta este un semn bun că modelul învață să genereze text de lungimea corectă.
 
-![Recompensa din funcția de recompensă](https://huggingface.co/reasoning-course/images/resolve/main/grpo/13.png)
+![Rezultatul oferit din funcția de recompensă](https://huggingface.co/reasoning-course/images/resolve/main/grpo/13.png)
 
 Ai putea observa că pierderea începe de la zero și apoi crește în timpul antrenamentului, ceea ce poate părea contraontuitiv. Acest comportament este așteptat în GRPO și este direct legat de formularea matematică a algoritmului. Pierderea în GRPO este proporțională cu divergența KL (capsula relativă la politica originală). Pe măsură ce antrenamentul progresează, modelul învață să genereze text care se potrivește mai bine cu funcția de recompensă, făcându-l să devieze mai mult de la politica sa inițială. Această divergență crescândă se reflectă în valoarea pierderii în creștere, care de fapt indică că modelul se adaptează cu succes pentru a optimiza funcția de recompensă.
 

From f6b4e26b9c1800c3d216c2041ecbe1886270577d Mon Sep 17 00:00:00 2001
From: eduard-balamatiuc <balamatiuc2@gmail.com>
Date: Thu, 5 Jun 2025 16:57:32 +0300
Subject: [PATCH 154/167] fix: solve grammatical issues in romanian translation
 of events chapter

---
 chapters/rum/events/2.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/rum/events/2.mdx b/chapters/rum/events/2.mdx
index 54cd94dfc..4d4ed3125 100644
--- a/chapters/rum/events/2.mdx
+++ b/chapters/rum/events/2.mdx
@@ -76,7 +76,7 @@ Mark Saroufim este Partner Engineer la Pytorch lucrând pe instrumente OSS de pr
 <img src="https://i.imgur.com/5dWQeNB.png" alt="Un rezumat vizual al prezentării lui Jakob" width="80%"/>
 </p>
 
-Jakob Uszkoreit este co-fondatorul Inceptive. Inceptive proiectează molecule RNA pentru vaccinuri și terapeutice folosind deep learning la scară largă într-un ciclu strâns cu experimente de randament ridicat cu scopul de a face medicamentele bazate pe RNA mai accesibile, mai eficiente și mai aplicabile pe scară largă. Anterior, Jakob a lucrat la Google pentru mai mult de un deceniu, conducând echipe de cercetare și dezvoltare în Google Brain, Research și Search lucrând pe fundamentele deep learning, computer vision, înțelegerea limbajului și traducerea automată.
+Jakob Uszkoreit este co-fondatorul Inceptive. Inceptive proiectează molecule de ARN pentru vaccinuri și terapeutice folosind deep learning la scară largă într-un ciclu strâns cu experimente de randament ridicat cu scopul de a face medicamentele bazate pe RNA mai accesibile, mai eficiente și mai aplicabile pe scară largă. Anterior, Jakob a lucrat la Google pentru mai mult de un deceniu, conducând echipe de cercetare și dezvoltare în Google Brain, Research și Search lucrând pe fundamentele deep learning, computer vision, înțelegerea limbajului și traducerea automată.
 
 ## Ziua 2: Instrumentele de folosit[[ziua-2-instrumentele-de-folosit]]
 

From 7e950174e24fe8968e6a2ba3bde7de8e591663c6 Mon Sep 17 00:00:00 2001
From: Steven Liu <59462357+stevhliu@users.noreply.github.com>
Date: Fri, 6 Jun 2025 14:53:45 -0700
Subject: [PATCH 155/167] sentencepiece

---
 chapters/en/chapter6/7.mdx | 10 +++++++++-
 1 file changed, 9 insertions(+), 1 deletion(-)

diff --git a/chapters/en/chapter6/7.mdx b/chapters/en/chapter6/7.mdx
index b0067ecc5..b0f0320f4 100644
--- a/chapters/en/chapter6/7.mdx
+++ b/chapters/en/chapter6/7.mdx
@@ -7,7 +7,9 @@
     {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter6/section7.ipynb"},
 ]} />
 
-The Unigram algorithm is often used in SentencePiece, which is the tokenization algorithm used by models like AlBERT, T5, mBART, Big Bird, and XLNet.
+The Unigram algorithm is used in combination with [SentencePiece](https://huggingface.co/papers/1808.06226), which is the tokenization algorithm used by models like AlBERT, T5, mBART, Big Bird, and XLNet.
+
+SentencePiece addresses the fact that not all languages use spaces to separate words. Instead, SentencePiece treats the input as a raw input stream which includes the space in the set of characters to use. Then it can use the Unigram algorithm to construct the appropriate vocabulary.
 
 <Youtube id="TGZfZVuF9Yc"/>
 
@@ -378,4 +380,10 @@ tokenize("This is the Hugging Face course.", model)
 ['▁This', '▁is', '▁the', '▁Hugging', '▁Face', '▁', 'c', 'ou', 'r', 's', 'e', '.']
 ```
 
+<Tip>
+
+The XLNetTokenizer uses SentencePiece which is why the `"_"` character is included. To decode with SentencePiece, concatenate all the tokens and replace `"_"` with a space.
+
+</Tip>
+
 That's it for Unigram! Hopefully by now you're feeling like an expert in all things tokenizer. In the next section, we will delve into the building blocks of the 🤗 Tokenizers library, and show you how you can use them to build your own tokenizer.

From c286b5f741127dc68e33c4a2fa425e01dea45ac2 Mon Sep 17 00:00:00 2001
From: burtenshaw <ben.burtenshaw@gmail.com>
Date: Tue, 10 Jun 2025 15:33:48 +0200
Subject: [PATCH 156/167] remove tensorflow and use Tip objects

---
 chapters/en/chapter3/1.mdx    |  20 ++--
 chapters/en/chapter3/2.mdx    | 104 +-----------------
 chapters/en/chapter3/3.mdx    |  47 +++++++-
 chapters/en/chapter3/3_tf.mdx | 199 ----------------------------------
 chapters/en/chapter3/4.mdx    |  42 ++++++-
 chapters/en/chapter3/5.mdx    |  30 ++---
 chapters/en/chapter3/6.mdx    |  71 ++++--------
 7 files changed, 126 insertions(+), 387 deletions(-)
 delete mode 100644 chapters/en/chapter3/3_tf.mdx

diff --git a/chapters/en/chapter3/1.mdx b/chapters/en/chapter3/1.mdx
index 884be198b..3ce084a5e 100644
--- a/chapters/en/chapter3/1.mdx
+++ b/chapters/en/chapter3/1.mdx
@@ -9,18 +9,12 @@
 
 In [Chapter 2](/course/chapter2) we explored how to use tokenizers and pretrained models to make predictions. But what if you want to fine-tune a pretrained model for your own dataset? That's the topic of this chapter! You will learn:
 
-{#if fw === 'pt'}
-* How to prepare a large dataset from the Hub
-* How to use the high-level `Trainer` API to fine-tune a model
-* How to use a custom training loop
-* How to leverage the 🤗 Accelerate library to easily run that custom training loop on any distributed setup
+* How to prepare a large dataset from the Hub using the latest 🤗 Datasets features
+* How to use the high-level `Trainer` API to fine-tune a model with modern best practices
+* How to implement a custom training loop with optimization techniques
+* How to leverage the 🤗 Accelerate library to easily run distributed training on any setup
+* How to apply current fine-tuning best practices including proper evaluation and model uploading
 
-{:else}
-* How to prepare a large dataset from the Hub
-* How to use Keras to fine-tune a model
-* How to use Keras to get predictions
-* How to use a custom metric
+This chapter focuses exclusively on **PyTorch**, as it has become the standard framework for modern deep learning research and production. We'll use the latest APIs and best practices from the Hugging Face ecosystem.
 
-{/if}
-
-In order to upload your trained checkpoints to the Hugging Face Hub, you will need a huggingface.co account: [create an account](https://huggingface.co/join)
\ No newline at end of file
+To upload your trained models to the Hugging Face Hub, you will need a huggingface.co account: [create an account](https://huggingface.co/join)
\ No newline at end of file
diff --git a/chapters/en/chapter3/2.mdx b/chapters/en/chapter3/2.mdx
index e94b46d75..d854973a9 100644
--- a/chapters/en/chapter3/2.mdx
+++ b/chapters/en/chapter3/2.mdx
@@ -1,9 +1,5 @@
-<FrameworkSwitchCourse {fw} />
-
 # Processing the data[[processing-the-data]]
 
-{#if fw === 'pt'}
-
 <CourseFloatingBanner chapter={3}
   classNames="absolute z-10 right-0 top-0"
   notebooks={[
@@ -11,18 +7,6 @@
     {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter3/section2_pt.ipynb"},
 ]} />
 
-{:else}
-
-<CourseFloatingBanner chapter={3}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter3/section2_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter3/section2_tf.ipynb"},
-]} />
-
-{/if}
-
-{#if fw === 'pt'}
 Continuing with the example from the [previous chapter](/course/chapter2), here is how we would train a sequence classifier on one batch in PyTorch:
 
 ```python
@@ -48,30 +32,6 @@ loss = model(**batch).loss
 loss.backward()
 optimizer.step()
 ```
-{:else}
-Continuing with the example from the [previous chapter](/course/chapter2), here is how we would train a sequence classifier on one batch in TensorFlow:
-
-```python
-import tensorflow as tf
-import numpy as np
-from transformers import AutoTokenizer, TFAutoModelForSequenceClassification
-
-# Same as before
-checkpoint = "bert-base-uncased"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint)
-sequences = [
-    "I've been waiting for a HuggingFace course my whole life.",
-    "This course is amazing!",
-]
-batch = dict(tokenizer(sequences, padding=True, truncation=True, return_tensors="tf"))
-
-# This is new
-model.compile(optimizer="adam", loss="sparse_categorical_crossentropy")
-labels = tf.convert_to_tensor([1, 1])
-model.train_on_batch(batch, labels)
-```
-{/if}
 
 Of course, just training the model on two sentences is not going to yield very good results. To get better results, you will need to prepare a bigger dataset.
 
@@ -79,11 +39,7 @@ In this section we will use as an example the MRPC (Microsoft Research Paraphras
 
 ### Loading a dataset from the Hub[[loading-a-dataset-from-the-hub]]
 
-{#if fw === 'pt'}
 <Youtube id="_BZearw7f0w"/>
-{:else}
-<Youtube id="W_gMJF0xomE"/>
-{/if}
 
 The Hub doesn't just contain models; it also has multiple datasets in lots of different languages. You can browse the datasets [here](https://huggingface.co/datasets), and we recommend you try to load and process a new dataset once you have gone through this section (see the general documentation [here](https://huggingface.co/docs/datasets/loading)). But for now, let's focus on the MRPC dataset! This is one of the 10 datasets composing the [GLUE benchmark](https://gluebenchmark.com/), which is an academic benchmark that is used to measure the performance of ML models across 10 different text classification tasks.
 
@@ -158,11 +114,7 @@ Behind the scenes, `label` is of type `ClassLabel`, and the mapping of integers
 
 ### Preprocessing a dataset[[preprocessing-a-dataset]]
 
-{#if fw === 'pt'}
 <Youtube id="0u3ioSwev3s"/>
-{:else}
-<Youtube id="P-rZWqcB6CE"/>
-{/if}
 
 To preprocess the dataset, we need to convert the text to numbers the model can make sense of. As you saw in the [previous chapter](/course/chapter2), this is done with a tokenizer. We can feed the tokenizer one sentence or a list of sentences, so we can directly tokenize all the first sentences and all the second sentences of each pair like this:
 
@@ -283,34 +235,19 @@ Our `tokenize_function` returns a dictionary with the keys `input_ids`, `attenti
 
 The last thing we will need to do is pad all the examples to the length of the longest element when we batch elements together — a technique we refer to as *dynamic padding*.
 
-### Dynamic padding[[dynamic-padding]]
+##### Dynamic padding[[dynamic-padding]]
 
 <Youtube id="7q5NyFT8REg"/>
 
-{#if fw === 'pt'}
 The function that is responsible for putting together samples inside a batch is called a *collate function*. It's an argument you can pass when you build a `DataLoader`, the default being a function that will just convert your samples to PyTorch tensors and concatenate them (recursively if your elements are lists, tuples, or dictionaries). This won't be possible in our case since the inputs we have won't all be of the same size. We have deliberately postponed the padding, to only apply it as necessary on each batch and avoid having over-long inputs with a lot of padding. This will speed up training by quite a bit, but note that if you're training on a TPU it can cause problems — TPUs prefer fixed shapes, even when that requires extra padding.
 
-{:else}
-
-The function that is responsible for putting together samples inside a batch is called a *collate function*. The default collator is a function that will just convert your samples to tf.Tensor and concatenate them (recursively if your elements are lists, tuples, or dictionaries). This won't be possible in our case since the inputs we have won't all be of the same size. We have deliberately postponed the padding, to only apply it as necessary on each batch and avoid having over-long inputs with a lot of padding. This will speed up training by quite a bit, but note that if you're training on a TPU it can cause problems — TPUs prefer fixed shapes, even when that requires extra padding.
-
-{/if}
-
 To do this in practice, we have to define a collate function that will apply the correct amount of padding to the items of the dataset we want to batch together. Fortunately, the 🤗 Transformers library provides us with such a function via `DataCollatorWithPadding`. It takes a tokenizer when you instantiate it (to know which padding token to use, and whether the model expects padding to be on the left or on the right of the inputs) and will do everything you need:
 
-{#if fw === 'pt'}
 ```py
 from transformers import DataCollatorWithPadding
 
 data_collator = DataCollatorWithPadding(tokenizer=tokenizer)
 ```
-{:else}
-```py
-from transformers import DataCollatorWithPadding
-
-data_collator = DataCollatorWithPadding(tokenizer=tokenizer, return_tensors="tf")
-```
-{/if}
 
 To test this new toy, let's grab a few samples from our training set that we would like to batch together. Here, we remove the columns `idx`, `sentence1`, and `sentence2` as they won't be needed and contain strings (and we can't create tensors with strings) and have a look at the lengths of each entry in the batch:
 
@@ -331,17 +268,6 @@ batch = data_collator(samples)
 {k: v.shape for k, v in batch.items()}
 ```
 
-{#if fw === 'tf'}
-
-```python out
-{'attention_mask': TensorShape([8, 67]),
- 'input_ids': TensorShape([8, 67]),
- 'token_type_ids': TensorShape([8, 67]),
- 'labels': TensorShape([8])}
-```
-
-{:else}
-
 ```python out
 {'attention_mask': torch.Size([8, 67]),
  'input_ids': torch.Size([8, 67]),
@@ -351,36 +277,10 @@ batch = data_collator(samples)
 
 Looking good! Now that we've gone from raw text to batches our model can deal with, we're ready to fine-tune it!
 
-{/if}
-
 <Tip>
 
 ✏️ **Try it out!** Replicate the preprocessing on the GLUE SST-2 dataset. It's a little bit different since it's composed of single sentences instead of pairs, but the rest of what we did should look the same. For a harder challenge, try to write a preprocessing function that works on any of the GLUE tasks.
 
 </Tip>
 
-{#if fw === 'tf'}
-
-Now that we have our dataset and a data collator, we need to put them together. We could manually load batches and collate them, but that's a lot of work, and probably not very performant either. Instead, there's a simple method that offers a performant solution to this problem: `to_tf_dataset()`. This will wrap a `tf.data.Dataset` around your dataset, with an optional collation function. `tf.data.Dataset` is a native TensorFlow format that Keras can use for `model.fit()`, so this one method immediately converts a 🤗 Dataset to a format that's ready for training. Let's see it in action with our dataset!
-
-```py
-tf_train_dataset = tokenized_datasets["train"].to_tf_dataset(
-    columns=["attention_mask", "input_ids", "token_type_ids"],
-    label_cols=["labels"],
-    shuffle=True,
-    collate_fn=data_collator,
-    batch_size=8,
-)
-
-tf_validation_dataset = tokenized_datasets["validation"].to_tf_dataset(
-    columns=["attention_mask", "input_ids", "token_type_ids"],
-    label_cols=["labels"],
-    shuffle=False,
-    collate_fn=data_collator,
-    batch_size=8,
-)
-```
-
-And that's it! We can take those datasets forward into the next lecture, where training will be pleasantly straightforward after all the hard work of data preprocessing.
-
-{/if}
+Perfect! Now that we have preprocessed our data with the latest best practices from the 🤗 Datasets library, we're ready to move on to training our model using the modern Trainer API. The next section will show you how to fine-tune your model effectively using the latest features and optimizations available in the Hugging Face ecosystem.
diff --git a/chapters/en/chapter3/3.mdx b/chapters/en/chapter3/3.mdx
index a7f2662bc..936f7adb2 100644
--- a/chapters/en/chapter3/3.mdx
+++ b/chapters/en/chapter3/3.mdx
@@ -11,7 +11,7 @@
 
 <Youtube id="nvBXf7s7vTI"/>
 
-🤗 Transformers provides a `Trainer` class to help you fine-tune any of the pretrained models it provides on your dataset. Once you've done all the data preprocessing work in the last section, you have just a few steps left to define the `Trainer`. The hardest part is likely to be preparing the environment to run `Trainer.train()`, as it will run very slowly on a CPU. If you don't have a GPU set up, you can get access to free GPUs or TPUs on [Google Colab](https://colab.research.google.com/).
+🤗 Transformers provides a `Trainer` class to help you fine-tune any of the pretrained models it provides on your dataset with modern best practices. Once you've done all the data preprocessing work in the last section, you have just a few steps left to define the `Trainer`. The hardest part is likely to be preparing the environment to run `Trainer.train()`, as it will run very slowly on a CPU. If you don't have a GPU set up, you can get access to free GPUs or TPUs on [Google Colab](https://colab.research.google.com/).
 
 The code examples below assume you have already executed the examples in the previous section. Here is a short summary recapping what you need:
 
@@ -58,7 +58,7 @@ model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_label
 
 You will notice that unlike in [Chapter 2](/course/chapter2), you get a warning after instantiating this pretrained model. This is because BERT has not been pretrained on classifying pairs of sentences, so the head of the pretrained model has been discarded and a new head suitable for sequence classification has been added instead. The warnings indicate that some weights were not used (the ones corresponding to the dropped pretraining head) and that some others were randomly initialized (the ones for the new head). It concludes by encouraging you to train the model, which is exactly what we are going to do now.
 
-Once we have our model, we can define a `Trainer` by passing it all the objects constructed up to now — the `model`, the `training_args`, the training and validation datasets, our `data_collator`, and our `processing_class` (e.g., a tokenizer, feature extractor, or processor):
+Once we have our model, we can define a `Trainer` by passing it all the objects constructed up to now — the `model`, the `training_args`, the training and validation datasets, our `data_collator`, and our `processing_class`. The `processing_class` parameter is a newer addition that tells the Trainer which tokenizer to use for processing:
 
 ```py
 from transformers import Trainer
@@ -73,7 +73,11 @@ trainer = Trainer(
 )
 ```
 
-Note that when you pass a tokenizer as the `processing_class`, as we did here, the default `data_collator` used by the `Trainer` will be a `DataCollatorWithPadding` if the `processing_class` is a tokenizer or feature extractor, so you can skip the line `data_collator=data_collator` in this call. It was still important to show you this part of the processing in section 2!
+<Tip>
+
+💡 When you pass a tokenizer as the `processing_class`, the default `data_collator` used by the `Trainer` will be a `DataCollatorWithPadding`. You can skip the `data_collator=data_collator` line in this case, but we included it here to show you this important part of the processing pipeline.
+
+</Tip>
 
 To fine-tune the model on our dataset, we just have to call the `train()` method of our `Trainer`:
 
@@ -160,9 +164,42 @@ trainer.train()
 
 This time, it will report the validation loss and metrics at the end of each epoch on top of the training loss. Again, the exact accuracy/F1 score you reach might be a bit different from what we found, because of the random head initialization of the model, but it should be in the same ballpark.
 
-The `Trainer` will work out of the box on multiple GPUs or TPUs and provides lots of options, like mixed-precision training (use `fp16 = True` in your training arguments). We will go over everything it supports in Chapter 10.
+### Advanced Training Features[[advanced-training-features]]
+
+The `Trainer` comes with many built-in features that make modern deep learning best practices accessible:
+
+**Mixed Precision Training**: Use `fp16=True` in your training arguments for faster training and reduced memory usage:
+```py
+training_args = TrainingArguments(
+    "test-trainer", 
+    eval_strategy="epoch",
+    fp16=True,  # Enable mixed precision
+)
+```
+
+**Gradient Accumulation**: For effective larger batch sizes when GPU memory is limited:
+```py
+training_args = TrainingArguments(
+    "test-trainer", 
+    eval_strategy="epoch",
+    per_device_train_batch_size=4,
+    gradient_accumulation_steps=4,  # Effective batch size = 4 * 4 = 16
+)
+```
+
+**Learning Rate Scheduling**: The Trainer uses linear decay by default, but you can customize this:
+```py
+training_args = TrainingArguments(
+    "test-trainer", 
+    eval_strategy="epoch",
+    learning_rate=2e-5,
+    lr_scheduler_type="cosine",  # Try different schedulers
+)
+```
+
+The `Trainer` will work out of the box on multiple GPUs or TPUs and provides lots of options for distributed training. We will go over everything it supports in Chapter 10.
 
-This concludes the introduction to fine-tuning using the `Trainer` API. An example of doing this for most common NLP tasks will be given in [Chapter 7](/course/chapter7), but for now let's look at how to do the same thing in pure PyTorch.
+This concludes the introduction to fine-tuning using the `Trainer` API. An example of doing this for most common NLP tasks will be given in [Chapter 7](/course/chapter7), but for now let's look at how to do the same thing with a pure PyTorch training loop.
 
 <Tip>
 
diff --git a/chapters/en/chapter3/3_tf.mdx b/chapters/en/chapter3/3_tf.mdx
deleted file mode 100644
index 9df89e356..000000000
--- a/chapters/en/chapter3/3_tf.mdx
+++ /dev/null
@@ -1,199 +0,0 @@
-<FrameworkSwitchCourse {fw} />
-
-# Fine-tuning a model with Keras[[fine-tuning-a-model-with-keras]]
-
-<CourseFloatingBanner chapter={3}
-  classNames="absolute z-10 right-0 top-0"
-  notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter3/section3_tf.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter3/section3_tf.ipynb"},
-]} />
-
-Once you've done all the data preprocessing work in the last section, you have just a few steps left to train the model. Note, however, that the `model.fit()` command will run very slowly on a CPU. If you don't have a GPU set up, you can get access to free GPUs or TPUs on [Google Colab](https://colab.research.google.com/).
-
-The code examples below assume you have already executed the examples in the previous section. Here is a short summary recapping what you need:
-
-```py
-from datasets import load_dataset
-from transformers import AutoTokenizer, DataCollatorWithPadding
-import numpy as np
-
-raw_datasets = load_dataset("glue", "mrpc")
-checkpoint = "bert-base-uncased"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-
-
-def tokenize_function(example):
-    return tokenizer(example["sentence1"], example["sentence2"], truncation=True)
-
-
-tokenized_datasets = raw_datasets.map(tokenize_function, batched=True)
-
-data_collator = DataCollatorWithPadding(tokenizer=tokenizer, return_tensors="tf")
-
-tf_train_dataset = tokenized_datasets["train"].to_tf_dataset(
-    columns=["attention_mask", "input_ids", "token_type_ids"],
-    label_cols=["labels"],
-    shuffle=True,
-    collate_fn=data_collator,
-    batch_size=8,
-)
-
-tf_validation_dataset = tokenized_datasets["validation"].to_tf_dataset(
-    columns=["attention_mask", "input_ids", "token_type_ids"],
-    label_cols=["labels"],
-    shuffle=False,
-    collate_fn=data_collator,
-    batch_size=8,
-)
-```
-
-### Training[[training]]
-
-TensorFlow models imported from 🤗 Transformers are already Keras models. Here is a short introduction to Keras.
-
-<Youtube id="rnTGBy2ax1c"/>
-
-That means that once we have our data, very little work is required to begin training on it.
-
-<Youtube id="AUozVp78dhk"/>
-
-As in the [previous chapter](/course/chapter2), we will use the `TFAutoModelForSequenceClassification` class, with two labels: 
-
-```py
-from transformers import TFAutoModelForSequenceClassification
-
-model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
-```
-
-You will notice that unlike in [Chapter 2](/course/chapter2), you get a warning after instantiating this pretrained model. This is because BERT has not been pretrained on classifying pairs of sentences, so the head of the pretrained model has been discarded and a new head suitable for sequence classification has been inserted instead. The warnings indicate that some weights were not used (the ones corresponding to the dropped pretraining head) and that some others were randomly initialized (the ones for the new head). It concludes by encouraging you to train the model, which is exactly what we are going to do now.
-
-To fine-tune the model on our dataset, we just have to `compile()` our model and then pass our data to the `fit()` method. This will start the fine-tuning process (which should take a couple of minutes on a GPU) and report training loss as it goes, plus the validation loss at the end of each epoch.
-
-<Tip>
-
-Note that 🤗 Transformers models have a special ability that most Keras models don't - they can automatically use an appropriate loss which they compute internally. They will use this loss by default if you don't set a loss argument in `compile()`. Note that to use the internal loss you'll need to pass your labels as part of the input, not as a separate label, which is the normal way to use labels with Keras models. You'll see examples of this in Part 2 of the course, where defining the correct loss function can be tricky. For sequence classification, however, a standard Keras loss function works fine, so that's what we'll use here.
-
-</Tip>
-
-```py
-from tensorflow.keras.losses import SparseCategoricalCrossentropy
-
-model.compile(
-    optimizer="adam",
-    loss=SparseCategoricalCrossentropy(from_logits=True),
-    metrics=["accuracy"],
-)
-model.fit(
-    tf_train_dataset,
-    validation_data=tf_validation_dataset,
-)
-```
-
-<Tip warning={true}>
-
-Note a very common pitfall here — you *can* just pass the name of the loss as a string to Keras, but by default Keras will assume that you have already applied a softmax to your outputs. Many models, however, output the values right before the softmax is applied, which are also known as the *logits*. We need to tell the loss function that that's what our model does, and the only way to do that is to call it directly, rather than by name with a string.
-
-</Tip>
-
-
-### Improving training performance[[improving-training-performance]]
-
-<Youtube id="cpzq6ESSM5c"/>
-
-If you try the above code, it certainly runs, but you'll find that the loss declines only slowly or sporadically. The primary cause
-is the *learning rate*. As with the loss, when we pass Keras the name of an optimizer as a string, Keras initializes
-that optimizer with default values for all parameters, including learning rate. From long experience, though, we know
-that transformer models benefit from a much lower learning rate than the default for Adam, which is 1e-3, also written
-as 10 to the power of -3, or 0.001. 5e-5 (0.00005), which is some twenty times lower, is a much better starting point.
-
-In addition to lowering the learning rate, we have a second trick up our sleeve: We can slowly reduce the learning rate
-over the course of training. In the literature, you will sometimes see this referred to as *decaying* or *annealing*
-the learning rate. In Keras, the best way to do this is to use a *learning rate scheduler*. A good one to use is
-`PolynomialDecay` — despite the name, with default settings it simply linearly decays the learning rate from the initial
-value to the final value over the course of training, which is exactly what we want. In order to use a scheduler correctly,
-though, we need to tell it how long training is going to be. We compute that as `num_train_steps` below.
-
-```py
-from tensorflow.keras.optimizers.schedules import PolynomialDecay
-
-batch_size = 8
-num_epochs = 3
-# The number of training steps is the number of samples in the dataset, divided by the batch size then multiplied
-# by the total number of epochs. Note that the tf_train_dataset here is a batched tf.data.Dataset,
-# not the original Hugging Face Dataset, so its len() is already num_samples // batch_size.
-num_train_steps = len(tf_train_dataset) * num_epochs
-lr_scheduler = PolynomialDecay(
-    initial_learning_rate=5e-5, end_learning_rate=0.0, decay_steps=num_train_steps
-)
-from tensorflow.keras.optimizers import Adam
-
-opt = Adam(learning_rate=lr_scheduler)
-```
-
-<Tip>
-
-The 🤗 Transformers library also has a `create_optimizer()` function that will create an `AdamW` optimizer with learning rate decay. This is a convenient shortcut that you'll see in detail in future sections of the course.
-
-</Tip>
-
-Now we have our all-new optimizer, and we can try training with it. First, let's reload the model, to reset the changes to the weights from the training run we just did, and then we can compile it with the new optimizer:
-
-```py
-import tensorflow as tf
-
-model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
-loss = tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True)
-model.compile(optimizer=opt, loss=loss, metrics=["accuracy"])
-```
-
-Now, we fit again:
-
-```py
-model.fit(tf_train_dataset, validation_data=tf_validation_dataset, epochs=3)
-```
-
-<Tip>
-
-💡 If you want to automatically upload your model to the Hub during training, you can pass along a `PushToHubCallback` in the `model.fit()` method. We will learn more about this in [Chapter 4](/course/chapter4/3)
-
-</Tip>
-
-### Model predictions[[model-predictions]]
-
-<Youtube id="nx10eh4CoOs"/>
-
-
-Training and watching the loss go down is all very nice, but what if we want to actually get outputs from the trained model, either to compute some metrics, or to use the model in production? To do that, we can just use the `predict()` method. This will return the *logits* from the output head of the model, one per class.
-
-```py
-preds = model.predict(tf_validation_dataset)["logits"]
-```
-
-We can convert these logits into the model's class predictions by using `argmax` to find the highest logit, which corresponds to the most likely class:
-
-```py
-class_preds = np.argmax(preds, axis=1)
-print(preds.shape, class_preds.shape)
-```
-
-```python out
-(408, 2) (408,)
-```
-
-Now, let's use those `preds` to compute some metrics! We can load the metrics associated with the MRPC dataset as easily as we loaded the dataset, this time with the `evaluate.load()` function. The object returned has a `compute()` method we can use to do the metric calculation:
-
-```py
-import evaluate
-
-metric = evaluate.load("glue", "mrpc")
-metric.compute(predictions=class_preds, references=raw_datasets["validation"]["label"])
-```
-
-```python out
-{'accuracy': 0.8578431372549019, 'f1': 0.8996539792387542}
-```
-
-The exact results you get may vary, as the random initialization of the model head might change the metrics it achieved. Here, we can see our model has an accuracy of 85.78% on the validation set and an F1 score of 89.97. Those are the two metrics used to evaluate results on the MRPC dataset for the GLUE benchmark. The table in the [BERT paper](https://arxiv.org/pdf/1810.04805.pdf) reported an F1 score of 88.9 for the base model. That was the `uncased` model while we are currently using the `cased` model, which explains the better result.
-
-This concludes the introduction to fine-tuning using the Keras API. An example of doing this for most common NLP tasks will be given in [Chapter 7](/course/chapter7). If you would like to hone your skills on the Keras API, try to fine-tune a model on the GLUE SST-2 dataset, using the data processing you did in section 2.
diff --git a/chapters/en/chapter3/4.mdx b/chapters/en/chapter3/4.mdx
index 77e84c75d..a9e053584 100644
--- a/chapters/en/chapter3/4.mdx
+++ b/chapters/en/chapter3/4.mdx
@@ -1,4 +1,4 @@
-# A full training[[a-full-training]]
+# A full training loop[[a-full-training]]
 
 <CourseFloatingBanner chapter={3}
   classNames="absolute z-10 right-0 top-0"
@@ -9,7 +9,7 @@
 
 <Youtube id="Dh9CL8fyG80"/>
 
-Now we'll see how to achieve the same results as we did in the last section without using the `Trainer` class. Again, we assume you have done the data processing in section 2. Here is a short summary covering everything you will need:
+Now we'll see how to achieve the same results as we did in the last section without using the `Trainer` class, implementing a training loop from scratch with modern PyTorch best practices. Again, we assume you have done the data processing in section 2. Here is a short summary covering everything you will need:
 
 ```py
 from datasets import load_dataset
@@ -110,6 +110,15 @@ from torch.optim import AdamW
 optimizer = AdamW(model.parameters(), lr=5e-5)
 ```
 
+<Tip>
+
+💡 **Modern Optimization Tips**: For even better performance, you can try:
+- **AdamW with weight decay**: `AdamW(model.parameters(), lr=5e-5, weight_decay=0.01)`
+- **8-bit Adam**: Use `bitsandbytes` for memory-efficient optimization
+- **Different learning rates**: Lower learning rates (1e-5 to 3e-5) often work better for large models
+
+</Tip>
+
 Finally, the learning rate scheduler used by default is just a linear decay from the maximum value (5e-5) to 0. To properly define it, we need to know the number of training steps we will take, which is the number of epochs we want to run multiplied by the number of training batches (which is the length of our training dataloader). The `Trainer` uses three epochs by default, so we will follow that:
 
 ```py
@@ -167,6 +176,17 @@ for epoch in range(num_epochs):
         progress_bar.update(1)
 ```
 
+<Tip>
+
+💡 **Modern Training Optimizations**: To make your training loop even more efficient, consider:
+
+- **Gradient Clipping**: Add `torch.nn.utils.clip_grad_norm_(model.parameters(), max_norm=1.0)` before `optimizer.step()`
+- **Mixed Precision**: Use `torch.cuda.amp.autocast()` and `GradScaler` for faster training
+- **Gradient Accumulation**: Accumulate gradients over multiple batches to simulate larger batch sizes
+- **Checkpointing**: Save model checkpoints periodically to resume training if interrupted
+
+</Tip>
+
 You can see that the core of the training loop looks a lot like the one in the introduction. We didn't ask for any reporting, so this training loop will not tell us anything about how the model fares. We need to add an evaluation loop for that.
 
 
@@ -207,7 +227,7 @@ Again, your results will be slightly different because of the randomness in the
 
 <Youtube id="s7dy8QRgjJ0" />
 
-The training loop we defined earlier works fine on a single CPU or GPU. But using the [🤗 Accelerate](https://github.com/huggingface/accelerate) library, with just a few adjustments we can enable distributed training on multiple GPUs or TPUs. Starting from the creation of the training and validation dataloaders, here is what our manual training loop looks like:
+The training loop we defined earlier works fine on a single CPU or GPU. But using the [🤗 Accelerate](https://github.com/huggingface/accelerate) library, with just a few adjustments we can enable distributed training on multiple GPUs or TPUs. 🤗 Accelerate handles the complexity of distributed training, mixed precision, and device placement automatically. Starting from the creation of the training and validation dataloaders, here is what our manual training loop looks like:
 
 ```py
 from torch.optim import AdamW
@@ -360,3 +380,19 @@ notebook_launcher(training_function)
 ```
 
 You can find more examples in the [🤗 Accelerate repo](https://github.com/huggingface/accelerate/tree/main/examples).
+
+### Next Steps and Best Practices[[next-steps-and-best-practices]]
+
+Now that you've learned how to implement training from scratch, here are some additional considerations for production use:
+
+**Model Evaluation**: Always evaluate your model on multiple metrics, not just accuracy. Use the 🤗 Evaluate library for comprehensive evaluation.
+
+**Hyperparameter Tuning**: Consider using libraries like Optuna or Ray Tune for systematic hyperparameter optimization.
+
+**Model Monitoring**: Track training metrics, learning curves, and validation performance throughout training.
+
+**Model Sharing**: Once trained, share your model on the Hugging Face Hub to make it available to the community.
+
+**Efficiency**: For large models, consider techniques like gradient checkpointing, parameter-efficient fine-tuning (LoRA, AdaLoRA), or quantization methods.
+
+This concludes our deep dive into fine-tuning with custom training loops. The skills you've learned here will serve you well when you need full control over the training process or want to implement custom training logic that goes beyond what the `Trainer` API offers.
diff --git a/chapters/en/chapter3/5.mdx b/chapters/en/chapter3/5.mdx
index 5aa6b002d..ad3e16fc6 100644
--- a/chapters/en/chapter3/5.mdx
+++ b/chapters/en/chapter3/5.mdx
@@ -7,19 +7,23 @@
     classNames="absolute z-10 right-0 top-0"
 />
 
-That was fun! In the first two chapters you learned about models and tokenizers, and now you know how to fine-tune them for your own data. To recap, in this chapter you:
+That was comprehensive! In the first two chapters you learned about models and tokenizers, and now you know how to fine-tune them for your own data using modern best practices. To recap, in this chapter you:
 
-{#if fw === 'pt'}
-* Learned about datasets in the [Hub](https://huggingface.co/datasets)
-* Learned how to load and preprocess datasets, including using dynamic padding and collators
-* Implemented your own fine-tuning and evaluation of a model
-* Implemented a lower-level training loop
-* Used 🤗 Accelerate to easily adapt your training loop so it works for multiple GPUs or TPUs
+* Learned about datasets on the [Hub](https://huggingface.co/datasets) and modern data processing techniques
+* Learned how to load and preprocess datasets efficiently, including using dynamic padding and data collators
+* Implemented fine-tuning and evaluation using the high-level `Trainer` API with the latest features
+* Implemented a complete custom training loop from scratch with PyTorch
+* Used 🤗 Accelerate to easily adapt your training loop for distributed training on multiple GPUs or TPUs
+* Explored modern optimization techniques and training best practices
+* Learned about proper model evaluation using the 🤗 Evaluate library
 
-{:else}
-* Learned about datasets in the [Hub](https://huggingface.co/datasets)
-* Learned how to load and preprocess datasets
-* Learned how to fine-tune and evaluate a model with Keras
-* Implemented a custom metric
+**Key takeaways for modern fine-tuning:**
 
-{/if}
+- Always use the latest APIs like `processing_class` in the Trainer
+- Consider mixed precision training and gradient accumulation for efficiency
+- Use the 🤗 Evaluate library for comprehensive model evaluation
+- Leverage 🤗 Accelerate for seamless distributed training
+- Apply modern optimization techniques like proper learning rate scheduling and weight decay
+- Monitor your training with proper metrics and validation
+
+You now have all the tools needed to fine-tune state-of-the-art language models effectively using the latest best practices from the Hugging Face ecosystem!
diff --git a/chapters/en/chapter3/6.mdx b/chapters/en/chapter3/6.mdx
index 89d131b58..f2e2d7633 100644
--- a/chapters/en/chapter3/6.mdx
+++ b/chapters/en/chapter3/6.mdx
@@ -1,5 +1,3 @@
-<FrameworkSwitchCourse {fw} />
-
 <!-- DISABLE-FRONTMATTER-SECTIONS -->
 
 # End-of-chapter quiz[[end-of-chapter-quiz]]
@@ -83,7 +81,6 @@ Test what you learned in this chapter!
 	]}
 />
 
-{#if fw === 'pt'}
 ### 4. What are the benefits of the `Dataset.map()` method?
 
 <Question
@@ -222,80 +219,50 @@ Test what you learned in this chapter!
 	]}
 />
 
-{:else}
-### 4. What happens when you instantiate one of the `TFAutoModelForXxx` classes with a pretrained language model (such as `bert-base-uncased`) that corresponds to a different task than the one for which it was trained?
+### 10. What is the purpose of the `processing_class` parameter in the Trainer?
 
 <Question
 	choices={[
 		{
-			text: "Nothing, but you get a warning.",
-			explain: "You do get a warning, but that's not all!"
-		},
-		{
-			text: "The head of the pretrained model is discarded and a new head suitable for the task is inserted instead.",
-			explain: "Correct. For example, when we used <code>TFAutoModelForSequenceClassification</code> with <code>bert-base-uncased</code>, we got warnings when instantiating the model. The pretrained head is not used for the sequence classification task, so it's discarded and a new head is instantiated with random weights.",
+			text: "It tells the Trainer which tokenizer to use for processing the data.",
+			explain: "Correct! The processing_class parameter is a modern addition that helps the Trainer know how to process your data.",
             correct: true
 		},
 		{
-			text: "The head of the pretrained model is discarded.",
-			explain: "Something else needs to happen. Try again!"
-		},
-        {
-			text: "Nothing, since the model can still be fine-tuned for the different task.",
-			explain: "The head of the pretrained model was not trained to solve this task, so we should discard the head!"
-		}
-	]}
-/>
-
-### 5. The TensorFlow models from `transformers` are already Keras models. What benefit does this offer?
-
-<Question
-	choices={[
-		{
-			text: "The models work on a TPU out of the box.",
-			explain: "Almost! There are some small additional changes required. For example, you need to run everything in a <code>TPUStrategy</code> scope, including the initialization of the model."
-		},
-		{
-			text: "You can leverage existing methods such as <code>compile()</code>, <code>fit()</code>, and <code>predict()</code>.",
-			explain: "Correct! Once you have the data, training on it requires very little work.",
-            correct: true
+			text: "It specifies which device to use for training.",
+			explain: "No, device placement is handled differently in the Trainer."
 		},
 		{
-			text: "You get to learn Keras as well as transformers.",
-			explain: "Correct, but we're looking for something else :)",
-			correct: true
+			text: "It determines the batch size for training.",
+			explain: "No, batch size is specified in TrainingArguments."
 		},
         {
-			text: "You can easily compute metrics related to the dataset.",
-			explain: "Keras helps us with training and evaluating the model, not computing dataset-related metrics."
+			text: "It configures the learning rate schedule.",
+			explain: "No, learning rate scheduling is configured through TrainingArguments."
 		}
 	]}
 />
 
-### 6. How can you define your own custom metric?
+### 11. Which modern optimization technique can help with memory efficiency during training?
 
 <Question
 	choices={[
 		{
-			text: "By subclassing <code>tf.keras.metrics.Metric</code>.",
-			explain: "Great!",
-			correct: true
+			text: "Mixed precision training with fp16=True.",
+			explain: "Correct! Mixed precision training reduces memory usage and can speed up training.",
+            correct: true
 		},
 		{
-			text: "Using the Keras functional API.",
-			explain: "Try again!"
+			text: "Using a smaller model.",
+			explain: "While this would reduce memory usage, it's not an optimization technique - it's changing the model itself."
 		},
 		{
-			text: "By using a callable with signature <code>metric_fn(y_true, y_pred)</code>.",
-			explain: "Correct!",
-			correct: true
+			text: "Gradient accumulation.",
+			explain: "Gradient accumulation helps simulate larger batch sizes, but doesn't directly reduce memory usage per batch.",
 		},
         {
-			text: "By Googling it.",
-			explain: "That's not the answer we're looking for, but it should help you find it.",
-			correct: true
+			text: "Using a different tokenizer.",
+			explain: "The tokenizer choice doesn't significantly impact training memory usage."
 		}
 	]}
 />
-
-{/if}

From 33e144e90809bc03c87a72d5fbe4dd74146ffd6c Mon Sep 17 00:00:00 2001
From: burtenshaw <ben.burtenshaw@gmail.com>
Date: Wed, 11 Jun 2025 10:17:38 +0200
Subject: [PATCH 157/167] add intermediate quizzes

---
 chapters/en/chapter3/2.mdx | 134 +++++++++++++++++++++++++++
 chapters/en/chapter3/3.mdx | 159 ++++++++++++++++++++++++++++++++
 chapters/en/chapter3/4.mdx | 184 +++++++++++++++++++++++++++++++++++++
 3 files changed, 477 insertions(+)

diff --git a/chapters/en/chapter3/2.mdx b/chapters/en/chapter3/2.mdx
index d854973a9..aadb12628 100644
--- a/chapters/en/chapter3/2.mdx
+++ b/chapters/en/chapter3/2.mdx
@@ -284,3 +284,137 @@ Looking good! Now that we've gone from raw text to batches our model can deal wi
 </Tip>
 
 Perfect! Now that we have preprocessed our data with the latest best practices from the 🤗 Datasets library, we're ready to move on to training our model using the modern Trainer API. The next section will show you how to fine-tune your model effectively using the latest features and optimizations available in the Hugging Face ecosystem.
+
+## Section Quiz[[section-quiz]]
+
+Test your understanding of data processing concepts:
+
+### 1. What is the main advantage of using `Dataset.map()` with `batched=True`?
+
+<Question
+	choices={[
+		{
+			text: "It uses less memory.",
+			explain: "While it can be more memory efficient, this is not the main advantage."
+		},
+		{
+			text: "It processes multiple examples at once, making tokenization much faster.",
+			explain: "Correct! Processing in batches allows the fast tokenizer to work on multiple examples simultaneously, significantly improving speed.",
+            correct: true
+		},
+		{
+			text: "It automatically handles padding for you.",
+			explain: "Batching doesn't automatically handle padding - that's done by the data collator."
+		},
+        {
+			text: "It converts the data to PyTorch tensors.",
+			explain: "The tensor conversion happens when you set the format, not during batched mapping."
+		}
+	]}
+/>
+
+### 2. Why do we use dynamic padding instead of padding all sequences to the maximum length in the dataset?
+
+<Question
+	choices={[
+		{
+			text: "Dynamic padding is required by the model architecture.",
+			explain: "No, models can handle both fixed and dynamic padding."
+		},
+		{
+			text: "It reduces computational overhead by only padding to the maximum length in each batch.",
+			explain: "Correct! Dynamic padding avoids unnecessary computation on padding tokens by only padding to the batch maximum, not the dataset maximum.",
+            correct: true
+		},
+		{
+			text: "It improves model accuracy.",
+			explain: "Padding strategy doesn't directly affect model accuracy."
+		},
+        {
+			text: "It's required when using the DataCollatorWithPadding.",
+			explain: "DataCollatorWithPadding enables dynamic padding, but you could still use fixed padding if desired."
+		}
+	]}
+/>
+
+### 3. What does the `token_type_ids` field represent in BERT tokenization?
+
+<Question
+	choices={[
+		{
+			text: "The position of each token in the sequence.",
+			explain: "That would be position embeddings, not token_type_ids."
+		},
+		{
+			text: "Which sentence each token belongs to when processing sentence pairs.",
+			explain: "Correct! token_type_ids distinguish between the first sentence (0) and second sentence (1) in sentence pair tasks.",
+            correct: true
+		},
+		{
+			text: "The attention mask for each token.",
+			explain: "The attention mask is a separate field that indicates which tokens to attend to."
+		},
+        {
+			text: "The vocabulary ID of each token.",
+			explain: "That's the input_ids field, not token_type_ids."
+		}
+	]}
+/>
+
+### 4. When loading a dataset with `load_dataset("glue", "mrpc")`, what does the second argument specify?
+
+<Question
+	choices={[
+		{
+			text: "The version of the dataset to load.",
+			explain: "Version specification uses different parameters."
+		},
+		{
+			text: "The specific task or subset within the GLUE benchmark.",
+			explain: "Correct! MRPC is one of the specific tasks within the larger GLUE benchmark collection.",
+            correct: true
+		},
+		{
+			text: "The split of the dataset (train/validation/test).",
+			explain: "Splits are accessed after loading, not specified in the load_dataset call."
+		},
+        {
+			text: "The format to return the data in.",
+			explain: "Format is set using the set_format() method after loading."
+		}
+	]}
+/>
+
+### 5. What is the purpose of removing columns like 'sentence1' and 'sentence2' before training?
+
+<Question
+	choices={[
+		{
+			text: "To save memory during training.",
+			explain: "While it does save some memory, this is not the main reason."
+		},
+		{
+			text: "The model doesn't expect these raw text columns and would throw an error.",
+			explain: "Correct! Models expect numerical tensors, not raw text strings. Keeping text columns would cause errors.",
+            correct: true
+		},
+		{
+			text: "These columns are not needed for evaluation.",
+			explain: "While true, the main reason is that the model can't process raw text."
+		},
+        {
+			text: "It improves training speed significantly.",
+			explain: "The speed improvement is minimal compared to avoiding errors from incompatible data types."
+		}
+	]}
+/>
+
+<Tip>
+
+💡 **Key Takeaways:**
+- Use `batched=True` with `Dataset.map()` for significantly faster preprocessing
+- Dynamic padding with `DataCollatorWithPadding` is more efficient than fixed-length padding
+- Always preprocess your data to match what your model expects (numerical tensors, correct column names)
+- The 🤗 Datasets library provides powerful tools for efficient data processing at scale
+
+</Tip>
diff --git a/chapters/en/chapter3/3.mdx b/chapters/en/chapter3/3.mdx
index 936f7adb2..215d43e8b 100644
--- a/chapters/en/chapter3/3.mdx
+++ b/chapters/en/chapter3/3.mdx
@@ -207,3 +207,162 @@ This concludes the introduction to fine-tuning using the `Trainer` API. An examp
 
 </Tip>
 
+## Section Quiz[[section-quiz]]
+
+Test your understanding of the Trainer API and fine-tuning concepts:
+
+### 1. What is the purpose of the `processing_class` parameter in the Trainer?
+
+<Question
+	choices={[
+		{
+			text: "It specifies which model architecture to use.",
+			explain: "Model architecture is specified when loading the model, not in the Trainer."
+		},
+		{
+			text: "It tells the Trainer which tokenizer to use for processing data.",
+			explain: "Correct! The processing_class parameter is a modern addition that helps the Trainer know which tokenizer to use.",
+            correct: true
+		},
+		{
+			text: "It determines the batch size for training.",
+			explain: "Batch size is set in TrainingArguments, not through processing_class."
+		},
+        {
+			text: "It controls the evaluation frequency.",
+			explain: "Evaluation frequency is controlled by eval_strategy in TrainingArguments."
+		}
+	]}
+/>
+
+### 2. Which TrainingArguments parameter controls how often evaluation occurs during training?
+
+<Question
+	choices={[
+		{
+			text: "eval_frequency",
+			explain: "There's no eval_frequency parameter in TrainingArguments."
+		},
+		{
+			text: "eval_strategy",
+			explain: "Correct! eval_strategy can be set to 'epoch', 'steps', or 'no' to control evaluation timing.",
+            correct: true
+		},
+		{
+			text: "evaluation_steps",
+			explain: "eval_steps sets the number of steps between evaluations, but eval_strategy determines if/when evaluation happens."
+		},
+        {
+			text: "do_eval",
+			explain: "There's no do_eval parameter in modern TrainingArguments."
+		}
+	]}
+/>
+
+### 3. What does `fp16=True` in TrainingArguments enable?
+
+<Question
+	choices={[
+		{
+			text: "16-bit integer precision for faster training.",
+			explain: "fp16 refers to floating-point precision, not integer precision."
+		},
+		{
+			text: "Mixed precision training with 16-bit floating-point numbers for faster training and reduced memory usage.",
+			explain: "Correct! Mixed precision training uses 16-bit floats for forward pass and 32-bit for gradients, improving speed and reducing memory usage.",
+            correct: true
+		},
+		{
+			text: "Training for exactly 16 epochs.",
+			explain: "fp16 has nothing to do with the number of epochs."
+		},
+        {
+			text: "Using 16 GPUs for distributed training.",
+			explain: "The number of GPUs is not controlled by the fp16 parameter."
+		}
+	]}
+/>
+
+### 4. What is the role of the `compute_metrics` function in the Trainer?
+
+<Question
+	choices={[
+		{
+			text: "It calculates the loss during training.",
+			explain: "Loss calculation is handled automatically by the model, not by compute_metrics."
+		},
+		{
+			text: "It converts logits to predictions and calculates evaluation metrics like accuracy and F1.",
+			explain: "Correct! compute_metrics takes predictions and labels, then returns metrics for evaluation.",
+            correct: true
+		},
+		{
+			text: "It determines which optimizer to use.",
+			explain: "Optimizer selection is not handled by compute_metrics."
+		},
+        {
+			text: "It preprocesses the training data.",
+			explain: "Data preprocessing is done before training, not by compute_metrics during evaluation."
+		}
+	]}
+/>
+
+### 5. What happens when you don't provide an `eval_dataset` to the Trainer?
+
+<Question
+	choices={[
+		{
+			text: "Training will fail with an error.",
+			explain: "Training can proceed without an eval_dataset, though you won't get evaluation metrics."
+		},
+		{
+			text: "The Trainer will automatically split the training data for evaluation.",
+			explain: "The Trainer doesn't automatically create validation splits."
+		},
+		{
+			text: "You won't get evaluation metrics during training, but training will still work.",
+			explain: "Correct! Evaluation is optional - you can train without it, but you won't see validation metrics.",
+            correct: true
+		},
+        {
+			text: "The model will use the training data for evaluation.",
+			explain: "The Trainer won't automatically use training data for evaluation - it simply won't evaluate."
+		}
+	]}
+/>
+
+### 6. What is gradient accumulation and how do you enable it?
+
+<Question
+	choices={[
+		{
+			text: "It saves gradients to disk, enabled with save_gradients=True.",
+			explain: "Gradient accumulation doesn't involve saving gradients to disk."
+		},
+		{
+			text: "It accumulates gradients over multiple batches before updating, enabled with gradient_accumulation_steps.",
+			explain: "Correct! This allows you to simulate larger batch sizes by accumulating gradients over multiple forward passes.",
+            correct: true
+		},
+		{
+			text: "It speeds up gradient computation, enabled automatically with fp16.",
+			explain: "While fp16 can speed up training, gradient accumulation is a separate technique."
+		},
+        {
+			text: "It prevents gradient overflow, enabled with gradient_clipping=True.",
+			explain: "That describes gradient clipping, not gradient accumulation."
+		}
+	]}
+/>
+
+<Tip>
+
+💡 **Key Takeaways:**
+- The `Trainer` API provides a high-level interface that handles most training complexity
+- Use `processing_class` to specify your tokenizer for proper data handling
+- `TrainingArguments` controls all aspects of training: learning rate, batch size, evaluation strategy, and optimizations
+- `compute_metrics` enables custom evaluation metrics beyond just training loss
+- Modern features like mixed precision (`fp16=True`) and gradient accumulation can significantly improve training efficiency
+
+</Tip>
+
diff --git a/chapters/en/chapter3/4.mdx b/chapters/en/chapter3/4.mdx
index a9e053584..5d5cb216c 100644
--- a/chapters/en/chapter3/4.mdx
+++ b/chapters/en/chapter3/4.mdx
@@ -396,3 +396,187 @@ Now that you've learned how to implement training from scratch, here are some ad
 **Efficiency**: For large models, consider techniques like gradient checkpointing, parameter-efficient fine-tuning (LoRA, AdaLoRA), or quantization methods.
 
 This concludes our deep dive into fine-tuning with custom training loops. The skills you've learned here will serve you well when you need full control over the training process or want to implement custom training logic that goes beyond what the `Trainer` API offers.
+
+## Section Quiz[[section-quiz]]
+
+Test your understanding of custom training loops and advanced training techniques:
+
+### 1. What is the main difference between Adam and AdamW optimizers?
+
+<Question
+	choices={[
+		{
+			text: "AdamW uses a different learning rate schedule.",
+			explain: "Learning rate scheduling is separate from the optimizer choice."
+		},
+		{
+			text: "AdamW includes decoupled weight decay regularization.",
+			explain: "Correct! AdamW separates weight decay from the gradient-based parameter updates, leading to better regularization.",
+            correct: true
+		},
+		{
+			text: "AdamW only works with transformer models.",
+			explain: "AdamW can be used with any model architecture, not just transformers."
+		},
+        {
+			text: "AdamW requires less memory than Adam.",
+			explain: "Both optimizers have similar memory requirements."
+		}
+	]}
+/>
+
+### 2. In a training loop, what is the correct order of operations?
+
+<Question
+	choices={[
+		{
+			text: "Forward pass → Backward pass → Optimizer step → Zero gradients",
+			explain: "Close, but you should zero gradients before the next forward pass to avoid accumulating old gradients."
+		},
+		{
+			text: "Forward pass → Backward pass → Optimizer step → Scheduler step → Zero gradients",
+			explain: "Correct! This is the proper order: compute loss, compute gradients, update parameters, update learning rate, then clear gradients.",
+            correct: true
+		},
+		{
+			text: "Zero gradients → Forward pass → Optimizer step → Backward pass",
+			explain: "The backward pass must come after the forward pass to compute gradients from the loss."
+		},
+        {
+			text: "Forward pass → Zero gradients → Backward pass → Optimizer step",
+			explain: "Zeroing gradients before backward pass would eliminate the gradients you just computed."
+		}
+	]}
+/>
+
+### 3. What does the 🤗 Accelerate library primarily help with?
+
+<Question
+	choices={[
+		{
+			text: "Making your models train faster by optimizing the forward pass.",
+			explain: "Accelerate doesn't optimize the model architecture itself."
+		},
+		{
+			text: "Automatically selecting the best hyperparameters.",
+			explain: "Accelerate doesn't do hyperparameter optimization."
+		},
+		{
+			text: "Enabling distributed training across multiple GPUs/TPUs with minimal code changes.",
+			explain: "Correct! Accelerate handles distributed training complexity, allowing your code to run on single or multiple devices seamlessly.",
+            correct: true
+		},
+        {
+			text: "Converting models to different frameworks like TensorFlow.",
+			explain: "Accelerate works within PyTorch and doesn't convert between frameworks."
+		}
+	]}
+/>
+
+### 4. Why do we move batches to the device in a training loop?
+
+<Question
+	choices={[
+		{
+			text: "To make the training faster.",
+			explain: "While it can affect speed, the main reason is compatibility."
+		},
+		{
+			text: "Because the model and data must be on the same device (CPU/GPU) for computation.",
+			explain: "Correct! PyTorch requires tensors to be on the same device for operations to work.",
+            correct: true
+		},
+		{
+			text: "To save memory.",
+			explain: "Moving to device doesn't inherently save memory."
+		},
+        {
+			text: "It's required by the DataLoader.",
+			explain: "DataLoader doesn't require specific device placement."
+		}
+	]}
+/>
+
+### 5. What does `model.eval()` do before evaluation?
+
+<Question
+	choices={[
+		{
+			text: "It freezes the model parameters so they can't be updated.",
+			explain: "model.eval() doesn't freeze parameters - that would be done by setting requires_grad=False."
+		},
+		{
+			text: "It changes the behavior of layers like dropout and batch normalization for inference.",
+			explain: "Correct! eval() mode disables dropout and uses running statistics for batch norm instead of computing them from the current batch.",
+            correct: true
+		},
+		{
+			text: "It enables gradient computation for evaluation metrics.",
+			explain: "Actually, we typically use torch.no_grad() during evaluation to disable gradient computation."
+		},
+        {
+			text: "It automatically calculates evaluation metrics.",
+			explain: "model.eval() only changes layer behavior - you still need to implement metric calculation separately."
+		}
+	]}
+/>
+
+### 6. What is the purpose of `torch.no_grad()` during evaluation?
+
+<Question
+	choices={[
+		{
+			text: "To prevent the model from making predictions.",
+			explain: "torch.no_grad() doesn't prevent predictions, just gradient computation."
+		},
+		{
+			text: "To save memory and speed up computation by disabling gradient tracking.",
+			explain: "Correct! Since we don't need gradients for evaluation, disabling them saves memory and computation.",
+            correct: true
+		},
+		{
+			text: "To enable evaluation mode for the model.",
+			explain: "Evaluation mode is enabled with model.eval(), not torch.no_grad()."
+		},
+        {
+			text: "To ensure consistent results across runs.",
+			explain: "Reproducibility is handled by setting random seeds, not torch.no_grad()."
+		}
+	]}
+/>
+
+### 7. What changes when you use 🤗 Accelerate in your training loop?
+
+<Question
+	choices={[
+		{
+			text: "You must rewrite your entire training loop from scratch.",
+			explain: "Accelerate requires minimal changes to existing PyTorch code."
+		},
+		{
+			text: "You wrap key objects with accelerator.prepare() and use accelerator.backward() instead of loss.backward().",
+			explain: "Correct! These are the main changes - prepare your objects and use accelerator.backward() for proper distributed training.",
+            correct: true
+		},
+		{
+			text: "You need to specify the number of GPUs in your code.",
+			explain: "Accelerate automatically detects available hardware."
+		},
+        {
+			text: "You must use a different optimizer and scheduler.",
+			explain: "You can use the same optimizers and schedulers with Accelerate."
+		}
+	]}
+/>
+
+<Tip>
+
+💡 **Key Takeaways:**
+- Manual training loops give you complete control but require understanding of the proper sequence: forward → backward → optimizer step → scheduler step → zero gradients
+- AdamW with weight decay is the recommended optimizer for transformer models
+- Always use `model.eval()` and `torch.no_grad()` during evaluation for correct behavior and efficiency
+- 🤗 Accelerate makes distributed training accessible with minimal code changes
+- Device management (moving tensors to GPU/CPU) is crucial for PyTorch operations
+- Modern techniques like mixed precision, gradient accumulation, and gradient clipping can significantly improve training efficiency
+
+</Tip>

From c3e04f0240a525551b35758e1ed7f1c020308bf5 Mon Sep 17 00:00:00 2001
From: burtenshaw <ben.burtenshaw@gmail.com>
Date: Wed, 11 Jun 2025 10:39:16 +0200
Subject: [PATCH 158/167] add more reference to docs and cook book

---
 chapters/en/chapter3/1.mdx | 23 +++++++++-
 chapters/en/chapter3/2.mdx | 24 ++++++++++-
 chapters/en/chapter3/3.mdx | 24 +++++++++++
 chapters/en/chapter3/4.mdx | 88 ++++++++++++++++----------------------
 chapters/en/chapter3/5.mdx | 39 ++++++++++++-----
 5 files changed, 134 insertions(+), 64 deletions(-)

diff --git a/chapters/en/chapter3/1.mdx b/chapters/en/chapter3/1.mdx
index 3ce084a5e..24e8c8a1a 100644
--- a/chapters/en/chapter3/1.mdx
+++ b/chapters/en/chapter3/1.mdx
@@ -13,7 +13,28 @@ In [Chapter 2](/course/chapter2) we explored how to use tokenizers and pretraine
 * How to use the high-level `Trainer` API to fine-tune a model with modern best practices
 * How to implement a custom training loop with optimization techniques
 * How to leverage the 🤗 Accelerate library to easily run distributed training on any setup
-* How to apply current fine-tuning best practices including proper evaluation and model uploading
+* How to apply current fine-tuning best practices for maximum performance
+
+<Tip>
+
+📚 **Essential Resources**: Before starting, you might want to review the [🤗 Datasets documentation](https://huggingface.co/docs/datasets/) for data processing.
+
+</Tip>
+
+This chapter will also serve as an introduction to the 🤗 Ecosystems. We'll see how libraries like 🤗 Datasets, 🤗 Tokenizers, 🤗 Accelerate, and 🤗 Evaluate can help you train models more efficiently and effectively.
+
+Each of the main sections in this chapter will teach you something different:
+- **Section 2**: Learn modern data preprocessing techniques and efficient dataset handling
+- **Section 3**: Master the powerful Trainer API with all its latest features
+- **Section 4**: Implement training loops from scratch and understand distributed training with Accelerate
+
+By the end of this chapter, you'll be able to fine-tune models on your own datasets using both high-level APIs and custom training loops, applying the latest best practices in the field.
+
+<Tip>
+
+🎯 **What You'll Build**: By the end of this chapter, you'll have fine-tuned a BERT model for text classification and understand how to adapt the techniques to your own datasets and tasks.
+
+</Tip>
 
 This chapter focuses exclusively on **PyTorch**, as it has become the standard framework for modern deep learning research and production. We'll use the latest APIs and best practices from the Hugging Face ecosystem.
 
diff --git a/chapters/en/chapter3/2.mdx b/chapters/en/chapter3/2.mdx
index aadb12628..00c7f24d1 100644
--- a/chapters/en/chapter3/2.mdx
+++ b/chapters/en/chapter3/2.mdx
@@ -47,6 +47,8 @@ The 🤗 Datasets library provides a very simple command to download and cache a
 
 <Tip>
 ⚠️ **Warning** Make sure that `datasets` is installed by running `pip install datasets`. Then, load the MRPC dataset and print it to see what it contains.
+
+💡 **Additional Resources**: For more dataset loading techniques and examples, check out the [🤗 Datasets documentation](https://huggingface.co/docs/datasets/).
 </Tip> 
 
 ```py
@@ -127,6 +129,12 @@ tokenized_sentences_1 = tokenizer(raw_datasets["train"]["sentence1"])
 tokenized_sentences_2 = tokenizer(raw_datasets["train"]["sentence2"])
 ```
 
+<Tip>
+
+💡 **Deep Dive**: For more advanced tokenization techniques and understanding how different tokenizers work, explore the [🤗 Tokenizers documentation](https://huggingface.co/docs/transformers/main/en/tokenizer_summary) and the [tokenization guide in the cookbook](https://huggingface.co/learn/cookbook/en/advanced_rag#tokenization-strategies).
+
+</Tip>
+
 However, we can't just pass two sequences to the model and get a prediction of whether the two sentences are paraphrases or not. We need to handle the two sequences as a pair, and apply the appropriate preprocessing. Fortunately, the tokenizer can also take a pair of sequences and prepare it the way our BERT model expects: 
 
 ```py
@@ -201,7 +209,13 @@ def tokenize_function(example):
 
 This function takes a dictionary (like the items of our dataset) and returns a new dictionary with the keys `input_ids`, `attention_mask`, and `token_type_ids`. Note that it also works if the `example` dictionary contains several samples (each key as a list of sentences) since the `tokenizer` works on lists of pairs of sentences, as seen before. This will allow us to use the option `batched=True` in our call to `map()`, which will greatly speed up the tokenization. The `tokenizer` is backed by a tokenizer written in Rust from the [🤗 Tokenizers](https://github.com/huggingface/tokenizers) library. This tokenizer can be very fast, but only if we give it lots of inputs at once.
 
-Note that we've left the `padding` argument out in our tokenization function for now. This is because padding all the samples to the maximum length is not efficient: it's better to pad the samples when we're building a batch, as then we only need to pad to the maximum length in that batch, and not the maximum length in the entire dataset. This can save a lot of time and processing power when the inputs have very variable lengths! 
+Note that we've left the `padding` argument out in our tokenization function for now. This is because padding all the samples to the maximum length is not efficient: it's better to pad the samples when we're building a batch, as then we only need to pad to the maximum length in that batch, and not the maximum length in the entire dataset. This can save a lot of time and processing power when the inputs have very variable lengths!
+
+<Tip>
+
+📚 **Performance Tips**: Learn more about efficient data processing techniques in the [🤗 Datasets performance guide](https://huggingface.co/docs/datasets/about_arrow).
+
+</Tip>
 
 Here is how we apply the tokenization function on all our datasets at once. We're using `batched=True` in our call to `map` so the function is applied to multiple elements of our dataset at once, and not on each element separately. This allows for faster preprocessing.
 
@@ -241,6 +255,12 @@ The last thing we will need to do is pad all the examples to the length of the l
 
 The function that is responsible for putting together samples inside a batch is called a *collate function*. It's an argument you can pass when you build a `DataLoader`, the default being a function that will just convert your samples to PyTorch tensors and concatenate them (recursively if your elements are lists, tuples, or dictionaries). This won't be possible in our case since the inputs we have won't all be of the same size. We have deliberately postponed the padding, to only apply it as necessary on each batch and avoid having over-long inputs with a lot of padding. This will speed up training by quite a bit, but note that if you're training on a TPU it can cause problems — TPUs prefer fixed shapes, even when that requires extra padding.
 
+<Tip>
+
+🚀 **Optimization Guide**: For more details on optimizing training performance, including padding strategies and TPU considerations, see the [🤗 Transformers performance documentation](https://huggingface.co/docs/transformers/main/en/performance).
+
+</Tip>
+
 To do this in practice, we have to define a collate function that will apply the correct amount of padding to the items of the dataset we want to batch together. Fortunately, the 🤗 Transformers library provides us with such a function via `DataCollatorWithPadding`. It takes a tokenizer when you instantiate it (to know which padding token to use, and whether the model expects padding to be on the left or on the right of the inputs) and will do everything you need:
 
 ```py
@@ -281,6 +301,8 @@ Looking good! Now that we've gone from raw text to batches our model can deal wi
 
 ✏️ **Try it out!** Replicate the preprocessing on the GLUE SST-2 dataset. It's a little bit different since it's composed of single sentences instead of pairs, but the rest of what we did should look the same. For a harder challenge, try to write a preprocessing function that works on any of the GLUE tasks.
 
+📖 **Additional Practice**: Check out these hands-on examples from the [🤗 Transformers examples](https://huggingface.co/docs/transformers/main/en/notebooks).
+
 </Tip>
 
 Perfect! Now that we have preprocessed our data with the latest best practices from the 🤗 Datasets library, we're ready to move on to training our model using the modern Trainer API. The next section will show you how to fine-tune your model effectively using the latest features and optimizations available in the Hugging Face ecosystem.
diff --git a/chapters/en/chapter3/3.mdx b/chapters/en/chapter3/3.mdx
index 215d43e8b..6880c57bd 100644
--- a/chapters/en/chapter3/3.mdx
+++ b/chapters/en/chapter3/3.mdx
@@ -13,6 +13,12 @@
 
 🤗 Transformers provides a `Trainer` class to help you fine-tune any of the pretrained models it provides on your dataset with modern best practices. Once you've done all the data preprocessing work in the last section, you have just a few steps left to define the `Trainer`. The hardest part is likely to be preparing the environment to run `Trainer.train()`, as it will run very slowly on a CPU. If you don't have a GPU set up, you can get access to free GPUs or TPUs on [Google Colab](https://colab.research.google.com/).
 
+<Tip>
+
+📚 **Training Resources**: Before diving into training, familiarize yourself with the comprehensive [🤗 Transformers training guide](https://huggingface.co/docs/transformers/main/en/training) and explore practical examples in the [fine-tuning cookbook](https://huggingface.co/learn/cookbook/en/fine_tuning_code_llm).
+
+</Tip>
+
 The code examples below assume you have already executed the examples in the previous section. Here is a short summary recapping what you need:
 
 ```py
@@ -46,6 +52,8 @@ training_args = TrainingArguments("test-trainer")
 
 💡 If you want to automatically upload your model to the Hub during training, pass along `push_to_hub=True` in the `TrainingArguments`. We will learn more about this in [Chapter 4](/course/chapter4/3)
 
+🚀 **Advanced Configuration**: For detailed information on all available training arguments and optimization strategies, check out the [TrainingArguments documentation](https://huggingface.co/docs/transformers/main/en/main_classes/trainer#transformers.TrainingArguments) and the [training configuration cookbook](https://huggingface.co/learn/cookbook/en/training_tricks#training-arguments).
+
 </Tip>
 
 The second step is to define our model. As in the [previous chapter](/course/chapter2), we will use the `AutoModelForSequenceClassification` class, with two labels:
@@ -77,6 +85,8 @@ trainer = Trainer(
 
 💡 When you pass a tokenizer as the `processing_class`, the default `data_collator` used by the `Trainer` will be a `DataCollatorWithPadding`. You can skip the `data_collator=data_collator` line in this case, but we included it here to show you this important part of the processing pipeline.
 
+📖 **Learn More**: For comprehensive details on the Trainer class and its parameters, visit the [Trainer API documentation](https://huggingface.co/docs/transformers/main/en/main_classes/trainer) and explore advanced usage patterns in the [training cookbook recipes](https://huggingface.co/learn/cookbook/en/fine_tuning_code_llm#setting-up-the-trainer).
+
 </Tip>
 
 To fine-tune the model on our dataset, we just have to call the `train()` method of our `Trainer`:
@@ -127,6 +137,12 @@ metric.compute(predictions=preds, references=predictions.label_ids)
 {'accuracy': 0.8578431372549019, 'f1': 0.8996539792387542}
 ```
 
+<Tip>
+
+📊 **Evaluation Deep Dive**: Learn about different evaluation metrics and strategies in the [🤗 Evaluate documentation](https://huggingface.co/docs/evaluate/) and explore comprehensive evaluation techniques in the [model evaluation cookbook](https://huggingface.co/learn/cookbook/en/evaluation).
+
+</Tip>
+
 The exact results you get may vary, as the random initialization of the model head might change the metrics it achieved. Here, we can see our model has an accuracy of 85.78% on the validation set and an F1 score of 89.97. Those are the two metrics used to evaluate results on the MRPC dataset for the GLUE benchmark. The table in the [BERT paper](https://arxiv.org/pdf/1810.04805.pdf) reported an F1 score of 88.9 for the base model. That was the `uncased` model while we are currently using the `cased` model, which explains the better result.
 
 Wrapping everything together, we get our `compute_metrics()` function:
@@ -197,6 +213,12 @@ training_args = TrainingArguments(
 )
 ```
 
+<Tip>
+
+🎯 **Performance Optimization**: For more advanced training techniques including distributed training, memory optimization, and hardware-specific optimizations, explore the [🤗 Transformers performance guide](https://huggingface.co/docs/transformers/main/en/performance).
+
+</Tip>
+
 The `Trainer` will work out of the box on multiple GPUs or TPUs and provides lots of options for distributed training. We will go over everything it supports in Chapter 10.
 
 This concludes the introduction to fine-tuning using the `Trainer` API. An example of doing this for most common NLP tasks will be given in [Chapter 7](/course/chapter7), but for now let's look at how to do the same thing with a pure PyTorch training loop.
@@ -205,6 +227,8 @@ This concludes the introduction to fine-tuning using the `Trainer` API. An examp
 
 ✏️ **Try it out!** Fine-tune a model on the GLUE SST-2 dataset, using the data processing you did in section 2.
 
+📝 **More Examples**: Check out the comprehensive collection of [🤗 Transformers notebooks](https://huggingface.co/docs/transformers/main/en/notebooks).
+
 </Tip>
 
 ## Section Quiz[[section-quiz]]
diff --git a/chapters/en/chapter3/4.mdx b/chapters/en/chapter3/4.mdx
index 5d5cb216c..7f3e874a9 100644
--- a/chapters/en/chapter3/4.mdx
+++ b/chapters/en/chapter3/4.mdx
@@ -11,6 +11,12 @@
 
 Now we'll see how to achieve the same results as we did in the last section without using the `Trainer` class, implementing a training loop from scratch with modern PyTorch best practices. Again, we assume you have done the data processing in section 2. Here is a short summary covering everything you will need:
 
+<Tip>
+
+🏗️ **Training from Scratch**: This section builds on the previous content. For comprehensive guidance on PyTorch training loops and best practices, check out the [🤗 Transformers training documentation](https://huggingface.co/docs/transformers/main/en/training#train-in-native-pytorch) and the [custom training cookbook](https://huggingface.co/learn/cookbook/en/fine_tuning_code_llm#training-loop).
+
+</Tip>
+
 ```py
 from datasets import load_dataset
 from transformers import AutoTokenizer, DataCollatorWithPadding
@@ -117,6 +123,8 @@ optimizer = AdamW(model.parameters(), lr=5e-5)
 - **8-bit Adam**: Use `bitsandbytes` for memory-efficient optimization
 - **Different learning rates**: Lower learning rates (1e-5 to 3e-5) often work better for large models
 
+🚀 **Optimization Resources**: Learn more about optimizers and training strategies in the [🤗 Transformers optimization guide](https://huggingface.co/docs/transformers/main/en/performance#optimizer) and explore advanced techniques in the [optimization cookbook](https://huggingface.co/learn/cookbook/en/training_tricks#optimizers-and-schedulers).
+
 </Tip>
 
 Finally, the learning rate scheduler used by default is just a linear decay from the maximum value (5e-5) to 0. To properly define it, we need to know the number of training steps we will take, which is the number of epochs we want to run multiplied by the number of training batches (which is the length of our training dataloader). The `Trainer` uses three epochs by default, so we will follow that:
@@ -185,6 +193,8 @@ for epoch in range(num_epochs):
 - **Gradient Accumulation**: Accumulate gradients over multiple batches to simulate larger batch sizes
 - **Checkpointing**: Save model checkpoints periodically to resume training if interrupted
 
+🔧 **Implementation Guide**: For detailed examples of these optimizations, see the [🤗 Transformers efficient training guide](https://huggingface.co/docs/transformers/main/en/perf_train_gpu_one) and the [advanced training cookbook](https://huggingface.co/learn/cookbook/en/training_tricks#gradient-accumulation).
+
 </Tip>
 
 You can see that the core of the training loop looks a lot like the one in the introduction. We didn't ask for any reporting, so this training loop will not tell us anything about how the model fares. We need to add an evaluation loop for that.
@@ -194,6 +204,12 @@ You can see that the core of the training loop looks a lot like the one in the i
 
 As we did earlier, we will use a metric provided by the 🤗 Evaluate library. We've already seen the `metric.compute()` method, but metrics can actually accumulate batches for us as we go over the prediction loop with the method `add_batch()`. Once we have accumulated all the batches, we can get the final result with `metric.compute()`. Here's how to implement all of this in an evaluation loop:
 
+<Tip>
+
+📊 **Evaluation Best Practices**: For more sophisticated evaluation strategies and metrics, explore the [🤗 Evaluate documentation](https://huggingface.co/docs/evaluate/) and the [comprehensive evaluation cookbook](https://huggingface.co/learn/cookbook/en/evaluation).
+
+</Tip>
+
 ```py
 import evaluate
 
@@ -229,18 +245,28 @@ Again, your results will be slightly different because of the randomness in the
 
 The training loop we defined earlier works fine on a single CPU or GPU. But using the [🤗 Accelerate](https://github.com/huggingface/accelerate) library, with just a few adjustments we can enable distributed training on multiple GPUs or TPUs. 🤗 Accelerate handles the complexity of distributed training, mixed precision, and device placement automatically. Starting from the creation of the training and validation dataloaders, here is what our manual training loop looks like:
 
+<Tip>
+
+⚡ **Accelerate Deep Dive**: Learn everything about distributed training, mixed precision, and hardware optimization in the [🤗 Accelerate documentation](https://huggingface.co/docs/accelerate/) and explore practical examples in the [distributed training cookbook](https://huggingface.co/learn/cookbook/en/distributed_training).
+
+</Tip>
+
 ```py
+from accelerate import Accelerator
 from torch.optim import AdamW
 from transformers import AutoModelForSequenceClassification, get_scheduler
 
+accelerator = Accelerator()
+
 model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
 optimizer = AdamW(model.parameters(), lr=3e-5)
 
-device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")
-model.to(device)
+train_dl, eval_dl, model, optimizer = accelerator.prepare(
+    train_dataloader, eval_dataloader, model, optimizer
+)
 
 num_epochs = 3
-num_training_steps = num_epochs * len(train_dataloader)
+num_training_steps = num_epochs * len(train_dl)
 lr_scheduler = get_scheduler(
     "linear",
     optimizer=optimizer,
@@ -252,11 +278,10 @@ progress_bar = tqdm(range(num_training_steps))
 
 model.train()
 for epoch in range(num_epochs):
-    for batch in train_dataloader:
-        batch = {k: v.to(device) for k, v in batch.items()}
+    for batch in train_dl:
         outputs = model(**batch)
         loss = outputs.loss
-        loss.backward()
+        accelerator.backward(loss)
 
         optimizer.step()
         lr_scheduler.step()
@@ -264,51 +289,6 @@ for epoch in range(num_epochs):
         progress_bar.update(1)
 ```
 
-And here are the changes:
-
-```diff
-+ from accelerate import Accelerator
-  from torch.optim import AdamW
-  from transformers import AutoModelForSequenceClassification, get_scheduler
-
-+ accelerator = Accelerator()
-
-  model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
-  optimizer = AdamW(model.parameters(), lr=3e-5)
-
-- device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")
-- model.to(device)
-
-+ train_dataloader, eval_dataloader, model, optimizer = accelerator.prepare(
-+     train_dataloader, eval_dataloader, model, optimizer
-+ )
-
-  num_epochs = 3
-  num_training_steps = num_epochs * len(train_dataloader)
-  lr_scheduler = get_scheduler(
-      "linear",
-      optimizer=optimizer,
-      num_warmup_steps=0,
-      num_training_steps=num_training_steps
-  )
-
-  progress_bar = tqdm(range(num_training_steps))
-
-  model.train()
-  for epoch in range(num_epochs):
-      for batch in train_dataloader:
--         batch = {k: v.to(device) for k, v in batch.items()}
-          outputs = model(**batch)
-          loss = outputs.loss
--         loss.backward()
-+         accelerator.backward(loss)
-
-          optimizer.step()
-          lr_scheduler.step()
-          optimizer.zero_grad()
-          progress_bar.update(1)
-```
-
 The first line to add is the import line. The second line instantiates an `Accelerator` object that will look at the environment and initialize the proper distributed setup. 🤗 Accelerate handles the device placement for you, so you can remove the lines that put the model on the device (or, if you prefer, change them to use `accelerator.device` instead of `device`).
 
 Then the main bulk of the work is done in the line that sends the dataloaders, the model, and the optimizer to `accelerator.prepare()`. This will wrap those objects in the proper container to make sure your distributed training works as intended. The remaining changes to make are removing the line that puts the batch on the `device` (again, if you want to keep this you can just change it to use `accelerator.device`) and replacing `loss.backward()` with `accelerator.backward(loss)`.
@@ -381,6 +361,12 @@ notebook_launcher(training_function)
 
 You can find more examples in the [🤗 Accelerate repo](https://github.com/huggingface/accelerate/tree/main/examples).
 
+<Tip>
+
+🌐 **Distributed Training**: For comprehensive coverage of multi-GPU and multi-node training, check out the [🤗 Transformers distributed training guide](https://huggingface.co/docs/transformers/main/en/perf_train_gpu_many) and the [scaling training cookbook](https://huggingface.co/learn/cookbook/en/distributed_training#multi-gpu-training).
+
+</Tip>
+
 ### Next Steps and Best Practices[[next-steps-and-best-practices]]
 
 Now that you've learned how to implement training from scratch, here are some additional considerations for production use:
diff --git a/chapters/en/chapter3/5.mdx b/chapters/en/chapter3/5.mdx
index ad3e16fc6..e24553dfd 100644
--- a/chapters/en/chapter3/5.mdx
+++ b/chapters/en/chapter3/5.mdx
@@ -13,17 +13,34 @@ That was comprehensive! In the first two chapters you learned about models and t
 * Learned how to load and preprocess datasets efficiently, including using dynamic padding and data collators
 * Implemented fine-tuning and evaluation using the high-level `Trainer` API with the latest features
 * Implemented a complete custom training loop from scratch with PyTorch
-* Used 🤗 Accelerate to easily adapt your training loop for distributed training on multiple GPUs or TPUs
-* Explored modern optimization techniques and training best practices
-* Learned about proper model evaluation using the 🤗 Evaluate library
+* Used 🤗 Accelerate to make your training code work seamlessly on multiple GPUs or TPUs
+* Applied modern optimization techniques like mixed precision training and gradient accumulation
 
-**Key takeaways for modern fine-tuning:**
+<Tip>
 
-- Always use the latest APIs like `processing_class` in the Trainer
-- Consider mixed precision training and gradient accumulation for efficiency
-- Use the 🤗 Evaluate library for comprehensive model evaluation
-- Leverage 🤗 Accelerate for seamless distributed training
-- Apply modern optimization techniques like proper learning rate scheduling and weight decay
-- Monitor your training with proper metrics and validation
+🎉 **Congratulations!** You've mastered the fundamentals of fine-tuning transformer models. You're now ready to tackle real-world ML projects!
 
-You now have all the tools needed to fine-tune state-of-the-art language models effectively using the latest best practices from the Hugging Face ecosystem!
+📖 **Continue Learning**: Explore these resources to deepen your knowledge:
+- [🤗 Transformers task guides](https://huggingface.co/docs/transformers/main/en/tasks/sequence_classification) for specific NLP tasks
+- [🤗 Transformers examples](https://huggingface.co/docs/transformers/main/en/notebooks) for comprehensive notebooks
+
+🚀 **Next Steps**: 
+- Try fine-tuning on your own dataset using the techniques you've learned
+- Experiment with different model architectures available on the [Hugging Face Hub](https://huggingface.co/models)
+- Join the [Hugging Face community](https://discuss.huggingface.co/) to share your projects and get help
+
+</Tip>
+
+This is just the beginning of your journey with 🤗 Transformers. In the next chapter, we'll explore how to share your models and tokenizers with the community and contribute to the ever-growing ecosystem of pretrained models.
+
+The skills you've developed here - data preprocessing, training configuration, evaluation, and optimization - are fundamental to any machine learning project. Whether you're working on text classification, named entity recognition, question answering, or any other NLP task, these techniques will serve you well.
+
+<Tip>
+
+💡 **Pro Tips for Success**:
+- Always start with a strong baseline using the `Trainer` API before implementing custom training loops
+- Use the 🤗 Hub to find pretrained models that are close to your task for better starting points
+- Monitor your training with proper evaluation metrics and don't forget to save checkpoints
+- Leverage the community - share your models and datasets to help others and get feedback on your work
+
+</Tip>

From 771a5ef3bbe0394450303017a84bae2dd8a0b7d4 Mon Sep 17 00:00:00 2001
From: burtenshaw <ben.burtenshaw@gmail.com>
Date: Fri, 13 Jun 2025 10:14:38 +0200
Subject: [PATCH 159/167] add a section on interpreting learning curves

---
 chapters/en/_toctree.yml   |   2 +
 chapters/en/chapter3/6.mdx | 505 ++++++++++++++++++++++++-------------
 chapters/en/chapter3/7.mdx | 268 ++++++++++++++++++++
 3 files changed, 593 insertions(+), 182 deletions(-)
 create mode 100644 chapters/en/chapter3/7.mdx

diff --git a/chapters/en/_toctree.yml b/chapters/en/_toctree.yml
index b300b245f..186ca8099 100644
--- a/chapters/en/_toctree.yml
+++ b/chapters/en/_toctree.yml
@@ -65,6 +65,8 @@
   - local: chapter3/5
     title: Fine-tuning, Check!
   - local: chapter3/6
+    title: Learning Curves
+  - local: chapter3/7
     title: End-of-chapter quiz
     quiz: 3
 
diff --git a/chapters/en/chapter3/6.mdx b/chapters/en/chapter3/6.mdx
index f2e2d7633..9eee4510a 100644
--- a/chapters/en/chapter3/6.mdx
+++ b/chapters/en/chapter3/6.mdx
@@ -1,268 +1,409 @@
-<!-- DISABLE-FRONTMATTER-SECTIONS -->
+# Understanding Learning Curves[[understanding-learning-curves]]
 
-# End-of-chapter quiz[[end-of-chapter-quiz]]
+<CourseFloatingBanner chapter={3}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter3/section7.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter3/section7.ipynb"},
+]} />
 
-<CourseFloatingBanner
-    chapter={3}
-    classNames="absolute z-10 right-0 top-0"
-/>
+Now that you've learned how to fine-tune models using both the `Trainer` API and custom training loops, it's crucial to understand how to interpret the results. Learning curves are invaluable tools that help you evaluate your model's performance during training and identify potential issues before they become major problems.
 
-Test what you learned in this chapter!
+In this section, we'll explore how to read and interpret accuracy and loss curves, understand what different curve shapes tell us about our model's behavior, and learn how to address common training issues.
 
-### 1. The `emotion` dataset contains Twitter messages labeled with emotions. Search for it in the [Hub](https://huggingface.co/datasets), and read the dataset card. Which of these is not one of its basic emotions?
+## What are Learning Curves?[[what-are-learning-curves]]
 
-<Question
-	choices={[
-		{
-			text: "Joy",
-			explain: "Try again — this emotion is present in that dataset!"
-		},
-		{
-			text: "Love",
-			explain: "Try again — this emotion is present in that dataset!"
-		},
-		{
-			text: "Confusion",
-			explain: "Correct! Confusion is not one of the six basic emotions.",
-            correct: true
-		},
-        {
-			text: "Surprise",
-			explain: "Surprise! Try another one!"
-		}
-	]}
-/>
+Learning curves are visual representations of your model's performance metrics over time during training. The two most important curves to monitor are:
 
-### 2. Search for the `ar_sarcasm` dataset in the [Hub](https://huggingface.co/datasets). Which task does it support?
+- **Loss curves**: Show how the model's error (loss) changes over training steps or epochs
+- **Accuracy curves**: Show the percentage of correct predictions over training steps or epochs
 
-<Question
-	choices={[
-		{
-			text: "Sentiment classification",
-			explain: "That's right! You can tell thanks to the tags.",
-            correct: true
-		},
-		{
-			text: "Machine translation",
-			explain: "That's not it — take another look at the <a href='https://huggingface.co/datasets/ar_sarcasm'>dataset card</a>!"
-		},
-		{
-			text: "Named entity recognition",
-			explain: "That's not it — take another look at the <a href='https://huggingface.co/datasets/ar_sarcasm'>dataset card</a>!"
-		},
-        {
-			text: "Question answering",
-			explain: "Alas, this question was not answered correctly. Try again!"
-		}
-	]}
-/>
+These curves help us understand whether our model is learning effectively and can guide us in making adjustments to improve performance.
 
-### 3. How does the BERT model expect a pair of sentences to be processed?
+### Loss Curves[[loss-curves]]
 
-<Question
-	choices={[
-		{
-			text: "Tokens_of_sentence_1 [SEP] Tokens_of_sentence_2",
-			explain: "A <code>[SEP]</code> special token is needed to separate the two sentences, but that's not the only thing!"
-		},
-		{
-			text: "[CLS] Tokens_of_sentence_1 Tokens_of_sentence_2",
-			explain: "A <code>[CLS]</code> special token is required at the beginning, but that's not the only thing!"
-		},
-		{
-			text: "[CLS] Tokens_of_sentence_1 [SEP] Tokens_of_sentence_2 [SEP]",
-			explain: "That's correct!",
-            correct: true
-		},
-        {
-			text: "[CLS] Tokens_of_sentence_1 [SEP] Tokens_of_sentence_2",
-			explain: "A <code>[CLS]</code> special token is needed at the beginning as well as a <code>[SEP]</code> special token to separate the two sentences, but that's not all!"
-		}
-	]}
-/>
+The loss curve shows how the model's error decreases over time. In a typical successful training run, you'll see:
 
-### 4. What are the benefits of the `Dataset.map()` method?
+![Loss Curve](https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter3/1.png)
 
-<Question
-	choices={[
-		{
-			text: "The results of the function are cached, so it won't take any time if we re-execute the code.",
-			explain: "That is indeed one of the neat benefits of this method! It's not the only one, though...",
-            correct: true
-		},
-		{
-			text: "It can apply multiprocessing to go faster than applying the function on each element of the dataset.",
-			explain: "This is a neat feature of this method, but it's not the only one!",
-            correct: true
-		},
-		{
-			text: "It does not load the whole dataset into memory, saving the results as soon as one element is processed.",
-			explain: "That's one advantage of this method. There are others, though!",
-            correct: true
-		},
-	]}
-/>
+- **High initial loss**: The model starts with random weights, so predictions are initially poor
+- **Decreasing loss**: As training progresses, the loss should generally decrease
+- **Convergence**: Eventually, the loss stabilizes at a low value
 
-### 5. What does dynamic padding mean?
+```python
+# Example of tracking loss during training with the Trainer
+from transformers import Trainer, TrainingArguments
+import wandb
 
-<Question
-	choices={[
-		{
-			text: "It's when you pad the inputs for each batch to the maximum length in the whole dataset.",
-			explain: "It does imply padding when creating the batch, but not to the maximum length in the whole dataset."
-		},
-		{
-			text: "It's when you pad your inputs when the batch is created, to the maximum length of the sentences inside that batch.",
-			explain: "That's correct! The \"dynamic\" part comes from the fact that the size of each batch is determined at the time of creation, and all your batches might have different shapes as a result.",
-            correct: true
-		},
-		{
-			text: "It's when you pad your inputs so that each sentence has the same number of tokens as the previous one in the dataset.",
-			explain: "That's incorrect, plus it doesn't make sense to look at the order in the dataset since we shuffle it during training."
-		},
-	]}
-/>
+# Initialize Weights & Biases for experiment tracking
+wandb.init(project="transformer-fine-tuning", name="bert-mrpc-analysis")
 
-### 6. What is the purpose of a collate function?
+training_args = TrainingArguments(
+    output_dir="./results",
+    eval_strategy="steps",
+    eval_steps=50,
+    save_steps=100,
+    logging_steps=10,  # Log metrics every 10 steps
+    num_train_epochs=3,
+    per_device_train_batch_size=16,
+    per_device_eval_batch_size=16,
+    report_to="wandb",  # Send logs to Weights & Biases
+)
 
-<Question
-	choices={[
-		{
-			text: "It ensures all the sequences in the dataset have the same length.",
-			explain: "A collate function is involved in handling individual batches, not the whole dataset. Additionally, we're talking about generic collate functions, not <code>DataCollatorWithPadding</code> specifically."
-		},
-		{
-			text: "It puts together all the samples in a batch.",
-			explain: "Correct! You can pass the collate function as an argument of a <code>DataLoader</code>. We used the <code>DataCollatorWithPadding</code> function, which pads all items in a batch so they have the same length.",
-            correct: true
-		},
-		{
-			text: "It preprocesses the whole dataset.",
-			explain: "That would be a preprocessing function, not a collate function."
-		},
-        {
-			text: "It truncates the sequences in the dataset.",
-			explain: "A collate function is involved in handling individual batches, not the whole dataset. If you're interested in truncating, you can use the <code>truncate</code> argument of <code>tokenizer</code>."
-		}
-	]}
-/>
+trainer = Trainer(
+    model=model,
+    args=training_args,
+    train_dataset=tokenized_datasets["train"],
+    eval_dataset=tokenized_datasets["validation"],
+    data_collator=data_collator,
+    processing_class=tokenizer,
+    compute_metrics=compute_metrics,
+)
+
+# Train and automatically log metrics
+trainer.train()
+```
 
-### 7. What happens when you instantiate one of the `AutoModelForXxx` classes with a pretrained language model (such as `bert-base-uncased`) that corresponds to a different task than the one for which it was trained?
+### Accuracy Curves[[accuracy-curves]]
+
+The accuracy curve shows the percentage of correct predictions over time. Unlike loss curves, accuracy curves:
+
+![Accuracy Curve](https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter3/2.png)
+
+- **Start low**: Initial accuracy might be around random chance (50% for binary classification)
+- **Increase with training**: Accuracy should generally improve as the model learns
+- **May show plateaus**: Accuracy often increases in discrete jumps rather than smoothly
+
+<Tip>
+
+💡 **Why Accuracy Curves Are "Steppy"**: Unlike loss, which is continuous, accuracy is calculated by comparing discrete predictions to true labels. Small improvements in model confidence might not change the final prediction, causing accuracy to remain flat until a threshold is crossed.
+
+</Tip>
+
+## Interpreting Learning Curve Patterns[[interpreting-learning-curve-patterns]]
+
+Different curve shapes reveal different aspects of your model's training. Let's examine the most common patterns and what they mean.
+
+### Healthy Learning Curves[[healthy-learning-curves]]
+
+A well-behaved training run typically shows:
+
+![Healthy Loss Curve](https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter3/5.png)
+
+Let's look at the picture above. It displays both the loss curve (on the left) and the corresponding accuracy curve (on the right). These curves have distinct characteristics.
+
+The loss curve shows the value of the model's loss over time. Initially, the loss is high and then it gradually decreases, indicating that the model is improving. A decrease in the loss value suggests that the model is making better predictions, as the loss represents the error between the predicted output and the true output.
+
+Now let's shift our focus to the accuracy curve. It represents the model's accuracy over time. The accuracy curve begins at a low value and increases as training progresses. Accuracy measures the proportion of correctly classified instances. So, as the accuracy curve rises, it signifies that the model is making more correct predictions.
+
+One notable difference between the curves is the smoothness and the presence of "plateaus" on the accuracy curve. While the loss decreases smoothly, the plateaus on the accuracy curve indicate discrete jumps in accuracy instead of a continuous increase. This behavior is attributed to how accuracy is measured. The loss can improve if the model's output gets closer to the target, even if the final prediction is still incorrect. Accuracy, however, only improves when the prediction crosses the threshold to be correct.
+
+For example, in a binary classifier distinguishing cats (0) from dogs (1), if the model predicts 0.3 for an image of a dog (true value 1), this is rounded to 0 and is an incorrect classification. If in the next step it predicts 0.4, it's still incorrect. The loss will have decreased because 0.4 is closer to 1 than 0.3, but the accuracy remains unchanged, creating a plateau. The accuracy will only jump up when the model predicts a value greater than 0.5 that gets rounded to 1.
+
+<Tip>
+
+**Characteristics of healthy curves:**
+- **Smooth decline in loss**: Both training and validation loss decrease steadily
+- **Close training/validation performance**: Small gap between training and validation metrics
+- **Convergence**: Curves level off, indicating the model has learned the patterns
+
+</Tip>
+
+### Practical Examples[[practical-examples]]
+
+Let's work through some practical examples of learning curves. First, we will highlight some approaches to monitor the learning curves during training. Below, we will break down the different patterns that can be observed in the learning curves.
+
+#### During Training[[during-training]]
+
+During the training process (after you've hit `trainer.train()`), you can monitor these key indicators:
+
+1. **Loss convergence**: Is the loss still decreasing or has it plateaued?
+2. **Overfitting signs**: Is validation loss starting to increase while training loss decreases?
+3. **Learning rate**: Are the curves too erratic (LR too high) or too flat (LR too low)?
+4. **Stability**: Are there sudden spikes or drops that indicate problems?
+
+#### After Training[[after-training]]
+
+After the training process is complete, you can analyze the complete curves to understand the model's performance.
+
+1. **Final performance**: Did the model reach acceptable performance levels?
+2. **Efficiency**: Could the same performance be achieved with fewer epochs?
+3. **Generalization**: How close are training and validation performance?
+4. **Trends**: Would additional training likely improve performance?
+
+<Tip>
+
+🔍 **W&B Dashboard Features**: Weights & Biases automatically creates beautiful, interactive plots of your learning curves. You can:
+- Compare multiple runs side by side
+- Add custom metrics and visualizations  
+- Set up alerts for anomalous behavior
+- Share results with your team
+
+Learn more in the [Weights & Biases documentation](https://docs.wandb.ai/).
+</Tip>
+
+#### Overfitting[[overfitting]]
+
+Overfitting occurs when the model learns too much from the training data and is unable to generalize to different data (represented by the validation set).
+
+**Symptoms:**
+
+- Training loss continues to decrease while validation loss increases or plateaus
+- Large gap between training and validation accuracy
+- Training accuracy much higher than validation accuracy
+
+![Overfitting](https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter3/10.png)
+
+**Solutions for overfitting:**
+- **Regularization**: Add dropout, weight decay, or other regularization techniques
+- **Early stopping**: Stop training when validation performance stops improving
+- **Data augmentation**: Increase training data diversity
+- **Reduce model complexity**: Use a smaller model or fewer parameters
+
+In the sample below, we use early stopping to prevent overfitting. We set the `early_stopping_patience` to 3, which means that if the validation loss does not improve for 3 consecutive epochs, the training will be stopped.
+
+```python
+# Example of detecting overfitting with early stopping
+from transformers import EarlyStoppingCallback
+
+training_args = TrainingArguments(
+    output_dir="./results",
+    eval_strategy="steps",
+    eval_steps=100,
+    save_strategy="steps",
+    save_steps=100,
+    load_best_model_at_end=True,
+    metric_for_best_model="eval_loss",
+    greater_is_better=False,
+    num_train_epochs=10,  # Set high, but we'll stop early
+)
+
+# Add early stopping to prevent overfitting
+trainer = Trainer(
+    model=model,
+    args=training_args,
+    train_dataset=tokenized_datasets["train"],
+    eval_dataset=tokenized_datasets["validation"],
+    data_collator=data_collator,
+    processing_class=tokenizer,
+    compute_metrics=compute_metrics,
+    callbacks=[EarlyStoppingCallback(early_stopping_patience=3)]
+)
+```
+
+#### 2. Underfitting[[underfitting]]
+
+Underfitting occurs when the model is too simple to capture the underlying patterns in the data. This can happen for several reasons:
+
+- The model is too small or lacks capacity to learn the patterns
+- The learning rate is too low, causing slow learning
+- The dataset is too small or not representative of the problem
+- The model is not properly regularized
+
+**Symptoms:**
+- Both training and validation loss remain high
+- Model performance plateaus early in training
+- Training accuracy is lower than expected
+
+![Underfitting](https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter3/7.png)
+
+**Solutions for underfitting:**
+- **Increase model capacity**: Use a larger model or more parameters
+- **Train longer**: Increase the number of epochs
+- **Adjust learning rate**: Try different learning rates
+- **Check data quality**: Ensure your data is properly preprocessed
+
+In the sample below, we train for more epochs to see if the model can learn the patterns in the data.
+
+```python
+from transformers import TrainingArguments
+
+training_args = TrainingArguments(
+    output_dir="./results",
+-    num_train_epochs=5,
++    num_train_epochs=10,
+)
+```
+
+#### 3. Erratic Learning Curves[[erratic-learning-curves]]
+
+Erratic learning curves occur when the model is not learning effectively. This can happen for several reasons:
+
+- The learning rate is too high, causing the model to overshoot the optimal parameters
+- The batch size is too small, causing the model to learn slowly
+- The model is not properly regularized, causing it to overfit to the training data
+- The dataset is not properly preprocessed, causing the model to learn from noise
+
+![Erratic Learning Curves](https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter3/3.png)
+
+**Symptoms:**
+- Frequent fluctuations in loss or accuracy
+- Curves show high variance or instability
+- Performance oscillates without clear trend
+
+Both training and validation curves show erratic behavior.
+
+![Erratic Learning Curves](https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter3/9.png)
+
+**Solutions for erratic curves:**
+- **Lower learning rate**: Reduce step size for more stable training
+- **Increase batch size**: Larger batches provide more stable gradients
+- **Gradient clipping**: Prevent exploding gradients
+- **Better data preprocessing**: Ensure consistent data quality
+
+In the sample below, we lower the learning rate and increase the batch size.
+
+```python
+from transformers import TrainingArguments
+
+training_args = TrainingArguments(
+    output_dir="./results",
+-    learning_rate=1e-5,
++    learning_rate=1e-4,
+-    per_device_train_batch_size=16,
++    per_device_train_batch_size=32,
+)
+```
+
+## Key Takeaways[[key-takeaways]]
+
+Understanding learning curves is crucial for becoming an effective machine learning practitioner. These visual tools provide immediate feedback about your model's training progress and help you make informed decisions about when to stop training, adjust hyperparameters, or try different approaches. With practice, you'll develop an intuitive understanding of what healthy learning curves look like and how to address issues when they arise. 
+
+<Tip>
+
+💡 **Key Takeaways:**
+- Learning curves are essential tools for understanding model training progress
+- Monitor both loss and accuracy curves, but remember they have different characteristics
+- Overfitting shows as diverging training/validation performance
+- Underfitting shows as poor performance on both training and validation data
+- Tools like Weights & Biases make it easy to track and analyze learning curves
+- Early stopping and proper regularization can address most common training issues
+
+🔬 **Next Steps**: Practice analyzing learning curves on your own fine-tuning experiments. Try different hyperparameters and observe how they affect the curve shapes. This hands-on experience is the best way to develop intuition for reading training progress.
+
+</Tip>
+
+## Section Quiz[[section-quiz]]
+
+Test your understanding of learning curves and training analysis:
+
+### 1. What does it typically mean when training loss decreases but validation loss starts increasing?
 
 <Question
 	choices={[
 		{
-			text: "Nothing, but you get a warning.",
-			explain: "You do get a warning, but that's not all!"
+			text: "The model is learning successfully and will continue to improve.",
+			explain: "If validation loss is increasing while training loss decreases, this indicates a problem, not success."
 		},
 		{
-			text: "The head of the pretrained model is discarded and a new head suitable for the task is inserted instead.",
-			explain: "Correct. For example, when we used <code>AutoModelForSequenceClassification</code> with <code>bert-base-uncased</code>, we got warnings when instantiating the model. The pretrained head is not used for the sequence classification task, so it's discarded and a new head is instantiated with random weights.",
+			text: "The model is overfitting to the training data.",
+			explain: "Correct! This is a classic sign of overfitting - the model performs well on training data but poorly on unseen validation data.",
             correct: true
 		},
 		{
-			text: "The head of the pretrained model is discarded.",
-			explain: "Something else needs to happen. Try again!"
+			text: "The learning rate is too low.",
+			explain: "A low learning rate would cause slow learning, not the divergence between training and validation performance."
 		},
         {
-			text: "Nothing, since the model can still be fine-tuned for the different task.",
-			explain: "The head of the pretrained model was not trained to solve this task, so we should discard the head!"
+			text: "The dataset is too small.",
+			explain: "While small datasets can contribute to overfitting, this specific pattern is the definition of overfitting regardless of dataset size."
 		}
 	]}
 />
 
-### 8. What's the purpose of `TrainingArguments`?
+### 2. Why do accuracy curves often show a "steppy" or plateau-like pattern rather than smooth increases?
 
 <Question
 	choices={[
 		{
-			text: "It contains all the hyperparameters used for training and evaluation with the <code>Trainer</code>.",
-			explain: "Correct!",
-            correct: true
+			text: "There's an error in the accuracy calculation.",
+			explain: "The steppy pattern is normal and expected, not an error."
 		},
 		{
-			text: "It specifies the size of the model.",
-			explain: "The model size is defined by the model configuration, not the class <code>TrainingArguments</code>."
+			text: "Accuracy is a discrete metric that only changes when predictions cross decision boundaries.",
+			explain: "Correct! Unlike loss, accuracy depends on discrete prediction decisions, so small improvements in confidence may not change the final accuracy until a threshold is crossed.",
+            correct: true
 		},
 		{
-			text: "It just contains the hyperparameters used for evaluation.",
-			explain: "In the example, we specified where the model and its checkpoints will be saved. Try again!"
+			text: "The model is not learning effectively.",
+			explain: "Steppy accuracy curves are normal even when the model is learning well."
 		},
         {
-			text: "It just contains the hyperparameters used for training.",
-			explain: "In the example, we used an <code>evaluation_strategy</code> as well, so this impacts evaluation. Try again!"
+			text: "The batch size is too small.",
+			explain: "Batch size affects training stability but doesn't explain the inherently discrete nature of accuracy metrics."
 		}
 	]}
 />
 
-### 9. Why should you use the 🤗 Accelerate library?
+### 3. What is the best approach when you observe erratic, highly fluctuating learning curves?
 
 <Question
 	choices={[
 		{
-			text: "It provides access to faster models.",
-			explain: "No, the 🤗 Accelerate library does not provide any models."
+			text: "Increase the learning rate to speed up convergence.",
+			explain: "Increasing the learning rate would likely make the fluctuations worse."
 		},
 		{
-			text: "It provides a high-level API so I don't have to implement my own training loop.",
-			explain: "This is what we did with <code>Trainer</code>, not the 🤗 Accelerate library. Try again!"
+			text: "Reduce the learning rate and possibly increase the batch size.",
+			explain: "Correct! Lower learning rates and larger batch sizes typically lead to more stable training.",
+            correct: true
 		},
 		{
-			text: "It makes our training loops work on distributed strategies.",
-			explain: "Correct! With 🤗 Accelerate, your training loops will work for multiple GPUs and TPUs.",
-            correct: true
+			text: "Stop training immediately as the model won't improve.",
+			explain: "Erratic curves can often be fixed with hyperparameter adjustments."
 		},
         {
-			text: "It provides more optimization functions.",
-			explain: "No, the 🤗 Accelerate library does not provide any optimization functions."
+			text: "Switch to a completely different model architecture.",
+			explain: "This is premature - erratic curves are usually fixable with hyperparameter tuning."
 		}
 	]}
 />
 
-### 10. What is the purpose of the `processing_class` parameter in the Trainer?
+### 4. When should you consider using early stopping?
 
 <Question
 	choices={[
 		{
-			text: "It tells the Trainer which tokenizer to use for processing the data.",
-			explain: "Correct! The processing_class parameter is a modern addition that helps the Trainer know how to process your data.",
-            correct: true
+			text: "Always, as it prevents any form of overfitting.",
+			explain: "Early stopping is useful but not always necessary, especially if other regularization methods are working."
 		},
 		{
-			text: "It specifies which device to use for training.",
-			explain: "No, device placement is handled differently in the Trainer."
+			text: "When validation performance stops improving or starts degrading.",
+			explain: "Correct! Early stopping helps prevent overfitting by stopping training when the model no longer generalizes better.",
+            correct: true
 		},
 		{
-			text: "It determines the batch size for training.",
-			explain: "No, batch size is specified in TrainingArguments."
+			text: "Only when training loss is still decreasing rapidly.",
+			explain: "If training loss is decreasing rapidly and validation performance is good, you might want to continue training."
 		},
         {
-			text: "It configures the learning rate schedule.",
-			explain: "No, learning rate scheduling is configured through TrainingArguments."
+			text: "Never, as it prevents the model from reaching its full potential.",
+			explain: "Early stopping is a valuable technique that often improves final model performance by preventing overfitting."
 		}
 	]}
 />
 
-### 11. Which modern optimization technique can help with memory efficiency during training?
+### 5. What indicates that your model might be underfitting?
 
 <Question
 	choices={[
 		{
-			text: "Mixed precision training with fp16=True.",
-			explain: "Correct! Mixed precision training reduces memory usage and can speed up training.",
-            correct: true
+			text: "Training accuracy is much higher than validation accuracy.",
+			explain: "This describes overfitting, not underfitting."
 		},
 		{
-			text: "Using a smaller model.",
-			explain: "While this would reduce memory usage, it's not an optimization technique - it's changing the model itself."
+			text: "Both training and validation performance are poor and plateau early.",
+			explain: "Correct! Underfitting occurs when the model lacks capacity to learn the patterns, resulting in poor performance on both training and validation data.",
+            correct: true
 		},
 		{
-			text: "Gradient accumulation.",
-			explain: "Gradient accumulation helps simulate larger batch sizes, but doesn't directly reduce memory usage per batch.",
+			text: "The learning curves are very smooth with no fluctuations.",
+			explain: "Smooth curves are generally good and don't indicate underfitting."
 		},
         {
-			text: "Using a different tokenizer.",
-			explain: "The tokenizer choice doesn't significantly impact training memory usage."
+			text: "Validation loss is decreasing faster than training loss.",
+			explain: "This would actually be a positive sign, not a problem."
 		}
 	]}
 />
+
diff --git a/chapters/en/chapter3/7.mdx b/chapters/en/chapter3/7.mdx
new file mode 100644
index 000000000..f2e2d7633
--- /dev/null
+++ b/chapters/en/chapter3/7.mdx
@@ -0,0 +1,268 @@
+<!-- DISABLE-FRONTMATTER-SECTIONS -->
+
+# End-of-chapter quiz[[end-of-chapter-quiz]]
+
+<CourseFloatingBanner
+    chapter={3}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+Test what you learned in this chapter!
+
+### 1. The `emotion` dataset contains Twitter messages labeled with emotions. Search for it in the [Hub](https://huggingface.co/datasets), and read the dataset card. Which of these is not one of its basic emotions?
+
+<Question
+	choices={[
+		{
+			text: "Joy",
+			explain: "Try again — this emotion is present in that dataset!"
+		},
+		{
+			text: "Love",
+			explain: "Try again — this emotion is present in that dataset!"
+		},
+		{
+			text: "Confusion",
+			explain: "Correct! Confusion is not one of the six basic emotions.",
+            correct: true
+		},
+        {
+			text: "Surprise",
+			explain: "Surprise! Try another one!"
+		}
+	]}
+/>
+
+### 2. Search for the `ar_sarcasm` dataset in the [Hub](https://huggingface.co/datasets). Which task does it support?
+
+<Question
+	choices={[
+		{
+			text: "Sentiment classification",
+			explain: "That's right! You can tell thanks to the tags.",
+            correct: true
+		},
+		{
+			text: "Machine translation",
+			explain: "That's not it — take another look at the <a href='https://huggingface.co/datasets/ar_sarcasm'>dataset card</a>!"
+		},
+		{
+			text: "Named entity recognition",
+			explain: "That's not it — take another look at the <a href='https://huggingface.co/datasets/ar_sarcasm'>dataset card</a>!"
+		},
+        {
+			text: "Question answering",
+			explain: "Alas, this question was not answered correctly. Try again!"
+		}
+	]}
+/>
+
+### 3. How does the BERT model expect a pair of sentences to be processed?
+
+<Question
+	choices={[
+		{
+			text: "Tokens_of_sentence_1 [SEP] Tokens_of_sentence_2",
+			explain: "A <code>[SEP]</code> special token is needed to separate the two sentences, but that's not the only thing!"
+		},
+		{
+			text: "[CLS] Tokens_of_sentence_1 Tokens_of_sentence_2",
+			explain: "A <code>[CLS]</code> special token is required at the beginning, but that's not the only thing!"
+		},
+		{
+			text: "[CLS] Tokens_of_sentence_1 [SEP] Tokens_of_sentence_2 [SEP]",
+			explain: "That's correct!",
+            correct: true
+		},
+        {
+			text: "[CLS] Tokens_of_sentence_1 [SEP] Tokens_of_sentence_2",
+			explain: "A <code>[CLS]</code> special token is needed at the beginning as well as a <code>[SEP]</code> special token to separate the two sentences, but that's not all!"
+		}
+	]}
+/>
+
+### 4. What are the benefits of the `Dataset.map()` method?
+
+<Question
+	choices={[
+		{
+			text: "The results of the function are cached, so it won't take any time if we re-execute the code.",
+			explain: "That is indeed one of the neat benefits of this method! It's not the only one, though...",
+            correct: true
+		},
+		{
+			text: "It can apply multiprocessing to go faster than applying the function on each element of the dataset.",
+			explain: "This is a neat feature of this method, but it's not the only one!",
+            correct: true
+		},
+		{
+			text: "It does not load the whole dataset into memory, saving the results as soon as one element is processed.",
+			explain: "That's one advantage of this method. There are others, though!",
+            correct: true
+		},
+	]}
+/>
+
+### 5. What does dynamic padding mean?
+
+<Question
+	choices={[
+		{
+			text: "It's when you pad the inputs for each batch to the maximum length in the whole dataset.",
+			explain: "It does imply padding when creating the batch, but not to the maximum length in the whole dataset."
+		},
+		{
+			text: "It's when you pad your inputs when the batch is created, to the maximum length of the sentences inside that batch.",
+			explain: "That's correct! The \"dynamic\" part comes from the fact that the size of each batch is determined at the time of creation, and all your batches might have different shapes as a result.",
+            correct: true
+		},
+		{
+			text: "It's when you pad your inputs so that each sentence has the same number of tokens as the previous one in the dataset.",
+			explain: "That's incorrect, plus it doesn't make sense to look at the order in the dataset since we shuffle it during training."
+		},
+	]}
+/>
+
+### 6. What is the purpose of a collate function?
+
+<Question
+	choices={[
+		{
+			text: "It ensures all the sequences in the dataset have the same length.",
+			explain: "A collate function is involved in handling individual batches, not the whole dataset. Additionally, we're talking about generic collate functions, not <code>DataCollatorWithPadding</code> specifically."
+		},
+		{
+			text: "It puts together all the samples in a batch.",
+			explain: "Correct! You can pass the collate function as an argument of a <code>DataLoader</code>. We used the <code>DataCollatorWithPadding</code> function, which pads all items in a batch so they have the same length.",
+            correct: true
+		},
+		{
+			text: "It preprocesses the whole dataset.",
+			explain: "That would be a preprocessing function, not a collate function."
+		},
+        {
+			text: "It truncates the sequences in the dataset.",
+			explain: "A collate function is involved in handling individual batches, not the whole dataset. If you're interested in truncating, you can use the <code>truncate</code> argument of <code>tokenizer</code>."
+		}
+	]}
+/>
+
+### 7. What happens when you instantiate one of the `AutoModelForXxx` classes with a pretrained language model (such as `bert-base-uncased`) that corresponds to a different task than the one for which it was trained?
+
+<Question
+	choices={[
+		{
+			text: "Nothing, but you get a warning.",
+			explain: "You do get a warning, but that's not all!"
+		},
+		{
+			text: "The head of the pretrained model is discarded and a new head suitable for the task is inserted instead.",
+			explain: "Correct. For example, when we used <code>AutoModelForSequenceClassification</code> with <code>bert-base-uncased</code>, we got warnings when instantiating the model. The pretrained head is not used for the sequence classification task, so it's discarded and a new head is instantiated with random weights.",
+            correct: true
+		},
+		{
+			text: "The head of the pretrained model is discarded.",
+			explain: "Something else needs to happen. Try again!"
+		},
+        {
+			text: "Nothing, since the model can still be fine-tuned for the different task.",
+			explain: "The head of the pretrained model was not trained to solve this task, so we should discard the head!"
+		}
+	]}
+/>
+
+### 8. What's the purpose of `TrainingArguments`?
+
+<Question
+	choices={[
+		{
+			text: "It contains all the hyperparameters used for training and evaluation with the <code>Trainer</code>.",
+			explain: "Correct!",
+            correct: true
+		},
+		{
+			text: "It specifies the size of the model.",
+			explain: "The model size is defined by the model configuration, not the class <code>TrainingArguments</code>."
+		},
+		{
+			text: "It just contains the hyperparameters used for evaluation.",
+			explain: "In the example, we specified where the model and its checkpoints will be saved. Try again!"
+		},
+        {
+			text: "It just contains the hyperparameters used for training.",
+			explain: "In the example, we used an <code>evaluation_strategy</code> as well, so this impacts evaluation. Try again!"
+		}
+	]}
+/>
+
+### 9. Why should you use the 🤗 Accelerate library?
+
+<Question
+	choices={[
+		{
+			text: "It provides access to faster models.",
+			explain: "No, the 🤗 Accelerate library does not provide any models."
+		},
+		{
+			text: "It provides a high-level API so I don't have to implement my own training loop.",
+			explain: "This is what we did with <code>Trainer</code>, not the 🤗 Accelerate library. Try again!"
+		},
+		{
+			text: "It makes our training loops work on distributed strategies.",
+			explain: "Correct! With 🤗 Accelerate, your training loops will work for multiple GPUs and TPUs.",
+            correct: true
+		},
+        {
+			text: "It provides more optimization functions.",
+			explain: "No, the 🤗 Accelerate library does not provide any optimization functions."
+		}
+	]}
+/>
+
+### 10. What is the purpose of the `processing_class` parameter in the Trainer?
+
+<Question
+	choices={[
+		{
+			text: "It tells the Trainer which tokenizer to use for processing the data.",
+			explain: "Correct! The processing_class parameter is a modern addition that helps the Trainer know how to process your data.",
+            correct: true
+		},
+		{
+			text: "It specifies which device to use for training.",
+			explain: "No, device placement is handled differently in the Trainer."
+		},
+		{
+			text: "It determines the batch size for training.",
+			explain: "No, batch size is specified in TrainingArguments."
+		},
+        {
+			text: "It configures the learning rate schedule.",
+			explain: "No, learning rate scheduling is configured through TrainingArguments."
+		}
+	]}
+/>
+
+### 11. Which modern optimization technique can help with memory efficiency during training?
+
+<Question
+	choices={[
+		{
+			text: "Mixed precision training with fp16=True.",
+			explain: "Correct! Mixed precision training reduces memory usage and can speed up training.",
+            correct: true
+		},
+		{
+			text: "Using a smaller model.",
+			explain: "While this would reduce memory usage, it's not an optimization technique - it's changing the model itself."
+		},
+		{
+			text: "Gradient accumulation.",
+			explain: "Gradient accumulation helps simulate larger batch sizes, but doesn't directly reduce memory usage per batch.",
+		},
+        {
+			text: "Using a different tokenizer.",
+			explain: "The tokenizer choice doesn't significantly impact training memory usage."
+		}
+	]}
+/>

From 227994ed389eebcf5ddde687f3f5bb396b09df69 Mon Sep 17 00:00:00 2001
From: burtenshaw <ben.burtenshaw@gmail.com>
Date: Fri, 13 Jun 2025 15:17:28 +0200
Subject: [PATCH 160/167] add a section on convergence

---
 chapters/en/chapter3/6.mdx | 8 ++++++++
 1 file changed, 8 insertions(+)

diff --git a/chapters/en/chapter3/6.mdx b/chapters/en/chapter3/6.mdx
index 9eee4510a..13572fa56 100644
--- a/chapters/en/chapter3/6.mdx
+++ b/chapters/en/chapter3/6.mdx
@@ -80,6 +80,14 @@ The accuracy curve shows the percentage of correct predictions over time. Unlike
 
 </Tip>
 
+### Convergence[[convergence]]
+
+Convergence occurs when the model's performance stabilizes and the loss and accuracy curves level off. This is a sign that the model has learned the patterns in the data and is ready to be used. In simple terms, we are aiming for the model to converge to a stable performance every time we train it.
+
+![Convergence](https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter3/4.png)
+
+Once models have converged, we can use them to make predictions on new data and refer to evaluation metrics to understand how well the model is performing.
+
 ## Interpreting Learning Curve Patterns[[interpreting-learning-curve-patterns]]
 
 Different curve shapes reveal different aspects of your model's training. Let's examine the most common patterns and what they mean.

From 068d132ce889a883e50a7cdf7431d52527622079 Mon Sep 17 00:00:00 2001
From: burtenshaw <ben.burtenshaw@gmail.com>
Date: Mon, 16 Jun 2025 09:45:08 +0200
Subject: [PATCH 161/167] proof read prose and check links

---
 chapters/en/chapter3/1.mdx |  4 ++--
 chapters/en/chapter3/2.mdx | 12 ++++++++----
 chapters/en/chapter3/3.mdx | 15 ++++++++-------
 chapters/en/chapter3/4.mdx | 12 ++++++------
 chapters/en/chapter3/6.mdx | 32 +++++++++++++++++---------------
 5 files changed, 41 insertions(+), 34 deletions(-)

diff --git a/chapters/en/chapter3/1.mdx b/chapters/en/chapter3/1.mdx
index 24e8c8a1a..34e68bb36 100644
--- a/chapters/en/chapter3/1.mdx
+++ b/chapters/en/chapter3/1.mdx
@@ -7,7 +7,7 @@
     classNames="absolute z-10 right-0 top-0"
 />
 
-In [Chapter 2](/course/chapter2) we explored how to use tokenizers and pretrained models to make predictions. But what if you want to fine-tune a pretrained model for your own dataset? That's the topic of this chapter! You will learn:
+In [Chapter 2](/course/chapter2) we explored how to use tokenizers and pretrained models to make predictions. But what if you want to fine-tune a pretrained model to solve a specific task? That's the topic of this chapter! You will learn:
 
 * How to prepare a large dataset from the Hub using the latest 🤗 Datasets features
 * How to use the high-level `Trainer` API to fine-tune a model with modern best practices
@@ -21,7 +21,7 @@ In [Chapter 2](/course/chapter2) we explored how to use tokenizers and pretraine
 
 </Tip>
 
-This chapter will also serve as an introduction to the 🤗 Ecosystems. We'll see how libraries like 🤗 Datasets, 🤗 Tokenizers, 🤗 Accelerate, and 🤗 Evaluate can help you train models more efficiently and effectively.
+This chapter will also serve as an introduction to some Hugging Face libraries beyond the 🤗 Transformers library! We'll see how libraries like 🤗 Datasets, 🤗 Tokenizers, 🤗 Accelerate, and 🤗 Evaluate can help you train models more efficiently and effectively.
 
 Each of the main sections in this chapter will teach you something different:
 - **Section 2**: Learn modern data preprocessing techniques and efficient dataset handling
diff --git a/chapters/en/chapter3/2.mdx b/chapters/en/chapter3/2.mdx
index 00c7f24d1..6de93730d 100644
--- a/chapters/en/chapter3/2.mdx
+++ b/chapters/en/chapter3/2.mdx
@@ -3,11 +3,11 @@
 <CourseFloatingBanner chapter={3}
   classNames="absolute z-10 right-0 top-0"
   notebooks={[
-    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter3/section2_pt.ipynb"},
-    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter3/section2_pt.ipynb"},
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter3/section2.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter3/section2.ipynb"},
 ]} />
 
-Continuing with the example from the [previous chapter](/course/chapter2), here is how we would train a sequence classifier on one batch in PyTorch:
+Continuing with the example from the [previous chapter](/course/chapter2), here is how we would train a sequence classifier on one batch:
 
 ```python
 import torch
@@ -46,9 +46,9 @@ The Hub doesn't just contain models; it also has multiple datasets in lots of di
 The 🤗 Datasets library provides a very simple command to download and cache a dataset on the Hub. We can download the MRPC dataset like this:
 
 <Tip>
-⚠️ **Warning** Make sure that `datasets` is installed by running `pip install datasets`. Then, load the MRPC dataset and print it to see what it contains.
 
 💡 **Additional Resources**: For more dataset loading techniques and examples, check out the [🤗 Datasets documentation](https://huggingface.co/docs/datasets/).
+
 </Tip> 
 
 ```py
@@ -77,8 +77,12 @@ DatasetDict({
 
 As you can see, we get a `DatasetDict` object which contains the training set, the validation set, and the test set. Each of those contains several columns (`sentence1`, `sentence2`, `label`, and `idx`) and a variable number of rows, which are the number of elements in each set (so, there are 3,668 pairs of sentences in the training set, 408 in the validation set, and 1,725 in the test set).
 
+<Tip>
+
 This command downloads and caches the dataset, by default in *~/.cache/huggingface/datasets*. Recall from Chapter 2 that you can customize your cache folder by setting the `HF_HOME` environment variable.
 
+</Tip>
+
 We can access each pair of sentences in our `raw_datasets` object by indexing, like with a dictionary:
 
 ```py
diff --git a/chapters/en/chapter3/3.mdx b/chapters/en/chapter3/3.mdx
index 6880c57bd..7af9905a1 100644
--- a/chapters/en/chapter3/3.mdx
+++ b/chapters/en/chapter3/3.mdx
@@ -48,9 +48,9 @@ from transformers import TrainingArguments
 training_args = TrainingArguments("test-trainer")
 ```
 
-<Tip>
+If you want to automatically upload your model to the Hub during training, pass along `push_to_hub=True` in the `TrainingArguments`. We will learn more about this in [Chapter 4](/course/chapter4/3)
 
-💡 If you want to automatically upload your model to the Hub during training, pass along `push_to_hub=True` in the `TrainingArguments`. We will learn more about this in [Chapter 4](/course/chapter4/3)
+<Tip>
 
 🚀 **Advanced Configuration**: For detailed information on all available training arguments and optimization strategies, check out the [TrainingArguments documentation](https://huggingface.co/docs/transformers/main/en/main_classes/trainer#transformers.TrainingArguments) and the [training configuration cookbook](https://huggingface.co/learn/cookbook/en/training_tricks#training-arguments).
 
@@ -81,9 +81,9 @@ trainer = Trainer(
 )
 ```
 
-<Tip>
+When you pass a tokenizer as the `processing_class`, the default `data_collator` used by the `Trainer` will be a `DataCollatorWithPadding`. You can skip the `data_collator=data_collator` line in this case, but we included it here to show you this important part of the processing pipeline.
 
-💡 When you pass a tokenizer as the `processing_class`, the default `data_collator` used by the `Trainer` will be a `DataCollatorWithPadding`. You can skip the `data_collator=data_collator` line in this case, but we included it here to show you this important part of the processing pipeline.
+<Tip>
 
 📖 **Learn More**: For comprehensive details on the Trainer class and its parameters, visit the [Trainer API documentation](https://huggingface.co/docs/transformers/main/en/main_classes/trainer) and explore advanced usage patterns in the [training cookbook recipes](https://huggingface.co/learn/cookbook/en/fine_tuning_code_llm#setting-up-the-trainer).
 
@@ -139,7 +139,7 @@ metric.compute(predictions=preds, references=predictions.label_ids)
 
 <Tip>
 
-📊 **Evaluation Deep Dive**: Learn about different evaluation metrics and strategies in the [🤗 Evaluate documentation](https://huggingface.co/docs/evaluate/) and explore comprehensive evaluation techniques in the [model evaluation cookbook](https://huggingface.co/learn/cookbook/en/evaluation).
+Learn about different evaluation metrics and strategies in the [🤗 Evaluate documentation](https://huggingface.co/docs/evaluate/).
 
 </Tip>
 
@@ -185,6 +185,7 @@ This time, it will report the validation loss and metrics at the end of each epo
 The `Trainer` comes with many built-in features that make modern deep learning best practices accessible:
 
 **Mixed Precision Training**: Use `fp16=True` in your training arguments for faster training and reduced memory usage:
+
 ```py
 training_args = TrainingArguments(
     "test-trainer", 
@@ -194,6 +195,7 @@ training_args = TrainingArguments(
 ```
 
 **Gradient Accumulation**: For effective larger batch sizes when GPU memory is limited:
+
 ```py
 training_args = TrainingArguments(
     "test-trainer", 
@@ -204,6 +206,7 @@ training_args = TrainingArguments(
 ```
 
 **Learning Rate Scheduling**: The Trainer uses linear decay by default, but you can customize this:
+
 ```py
 training_args = TrainingArguments(
     "test-trainer", 
@@ -225,8 +228,6 @@ This concludes the introduction to fine-tuning using the `Trainer` API. An examp
 
 <Tip>
 
-✏️ **Try it out!** Fine-tune a model on the GLUE SST-2 dataset, using the data processing you did in section 2.
-
 📝 **More Examples**: Check out the comprehensive collection of [🤗 Transformers notebooks](https://huggingface.co/docs/transformers/main/en/notebooks).
 
 </Tip>
diff --git a/chapters/en/chapter3/4.mdx b/chapters/en/chapter3/4.mdx
index 7f3e874a9..e69c4e750 100644
--- a/chapters/en/chapter3/4.mdx
+++ b/chapters/en/chapter3/4.mdx
@@ -13,7 +13,7 @@ Now we'll see how to achieve the same results as we did in the last section with
 
 <Tip>
 
-🏗️ **Training from Scratch**: This section builds on the previous content. For comprehensive guidance on PyTorch training loops and best practices, check out the [🤗 Transformers training documentation](https://huggingface.co/docs/transformers/main/en/training#train-in-native-pytorch) and the [custom training cookbook](https://huggingface.co/learn/cookbook/en/fine_tuning_code_llm#training-loop).
+🏗️ **Training from Scratch**: This section builds on the previous content. For comprehensive guidance on PyTorch training loops and best practices, check out the [🤗 Transformers training documentation](https://huggingface.co/docs/transformers/main/en/training#train-in-native-pytorch) and the [custom training cookbook](https://huggingface.co/learn/cookbook/en/fine_tuning_code_llm_on_single_gpu#model).
 
 </Tip>
 
@@ -123,7 +123,7 @@ optimizer = AdamW(model.parameters(), lr=5e-5)
 - **8-bit Adam**: Use `bitsandbytes` for memory-efficient optimization
 - **Different learning rates**: Lower learning rates (1e-5 to 3e-5) often work better for large models
 
-🚀 **Optimization Resources**: Learn more about optimizers and training strategies in the [🤗 Transformers optimization guide](https://huggingface.co/docs/transformers/main/en/performance#optimizer) and explore advanced techniques in the [optimization cookbook](https://huggingface.co/learn/cookbook/en/training_tricks#optimizers-and-schedulers).
+🚀 **Optimization Resources**: Learn more about optimizers and training strategies in the [🤗 Transformers optimization guide](https://huggingface.co/docs/transformers/main/en/performance#optimizer).
 
 </Tip>
 
@@ -193,7 +193,7 @@ for epoch in range(num_epochs):
 - **Gradient Accumulation**: Accumulate gradients over multiple batches to simulate larger batch sizes
 - **Checkpointing**: Save model checkpoints periodically to resume training if interrupted
 
-🔧 **Implementation Guide**: For detailed examples of these optimizations, see the [🤗 Transformers efficient training guide](https://huggingface.co/docs/transformers/main/en/perf_train_gpu_one) and the [advanced training cookbook](https://huggingface.co/learn/cookbook/en/training_tricks#gradient-accumulation).
+🔧 **Implementation Guide**: For detailed examples of these optimizations, see the [🤗 Transformers efficient training guide](https://huggingface.co/docs/transformers/main/en/perf_train_gpu_one) and the [range of optimizers](https://huggingface.co/docs/transformers/main/en/optimizers).
 
 </Tip>
 
@@ -206,7 +206,7 @@ As we did earlier, we will use a metric provided by the 🤗 Evaluate library. W
 
 <Tip>
 
-📊 **Evaluation Best Practices**: For more sophisticated evaluation strategies and metrics, explore the [🤗 Evaluate documentation](https://huggingface.co/docs/evaluate/) and the [comprehensive evaluation cookbook](https://huggingface.co/learn/cookbook/en/evaluation).
+📊 **Evaluation Best Practices**: For more sophisticated evaluation strategies and metrics, explore the [🤗 Evaluate documentation](https://huggingface.co/docs/evaluate/) and the [comprehensive evaluation cookbook](https://github.com/huggingface/evaluation-guidebook).
 
 </Tip>
 
@@ -247,7 +247,7 @@ The training loop we defined earlier works fine on a single CPU or GPU. But usin
 
 <Tip>
 
-⚡ **Accelerate Deep Dive**: Learn everything about distributed training, mixed precision, and hardware optimization in the [🤗 Accelerate documentation](https://huggingface.co/docs/accelerate/) and explore practical examples in the [distributed training cookbook](https://huggingface.co/learn/cookbook/en/distributed_training).
+⚡ **Accelerate Deep Dive**: Learn everything about distributed training, mixed precision, and hardware optimization in the [🤗 Accelerate documentation](https://huggingface.co/docs/accelerate/) and explore practical examples in the [transformers documentation](https://huggingface.co/docs/transformers/main/en/accelerate).
 
 </Tip>
 
@@ -363,7 +363,7 @@ You can find more examples in the [🤗 Accelerate repo](https://github.com/hugg
 
 <Tip>
 
-🌐 **Distributed Training**: For comprehensive coverage of multi-GPU and multi-node training, check out the [🤗 Transformers distributed training guide](https://huggingface.co/docs/transformers/main/en/perf_train_gpu_many) and the [scaling training cookbook](https://huggingface.co/learn/cookbook/en/distributed_training#multi-gpu-training).
+🌐 **Distributed Training**: For comprehensive coverage of multi-GPU and multi-node training, check out the [🤗 Transformers distributed training guide](https://huggingface.co/docs/transformers/main/en/perf_train_gpu_many) and the [scaling training cookbook](https://huggingface.co/docs/transformers/main/en/accelerate).
 
 </Tip>
 
diff --git a/chapters/en/chapter3/6.mdx b/chapters/en/chapter3/6.mdx
index 13572fa56..a161cf585 100644
--- a/chapters/en/chapter3/6.mdx
+++ b/chapters/en/chapter3/6.mdx
@@ -7,7 +7,7 @@
     {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter3/section7.ipynb"},
 ]} />
 
-Now that you've learned how to fine-tune models using both the `Trainer` API and custom training loops, it's crucial to understand how to interpret the results. Learning curves are invaluable tools that help you evaluate your model's performance during training and identify potential issues before they become major problems.
+Now that you've learned how to implement fine-tuning using both the `Trainer` API and custom training loops, it's crucial to understand how to interpret the results. Learning curves are invaluable tools that help you evaluate your model's performance during training and identify potential issues before they reduce performance.
 
 In this section, we'll explore how to read and interpret accuracy and loss curves, understand what different curve shapes tell us about our model's behavior, and learn how to address common training issues.
 
@@ -18,17 +18,19 @@ Learning curves are visual representations of your model's performance metrics o
 - **Loss curves**: Show how the model's error (loss) changes over training steps or epochs
 - **Accuracy curves**: Show the percentage of correct predictions over training steps or epochs
 
-These curves help us understand whether our model is learning effectively and can guide us in making adjustments to improve performance.
+These curves help us understand whether our model is learning effectively and can guide us in making adjustments to improve performance. In Transformers, these metrics are individually computed for each batch and then logged to the disk. We can then use libraries like [Weights & Biases](https://wandb.ai/) to visualize these curves and track our model's performance over time.
 
 ### Loss Curves[[loss-curves]]
 
-The loss curve shows how the model's error decreases over time. In a typical successful training run, you'll see:
+The loss curve shows how the model's error decreases over time. In a typical successful training run, you'll see a curve similar to the one below:
 
 ![Loss Curve](https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter3/1.png)
 
-- **High initial loss**: The model starts with random weights, so predictions are initially poor
+- **High initial loss**: The model starts without optimization, so predictions are initially poor
 - **Decreasing loss**: As training progresses, the loss should generally decrease
-- **Convergence**: Eventually, the loss stabilizes at a low value
+- **Convergence**: Eventually, the loss stabilizes at a low value, indicating that the model has learned the patterns in the data
+
+As in previous chapters, we can use the `Trainer` API to track these metrics and visualize them in a dashboard. Below is an example of how to do this with Weights & Biases.
 
 ```python
 # Example of tracking loss during training with the Trainer
@@ -66,13 +68,13 @@ trainer.train()
 
 ### Accuracy Curves[[accuracy-curves]]
 
-The accuracy curve shows the percentage of correct predictions over time. Unlike loss curves, accuracy curves:
+The accuracy curve shows the percentage of correct predictions over time. Unlike loss curves, accuracy curves should generally increase as the model learns and can typically include more steps than the loss curve.
 
 ![Accuracy Curve](https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter3/2.png)
 
-- **Start low**: Initial accuracy might be around random chance (50% for binary classification)
-- **Increase with training**: Accuracy should generally improve as the model learns
-- **May show plateaus**: Accuracy often increases in discrete jumps rather than smoothly
+- **Start low**: Initial accuracy should be low, as the model has not yet learned the patterns in the data
+- **Increase with training**: Accuracy should generally improve as the model learns if it is able to learn the patterns in the data
+- **May show plateaus**: Accuracy often increases in discrete jumps rather than smoothly, as the model makes predictions that are close to the true labels
 
 <Tip>
 
@@ -94,11 +96,11 @@ Different curve shapes reveal different aspects of your model's training. Let's
 
 ### Healthy Learning Curves[[healthy-learning-curves]]
 
-A well-behaved training run typically shows:
+A well-behaved training run typically shows curve shapes similar to the one below:
 
 ![Healthy Loss Curve](https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter3/5.png)
 
-Let's look at the picture above. It displays both the loss curve (on the left) and the corresponding accuracy curve (on the right). These curves have distinct characteristics.
+Let's look at the illustration above. It displays both the loss curve (on the left) and the corresponding accuracy curve (on the right). These curves have distinct characteristics.
 
 The loss curve shows the value of the model's loss over time. Initially, the loss is high and then it gradually decreases, indicating that the model is improving. A decrease in the loss value suggests that the model is making better predictions, as the loss represents the error between the predicted output and the true output.
 
@@ -154,14 +156,14 @@ Learn more in the [Weights & Biases documentation](https://docs.wandb.ai/).
 
 Overfitting occurs when the model learns too much from the training data and is unable to generalize to different data (represented by the validation set).
 
+![Overfitting](https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter3/10.png)
+
 **Symptoms:**
 
 - Training loss continues to decrease while validation loss increases or plateaus
 - Large gap between training and validation accuracy
 - Training accuracy much higher than validation accuracy
 
-![Overfitting](https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter3/10.png)
-
 **Solutions for overfitting:**
 - **Regularization**: Add dropout, weight decay, or other regularization techniques
 - **Early stopping**: Stop training when validation performance stops improving
@@ -208,13 +210,13 @@ Underfitting occurs when the model is too simple to capture the underlying patte
 - The dataset is too small or not representative of the problem
 - The model is not properly regularized
 
+![Underfitting](https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter3/7.png)
+
 **Symptoms:**
 - Both training and validation loss remain high
 - Model performance plateaus early in training
 - Training accuracy is lower than expected
 
-![Underfitting](https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter3/7.png)
-
 **Solutions for underfitting:**
 - **Increase model capacity**: Use a larger model or more parameters
 - **Train longer**: Increase the number of epochs

From fc272d948427b023dd0365e0b002f414a9a8c114 Mon Sep 17 00:00:00 2001
From: burtenshaw <ben.burtenshaw@gmail.com>
Date: Mon, 16 Jun 2025 09:47:13 +0200
Subject: [PATCH 162/167] format code blocks

---
 chapters/en/chapter3/3.mdx |  6 +++---
 chapters/en/chapter3/6.mdx | 14 +++++++-------
 2 files changed, 10 insertions(+), 10 deletions(-)

diff --git a/chapters/en/chapter3/3.mdx b/chapters/en/chapter3/3.mdx
index 7af9905a1..3c8162476 100644
--- a/chapters/en/chapter3/3.mdx
+++ b/chapters/en/chapter3/3.mdx
@@ -188,7 +188,7 @@ The `Trainer` comes with many built-in features that make modern deep learning b
 
 ```py
 training_args = TrainingArguments(
-    "test-trainer", 
+    "test-trainer",
     eval_strategy="epoch",
     fp16=True,  # Enable mixed precision
 )
@@ -198,7 +198,7 @@ training_args = TrainingArguments(
 
 ```py
 training_args = TrainingArguments(
-    "test-trainer", 
+    "test-trainer",
     eval_strategy="epoch",
     per_device_train_batch_size=4,
     gradient_accumulation_steps=4,  # Effective batch size = 4 * 4 = 16
@@ -209,7 +209,7 @@ training_args = TrainingArguments(
 
 ```py
 training_args = TrainingArguments(
-    "test-trainer", 
+    "test-trainer",
     eval_strategy="epoch",
     learning_rate=2e-5,
     lr_scheduler_type="cosine",  # Try different schedulers
diff --git a/chapters/en/chapter3/6.mdx b/chapters/en/chapter3/6.mdx
index a161cf585..ee107eaf8 100644
--- a/chapters/en/chapter3/6.mdx
+++ b/chapters/en/chapter3/6.mdx
@@ -197,7 +197,7 @@ trainer = Trainer(
     data_collator=data_collator,
     processing_class=tokenizer,
     compute_metrics=compute_metrics,
-    callbacks=[EarlyStoppingCallback(early_stopping_patience=3)]
+    callbacks=[EarlyStoppingCallback(early_stopping_patience=3)],
 )
 ```
 
@@ -230,8 +230,8 @@ from transformers import TrainingArguments
 
 training_args = TrainingArguments(
     output_dir="./results",
--    num_train_epochs=5,
-+    num_train_epochs=10,
+    -num_train_epochs=5,
+    +num_train_epochs=10,
 )
 ```
 
@@ -268,10 +268,10 @@ from transformers import TrainingArguments
 
 training_args = TrainingArguments(
     output_dir="./results",
--    learning_rate=1e-5,
-+    learning_rate=1e-4,
--    per_device_train_batch_size=16,
-+    per_device_train_batch_size=32,
+    -learning_rate=1e-5,
+    +learning_rate=1e-4,
+    -per_device_train_batch_size=16,
+    +per_device_train_batch_size=32,
 )
 ```
 

From 31a5ccd2cee75034d0c9b38c947be0d0c80ee434 Mon Sep 17 00:00:00 2001
From: sergiopaniego <sergiopaniegoblanco@gmail.com>
Date: Mon, 16 Jun 2025 11:59:04 +0200
Subject: [PATCH 163/167] Updated toctree removing tf

---
 chapters/en/_toctree.yml | 1 -
 1 file changed, 1 deletion(-)

diff --git a/chapters/en/_toctree.yml b/chapters/en/_toctree.yml
index 186ca8099..1af7ad9d6 100644
--- a/chapters/en/_toctree.yml
+++ b/chapters/en/_toctree.yml
@@ -59,7 +59,6 @@
     title: Processing the data
   - local: chapter3/3
     title: Fine-tuning a model with the Trainer API or Keras
-    local_fw: { pt: chapter3/3, tf: chapter3/3_tf }
   - local: chapter3/4
     title: A full training
   - local: chapter3/5

From 7600bbdb8cb5b0198fa957d922f54226c545dbbc Mon Sep 17 00:00:00 2001
From: sergiopaniego <sergiopaniegoblanco@gmail.com>
Date: Mon, 16 Jun 2025 12:09:13 +0200
Subject: [PATCH 164/167] Change double quotes to single quotes in question
 text

---
 chapters/en/chapter3/2.mdx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/chapters/en/chapter3/2.mdx b/chapters/en/chapter3/2.mdx
index 6de93730d..bc1b00179 100644
--- a/chapters/en/chapter3/2.mdx
+++ b/chapters/en/chapter3/2.mdx
@@ -387,7 +387,7 @@ Test your understanding of data processing concepts:
 	]}
 />
 
-### 4. When loading a dataset with `load_dataset("glue", "mrpc")`, what does the second argument specify?
+### 4. When loading a dataset with `load_dataset('glue', 'mrpc')`, what does the second argument specify?
 
 <Question
 	choices={[

From 4a82db94a1369c9c1eea9dec3da00f2cde8bb865 Mon Sep 17 00:00:00 2001
From: Rahul Konda <rahulmadhukonda@outlook.com>
Date: Mon, 16 Jun 2025 17:16:48 +0530
Subject: [PATCH 165/167] added/te/chapter1/1

---
 chapters/te/_toctree.yml   |   9 +-
 chapters/te/chapter1/1.mdx | 163 +++++++++++++++++++++++++++++++++++++
 2 files changed, 169 insertions(+), 3 deletions(-)
 create mode 100644 chapters/te/chapter1/1.mdx

diff --git a/chapters/te/_toctree.yml b/chapters/te/_toctree.yml
index 4357673bf..dc9644297 100644
--- a/chapters/te/_toctree.yml
+++ b/chapters/te/_toctree.yml
@@ -1,5 +1,8 @@
 - title: 0. అమరిక
   sections:
-  - local: chapter0/1
-    title: పరిచయం
-
+    - local: chapter0/1
+      title: పరిచయం
+- title: 1. ట్రాన్స్‌ఫార్మర్ నమూనాలు
+  sections:
+    - local: chapter1/1
+      title: పరిచయం
diff --git a/chapters/te/chapter1/1.mdx b/chapters/te/chapter1/1.mdx
new file mode 100644
index 000000000..194c13860
--- /dev/null
+++ b/chapters/te/chapter1/1.mdx
@@ -0,0 +1,163 @@
+# పరిచయం[[introduction]]
+
+<CourseFloatingBanner chapter={1} classNames="absolute z-10 right-0 top-0" />
+
+## 🤗 కోర్స్‌కు స్వాగతం![[welcome-to-the-course]]
+
+<Youtube id="00GKzGyWFEs" />
+
+ఈ కోర్సు మీకు Large Language Models (LLMs) మరియు Natural Language Processing (NLP) గురించి [Hugging Face](https://huggingface.co/) ఎకోసిస్టమ్‌లోని లైబ్రరీలను — [🤗 Transformers](https://github.com/huggingface/transformers), [🤗 Datasets](https://github.com/huggingface/datasets), [🤗 Tokenizers](https://github.com/huggingface/tokenizers), and [🤗 Accelerate](https://github.com/huggingface/accelerate) — అలాగే [Hugging Face Hub](https://huggingface.co/models) ఉపయోగించి నేర్పుతుంది..
+
+మేము Hugging Face ఎకోసిస్టమ్ వెలుపల ఉన్న లైబ్రరీలను కూడా కవర్ చేస్తాం. ఇవి AI కమ్యూనిటీకి అద్భుతమైన సహకారాలు మరియు చాలా ఉపయోగకరమైన సాధనాలు.
+
+ఇది పూర్తిగా ఉచితం మరియు ప్రకటనలు లేవు.
+
+## NLP మరియు LLMలను అర్థం చేసుకోవడం[[understanding-nlp-and-llms]]
+
+ఈ కోర్సు మొదట NLP (Natural Language Processing) పై దృష్టి సారించినప్పటికీ, ఇది Large Language Models (LLMs) పై దృష్టి సారించడానికి అభివృద్ధి చెందింది, ఇది ఈ రంగంలో తాజా పురోగతిని సూచిస్తుంది.
+
+**తేడా ఏమిటి?**
+
+- **NLP (Natural Language Processing)** అనేది కంప్యూటర్‌లు మానవ భాషను అర్థం చేసుకోవడానికి, వివరించడానికి మరియు రూపొందించడానికి వీలు కల్పించడంపై దృష్టి సారించిన విస్తృత రంగం. NLP సెంటిమెంట్ అనాలిసిస్, నేమ్డ్ ఎంటిటీ రికగ్నిషన్ మరియు మెషిన్ ట్రాన్స్‌లేషన్ వంటి అనేక పద్ధతులు మరియు పనులను కలిగి ఉంటుంది.
+- **LLMs (Large Language Models)** అనేవి NLP మోడల్‌లలోని ఒక శక్తివంతమైన ఉపసమితి, వాటి భారీ పరిమాణం, విస్తృతమైన శిక్షణ డేటా మరియు కనీస టాస్క్-నిర్దిష్ట శిక్షణతో విస్తృత శ్రేణి భాషా పనులను చేయగల సామర్థ్యం కలిగి ఉంటాయి. Llama, GPT, లేదా Claude సిరీస్ వంటి మోడల్‌లు NLPలో సాధ్యమయ్యే వాటిని విప్లవాత్మకం చేసిన LLMలకు ఉదాహరణలు.
+
+ఈ కోర్సు అంతటా, మీరు సాంప్రదాయ NLP భావనలు మరియు అత్యాధునిక LLM పద్ధతులు రెండింటి గురించి నేర్చుకుంటారు, ఎందుకంటే LLMలతో సమర్థవంతంగా పనిచేయడానికి NLP యొక్క పునాదులను అర్థం చేసుకోవడం చాలా ముఖ్యం.
+
+## ఏమి ఆశించాలి??[[what-to-expect]]
+
+కోర్సు యొక్క సంక్షిప్త అవలోకనం ఇక్కడ ఉంది:
+
+<div class="flex justify-center">
+<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/summary.svg" alt="Brief overview of the chapters of the course.">
+<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/summary-dark.svg" alt="Brief overview of the chapters of the course.">
+</div>
+
+- అధ్యాయాలు 1 నుండి 4 వరకు 🤗 Transformers లైబ్రరీ యొక్క ప్రధాన భావనలకు పరిచయాన్ని అందిస్తాయి. కోర్సులోని ఈ భాగం ముగిసేనాటికి, మీరు Transformer మోడల్‌లు ఎలా పనిచేస్తాయో పరిచయం చేసుకుంటారు మరియు Hugging Face Hub నుండి మోడల్‌ను ఎలా ఉపయోగించాలి, డేటాసెట్‌పై దాన్ని ఫైన్-ట్యూన్ చేయడం మరియు మీ ఫలితాలను Hubలో పంచుకోవడం ఎలాగో తెలుసుకుంటారు!
+- అధ్యాయాలు 5 నుండి 8 వరకు 🤗 Datasets మరియు 🤗 Tokenizers యొక్క ప్రాథమికాంశాలను బోధిస్తాయి, ఆపై క్లాసిక్ NLP పనులు మరియు LLM పద్ధతులలోకి వెళ్తాయి. ఈ భాగం ముగిసేనాటికి, మీరు చాలా సాధారణ భాషా ప్రాసెసింగ్ సవాళ్లను మీరే పరిష్కరించగలరు.
+- అధ్యాయం 9 NLPకి మించి మీ మోడల్‌ల డెమోలను 🤗 Hubలో ఎలా నిర్మించాలో మరియు పంచుకోవాలో కవర్ చేస్తుంది. ఈ భాగం ముగిసేనాటికి, మీరు మీ 🤗 Transformers అప్లికేషన్‌ను ప్రపంచానికి ప్రదర్శించడానికి సిద్ధంగా ఉంటారు!
+- అధ్యాయాలు 10 నుండి 12 వరకు ఫైన్-ట్యూనింగ్, అధిక-నాణ్యత డేటాసెట్‌లను క్యూరేట్ చేయడం మరియు రీజనింగ్ మోడల్‌లను నిర్మించడం వంటి అధునాతన LLM అంశాలలోకి వెళ్తాయి.
+
+ఈ కోర్సు:
+
+- Python పై మంచి జ్ఞానం అవసరం
+- fast.ai యొక్క Practical Deep Learning for Coders లేదా DeepLearning.AI అభివృద్ధి చేసిన ప్రోగ్రామ్‌లలో ఒకటైన పరిచయ డీప్ లెర్నింగ్ కోర్సు తర్వాత తీసుకోవడం మంచిది
+- ముందస్తు PyTorch లేదా TensorFlow జ్ఞానం అవసరం లేదు, అయితే వాటిలో ఏదో ఒకదానితో కొంత పరిచయం సహాయపడుతుంది.
+
+మీరు ఈ కోర్సును పూర్తి చేసిన తర్వాత, మీరు DeepLearning.AI యొక్క Natural Language Processing Specializationను పరిశీలించమని సిఫార్సు చేస్తున్నాము, ఇది naive Bayes మరియు LSTMs వంటి విస్తృత శ్రేణి సాంప్రదాయ NLP మోడల్‌లను కవర్ చేస్తుంది, అవి తెలుసుకోవడం చాలా విలువైనవి!
+
+## మేము ఎవరము?[[who-are-we]]
+
+రచయితల గురించి:
+
+[**Abubakar Abid**](https://huggingface.co/abidlabs) స్టాన్‌ఫోర్డ్‌లో అప్లైడ్ మెషిన్ లెర్నింగ్‌లో పీహెచ్‌డీ పూర్తి చేశారు. తన పీహెచ్‌డీ సమయంలో, అతను Gradio అనే ఓపెన్ సోర్స్ పైథాన్ లైబ్రరీని స్థాపించారు, ఇది 600,000 పైగా మెషిన్ లెర్నింగ్ డెమోలను రూపొందించడానికి ఉపయోగించబడింది. Gradio ను Hugging Face కొనుగోలు చేసింది, అక్కడ ఇప్పుడు Abubakar మెషిన్ లెర్నింగ్ టీమ్ లీడ్‌గా పనిచేస్తున్నారు.
+
+[**Ben Burtenshaw**](https://huggingface.co/burtenshaw) Hugging Face లో మెషిన్ లెర్నింగ్ ఇంజనీర్. అతను ఆంట్‌వెర్ప్ విశ్వవిద్యాలయంలో నాచురల్ లాంగ్వేజ్ ప్రాసెసింగ్‌లో పీహెచ్‌డీ పూర్తి చేశారు, అక్కడ అతను అక్షరాస్యత నైపుణ్యాలను మెరుగుపరచడం కోసం పిల్లల కథలను రూపొందించడానికి Transformer మోడల్స్‌ను ఉపయోగించారు. అప్పటి నుండి, అతను విస్తృత సమాజం కోసం విద్యా సామగ్రి మరియు సాధనాలపై దృష్టి పెట్టారు.
+
+[**Matthew Carrigan**](https://huggingface.co/Rocketknight1) Hugging Face లో మెషిన్ లెర్నింగ్ ఇంజనీర్. అతను ఐర్లాండ్‌లోని డబ్లిన్‌లో నివసిస్తున్నారు మరియు గతంలో Parse.ly లో ML ఇంజనీర్‌గా మరియు అంతకు ముందు ట్రినిటీ కాలేజ్ డబ్లిన్‌లో పోస్ట్-డాక్టోరల్ పరిశోధకుడిగా పనిచేశారు. ప్రస్తుత ఆర్కిటెక్చర్లను స్కేల్ చేయడం ద్వారా మనం AGI ని సాధిస్తామని అతను నమ్మరు, కానీ రోబోట్ అమరత్వంపై ఆయనకు గొప్ప ఆశలు ఉన్నాయి.
+
+[**Lysandre Debut**](https://huggingface.co/lysandre) Hugging Face లో మెషిన్ లెర్నింగ్ ఇంజనీర్ మరియు అతను 🤗 Transformers లైబ్రరీ అభివృద్ధి యొక్క ప్రారంభ దశల నుండి పనిచేస్తున్నారు. అతని లక్ష్యం చాలా సులభమైన API తో సాధనాలను అభివృద్ధి చేయడం ద్వారా NLP ని ప్రతిఒక్కరికీ అందుబాటులోకి తీసుకురావడం.
+
+[**Sylvain Gugger**](https://huggingface.co/sgugger) Hugging Face లో రీసెర్చ్ ఇంజనీర్ మరియు 🤗 Transformers లైబ్రరీ యొక్క ప్రధాన నిర్వహణదారులలో ఒకరు. గతంలో అతను fast.ai లో రీసెర్చ్ సైంటిస్ట్, మరియు అతను జెరెమీ హోవార్డ్‌తో కలిసి Deep Learning for Coders with fastai and PyTorch పుస్తకాన్ని సహ-రచించారు. పరిమిత వనరులతో మోడల్స్ వేగంగా శిక్షణ పొందడానికి వీలు కల్పించే టెక్నిక్‌లను రూపొందించడం మరియు మెరుగుపరచడం ద్వారా డీప్ లెర్నింగ్‌ను మరింత అందుబాటులోకి తీసుకురావడం అతని పరిశోధన యొక్క ముఖ్య ఉద్దేశ్యం.
+
+[**Dawood Khan**](https://huggingface.co/dawoodkhan82) Hugging Face లో మెషిన్ లెర్నింగ్ ఇంజనీర్. అతను NYC కి చెందినవాడు మరియు న్యూయార్క్ యూనివర్సిటీలో కంప్యూటర్ సైన్స్ చదివి పట్టభద్రుడయ్యాడు. కొన్ని సంవత్సరాలు ఐఓఎస్ ఇంజనీర్‌గా పనిచేసిన తరువాత, దావూద్ తన సహ-వ్యవస్థాపకులతో కలిసి Gradio ని ప్రారంభించడానికి ఉద్యోగాన్ని విడిచిపెట్టాడు. చివరికి Gradio ని Hugging Face కొనుగోలు చేసింది.
+
+[**Merve Noyan**](https://huggingface.co/merve) Hugging Face లో డెవలపర్ అడ్వకేట్, ప్రతిఒక్కరికీ మెషిన్ లెర్నింగ్‌ను ప్రజాస్వామ్యీకరించడానికి సాధనాలను అభివృద్ధి చేయడం మరియు వాటి చుట్టూ కంటెంట్‌ను నిర్మించడంపై పనిచేస్తున్నారు.
+
+[**Lucile Saulnier**](https://huggingface.co/SaulLu) Hugging Face లో మెషిన్ లెర్నింగ్ ఇంజనీర్, ఓపెన్ సోర్స్ సాధనాల వాడకాన్ని అభివృద్ధి చేయడం మరియు మద్దతు ఇవ్వడం. ఆమె సహకార శిక్షణ మరియు BigScience వంటి నాచురల్ లాంగ్వేజ్ ప్రాసెసింగ్ రంగంలో అనేక పరిశోధన ప్రాజెక్టులలో చురుకుగా పాల్గొంటున్నారు.
+
+[**Lewis Tunstall**](https://huggingface.co/lewtun) Hugging Face లో మెషిన్ లెర్నింగ్ ఇంజనీర్, ఓపెన్-సోర్స్ సాధనాలను అభివృద్ధి చేయడం మరియు వాటిని విస్తృత സമൂഹానికి అందుబాటులోకి తీసుకురావడంపై దృష్టి పెట్టారు. అతను ఓ'రైల్లీ వారి [Natural Language Processing with Transformers](https://www.oreilly.com/library/view/natural-language-processing/9781098136789/)పుస్తక సహ-రచయిత కూడా.
+
+[**Leandro von Werra**](https://huggingface.co/lvwerra) Hugging Face లోని ఓపెన్-సోర్స్ బృందంలో మెషిన్ లెర్నింగ్ ఇంజనీర్ మరియు ఓ'రైల్లీ వారి [Natural Language Processing with Transformers](https://www.oreilly.com/library/view/natural-language-processing/9781098136789/) పుస్తక సహ-రచయిత కూడా. అతను మొత్తం మెషిన్ లెర్నింగ్ స్టాక్‌లో పనిచేయడం ద్వారా NLP ప్రాజెక్టులను ఉత్పత్తికి తీసుకురావడంలో చాలా సంవత్సరాల పరిశ్రమ అనుభవాన్ని కలిగి ఉన్నాడు.
+
+## తరచుగా అడిగే ప్రశ్నలు (FAQ)[[faq]]
+
+తరచుగా అడిగే ప్రశ్నలకు ఇక్కడ కొన్ని సమాధానాలు ఉన్నాయి:
+
+- **ఈ కోర్సు పూర్తి చేయడం ద్వారా సర్టిఫికేషన్ లభిస్తుందా?**
+  ప్రస్తుతానికి ఈ కోర్సుకు ఎలాంటి సర్టిఫికేషన్ లేదు. అయితే, మేము Hugging Face ఎకోసిస్టమ్ కోసం ఒక సర్టిఫికేషన్ కార్యక్రమంపై పనిచేస్తున్నాము -- వేచి ఉండండి!
+
+- **ఈ కోర్సుపై నేను ఎంత సమయం కేటాయించాలి?**
+  ఈ కోర్సులోని ప్రతి అధ్యాయం వారానికి సుమారు 6-8 గంటల పనితో, 1 వారంలో పూర్తి చేసేలా రూపొందించబడింది. అయితే, కోర్సును పూర్తి చేయడానికి మీకు అవసరమైనంత సమయం తీసుకోవచ్చు.
+
+- **నాకు ఏదైనా ప్రశ్న ఉంటే, ఎక్కడ అడగాలి?**
+  కోర్సులోని ఏదైనా విభాగానికి సంబంధించి మీకు ప్రశ్న ఉంటే, పేజీ పైభాగంలో ఉన్న "Ask a question" (ప్రశ్న అడగండి) బ్యానర్‌పై క్లిక్ చేయండి, అప్పుడు మీరు [Hugging Face forums](https://discuss.huggingface.co/) లోని సరైన విభాగానికి ఆటోమేటిక్‌గా మళ్ళించబడతారు:
+
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/forum-button.png" alt="Link to the Hugging Face forums" width="75%">
+
+కోర్సు పూర్తి చేసిన తర్వాత మీరు మరింత ప్రాక్టీస్ చేయాలనుకుంటే, ఫోరమ్‌లలో [ప్రాజెక్ట్ ఐడియాల](https://discuss.huggingface.co/c/course/course-event/25) జాబితా కూడా అందుబాటులో ఉందని గమనించండి.
+
+- **ఈ కోర్సు కోసం కోడ్‌ను ఎలా పొందాలి?**
+  ప్రతి విభాగం కోసం, Google Colab లేదా Amazon SageMaker Studio Lab లో కోడ్‌ను రన్ చేయడానికి పేజీ పైభాగంలో ఉన్న బ్యానర్‌పై క్లిక్ చేయండి:
+
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/notebook-buttons.png" alt="Link to the Hugging Face course notebooks" width="75%">
+
+కోర్సులోని మొత్తం కోడ్‌ను కలిగి ఉన్న Jupyter నోట్‌బుక్‌లు [`huggingface/notebooks`](https://github.com/huggingface/notebooks) రిపోలో హోస్ట్ చేయబడ్డాయి. మీరు వాటిని స్థానికంగా (locally) రూపొందించాలనుకుంటే, GitHub లోని [`course`](https://github.com/huggingface/course#-jupyter-notebooks) రిపోలోని సూచనలను చూడండి.
+
+- **How can I contribute to the course?**
+  There are many ways to contribute to the course! If you find a typo or a bug, please open an issue on the [`course`](https://github.com/huggingface/course) repo. If you would like to help translate the course into your native language, check out the instructions [here](https://github.com/huggingface/course#translating-the-course-into-your-language).
+
+- **నేను కోర్సుకు ఎలా సహకరించగలను?**
+  కోర్సుకు సహకరించడానికి చాలా మార్గాలు ఉన్నాయి! మీరు ఏదైనా అక్షర దోషం (typo) లేదా బగ్ కనుగొంటే, దయచేసి [`course`](https://github.com/huggingface/course) రిపోలో ఒక ఇష్యూను ఓపెన్ చేయండి. మీరు కోర్సును మీ మాతృభాషలోకి అనువదించడానికి సహాయం చేయాలనుకుంటే, [ఇక్కడ](https://github.com/huggingface/course#translating-the-course-into-your-language) సూచనలను చూడండి.
+
+**ప్రతి అనువాదం కోసం తీసుకున్న నిర్ణయాలు ఏమిటి?**
+ప్రతి అనువాదం కోసం, మేము అనువాదంలో తీసుకున్న నిర్ణయాలను వివరించే ఒక `TRANSLATING.txt` ఫైల్‌ను కలిగి ఉన్నాము. ఈ ఫైల్‌లో మేము యంత్ర అభ్యాసం పదజాలం మరియు ఇతర సాంకేతిక పదజాలం కోసం చేసిన ఎంపికలను వివరించాము. ఉదాహరణకు, జర్మన్ కోసం [ఇక్కడ](https://github.com/huggingface/course/blob/main/chapters/de/TRANSLATING.txt) చూడండి.
+
+- **నేను ఈ కోర్సును తిరిగి ఉపయోగించుకోవచ్చా?**
+  తప్పకుండా! ఈ కోర్సు అనుమతి గల Apache 2 license క్రింద విడుదల చేయబడింది. దీని అర్థం మీరు తగిన క్రెడిట్ ఇవ్వాలి, లైసెన్సుకు లింక్ అందించాలి, మరియు ఏవైనా మార్పులు చేసినట్లయితే సూచించాలి. మీరు దీనిని ఏ సహేతుకమైన పద్ధతిలోనైనా చేయవచ్చు, కానీ లైసెన్సర్ మిమ్మల్ని లేదా మీ వినియోగాన్ని ఆమోదించినట్లు సూచించే ఏ విధంగానూ చేయకూడదు. మీరు కోర్సును ఉదహరించాలనుకుంటే, దయచేసి ఈ క్రింది BibTeX ను ఉపయోగించండి:
+
+```
+@misc{huggingfacecourse,
+  author = {Hugging Face},
+  title = {The Hugging Face Course, 2022},
+  howpublished = "\url{https://huggingface.co/course}",
+  year = {2022},
+  note = "[Online; accessed <today>]"
+}
+```
+
+## భాషలు మరియు అనువాదాలు[[languages-and-translations]]
+
+మా అద్భుతమైన కమ్యూనిటీకి ధన్యవాదాలు, ఈ కోర్సు ఇంగ్లీష్‌తో పాటు అనేక ఇతర భాషలలో కూడా అందుబాటులో ఉంది 🔥! ఏయే భాషలు అందుబాటులో ఉన్నాయో మరియు అనువాదాలకు ఎవరు సహకరించారో చూడటానికి దిగువ పట్టికను చూడండి:
+
+| భాష                                                                                      | రచయితలు                                                                                                                                                                                                                    |
+| :--------------------------------------------------------------------------------------- | :------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- |
+| [French](https://huggingface.co/course/fr/chapter1/1)                                    | [@lbourdois](https://github.com/lbourdois), [@ChainYo](https://github.com/ChainYo), [@melaniedrevet](https://github.com/melaniedrevet), [@abdouaziz](https://github.com/abdouaziz)                                         |
+| [Vietnamese](https://huggingface.co/course/vi/chapter1/1)                                | [@honghanhh](https://github.com/honghanhh)                                                                                                                                                                                 |
+| [Chinese (simplified)](https://huggingface.co/course/zh-CN/chapter1/1)                   | [@zhlhyx](https://github.com/zhlhyx), [petrichor1122](https://github.com/petrichor1122), [@yaoqih](https://github.com/yaoqih)                                                                                              |
+| [Bengali](https://huggingface.co/course/bn/chapter1/1) (పని జరుగుతోంది)                  | [@avishek-018](https://github.com/avishek-018), [@eNipu](https://github.com/eNipu)                                                                                                                                         |
+| [German](https://huggingface.co/course/de/chapter1/1) (పని జరుగుతోంది)                   | [@JesperDramsch](https://github.com/JesperDramsch), [@MarcusFra](https://github.com/MarcusFra), [@fabridamicelli](https://github.com/fabridamicelli)                                                                       |
+| [Spanish](https://huggingface.co/course/es/chapter1/1) (పని జరుగుతోంది)                  | [@camartinezbu](https://github.com/camartinezbu), [@munozariasjm](https://github.com/munozariasjm), [@fordaz](https://github.com/fordaz)                                                                                   |
+| [Persian](https://huggingface.co/course/fa/chapter1/1) (పని జరుగుతోంది)                  | [@jowharshamshiri](https://github.com/jowharshamshiri), [@schoobani](https://github.com/schoobani)                                                                                                                         |
+| [Gujarati](https://huggingface.co/course/gu/chapter1/1) (పని జరుగుతోంది)                 | [@pandyaved98](https://github.com/pandyaved98)                                                                                                                                                                             |
+| [Hebrew](https://huggingface.co/course/he/chapter1/1) (పని జరుగుతోంది)                   | [@omer-dor](https://github.com/omer-dor)                                                                                                                                                                                   |
+| [Hindi](https://huggingface.co/course/hi/chapter1/1) (పని జరుగుతోంది)                    | [@pandyaved98](https://github.com/pandyaved98)                                                                                                                                                                             |
+| [Bahasa Indonesia](https://huggingface.co/course/id/chapter1/1) (పని జరుగుతోంది)         | [@gstdl](https://github.com/gstdl)                                                                                                                                                                                         |
+| [Italian](https://huggingface.co/course/it/chapter1/1) (పని జరుగుతోంది)                  | [@CaterinaBi](https://github.com/CaterinaBi), [@ClonedOne](https://github.com/ClonedOne), [@Nolanogenn](https://github.com/Nolanogenn), [@EdAbati](https://github.com/EdAbati), [@gdacciaro](https://github.com/gdacciaro) |
+| [Japanese](https://huggingface.co/course/ja/chapter1/1) (పని జరుగుతోంది)                 | [@hiromu166](https://github.com/@hiromu166), [@younesbelkada](https://github.com/@younesbelkada), [@HiromuHota](https://github.com/@HiromuHota)                                                                            |
+| [Korean](https://huggingface.co/course/ko/chapter1/1) (పని జరుగుతోంది)                   | [@Doohae](https://github.com/Doohae), [@wonhyeongseo](https://github.com/wonhyeongseo), [@dlfrnaos19](https://github.com/dlfrnaos19)                                                                                       |
+| [Portuguese](https://huggingface.co/course/pt/chapter1/1) (పని జరుగుతోంది)               | [@johnnv1](https://github.com/johnnv1), [@victorescosta](https://github.com/victorescosta), [@LincolnVS](https://github.com/LincolnVS)                                                                                     |
+| [Russian](https://huggingface.co/course/ru/chapter1/1) (పని జరుగుతోంది)                  | [@pdumin](https://github.com/pdumin), [@svv73](https://github.com/svv73)                                                                                                                                                   |
+| [Thai](https://huggingface.co/course/th/chapter1/1) (పని జరుగుతోంది)                     | [@peeraponw](https://github.com/peeraponw), [@a-krirk](https://github.com/a-krirk), [@jomariya23156](https://github.com/jomariya23156), [@ckingkan](https://github.com/ckingkan)                                           |
+| [Turkish](https://huggingface.co/course/tr/chapter1/1) (పని జరుగుతోంది)                  | [@tanersekmen](https://github.com/tanersekmen), [@mertbozkir](https://github.com/mertbozkir), [@ftarlaci](https://github.com/ftarlaci), [@akkasayaz](https://github.com/akkasayaz)                                         |
+| [Chinese (traditional)](https://huggingface.co/course/zh-TW/chapter1/1) (పని జరుగుతోంది) | [@davidpeng86](https://github.com/davidpeng86)                                                                                                                                                                             |
+
+కొన్ని భాషల కోసం, [కోర్సు YouTube వీడియోలలో] (https://youtube.com/playlist?list=PLo2EIpI_JMQvWfQndUesu0nPBAtZ9gP1o) ఆ భాషలో సబ్-టైటిల్స్ ఉన్నాయి. వీడియో యొక్క కుడి దిగువ మూలలో ఉన్న CC బటన్‌పై ముందుగా క్లిక్ చేయడం ద్వారా మీరు వాటిని ప్రారంభించవచ్చు. ఆ తర్వాత, సెట్టింగ్స్ ఐకాన్ ⚙️ క్రింద, Subtitles/CC ఎంపికను ఎంచుకోవడం ద్వారా మీకు కావలసిన భాషను ఎంచుకోవచ్చు.
+
+<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/subtitles.png" alt="Activating subtitles for the Hugging Face course YouTube videos" width="75%">
+
+<Tip>
+  పైన పట్టికలో మీ భాష కనిపించలేదా లేదా మీరు ఇప్పటికే ఉన్న అనువాదానికి
+  సహకరించాలనుకుంటున్నారా? ఇక్కడ ఉన్న సూచనలను{" "}
+  <a href="https://github.com/huggingface/course#translating-the-course-into-your-language">
+    ఇక్కడ
+  </a>
+  అనుసరించడం ద్వారా మీరు కోర్సును అనువదించడానికి మాకు సహాయం చేయవచ్చు.
+</Tip>
+
+## ప్రారంభిద్దాం 🚀
+
+మీరు సిద్ధంగా ఉన్నారా? ఈ అధ్యాయంలో, మీరు నేర్చుకుంటారు:
+
+- టెక్స్ట్ జనరేషన్ మరియు వర్గీకరణ వంటి NLP పనులను పరిష్కరించడానికి `pipeline()` ఫంక్షన్‌ను ఎలా ఉపయోగించాలో.
+- Transformer నిర్మాణం గురించి.
+- ఎన్‌కోడర్, డీకోడర్, మరియు ఎన్‌కోడర్-డీకోడర్ ఆర్కిటెక్చర్ల మధ్య తేడాను మరియు వాటి వినియోగ సందర్భాలను ఎలా గుర్తించాలో.

From f9fb808ac4e113225634f536d197d6869ff29d01 Mon Sep 17 00:00:00 2001
From: Rahul Konda <rahulmadhukonda@outlook.com>
Date: Mon, 16 Jun 2025 20:28:00 +0530
Subject: [PATCH 166/167] Update 1.mdx

 I've removed the original English text, which I had forgotten to delete.
---
 chapters/te/chapter1/1.mdx | 3 ---
 1 file changed, 3 deletions(-)

diff --git a/chapters/te/chapter1/1.mdx b/chapters/te/chapter1/1.mdx
index 194c13860..c62a72c30 100644
--- a/chapters/te/chapter1/1.mdx
+++ b/chapters/te/chapter1/1.mdx
@@ -93,9 +93,6 @@
 
 కోర్సులోని మొత్తం కోడ్‌ను కలిగి ఉన్న Jupyter నోట్‌బుక్‌లు [`huggingface/notebooks`](https://github.com/huggingface/notebooks) రిపోలో హోస్ట్ చేయబడ్డాయి. మీరు వాటిని స్థానికంగా (locally) రూపొందించాలనుకుంటే, GitHub లోని [`course`](https://github.com/huggingface/course#-jupyter-notebooks) రిపోలోని సూచనలను చూడండి.
 
-- **How can I contribute to the course?**
-  There are many ways to contribute to the course! If you find a typo or a bug, please open an issue on the [`course`](https://github.com/huggingface/course) repo. If you would like to help translate the course into your native language, check out the instructions [here](https://github.com/huggingface/course#translating-the-course-into-your-language).
-
 - **నేను కోర్సుకు ఎలా సహకరించగలను?**
   కోర్సుకు సహకరించడానికి చాలా మార్గాలు ఉన్నాయి! మీరు ఏదైనా అక్షర దోషం (typo) లేదా బగ్ కనుగొంటే, దయచేసి [`course`](https://github.com/huggingface/course) రిపోలో ఒక ఇష్యూను ఓపెన్ చేయండి. మీరు కోర్సును మీ మాతృభాషలోకి అనువదించడానికి సహాయం చేయాలనుకుంటే, [ఇక్కడ](https://github.com/huggingface/course#translating-the-course-into-your-language) సూచనలను చూడండి.
 

From c02318e6e317992c2a4386646b2eb07deac6bc33 Mon Sep 17 00:00:00 2001
From: burtenshaw <ben.burtenshaw@gmail.com>
Date: Tue, 17 Jun 2025 12:51:47 +0200
Subject: [PATCH 167/167] Apply suggestions from code review

Co-authored-by: Sergio Paniego Blanco <sergiopaniegoblanco@gmail.com>
---
 chapters/en/_toctree.yml   |  6 +++---
 chapters/en/chapter3/1.mdx |  2 +-
 chapters/en/chapter3/3.mdx | 26 +++++++++++++-------------
 chapters/en/chapter3/7.mdx | 26 +++++++++++++-------------
 4 files changed, 30 insertions(+), 30 deletions(-)

diff --git a/chapters/en/_toctree.yml b/chapters/en/_toctree.yml
index 1af7ad9d6..a230a1e58 100644
--- a/chapters/en/_toctree.yml
+++ b/chapters/en/_toctree.yml
@@ -58,13 +58,13 @@
   - local: chapter3/2
     title: Processing the data
   - local: chapter3/3
-    title: Fine-tuning a model with the Trainer API or Keras
+    title: Fine-tuning a model with the Trainer API
   - local: chapter3/4
-    title: A full training
+    title: A full training loop
   - local: chapter3/5
     title: Fine-tuning, Check!
   - local: chapter3/6
-    title: Learning Curves
+    title: Understanding Learning Curves
   - local: chapter3/7
     title: End-of-chapter quiz
     quiz: 3
diff --git a/chapters/en/chapter3/1.mdx b/chapters/en/chapter3/1.mdx
index 34e68bb36..743b13c6c 100644
--- a/chapters/en/chapter3/1.mdx
+++ b/chapters/en/chapter3/1.mdx
@@ -38,4 +38,4 @@ By the end of this chapter, you'll be able to fine-tune models on your own datas
 
 This chapter focuses exclusively on **PyTorch**, as it has become the standard framework for modern deep learning research and production. We'll use the latest APIs and best practices from the Hugging Face ecosystem.
 
-To upload your trained models to the Hugging Face Hub, you will need a huggingface.co account: [create an account](https://huggingface.co/join)
\ No newline at end of file
+To upload your trained models to the Hugging Face Hub, you will need a Hugging Face account: [create an account](https://huggingface.co/join)
\ No newline at end of file
diff --git a/chapters/en/chapter3/3.mdx b/chapters/en/chapter3/3.mdx
index 3c8162476..12705fca7 100644
--- a/chapters/en/chapter3/3.mdx
+++ b/chapters/en/chapter3/3.mdx
@@ -15,7 +15,7 @@
 
 <Tip>
 
-📚 **Training Resources**: Before diving into training, familiarize yourself with the comprehensive [🤗 Transformers training guide](https://huggingface.co/docs/transformers/main/en/training) and explore practical examples in the [fine-tuning cookbook](https://huggingface.co/learn/cookbook/en/fine_tuning_code_llm).
+📚 **Training Resources**: Before diving into training, familiarize yourself with the comprehensive [🤗 Transformers training guide](https://huggingface.co/docs/transformers/main/en/training) and explore practical examples in the [fine-tuning cookbook](https://huggingface.co/learn/cookbook/en/fine_tuning_code_llm_on_single_gpu).
 
 </Tip>
 
@@ -52,7 +52,7 @@ If you want to automatically upload your model to the Hub during training, pass
 
 <Tip>
 
-🚀 **Advanced Configuration**: For detailed information on all available training arguments and optimization strategies, check out the [TrainingArguments documentation](https://huggingface.co/docs/transformers/main/en/main_classes/trainer#transformers.TrainingArguments) and the [training configuration cookbook](https://huggingface.co/learn/cookbook/en/training_tricks#training-arguments).
+🚀 **Advanced Configuration**: For detailed information on all available training arguments and optimization strategies, check out the [TrainingArguments documentation](https://huggingface.co/docs/transformers/main/en/main_classes/trainer#transformers.TrainingArguments) and the [training configuration cookbook](https://huggingface.co/learn/cookbook/en/fine_tuning_code_llm_on_single_gpu).
 
 </Tip>
 
@@ -85,7 +85,7 @@ When you pass a tokenizer as the `processing_class`, the default `data_collator`
 
 <Tip>
 
-📖 **Learn More**: For comprehensive details on the Trainer class and its parameters, visit the [Trainer API documentation](https://huggingface.co/docs/transformers/main/en/main_classes/trainer) and explore advanced usage patterns in the [training cookbook recipes](https://huggingface.co/learn/cookbook/en/fine_tuning_code_llm#setting-up-the-trainer).
+📖 **Learn More**: For comprehensive details on the Trainer class and its parameters, visit the [Trainer API documentation](https://huggingface.co/docs/transformers/main/en/main_classes/trainer) and explore advanced usage patterns in the [training cookbook recipes](https://huggingface.co/learn/cookbook/en/fine_tuning_code_llm_on_single_gpu).
 
 </Tip>
 
@@ -236,7 +236,7 @@ This concludes the introduction to fine-tuning using the `Trainer` API. An examp
 
 Test your understanding of the Trainer API and fine-tuning concepts:
 
-### 1. What is the purpose of the `processing_class` parameter in the Trainer?
+### 1. What is the purpose of the <code>processing_class</code> parameter in the Trainer?
 
 <Question
 	choices={[
@@ -246,7 +246,7 @@ Test your understanding of the Trainer API and fine-tuning concepts:
 		},
 		{
 			text: "It tells the Trainer which tokenizer to use for processing data.",
-			explain: "Correct! The processing_class parameter is a modern addition that helps the Trainer know which tokenizer to use.",
+			explain: "The processing_class parameter is a modern addition that helps the Trainer know which tokenizer to use.",
             correct: true
 		},
 		{
@@ -270,7 +270,7 @@ Test your understanding of the Trainer API and fine-tuning concepts:
 		},
 		{
 			text: "eval_strategy",
-			explain: "Correct! eval_strategy can be set to 'epoch', 'steps', or 'no' to control evaluation timing.",
+			explain: "eval_strategy can be set to 'epoch', 'steps', or 'no' to control evaluation timing.",
             correct: true
 		},
 		{
@@ -284,7 +284,7 @@ Test your understanding of the Trainer API and fine-tuning concepts:
 	]}
 />
 
-### 3. What does `fp16=True` in TrainingArguments enable?
+### 3. What does <code>fp16=True</code> in TrainingArguments enable?
 
 <Question
 	choices={[
@@ -294,7 +294,7 @@ Test your understanding of the Trainer API and fine-tuning concepts:
 		},
 		{
 			text: "Mixed precision training with 16-bit floating-point numbers for faster training and reduced memory usage.",
-			explain: "Correct! Mixed precision training uses 16-bit floats for forward pass and 32-bit for gradients, improving speed and reducing memory usage.",
+			explain: "Mixed precision training uses 16-bit floats for forward pass and 32-bit for gradients, improving speed and reducing memory usage.",
             correct: true
 		},
 		{
@@ -308,7 +308,7 @@ Test your understanding of the Trainer API and fine-tuning concepts:
 	]}
 />
 
-### 4. What is the role of the `compute_metrics` function in the Trainer?
+### 4. What is the role of the <code>compute_metrics</code> function in the Trainer?
 
 <Question
 	choices={[
@@ -318,7 +318,7 @@ Test your understanding of the Trainer API and fine-tuning concepts:
 		},
 		{
 			text: "It converts logits to predictions and calculates evaluation metrics like accuracy and F1.",
-			explain: "Correct! compute_metrics takes predictions and labels, then returns metrics for evaluation.",
+			explain: "compute_metrics takes predictions and labels, then returns metrics for evaluation.",
             correct: true
 		},
 		{
@@ -332,7 +332,7 @@ Test your understanding of the Trainer API and fine-tuning concepts:
 	]}
 />
 
-### 5. What happens when you don't provide an `eval_dataset` to the Trainer?
+### 5. What happens when you don't provide an <code>eval_dataset</code> to the Trainer?
 
 <Question
 	choices={[
@@ -346,7 +346,7 @@ Test your understanding of the Trainer API and fine-tuning concepts:
 		},
 		{
 			text: "You won't get evaluation metrics during training, but training will still work.",
-			explain: "Correct! Evaluation is optional - you can train without it, but you won't see validation metrics.",
+			explain: "Evaluation is optional - you can train without it, but you won't see validation metrics.",
             correct: true
 		},
         {
@@ -366,7 +366,7 @@ Test your understanding of the Trainer API and fine-tuning concepts:
 		},
 		{
 			text: "It accumulates gradients over multiple batches before updating, enabled with gradient_accumulation_steps.",
-			explain: "Correct! This allows you to simulate larger batch sizes by accumulating gradients over multiple forward passes.",
+			explain: "This allows you to simulate larger batch sizes by accumulating gradients over multiple forward passes.",
             correct: true
 		},
 		{
diff --git a/chapters/en/chapter3/7.mdx b/chapters/en/chapter3/7.mdx
index f2e2d7633..f6bbaaba1 100644
--- a/chapters/en/chapter3/7.mdx
+++ b/chapters/en/chapter3/7.mdx
@@ -9,7 +9,7 @@
 
 Test what you learned in this chapter!
 
-### 1. The `emotion` dataset contains Twitter messages labeled with emotions. Search for it in the [Hub](https://huggingface.co/datasets), and read the dataset card. Which of these is not one of its basic emotions?
+### 1. The <code>emotion</code> dataset contains Twitter messages labeled with emotions. Search for it in the [Hub](https://huggingface.co/datasets), and read the dataset card. Which of these is not one of its basic emotions?
 
 <Question
 	choices={[
@@ -23,7 +23,7 @@ Test what you learned in this chapter!
 		},
 		{
 			text: "Confusion",
-			explain: "Correct! Confusion is not one of the six basic emotions.",
+			explain: "Confusion is not one of the six basic emotions.",
             correct: true
 		},
         {
@@ -33,7 +33,7 @@ Test what you learned in this chapter!
 	]}
 />
 
-### 2. Search for the `ar_sarcasm` dataset in the [Hub](https://huggingface.co/datasets). Which task does it support?
+### 2. Search for the <code>ar_sarcasm</code> dataset in the [Hub](https://huggingface.co/datasets). Which task does it support?
 
 <Question
 	choices={[
@@ -81,7 +81,7 @@ Test what you learned in this chapter!
 	]}
 />
 
-### 4. What are the benefits of the `Dataset.map()` method?
+### 4. What are the benefits of the <code>Dataset.map()</code> method?
 
 <Question
 	choices={[
@@ -133,7 +133,7 @@ Test what you learned in this chapter!
 		},
 		{
 			text: "It puts together all the samples in a batch.",
-			explain: "Correct! You can pass the collate function as an argument of a <code>DataLoader</code>. We used the <code>DataCollatorWithPadding</code> function, which pads all items in a batch so they have the same length.",
+			explain: "You can pass the collate function as an argument of a <code>DataLoader</code>. We used the <code>DataCollatorWithPadding</code> function, which pads all items in a batch so they have the same length.",
             correct: true
 		},
 		{
@@ -147,7 +147,7 @@ Test what you learned in this chapter!
 	]}
 />
 
-### 7. What happens when you instantiate one of the `AutoModelForXxx` classes with a pretrained language model (such as `bert-base-uncased`) that corresponds to a different task than the one for which it was trained?
+### 7. What happens when you instantiate one of the <code>AutoModelForXxx</code> classes with a pretrained language model (such as <code>bert-base-uncased</code>) that corresponds to a different task than the one for which it was trained?
 
 <Question
 	choices={[
@@ -157,7 +157,7 @@ Test what you learned in this chapter!
 		},
 		{
 			text: "The head of the pretrained model is discarded and a new head suitable for the task is inserted instead.",
-			explain: "Correct. For example, when we used <code>AutoModelForSequenceClassification</code> with <code>bert-base-uncased</code>, we got warnings when instantiating the model. The pretrained head is not used for the sequence classification task, so it's discarded and a new head is instantiated with random weights.",
+			explain: "For example, when we used <code>AutoModelForSequenceClassification</code> with <code>bert-base-uncased</code>, we got warnings when instantiating the model. The pretrained head is not used for the sequence classification task, so it's discarded and a new head is instantiated with random weights.",
             correct: true
 		},
 		{
@@ -171,13 +171,13 @@ Test what you learned in this chapter!
 	]}
 />
 
-### 8. What's the purpose of `TrainingArguments`?
+### 8. What's the purpose of <code>TrainingArguments</code>?
 
 <Question
 	choices={[
 		{
 			text: "It contains all the hyperparameters used for training and evaluation with the <code>Trainer</code>.",
-			explain: "Correct!",
+			explain: "Nice one!",
             correct: true
 		},
 		{
@@ -209,7 +209,7 @@ Test what you learned in this chapter!
 		},
 		{
 			text: "It makes our training loops work on distributed strategies.",
-			explain: "Correct! With 🤗 Accelerate, your training loops will work for multiple GPUs and TPUs.",
+			explain: "With 🤗 Accelerate, your training loops will work for multiple GPUs and TPUs.",
             correct: true
 		},
         {
@@ -219,13 +219,13 @@ Test what you learned in this chapter!
 	]}
 />
 
-### 10. What is the purpose of the `processing_class` parameter in the Trainer?
+### 10. What is the purpose of the <code>processing_class</code> parameter in the Trainer?
 
 <Question
 	choices={[
 		{
 			text: "It tells the Trainer which tokenizer to use for processing the data.",
-			explain: "Correct! The processing_class parameter is a modern addition that helps the Trainer know how to process your data.",
+			explain: "The processing_class parameter is a modern addition that helps the Trainer know how to process your data.",
             correct: true
 		},
 		{
@@ -249,7 +249,7 @@ Test what you learned in this chapter!
 	choices={[
 		{
 			text: "Mixed precision training with fp16=True.",
-			explain: "Correct! Mixed precision training reduces memory usage and can speed up training.",
+			explain: "Mixed precision training reduces memory usage and can speed up training.",
             correct: true
 		},
 		{

	patient_id	drugName	condition	review	rating	date	usefulCount	review_length
0	95260	Guanfacine	adhd	"My son is halfway through his fourth week of Intuniv..."	8.0	April 27, 2010	192	141
1	92703	Lybrel	birth control	"I used to take another oral contraceptive, which had 21 pill cycle, and was very happy- very light periods, max 5 days, no other side effects..."	5.0	December 14, 2009	17	134
2	138000	Ortho Evra	birth control	"This is my first time using any form of birth control..."	8.0	November 3, 2015	10	89
	condition	frequency
0	birth control	27655
1	depression	8023
2	acne	5209
3	anxiety	4991
4	pain	4744
	html_url	title	comments	body
0	https://github.com/huggingface/datasets/issues/2787	ConnectionError: Couldn't reach https://raw.githubusercontent.com	the bug code locate in ：\r\n if data_args.task_name is not None...	Hello,\r\nI am trying to run run_glue.py and it gives me this error...
1	https://github.com/huggingface/datasets/issues/2787	ConnectionError: Couldn't reach https://raw.githubusercontent.com	Hi @jinec,\r\n\r\nFrom time to time we get this kind of `ConnectionError` coming from the github.com website: https://raw.githubusercontent.com...	Hello,\r\nI am trying to run run_glue.py and it gives me this error...
2	https://github.com/huggingface/datasets/issues/2787	ConnectionError: Couldn't reach https://raw.githubusercontent.com	cannot connect，even by Web browser，please check that there is some problems。	Hello,\r\nI am trying to run run_glue.py and it gives me this error...
3	https://github.com/huggingface/datasets/issues/2787	ConnectionError: Couldn't reach https://raw.githubusercontent.com	I can access https://raw.githubusercontent.com/huggingface/datasets/1.7.0/datasets/glue/glue.py without problem...	Hello,\r\nI am trying to run run_glue.py and it gives me this error...