continued-pretraining

Star

Here are 5 public repositories matching this topic...

cisnlp / LangSAMP

Star

LangSAMP: Language-Script Aware Multilingual Pretraining

multilingual language-embeddings continued-pretraining

Updated Sep 30, 2024
Python

lpalbou / ForgeLLM

Star

A comprehensive toolkit for end-to-end continued pre-training, fine-tuning, monitoring, testing and publishing of language models with MLX-LM

machine-learning apple language-model mlx fine-tuning model-monitoring pretraining llm llm-training continued-pretraining mlx-lm

Updated Jul 20, 2025
Python

MilyaushaShamsutdinova / MedAdapt-LLM

Star

Adapting LLM to the medical domain through SFT, RAG, and multistep fine-tuning to enhance domain knowledge and performance.

nlp medicine fine-tuning rag sft llm continued-pretraining

Updated May 12, 2025
Jupyter Notebook

mlynatom / master-thesis

Star

Master's thesis repository

czech llm instruction-tuning continued-pretraining llm-adaptation vocabulary-adaptation

Updated May 18, 2025
Jupyter Notebook

MilosKosRadGit / ClozeTaskEvaluation

Star

This project evaluates Llama 3.2 3B continued pre-training for Serbian language, using a custom-made cloze-style benchmark. It supports grammatical, lexical, semantic, idiomatic, and factual sentence completion tasks. The evaluation script calculates model accuracy based on log-likelihood scoring over masked token choices.

benchmark evaluation natural-language-generation serbian-language cloze-tests generative-ai llama3-2 continued-pretraining

Updated Jun 19, 2025
Python

Improve this page

Add a description, image, and links to the continued-pretraining topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the continued-pretraining topic, visit your repo's landing page and select "manage topics."

Learn more

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

continued-pretraining

Here are 5 public repositories matching this topic...

cisnlp / LangSAMP

lpalbou / ForgeLLM

MilyaushaShamsutdinova / MedAdapt-LLM

mlynatom / master-thesis

MilosKosRadGit / ClozeTaskEvaluation

Improve this page

Add this topic to your repo