Data Leakage Detection in LLMs

A framework for detecting data leakage and bias in LLMs (e.g., Llama-2, Mistral) using n-gram metrics and one-shot prompting. BLEURT and ROUGE-L models are used to evaluate similarity between reference and model outputs for guided and general prompts. The framework analyzes model behavior on MMLU and TruthfulQA benchmarks to identify training data memorization and gender stereotyping patterns.

Name		Name	Last commit message	Last commit date
Latest commit History 36 Commits
Seen Question (Guided+General)		Seen Question (Guided+General)
Seen Question, Seen Question + Answer		Seen Question, Seen Question + Answer
Seen Relevant Bias		Seen Relevant Bias
Seen Similar Question + Answer		Seen Similar Question + Answer
Seen Similar Question		Seen Similar Question
.DS_Store		.DS_Store
Final_Presentation.pdf		Final_Presentation.pdf
Final_Presentation.pptx		Final_Presentation.pptx
Final_Report.pdf		Final_Report.pdf
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Data Leakage Detection in LLMs

About

Uh oh!

Releases

Packages

Contributors 5

Uh oh!

Languages

Saketh1702/Data-Leakage-Detection-in-LLMs

Folders and files

Latest commit

History

Repository files navigation

Data Leakage Detection in LLMs

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 5

Uh oh!

Languages

Packages