[ACL'25 Main] Stepwise Reasoning Disruption Attack of LLMs

Code implementation of ACL paper "Stepwise Reasoning Disruption Attack of LLMs"

Usage

1. Question Modification (`QuestionModification.py`)

This component modifies original questions while preserving their semantic meaning.

python QuestionModification.py \
    --llm_name <model_name> \
    --dataset <dataset_name> \
    --few_shot <True/False> \

2. Solution Generation (`GetSolutionofQuestionModified.py`)

Generates CoT solutions for modified questions.

python GetSolutionofQuestionModified.py \
    --llm_name <model_name> \
    --dataset <dataset_name> \
    --few_shot <True/False> \

3. SEED-P Attack (`SEEDpAttack.py`)

Performs the SEED-P attack by introducing prior reasoning steps of the modified question.

python SEEDpAttack.py \
    --llm_name <model_name> \
    --dataset <dataset_name> \
    --ratio <float> \
    --few_shot <True/False> \

4. Evaluation (`Evaluation.py`)

Evaluation the Accuracy and Attack Success Rate.

Step1: Run baseline (no attack) for comparison:

python SEEDpAttack.py \
    --llm_name <model_name> \
    --dataset <dataset_name> \
    --ratio 0.0 \
    --few_shot <True/False> \

Step 2: Compute ASR and Accuracy:

python Evaluation.py 
    --llm_name <model_name> \
    --dataset <dataset_name> \
    --ratio <float> \
    --few_shot <True/False> \

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
assets		assets
.gitignore		.gitignore
Evaluation.py		Evaluation.py
EvaluationUtils.py		EvaluationUtils.py
FewShotPrompt.py		FewShotPrompt.py
GetSolutionofQuestionModified.py		GetSolutionofQuestionModified.py
QuestionModification.py		QuestionModification.py
README.md		README.md
SEEDpAttack.py		SEEDpAttack.py
api.py		api.py
data.zip		data.zip
dataset.py		dataset.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

[ACL'25 Main] Stepwise Reasoning Disruption Attack of LLMs

Usage

1. Question Modification (`QuestionModification.py`)

2. Solution Generation (`GetSolutionofQuestionModified.py`)

3. SEED-P Attack (`SEEDpAttack.py`)

4. Evaluation (`Evaluation.py`)

About

Uh oh!

Releases

Packages

Uh oh!

Languages

Applied-Machine-Learning-Lab/SEED-Attack

Folders and files

Latest commit

History

Repository files navigation

[ACL'25 Main] Stepwise Reasoning Disruption Attack of LLMs

Usage

1. Question Modification (QuestionModification.py)

2. Solution Generation (GetSolutionofQuestionModified.py)

3. SEED-P Attack (SEEDpAttack.py)

4. Evaluation (Evaluation.py)

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

1. Question Modification (`QuestionModification.py`)

2. Solution Generation (`GetSolutionofQuestionModified.py`)

3. SEED-P Attack (`SEEDpAttack.py`)

4. Evaluation (`Evaluation.py`)

Packages