@@ -79,47 +79,6 @@ extern "C" {
79
79
LLAMA_VOCAB_TYPE_RWKV = 5 , // RWKV tokenizer based on greedy tokenization
80
80
};
81
81
82
- // pre-tokenization types
83
- enum llama_vocab_pre_type {
84
- LLAMA_VOCAB_PRE_TYPE_DEFAULT = 0 ,
85
- LLAMA_VOCAB_PRE_TYPE_LLAMA3 = 1 ,
86
- LLAMA_VOCAB_PRE_TYPE_DEEPSEEK_LLM = 2 ,
87
- LLAMA_VOCAB_PRE_TYPE_DEEPSEEK_CODER = 3 ,
88
- LLAMA_VOCAB_PRE_TYPE_FALCON = 4 ,
89
- LLAMA_VOCAB_PRE_TYPE_MPT = 5 ,
90
- LLAMA_VOCAB_PRE_TYPE_STARCODER = 6 ,
91
- LLAMA_VOCAB_PRE_TYPE_GPT2 = 7 ,
92
- LLAMA_VOCAB_PRE_TYPE_REFACT = 8 ,
93
- LLAMA_VOCAB_PRE_TYPE_COMMAND_R = 9 ,
94
- LLAMA_VOCAB_PRE_TYPE_STABLELM2 = 10 ,
95
- LLAMA_VOCAB_PRE_TYPE_QWEN2 = 11 ,
96
- LLAMA_VOCAB_PRE_TYPE_OLMO = 12 ,
97
- LLAMA_VOCAB_PRE_TYPE_DBRX = 13 ,
98
- LLAMA_VOCAB_PRE_TYPE_SMAUG = 14 ,
99
- LLAMA_VOCAB_PRE_TYPE_PORO = 15 ,
100
- LLAMA_VOCAB_PRE_TYPE_CHATGLM3 = 16 ,
101
- LLAMA_VOCAB_PRE_TYPE_CHATGLM4 = 17 ,
102
- LLAMA_VOCAB_PRE_TYPE_VIKING = 18 ,
103
- LLAMA_VOCAB_PRE_TYPE_JAIS = 19 ,
104
- LLAMA_VOCAB_PRE_TYPE_TEKKEN = 20 ,
105
- LLAMA_VOCAB_PRE_TYPE_SMOLLM = 21 ,
106
- LLAMA_VOCAB_PRE_TYPE_CODESHELL = 22 ,
107
- LLAMA_VOCAB_PRE_TYPE_BLOOM = 23 ,
108
- LLAMA_VOCAB_PRE_TYPE_GPT3_FINNISH = 24 ,
109
- LLAMA_VOCAB_PRE_TYPE_EXAONE = 25 ,
110
- LLAMA_VOCAB_PRE_TYPE_CHAMELEON = 26 ,
111
- LLAMA_VOCAB_PRE_TYPE_MINERVA = 27 ,
112
- LLAMA_VOCAB_PRE_TYPE_DEEPSEEK3_LLM = 28 ,
113
- LLAMA_VOCAB_PRE_TYPE_GPT4O = 29 ,
114
- LLAMA_VOCAB_PRE_TYPE_SUPERBPE = 30 ,
115
- LLAMA_VOCAB_PRE_TYPE_TRILLION = 31 ,
116
- LLAMA_VOCAB_PRE_TYPE_BAILINGMOE = 32 ,
117
- LLAMA_VOCAB_PRE_TYPE_LLAMA4 = 33 ,
118
- LLAMA_VOCAB_PRE_TYPE_PIXTRAL = 34 ,
119
- LLAMA_VOCAB_PRE_TYPE_SEED_CODER = 35 ,
120
- LLAMA_VOCAB_PRE_TYPE_HUNYUAN = 36 ,
121
- };
122
-
123
82
enum llama_rope_type {
124
83
LLAMA_ROPE_TYPE_NONE = -1 ,
125
84
LLAMA_ROPE_TYPE_NORM = 0 ,
0 commit comments