Prompt Token Count

Tokenize a prompt and/or get the number of tokens a prompt will take

Install

go get github.com/ableinc/prompt-token-count

Usage

package main

import (
	"fmt"
	"log"

	"github.com/ableinc/prompt-token-count/cmd/tokenizer"
)

func encodingForModel(model string) (*tokenizer.Encoding, error) {
	switch model {
	case "gpt-4", "gpt-4-turbo", "gpt-3.5-turbo", "text-embedding-ada-002":
		return tokenizer.GetEncoding("cl100k_base")
	case "gpt-4o", "gpt-4o-mini":
		return tokenizer.GetEncoding("o200k_base")
	case "text-davinci-002", "text-davinci-003", "code-davinci-002", "text-davinci-edit-001":
		return tokenizer.GetEncoding("p50k_base")
	case "code-cushman-001", "davinci", "curie", "babbage", "ada":
		return tokenizer.GetEncoding("r50k_base")
	case "text-ada-001", "text-babbage-001", "text-curie-001", "text-davinci-001", "code-davinci-001":
		return tokenizer.GetEncoding("gpt2")
	default:
		return nil, fmt.Errorf("unknown model: %s", model)
	}
}

func main() {
	model, err := encodingForModel("gpt-4")
	if err != nil {
		log.Fatalf("incorrect model provided: %v", err)
	}
	prompt := tokenizer.TokenString("Give me Golang code to create a binary tree.")
	fmt.Println("Number of tokens (raw text): ", prompt.CountTokens())
	tokens := model.Encode(prompt)
	fmt.Println("NUmber of tokens (encodings): ", tokens.CountTokens())
	fmt.Println("Encoding: ", tokens)
	prompt = model.Decode(tokens)
	fmt.Println("Decoding: ", prompt)
}

Input/Output Cost?

If you need to know the cost for a prompt (input) and the output (completion) use this library: prompt-complete-cost

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
cmd/tokenizer		cmd/tokenizer
internal		internal
.gitignore		.gitignore
README.md		README.md
go.mod		go.mod
main.go		main.go
story.txt		story.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Prompt Token Count

Install

Usage

Input/Output Cost?

About

Uh oh!

Releases 3

Packages

Uh oh!

Languages

ableinc/prompt-token-count

Folders and files

Latest commit

History

Repository files navigation

Prompt Token Count

Install

Usage

Input/Output Cost?

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases 3

Packages 0

Uh oh!

Languages

Packages