aider/aider/models/openai.py

import re

import tiktoken

from .model import Model

known_tokens = {
    "gpt-3.5-turbo": 4,
    "gpt-4": 8,
    "gpt-4-1106-preview": 128,
    "gpt-3.5-turbo-1106": 16,
}


class OpenAIModel(Model):
    def __init__(self, name):
        self.name = name

        tokens = None

        match = re.search(r"-([0-9]+)k", name)
        if match:
            tokens = int(match.group(1))
        else:
            for m, t in known_tokens.items():
                if name.startswith(m):
                    tokens = t

        if tokens is None:
            raise ValueError(f"Unknown context window size for model: {name}")

        self.max_context_tokens = tokens * 1024
        self.tokenizer = tiktoken.encoding_for_model(name)

        if self.is_gpt4():
            if name == "gpt-4-1106-preview":
                self.edit_format = "udiff"
            else:
                self.edit_format = "diff"

            self.use_repo_map = True
            self.send_undo_reply = True

            if tokens == 8:
                self.prompt_price = 0.03
                self.completion_price = 0.06
                self.max_chat_history_tokens = 1024
            elif tokens == 32:
                self.prompt_price = 0.06
                self.completion_price = 0.12
                self.max_chat_history_tokens = 2 * 1024
            elif tokens == 128:
                self.prompt_price = 0.01
                self.completion_price = 0.03
                self.max_chat_history_tokens = 2 * 1024

            return

        if self.is_gpt35():
            self.edit_format = "whole"
            self.always_available = True
            self.send_undo_reply = False

            if self.name == "gpt-3.5-turbo-1106":
                self.prompt_price = 0.001
                self.completion_price = 0.002
                self.max_chat_history_tokens = 2 * 1024
            elif tokens == 4:
                self.prompt_price = 0.0015
                self.completion_price = 0.002
                self.max_chat_history_tokens = 1024
            elif tokens == 16:
                self.prompt_price = 0.003
                self.completion_price = 0.004
                self.max_chat_history_tokens = 2 * 1024

            return

        raise ValueError(f"Unsupported model: {name}")

    def is_gpt4(self):
        return self.name.startswith("gpt-4")

    def is_gpt35(self):
        return self.name.startswith("gpt-3.5-turbo")