From 5408dcb1853bb4b88e4bc603201c4897bb29391b Mon Sep 17 00:00:00 2001
From: Paul Gauthier <aider@paulg.org>
Date: Wed, 11 Sep 2024 09:32:14 -0700
Subject: [PATCH] wip

---
 benchmark/benchmark.py | 8 +++++---
 1 file changed, 5 insertions(+), 3 deletions(-)

diff --git a/benchmark/benchmark.py b/benchmark/benchmark.py
index 5fe542925..dbe5835a3 100755
--- a/benchmark/benchmark.py
+++ b/benchmark/benchmark.py
@@ -549,15 +549,17 @@ def run_test_real(
         chat_history_file=history_fname,
     )
 
-    ask_model = models.Model("gpt-4o")
-    # ask_model = models.Model("openrouter/anthropic/claude-3.5-sonnet")
+    # ask_model = models.Model("gpt-4o")
+    ask_model = models.Model("openrouter/anthropic/claude-3.5-sonnet")
     # ask_model = models.Model("openrouter/deepseek/deepseek-coder")
 
     # whole_model = models.Model("gpt-4o")
     # whole_model = models.Model("openrouter/anthropic/claude-3.5-sonnet")
     # whole_model = models.Model("openrouter/deepseek/deepseek-coder")
     # whole_model = models.Model("openrouter/anthropic/claude-3-haiku-20240307")
-    whole_model = models.Model("gpt-4o-mini")
+    # whole_model = models.Model("gpt-4o-mini")
+    # whole_model = models.Model("openrouter/meta-llama/llama-3.1-8b-instruct")
+    whole_model = models.Model("openrouter/meta-llama/llama-3-70b-instruct")
 
     main_model = ask_model
     edit_format = "ask-whole"