Agenta-AI · mmabrouk · Feb 7, 2024 · Feb 7, 2024 · Feb 7, 2024 · Feb 7, 2024
diff --git a/agenta-backend/agenta_backend/tasks/evaluations.py b/agenta-backend/agenta_backend/tasks/evaluations.py
@@ -338,8 +338,13 @@ async def aggregate_evaluator_results(
                 )
 
             else:
-                # Handle boolean values for auto_regex_test and other evaluators
-                if all(isinstance(result.value, bool) for result in results):
+                if evaluator_key == "auto_regex_test" and all(
+                    isinstance(result.value, bool) for result in results
+                ):
+                    average_value = sum(result.value for result in results) / len(
+                        results
+                    )
+                elif evaluator_key not in ["auto_ai_critique", "auto_regex_test"]:
                     average_value = sum(result.value for result in results) / len(
                         results
                     )