[BUZZOK-25993] Sync run_agent.py with latest changes (#1467)

mjnitz02 · svc-harness-git2 · web-flow · commit ae022058323b · 2025-05-28T17:41:56.000+01:00
* Synchronize run_agent with datarobot-user-models

* Bump drum

* Reconcile dependencies, updated IDs, tags

---------

Co-authored-by: svc-harness-git2 &lt;svc-harness-git2@datarobot.com&gt;
diff --git a/public_dropin_environments/python311_genai_agents/env_info.json b/public_dropin_environments/python311_genai_agents/env_info.json
@@ -4,7 +4,7 @@
   "description": "This template environment can be used to create GenAI-powered agents using CrewAI, LangGraph, or Llama-Index. Similar to other drop-in environments, you can either include a .pth artifact or any other code needed to deserialize your model, and optionally a custom.py file. You can also use this environment in codespaces.",
   "programmingLanguage": "python",
   "label": "",
-  "environmentVersionId": "6830d3140012af0f96ebdc53",
+  "environmentVersionId": "683733219604e901ac1a7541",
   "environmentVersionDescription": "",
   "isPublic": true,
   "useCases": [
@@ -13,8 +13,8 @@
   ],
   "imageRepository": "env-python-genai-agents",
   "tags": [
-    "v11.1.0-6830d3140012af0f96ebdc53",
-    "6830d3140012af0f96ebdc53",
+    "v11.1.0-683733219604e901ac1a7541",
+    "683733219604e901ac1a7541",
     "v11.1.0-latest"
   ]
 }
diff --git a/public_dropin_environments/python311_genai_agents/ipython_config.py b/public_dropin_environments/python311_genai_agents/ipython_config.py
@@ -12,6 +12,6 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 
-# This need to load extensions automaticaly when kernel starting
+# This need to load extensions automatically when kernel starting
 
 c.InteractiveShellApp.extensions = ["dataframe_formatter"]
diff --git a/public_dropin_environments/python311_genai_agents/requirements.in b/public_dropin_environments/python311_genai_agents/requirements.in
@@ -4,14 +4,15 @@ ecs-logging
 jupyter-client
 jupyter_kernel_gateway
 jupyter_core
-ipykernel
+ipykernel<6.29.0
 pandas
 numpy
 mistune
-datarobot-drum @ git+https://github.com/datarobot/datarobot-user-models#egg=datarobot-drum&subdirectory=custom_model_runner
+datarobot-drum>=1.16.14
 datarobot
 numpy
 uwsgi
+flask>=3.1.1
 
 # Generative AI Frameworks
 crewai
diff --git a/public_dropin_environments/python311_genai_agents/requirements.txt b/public_dropin_environments/python311_genai_agents/requirements.txt
@@ -50,7 +50,7 @@ crewai-tools==0.44.0
 cryptography==44.0.3
 dataclasses-json==0.6.7
 datarobot==3.7.1
-datarobot-drum @ git+https://github.com/datarobot/datarobot-user-models#subdirectory=custom_model_runner
+datarobot-drum==1.16.14
 datarobot-mlops==11.0.0
 datarobot-storage==2.2.0
 datasets==3.6.0
@@ -109,7 +109,7 @@ importlib-metadata==8.6.1
 importlib-resources==6.5.2
 inflection==0.5.1
 instructor==1.8.1
-ipykernel==6.29.5
+ipykernel==6.28.0
 ipython==8.36.0
 isodate==0.7.2
 isoduration==20.11.0
@@ -326,7 +326,7 @@ tinycss2==1.4.0
 tokenizers==0.20.3
 tomli==2.2.1
 tomli-w==1.2.0
-tornado==6.5.1
+tornado==6.5
 tqdm==4.67.1
 traceloop-sdk==0.40.3
 trafaret==2.1.1
diff --git a/public_dropin_environments/python311_genai_agents/run_agent.py b/public_dropin_environments/python311_genai_agents/run_agent.py
@@ -17,64 +17,92 @@
 import logging
 import os
 import sys
-from typing import cast
+from pathlib import Path
+from typing import Any
+from urllib.parse import urlparse, urlunparse
 
 import requests
 from datarobot_drum.drum.enum import TargetType
 from datarobot_drum.drum.root_predictors.drum_server_utils import DrumServerRun
 from openai import OpenAI
 from openai.types.chat import ChatCompletion
-
-root = logging.getLogger()
-
-parser = argparse.ArgumentParser()
-parser.add_argument(
-    "--chat_completion",
-    type=str,
-    default="{}",
-    help="OpenAI ChatCompletion dict as json string",
-)
-parser.add_argument(
-    "--default_headers",
-    type=str,
-    default="{}",
-    help="OpenAI default_headers as json string",
-)
-parser.add_argument(
-    "--custom_model_dir",
-    type=str,
-    default="",
-    help="directory containing custom.py location",
+from openai.types.chat.completion_create_params import (
+    CompletionCreateParamsBase,
 )
-parser.add_argument("--output_path", type=str, default="", help="json output file location")
-args = parser.parse_args()
+from pydantic import TypeAdapter
 
+root = logging.getLogger()
 
-def setup_logging(logger: logging.Logger, output_path: str, log_level: int = logging.INFO) -> None:
-    if len(output_path) == 0:
-        output_path = "output.log"
-    else:
-        output_path = f"{output_path}.log"
-
+CURRENT_DIR = Path(__file__).parent
+DEFAULT_OUTPUT_LOG_PATH = CURRENT_DIR / "output.log"
+DEFAULT_OUTPUT_JSON_PATH = CURRENT_DIR / "output.json"
+
+
+def argparse_args() -> argparse.Namespace:
+    parser = argparse.ArgumentParser()
+    parser.add_argument(
+        "--chat_completion",
+        type=str,
+        required=True,
+        help="OpenAI ChatCompletion dict as json string",
+    )
+    parser.add_argument(
+        "--default_headers",
+        type=str,
+        default="{}",
+        help="OpenAI default_headers as json string",
+    )
+    parser.add_argument(
+        "--custom_model_dir",
+        type=str,
+        required=True,
+        help="directory containing custom.py location",
+    )
+    parser.add_argument("--output_path", type=str, default=None, help="json output file location")
+    parser.add_argument("--otlp_entity_id", type=str, default=None, help="Entity ID for tracing")
+    args = parser.parse_args()
+    return args
+
+
+def setup_logging(logger: logging.Logger, log_level: int = logging.INFO) -> None:
     logger.setLevel(log_level)
     handler_stream = logging.StreamHandler(sys.stdout)
     handler_stream.setLevel(log_level)
-    formatter = logging.Formatter("%(message)s")
+    formatter = logging.Formatter("%(asctime)s - %(levelname)s - %(message)s")
     handler_stream.setFormatter(formatter)
 
-    if os.path.exists(output_path):
-        os.remove(output_path)
-    handler_file = logging.FileHandler(output_path)
-    handler_file.setLevel(log_level)
-    formatter_file = logging.Formatter("%(asctime)s - %(levelname)s - %(message)s")
-    handler_file.setFormatter(formatter_file)
-
     logger.addHandler(handler_stream)
-    logger.addHandler(handler_file)
+
+
+def setup_otlp_env_variables(entity_id: str | None = None) -> None:
+    # do not override if already set
+    if os.environ.get("OTEL_EXPORTER_OTLP_ENDPOINT") or os.environ.get(
+        "OTEL_EXPORTER_OTLP_HEADERS"
+    ):
+        root.info("OTEL_EXPORTER_OTLP_ENDPOINT or OTEL_EXPORTER_OTLP_HEADERS already set, skipping")
+        return
+
+    datarobot_endpoint = os.environ.get("DATAROBOT_ENDPOINT")
+    datarobot_api_token = os.environ.get("DATAROBOT_API_TOKEN")
+    if not datarobot_endpoint or not datarobot_api_token:
+        root.warning("DATAROBOT_ENDPOINT or DATAROBOT_API_TOKEN not set, tracing is disabled")
+        return
+
+    parsed_url = urlparse(datarobot_endpoint)
+    stripped_url = (parsed_url.scheme, parsed_url.netloc, "otel", "", "", "")
+    otlp_endpoint = urlunparse(stripped_url)
+    otlp_headers = f"X-DataRobot-Api-Key={datarobot_api_token}"
+    if entity_id:
+        otlp_headers += f",X-DataRobot-Entity-Id={entity_id}"
+    os.environ["OTEL_EXPORTER_OTLP_ENDPOINT"] = otlp_endpoint
+    os.environ["OTEL_EXPORTER_OTLP_HEADERS"] = otlp_headers
+    root.info(f"Using OTEL_EXPORTER_OTLP_ENDPOINT: {otlp_endpoint}")
 
 
 def execute_drum(
-    chat_completion: str, default_headers: str, custom_model_dir: str, output_path: str
+    chat_completion: CompletionCreateParamsBase,
+    default_headers: dict[str, str],
+    custom_model_dir: Path,
 ) -> ChatCompletion:
     root.info("Executing agent as [chat] endpoint. DRUM Executor.")
     root.info("Starting DRUM server.")
@@ -97,44 +125,95 @@ def execute_drum(
             root.error("Server failed to start")
             try:
                 root.error(response.text)
-                root.error(response.json())
             finally:
                 raise RuntimeError("Server failed to start")
 
-        root.info("Parsing OpenAI request")
-        completion_params = json.loads(chat_completion)
-        header_params = json.loads(default_headers)
-
         # Use a standard OpenAI client to call the DRUM server. This mirrors the behavior of a deployed agent.
         # Using the `chat.completions.create` method ensures the parameters are OpenAI compatible.
         root.info("Executing Agent")
         client = OpenAI(
             base_url=drum_runner.url_server_address,
             api_key="not-required",
-            default_headers=header_params,
+            default_headers=default_headers,
             max_retries=0,
         )
-        completion = client.chat.completions.create(**completion_params)
-
+        completion = client.chat.completions.create(**chat_completion)
     # Continue outside the context manager to ensure the server is stopped and logs
     # are flushed before we write the output
-    root.info(f"Storing result: {output_path}")
-    if len(output_path) == 0:
-        output_path = os.path.join(custom_model_dir, "output.json")
-    with open(output_path, "w") as fp:
-        fp.write(completion.to_json())
+    return completion
 
-    root.info(completion.to_json())
-    return cast(ChatCompletion, completion)
 
+def construct_prompt(chat_completion: str) -> CompletionCreateParamsBase:
+    chat_completion_dict = json.loads(chat_completion)
+    if "model" not in chat_completion_dict:
+        chat_completion_dict["model"] = "unknown"
+    validator = TypeAdapter(CompletionCreateParamsBase)
+    validator.validate_python(chat_completion_dict)
+    completion_create_params: CompletionCreateParamsBase = CompletionCreateParamsBase(
+        **chat_completion_dict  # type: ignore[typeddict-item]
+    )
+    return completion_create_params
 
-# Agent execution
-if len(args.custom_model_dir) == 0:
-    args.custom_model_dir = os.path.join(os.getcwd(), "custom_model")
-setup_logging(logger=root, output_path=args.output_path, log_level=logging.INFO)
-result = execute_drum(
-    chat_completion=args.chat_completion,
-    default_headers=args.default_headers,
-    custom_model_dir=args.custom_model_dir,
-    output_path=args.output_path,
-)
+
+def store_result(result: ChatCompletion, output_path: Path) -> None:
+    root.info(f"Storing result: {output_path}")
+    with open(output_path, "w") as fp:
+        fp.write(result.to_json())
+
+
+def main() -> Any:
+    with open(DEFAULT_OUTPUT_LOG_PATH, "w") as f:
+        sys.stdout = f
+        sys.stderr = f
+        print("Parsing args")
+        args = argparse_args()
+
+    output_log_path = (
+        Path(args.output_path + ".log") if args.output_path else DEFAULT_OUTPUT_LOG_PATH
+    )
+    with open(output_log_path, "a") as f:
+        sys.stdout = f
+        sys.stderr = f
+
+        try:
+            print("Setting up logging")
+            setup_logging(logger=root, log_level=logging.INFO)
+            root.info("Parsing args")
+
+            # Parse input to fail early if it's not valid
+            chat_completion = construct_prompt(args.chat_completion)
+            default_headers = json.loads(args.default_headers)
+            root.info(f"Chat completion: {chat_completion}")
+            root.info(f"Default headers: {default_headers}")
+
+            # Setup tracing
+            print("Setting up tracing")
+            setup_otlp_env_variables(args.otlp_entity_id)
+
+            root.info(f"Executing request in directory {args.custom_model_dir}")
+            result = execute_drum(
+                chat_completion=chat_completion,
+                default_headers=default_headers,
+                custom_model_dir=args.custom_model_dir,
+            )
+            root.info(f"Result: {result}")
+            store_result(
+                result,
+                Path(args.output_path) if args.output_path else DEFAULT_OUTPUT_JSON_PATH,
+            )
+        except Exception as e:
+            root.exception(f"Error executing agent: {e}")
+
+
+if __name__ == "__main__":
+    stdout = sys.stdout
+    stderr = sys.stderr
+    try:
+        main()
+    except Exception:
+        pass
+    finally:
+        # Return to original stdout and stderr otherwise the kernel will fail to flush and
+        # hang
+        sys.stdout = stdout
+        sys.stderr = stderr