fix: improve error handling for Ollama JSON parsing errors (#87)

claude · JimStenstrom · commit 388cc8949506 · 2025-11-27T22:15:59.000-06:00
Enhances error handling and configurability for issue #87 where Ollama returns malformed JSON causing RetryError failures. Changes: - Add specific detection and helpful error messages for Ollama unmarshal errors - Provide actionable troubleshooting steps (restart Ollama, re-pull model, etc.) - Add configurable maxRetries option to AIProviderConfig - Pass maxRetries to AI SDK generateText and streamText calls - Default maxRetries to 2 (same as AI SDK default) This helps users understand that the issue is with their Ollama server, not nanocoder, and gives them clear steps to resolve it.
diff --git a/source/ai-sdk-client.ts b/source/ai-sdk-client.ts
@@ -24,6 +24,24 @@ function parseAPIError(error: unknown): string {
 
 	const errorMessage = error.message;
 
+	// Handle Ollama-specific unmarshal/JSON parsing errors
+	if (
+		errorMessage.includes('unmarshal') ||
+		(errorMessage.includes('invalid character') &&
+			errorMessage.includes('after top-level value'))
+	) {
+		return (
+			'Ollama server error: The model returned malformed JSON. ' +
+			'This usually indicates an issue with the Ollama server or model. ' +
+			'Try:\n' +
+			'  1. Restart Ollama: systemctl restart ollama (Linux) or restart the Ollama app\n' +
+			'  2. Re-pull the model: ollama pull <model-name>\n' +
+			'  3. Check Ollama logs for more details\n' +
+			'  4. Try a different model to see if the issue is model-specific\n' +
+			`Original error: ${errorMessage}`
+		);
+	}
+
 	// Extract status code and clean message from common error patterns
 	const statusMatch = errorMessage.match(
 		/(?:Error: )?(\d{3})\s+(?:\d{3}\s+)?(?:Bad Request|[^:]+):\s*(.+)/i,
@@ -138,12 +156,15 @@ export class AISDKClient implements LLMClient {
 	private providerConfig: AIProviderConfig;
 	private undiciAgent: Agent;
 	private cachedContextSize: number;
+	private maxRetries: number;
 
 	constructor(providerConfig: AIProviderConfig) {
 		this.providerConfig = providerConfig;
 		this.availableModels = providerConfig.models;
 		this.currentModel = providerConfig.models[0] || '';
 		this.cachedContextSize = 0;
+		// Default to 2 retries (same as AI SDK default), or use configured value
+		this.maxRetries = providerConfig.maxRetries ?? 2;
 
 		const {requestTimeout, socketTimeout, connectionPool} = this.providerConfig;
 		const resolvedSocketTimeout =
@@ -263,6 +284,7 @@ export class AISDKClient implements LLMClient {
 				messages: modelMessages,
 				tools: aiTools,
 				abortSignal: signal,
+				maxRetries: this.maxRetries,
 			});
 
 			// Extract tool calls from result
@@ -384,6 +406,7 @@ export class AISDKClient implements LLMClient {
 				messages: modelMessages,
 				tools: aiTools,
 				abortSignal: signal,
+				maxRetries: this.maxRetries,
 			});
 
 			// Stream tokens
diff --git a/source/types/config.ts b/source/types/config.ts
@@ -7,6 +7,7 @@ export interface AIProviderConfig {
 	models: string[];
 	requestTimeout?: number;
 	socketTimeout?: number;
+	maxRetries?: number; // Maximum number of retries for failed requests (default: 2)
 	connectionPool?: {
 		idleTimeout?: number;
 		cumulativeMaxIdleTimeout?: number;
@@ -26,6 +27,7 @@ export interface ProviderConfig {
 	models: string[];
 	requestTimeout?: number;
 	socketTimeout?: number;
+	maxRetries?: number; // Maximum number of retries for failed requests (default: 2)
 	organizationId?: string;
 	timeout?: number;
 	connectionPool?: {
@@ -44,6 +46,7 @@ export interface AppConfig {
 		models: string[];
 		requestTimeout?: number;
 		socketTimeout?: number;
+		maxRetries?: number; // Maximum number of retries for failed requests (default: 2)
 		connectionPool?: {
 			idleTimeout?: number;
 			cumulativeMaxIdleTimeout?: number;