Refactor response generation (#200)

XInTheDark · web-flow · commit ed83fb771fee · 2025-03-26T23:55:24.000+08:00
All core functionality of response generation has been moved to `response.js`. One new change, in particular, is the `generateResponse` function which combines all 3 types of providers into a single AsyncGenerator. This makes the code much more maintainable. Performance wise, there should be no significant impact, but this needs to be observed for some time. As a result of this patch, #193 is also fixed. fixes #193
diff --git a/src/aiChat.jsx b/src/aiChat.jsx
@@ -325,7 +325,8 @@ export default function Chat({ launchContext }) {
     const devMode = Preferences["devMode"];
 
     if (!info.stream) {
-      response = await getChatResponse(currentChatData, query);
+      // Use getChatResponseSync for non-streaming providers to get the complete string directly
+      response = await getChatResponseSync(currentChatData, query);
       setCurrentChatMessage(currentChatData, setCurrentChatData, messageID, { response: response });
 
       elapsed = (Date.now() - start) / 1000;
diff --git a/src/api/gpt.jsx b/src/api/gpt.jsx
@@ -16,6 +16,7 @@ import {
 import { useEffect, useState } from "react";
 
 import * as providers from "./providers.js";
+import { generateResponse, generateResponseSync, generateChatResponse, generateChatResponseSync } from "./response.js";
 
 import throttle, { AIChatDelayFunction } from "#root/src/helpers/throttle.js";
 
@@ -24,10 +25,9 @@ import { PasteAction } from "../components/actions/pasteAction.jsx";
 import { autoCheckForUpdates } from "../helpers/update.jsx";
 
 import { init } from "../api/init.js";
-import { Message, pairs_to_messages } from "../classes/message.js";
+import { Message } from "../classes/message.js";
 import { Preferences } from "./preferences.js";
 
-import { truncate_chat } from "../helpers/helper.js";
 import { plainTextMarkdown } from "../helpers/markdown.js";
 import { getFormattedWebResult, systemResponse, web_search_mode, webSystemPrompt } from "./tools/web";
 
@@ -200,7 +200,7 @@ export default (
       let start = Date.now();
 
       if (!info.stream) {
-        response = await chatCompletion(info, messages, options);
+        response = await generateResponseSync(info, messages, options);
         setMarkdown(response);
 
         elapsed = (Date.now() - start) / 1000;
@@ -223,7 +223,7 @@ export default (
 
         const handler = throttle(_handler, { delay: 30, delayFunction: AIChatDelayFunction() });
 
-        await chatCompletion(info, messages, options, handler, get_status);
+        await processStream(generateResponse(info, messages, options, get_status), info.provider, handler);
 
         handler.flush();
       }
@@ -497,66 +497,21 @@ export default (
   );
 };
 
-// Generate response using a chat context (array of Messages, NOT MessagePairs - conversion should be done before this)
-// and options. This is the core function of the extension.
-//
-// if stream_update is passed, we will call it with stream_update(new_message) every time a chunk is received
-// otherwise, this function returns an async generator (if stream = true) or a string (if stream = false)
-// if status is passed, we will stop generating when status() is true
-//
-// also note that the chat parameter is an array of Message objects, and how it is handled is up to the provider modules.
-// for most providers it is first converted into JSON format before being used.
-export const chatCompletion = async (info, chat, options, stream_update = null, status = null) => {
-  const provider = info.provider; // provider object
-  // additional options
-  options = providers.get_options_from_info(info, options);
-
-  let response = await providers.generate(provider, chat, options, { stream_update });
-
-  // stream = false
-  if (typeof response === "string") {
-    // will not be a string if stream is enabled
-    return response;
-  }
-
-  // streaming related handling
-  if (provider.customStream) return; // handled in the provider
-  if (stream_update) {
-    await processStream(response, provider, stream_update, status);
-    return;
-  }
-  return response;
-};
-
 // generate response. input: currentChat is a chat object from AI Chat; query (string) is optional
 // see the documentation of chatCompletion for details on the other parameters
 export const getChatResponse = async (currentChat, query = null, stream_update = null, status = null) => {
-  // load provider and model
-  const info = providers.get_provider_info(currentChat.provider);
-  // additional options
-  let options = providers.get_options_from_info(info, currentChat.options);
-
-  // format chat
-  let chat = pairs_to_messages(currentChat.messages, query);
-  chat = truncate_chat(chat, info);
+  if (!stream_update) {
+    // If no stream_update is provided, return the async generator
+    return generateChatResponse(currentChat, query, {}, status);
+  }
 
-  // generate response
-  return await chatCompletion(info, chat, options, stream_update, status);
+  // If stream_update is provided, process the stream
+  await processStream(generateChatResponse(currentChat, query, {}, status), null, stream_update, status);
 };
 
 // generate response using a chat context and a query, while forcing stream = false
 export const getChatResponseSync = async (currentChat, query = null) => {
-  let r = await getChatResponse(currentChat, query);
-  if (typeof r === "string") {
-    return r;
-  }
-
-  const info = providers.get_provider_info(currentChat.provider);
-  let response = "";
-  for await (const chunk of processChunks(r, info.provider)) {
-    response = chunk;
-  }
-  return response;
+  return await generateChatResponseSync(currentChat, query);
 };
 
 // yield chunks incrementally from a response.
diff --git a/src/api/response.js b/src/api/response.js
@@ -0,0 +1,175 @@
+import * as providers from "./providers.js";
+import { pairs_to_messages } from "#root/src/classes/message.js";
+import { truncate_chat } from "#root/src/helpers/helper.js";
+
+/**
+ * Generate a response from a provider.
+ * Returns an async generator that yields each chunk of the response.
+ *
+ * @param {Object} info - Provider info object (contains provider, model, etc.)
+ * @param {Array} chat - Array of messages
+ * @param {Object} options - Additional options
+ * @param {Function} status - Optional function that returns true when generation should stop
+ * @returns {AsyncGenerator} - Async generator that yields chunks of the response
+ */
+export const generateResponse = async function* (info, chat, options = {}, status = null) {
+  const provider = info.provider;
+
+  // Get options from info
+  options = providers.get_options_from_info(info, options);
+
+  try {
+    if (provider.customStream) {
+      // For providers that use stream_update callback: Use a promise-based signal.
+      let response = "";
+      let queue = [];
+      let signalPromiseResolve = null;
+      let signalPromise = new Promise((resolve) => {
+        signalPromiseResolve = resolve;
+      });
+      let done = false;
+      let error = null;
+
+      // Start the provider's generate method in the background
+      provider
+        .generate(chat, options, {
+          stream_update: (new_response) => {
+            if (new_response === null || new_response === undefined) return;
+
+            const content = new_response.substring(response.length);
+            response = new_response;
+
+            if (content) {
+              queue.push(content);
+              if (signalPromiseResolve) {
+                // Signal that new data is available
+                const resolveFunc = signalPromiseResolve;
+                signalPromiseResolve = null; // Prevent resolving multiple times before next await
+                signalPromise = new Promise((resolve) => {
+                  signalPromiseResolve = resolve;
+                }); // Create next signal promise
+                resolveFunc();
+              }
+            }
+          },
+        })
+        .then(() => {
+          done = true;
+          if (signalPromiseResolve) signalPromiseResolve(); // Signal completion
+        })
+        .catch((e) => {
+          console.error("Error in provider.generate:", e);
+          error = e;
+          done = true;
+          if (signalPromiseResolve) signalPromiseResolve(); // Signal error/completion
+        });
+
+      // Async generator loop consuming the queue, waiting for signals
+      while (!done || queue.length > 0) {
+        // Check status before yielding or waiting
+        if (status && status()) {
+          console.log("Generator stopping due to status check.");
+          // TODO: Ideally, signal the provider.generate to stop if possible.
+          return;
+        }
+
+        // Yield all currently queued chunks
+        while (queue.length > 0) {
+          yield queue.shift();
+        }
+
+        // If not done and queue is empty, wait for the next signal (data or completion)
+        if (!done) {
+          await signalPromise;
+        }
+      }
+
+      if (error) {
+        console.log(error);
+      }
+    } else if (info.stream) {
+      // For providers using async generators (standard streaming)
+      const response = await provider.generate(chat, options, {});
+
+      // Yield chunks, checking status periodically
+      let i = 0;
+      for await (const chunk of response) {
+        if ((i & 15) === 0 && status && status()) {
+          return;
+        }
+        yield chunk;
+        i++;
+      }
+    } else {
+      // For non-streaming providers
+      const response = await provider.generate(chat, options, {});
+      yield response;
+    }
+  } catch (e) {
+    console.error("Error generating response:", e);
+    yield `Error: ${e.message}`;
+  }
+};
+
+/**
+ * Generate a complete response as a string.
+ *
+ * @param {Object} info - Provider info object
+ * @param {Array} chat - Array of messages
+ * @param {Object} options - Additional options
+ * @returns {Promise<string>} - Promise that resolves to the complete response
+ */
+export const generateResponseSync = async (info, chat, options = {}) => {
+  let completeResponse = "";
+
+  for await (const chunk of generateResponse(info, chat, options)) {
+    completeResponse += chunk;
+  }
+
+  return completeResponse;
+};
+
+/**
+ * Format chat and generate a response.
+ *
+ * @param {Object} currentChat - The chat object
+ * @param {string|null} query - Optional query to append
+ * @param {Object} options - Additional options
+ * @param {Function} status - Optional function that returns true when generation should stop
+ * @returns {AsyncGenerator} - Async generator that yields chunks of the response
+ */
+export const generateChatResponse = async function* (currentChat, query = null, options = {}, status = null) {
+  // Load provider and model
+  const info = providers.get_provider_info(currentChat.provider);
+
+  // Format chat
+  let chat = pairs_to_messages(currentChat.messages, query);
+  chat = truncate_chat(chat, info);
+
+  // Merge options
+  const mergedOptions = {
+    ...providers.get_options_from_info(info, currentChat.options),
+    ...options,
+  };
+
+  // Generate response
+  yield* generateResponse(info, chat, mergedOptions, status);
+};
+
+/**
+ * Get a complete chat response as a string
+ *
+ * @param {Object} currentChat - The chat object
+ * @param {string|null} query - Optional query to append
+ * @param {Object} options - Additional options
+ * @returns {Promise<string>} - Promise that resolves to the complete response
+ */
+export const generateChatResponseSync = async (currentChat, query = null, options = {}) => {
+  let completeResponse = "";
+
+  for await (const chunk of generateChatResponse(currentChat, query, options)) {
+    completeResponse += chunk;
+  }
+
+  return completeResponse;
+};