Deep Research是什么？2024开源多跳推理框架指南

概述

Deep Research 是一个用于进行具备推理能力的深度、多跳研究的开源库。它通过递归探索在搜索过程中不断深入挖掘相关信息，通过迭代方式扩展研究范围和深度。执行聚焦的网络搜索，为复杂问题提供全面、有证据支持的答案。

Deep Research 是一个开源库，旨在通过递归探索在搜索过程中不断深入挖掘相关信息，通过迭代方式扩展研究范围和深度。和聚焦网络搜索，为复杂问题提供全面且基于证据的答案，具备深度推理能力。

由于 Perplexity 和 OpenAI 的 Deep Research 功能受限且闭源，我们决定构建一个相反的方案——一个开放、完全可定制的深度研究系统执行多跳、聚焦的网络搜索，比较发现结果，并撰写有证据支持的答案。框架。

Given that Perplexity and OpenAI's Deep Research features are gated and closed-source, we decided to build the opposite—an open, fully customizable deep research framework.

✨ 核心特性

Deep Research 旨在成为您进行 AI 驱动研究的全面解决方案：

🧠 针对复杂问题的高级多跳推理通过多个推理步骤逐步深入分析复杂问题，每个步骤基于前一步的结果进行进一步探索。能力

Advanced multi-hop reasoning for complex questions
🌐 具备递归探索在搜索过程中不断深入挖掘相关信息，通过迭代方式扩展研究范围和深度。能力的实时网络搜索

Real-time web search with recursive exploration
🔍 用于全面覆盖的自动子查询生成

Automatic subquery generation for comprehensive coverage
📊 用于确保研究彻底性的智能深度与广度控制

Intelligent depth and breadth control for research thoroughness
📝 带有恰当引用的基于证据的报告生成

Evidence-based report generation with proper citations
📚 带有来源追踪的自动参考文献生成

Automatic bibliography generation with source tracking
🔄 用于深化理解的迭代研究循环

Iterative research cycles for deeper understanding
🤖 具备专业推理能力的多模型支持

Multi-model support with specialized reasoning capabilities
⚡ 用于自定义研究参数的灵活配置

Flexible configuration for customizing research parameters
📈 可扩展性：从简单查询到复杂研究问题

Scalable from simple inquiries to complex research problems

🧱 核心概念

深度思考系统将问题分解为逻辑部分，独立推理各部分，并综合得出答案。

系统将问题分解为逻辑部分，独立地对各部分进行推理，然后综合得出答案。

The system breaks down a question into logical parts, reasons through them independently, and synthesizes an answer.

深度研究系统执行多跳、聚焦的网络搜索，比较发现结果，并撰写有证据支持的答案。

系统执行多跳、聚焦的网络搜索，比较发现的结果，并撰写有证据支持的答案。

The system performs multi-hop, focused web searches, compares the findings, and composes an evidence-backed answer.

🚀 快速开始

安装

npm i deep-research
# 或
yarn add deep-research
# 或
bun i deep-research

基础用法

import { createDeepResearch } from "deep-research";

// 使用默认设置通过工厂函数创建实例
const deepResearch = createDeepResearch({
  OPENAI_API_KEY: process.env.OPENAI_API_KEY,
  GEMINI_API_KEY: process.env.GEMINI_API_KEY,
  OPENROUTER_API_KEY: process.env.OPENROUTER_API_KEY,
  JIGSAW_API_KEY: process.env.JIGSAW_API_KEY,
});

// 研究提示词
const prompt = "What are the recent developments in quantum computing?";

// 生成研究报告
const result = await deepResearch.generate(prompt);

console.log(result.data.text);
console.log(result.data.bibliography);

高级用法

import { createDeepResearch } from "deep-research";
import { createGoogleGenerativeAI } from "@ai-sdk/google";
import { createOpenRouter } from "@openrouter/ai-sdk-provider";
import { createOpenAI } from "@ai-sdk/openai";

// 初始化 AI 提供商
const gemini = createGoogleGenerativeAI({
  apiKey: process.env.GEMINI_API_KEY,
});

const openaiProvider = createOpenAI({
  apiKey: process.env.OPENAI_API_KEY,
});

const openRouterProvider = createOpenRouter({ 
  apiKey: OPENROUTER_API_KEY! 
})

// 获取模型实例
const geminiModel = gemini("gemini-2.0-flash");
const deepseekModel = openRouterProvider("deepseek-ai/DeepSeek-R1");
const openaiModel = openaiProvider("gpt-4o");

// 使用自定义配置创建实例
const deepResearch = createDeepResearch({
  max_output_tokens: 30000, // 令牌硬性上限
  target_output_tokens: 10000, // 目标报告长度
  max_depth: 4, // 指定执行多少次研究迭代
  max_breadth: 3, // 指定生成多少个子查询
  models: {
    default: openaiModel, // 来自 AI SDK 的自定义模型
    reasoning: deepseekModel,
    output: geminiModel,
  },
  logging: {
    enabled: true, // 启用控制台日志
  },
});

// 研究提示词
const prompt = "What are the recent developments in quantum computing?";

// 生成研究报告
const result = await deepResearch.generate(prompt);

console.log(result.data.text);
console.log(result.data.bibliography);

⚙️ 配置选项

类别	选项	类型	默认值	描述
核心参数	`max_depth`	`Number`	`3`	控制系统将执行的研究迭代次数。值越高，允许进行更彻底的多跳研究。系统将持续研究直到获得完整答案或达到此限制。
	`max_breadth`	`Number`	`3`	控制每次研究迭代生成的子查询数量。值越高，能更广泛地探索主题。决定并行探索的搜索路径数量。
	`max_output_tokens`	`Number`	`32000`	最终报告的硬性长度上限。必须大于 `target_output_tokens`。
	`target_output_tokens`	`Number`	`可选`	生成报告的理想长度。系统将尝试生成大致符合此长度的报告。
模型配置	`models.default`	`LanguageModelV1`	`GPT-4o`	用于大多数操作的主要模型。
	`models.reasoning`	`LanguageModelV1`	`DeepSeek-R1`	用于对搜索结果进行推理的模型。
	`models.output`	`LanguageModelV1`	`GPT-4o`	用于生成最终报告的模型。
日志	`logging.enabled`	`Boolean`	`false`	设置为 `true` 时，启用详细的控制台日志记录。有助于调试和理解研究过程。
API 密钥	`JIGSAW_API_KEY`	`String`	`必需`	用于访问 JigsawStack API用于网络搜索的API服务，是Deep Research进行数据收集的关键组件。进行网络搜索。
	`OPENAI_API_KEY`	`String`	`如果未提供自定义模型则为必需`	用于 OpenAI 模型访问。
	`DEEPINFRA_API_KEY`	`String`	`如果未提供自定义模型则为必需`	用于 DeepInfra 模型访问。

🧩 工作原理

1️⃣ 研究规划与分析

使用用户提供的配置创建 DeepResearch 实例

Creates a DeepResearch instance with user-provided configuration
分析输入提示词以理解需求

Analyzes the input prompt to understand requirements
生成全面的研究计划

Generates a comprehensive research plan
使用 LLM 将计划分解为聚焦的子查询

Breaks down into focused sub-queries using LLMs

2️⃣ 数据收集与处理

通过 JigsawStack API用于网络搜索的API服务，是Deep Research进行数据收集的关键组件。为每个子查询执行 AI 驱动的网络搜索

Executes AI-powered web searches for each sub-query via JigsawStack API用于网络搜索的API服务，是Deep Research进行数据收集的关键组件。
收集并验证相关来源

Gathers and validates relevant sources
从搜索结果生成上下文

Generates context from search results
对 URL 去重以确保来源唯一性

Deduplicates URLs to ensure unique sources

3️⃣ 分析与综合

通过推理模型处理收集到的信息

Processes gathered information through reasoning models
分析并综合研究发现

Analyzes and synthesizes the findings
评估信息充分性

Evaluates information sufficiency
判断是否需要进一步研究

Determines if additional research is needed
如果需要，在配置的深度限制内执行迭代研究

Performs iterative research within configured depth limits if needed

4️⃣ 报告生成与引用

创建全面的最终报告

Creates comprehensive final report
迭代生成内容直至完成

Iteratively generates content until complete
将来源映射到引用编号

Maps sources to reference numbers
生成带有引用的参考文献

Generates bibliography with citations
根据目标长度要求格式化输出

Formats output according to target length requirements

JigsawStack

本项目是 JigsawStack 的一部分——一套功能强大、对开发者友好且保持低成本的 API，适用于各种用例。点击此处免费注册！

This project is part of JigsawStack - A suite of powerful and developer friendly APIs for various use cases while keeping costs low. Sign up here for free!

🛠️ 贡献

欢迎贡献！请随时提交 PR :)

Contributions are welcome! Please feel free to submit a PR :)