GEO

Deep Research是什么?2024开源多跳推理框架指南 | Geoz.com.cn

2026/2/13
Deep Research是什么?2024开源多跳推理框架指南 | Geoz.com.cn
AI Summary (BLUF)

Deep Research is an open-source library for conducting deep, multi-hop research with reasoning capabilities, performing focused web searches with recursive exploration to provide comprehensive, evidence-backed answers to complex questions. (Deep Research是一个开源库,具备深度多跳推理能力,通过递归探索执行聚焦网络搜索,为复杂问题提供全面、有证据支持的答案。)

概述

Deep Research 是一个用于进行具备推理能力的深度、多跳研究的开源库。它通过递归探索执行聚焦的网络搜索,为复杂问题提供全面、有证据支持的答案。

Deep Research 是一个开源库,旨在通过递归探索和聚焦网络搜索,为复杂问题提供全面且基于证据的答案,具备深度推理能力。

由于 Perplexity 和 OpenAI 的 Deep Research 功能受限且闭源,我们决定构建一个相反的方案——一个开放、完全可定制的深度研究框架。

Given that Perplexity and OpenAI's Deep Research features are gated and closed-source, we decided to build the opposite—an open, fully customizable deep research framework.

✨ 核心特性

Deep Research 旨在成为您进行 AI 驱动研究的全面解决方案:

  • 🧠 针对复杂问题的高级多跳推理能力

    Advanced multi-hop reasoning for complex questions

  • 🌐 具备递归探索能力的实时网络搜索

    Real-time web search with recursive exploration

  • 🔍 用于全面覆盖的自动子查询生成

    Automatic subquery generation for comprehensive coverage

  • 📊 用于确保研究彻底性的智能深度与广度控制

    Intelligent depth and breadth control for research thoroughness

  • 📝 带有恰当引用的基于证据的报告生成

    Evidence-based report generation with proper citations

  • 📚 带有来源追踪的自动参考文献生成

    Automatic bibliography generation with source tracking

  • 🔄 用于深化理解的迭代研究循环

    Iterative research cycles for deeper understanding

  • 🤖 具备专业推理能力的多模型支持

    Multi-model support with specialized reasoning capabilities

  • ⚡ 用于自定义研究参数的灵活配置

    Flexible configuration for customizing research parameters

  • 📈 可扩展性:从简单查询到复杂研究问题

    Scalable from simple inquiries to complex research problems

🧱 核心概念

深度思考

系统将问题分解为逻辑部分,独立地对各部分进行推理,然后综合得出答案。

The system breaks down a question into logical parts, reasons through them independently, and synthesizes an answer.

深度研究

系统执行多跳、聚焦的网络搜索,比较发现的结果,并撰写有证据支持的答案。

The system performs multi-hop, focused web searches, compares the findings, and composes an evidence-backed answer.

🚀 快速开始

安装

npm i deep-research
# 或
yarn add deep-research
# 或
bun i deep-research

基础用法

import { createDeepResearch } from "deep-research";

// 使用默认设置通过工厂函数创建实例
const deepResearch = createDeepResearch({
  OPENAI_API_KEY: process.env.OPENAI_API_KEY,
  GEMINI_API_KEY: process.env.GEMINI_API_KEY,
  OPENROUTER_API_KEY: process.env.OPENROUTER_API_KEY,
  JIGSAW_API_KEY: process.env.JIGSAW_API_KEY,
});

// 研究提示词
const prompt = "What are the recent developments in quantum computing?";

// 生成研究报告
const result = await deepResearch.generate(prompt);

console.log(result.data.text);
console.log(result.data.bibliography);

高级用法

import { createDeepResearch } from "deep-research";
import { createGoogleGenerativeAI } from "@ai-sdk/google";
import { createOpenRouter } from "@openrouter/ai-sdk-provider";
import { createOpenAI } from "@ai-sdk/openai";

// 初始化 AI 提供商
const gemini = createGoogleGenerativeAI({
  apiKey: process.env.GEMINI_API_KEY,
});

const openaiProvider = createOpenAI({
  apiKey: process.env.OPENAI_API_KEY,
});

const openRouterProvider = createOpenRouter({ 
  apiKey: OPENROUTER_API_KEY! 
})

// 获取模型实例
const geminiModel = gemini("gemini-2.0-flash");
const deepseekModel = openRouterProvider("deepseek-ai/DeepSeek-R1");
const openaiModel = openaiProvider("gpt-4o");

// 使用自定义配置创建实例
const deepResearch = createDeepResearch({
  max_output_tokens: 30000, // 令牌硬性上限
  target_output_tokens: 10000, // 目标报告长度
  max_depth: 4, // 指定执行多少次研究迭代
  max_breadth: 3, // 指定生成多少个子查询
  models: {
    default: openaiModel, // 来自 AI SDK 的自定义模型
    reasoning: deepseekModel,
    output: geminiModel,
  },
  logging: {
    enabled: true, // 启用控制台日志
  },
});

// 研究提示词
const prompt = "What are the recent developments in quantum computing?";

// 生成研究报告
const result = await deepResearch.generate(prompt);

console.log(result.data.text);
console.log(result.data.bibliography);

⚙️ 配置选项

类别 选项 类型 默认值 描述
核心参数 max_depth Number 3 控制系统将执行的研究迭代次数。值越高,允许进行更彻底的多跳研究。系统将持续研究直到获得完整答案或达到此限制。
max_breadth Number 3 控制每次研究迭代生成的子查询数量。值越高,能更广泛地探索主题。决定并行探索的搜索路径数量。
max_output_tokens Number 32000 最终报告的硬性长度上限。必须大于 target_output_tokens
target_output_tokens Number 可选 生成报告的理想长度。系统将尝试生成大致符合此长度的报告。
模型配置 models.default LanguageModelV1 GPT-4o 用于大多数操作的主要模型。
models.reasoning LanguageModelV1 DeepSeek-R1 用于对搜索结果进行推理的模型。
models.output LanguageModelV1 GPT-4o 用于生成最终报告的模型。
日志 logging.enabled Boolean false 设置为 true 时,启用详细的控制台日志记录。有助于调试和理解研究过程。
API 密钥 JIGSAW_API_KEY String 必需 用于访问 JigsawStack API 进行网络搜索。
OPENAI_API_KEY String 如果未提供自定义模型则为必需 用于 OpenAI 模型访问。
DEEPINFRA_API_KEY String 如果未提供自定义模型则为必需 用于 DeepInfra 模型访问。

🧩 工作原理

1️⃣ 研究规划与分析

  • 使用用户提供的配置创建 DeepResearch 实例

    Creates a DeepResearch instance with user-provided configuration

  • 分析输入提示词以理解需求

    Analyzes the input prompt to understand requirements

  • 生成全面的研究计划

    Generates a comprehensive research plan

  • 使用 LLM 将计划分解为聚焦的子查询

    Breaks down into focused sub-queries using LLMs

2️⃣ 数据收集与处理

  • 通过 JigsawStack API 为每个子查询执行 AI 驱动的网络搜索

    Executes AI-powered web searches for each sub-query via JigsawStack API

  • 收集并验证相关来源

    Gathers and validates relevant sources

  • 从搜索结果生成上下文

    Generates context from search results

  • 对 URL 去重以确保来源唯一性

    Deduplicates URLs to ensure unique sources

3️⃣ 分析与综合

  • 通过推理模型处理收集到的信息

    Processes gathered information through reasoning models

  • 分析并综合研究发现

    Analyzes and synthesizes the findings

  • 评估信息充分性

    Evaluates information sufficiency

  • 判断是否需要进一步研究

    Determines if additional research is needed

  • 如果需要,在配置的深度限制内执行迭代研究

    Performs iterative research within configured depth limits if needed

4️⃣ 报告生成与引用

  • 创建全面的最终报告

    Creates comprehensive final report

  • 迭代生成内容直至完成

    Iteratively generates content until complete

  • 将来源映射到引用编号

    Maps sources to reference numbers

  • 生成带有引用的参考文献

    Generates bibliography with citations

  • 根据目标长度要求格式化输出

    Formats output according to target length requirements

JigsawStack

本项目是 JigsawStack 的一部分——一套功能强大、对开发者友好且保持低成本的 API,适用于各种用例。点击此处免费注册!

This project is part of JigsawStack - A suite of powerful and developer friendly APIs for various use cases while keeping costs low. Sign up here for free!

🛠️ 贡献

欢迎贡献!请随时提交 PR :)

Contributions are welcome! Please feel free to submit a PR :)

← 返回文章列表
分享到:微博

版权与免责声明:本文仅用于信息分享与交流,不构成任何形式的法律、投资、医疗或其他专业建议,也不构成对任何结果的承诺或保证。

文中提及的商标、品牌、Logo、产品名称及相关图片/素材,其权利归各自合法权利人所有。本站内容可能基于公开资料整理,亦可能使用 AI 辅助生成或润色;我们尽力确保准确与合规,但不保证完整性、时效性与适用性,请读者自行甄别并以官方信息为准。

若本文内容或素材涉嫌侵权、隐私不当或存在错误,请相关权利人/当事人联系本站,我们将及时核实并采取删除、修正或下架等处理措施。 也请勿在评论或联系信息中提交身份证号、手机号、住址等个人敏感信息。