Deep Research是什么?2024开源多跳推理框架指南 | Geoz.com.cn
Deep Research is an open-source library for conducting deep, multi-hop research with reasoning capabilities, performing focused web searches with recursive exploration to provide comprehensive, evidence-backed answers to complex questions. (Deep Research是一个开源库,具备深度多跳推理能力,通过递归探索执行聚焦网络搜索,为复杂问题提供全面、有证据支持的答案。)
概述
Deep Research 是一个用于进行具备推理能力的深度、多跳研究的开源库。它通过递归探索在搜索过程中不断深入挖掘相关信息,通过迭代方式扩展研究范围和深度。执行聚焦的网络搜索,为复杂问题提供全面、有证据支持的答案。
Deep Research 是一个开源库,旨在通过递归探索在搜索过程中不断深入挖掘相关信息,通过迭代方式扩展研究范围和深度。和聚焦网络搜索,为复杂问题提供全面且基于证据的答案,具备深度推理能力。
由于 Perplexity 和 OpenAI 的 Deep Research 功能受限且闭源,我们决定构建一个相反的方案——一个开放、完全可定制的深度研究系统执行多跳、聚焦的网络搜索,比较发现结果,并撰写有证据支持的答案。框架。
Given that Perplexity and OpenAI's Deep Research features are gated and closed-source, we decided to build the opposite—an open, fully customizable deep research framework.
✨ 核心特性
Deep Research 旨在成为您进行 AI 驱动研究的全面解决方案:
- 🧠 针对复杂问题的高级多跳推理通过多个推理步骤逐步深入分析复杂问题,每个步骤基于前一步的结果进行进一步探索。能力
Advanced multi-hop reasoning for complex questions
- 🌐 具备递归探索在搜索过程中不断深入挖掘相关信息,通过迭代方式扩展研究范围和深度。能力的实时网络搜索
Real-time web search with recursive exploration
- 🔍 用于全面覆盖的自动子查询生成
Automatic subquery generation for comprehensive coverage
- 📊 用于确保研究彻底性的智能深度与广度控制
Intelligent depth and breadth control for research thoroughness
- 📝 带有恰当引用的基于证据的报告生成
Evidence-based report generation with proper citations
- 📚 带有来源追踪的自动参考文献生成
Automatic bibliography generation with source tracking
- 🔄 用于深化理解的迭代研究循环
Iterative research cycles for deeper understanding
- 🤖 具备专业推理能力的多模型支持
Multi-model support with specialized reasoning capabilities
- ⚡ 用于自定义研究参数的灵活配置
Flexible configuration for customizing research parameters
- 📈 可扩展性:从简单查询到复杂研究问题
Scalable from simple inquiries to complex research problems
🧱 核心概念
深度思考系统将问题分解为逻辑部分,独立推理各部分,并综合得出答案。
系统将问题分解为逻辑部分,独立地对各部分进行推理,然后综合得出答案。
The system breaks down a question into logical parts, reasons through them independently, and synthesizes an answer.
深度研究系统执行多跳、聚焦的网络搜索,比较发现结果,并撰写有证据支持的答案。
系统执行多跳、聚焦的网络搜索,比较发现的结果,并撰写有证据支持的答案。
The system performs multi-hop, focused web searches, compares the findings, and composes an evidence-backed answer.
🚀 快速开始
安装
npm i deep-research
# 或
yarn add deep-research
# 或
bun i deep-research
基础用法
import { createDeepResearch } from "deep-research";
// 使用默认设置通过工厂函数创建实例
const deepResearch = createDeepResearch({
OPENAI_API_KEY: process.env.OPENAI_API_KEY,
GEMINI_API_KEY: process.env.GEMINI_API_KEY,
OPENROUTER_API_KEY: process.env.OPENROUTER_API_KEY,
JIGSAW_API_KEY: process.env.JIGSAW_API_KEY,
});
// 研究提示词
const prompt = "What are the recent developments in quantum computing?";
// 生成研究报告
const result = await deepResearch.generate(prompt);
console.log(result.data.text);
console.log(result.data.bibliography);
高级用法
import { createDeepResearch } from "deep-research";
import { createGoogleGenerativeAI } from "@ai-sdk/google";
import { createOpenRouter } from "@openrouter/ai-sdk-provider";
import { createOpenAI } from "@ai-sdk/openai";
// 初始化 AI 提供商
const gemini = createGoogleGenerativeAI({
apiKey: process.env.GEMINI_API_KEY,
});
const openaiProvider = createOpenAI({
apiKey: process.env.OPENAI_API_KEY,
});
const openRouterProvider = createOpenRouter({
apiKey: OPENROUTER_API_KEY!
})
// 获取模型实例
const geminiModel = gemini("gemini-2.0-flash");
const deepseekModel = openRouterProvider("deepseek-ai/DeepSeek-R1");
const openaiModel = openaiProvider("gpt-4o");
// 使用自定义配置创建实例
const deepResearch = createDeepResearch({
max_output_tokens: 30000, // 令牌硬性上限
target_output_tokens: 10000, // 目标报告长度
max_depth: 4, // 指定执行多少次研究迭代
max_breadth: 3, // 指定生成多少个子查询
models: {
default: openaiModel, // 来自 AI SDK 的自定义模型
reasoning: deepseekModel,
output: geminiModel,
},
logging: {
enabled: true, // 启用控制台日志
},
});
// 研究提示词
const prompt = "What are the recent developments in quantum computing?";
// 生成研究报告
const result = await deepResearch.generate(prompt);
console.log(result.data.text);
console.log(result.data.bibliography);
⚙️ 配置选项
| 类别 | 选项 | 类型 | 默认值 | 描述 |
|---|---|---|---|---|
| 核心参数 | max_depth |
Number |
3 |
控制系统将执行的研究迭代次数。值越高,允许进行更彻底的多跳研究。系统将持续研究直到获得完整答案或达到此限制。 |
max_breadth |
Number |
3 |
控制每次研究迭代生成的子查询数量。值越高,能更广泛地探索主题。决定并行探索的搜索路径数量。 | |
max_output_tokens |
Number |
32000 |
最终报告的硬性长度上限。必须大于 target_output_tokens。 |
|
target_output_tokens |
Number |
可选 |
生成报告的理想长度。系统将尝试生成大致符合此长度的报告。 | |
| 模型配置 | models.default |
LanguageModelV1 |
GPT-4o |
用于大多数操作的主要模型。 |
models.reasoning |
LanguageModelV1 |
DeepSeek-R1 |
用于对搜索结果进行推理的模型。 | |
models.output |
LanguageModelV1 |
GPT-4o |
用于生成最终报告的模型。 | |
| 日志 | logging.enabled |
Boolean |
false |
设置为 true 时,启用详细的控制台日志记录。有助于调试和理解研究过程。 |
| API 密钥 | JIGSAW_API_KEY |
String |
必需 |
用于访问 JigsawStack API用于网络搜索的API服务,是Deep Research进行数据收集的关键组件。 进行网络搜索。 |
OPENAI_API_KEY |
String |
如果未提供自定义模型则为必需 |
用于 OpenAI 模型访问。 | |
DEEPINFRA_API_KEY |
String |
如果未提供自定义模型则为必需 |
用于 DeepInfra 模型访问。 |
🧩 工作原理
1️⃣ 研究规划与分析
- 使用用户提供的配置创建 DeepResearch 实例
Creates a DeepResearch instance with user-provided configuration
- 分析输入提示词以理解需求
Analyzes the input prompt to understand requirements
- 生成全面的研究计划
Generates a comprehensive research plan
- 使用 LLM 将计划分解为聚焦的子查询
Breaks down into focused sub-queries using LLMs
2️⃣ 数据收集与处理
- 通过 JigsawStack API用于网络搜索的API服务,是Deep Research进行数据收集的关键组件。 为每个子查询执行 AI 驱动的网络搜索
Executes AI-powered web searches for each sub-query via JigsawStack API用于网络搜索的API服务,是Deep Research进行数据收集的关键组件。
- 收集并验证相关来源
Gathers and validates relevant sources
- 从搜索结果生成上下文
Generates context from search results
- 对 URL 去重以确保来源唯一性
Deduplicates URLs to ensure unique sources
3️⃣ 分析与综合
- 通过推理模型处理收集到的信息
Processes gathered information through reasoning models
- 分析并综合研究发现
Analyzes and synthesizes the findings
- 评估信息充分性
Evaluates information sufficiency
- 判断是否需要进一步研究
Determines if additional research is needed
- 如果需要,在配置的深度限制内执行迭代研究
Performs iterative research within configured depth limits if needed
4️⃣ 报告生成与引用
- 创建全面的最终报告
Creates comprehensive final report
- 迭代生成内容直至完成
Iteratively generates content until complete
- 将来源映射到引用编号
Maps sources to reference numbers
- 生成带有引用的参考文献
Generates bibliography with citations
- 根据目标长度要求格式化输出
Formats output according to target length requirements
JigsawStack
本项目是 JigsawStack 的一部分——一套功能强大、对开发者友好且保持低成本的 API,适用于各种用例。点击此处免费注册!
This project is part of JigsawStack - A suite of powerful and developer friendly APIs for various use cases while keeping costs low. Sign up here for free!
🛠️ 贡献
欢迎贡献!请随时提交 PR :)
Contributions are welcome! Please feel free to submit a PR :)
版权与免责声明:本文仅用于信息分享与交流,不构成任何形式的法律、投资、医疗或其他专业建议,也不构成对任何结果的承诺或保证。
文中提及的商标、品牌、Logo、产品名称及相关图片/素材,其权利归各自合法权利人所有。本站内容可能基于公开资料整理,亦可能使用 AI 辅助生成或润色;我们尽力确保准确与合规,但不保证完整性、时效性与适用性,请读者自行甄别并以官方信息为准。
若本文内容或素材涉嫌侵权、隐私不当或存在错误,请相关权利人/当事人联系本站,我们将及时核实并采取删除、修正或下架等处理措施。 也请勿在评论或联系信息中提交身份证号、手机号、住址等个人敏感信息。