GEO

标签:AI大模型

查看包含 AI大模型 标签的所有文章。

35
如何利用OpenAPI替代MCP为LLM集成工具?(附Scala实现方案)

如何利用OpenAPI替代MCP为LLM集成工具?(附Scala实现方案)

BLUF
This article explores an alternative approach to the Model Context Protocol (MCP) for integrating tools with Large Language Models (LLMs) by leveraging existing OpenAPI servers. It proposes a simpler, more intuitive method that uses structured HTTP API definitions as tool inputs, requiring only minimal authentication flow additions. The implementation is demonstrated through a concise Scala script, focusing on core tool integration while omitting MCP's broader features like prompts and resources. 原文翻译: 本文探讨了一种替代模型上下文协议(MCP)的方法,通过利用现有的OpenAPI服务器为大型语言模型(LLM)集成工具。它提出了一种更简单、更直观的方法,使用结构化的HTTP API定义作为工具输入,仅需添加最小的身份验证流程。通过一个简洁的Scala脚本演示了实现,专注于核心工具集成,同时省略了MCP更广泛的功能,如提示和资源。
AI 搜索观察2026/4/18
Cognee开源知识引擎如何为AI智能体构建持久记忆?

Cognee开源知识引擎如何为AI智能体构建持久记忆?

BLUF
Cognee is an open-source knowledge engine that transforms unstructured data into AI memory through vector search and graph databases, enabling continuous learning and context-aware AI agents. 原文翻译: Cognee是一个开源知识引擎,通过向量搜索和图数据库将非结构化数据转化为AI记忆,实现持续学习和上下文感知的AI智能体。
实验与实测2026/4/4
RAG系统如何优化文档处理和向量检索?(附IBM Docling与重排序模型实战)

RAG系统如何优化文档处理和向量检索?(附IBM Docling与重排序模型实战)

BLUF
This technical guide explores advanced optimization techniques for RAG (Retrieval-Augmented Generation) systems, focusing on document processing with IBM's Docling, efficient vector similarity calculations using dot product over cosine similarity, and implementing re-ranking models to improve retrieval accuracy. The article demonstrates practical implementation with code examples and discusses transitioning to enterprise-scale solutions like Vertex AI's RAG Engine. 原文翻译: 本技术指南探讨了RAG(检索增强生成)系统的高级优化技术,重点介绍了使用IBM的Docling进行文档处理、使用点积代替余弦相似度进行高效向量相似度计算,以及实现重排序模型以提高检索准确性。文章通过代码示例展示了实际实现,并讨论了向企业级解决方案(如Vertex AI的RAG引擎)的过渡。
实验与实测2026/4/1
Qwen3.5是什么?2026年原生多模态AI模型深度解析

Qwen3.5是什么?2026年原生多模态AI模型深度解析

BLUF
Qwen3.5 is a native multimodal AI model with 397B parameters and 17B activated per inference, featuring hybrid architecture, 201 language support, and superior performance across reasoning, coding, and vision tasks. 原文翻译: Qwen3.5是一款原生多模态AI模型,拥有3970亿参数,每次推理激活170亿参数,采用混合架构,支持201种语言,在推理、编码和视觉任务上表现卓越。
AI 搜索观察2026/3/21