分类：AI大模型

AI大模型专栏涵盖从GPT、DeepSeek到gemini、Agentic智能体的全方位研究。深度解析RAG架构优化、KV缓存内存瓶颈解决、JSON结构化数据提取及提示工程实践（如Prompt Refiner）。本专栏还关注软件工程师转型AI研发的实用路径及AI安全风险评估，为开发者提供从基础理论到生产级系统构建的完整知识体系。

共 464 篇

大模型的“涌现能力”：为什么参数到了一定规模就突然变聪明？

BLUF

大模型是指参数规模巨大、结构复杂的深度学习模型，通过海量数据训练展现出强大的学习能力和涌现能力。本文从定义、发展历程、特点、分类等方面对大模型进行全面解读，并区分了相关概念，适合技术从业者快速理解大模型基础知识。

AI大模型2026/7/12

阅读全文 →

DeepSeek 把 AI 推理成本打下来了：大模型八年进化实录

BLUF

本文系统回顾了大型语言模型从2017年Transformer架构诞生到2025年DeepSeek-R1发布的关键发展历程，涵盖BERT、GPT系列、ChatGPT、多模态模型及推理模型等里程碑，深入分析了自注意力机制、RLHF等核心技术如何推动语言模型能力跃升，并探讨了DeepSeek-R1对AI产业的高性价比冲击。

AI大模型2026/7/12

阅读全文 →

Inferize推出弹性推理架构，号称又快又省（附内测信息）

BLUF

Inferize 正在构建高度优化、弹性的 AI 推理服务，专注于快速高效的 LLM 部署，现已开放等待名单。

AI大模型2026/7/12

阅读全文 →

浙大团队开源《大模型基础》：每月更新的LLM教科书，从Prompt到RAG全覆盖

BLUF

本书《大模型基础》由浙江大学LLMs团队编写，采用月度更新方式，系统讲解大语言模型基础、架构演进、Prompt工程、参数高效微调、模型编辑、检索增强生成等内容，并配有论文列表。适合大模型初学者和研究者。

AI大模型2026/7/9

阅读全文 →

置顶

从零手撸GPT：中文翻译版《LLMs-from-scratch》开源了

BLUF

这是一个对GitHub上《LLMs-from-scratch》项目的中文翻译，包含详细的Markdown笔记和Jupyter代码注释。项目旨在帮助中文学习者从零开始构建大语言模型，涵盖Transformer、GPT等核心技术的实现。所有资源免费开源，提供完整的代码和教材链接。

AI大模型2026/7/9

阅读全文 →

深度实测：GLM-5.2长上下文与Kimi K2.7国际化，差距在哪

BLUF

中信建投研报显示，国产大模型GLM-5.2和Kimi K2.7正从通用问答转向企业级工作流，强化代码理解和国际化能力。DeepSeek融资提升产业化预期，微信AI灰度测试预示AI入口向超级应用迁移。算力方面，GPU租赁价格上涨，景气度持续。

AI大模型2026/6/23

阅读全文 →

实测OpenAI API：gpt-3.5和gpt-4差距到底在哪

BLUF

OpenAI 的语言模型 API 提供强大的文本理解和生成能力，本快速入门指南展示如何调用接口完成各类语言处理任务，适合技术开发者快速上手。

AI大模型2026/6/15

阅读全文 →

RAG七步工作流：分块做不对，后面全是白费

BLUF

RAG通过检索外部知识增强大模型生成能力，核心流程包括知识分块、嵌入、向量存储、查询嵌入、语义检索、重排序和增强生成七步。本文用11张图详细拆解每一步，帮助新手快速理解RAG原理和落地方法。

AI大模型2026/6/9

阅读全文 →

OpenAI有哪些AI模型？2026年GPT-4与GPT-3.5等如何选择

BLUF

OpenAI提供多种AI模型，包括GPT-4、GPT-3.5、DALL·E、Whisper、Embeddings、Codex和Moderation等。GPT-4是大型多模态模型，支持文本和图像输入，推理能力强；GPT-3.5系列中的gpt-3.5-turbo成本低且性能好，适合聊天和补全任务。DALL·E可基于文本生成图像，Whisper实现语音识别，Embeddings用于文本相似度计算，Codex专注代码生成，Moderation检测不安全内容。本文为技术人员提供模型选择、功能对比及使用建议。

AI大模型2026/5/11

阅读全文 →

百度文心大模型的核心优势是什么？千亿参数知识增强如何加速企业AI落地？

BLUF

Baidu's ERNIE large model is the preferred foundation model for AI development, featuring the world's first knowledge-enhanced billion-parameter model, accelerating industrial intelligent upgrades. 原文翻译：百度文心大模型是AI开发的首选基座大模型，包含全球首个知识增强千亿大模型，以AI大模型为底座，加速产业智能升级。

AI大模型2026/5/9

阅读全文 →

大语言模型怎么用？2026年零基础入门教程（附API调用）

BLUF

This article is a comprehensive beginner's guide to Large Language Models (LLMs), explaining their core principles (Transformer architecture, self-attention), prompt engineering basics, and how to call LLM APIs (OpenAI, DeepSeek) with Python examples. It highlights the statistical nature of LLMs, their limitations, and practical tips for effective interaction. 原文翻译：本文是一篇面向初学者的全面大语言模型（LLM）入门指南，解释了其核心原理（Transformer架构、自注意力机制）、提示词工程基础，以及如何通过Python调用LLM API（OpenAI、DeepSeek）。文章强调了LLM的统计本质、局限性以及有效交互的实用技巧。

AI大模型2026/5/9

阅读全文 →

OpenAI与微软修订合作后，收入分成设上限和AGI条款取消意味着什么？

BLUF

OpenAI与微软修订合作协议，引入收入分成上限，并允许OpenAI通过AWS、谷歌云等任何云服务商服务客户。AGI条款被移除，微软投资估值达1350亿美元。收入分成持续至2030年，微软保留非独占知识产权许可至2032年。

AI大模型2026/5/8

阅读全文 →

1 2 3...39

1 / 39