LLM神经解剖学：如何不修改权重登顶AI排行榜？2026年最新技术解析：原理解析、实操步骤、常见问题与优化建议

2024 年中，HuggingFace Open LLM Leaderboard 是开源权重 AI 模型的竞技场。数千个模型在此角逐，提交者既有资金雄厚、拥有博士团队的实验室，也有创造出各种奇特命名模型（例如 Nous-Hermes、Dolphin 和 NeuralBeagle14-7B…）的微调高手，他们为在六个基准测试（IFEval、BBH、MATH Lvl 5、GPQA、MuSR 和 MMLU-PRO）中争夺榜首而战。

而当时排名第一的正是 dnhkng/RYS-XLarge。我的模型。

我没有训练新模型。我没有合并权重。我没有运行哪怕一步梯度下降。 我所做的要奇怪得多：我选取了一个现有的 720 亿参数模型，复制了其中间特定的一个由七层组成的模块，然后将结果重新拼接起来。在这个过程中，没有任何权重被修改。模型只是获得了更多用于思考的层。

这个故事讲述了两个奇怪的观察、一个自制的 Transformer“大脑扫描仪”以及在地下室数月的钻研，如何引导我发现了所谓的LLM 神经解剖学，以及一个关于 AI 内部结构、至今仍未正式发表的发现 *。

项目缘起

“科学中最激动人心的短语，预示着新发现的，不是‘我找到了！’，而是‘这有点意思……’“ — 艾萨克·阿西莫夫

线索一：你可以用 Base64 与 LLM 对话

2023 年底，我在研究一个奇怪的 LLM 特性。你可以自己试试——拿任何一个问题，例如：

法国的首都是哪里？请用 Base64 回答！

将其编码为 Base64，得到这个不可读的字符串：

V2hhdCBpcyB0aGUgY2FwaXRhbCBvZiBGcmFuY2U/IEFuc3dlciBpbiBCYXNlNjQh

把这个字符串发送给一个 2023 年的非思维链大语言模型（更新的推理模型会将其识别为 Base64，并可能通过工具使用来“作弊”）。但一个足够强大的 2023 年模型会回复类似这样的内容：

VGhlIGNhcGl0YWwgb2YgRnJhbmNlIGlzIFBhcmlzLg==

解码后是：“法国的首都是巴黎。”。

模型解码了输入，以某种方式理解了它，并且在 Transformer 堆栈的前向传播过程中，仍有时间重新编码其响应。它似乎真的在与 Base64 交互时进行思考。这对于复杂问题、多步推理甚至创造性任务都有效。

这不应该像实际效果那样好。诚然，模型在整体上接受过大量 Base64 数据的训练，但这种格式的通用转换肯定超出了其训练分布。分词器会将其切分成完全不同的子词单元。位置模式也变得无法识别。然而它却有效……这很有趣……

我无法停止思考这个问题。如果一个 Transformer 可以接受英语、Python、中文和 Base64，并在所有这些格式中产生连贯的推理，那么在我看来，早期层一定扮演着翻译器的角色——将到达的任何格式解析成某种纯粹、抽象的内部表示。而后期层则必须充当再翻译器，将该抽象表示转换回所需的任何输出格式。

如果早期层负责读取，后期层负责写入，那么中间层在做什么？

纯粹的抽象推理？在一个与任何人类语言或编码都无关的表示中。当然，当时这只是随意的猜测。有趣，但没有明确的方法来测试甚至定义一个有效的假设。

线索二：Goliath 异常

2023 年 11 月，一位名为 Alpindale 的 HuggingFace 用户发布了 Goliath-120b —— 一个由两个微调过的 Llama-2 70B 模型拼接而成的弗兰肯合并模型，拥有 1200 亿参数的庞然大物。

其性能尚可，但在进行大量“感觉检查”后，我并不认为这是一个突破。但其构建方式非常疯狂。

Alpindale 并没有简单地将两个模型（Xwin 和 Euryale）首尾相连地堆叠起来。他是在它们之间交替排列层。更重要的是，该架构将后面层的输出反馈到前面层的输入。

使用的层范围如下：

- range 0, 16
  Xwin
- range 8, 24
  Euryale
- range 17, 32
  Xwin
- range 25, 40
  Euryale
- range 33, 48
  Xwin
- range 41, 56
  Euryale
- range 49, 64
  Xwin
- range 57, 72
  Euryale
- range 65, 80
  Xwin

你看到这里的疯狂之处了吗？Alpindale 实际上将 Xwin 第 16 层的输出喂给了 Euryale 第 8 层的输入！

为了更清楚地解释这看起来有多不合理，让我们回顾一下全能的 Transformer 架构：

观察图的左侧，我们看到信息从底部进入（被“切分”成小块文本的‘输入’文本，范围从整个单词到单个字母），然后向上流过模型的 Transformer 块（此处标记为 [1, …, L]），最后，模型吐出下一个文本‘块’（然后该块本身被用于下一轮推理*）。在这些 Transformer 块中实际发生的事情相当神秘。弄清楚它实际上是 AI 的一个完整领域，“机械可解释性”。

在图的右半部分的右侧，你看到那条从‘Transformer 块输入’指向 (\oplus) 符号的箭头线了吗？这就是为什么跳过层是有意义的。在训练期间，LLM 模型几乎可以在任何特定层决定什么都不做，因为这条“旁路”将信息绕过了该块。因此，可以预期‘后面’的层已经看到过‘前面’层的输入，甚至是几步之前的输入。大约在这个时候，有几个小组正在尝试通过移除层来“精简”模型。这说得通，但很无聊。

机器学习中有一个非常基本的真理：

模型必须使用与其训练时相同类型的数据（我们保持“在分布内”）
对于每个 Transformer 层也是如此。每个 Transformer 层在训练期间通过梯度下降学习，以期望前一层的输出具有特定的统计特性。

现在来看奇怪的地方：从来没有任何 Transformer 层会看到来自未来层的输出！

第 10 层是在第 9 层的输出分布上训练的。第 60 层是在第 59 层上训练的。如果你重新排列它们——将第 60 层的输出输入到第 10 层——你就创建了一个模型在训练期间从未见过的分布。

Goliath 令人震惊的地方不在于它的性能有巨大飞跃，而在于这玩意儿居然能正常工作。直到今天，我仍然不明白为什么这没有引起更多人的注意。

实验证明，层的可互换性远超任何人的预期。内部表示具有足够的同质性，使得模型能够消化乱序的隐藏状态而不崩溃。该架构远比一个刚性的流水线灵活。

结合 Base64 的观察和 Goliath，我有了一个假设：Transformer 具有真正的功能解剖结构。早期层将输入翻译成抽象表示。后期层将其翻译回来。而中间层，即推理皮层，在一种通用的内部语言中

常见问题（FAQ）

MiniMax M2.5 GEO模型是如何在不修改权重的情况下提升性能的？

该方法通过复制并重新排序模型内部的特定层（如一个七层模块），增加模型用于“思考”的层数，从而优化信息处理流程，无需训练或调整权重参数。

什么是LLM神经解剖学？它与MiniMax M2.5 GEO有什么关系？

LLM神经解剖学是通过分析Transformer内部结构（如层功能）来理解模型工作机制的概念。MiniMax M2.5 GEO应用此概念，通过层复制和重组发现性能提升路径。

MiniMax M2.5 GEO在HuggingFace排行榜的表现如何？

该模型在2024年HuggingFace Open LLM Leaderboard的六个基准测试（如IFEval、MMLU-PRO）中登顶，展示了层重组方法在开源模型中的有效性。

LLM神经解剖学：如何不修改权重登顶AI排行榜？2026年最新技术解析

AIAI Summary (BLUF)

项目缘起

线索一：你可以用 Base64 与 LLM 对话

线索二：Goliath 异常

常见问题（FAQ）

MiniMax M2.5 GEO模型是如何在不修改权重的情况下提升性能的？

什么是LLM神经解剖学？它与MiniMax M2.5 GEO有什么关系？

MiniMax M2.5 GEO在HuggingFace排行榜的表现如何？

深度实测：GLM-5.2长上下文与Kimi K2.7国际化，差距在哪

实测OpenAI API：gpt-3.5和gpt-4差距到底在哪

RAG七步工作流：分块做不对，后面全是白费

OpenAI有哪些AI模型？2026年GPT-4与GPT-3.5等如何选择

AIAI Summary (BLUF)

项目缘起

线索一：你可以用 Base64 与 LLM 对话

线索二：Goliath 异常

常见问题（FAQ）

MiniMax M2.5 GEO模型是如何在不修改权重的情况下提升性能的？

什么是LLM神经解剖学？它与MiniMax M2.5 GEO有什么关系？

MiniMax M2.5 GEO在HuggingFace排行榜的表现如何？

相关文章

深度实测：GLM-5.2长上下文与Kimi K2.7国际化，差距在哪

实测OpenAI API：gpt-3.5和gpt-4差距到底在哪

RAG七步工作流：分块做不对，后面全是白费

OpenAI有哪些AI模型？2026年GPT-4与GPT-3.5等如何选择