首页 > 编程入门文章详情

底座（基座）模型是如何训练的？

编程入门行业动态更新时间:2024-10-25 18:34:14

底座（<a href=https://www.elefans.com/category/jswz/34/1733751.html style= 基座）模型是如何训练的？"/>

底座（基座）模型是如何训练的？

我们把LLM的基本训练步骤分为两步，预训练和对齐；预训练我们非常熟悉，是bert-finetuning时代的基本原理，只不过LLM一般遵循自回归的逻辑，因此使用GPT模型的预训练方式：CLM（具备因果关系的MLM）；预训练帮助我们在海量语料下，通过自监督的方式确定了模型的基本参数，使得模型存储了大量世界知识和逻辑。
而为了使预训练模型能够完成chat功能，我们还有第二步：对齐，这也是LLM“显示出智能”的重要一环，对齐又可以分为三步，分别是：SFT，RM和RLHF。

更多推荐

底座（基座）模型是如何训练的？

本文发布于:2023-11-15 22:30:29，感谢您对本站的认可！

本文链接:https://www.elefans.com/category/jswz/34/1607627.html

版权声明:本站内容均来自互联网，仅供演示用，请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系，我们将在24小时内删除。

基座底座模型

上一篇： “在哪里"用linq to sql
下一篇： LINQ嵌套在哪里

发布评论取消回复

评论列表（有 0 条评论）

热门文章