Mistral 7B 比Llama 2更好的开源大模型 (一)

编程入门 行业动态 更新时间:2024-10-27 03:27:23

Mistral 7B 比Llama 2更好的<a href=https://www.elefans.com/category/jswz/34/1770131.html style=开源大模型 (一)"/>

Mistral 7B 比Llama 2更好的开源大模型 (一)

Mistral 7B 简介

Mistral 7B

Mistral 7B 是一个 7.3B 参数模型:

  • 在所有基准测试中优于 Llama 2 13B
  • 在许多基准测试中优于 Llama 1 34B
  • 接近 CodeLlama 7B 的代码性能,同时保持擅长英语任务
  • 使用分组查询注意力 (GQA) 加快推理速度
  • 使用滑动窗口注意力 (SWA) 以更低的成本处理更长的序列

性能细节

将 Mistral 7B 与 Llama 2 系列进行比较,运行所有模型评估,以便进行公平比较。

Mistral 7B 和不同 Llama 模型在各种基准测试中的性能。Mistral 7B 在所有指标上都明显优于 Llama 2 13B,与 Llama 34B 相当,在代码和推理基准方面也非常出色。

基准测试按其主题分类:

  • 常识推理: 0-shot average of Hellaswag, Winogrande, PIQA, SIQA, OpenbookQA, ARC-Easy, ARC-Challenge, and CommonsenseQA.
  • 世界知识: 5-shot average of NaturalQuestions and TriviaQA.
  • 阅读理解: 0-shot average of BoolQ and QuAC.
  • 数学 : Average of 8-shot GSM8K with maj@8 and 4-shot MATH with maj@4

更多推荐

Mistral 7B 比Llama 2更好的开源大模型 (一)

本文发布于:2023-11-15 02:21:53,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1592043.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:开源   模型   Mistral   Llama

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!