admin管理员组

文章数量:1631190

让我们来看一下8月份有哪些大模型更新,涵盖了多个领域,包括语言模型、视觉模型以及数学模型等。以下是本次更新的主要亮点:

  • 1、 智谱系列升级:

 a、GLM-4-Flash:免费供应,提供快速响应的对话体验。

 b、GLM-4-Long:超长上下文模型,支持高达1百万tokens的上下文,成本为1元/百万tokens。

 c、GLM-4-Plus:旗舰版模型,性能升级,成本降至50元/百万tokens。

 d、GLM-4V-Plus:升级版视觉多模态模型,上下文扩展至8K,成本降至10元/百万tokens。

 e、Cogview3-Plus:文生图模型升级,成本降低40%,支持更多种分辨率,生成一张图的成本为6分。

点评:智谱全系都做了功能升级以及成本降低。其中GLM4V-PLUS,本身拥有不俗的性能,成本大幅下降,同时上下文达到了8K,实用性大幅增强,目前识别一张手机图片的成本大约1分钱,非常实用。并且智谱还拥有视频生成模型,可能是国内最全面的大模型公司。

 2、通义千问系列升级:

  •   Qwen2-Math:专门为数学场景优化的模型,数学能力超越多个顶流模型,如GPT4o,Claude3.5 Sonnet, DeepSeek Coder。目前免费供应。

  •   Qwen2-VL:最新的视觉大模型,支持视频识别,性能指标对标GPT4o和Claude3.5 Sonnet,具有32K的上下文处理能力,成本为20元/百万tokens。

点评:Qwen2-Math登顶当前最强数学模型,面对数学问题时是一个可选模型。Qwen2-VL测试指标相当高,32K的上下文使得泛用性更强,输入成本比GPT4o略高,但输出成本低3倍,是一个国产替代的选择。

 3、DeepSeek系列升级:

 发布最新的缓存命中技术,有效降低成本至0.1元/百万tokens,适用于文件读取和固定提示词。

点评:由于token消耗大部分是在系统提示词中,妥善使用确实可以极大降低成本,同时还能保证较高的输出质量。

 4、MiniMax系列升级:

  •     abab6.5s:成本降至1元/百万tokens,具有254K的上下文处理能力,以及极高的token处理速度。

 5、腾讯混元系列升级:

 发布多模态模型hunyuan-vision,具有4K的上下文,成本为18元/百万tokens。

 6、Openai系列升级:

  •   gpt-4o-2024-08-06:综合成本降低40%,输入成本为18元/百万tokens,输出成本为72元/百万tokens,最大输出tokens升级至16K。支持结构型输出(Structured Output)

点评:GPT4o降价后,价格竞争力又上来了,甚至比不少国产模型都便宜。与此同时,升级了16K的输出上限,并且支持结构型输出,性能也在同步升级。

 7、Gemini系列升级:

  •    gemini-flash:输入成本0.5元/百万tokens,输出成本2元/百万tokens。
  •    gemini-pro:输入成本25元/百万tokens,输出成本76元/百万tokens。

点评:谷歌的Gemini本身就是实力强劲的多模态模型,成本大幅优化后,保持了其综合竞争力。

用户可以在智匠AI(MindCraft AI)上体验最新更新的模型。

本文标签: 模型