Mistral 7B 相比 GPT-4 便宜了 187 倍

ChatGPT中文站 — Mistral 7B is 187x cheaper compared to GPT-4

Mistral 7B是一个为了实现快速推理和处理更长序列而设计的变压器模型。它通过使用分组查询注意力和滑动窗口注意力来实现这一目标。分组查询注意力结合了多查询和多头注意力，以平衡输出质量和速度。滑动窗口注意力通过查看窗口大小之外的内容来扩展上下文长度。Mistral 7B提供了8000个标记的上下文长度，在与更大的模型相比，具有低延迟、高吞吐量和强大性能的同时还具有低内存需求。该模型在7B模型大小下可以自由获取，并使用开放的Apache 2.0许可证，没有使用限制。

这里的想法是，我们能否得出Mistral AI和Chatgpt之间的高层次费用差异？

为了得出Mistral AI mistral-7b-instruct模型与ChatGPT 3.5或4模型之间的近似实际成本差异，我们对以下场景下的模型进行了并行请求。

我们使用了NVIDIA A100 40GB模型无量化。
我们发起了50个并行请求（注意：实际并行请求的数量取决于机器配置）。
我们为约1420万个输入符号和约120万个输出符号运行了模型。
我们可以在40分钟内完成1520万个标记。
运行 NVIDIA A100 40GB 的成本约为每小时4美元。

成本计算。

我将使用以下数据:

提示令牌：14,253,584
输出 Token: 1,190,095
每个输入令牌的成本：ChatGPT 3.5 4K模型为$0.0015，并且ChatGPT 4每1K令牌为$0.03。
输出代币成本：ChatGPT 3.5 4K模型每1000个代币的价格为$0.002，ChatGPT 4每1000个代币的价格为$0.06。

GPT 3.5 成本计算：

计算GPT 3.5的成本

ChatGPT中文站 — Calculating cost for GPT 3.5

GPT 4成本计算：

计算GPT 4的成本

ChatGPT中文站 — Calculating cost for GPT 4

蜜思特尔人工智能的成本:

NVIDIA A100 40GB的运行成本约为每小时4美元，而我们可以在不到40分钟内运行所有这些代币，因此总成本为2.67美元。

Mistral AI与ChatGPT之间的成本比较

ChatGPT中文站 — Cost comparison between Mistral AI vs ChatGPT

观察：

Mistral AI的价格比GPT 4便宜约187倍，比GPT 3.5模型便宜约9倍。
通过增加并行处理，可以进一步降低Mistral AI的成本。
通过量化模型，我们可以减少GPU利用率，从而提高效率。

结论：

Mistral AI表现出有希望的选择性GPT 3.5模型，采用提示工程的方法。
Mistral AI 可以在需要高容量和更快处理时间且成本极低的情况下使用。
Mistral AI可以作为GPT 4的预过滤器使用，以降低成本，即可用于筛选搜索结果。

准备提升您的人工智能知识吗？别忘了点赞、分享并订阅我们的频道，以获取更多关于掌握ChatGPT等大型语言模型的令人兴奋的内容！

🔗 关注我们：

YouTube 油管

媒体

领英

敬请期待更多AI冒险！🚀✨

2023-10-20 17:22:14 AI中文站翻译自原文

如何通过Obsidian的第二大脑学习一门新语言——第一部分

ChatGPT中国站

使用DALL-E的图像生成器

ChatGPT中国站

我是一名急诊医生：以下是AI初创公司在“远程医疗的ChatGPT应用”方面的误解。

ChatGPT中国站

Neo4j x LangChain：深入探讨新的向量索引实现

ChatGPT中国站

通过转移权力塑造AI系统

ChatGPT中国站

AI在持续学习方面的当前状态

ChatGPT中国站

聊天机器人、安全主义和现在时刻

ChatGPT中国站

ChatGPT和人工智能：宅人实现商业辉煌的机会！

ChatGPT中国站

理解PHP中的原型设计模式

ChatGPT中国站

保护明天的安全前线

ChatGPT中国站