Mistral - 搜索

约 22 个结果

在新选项卡中打开链接

时间不限

zhihu.com
https://www.zhihu.com › question
AI 新贵 Mistral 发布旗舰大模型，消费者对这款文本生成模型评价 …
图4：Mistral 7B和不同Llama模型在各种基准测试上的性能。为了进行准确比较，所有模型都在所有指标上使用我们的评估流程进行了重新评估。Mistral 7B在所有基准测试上都明显优于Llama …
zhihu.com
https://www.zhihu.com › question
如何看MistralAI开源Mistral-7B-v0.2，是否值得升级？ - 知乎
近日，Mistral AI再次引领开源潮流，发布了Mistral-7B v0.2基础模型，这不仅是对之前版本的升级，更是在性能与功能上的一次质的飞跃。Mistral-7B v0.2不仅将上下文长度由4K扩展至惊人 …
zhihu.com
https://www.zhihu.com › question
法国初创公司 Mistral AI 发布首个生成式人工智能模型，该模型有 …
以下是对这两种备受期待的Mistral AI 模型的简要概述： Mistral 7B 是 Mistral AI 推出的首个基础模型，支持英语文本生成任务并具备自然编码能力。它为实现低延迟进行过优化，并且相对其规 …
zhihu.com
https://www.zhihu.com › question › answers › updated
如何看待MistralAI开源全球首个基于混合专家技术的大模型Mistral …
知乎，中文互联网高质量的问答社区和创作者聚集的原创内容平台，于 2011 年 1 月正式上线，以「让人们更好的分享知识、经验和见解，找到自己的解答」为品牌使命。知乎凭借认真、专业 …
zhihu.com
https://www.zhihu.com › question › answers › updated
Mistral Large 发布，对工业届和学术届有什么影响？ - 知乎
Mistral 正式发布 Mistral Large在基准测试中仅次于GPT-4，超过其他所有模型。 Mistral Large具有新的功能和优势：它在英语、法语、西班牙语、德语和意大利语方面拥有母语般流利的能 …
zhihu.com
https://www.zhihu.com › question
如何看待MistralAI开源全球首个基于混合专家技术的大模型Mistral …
Mixtral-8x7B 和 Mistral-7B 模型 config Upcycling . 这是一种比较有效的将已经训练好的 Dense 模型转化为 MoE 的方式，其中 Attention 部分没有任何变化（复用 Dense）， FFN 部分将原来 …
zhihu.com
https://www.zhihu.com › question
个人微调大模型(7B)，最经济的硬件配置是什么？ - 知乎
总结来说，最经济的硬件配置应该是能够在预算范围内提供足够性能的配置。对于个人微调7B大模型，可以考虑先上1块4090 GPU，主板可以考虑x12spi-tf，这块主板的好处在于两个x16槽 …
zhihu.com
https://www.zhihu.com › question
单张4090能运行的最强开源大模型是哪个？ - 知乎
知乎，中文互联网高质量的问答社区和创作者聚集的原创内容平台，于 2011 年 1 月正式上线，以「让人们更好的分享知识、经验和见解，找到自己的解答」为品牌使命。知乎凭借认真、专业 …
zhihu.com
https://www.zhihu.com › tardis › bd › art
十分钟读懂旋转编码（RoPE） - 知乎
其中 RoFormer 是一个绝对位置编码替换为 RoPE 的WoBERT模型，后面的参数（512）是微调时截断的maxlen，可以看到 RoPE 确实能较好地处理长文本语义。
zhihu.com
https://www.zhihu.com › question
现在市面上的大模型这么多，有没有大佬可以总结分类下，另外基 …
Mistral-7B 在所有评估的基准测试中都优于最佳开源 13B 模型（LLaMA-2-13B），在推理、数学和代码生成方面优于最佳开源 34B 模型（LLaMA-34B）。该模型利用分组查询注意力来加快 …
分页
- 1
- 2
- 3
- 下一页