FV 7B - 搜索

约 80,300 个结果

在新选项卡中打开链接

时间不限

zhihu.com
https://zhuanlan.zhihu.com
7B？13B？175B？671B？大模型的参数是什么？ - 知乎专栏
例如，对于一个7B的模型而言，大体上，使用浮点精度需要28GB内存，使用BF16精度需要14GB内存，使用int8精度需要7GB内存。这个粗略的估计方式可以相应地应用到其他版本的 …
baidu.com
https://baijiahao.baidu.com
原作者带队再次改造xLSTM，7B模型速度最快超Mamba 50%
2025年3月19日 · 研究者通过优化mLSTM架构和训练策略，使xLSTM 7B在生成速度上超越Mamba 50%，内存占用最低，成为最快、最高效的7B语言模型，推理效率测试中预填充和生成吞吐 …
zhihu.com
https://zhuanlan.zhihu.com
deepseek-r1的1.5b、7b、8b、14b、32b、70b和671b有啥区别？
2025年1月28日 · 1.5b-7b：适合对响应速度要求高、硬件资源有限的场景，如移动端的简单智能助手、轻量级的文本生成工具等，可快速加载和运行。 8B-14B：可用于一些对模型性能有一定 …
csdn.net
https://blog.csdn.net › article › details
大模型参数揭秘：7B, 13B, 175B的意义与影响 - CSDN博客
2024年12月24日 · 例如，对于一个7B的模型而言，大体上，使用浮点精度需要28GB内存，使用BF16精度需要14GB内存，使用int8精度需要7GB内存。这个粗略的估计方式可以相应地应用 …
volcengine.com
https://developer.volcengine.com › articles
大模型参数量都是7B，13B和65B等背后的原因是什么？
2024年6月19日 · 不知道大家有没有注意到现在大模型百花齐放，但是模型参数大小却非常一致，基本都是7b，13b，65b等。那么，为什么被设计成这么大呢？网络上有很多解释，笔者结 …
iaiuse.com
https://www.iaiuse.com › posts
【通俗易懂】7B、70B、175B？AI模型参数到底是啥意思？企业如 …
2024年9月15日 · 写在前面大模型的参数是什么意思在当今的 AI 时代，”参数”成了大语言模型中常见的讨论点。我们时常听到一些大型模型被标注为“7 B”或“13 B”，这些数字究竟代表了什 …
zhihu.com
https://zhuanlan.zhihu.com
大模型7B、13B参数是如何分布的？ - 知乎专栏
B = billion = 10亿，7B = 70亿表示参数量有70亿，在模型全量（full）训练模式下70亿参数全部参与训练。以baichuan-7B为例，分解各模块参数. 防止格式变化截图如下. 通过拆解发现全量参 …
51cto.com
https://blog.51cto.com › wirelesscom
7B？13B？175B？解读大模型的参数 - 51CTO博客
2024年6月17日 · 近日，一个新的里程碑被设立：Mistral AI发布了其最新模型Mistral 7B，它在众多基准测试中全面超越了Llama 2 13B模型，标志着AI技术的一个重大进步。 Mistral 7B vs …
baidu.com
https://developer.baidu.com › article › details
Mistral 7B：超越Llama 2的开源大模型-百度开发者中心 - Baidu
Mistral 7B是一个70亿参数的语言模型，旨在获得卓越的性能和效率。在所有评估的基准测试中，它都优于最好的开放13B模型（Llama 2），在推理、数学和代码生成方面也优于最好的发 …
baidu.com
https://developer.baidu.com › article › details
揭秘Baichuan-7B/13B：从SFT到RLHF，一文解读其原理与微调
2024年3月18日 · 本文将从Baichuan的 SFT 实现到Baichuan2的 RLHF 实现，为您一一揭秘。一、Baichuan-7B/13B的原理. Baichuan-7B/13B是基于Transformer架构的大型预训练语言模 …
分页
- 1
- 2
- 3
- 4
- 5
- 下一页