Xoc O1 - 搜索

约 3,870,000 个结果

在新选项卡中打开链接

时间不限

csdn.net
https://blog.csdn.net › v_JULY_v › article › details
一文总览OpenAI o1相关的技术：从CoT、Quiet-STaR、Self-Correct、Self-play RL、MCTS等到类o1 ...
在人工智能领域掀起巨浪的 OpenAI o1 模型发布三周后，一支由高校年轻研究者组成的团队今天发布了题为 "o1 Replication Journey: A Strategic Progress Report (o1 探索之旅：战略进展报告)" 的研究进展报告。
zhihu.com
https://www.zhihu.com › question
如何看最新发布的GPT-o1 pro？ - 知乎
不过我实际测了几道题目，o1 的思考时间基本都在 10s 内，但准确率其实挺高的。或者可以尝试直接告诉 o1 「Take all the time you need」，虽然我并没有感觉推理时间变长。 OpenAI 其实也说了，o1 相比于 o1-preview 而言，思考速度快了 50%，犯错频率减少 34%。
zhihu.com
https://zhuanlan.zhihu.com
（教程）如何访问使用OpenAI的o1模型，o1-mini和o1-preview使用区别，o1 …
o1-preview和o1-mini的区别： o1-preview: 旨在解决跨领域难题的推理模型; o1-mini: 更快、更便宜的推理模型，特别擅长编码、数学和科学。模型的训练日期截止，和模型的上下文支持长度： OpenAI o1最大的技术特征是什么？
csdn.net
https://blog.csdn.net › sherlockMa › article › details
类o1系列模型大盘点：QwQ、Deepseek-R1、Marco-o1、Huatuo-o1 …
2025年1月4日 · o1系列包括三个版本：OpenAI o1、OpenAI o1-preview和OpenAI o1-mini，分别针对不同的使用需求和频率。开发者和研究人员可以通过ChatGPT和API访问这些模型。尽管o1的开发和应用前景广阔，但其高昂的训练和运行成本也给OpenAI带来了财务压力，公司正在寻求新一 …
qq.com
https://news.qq.com › rain
全网最全 OpenAI o1 万字综述：创新、原理和团队 - 腾讯网
2024年9月24日 · 简介：o1是OpenAI 9月12日发布的针对复杂推理问题的全新大模型，也就是Sam一直说的“草莓”。该模型在回答问题之前能够进行更长时间的“思考”，且思考时间越长，推理质量越高。原理：基于强化学习的内化思维链学习，通过思维链式的问题拆解，模型可以不断验证和纠错。表现：o1模型在编程、数学、物理和化学博士级问题等任务上提升显著，但在写作等任务上表现不如GPT4o。构成：o1系列包括o1、o1-preview和o1-mini。 o1暂未公开，o1 …
zhihu.com
https://www.zhihu.com › question
如何看OpenAI最新发布的o1模型正式版，和此前的o1 preview有什 …
o1 系列模型通过强化学习（Reinforcement Learning）进行训练，可以有效提升复杂推理能力。o1模型在回答问题前会先进行“思考”，即在响应用户之前生成一系列推理步骤（chain of thought），以提高回答的准确性和逻辑性。 OpenAI o1模型与o1 preview模型的差异
zhihu.com
https://zhuanlan.zhihu.com
【论文解读】Search-o1：使用Agentic RAG实现o1式长推理
提出了 Search-o1 框架: 这是第一个将 Agentic 搜索工作流集成到 LRM 的 o1 式推理过程中的框架，可以实现自主的知识补充。有效整合外部知识: 通过结合 Agentic RAG 机制和 Reason-in-Documents 模块，使 LRM 能够按需检索外部知识，并将其无缝整合到推理链中，同时保持原有 ...
zhihu.com
https://zhuanlan.zhihu.com
揭秘o1类模型的过度思考：明明只需5个token,它偏要用900个?
2025年1月1日 · 本研究揭示了o1-like模型（类似于OpenAI的o1模型）的一个关键挑战：在测试时有效地和智能地扩展计算资源。通过突出过度思考现象并提出效率指标，论文增强了对o1-like模型资源利用的理解,基于自训练的方法有效地减少了过度思考，降低了不必要的计算，同时 ...
bitebaba.com
https://www.bitebaba.com › news
一文读懂 XOC：驱动去中心化未来的核心引擎_比特巴巴
2024年12月30日 · XOC（Xone Chain Token）是 Xone Chain生态的原生代币，既是推动网络高效运行的动力源泉，也是用户在去中心化生态中获得价值回报的关键工具。 Xone Chain通过XOC代币和创新的行为价值激励（BVI）机制，成功实现了用户行为的价值化，让每一份努力都成为推动生态繁荣的动力。本文将深入解析 XOC 的核心价值、应用场景以及未来潜力。 XOC 的核心价值体现在以下三个方面： XOC 借助独特的 BVI 机制，将用户的链上行为（如交易、质押、参与 …
volcengine.com
https://developer.volcengine.com › articles
推理模型专题 | 开源类O1：Marco-o1技术全面解读 - 文章 - 开发者 …
2024年12月31日 · 受OpenAI推出的o1模型启发，阿里国际团队研发了Marco-o1模型，以提升大语言模型的推理能力。通过结合CoT微调、MCTS算法和推理行动策略，Marco-o1显著增强了处理复杂任务的能力。

分页
- 1
- 2
- 3
- 4
- 下一页