LLM - 搜索 News

资讯

2 天

综上所述，路由LLM作为一种前沿技术，利用小模型的组合策略，展现了超越大型模型的潜力。这一变革为科研人员提供了新的视角，促使其不再追求单一超大模型，而是通过智能组合来实现性能的突破。随着研究的深入，路由LLM有望在更多领域中落地应用，真正实现人工智能技术的 democratization。返回搜狐，查看更多 ...

腾讯网4 天

LLM「想太多」有救了！高效推理让大模型思考过程更精简

有时候回答会绕好大一个圈子，推理过程冗长又复杂，虽能得出正确答案，但耗费了不少时间和计算资源。比如问它「2加3等于多少」，它可能会从数字的概念、加法原理开始，洋洋洒洒说上一大通，这在实际应用中可太影响效率啦。

3 天

AI也有人格面具，竟会讨好人类？大模型的「小心思」正在影响人类判断

斯坦福、Receptiviti、纽约大学和宾大的研究者发现，LLM在做人格测试时，会悄悄给自己戴上「人格面具」。研究人员对GPT-4、Claude 3和Llama ...

7 天

75年后，图灵测试终被GPT-4.5破解！73%人类被骗过，彻底输给AI

这表明，尽管测试人员能够成功地区分人类与ELIZA，但他们在与GPT-4.5-PERSONA和LLAMA-PERSONA比较时，无法可靠地识别出人类。

17 天

Django创造者Simon Willison分享：我如何使用LLM帮我写代码

近段时间，著名 AI 科学家 Andrej Karpathy 提出的氛围编程（vibe coding）是 AI 领域的一大热门话题。简单来说，氛围编程就是鼓励开发者忘掉代码，进入开发的氛围之中。更简单地讲，就是向 LLM 提出需求，然后「全部接受」即可。

10 天

高中生用「我的世界」评测SOTA模型！Claude暂时领先，DeepSeek紧随其后

AI频频刷新基准测试纪录，却算不清「strawberry」里到底有几个字母r，在人类看来很简单的问题却频频出错。这种反差促使创意测评兴起，例如由一名高中生开发的MC-Bench，用Minecraft方块「竞技场」模式评价AI能力。这种新的测评范式，或 ...

15 天

蚂蚁集团开源Ling团队模型，国产芯片训练成本降低20%

2025年3月，蚂蚁集团首次公开回应投资布局调整，将资金从成熟项目转向大模型、AI算力、具身智能等前沿领域。蚂蚁集团通过减持奥比中光（套现5.56亿元）与永安行（套现2.19亿元）两家上市公司，累计回收资金超7.75亿元，这是基于“AI First”战略的主动调整。

1 个月

从蛰伏到王炸，RL启示录

在过去这一年间，RL从一度沉沦的位置，重新走回了AI研究的闪光灯中心。2024年下半年，OpenAI率先发布了它在LLM基础上，用RL实现“深度思考”的成果——o1，设定了新的终点线。今年初，DeepSeek将赛道上的迷雾更进一步迅速驱散了，把自己的 ...

生物通11 天

生成式AI与大型语言模型在减少药物相关伤害中的应用：范围综述与 ...

这项里程碑式研究首次系统绘制GenAI在用药安全领域的技术图谱，揭示出两大突破性发现：GAN在数据稀缺场景的卓越表现，以及LLM的通用任务处理能力。但作者团队强调，当前技术存在三重鸿沟——缺乏前瞻性验证、标准化评估体系及伦理审查框架。特别是发现LLM在疼痛管理等场景存在潜在危害性偏见，敲响临床部署的警钟。

当前正在显示可能无法访问的结果。

隐藏无法访问的结果