资讯
综上所述,路由LLM作为一种前沿技术,利用小模型的组合策略,展现了超越大型模型的潜力。这一变革为科研人员提供了新的视角,促使其不再追求单一超大模型,而是通过智能组合来实现性能的突破。随着研究的深入,路由LLM有望在更多领域中落地应用,真正实现人工智能技术的 democratization。 返回搜狐,查看更多 ...
有时候回答会绕好大一个圈子,推理过程冗长又复杂,虽能得出正确答案,但耗费了不少时间和计算资源。 比如问它「2加3等于多少」,它可能会从数字的概念、加法原理开始,洋洋洒洒说上一大通,这在实际应用中可太影响效率啦。
斯坦福、Receptiviti、纽约大学和宾大的研究者发现,LLM在做人格测试时,会悄悄给自己戴上「人格面具」。 研究人员对GPT-4、Claude 3和Llama ...
这表明,尽管测试人员能够成功地区分人类与ELIZA,但他们在与GPT-4.5-PERSONA和LLAMA-PERSONA比较时,无法可靠地识别出人类。
近段时间,著名 AI 科学家 Andrej Karpathy 提出的氛围编程(vibe coding)是 AI 领域的一大热门话题。简单来说,氛围编程就是鼓励开发者忘掉代码,进入开发的氛围之中。更简单地讲,就是向 LLM 提出需求,然后「全部接受」即可。
AI频频刷新基准测试纪录,却算不清「strawberry」里到底有几个字母r,在人类看来很简单的问题却频频出错。这种反差促使创意测评兴起,例如由一名高中生开发的MC-Bench,用Minecraft方块「竞技场」模式评价AI能力。这种新的测评范式,或 ...
2025年3月,蚂蚁集团首次公开回应投资布局调整,将资金从成熟项目转向大模型、AI算力、具身智能等前沿领域。蚂蚁集团通过减持奥比中光(套现5.56亿元)与永安行(套现2.19亿元)两家上市公司,累计回收资金超7.75亿元,这是基于“AI First”战略的主动调整。
在过去这一年间,RL从一度沉沦的位置,重新走回了AI研究的闪光灯中心。2024年下半年,OpenAI率先发布了它在LLM基础上,用RL实现“深度思考”的成果——o1,设定了新的终点线。今年初,DeepSeek将赛道上的迷雾更进一步迅速驱散了,把自己的 ...
这项里程碑式研究首次系统绘制GenAI在用药安全领域的技术图谱,揭示出两大突破性发现:GAN在数据稀缺场景的卓越表现,以及LLM的通用任务处理能力。但作者团队强调,当前技术存在三重鸿沟——缺乏前瞻性验证、标准化评估体系及伦理审查框架。特别是发现LLM在疼痛管理等场景存在潜在危害性偏见,敲响临床部署的警钟。
当前正在显示可能无法访问的结果。
隐藏无法访问的结果