OpenAI神秘模型“草莓”曝光：推理能力大爆发，接近AGI L2

发布日期：2024-09-19 14:18

来源类型：吃瓜少女萌 | 作者：丽贝卡·米勒

【澳门金牛版正版资料大全免费】【新澳开奖记录今天结果】【2024年新澳门王中王资料】【管家婆最准一肖一码】【新澳彩开奖结果查询】【一码一肖100%精准】【4949澳门免费资料大全特色】【2024今晚澳门特马开什么号】【一肖中特期期准精选资料】【2O24澳彩管家婆资料传真】

【494949澳门今晚开什么】【2024新澳免费资料】 【最准一肖一码100%香港78期】

OpenAI最新绝密项目“草莓（Strawberry）”近日曝光，前身是Q*。

关于Q*的介绍，可以看我之前的文章《Open AI的Q*：开局一个名字，内容全靠猜》

这一新模型采用特殊方法在超大规模数据集上完成预训练，推理能力接近人类水平。

埃隆·马斯克对此评论：“AI灾难不再是回形针，而是永远的草莓田。”这种说法源自哲学家尼克·博斯特罗姆关于AI风险的比喻。

本周二，OpenAI在内部全体会议上展示了一个demo。据称该项目的推理能力已接近人类水平。据路透社5月份看到的内部文件显示，这正是OpenAI团队正全力研究“草莓”项目。

尽管项目细节在OpenAI内部也是高度保密，但这引发了网友们的广泛猜测，认为OpenAI还在憋个大招。

最新信息还显示，“草莓”使用的推理方法与2022年斯坦福发表的方法相似。具体运作和发布时间仍然未知。

OpenAI新模型“草莓”的强大能力

OpenAI的“草莓（Strawberry）”模型不仅能生成答案，还能执行复杂任务，如提前规划和自主可靠地在互联网上导航。

任务执行与推理能力

根据路透社获得的内部文件，“草莓”模型能自主浏览网页，执行长任务（LHF）。这一能力通过CUA（计算机代理）实现，可以根据发现的内容采取行动。十余位业内人士认为，这是现有AI模型无法解决的问题。

提前计划与自主导航

“草莓”模型不仅生成查询答案，还能进行深度研究。其目标是让AI像人类一样看待和理解世界。这需要AI具备提前计划和自主导航的能力，能够在互联网上可靠地执行复杂的多步骤任务。

模型预训练与特殊处理

知情人士透露，“草莓”模型在超大规模数据集上完成预训练，并使用一种特殊处理方法。后训练（post-training）包括微调和人类反馈强化学习（RLHF），以提升模型性能。

引入创新推理方法

“草莓”使用的推理方法与斯坦福大学2022年提出的自学推理（STaR）方法相似。STaR通过自举方式让模型自己学会推理，不依赖大规模人工标注数据。最终，STaR将GPT-3 Curie（6.7B参数）的准确率提升到72.5%。

Quiet-STaR的进一步改进

2024年，斯坦福团队基于STaR提出了Quiet-STaR方法。Quiet-STaR将显式推理变为隐式内部思考，通过“思考开始”和“思考结束”特殊token，使模型自主学习推理。结果显示，Quiet-STaR在GSM8K和CommonsenseQA数据集上，准确率分别提升至10.9%和47.2%。

AI推理能力的重要性

推理能力被认为是AI达到人类或超人类智能的关键。拥有推理能力的AI模型在科学发现、规划新软件应用上，具有巨大潜力。研究新模型是行业内的常见做法，随着时间推移，推理能力将不断改善。

深度研究数据集与应用测试

OpenAI为评估“草莓”模型的能力，开发了“深度研究”数据集，计划测试模型对软件和机器学习工程师工作的影响。虽然具体内容不详，但可以看出，OpenAI对该项目寄予厚望。

行业内的竞争与进展

除了OpenAI，谷歌、Meta、微软等科技巨头也在改进AI模型的推理能力。Sam Altman认为，未来AI领域最重要的进展将围绕推理能力展开。OpenAI希望“草莓”项目能在此领域取得重大突破，继续引领行业发展。

OpenAI定义AI的L1-L5级别

最近还曝光了OpenAI的AGI五级路线图。

L1：聊天机器人

L1级别为具备对话能力的AI，如ChatGPT。这是目前我们熟知的AI形式，能进行自然语言交流，但功能较为基础。

L2：推理者

L2级别是推理者，能像人类一样解决问题。OpenAI表示，他们接近这一阶段的实现，目标是让AI具备博士水平的基本问题解决能力，预计在一年半内达到。

L3：智能体

L3级别为智能体，能够代表用户采取行动。这不仅涉及思考，还需实际执行任务，如在互联网上自主导航、决策和执行复杂任务。

L4：创新者

L4级别是创新者，AI不仅能辅助人类发明创造，还能提出新点子和解决方案。这一阶段的AI将成为科研和技术创新的强大助手。

L5：组织者

L5级别为组织者，AI可以完成组织工作，管理任务。这是通往AGI的最后一步，目标是创建一个在经济价值任务中超越人类的高度自治系统。

结语

OpenAI CTO曾透露，未来18个月内，他们将致力于实现博士级别的智能，标志着从L1到L2的飞跃。

尽管OpenAI的新模型“草莓”展示了突破性的能力，AGI的最终实现可能还需时间。

L5级别的AI将引发巨大变革，需要长期积累和改良。过快实现可能让大量人类无法适应，因此AGI的实现时间或需以世纪计算。

如果你觉得这篇文章对你有所帮助，欢迎点赞、收藏以及转发分享。同时，请关注我，以获取更多关于人工智能的最新资讯和见解！

参考：

https://x.com/elonmusk/status/1811924287525126378

https://www.reuters.com/technology/artificial-intelligence/openai-working-new-reasoning-technology-under-code-name-strawberry-2024-07-12/

https://www.bloomberg.com/news/articles/2024-07-11/openai-sets-levels-to-track-progress-toward-superintelligent-ai

https://arxiv.org/abs/2403.09629

陈彦章妻：

4秒前：关于Q*的介绍，可以看我之前的文章《Open AI的Q*：开局一个名字，内容全靠猜》这一新模型采用特殊方法在超大规模数据集上完成预训练，推理能力接近人类水平。

邓煜荣：

2秒前：后训练（post-training）包括微调和人类反馈强化学习（RLHF），以提升模型性能。

吕鹏：

5秒前：据路透社5月份看到的内部文件显示，这正是OpenAI团队正全力研究“草莓”项目。

姜烈山：

3秒前：9%和47.

吃瓜少女萌

李纯就小区物业不先救明星父母”事件回应来了！

重庆医科学校要求饭卡充值千元：合理便利还是经济负担？

深中通道架起湾区融合又一动脉这么好看的画，居然是粉笔画的！

一觉醒来，世界发生了什么？20240828

OpenAI神秘模型“草莓”曝光：推理能力大爆发，接近AGI L2

OpenAI新模型“草莓”的强大能力

OpenAI定义AI的L1-L5级别

结语

OpenAI神秘模型“草莓”曝光：推理能力大爆发，接近AGI L2

OpenAI新模型“草莓”的强大能力

OpenAI定义AI的L1-L5级别

结语

推荐文章