OpenAI神秘模型“草莓”曝光:推理能力大爆发,接近AGI L2

发布日期:2024-09-19 14:18

来源类型:吃瓜少女萌 | 作者:丽贝卡·米勒

【澳门金牛版正版资料大全免费】【新澳开奖记录今天结果】【2024年新澳门王中王资料】【管家婆最准一肖一码】【新澳彩开奖结果查询】【一码一肖100%精准】【4949澳门免费资料大全特色】【2024今晚澳门特马开什么号】【一肖中特期期准精选资料】【2O24澳彩管家婆资料传真】
【494949澳门今晚开什么】 【2024新澳免费资料】 【最准一肖一码100%香港78期】

OpenAI最新绝密项目“草莓(Strawberry)”近日曝光,前身是Q*。

关于Q*的介绍,可以看我之前的文章《Open AI的Q*:开局一个名字,内容全靠猜

这一新模型采用特殊方法在超大规模数据集上完成预训练,推理能力接近人类水平。

埃隆·马斯克对此评论:“AI灾难不再是回形针,而是永远的草莓田。”这种说法源自哲学家尼克·博斯特罗姆关于AI风险的比喻。

本周二,OpenAI在内部全体会议上展示了一个demo。据称该项目的推理能力已接近人类水平。据路透社5月份看到的内部文件显示,这正是OpenAI团队正全力研究“草莓”项目。

尽管项目细节在OpenAI内部也是高度保密,但这引发了网友们的广泛猜测,认为OpenAI还在憋个大招。

最新信息还显示,“草莓”使用的推理方法与2022年斯坦福发表的方法相似。具体运作和发布时间仍然未知。

OpenAI新模型“草莓”的强大能力

OpenAI的“草莓(Strawberry)”模型不仅能生成答案,还能执行复杂任务,如提前规划和自主可靠地在互联网上导航。

任务执行与推理能力

根据路透社获得的内部文件,“草莓”模型能自主浏览网页,执行长任务(LHF)。这一能力通过CUA(计算机代理)实现,可以根据发现的内容采取行动。十余位业内人士认为,这是现有AI模型无法解决的问题。

提前计划与自主导航

“草莓”模型不仅生成查询答案,还能进行深度研究。其目标是让AI像人类一样看待和理解世界。这需要AI具备提前计划和自主导航的能力,能够在互联网上可靠地执行复杂的多步骤任务。

模型预训练与特殊处理

知情人士透露,“草莓”模型在超大规模数据集上完成预训练,并使用一种特殊处理方法。后训练(post-training)包括微调和人类反馈强化学习(RLHF),以提升模型性能。

引入创新推理方法

“草莓”使用的推理方法与斯坦福大学2022年提出的自学推理(STaR)方法相似。STaR通过自举方式让模型自己学会推理,不依赖大规模人工标注数据。最终,STaR将GPT-3 Curie(6.7B参数)的准确率提升到72.5%。

Quiet-STaR的进一步改进

2024年,斯坦福团队基于STaR提出了Quiet-STaR方法。Quiet-STaR将显式推理变为隐式内部思考,通过“思考开始”和“思考结束”特殊token,使模型自主学习推理。结果显示,Quiet-STaR在GSM8K和CommonsenseQA数据集上,准确率分别提升至10.9%和47.2%。

AI推理能力的重要性

推理能力被认为是AI达到人类或超人类智能的关键。拥有推理能力的AI模型在科学发现、规划新软件应用上,具有巨大潜力。研究新模型是行业内的常见做法,随着时间推移,推理能力将不断改善。

深度研究数据集与应用测试

OpenAI为评估“草莓”模型的能力,开发了“深度研究”数据集,计划测试模型对软件和机器学习工程师工作的影响。虽然具体内容不详,但可以看出,OpenAI对该项目寄予厚望。

行业内的竞争与进展

除了OpenAI,谷歌、Meta、微软等科技巨头也在改进AI模型的推理能力。Sam Altman认为,未来AI领域最重要的进展将围绕推理能力展开。OpenAI希望“草莓”项目能在此领域取得重大突破,继续引领行业发展。

OpenAI定义AI的L1-L5级别

最近还曝光了OpenAI的AGI五级路线图。

L1:聊天机器人

L1级别为具备对话能力的AI,如ChatGPT。这是目前我们熟知的AI形式,能进行自然语言交流,但功能较为基础。

L2:推理者

L2级别是推理者,能像人类一样解决问题。OpenAI表示,他们接近这一阶段的实现,目标是让AI具备博士水平的基本问题解决能力,预计在一年半内达到。

L3:智能体

L3级别为智能体,能够代表用户采取行动。这不仅涉及思考,还需实际执行任务,如在互联网上自主导航、决策和执行复杂任务。

L4:创新者

L4级别是创新者,AI不仅能辅助人类发明创造,还能提出新点子和解决方案。这一阶段的AI将成为科研和技术创新的强大助手。

L5:组织者

L5级别为组织者,AI可以完成组织工作,管理任务。这是通往AGI的最后一步,目标是创建一个在经济价值任务中超越人类的高度自治系统。

结语

OpenAI CTO曾透露,未来18个月内,他们将致力于实现博士级别的智能,标志着从L1到L2的飞跃。

尽管OpenAI的新模型“草莓”展示了突破性的能力,AGI的最终实现可能还需时间。

L5级别的AI将引发巨大变革,需要长期积累和改良。过快实现可能让大量人类无法适应,因此AGI的实现时间或需以世纪计算。

如果你觉得这篇文章对你有所帮助,欢迎点赞、收藏以及转发分享。同时,请关注我,以获取更多关于人工智能的最新资讯和见解!

参考:

https://x.com/elonmusk/status/1811924287525126378

https://www.reuters.com/technology/artificial-intelligence/openai-working-new-reasoning-technology-under-code-name-strawberry-2024-07-12/

https://www.bloomberg.com/news/articles/2024-07-11/openai-sets-levels-to-track-progress-toward-superintelligent-ai

https://arxiv.org/abs/2403.09629

陈彦章妻:

4秒前:关于Q*的介绍,可以看我之前的文章《Open AI的Q*:开局一个名字,内容全靠猜》这一新模型采用特殊方法在超大规模数据集上完成预训练,推理能力接近人类水平。

邓煜荣:

2秒前:后训练(post-training)包括微调和人类反馈强化学习(RLHF),以提升模型性能。

吕鹏:

5秒前:据路透社5月份看到的内部文件显示,这正是OpenAI团队正全力研究“草莓”项目。

姜烈山:

3秒前:9%和47.