OpenAI
凌晨突然官宣了一项重磅更新
免费用户终于能用上
Deep Research
(深度研究)功能了!
AI头条
虽然是以轻量版的形式推出,但实测发现其性能依然强悍,甚至在部分场景下表现接近付费版!作为AI领域博主,我第一时间上手实测并整理出核心信息,带大家看看这次更新到底有啥亮点。
轻量版 Deep Research 的核心更新
免费用户也能用
FREE!!!
此前仅限付费用户的 Deep Research 功能,现在免费用户每月可体验5次轻量版任务,Plus和 Team用户每月25次,Pro用户则高达125次。当付费用户的原始版额度用尽后,系统会自动切换至轻量版,无缝衔接。
o4-mini模型驱动,性能不缩水?
Performance
轻量版虽基于更经济的 o4-mini 模型,但继承了原版Deep Research的智能内核。在 BrowseComp Agentic Browsing 基准测试中,轻量版准确率达 45.6%,仅比原版(o3 模型)低 5%。实测发现,它在数学、编程和图像分析等任务中表现尤为突出,甚至能调用 Python 和网络搜索工具辅助推理。
响应更简洁,但质量不打折
Excellent
OpenAI强调轻量版会生成更简短的回复,但会保持原版的深度与逻辑性。如面对复杂代码调试需求,轻量版会直接给出关键修改建议,而非冗长分析的过程,适合追求效率的用户。
o4-mini
技术亮点:o4-mini 凭什么能打?
作为轻量版的核心引擎,o4-mini 虽体积小,但性能强悍:
· 多模态能力:支持图像与文本结合推理,例如解析手绘草图、科学图表,甚至能结合网络搜索和代码执行生成答案。
· 数学与编程王者:在 AIME 2025 数学竞赛中,o4-mini 的准确率高达 93.4%,超越前代模型;编程任务中,其代码生成效率比 o3-mini 提升 30%。
· 超低成本高并发:专为高吞吐量场景优化,适合教育辅导、数据分析等需要快速处理大批量任务的场景
适用场景
谁最适合用轻量版?
· 学生党:免费额度足够解决课业难题,例如数学题推导、论文资料检索。
· 开发者:快速生成代码片段、调试建议,甚至结合图表分析优化算法。
· 内容创作者:辅助生成深度报告框架,或通过图像分析提取灵感。
· 企业用户:批量处理数据报表、自动化生成分析摘要,降低人力成本。