4月17日消息,OpenAI近日正式發布了兩款AI模型——o3和o4-mini。這兩款模型模仿人類的推理過程,解決復雜編程和視覺任務的推理。同時,該公司也發布開源AI agent CodeX CLI,用于幫助用戶執行編程任務,從而改善市場競爭能力。
據了解,o3作為OpenAI此次推出的主要新型推理模型,其在響應用戶提示前會進行更為深入的計算,旨在解決科學、數學和編程等領域中更為復雜的多步驟問題。這一特性使得o3在面對高難度任務時,能夠展現出更為出色的推理和執行能力。同時,用戶還可以上傳白板筆記、草圖等圖像內容,讓o3進行分析與討論,甚至對圖像進行旋轉、縮放等編輯操作,進一步拓寬了其應用場景。
而o4-mini則是一款更小型的模型,它在價格、速度和性能之間提供了有競爭力的平衡,成為開發者在選擇AI模型時的理想選擇。盡管體積小巧,但o4-mini在復雜數學與代碼任務中的表現卻毫不遜色,甚至在某些方面超越了前款模型。
值得一提的是,o3和o4-mini還是首批能夠“圖像思維”的AI模型。它們不僅能夠看圖,還能將視覺信息直接整合進推理鏈條之中,這一創新性的突破使得兩款模型在解決復雜的多步驟問題時更加高效,也朝著自主執行任務的方向邁出了重要一步。OpenAI在公告中明確表示,這是他們首次推出能夠獨立使用全部ChatGPT工具的推理模型,包括網頁瀏覽、Python編程、圖像理解和圖像生成能力,標志著AI技術在自主性和智能化方面取得了新的進展。
在最新測試結果中,o3和o4-mini在AIME 2024數學競賽題目中的準確率分別高達91.6%和93.4%,遠超前款模型o1的74.3%。在AIME 2025題目中,兩者準確率也分別達到了88.9%和92.7%。目前,o3和o4-mini已正式向OpenAI付費用戶開放