OpenAI tung ra o3 và o4-mini: Bộ đôi mô hình AI có khả năng suy luận vượt trội

Hôm nay, Openai đã công bố ra mắt O3 và O4-Mini, hai mô hình suy luận AI mới. Điểm nổi bật của họ là khả năng tạm dừng để suy ngẫm câu hỏi trước khi trả lời.

Openai mô tả O3 là mô hình lý luận tiên tiến nhất của họ từ trước đến nay. Nó là vượt trội so với các mô hình trước đây trong các bài kiểm tra toán học, lập trình, lý luận, khoa học và thị giác. Trong khi đó, O4-Mini mang đến sự cân bằng cạnh tranh giữa giá cả, tốc độ và hiệu suất, các yếu tố quan trọng cho các nhà phát triển khi chọn mô hình AI cho ứng dụng của họ.

Không giống như các mô hình trước đó, O3 và O4-Mini có thể sử dụng các công cụ Chatsing như duyệt web, thực hiện mã Python, xử lý và tạo hình ảnh để hỗ trợ phản hồi. Từ hôm nay, cả hai mô hình này, cùng với biến thể O4-Mini-HGHE (được tối ưu hóa để tạo ra câu trả lời đáng tin cậy hơn), có sẵn cho người dùng đăng ký cho nhóm Pro, cộng và nhóm của Openai.

alt=”” >

Sự ra mắt của các mô hình mới này là một phần của khả năng cạnh tranh của Openai với các đối thủ như Google, Meta, XAI, Anthropic và Deepseek trong thị trường AI toàn cầu. Mặc dù Openai là công ty đầu tiên giới thiệu mô hình suy luận AI (O1), nhưng các đối thủ đã nhanh chóng phát triển các phiên bản tương tự hoặc thậm chí vượt trội. Trên thực tế, các mô hình lý do đang trở nên chiếm ưu thế khi các phòng thí nghiệm tìm cách cải thiện hiệu suất hệ thống.

Xem thêm realme Neo7 SE ra mắt: Smartphone đầu tiên dùng Dimensity 8400-Max, có pin 7.000mAh, giá hơn 6 triệu đồng

Đã có lúc O3 gần như không được tích hợp vào TATGPT. Giám đốc điều hành Sam Altman của Openai đã đề xuất rằng tập trung tài nguyên vào một giải pháp phức tạp hơn, sử dụng công nghệ tương tự O3. Tuy nhiên, áp lực cạnh tranh dường như đã khiến Openai thay đổi quyết định. OpenAI tự tin khẳng định rằng O3 đã đạt được hiệu suất hàng đầu trên Băng ghế được xác minh (không có cấu trúc hỗ trợ tùy chỉnh) với điểm 69,1% trong bài kiểm tra khả năng lập trình. O4-Mini cũng đạt được hiệu suất ấn tượng với 68,1%. Để so sánh, O3-Mini đạt 49,3% và Claude 3,7 Sonnet đạt 62,3%.

Một bước đột phá khác của O3 và O4-Mini là “suy nghĩ hình ảnh”. Người dùng có thể tải hình ảnh lên Chatgpt (ví dụ: phác thảo trên bảng trắng, sơ đồ PDF) để các mô hình phân tích trong giai đoạn “Suy nghĩ” trước khi trả lời. Do đó, họ có thể hiểu cả hình ảnh mờ, chất lượng thấp và thực hiện các nhiệm vụ như phóng to và quay hình ảnh trong quá trình khấu trừ.

Ngoài việc xử lý hình ảnh, O3 và O4-Mini cũng có thể chạy và thực thi mã Python trực tiếp trong trình duyệt thông qua tính năng Canvas của TATGPT, cũng như tìm kiếm thông tin trên web về các sự kiện hiện tại. Ngoài Chatgpt, cả ba mô hình (O3, O4-Mini và O4-Mini cao) sẽ được cung cấp thông qua API cho nhà phát triển OpenAI (API hoàn thành ChAT và API phản hồi), cho phép ứng dụng xây dựng các ứng dụng dựa trên các mô hình này ở mức phí.

Xem thêm iOS 18.2 giúp Camera Control trở nên hữu ích hơn thời điểm ra mắt

OpenAI áp dụng giá cạnh tranh cho O3 (mã thông báo đầu vào 10/triệu đô la, mã thông báo đầu ra 40 đô la/triệu) so với hiệu suất vượt trội của nó. O4-mini có giá tương đương của O3-Mini (mã thông báo đầu vào 1,10/triệu đô la, mã thông báo đầu ra 4,40 đô la/triệu).

Trong vài tuần tới, OpenAI dự kiến sẽ phát hành O3-Pro, phiên bản O3 mạnh hơn cho người đăng ký Chatgpt Pro.

Giám đốc điều hành Sam Altman nói rằng O3 và O4-Mini có thể là mô hình AI cuối cùng của OpenAI trong TATGPT trước khi GPT-5 ra mắt, một mô hình dự kiến sẽ thống nhất các mô hình truyền thống (như GPT-4.1) với các mô hình lý luận hiện tại của họ.

Tóm tắt chung về hiệu suất của O3 và O4-Mini:

O3:

Mô hình lý luận mạnh mẽ nhất của Openai.
Nổi bật trong lập trình, toán học, khoa học, nhận thức thị giác.
Dat Sota trên CodeForces, Swech-Bench, MMMU.
Theo các truy vấn phức tạp, phân tích đa chiều, không phải là câu trả lời rõ ràng.
Mạnh mẽ trong phân tích hình ảnh, biểu đồ, đồ thị.
Giảm giá 20% lỗi nghiêm trọng so với O1 trong các nhiệm vụ thực tế.
Đánh giá cao về khả năng phân tích, tạo và đánh giá các giả thuyết mới (sinh học, toán học, kỹ thuật).

O4-mini:

Mô hình nhỏ gọn, khấu trừ nhanh và tiết kiệm chi phí.
Hiệu suất ấn tượng so với kích thước và giá cả (đặc biệt là trong toán học, lập trình, tầm nhìn).
Hiệu suất tốt nhất trên AIME 2024 và 2025.
O3-mini nổi bật trong các nhiệm vụ khoa học dữ liệu và không thân và dữ liệu.
Hỗ trợ giới hạn cao, phù hợp cho truy vấn lớn.

Xem thêm Snapdragon 8s Gen 4 ra mắt: Có GPU mạnh hơn tới 49% so với tiền nhiệm, Wi-Fi 7 và Bluetooth 6.0

Điểm chung của O3 và O4-Mini:

Có thể sử dụng các công cụ Chatgpt (duyệt web, python, xử lý hình ảnh).
“Suy nghĩ với hình ảnh”, hiểu mờ ảo, chất lượng thấp, khởi động và xoay.
Chạy và thực hiện Python trực tiếp trong trình duyệt.
Tìm kiếm web cho sự kiện hiện tại.
Cải thiện khả năng làm theo hướng dẫn và phản hồi một cách hữu ích, có thể được xác minh.
Trải nghiệm trò chuyện tự nhiên hơn, sử dụng bộ nhớ và lịch sử trò chuyện.

https://www.youtube.com/watch?v=SQ8GBPUB3RK