OpenAI vừa khiến mọi người ngạc nhiên khi công bố o3, một mô hình AI mới được cho là gần với Trí tuệ nhân tạo tổng hợp (AGI), vào ngày cuối cùng của sự kiện “Shipmas” kéo dài 12 ngày.
OpenAI công bố các mẫu o3 mới
o3, phiên bản kế thừa của mô hình “suy luận” o1 ra mắt đầu năm nay, thực chất là một họ mô hình, bao gồm o3 và o3-mini – một phiên bản cô đọng, được tinh chỉnh cho các tác vụ cụ thể. Đặc điểm nổi bật nhất của o3 là khả năng “lý luận” và tự kiểm tra tính xác thực của thông tin, giúp hạn chế tối đa sai sót, “ảo tưởng” thường thấy ở các mô hình AI khác.
o3, mô hình lý luận mới nhất của chúng tôi, là một bước đột phá, với cải tiến chức năng từng bước trên các điểm chuẩn khó nhất của chúng tôi. chúng tôi hiện đang bắt đầu thử nghiệm an toàn và lập đội đỏ. https://t.co/4XlK1iHxFK
– Greg Brockman (@gdb) Ngày 20 tháng 12 năm 2024
Tuy nhiên, OpenAI cũng cẩn thận lưu ý rằng o3 chỉ tiếp cận AGI trong một số điều kiện nhất định. Đạt được AGI, theo định nghĩa của OpenAI, là tạo ra “các hệ thống có tính tự chủ cao, vượt trội hơn con người trong hầu hết các nhiệm vụ có giá trị kinh tế”. Tuyên bố này rất quan trọng, đặc biệt trong bối cảnh thỏa thuận hợp tác với Microsoft, khi OpenAI sẽ không còn nghĩa vụ chia sẻ công nghệ tiên tiến nhất nếu đạt được AGI.
Bên cạnh đó, mẫu o3 còn cho kết quả ấn tượng trong các thử nghiệm. Theo TechCrunchmô hình này đạt 87,5% trong bài kiểm tra ARC-AGI, bài kiểm tra đo lường khả năng tiếp thu các kỹ năng mới ngoài dữ liệu đào tạo. o3 cũng vượt trội trong các bài kiểm tra về lập trình (SWE-Bench Verify, Codeforces), toán (USA Math Invitational 2024, Frontier Math) và khoa học (GPQA Diamond).
Tuy nhiên, các chuyên gia vẫn thận trọng với các mẫu o3 mới. François Chollet, đồng sáng lập ARC-AGI, chỉ ra rằng o3 vẫn thất bại ở một số nhiệm vụ đơn giản, cho thấy sự khác biệt cơ bản so với trí thông minh của con người. Ông cũng nhấn mạnh chi phí tính toán cao của o3, lên tới hàng nghìn USD cho mỗi thử thách ARC-AGI.
Hiện tại, o3 và o3-mini chưa được phát hành rộng rãi. Các nhà nghiên cứu về an toàn có thể đăng ký dùng thử o3-mini ngay hôm nay, trong khi bản dùng thử o3 sẽ được triển khai sau đó. Kế hoạch dự kiến là ra mắt o3-mini vào cuối tháng 1, sau đó là o3. Điều này trái ngược với tuyên bố gần đây của CEO Sam Altman về việc muốn có một khuôn khổ thử nghiệm liên bang trước khi đưa ra các mô hình suy luận mới, nhằm giảm thiểu rủi ro tiềm ẩn.
Việc lược bỏ tên o2 được cho là nhằm tránh xung đột thương hiệu với nhà mạng O2 của Anh. Sự ra mắt của o3 diễn ra khi cuộc đua phát triển mô hình AI suy luận đang nóng dần lên, với sự tham gia của những gã khổng lồ như Google, DeepSeek và Alibaba. Đồng thời, sự kiện cũng trùng với thời điểm Alec Radford, nhà khoa học chủ chốt đằng sau loạt mô hình GPT của OpenAI, tuyên bố rời đi để theo đuổi nghiên cứu độc lập.
Theo: TechCrunch
Ý kiến bạn đọc (0)