OpenAI giới thiệu mô hình GPT‑4o Image Generation để tạo và chỉnh sửa hình ảnh

Giám đốc điều hành của Openai, Sam Altman vừa xuất bản một bước quan trọng trong khả năng tạo ra hình ảnh của Chatgpt. Trong chương trình phát sóng trực tiếp, ông đã giới thiệu bản nâng cấp lớn đầu tiên sau hơn một năm, cho phép trực tiếp tạo và chỉnh sửa ảnh với mô hình GPT-4O.
Trước đây, mặc dù GPT-4O là nền tảng cốt lõi của AI Chatbot này, khả năng của nó bị giới hạn trong việc xử lý và tạo văn bản. Với bản cập nhật này, sức mạnh của GPT-4O đã được mở rộng sang lĩnh vực hình ảnh.
So với Dall-E 3, mô hình tạo hình ảnh mà GPT-4O thay thế, GPT-4O có thể mất nhiều thời gian hơn để “xử lý”, nhưng OpenAI xác nhận rằng kết quả sẽ là hình ảnh chính xác và chi tiết hơn. Cụ thể, GPT-4O cũng có khả năng chỉnh sửa ảnh hiện có, bao gồm cả mọi người, cho phép người dùng thay đổi hoặc thêm chi tiết vào nền trước và nền một cách tự nhiên.
Để hỗ trợ tính năng hình ảnh mới, OpenAI đã tiết lộ với Tạp chí Phố Wall rằng họ đã đào tạo GPT-4O về dữ liệu công cộng và dữ liệu độc quyền từ các đối tác như Shutterstock.
alt=”” >
Trong bối cảnh nhiều công ty sáng tạo coi việc đào tạo dữ liệu là một lợi thế cạnh tranh và bảo mật, OpenAI tiết lộ một phần của chi tiết này. Tuy nhiên, tính minh bạch của dữ liệu đào tạo cũng có thể nêu ra các vấn đề pháp lý liên quan đến quyền sở hữu trí tuệ.
Tuy nhiên, Openai cũng trấn an cộng đồng nghệ sĩ. Giám đốc điều hành Brad Lighttcap đã xác nhận với tạp chí rằng công ty “tôn trọng quyền của các nghệ sĩ trong quá trình tạo ra sản phẩm và chúng tôi có chính sách để ngăn chặn việc tạo ra các bản sao trực tiếp của các tác phẩm của bất kỳ nghệ sĩ sống nào.”
Openai cũng cung cấp một hình thức cho phép người sáng tạo yêu cầu loại bỏ công việc của họ khỏi bộ dữ liệu đào tạo. Công ty cam kết tôn trọng các yêu cầu không cho phép BOT thu thập dữ liệu web của chúng tôi để thu thập dữ liệu đào tạo, bao gồm hình ảnh, từ các trang web.
Nâng cấp khả năng tạo hình ảnh của TATGPT diễn ra sau khi Google kiểm tra tính năng tương tự cho đèn flash Gemini 2.0. Tuy nhiên, tính năng hình ảnh của Gemini 2.0 Flash đã gây tranh cãi trên các mạng xã hội do thiếu các biện pháp kiểm soát hiệu quả, dẫn đến việc người dùng có thể xóa hình ảnh mờ và tạo hình ảnh vi phạm bản quyền.
Một vài ví dụ về Openai với GPT-4O
https://www.youtube.com/watch?v=JevonM6GBCA
https://www.youtube.com/watch?v=tmhaask9i1o
https://www.youtube.com/watch?v=nO7UO2II1SW
https://www.youtube.com/watch?v=e9rn8jx –c
https://www.youtube.com/watch?v=elWB_EMN1P0
https://www.youtube.com/watch?v=pfSounFBHzi
Truy cập và tính khả dụng
Tính năng tạo hình ảnh của GPT-4O bắt đầu được triển khai ngày hôm nay dưới dạng tạo hình ảnh mặc định trong TATGPT cho người dùng Plus, Pro, nhóm và các gói miễn phí. Truy cập vào tính năng này sẽ sớm được cung cấp cho người dùng Enterprise và EDU. Ngoài ra, tính năng này có sẵn để sử dụng trong Sora. Người dùng vẫn thích Dall · E có thể tiếp tục truy cập thông qua GPT Dall · e chuyên dụng.
Trong vài tuần tới, các nhà phát triển cũng sẽ có thể tạo ảnh với GPT – 4O thông qua API.
Tạo và tùy chỉnh ảnh với GPT – 4O rất đơn giản, tương tự như cuộc trò chuyện. Bạn chỉ cần mô tả các yêu cầu của bạn, bao gồm các chi tiết cụ thể như tỷ lệ khung, mã màu hex chính xác hoặc nền trong suốt. Bởi vì mô hình này tạo ra hình ảnh chi tiết hơn, thời gian xử lý để hiển thị hình ảnh có thể dài hơn, thường lên đến một phút.
>