Google DeepMind giới thiệu Nano Banana Pro với khả năng kết xuất văn bản nâng cao và chỉnh sửa hình ảnh chất lượng studio

Bitget App

Giao dịch thông minh hơn

MPOST2025/11/21 23:09

Theo:MPOST

Tóm lại Google DeepMind đã ra mắt mô hình tạo và chỉnh sửa hình ảnh Nano Banana Pro, cung cấp khả năng suy luận nâng cao, hiển thị văn bản nâng cao, bố cục nhiều yếu tố và nhiều tính năng khác.

Google DeepMind, bộ phận AI của công ty công nghệ Google, đã công bố ra mắt Nano Banana Pro, hay Gemini 3 Pro Image, một mô hình thế hệ tiếp theo để tạo và chỉnh sửa hình ảnh. Được phát triển dựa trên Gemini 3 Pro, Nano Banana Pro tận dụng khả năng suy luận tiên tiến và kiến thức thực tế của mô hình để tạo ra các biểu diễn hình ảnh chính xác hơn.

Mô hình được thiết kế để hỗ trợ nhiều tác vụ trực quan, bao gồm thiết kế ý tưởng, tạo nguyên mẫu, phát triển đồ họa thông tin và chuyển đổi nội dung viết tay thành sơ đồ có cấu trúc. Nano Banana Pro tạo ra hình ảnh trực quan nhận biết ngữ cảnh dựa trên lý luận nâng cao, thông tin bên ngoài và dữ liệu thời gian thực. Bằng cách kết hợp Gemini 3 Với khả năng phân tích, mô hình có thể tạo ra đồ họa giáo dục giàu thông tin, lời giải thích chi tiết và hình ảnh minh họa chính xác dựa trên tài liệu do người dùng cung cấp hoặc thông tin đã được xác minh từ thế giới thực. Nó cũng có thể sử dụng Google Tìm kiếm để trực quan hóa các mục như công thức nấu ăn, cập nhật thời tiết trực tiếp hoặc thông tin thể thao.

Nano Banana Pro cải thiện hơn nữa khả năng hiển thị văn bản trong hình ảnh, mang lại độ chính xác, rõ nét và dễ đọc hơn trên nhiều ngôn ngữ. Hệ thống hỗ trợ tạo hình ảnh chứa văn bản, từ nhãn ngắn đến đoạn văn dài hơn, đồng thời hiểu rõ hơn về sắc thái phong cách, chiều sâu và bố cục. Điều này cho phép tích hợp văn bản chính xác hơn trong mô hình, áp phích và các tài liệu sáng tạo khác, đồng thời cho phép bản địa hóa hoặc dịch nội dung để sử dụng rộng rãi hơn.

Mô hình này cũng nâng cao độ trung thực hình ảnh và tính linh hoạt sáng tạo. Thiết kế của nó cho phép kết hợp nhiều yếu tố, tích hợp tối đa mười bốn hình ảnh và duy trì sự nhất quán của tối đa năm cá nhân trong một bố cục. Các tác vụ như chuyển đổi phác thảo thành ý tưởng sản phẩm hoặc chuyển đổi bản thiết kế thành hình ảnh kết xuất 3D chi tiết đều được hưởng lợi từ tính nhất quán được cải thiện của nó. Nano Banana Pro giới thiệu các điều khiển sáng tạo mở rộng, cho phép người dùng điều chỉnh góc nhìn máy ảnh, điều chỉnh tiêu điểm, tinh chỉnh các vùng cụ thể của hình ảnh, áp dụng hiệu ứng màu phức tạp và thay đổi điều kiện ánh sáng. Đầu ra có thể được tạo ở nhiều tỷ lệ khung hình khác nhau, hỗ trợ độ phân giải 2K và 4K để đáp ứng cả yêu cầu kỹ thuật số và chất lượng in ấn.

Nano Banana Pro hiện có sẵn trên các công cụ dành cho người tiêu dùng, doanh nghiệp và sáng tạo

Người dùng trên khắp Google Các sản phẩm và dịch vụ của Google hiện có thể lựa chọn giữa phiên bản Nano Banana gốc, được thiết kế cho các chỉnh sửa nhanh chóng và đơn giản, và phiên bản Nano Banana Pro, dành cho các tác phẩm nâng cao hơn, đòi hỏi chất lượng hình ảnh cao và tinh tế. Phiên bản nâng cao này đang dần được cung cấp cho người tiêu dùng và học sinh thông qua ứng dụng Gemini bằng cách chọn "Tạo hình ảnh" với phiên bản "Suy nghĩ". Người dùng gói miễn phí sẽ được truy cập hạn chế trước khi chuyển đổi trở lại phiên bản gốc, trong khi người đăng ký gói Google AI Plus, Pro và Ultra sẽ được hưởng hạn ngạch mở rộng. Tại Hoa Kỳ, Nano Banana Pro có thể truy cập ở Chế độ AI cho Tìm kiếm dành cho người đăng ký Google AI Pro và Ultra, và cũng được cung cấp cho người đăng ký NotebookLM trên toàn thế giới.

Đối với người dùng chuyên nghiệp, Google Ads đang tích hợp Nano Banana Pro để hỗ trợ nâng cao hơn sáng tạo và biên tập Khả năng dành cho các nhà quảng cáo trên toàn cầu. Mô hình này cũng đang được triển khai cho các ứng dụng Google Workspace, bao gồm Google Slides và Vids. Các nhà phát triển và khách hàng doanh nghiệp sẽ thấy Nano Banana Pro được giới thiệu thông qua API Gemini, Google AI Studio và Google Antigravity để hỗ trợ việc tạo bố cục và mô hình phong phú hơn. Các doanh nghiệp có thể bắt đầu sử dụng mô hình này trong Vertex AI để sáng tạo quy mô lớn, với kế hoạch bổ sung cho Gemini Enterprise. Các chuyên gia sáng tạo sẽ được truy cập thông qua đăng ký Google AI Ultra trong Flow, công cụ làm phim AI của công ty, cho phép độ chính xác và khả năng kiểm soát cao hơn khi định hình cảnh và khung hình trực quan.

Google tiếp tục nhấn mạnh tính minh bạch xung quanh nội dung phương tiện do AI tạo ra. Tất cả hình ảnh được tạo ra thông qua các công cụ của Google đều được tích hợp hình mờ kỹ thuật số SynthID không thể nhận biết. Người dùng giờ đây có thể tải hình ảnh lên ứng dụng Gemini và trực tiếp kiểm tra xem hình ảnh đó có được tạo ra bởi Google AI thông qua xác minh SynthID hay không, với khả năng hỗ trợ âm thanh và video dự kiến sẽ được tích hợp trong tương lai. Bên cạnh SynthID, hình mờ Gemini sẽ hiển thị trên hình ảnh do người dùng gói miễn phí và Google AI Pro tạo ra để hỗ trợ nhận dạng rõ ràng hơn. Đối với các quy trình làm việc chuyên nghiệp yêu cầu hình ảnh không bị che khuất, hình mờ hiển thị sẽ được xóa khỏi hình ảnh do người dùng Google AI Ultra và những hình ảnh được tạo trong môi trường phát triển Google AI Studio tạo ra.

Tuyên bố miễn trừ trách nhiệm: Mọi thông tin trong bài viết đều thể hiện quan điểm của tác giả và không liên quan đến nền tảng. Bài viết này không nhằm mục đích tham khảo để đưa ra quyết định đầu tư.

PoolX: Khóa để nhận token mới.

APR lên đến 12%. Luôn hoạt động, luôn nhận airdrop.

Khóa ngay!

Bạn cũng có thể thích

Citi hoàn thành thử nghiệm mang tính bước ngoặt về quy trình thanh toán từ tiền pháp định sang tiền kỹ thuật số hợp tác với Swift

Tóm lại Citi và Swift đã hoàn tất thử nghiệm chứng minh tính khả thi của việc thanh toán giữa tiền pháp định và tiền kỹ thuật số bằng mô hình kết hợp.

MPOST•2025/11/21 23:09

Citi hoàn thành thử nghiệm mang tính bước ngoặt về quy trình thanh toán từ tiền pháp định sang tiền kỹ thuật số hợp tác với Swift

Chainlink trở thành giải pháp Oracle được ưa chuộng trên Injective

Tóm lại Injective đã tích hợp Chainlink để cung cấp dữ liệu thị trường theo thời gian thực và một cơ sở hạ tầng, cho phép nhanh hơn DeFi phát triển, sản phẩm tài chính được mã hóa và mở rộng quyền truy cập vào các ứng dụng trên chuỗi.

MPOST•2025/11/21 23:09

Chainlink trở thành giải pháp Oracle được ưa chuộng trên Injective

OpenAI Mở rộng ChatGPT Với tính năng trò chuyện nhóm, cho phép tối đa 20 người dùng tương tác cùng lúc

Tóm lại OpenAI vừa triển khai tính năng trò chuyện nhóm trên tất cả các cấp đăng ký, cho phép tối đa 20 người dùng cộng tác đồng thời với nhau và với ChatGPT trong cùng một chủ đề.

MPOST•2025/11/21 23:09

OpenAI Mở rộng ChatGPT Với tính năng trò chuyện nhóm, cho phép tối đa 20 người dùng tương tác cùng lúc

Cysic cung cấp ZK-Proofs nhanh hơn và tiết kiệm chi phí hơn cho NOYA

Tóm lại Cysic đang cung cấp một mạng lưới tính toán đầy đủ cho phép tạo ra bằng chứng không kiến thức cho AI được hỗ trợ và Web3 các ứng dụng hỗ trợ khối lượng công việc phi tập trung theo thời gian thực, quy mô lớn.

MPOST•2025/11/21 23:09