Hướng dẫn thiết lập nhanh FLUX để tạo hình ảnh AI chất lượng cao
.
5 phút đọc
Giới thiệu về FLUX
FLUXlà một họ mô hình text2img mới được phát hành vào tháng 8 năm 2024. Nhà phát triển, Black Forest Labs, được thành lập bởi các cựu thành viên của Stability AI , được biết đến với Stable Diffusion . Họ là một nhóm chuyên gia có kiến thức chuyên sâu trong lĩnh vực hình ảnh tạo sinh. Điều làm nên sự nổi tiếng của FLUX là chất lượng của các hình ảnh được tạo ra. Theo kết quả đánh giá chuẩn do chính họ công bố, nó vượt trội hơn Midjourney-V6.0 và SD3-Ultra , và phản ứng của cộng đồng cực kỳ tích cực. [Liên kết liên quan]
Bài đăng này tóm tắt cách tạo hình ảnh tạo hình chất lượng cao trong môi trường cục bộ, đặc biệt là với kích thước VRAM dưới 10GB, bằng cách sử dụng mô hình nguồn mở FLUX.1 [dev].
Yêu cầu
Máy: Windows 11+ GPU có VRAM 6GB MIN
Trình quản lý gói:Stability Matrix
Bưu kiện:Stable Diffusion WebUI Forge
Mô hình: FLUX.1 [dev]( Phiên bản bnb-nf4-v2 )
VAE:ae.safetensors
Bộ mã hóa văn bản: ViT-L-14-TEXT-detail-improved-hiT-GmP-TE-only-HF.safetensors,t5xxl_fp16.safetensors
Nâng cấp:4xFFHQDAT.pth
Cài đặt Stability Matrix
Tải xuống và cài đặt tệp phù hợp với hệ điều hành của bạn từ liên kết này .
Cài đặt Stable Diffusion WebUI Forge
Chạy Stability Matrixvà cài đặt Stable Diffusion WebUI Forgetheo các bước sau:
FLUX.1 [dev]là một mô hình mã nguồn mở miễn phí cho mục đích phi thương mại, với các kết quả được tạo ra có sẵn cho mục đích thương mại. Phiên bản NF4 được khuyến nghị, được tối ưu hóa cho việc sử dụng bộ nhớ và tốc độ thực thi, có thể sử dụng với tối thiểu 6GB VRAM .
Tải xuống tệp flux1-dev-bnb-nf4-v2.safetensors từ liên kết này và lưu vào thư mục Data/Models/StableDiffusion trong thư mục cài đặt Stability Matrix của bạn .
Cài đặt VAE
Tải xuống tệp ae.safetensors từ liên kết này và lưu vào thư mục Data/Models/VAE trong thư mục cài đặt Stability Matrix của bạn .
Cài đặt Text Encoder
Tải xuống tệp ViT-L-14-TEXT-detail-improved-hiT-GmP-TE-only-HF.safetensors từ liên kết này và lưu vào thư mục Data/Models/CLIP trong thư mục cài đặt Stability Matrix của bạn .
Cài đặt Upscaler
Tải xuống tệp 4xFFHQDAT.pth từ liên kết này và lưu vào thư mục Data/Models/ESRGAN trong thư mục cài đặt Stability Matrix của bạn .
Chạy Stable Diffusion Diffusion WebUI Forge
Mọi khâu chuẩn bị để tạo ảnh đã hoàn tất. Khởi chạy Stable Diffusion WebUI Forgetheo các bước sau:
Bây giờ, hãy nhập lời nhắc ví dụ sau và nhấp vào nút Tạo để tạo hình ảnh:
nukacola on the table, "nukacola", fallout, closed shot, nuclear radioactive color, realistic
Ấn tượng khi sử dụng FLUX
Với các thiết lập trên, tôi đã thử nghiệm hàng chục hình ảnh bằng RTX 3080 10GB. Tôi đã sử dụng tới ba LoRA và mất khoảng 1 phút 45 giây cho một hình ảnh có độ phân giải 512x768. Chất lượng đầu ra ở độ phân giải 512x512 hoặc 512x768 là tuyệt vời, gần như không thể phân biệt được với ảnh thật. Tuy nhiên, tiềm năng thực sự của FLUX được giải phóng ở độ phân giải 768x768 trở lên. Nó thể hiện một mức độ chi tiết khác, nhưng ở độ phân giải 768x1152, mất khoảng một giờ để tạo ra một hình ảnh, khiến quá trình này khá chậm và đòi hỏi sự kiên nhẫn đáng kể.
Chuyển đổi hình ảnh đầu ra thành tài nguyên 3D
Chuyển đổi hình ảnh 2D do FLUX tạo ra thành 3D có thể hữu ích cho nhiều mục đích khác nhau như phát triển trò chơi và in 3D. Trong khi ngành công nghiệp này vẫn đang trong giai đoạn đầu, công ty Tripo của Trung Quốc hiện đang dẫn đầu lĩnh vực này. Sử dụng mô hình trả phí của họ Tripo AI v2.0, bạn có thể dễ dàng chuyển đổi hình ảnh 2D được tạo bằng FLUX thành tài nguyên 3D. Tài nguyên 3D được tạo ra có thể được lưu dưới dạng tệp GLB , sau đó có thể xem bằng Trình xem 3D trên Windows 11. [ Liên kết trang web]