Giới thiệu về FluxGym
FluxGym
là một Web UI nguồn mở giúp tạo LoRA , một phần tinh chỉnh của mô hình cơ sở FLUX . Nó cho phép người dùng nhanh chóng và trực quan tạo LoRA mong muốn mà không cần biết cấu hình nền phức tạp và hệ sinh thái. ( FluxGym hiện là công cụ dễ nhất trong hệ sinh thái FLUX để tạo LoRA trong môi trường cục bộ.)- Bài viết này tóm tắt cách cài đặt FluxGym và tạo LoRA từ bộ dữ liệu hình ảnh của bạn.
GitHub - cocktailpeanut/fluxgym: Dead simple FLUX LoRA training UI with LOW VRAM support
Dead simple FLUX LoRA training UI with LOW VRAM support - cocktailpeanut/fluxgym
Hiểu về LoRA (Low-Rank Adaptation)
- LoRA là một kỹ thuật tinh chỉnh cho phép bạn tùy chỉnh mô hình cơ sở mà không cần đào tạo toàn bộ mạng
- Nó tạo ra một "phần bổ sung" nhỏ, chuyên biệt để dạy cho người mẫu những phong cách hoặc chủ đề mới
- Giảm đáng kể thời gian đào tạo và yêu cầu về tài nguyên so với việc tinh chỉnh mô hình đầy đủ
- Hoàn hảo để tạo trình tạo hình ảnh cá nhân trong khi vẫn duy trì khả năng của mô hình cơ sở
Tại sao lại chọn FluxGym?
- Đơn giản hóa quy trình đào tạo LoRA phức tạp thành giao diện web trực quan
- Loại bỏ nhu cầu về thao tác dòng lệnh hoặc kiến thức mã hóa
- Được tối ưu hóa đặc biệt cho hệ sinh thái mô hình FLUX
- Bao gồm các mặc định thông minh hoạt động tốt cho hầu hết các trường hợp sử dụng
- Hỗ trợ tạo phụ đề tự động bằng Florence-2
Yêu cầu
- Máy:
Windows 11
+ GPU có VRAM 12GB TỐI THIỂU (Kiểm tra thực tế cho thấy máy hoạt động mượt mà ngay cả với VRAM 10GB.) - Trình quản lý gói:
Pinokio
- Bưu kiện:
FluxGym
- Model:
FLUX.1 [dev]
- VAE:
ae.sft
- Bộ mã hóa văn bản:
clip_l.safetensors
,t5xxl_fp16.safetensors
Cài đặt Pinokio
Pinokio
là một công cụ chứa cho AI mã nguồn mở. Tương tự như Docker trong thế giới phần mềm, nó tạo ra một môi trường ảo biệt lập trong môi trường cục bộ, đơn giản hóa các phụ thuộc phức tạp giữa các thư viện trong nền. Tải xuống và cài đặt tệp phù hợp cho hệ điều hành của bạn từ liên kết này .
Cài đặt FluxGym
FluxGym
cho phép đào tạo hình ảnh siêu dễ dàng để tạo LoRA thông qua giao diện người dùng trực quan 3 bước. Tải xuống và cài đặt tệp phù hợp cho hệ điều hành của bạn từ liên kết này .
Chạy FluxGym
- Mọi khâu chuẩn bị cho khóa đào tạo LoRA đã hoàn tất. Khởi chạy
FluxGym
theo các bước sau:
Launch Pinokio
→ [FluxGym]
Đào tạo LoRA
- Khi giao diện web khởi chạy trong trình duyệt của bạn, hãy áp dụng các cài đặt sau để tạo LoRA tối ưu :
# Step 1. LoRA Info
→ The name of your LoRA: {your-lora-name}
→ Trigger word/sentence: {your-trigger-word}
→ Base model: [flux-dev]
→ VRAM: [12G] (default 24GB)
→ Repeat trains per image: 5 (default 10)
→ Max Train Epochs: 8 (default 16)
# Advanced options
→ --save_every_n_epochs: 2
# Step 2. Dataset
→ Upload your images: (Select and drag-and-drop at least 20 images for training)
→ [Add AI captions with Florence-2] (Automatically generate image captions)
# Step 3. Train
→ [Start training]
- Yếu tố quan trọng nhất là tập dữ liệu hình ảnh. Chọn và tải lên 20-30 hình ảnh về cùng một chủ đề với nhiều góc độ và môi trường khác nhau, tốt nhất là theo tỷ lệ bằng nhau.
- Dựa trên thiết lập ở trên, việc bắt đầu đào tạo với bộ dữ liệu 20 hình ảnh mất khoảng 8 giờ trên RTX 3080 (VRAM 10GB) . Do đó, bạn nên bắt đầu quá trình này trước khi đi ngủ.
- Sau khi quá trình đào tạo hoàn tất, LoRA được tạo dưới dạng tệp {your-lora-name}.safetensors trong thư mục pinokio\api\fluxgym.git\outputs . Nếu bạn đang sử dụng Stable Diffusion WebUI Forge , hãy sao chép tệp này vào thư mục Data/Models/Lora để sẵn sàng sử dụng.