一键部署所需应用

MuseTalk

MuseTalk

让静态人像瞬间“开口”的实时对口型专家

官方官方

免费镜像立即启动
Janus

Janus

多模态理解与生成的全能统一体

官方官方

免费镜像立即启动
LlamaFactory

LlamaFactory

让大模型微调变得像“工厂组装”一样简单

官方官方

免费镜像立即启动
LatentSync

LatentSync

赋予视频角色“说话”灵魂的精准对口型引擎

官方官方

免费镜像立即启动
Chatterbox TTS

Chatterbox TTS

具备灵魂与情感控制力的开源语音之星

官方官方

免费镜像立即启动
HunyuanVideo-1.5

HunyuanVideo-1.5

轻量、极速的专业级视频生成模型

官方官方

免费镜像立即启动
DeepSeek-OCR-2

DeepSeek-OCR-2

全场景高精度视觉文字识别

官方官方

免费镜像立即启动
VibeVoice-ASR

VibeVoice-ASR

懂分寸、会认人的全能语音识别专家

官方官方

免费镜像立即启动
VoxCPM

VoxCPM

懂语义、有情感的端到端语音生成引擎

官方官方

免费镜像立即启动
MediaCrawler

MediaCrawler

全能自媒体数据采集与分析助手

官方官方

免费镜像立即启动
ebook2audiobook

ebook2audiobook

个人专享的 AI 有声书制作专家

官方官方

免费镜像立即启动
Dolphin

Dolphin

字节跳动自研的高精度文档解析引擎

官方官方

免费镜像立即启动
F5-TTS

F5-TTS

化繁为简的“速写式”语音生成引擎

官方官方

免费镜像立即启动
InstantID

InstantID

零样本人像一致性生成的标杆工具

官方官方

免费镜像立即启动
Framepack

Framepack

革新性的长视频渐进式生成引擎

官方官方

免费镜像立即启动
Qwen3-TTS

Qwen3-TTS

开启“声音设计”时代的开源语音大模型

官方官方

免费镜像立即启动
Z-Image-Turbo

Z-Image-Turbo

高性能图像生成模型

官方官方

免费镜像立即启动
HunyuanImage 2.1

HunyuanImage 2.1

腾讯全能视觉创作大模型

官方官方

免费镜像立即启动
Wan2.2 Animate

Wan2.2 Animate

统一角色动画与替换的视觉生成引擎

官方官方

免费镜像立即启动
LTX-2

LTX-2

音视频统一生成的工业级视觉引擎

官方官方

免费镜像立即启动
FLUX.2-klein

FLUX.2-klein

极致速度与轻量化的视觉引擎

官方官方

免费镜像立即启动
Qwen-Image

Qwen-Image

理解与生成一体化的全能视觉大模型

官方官方

免费镜像立即启动
GLM-Image

GLM-Image

认知级“自回归+扩散”混合图像生成大模型

官方官方

免费镜像立即启动
FLUX.1 Kontext Dev

FLUX.1 Kontext Dev

多模态上下文 AI 创作引擎

官方官方

免费镜像立即启动
ComfyUI

ComfyUI

极致灵活的模块化 AI 绘画工作站

官方官方

免费镜像立即启动
Stable Diffusion WebUI

Stable Diffusion WebUI

AI 绘画的行业标准工作站

官方官方

免费镜像立即启动
DreamO

DreamO

字节跳动全能图像定制化创作引擎

官方官方

免费镜像立即启动
Wan 2.2 TI2V 5B

Wan 2.2 TI2V 5B

高效全能的 MoE 视频生成引擎

官方官方

免费镜像立即启动
FishSpeech

FishSpeech

SOTA 级全开源语音合成引擎

官方官方

免费镜像立即启动
SkyReels-V1

SkyReels-V1

首款 AI 短剧级开源视频生成大模型

官方官方

免费镜像立即启动
HiDream-I1/E1

HiDream-I1/E1

中国自研视觉生成大模型的领军者

官方官方

免费镜像立即启动
OmniGen2

OmniGen2

重新定义大一统视觉生成范式

官方官方

免费镜像立即启动
HivisionIDPhotos

HivisionIDPhotos

轻量级高效 AI 证件照制作工具

官方官方

免费镜像立即启动
TRELLIS 3D模型生成

TRELLIS 3D模型生成

高保真结构化 3D 资产生成大模型

官方官方

免费镜像立即启动
UniPic-2

UniPic-2

理解、生成与编辑的统一多模态模型

官方官方

免费镜像立即启动
CosyVoice2

CosyVoice2

极致拟人的全场景流式语音大模型

官方官方

免费镜像立即启动
FireRedTTS2

FireRedTTS2

SOTA 级对话语音合成引擎

官方官方

免费镜像立即启动
IndexTTS 2

IndexTTS 2

极致精准的工业级情感语音合成引擎

官方官方

免费镜像立即启动
IDM-VTON虚拟试衣

IDM-VTON虚拟试衣

下一代 AI 虚拟试衣与服装生成平台

官方官方

免费镜像立即启动
DeepSeek-OCR

DeepSeek-OCR

极致高效的视觉上下文压缩引擎

官方官方

免费镜像立即启动
GPT-SoVITS

GPT-SoVITS

引领行业的开源语音克隆与 TTS 框架

官方官方

免费镜像立即启动
FaceFusion

FaceFusion

工业级 AI 人脸换脸与增强平台

官方官方

免费镜像立即启动
Fluxgym

Fluxgym

零门槛 FLUX.1 LoRA 训练工作站

官方官方

免费镜像立即启动
联系我们联系我们