Wan 2.2 TI2V 5B
文生视频图生视频AI应用
- 应用大小:50 GB
- 适用资源:4090 | 5090
- 主系统:Ubuntu 24.04
- 应用环境:未知
应用介绍:
高效全能的 MoE 视频生成引擎
免费启动应用
说明文档
Wan 2.2 TI2V 5B 是万相(Wan)系列中的高效率混合模型。它首次在视频生成领域引入了 MoE(混合专家) 架构,并针对单卡运行进行了极致优化,支持 720P@24FPS 的高质量视频产出,是个人创作者进入 AI 影视创作领域的“性能小钢炮”。
核心技术突破
- MoE 混合专家架构:Wan 2.2 放弃了传统的单一模型路径,通过 MoE 架构将去噪过程分为“高噪”和“低噪”专家处理。这使得模型在不增加推理开销的前提下,具备了媲美 14B 参数级别模型的构图与细节表现力。
- TI2V 混合输入(Text-Image-to-Video):该版本是一个“二合一”模型,原生支持文本提示(T2V)和参考图引导(I2V)。无论是从零生成视频,还是为静态图注入灵魂,都能在同一个框架下完成。
- 电影级审美与光影:基于 65.6% 增量的图像数据和 83.2% 增量的视频数据训练。新增了光影、构图、对比度等精细化美学标签,生成的画面具有极强的“胶片质感”和真实感。
- 高倍率视觉压缩:采用全新的 16x16x4 VAE 架构,实现了 64 倍的视觉压缩比。这使得模型能以更低的显存占用生成更长的视频帧序列,并显著减少“AI 闪烁”现象。
核心功能与亮点
- 精准的相机控制:原生理解专业镜头语言,支持如“Dolly In(推镜头)”、“Orbital Arc(环绕镜头)”及“Pan/Tilt(摇移)”等精确指令。
- 复杂动态模拟:在处理人物奔跑、水流波动及复杂物理交互时,运动轨迹更加连贯,大幅改善了旧版本常见的肢体形变问题。
- 极低硬件门槛:5B 版本经过轻量化设计,支持显存卸载(Offloading),可在 8GB/12GB 显存的消费级显卡(如 RTX 3060/4070)上流畅运行 720P 视频任务。
- 强化的负向提示词:显著提升了对 Negative Prompt 的遵循度,能更有效地剔除画面中的伪影、低分辨率和畸变元素。
适用群体
- 社交媒体博主:低成本、高频率产出高质量的短视频素材。
- 独立开发者/原型设计:在本地快速验证视频创意,为游戏或影视项目构建动态概念图。
- ComfyUI 极客:利用配套的 Wan 2.2 节点构建高自由度的自动化视频生产流。

