Wan 2.2 TI2V 5B

Wan 2.2 TI2V 5B

文生视频图生视频

AI应用

应用大小：50 GB
适用资源：4090 | 5090
主系统：Ubuntu 24.04
应用环境：未知

应用介绍：

高效全能的 MoE 视频生成引擎

免费启动应用

说明文档

Wan 2.2 TI2V 5B 是万相（Wan）系列中的高效率混合模型。它首次在视频生成领域引入了 MoE（混合专家） 架构，并针对单卡运行进行了极致优化，支持 720P@24FPS 的高质量视频产出，是个人创作者进入 AI 影视创作领域的“性能小钢炮”。

核心技术突破

MoE 混合专家架构：Wan 2.2 放弃了传统的单一模型路径，通过 MoE 架构将去噪过程分为“高噪”和“低噪”专家处理。这使得模型在不增加推理开销的前提下，具备了媲美 14B 参数级别模型的构图与细节表现力。
TI2V 混合输入（Text-Image-to-Video）：该版本是一个“二合一”模型，原生支持文本提示（T2V）和参考图引导（I2V）。无论是从零生成视频，还是为静态图注入灵魂，都能在同一个框架下完成。
电影级审美与光影：基于 65.6% 增量的图像数据和 83.2% 增量的视频数据训练。新增了光影、构图、对比度等精细化美学标签，生成的画面具有极强的“胶片质感”和真实感。
高倍率视觉压缩：采用全新的 16x16x4 VAE 架构，实现了 64 倍的视觉压缩比。这使得模型能以更低的显存占用生成更长的视频帧序列，并显著减少“AI 闪烁”现象。

核心功能与亮点

精准的相机控制：原生理解专业镜头语言，支持如“Dolly In（推镜头）”、“Orbital Arc（环绕镜头）”及“Pan/Tilt（摇移）”等精确指令。
复杂动态模拟：在处理人物奔跑、水流波动及复杂物理交互时，运动轨迹更加连贯，大幅改善了旧版本常见的肢体形变问题。
极低硬件门槛：5B 版本经过轻量化设计，支持显存卸载（Offloading），可在 8GB/12GB 显存的消费级显卡（如 RTX 3060/4070）上流畅运行 720P 视频任务。
强化的负向提示词：显著提升了对 Negative Prompt 的遵循度，能更有效地剔除画面中的伪影、低分辨率和畸变元素。

适用群体

社交媒体博主：低成本、高频率产出高质量的短视频素材。
独立开发者/原型设计：在本地快速验证视频创意，为游戏或影视项目构建动态概念图。
ComfyUI 极客：利用配套的 Wan 2.2 节点构建高自由度的自动化视频生产流。

联系我们