通义万相

1年前更新 3,786 0 0

通义万相是阿里云通义大模型旗下的 AI 视觉生成模型，具备文生图、图生图、文生视频、图生视频等功能，支持多种艺术风格和比例选择，拥有自研架构、性能卓越，在权威评测中表现出色，于 2025 年 2 月 25 日全面开源，适用于影视、广告、设计等多个领域。

所在地：

中国

语言：

收录时间：

2025-03-07

打开网站手机查看

通义万相

打开网站

通义万相是阿里云通义大模型旗下的 AI 视觉生成模型，具备文生图、图生图、文生视频、图生视频等功能，支持多种艺术风格和比例选择，拥有自研架构、性能卓越，在权威评测中表现出色，于 2025 年 2 月 25 日全面开源，适用于影视、广告、设计等多个领域。

功能特点

图像生成

文生图：用户输入文字描述，能生成水彩、扁平插画、二次元、油画、中国画、3D 卡通和素描等多种风格图像。

图生图：基于用户上传图片，进行二次创作或风格迁移。

涂鸦作画：用户简单涂鸦，AI 可将其转化为完整艺术作品。

虚拟模特与写真：能生成各种风格和姿态的虚拟人物模特图像，还可将用户照片转换为不同风格艺术写真。

视频生成

文生视频：输入文本描述，如复杂的场景、人物动作、情节等，可生成 720P/30 帧的高清视频，支持中英文多语言输入。

图生视频：可将任意图片转化为动态视频，按照上传图像比例或预设比例生成，通过提示词控制视频运动。

技术优势

架构创新：采用自研 3D 因果 VAE 和时空全注意力 DiT 架构，全新的时空全注意机制让模型能更准确模拟现实世界复杂动态，还引入参数共享机制，提升性能同时降低训练成本。

性能卓越：在权威评测 VBench 中以 86.22% 总分登顶，超越 Sora、Pika 等模型，在运动幅度、多对象生成、空间关系等关键能力表现出色。

显存优化：设计创新的视频编解码方案，通过拆分视频并缓存中间特征，实现显存使用与原始视频长度无关，支持无限长 1080P 视频的高效编解码。

应用场景

个人创作：普通用户可快速生成个性化头像、壁纸或社交媒体配图。

设计领域：为平面设计师、插画师提供创意灵感和素材参考。

营销推广：企业能生成独特的营销图片、视频，提升品牌视觉效果。

教育领域：在美术教育中作为辅助工具，帮助学生理解不同艺术风格和创作技巧。

影视动画：在影视创作、动画制作中，可用于生成角色原型、创意短片等。

网站上的服务均为第三方提供，与本站无关。请用户注意自行甄别服务。

分页阅读

数据统计

暂无评论

暂无评论...

通义万相

功能特点

图像生成

视频生成

技术优势

应用场景

数据统计

相关导航

Stable Diffusion

BeadPattern

Short AI

剧幕AI

移乐AI

Morisot

神采AI

MagicLight AI

暂无评论

网址

秒哒

Krene

Xiaomi MiMo Studio

白日梦

QoderWork

TapTap制造

热门网址

通义万相

功能特点

图像生成

视频生成

技术优势

应用场景

数据统计

相关导航

Stable Diffusion

BeadPattern

Short AI

剧幕AI

移乐AI

Morisot

神采AI

MagicLight AI

暂无评论

网址

秒哒

Krene

Xiaomi MiMo Studio

白日梦

QoderWork

TapTap制造

热门网址

标签云