
通义万相是阿里云通义大模型旗下的 AI 视觉生成模型,具备文生图、图生图、文生视频、图生视频等功能,支持多种艺术风格和比例选择,拥有自研架构、性能卓越,在权威评测中表现出色,于 2025 年 2 月 25 日全面开源,适用于影视、广告、设计等多个领域。
功能特点
图像生成
文生图:用户输入文字描述,能生成水彩、扁平插画、二次元、油画、中国画、3D 卡通和素描等多种风格图像。
图生图:基于用户上传图片,进行二次创作或风格迁移。
涂鸦作画:用户简单涂鸦,AI 可将其转化为完整艺术作品。
虚拟模特与写真:能生成各种风格和姿态的虚拟人物模特图像,还可将用户照片转换为不同风格艺术写真。
视频生成
文生视频:输入文本描述,如复杂的场景、人物动作、情节等,可生成 720P/30 帧的高清视频,支持中英文多语言输入。
图生视频:可将任意图片转化为动态视频,按照上传图像比例或预设比例生成,通过提示词控制视频运动。
技术优势
架构创新:采用自研 3D 因果 VAE 和时空全注意力 DiT 架构,全新的时空全注意机制让模型能更准确模拟现实世界复杂动态,还引入参数共享机制,提升性能同时降低训练成本。
性能卓越:在权威评测 VBench 中以 86.22% 总分登顶,超越 Sora、Pika 等模型,在运动幅度、多对象生成、空间关系等关键能力表现出色。
显存优化:设计创新的视频编解码方案,通过拆分视频并缓存中间特征,实现显存使用与原始视频长度无关,支持无限长 1080P 视频的高效编解码。
应用场景
个人创作:普通用户可快速生成个性化头像、壁纸或社交媒体配图。
设计领域:为平面设计师、插画师提供创意灵感和素材参考。
营销推广:企业能生成独特的营销图片、视频,提升品牌视觉效果。
教育领域:在美术教育中作为辅助工具,帮助学生理解不同艺术风格和创作技巧。
影视动画:在影视创作、动画制作中,可用于生成角色原型、创意短片等。
网站上的服务均为第三方提供,与本站无关。请用户注意自行甄别服务。
数据统计
相关导航

AIEASE 是涵盖 AI 照片编辑平台(具备头像生成、背景移除等功能,操作便捷且保护隐私)、AI 智能体数字人开发(融合多技术打造具备 AI 能力的数字人,应用于多领域助企降本增效)及 AI 智能体名片等的多功能 AI 产品。

Uncrop
Uncrop是Phot AI旗下的一款专门用于图像裁剪和扩展的工具,它利用人工智能技术向外扩展图片画布的边缘,并分析图片的内容,根据内容生成新的像素。这可以确保扩展后的图片与原图的风格和内容保持一致。

影像之匠PixPretty
影像之匠 PixPretty 是一款为商业摄影而生的商业级 AI 人像后期软件,具有智能预设、人像精修、色彩调节、海量滤镜、批量修图等功能。

吐司AI
吐司 AI 是上海必有回响智能科技推出的 AI 绘画平台,具备一键运行大模型、构建工作流环境、模型分享、个性化训练、互动社区等核心功能,具有低门槛、高效、风格多样、操作友好等优势,可应用于个性化艺术创作、商业、教育等场景。

椒图 AI
椒图AI以“零门槛、高效率、商业级效果”为核心优势,用户反馈其人物一致性处理精准(如头发颜色、表情调整),生成速度极快,且支持免费体验,成为PhotoShop等传统软件的替代方案。

Whisk
Whisk是谷歌实验室(Google Labs)推出的一款创新的AI图像生成工具,它为用户提供了一种全新的、以图像为基础的创作方式,爆火网络的巨物宝可梦系列图片就是利用 Whisk 生成的。

磁力开创
磁力开创是快手磁力引擎推出的一站式AI视频生产平台,专为广告主、内容创作者及企业提供高效、低成本的视频创意解决方案。

Upscayl
免费开源的跨平台 AI 图像放大增强工具,它利用先进的人工智能算法(如 Real-ESRGAN 等)和 Vulkan 架构,可将低分辨率的图片进行高质量的放大、锐化、降噪、超分辨率重建等处理,且支持批量操作,能满足摄影后期、数字艺术、历史图像修复等多种场景的需求。
暂无评论...




