“灵光” 是蚂蚁集团于 2025 年 11 月 18 日正式发布的全模态通用 AI 助手,它也是业内首个全代码生成多模态内容的 AI 助手,目前已同步登陆安卓与苹果应用商店。其核心亮点是能在移动端实现 “自然语言 30 秒生成小应用”,核心理念是“让复杂变简单”,还支持 3D 数字模型、音频、图标等全模态信息输出,首批上线了三大核心功能。
🚀一、核心功能:重新定义人机交互
💬1. 灵光对话:结构化思维,信息秒懂💬
- 突破传统问答模式:通过结构化思维设计对话,回答逻辑清晰、表达简练,避免文字堆砌。
- 可视化内容生成:支持动态3D模型、可交互地图、音视频等全模态输出,使信息呈现更生动。例如,在教育场景中,用户咨询知识性问题时,灵光可生成3D实物动图或互动表格,将复杂信息简化。
- 信息组织优化:以“秒懂”为目标,通过优质的信息组织方式提升理解效率。
🛠️2. 灵光闪应用:30秒生成个性化AI工具🛠️
- 30秒生成AI应用:用户通过自然语言描述需求(如“生成健身计划工具”),灵光可在30秒至1分钟内生成可编辑、可交互、可分享的个性化应用。
- 参数自定义与场景拓展:支持用户调整应用参数(如鸡蛋大小、熟度),生成“溏心蛋时间计算器”等工具;还能调用大模型后端能力实现实时交互,拓宽使用场景(如养车成本计算器)。
👀3. 灵光开眼:AGI相机,实时解析物理世界👀
- AGI相机技术:通过实时视频流解析物理世界,支持文生图/视频、图生图/视频等创作模式。
- 场景化应用:在旅游场景中,用户用灵光对准建筑即可实时获取讲解信息。
🔧二、技术架构:多智能体协作,全代码生成🔧
- 全代码生成多模态内容:所有输出结果(如图表、动画、小应用组件)均由模型根据对话情境即时生成,而非依赖预设模板。
- 多智能体协作(Agentic架构):动态调度图像、3D、动画等专用Agent与工具,实时协作提供沉浸式视图体验。
🎯三、产品定位与优势:通用型AI助手,零门槛生产力工具🎯
- 定位:通用型AI助手,聚焦场景化生产力工具,重新定义人机交互边界。
- 优势:
- 零门槛AI Coding:普通用户可通过自然语言快速生成应用,降低技术门槛。
- 全模态交互:支持3D、音视频等多元信息输出,提升沟通效率。
- 实时交互能力:闪应用可调用后端模型,实现动态数据更新与外部交互。
🌍四、应用场景:覆盖教育、生活、旅游与生产力🌍
- 教育:生成互动式学习工具,简化复杂知识。
- 生活服务:快速创建健身计划、旅行规划器、健康食谱生成器等个性化应用。
- 旅游:通过AGI相机实时讲解建筑历史,增强沉浸感。
- 生产力工具:支持养车成本计算、时间管理等场景化需求。
📈五、市场背景:蚂蚁AGI战略的重要落地📈
灵光是蚂蚁集团AGI战略的重要落地产品,其推出标志着蚂蚁在通用人工智能领域从技术突破(如万亿参数模型“百灵”)到场景落地的全链路能力。此前,蚂蚁已布局AI医疗管家AQ、具身智能灵波科技等,形成多元化AI生态。
📝总结:灵光通过全模态输出、多智能体协作与零门槛应用生成能力,重新定义了AI助手的生产力边界,为用户提供更高效、更沉浸的交互体验。
网站上的服务均为第三方提供,与本站无关。请用户注意自行甄别服务。