首页 > 新车测评 > 新车测评 > 苹果传统强项再发力,视觉领域三种模态终于统一

苹果传统强项再发力,视觉领域三种模态终于统一

发布时间:2025-09-23 09:34:57来源: 15210273549

苹果新品发售的热度还没消退,大家都在讨论新手机的硬件进化。

而在 AI 功能方面,苹果仍然没有拿出什么颠覆性的应用,Apple Intelligence 在国内仍然遥遥无期。

再叠加上近期苹果 AI 团队和硬件团队的人才流失,这一切似乎对苹果而言都不是太乐观。

虽说苹果在大模型领域上总是吃瘪,但说一个不冷不热的知识:苹果在计算机视觉领域的智能研究是其传统强项。

在构建和视觉相关的大模型时,有一个非常显著的痛点。视觉模态包含图像、视频和三维这三种,这些视觉模态具备不同是数据维度和表征方式,在研究中几乎不可避免的需要分开处理,使得视觉模型被拆分为三个相不互通的研究领域,难以实现视觉领域的统一泛化。

但大语言模型却已经通过统一的分词方案展现出了强大的泛化能力。

然而,视觉 AI 仍然呈现出割裂状态,不同任务与模态依赖专门化的模型:图像、视频和三维资产通常需要独立的分词器,这些分词器往往只在 高保真重建 或 语义理解 其中之一上进行优化,而极少兼顾二者。

为此,Apple 研究团队提出了 ATOKEN(A Unified Tokenizer for Vision),针对这一核心局限,提出了首个能够在所有主要视觉模态上进行统一处理的视觉分词器,并同时兼顾重建质量与语义理解。

这一成果标志着朝着创建具备通用性与泛化能力的视觉表征迈出了重要一步。

新车测评更多>>

里程碑:AMD x86处理器总份额首度突破25% 1299元起!iPhone Pocket手机包正式开售 苹果:限量发售抢到就是赚 第17次双11大促,一次远场与近场的混战 球爆了!樊振东4-2逆转王楚钦,17板对拉炸场全运会 金鸡奖2025爆点,倪妮冲上主持台!明星阵容曝光、谁能夺大满贯? 00后女孩每月花五千买“秒回师”引热议:快节奏生活的新体现 泉州惠安第一民企迎来80后女总裁,身家260亿,曾为福建女首富 东风日产N6预售,10万级插混市场迎来“全能选手” 创维鸿途混动版正式申报,侧滑门,车长5490mm,7/9座布局 Similarweb 报告全球 AI 流量:Gemini 成 ChatGPT 最强劲对手 2025年天猫“双11”:实现四年来全周期最好增长 消息称三星三折叠屏手机已生产2万到3万部 有望年内发布 iPhone Pocket1299元起售,可当围巾甚至发绳,你会买吗? 威海瑞威房车:“产品+场景”打造“一站式户外生活”新生态 顶流IP下凡!特斯拉电摩曝光,4972元起售,这波品牌加持谁能拒绝 家用车天花板!全新丰田卡罗拉曝光,混动4L油耗+纯电 600km 轴距超3米1大SUV,承接尊界S800与问界M9中间空白? 丰田全新“小陆地巡洋舰”亮相,非承载式车身+四驱,混动系统兼 理想i9谍照首曝!明年亮相或许要成MPV“卷王” 300多项技术突破!中国6G领跑全球,但真正的标准大战才刚开始 高通推出跃龙IQ-X系列处理器 赋能工业PC与边缘智能升级 巅峰对决!江苏女排3-0完胜河南锁定头名,张常宁:珍惜每一场 我国完成第一阶段6G技术试验,形成300多项关键技术储备 马龙首秀胜利!赛后居然拍王楚钦屁股 没想到大头还调侃马龙 太逗了 英国男子垃圾桶 “寻宝” 上瘾!月赚 5600 元,捡过 1.4 万 Gucci 包 七星山荒野求生唯一女选手“冷美人”退赛 水下憋气4分钟!“水上芭蕾”是如何练成的? 全运男篮:四川逆转辽宁获季军,胡金秋主导战局,周琦末节定乾坤 银杏黄金周倒计时!6大秘境+2个宝藏地的终极玩法,错过再等一年 全运会游泳赛场:张展硕破纪录夺冠,潘展乐摘铜引热议