主页 > 豌豆AI > 正文

苹果新研究:AI不听录音,凭文本描述能零样本识别洗碗等12种活动

2025-12-05 16:22:05来源:Techweb编辑:李川峰

扫一扫

分享文章到微信

扫一扫

关注豌豆财经网微信公众号

  IT之家 11 月 22 日消息,科技媒体 9to5Mac 昨日(11 月 21 日)发布博文,报道称在最新公布的研究报告中,苹果指出大语言模型(LLM)可通过分析音频和运动数据的文本描述,精准识别用户活动,未来可能会应用于 Apple Watch 上。

  这项名为“后期多模态传感器融合”(Late Multimodal Sensor Fusion)的技术,主要结合 LLM 的推理能力与传统传感器数据,即使在传感器信息不足的情况下,也能精确判断用户正在进行的具体活动。

  研究的核心方法颇具新意。大语言模型并未直接处理用户的原始音频录音或运动数据,而是分析由专门的小型模型生成的文本描述。

  具体来说,音频模型会生成描述声音环境的文字(如“水流声”),而基于惯性测量单元(IMU)的运动模型则会输出动作类型的预测文本。这种方式不仅保护了用户隐私,还验证了 LLM 在理解和融合多源文本信息以进行复杂推理方面的强大能力。

  为验证该方法,研究团队使用了包含数千小时第一人称视角视频的 Ego4D 数据集。他们从中筛选出 12 种日常活动,包括吸尘、烹饪、洗碗、打篮球、举重等,每段样本时长 20 秒。

  随后,研究人员将小模型生成的文本描述输入给谷歌的 Gemini-2.5-pro 和阿里的 Qwen-32B 等多个大语言模型,并测试其在“零样本”(无任何示例)和“单样本”(提供一个示例)两种情况下的识别准确率。

  测试结果显示,即使没有任何针对性地训练,大语言模型在活动识别任务中的表现也远超随机猜测的水平,其 F1 分数(衡量精确率和召回率的指标)表现优异。当获得一个参考示例后,模型的准确度还会进一步提升。

  这项研究表明,利用 LLM 进行后期融合,可以有效开发出强大的多模态应用,而无需为特定场景开发专门模型,从而节省了额外的内存和计算资源。苹果公司还公开了实验数据和代码,以供其他研究者复现和验证。

     投稿邮箱:lukejiwang@163.com   详情访问豌豆财经网:http://www.wdyxw.com.cn

相关推荐
任正非最新讲话曝光 1.4万字 信息量巨大 任正非最新讲话曝光 1.4万字 信息量巨大

12月5日消息,近日,华为创始人任正非在位于上海的华为练秋湖研发中心与IC

豌豆AI2025-12-05

被Meta挖走多名AI工程师后 苹果挖走了Meta的首席法 被Meta挖走多名AI工程师后 苹果挖走了Meta的首席法

12月5日消息,据外媒报道,从今年6月份开始,扎克伯格担任CEO的Meta在招揽AI人

豌豆AI2025-12-05

四天告别四位高管,苹果高层面临大换血 四天告别四位高管,苹果高层面临大换血

四天时间,苹果四位高管先后离职,其中包括两位核心竞争力负责人。虽然一位

豌豆AI2025-12-05

新研究:OpenAI算力需求持续激增 2028年支出将达 新研究:OpenAI算力需求持续激增 2028年支出将达

11月21日消息,据媒体报道,巴克莱银行最新研究报告指出,AI行业的资本开支周

豌豆AI2025-12-05

英伟达营收已连续10个财季创下新高 还有望再延 英伟达营收已连续10个财季创下新高 还有望再延

11月21日消息,据外媒报道,在生成式人工智能热潮中大赚的英伟达,在昨日凌

豌豆AI2025-12-05

消息称 OpenAI 正从苹果的硬件工程团队中大肆挖人 消息称 OpenAI 正从苹果的硬件工程团队中大肆挖人

IT之家 11 月 23 日消息,据彭博社记者马克・古尔曼今日报道,OpenAI 正在从苹果

豌豆AI2025-12-05

阿里“千问”App首周下载破1000万 刷新AI类应用增 阿里“千问”App首周下载破1000万 刷新AI类应用增

快科技11月24日消息,今日,阿里巴巴宣布千问APP公测第一周即突破1000万下载。

豌豆AI2025-12-05

马斯克称将“深度参与”特斯拉AI芯片设计 目标 马斯克称将“深度参与”特斯拉AI芯片设计 目标

11月25日消息,特斯拉CEO马斯克日前在社交平台表示,他本人将“深度参与”特

豌豆AI2025-12-05

Anthropic最新Claude Opus 4.5大模型上市,API价格大降 Anthropic最新Claude Opus 4.5大模型上市,API价格大降

11月25日消息,Anthropic最新的大模型Claude Opus 4.5今天上市。Anthropic团队表示,C

豌豆AI2025-12-05

TechWeb微晚报:可折叠iPhone有望2399美元起售,史上 TechWeb微晚报:可折叠iPhone有望2399美元起售,史上

今日要闻一览: Anthropic最新Claude Opus 4.5大模型上市,API价格大降2/3 马斯克称将

豌豆AI2025-12-05