行业趋势
📅 2026-06-29 ⏱️ 8 分钟阅读 Dean Dean

iOS 27、Siri 与 Gemini 整合:手机操作范式转移的真正含义

多方报道称苹果可能在 iOS 27 中将 Google Gemini 引入 Siri。如果属实,真正的变革不是更聪明的聊天机器人——而是 Siri 终于学会操作应用程序并端到端完成手机操作。

iOS 27、Siri 与 Gemini 整合:手机操作范式转移的真正含义
📋 核心要点
📑 目录
  1. 快速回答
  2. 已确认、已报道还是不确定?
  3. 苹果为何可能使用外部模型
  4. Siri 真的能操作应用吗?
  5. App Intents 与可机器调用的应用
  6. 这对安卓用户和 FoneClaw 意味着什么
  7. 两个生态,通往手机智能体时代的不同路径

从 2025 年到 2026 年初,多家媒体报道称苹果正在探索——或已经达成协议——将 Google 的 Gemini 模型整合为 iOS 27 中 Siri 的后端。截至撰稿时,苹果尚未正式确认任何相关信息。我们确切知道的是,苹果正在大力投入让 Siri 具备做事的能力,而不仅仅是回答问题

这一区别至关重要。一个能帮你总结日程的语音助手很有用。一个能帮你预订会议、拒绝冲突安排、并给团队发消息的语音助手才是真正的变革。传闻中的 Gemini 整合可能是实现这一目标的手段。

快速回答

核心结论:彭博社、The Information 等媒体的报道表明,苹果可能在 iOS 27 中使用 Google Gemini 来驱动 Siri 的某些功能。苹果尚未公开确认这一点。如果属实,实际影响不是「Siri 变得更聪明」——而是「Siri 现在能安全地操作你的应用」。从回答问题到执行手机操作的转变才是真正的新闻。

已确认、已报道还是不确定?

围绕这个话题有大量噪音。以下是清晰的分类:

说法状态说明
苹果正在开发 Siri 的端侧 AI 模型已确认苹果在 WWDC 2024 发布了 Apple Intelligence,并在 iOS 18.x 更新中逐步改进了 Siri。
Siri 可以理解屏幕上下文并执行应用内操作已确认作为 Apple Intelligence 的一部分,已在 iOS 18.1+ 中上线。支持特定设备上的受支持应用。
苹果已与谷歌谈判将 Gemini 作为 Siri 后端已报道彭博社和 The Information 报道了持续的谈判。苹果和谷歌均未正式宣布。
Gemini 将完全取代苹果自己的模型不确定 / 不太可能大多数报道暗示混合方案——苹果的端侧模型处理隐私敏感任务,外部模型处理复杂推理。
iOS 27 将搭载 Gemini 驱动的 Siri 功能不确定没有官方确认。时间和范围仍属推测。
Siri 将能够跨应用完成多步骤手机操作部分确认苹果的 App Intents 框架使之成为可能。iOS 27 中的具体范围尚未公开。

苹果为何可能使用外部模型

苹果的端侧模型针对隐私和延迟进行了优化。它们善于处理个人上下文——知道「妈妈」是谁、理解你的日程、将数据保留在设备上。但在复杂的多步骤推理、长上下文理解和精细语言生成方面,目前大型云端模型仍有优势。

将 Gemini 用于特定任务,同时将隐私敏感操作保留在端侧,可以让苹果兼顾两者。这与苹果一贯的做法一致:严格控制用户体验,同时在需要的地方使用最佳组件。

值得注意的是,苹果在这方面已有先例。Apple Intelligence 被设计为根据任务复杂度在端侧和 Private Cloud Compute 之间路由。添加 Gemini 作为另一个路由选项并没有从根本上改变架构——而是扩展了它。

Siri 真的能操作应用吗?

这是对用户最重要的问题。答案是:越来越可以了。从 iOS 18.1 开始,Siri 可以在受支持的应用内执行操作——发送消息、编辑照片、移动文件等。但当前实现仍有局限。

挑战不在于智能——而在于整合。Siri 要「操作」一个应用,该应用必须以 Siri 可以发现和调用的方式暴露其操作。苹果为此提供的机制是 App Intents 框架。

App Intents 与可机器调用的应用

App Intents 是苹果的框架,允许开发者定义其应用可以代表 Siri、快捷指令和聚焦执行的操作。当一个应用采用 App Intents 时,它本质上变成了「可机器调用的」——Siri(或其他系统组件)可以调用特定操作,而无需用户手动点击界面。

这是实现手机智能体的基础架构。没有 App Intents,Siri 就需要像人一样模拟点击和滑动——既脆弱又低效。有了 App Intents,Siri 可以调用一个定义明确的函数:「为晚上 7 点预订这家餐厅」或「把最后一张照片发给这个联系人」。

强大的语言模型(无论是苹果自己的还是 Gemini)与结构良好的操作框架(App Intents)的结合,才是真正创建手机智能体的关键。仅有智能是不够的。系统需要一种可靠的方式将意图转化为行动。

这对安卓用户和 FoneClaw 意味着什么

在安卓平台上,FoneClaw 是一款 AI 手机助手,专为受支持的安卓手机操作而设计——拨打电话、发送消息、管理设置以及在拥有必要权限的设备上执行其他任务。FoneClaw 在安卓生态系统内运行,利用安卓的无障碍和自动化能力来执行真正的手机操作。

需要强调的是:FoneClaw 是为安卓打造的。它不是 iOS 应用,也不声称能在 iPhone 上运行。苹果的生态系统有不同的架构约束——App Intents、SiriKit 以及 iOS 施加的更严格的沙盒机制。将 FoneClaw 与 Siri 或 Apple Intelligence 直接比较并非同类比较。

有趣的是两者平行的发展轨迹。苹果(通过 Siri + App Intents)和安卓生态系统(通过 FoneClaw 等工具)正在朝同一个方向汇聚:AI 助手应该在你的手机上做事,而不只是谈论事情。执行路径不同,但目的地相似。

两个生态,通往手机智能体时代的不同路径

苹果和谷歌/安卓正在从相反的方向接近手机智能体的未来。苹果正在构建一个严格控制、隐私优先的系统,Siri 通过精心设计的框架(App Intents)操作应用。谷歌则将 Gemini 开放为一个平台,可以跨设备和服务(包括安卓)整合。

两种方法都不是绝对更优。苹果的模式提供更强的隐私保障和更一致的用户体验,但依赖于开发者对 App Intents 的采用。安卓模式提供更多灵活性和更快的迭代,但在不同设备间体验不够统一。

对用户而言,实际问题很简单:你的手机助手能否可靠地在你的设备上完成真实任务?无论背后的引擎是苹果的模型、谷歌的 Gemini 还是其他什么,价值在于执行。

常见问题

没有。截至撰稿时,苹果尚未正式确认与 Google Gemini 的任何 Siri 整合计划。多家可靠媒体报道称讨论和协议正在进行中,但尚无公开声明。
不一定。报道暗示采用混合方案,隐私敏感任务仍保留在端侧或通过苹果的 Private Cloud Compute 路由,而更复杂的推理任务可能使用外部模型。苹果有强烈的动机维持其隐私定位。
App Intents 是苹果的开发者框架,允许应用定义 Siri、快捷指令和聚焦可以调用的操作。它是使 Siri 能够在应用内执行真实操作而非仅仅回答问题的机制。
不能。FoneClaw 是一款安卓 AI 手机助手,专为受支持的安卓手机操作而设计。它无法在 iOS 或 iPhone 上运行。
回答问题是信息性的——Siri 告诉你一些事情。操作应用是事务性的——Siri 为你做一些事情。从回答到操作的转变意味着助手可以完成多步骤任务,如预订、发消息或代你管理手机设置。