行业趋势

📅 2026-06-29 ⏱️ 8 分钟阅读 Dean

Dean

iOS 27、Siri 与 Gemini 整合：手机操作范式转移的真正含义

多方报道称苹果可能在 iOS 27 中将 Google Gemini 引入 Siri。如果属实，真正的变革不是更聪明的聊天机器人——而是 Siri 终于学会操作应用程序并端到端完成手机操作。

📋 核心要点

苹果尚未公开确认 iOS 27 的 Siri 会使用 Google Gemini；这仍应被视为报道或传闻，而不是官方事实。
真正的变化不是模型名称，而是 Siri 能否可靠操作应用、理解上下文并完成多步骤手机任务。
FoneClaw 代表同一趋势在 Android 上的落地路线：通过用户确认来执行受支持的手机操作。

📑 目录

快速回答
已确认、已报道还是不确定？
苹果为何可能使用外部模型
Siri 真的能操作应用吗？
App Intents 与可机器调用的应用
这对安卓用户和 FoneClaw 意味着什么
两个生态，通往手机智能体时代的不同路径

从 2025 年到 2026 年初，多家媒体报道称苹果正在探索——或已经达成协议——将 Google 的 Gemini 模型整合为 iOS 27 中 Siri 的后端。截至撰稿时，苹果尚未正式确认任何相关信息。我们确切知道的是，苹果正在大力投入让 Siri 具备做事的能力，而不仅仅是回答问题。

这一区别至关重要。一个能帮你总结日程的语音助手很有用。一个能帮你预订会议、拒绝冲突安排、并给团队发消息的语音助手才是真正的变革。传闻中的 Gemini 整合可能是实现这一目标的手段。

快速回答

核心结论：彭博社、The Information 等媒体的报道表明，苹果可能在 iOS 27 中使用 Google Gemini 来驱动 Siri 的某些功能。苹果尚未公开确认这一点。如果属实，实际影响不是「Siri 变得更聪明」——而是「Siri 现在能安全地操作你的应用」。从回答问题到执行手机操作的转变才是真正的新闻。

已确认、已报道还是不确定？

围绕这个话题有大量噪音。以下是清晰的分类：

说法	状态	说明
苹果正在开发 Siri 的端侧 AI 模型	已确认	苹果在 WWDC 2024 发布了 Apple Intelligence，并在 iOS 18.x 更新中逐步改进了 Siri。
Siri 可以理解屏幕上下文并执行应用内操作	已确认	作为 Apple Intelligence 的一部分，已在 iOS 18.1+ 中上线。支持特定设备上的受支持应用。
苹果已与谷歌谈判将 Gemini 作为 Siri 后端	已报道	彭博社和 The Information 报道了持续的谈判。苹果和谷歌均未正式宣布。
Gemini 将完全取代苹果自己的模型	不确定 / 不太可能	大多数报道暗示混合方案——苹果的端侧模型处理隐私敏感任务，外部模型处理复杂推理。
iOS 27 将搭载 Gemini 驱动的 Siri 功能	不确定	没有官方确认。时间和范围仍属推测。
Siri 将能够跨应用完成多步骤手机操作	部分确认	苹果的 App Intents 框架使之成为可能。iOS 27 中的具体范围尚未公开。

苹果为何可能使用外部模型

苹果的端侧模型针对隐私和延迟进行了优化。它们善于处理个人上下文——知道「妈妈」是谁、理解你的日程、将数据保留在设备上。但在复杂的多步骤推理、长上下文理解和精细语言生成方面，目前大型云端模型仍有优势。

将 Gemini 用于特定任务，同时将隐私敏感操作保留在端侧，可以让苹果兼顾两者。这与苹果一贯的做法一致：严格控制用户体验，同时在需要的地方使用最佳组件。

值得注意的是，苹果在这方面已有先例。Apple Intelligence 被设计为根据任务复杂度在端侧和 Private Cloud Compute 之间路由。添加 Gemini 作为另一个路由选项并没有从根本上改变架构——而是扩展了它。

Apple Intelligence 官方页面

Siri 真的能操作应用吗？

这是对用户最重要的问题。答案是：越来越可以了。从 iOS 18.1 开始，Siri 可以在受支持的应用内执行操作——发送消息、编辑照片、移动文件等。但当前实现仍有局限。

挑战不在于智能——而在于整合。Siri 要「操作」一个应用，该应用必须以 Siri 可以发现和调用的方式暴露其操作。苹果为此提供的机制是 App Intents 框架。

App Intents 与可机器调用的应用

App Intents 是苹果的框架，允许开发者定义其应用可以代表 Siri、快捷指令和聚焦执行的操作。当一个应用采用 App Intents 时，它本质上变成了「可机器调用的」——Siri（或其他系统组件）可以调用特定操作，而无需用户手动点击界面。

这是实现手机智能体的基础架构。没有 App Intents，Siri 就需要像人一样模拟点击和滑动——既脆弱又低效。有了 App Intents，Siri 可以调用一个定义明确的函数：「为晚上 7 点预订这家餐厅」或「把最后一张照片发给这个联系人」。

强大的语言模型（无论是苹果自己的还是 Gemini）与结构良好的操作框架（App Intents）的结合，才是真正创建手机智能体的关键。仅有智能是不够的。系统需要一种可靠的方式将意图转化为行动。

这对安卓用户和 FoneClaw 意味着什么

在安卓平台上，FoneClaw 是一款 AI 手机助手，专为受支持的安卓手机操作而设计——拨打电话、发送消息、管理设置以及在拥有必要权限的设备上执行其他任务。FoneClaw 在安卓生态系统内运行，利用安卓的无障碍和自动化能力来执行真正的手机操作。

需要强调的是：FoneClaw 是为安卓打造的。它不是 iOS 应用，也不声称能在 iPhone 上运行。苹果的生态系统有不同的架构约束——App Intents、SiriKit 以及 iOS 施加的更严格的沙盒机制。将 FoneClaw 与 Siri 或 Apple Intelligence 直接比较并非同类比较。

有趣的是两者平行的发展轨迹。苹果（通过 Siri + App Intents）和安卓生态系统（通过 FoneClaw 等工具）正在朝同一个方向汇聚：AI 助手应该在你的手机上做事，而不只是谈论事情。执行路径不同，但目的地相似。

两个生态，通往手机智能体时代的不同路径

苹果和谷歌/安卓正在从相反的方向接近手机智能体的未来。苹果正在构建一个严格控制、隐私优先的系统，Siri 通过精心设计的框架（App Intents）操作应用。谷歌则将 Gemini 开放为一个平台，可以跨设备和服务（包括安卓）整合。

两种方法都不是绝对更优。苹果的模式提供更强的隐私保障和更一致的用户体验，但依赖于开发者对 App Intents 的采用。安卓模式提供更多灵活性和更快的迭代，但在不同设备间体验不够统一。

对用户而言，实际问题很简单：你的手机助手能否可靠地在你的设备上完成真实任务？无论背后的引擎是苹果的模型、谷歌的 Gemini 还是其他什么，价值在于执行。

常见问题

苹果是否已确认 Siri 将在 iOS 27 中使用 Google Gemini？

没有。截至撰稿时，苹果尚未正式确认与 Google Gemini 的任何 Siri 整合计划。多家可靠媒体报道称讨论和协议正在进行中，但尚无公开声明。

如果 Gemini 驱动 Siri，是否意味着 Siri 会将我所有数据发送给谷歌？

不一定。报道暗示采用混合方案，隐私敏感任务仍保留在端侧或通过苹果的 Private Cloud Compute 路由，而更复杂的推理任务可能使用外部模型。苹果有强烈的动机维持其隐私定位。

什么是 App Intents 框架？

App Intents 是苹果的开发者框架，允许应用定义 Siri、快捷指令和聚焦可以调用的操作。它是使 Siri 能够在应用内执行真实操作而非仅仅回答问题的机制。

FoneClaw 能在 iPhone 或 iOS 上使用吗？

不能。FoneClaw 是一款安卓 AI 手机助手，专为受支持的安卓手机操作而设计。它无法在 iOS 或 iPhone 上运行。

Siri 回答问题和操作应用之间的真正区别是什么？

回答问题是信息性的——Siri 告诉你一些事情。操作应用是事务性的——Siri 为你做一些事情。从回答到操作的转变意味着助手可以完成多步骤任务，如预订、发消息或代你管理手机设置。