複数の報道によると、AppleはiOS 27でGoogle GeminiをSiriに統合する可能性がある。もしそれが事実なら、本当の変革はより賢いチャットボットではなく、Siriがようやくアプリを操作し、スマホアクションをエンドツーエンドで完了できるようになることだ。
2025年から2026年初頭にかけて、複数のメディアがAppleがGoogleのGeminiモデルをiOS 27におけるSiriのバックエンドとして統合することを検討している—or 既に合意に至っている—と報じている。執筆時点でAppleからの正式な確認はない。確かなのは、AppleがSiriに答える能力だけでなく、実行する能力を持たせることに力を入れているということだ。
この違いは極めて重要だ。カレンダーを要約してくれる音声アシスタントは便利だ。会議を予約し、競合を断り、チームにメッセージを送れる音声アシスタントこそが真の変革だ。噂されているGemini統合は、その目標を達成するための手段かもしれない。
結論:BloombergやThe Informationなど複数のメディアの報道によると、AppleはiOS 27でSiriの一部機能にGoogle Geminiを使用する可能性がある。Appleはこれを公式に認めていない。もしこれが事実なら、実際の影響は「Siriが賢くなる」ことではなく、「Siriがアプリを安全に操作できるようになる」ことだ。質問に答えることからスマホアクションを実行することへの転換こそが本当のニュースだ。
この話題には多くのノイズがある。以下は明確な整理だ:
| 主張 | ステータス | 備考 |
|---|---|---|
| AppleがSiri用のオンデバイスAIモデルを開発している | 確認済み | AppleはWWDC 2024でApple Intelligenceを発表し、iOS 18.xのアップデートでSiriを段階的に改善してきた。 |
| Siriが画面のコンテキストを理解し、アプリ内アクションを実行できる | 確認済み | Apple Intelligenceの一環としてiOS 18.1+で提供開始。対応デバイスの対応アプリで動作する。 |
| AppleがGeminiをSiriのバックエンドとして使用するようGoogleと交渉している | 報道済み | BloombergとThe Informationが継続的な交渉を報じた。AppleとGoogleいずれも公式発表はない。 |
| GeminiがApple自社モデルを完全に置き換える | 不確実 / ありそうにない | ほとんどの報道はハイブリッドアプローチを示唆している—Appleのオンデバイスモデルがプライバシー敏感タスクを処理し、外部モデルが複雑な推論を担当。 |
| iOS 27がGemini搭載Siri機能を出荷する | 不確実 | 公式確認なし。時期と範囲は依然として推測の域を出ない。 |
| Siriがアプリを跨いだ複数ステップのスマホアクションを完了できるようになる | 部分的に確認済み | AppleのApp Intentsフレームワークがこれを可能にする。iOS 27での具体的な範囲はまだ公表されていない。 |
Appleのオンデバイスモデルはプライバシーとレイテンシに最適化されている。個人のコンテキスト処理に優れている—「ママ」が誰かを知り、スケジュールを理解し、データをデバイスに保持する。しかし複雑な多段階推論、長文コンテキスト理解、繊細な言語生成の分野では、現在の大規模クラウドホスト型モデルがまだ優位にある。
Geminiを特定のタスクに使用しつつ、プライバシー敏感な操作をオンデバイスに保持することで、Appleは両方の長所を提供できる。これはAppleの伝統的なアプローチと一致している:ユーザーエクスペリエンスを厳密に制御しながら、必要な場所で最高のコンポーネントを活用する。
Appleにはすでに前例がある。Apple Intelligenceはタスクの複雑さに応じてオンデバイスとPrivate Cloud Computeの間でルーティングするよう設計されている。Geminiを別のルーティングオプションとして追加しても、アーキテクチャは根本的に変わらない—拡張されるだけだ。
これはユーザーにとって最も重要な質問だ。答えは:ますますできるようになっている、だ。iOS 18.1以降、Siriは対応アプリ内でアクションを実行できる—メッセージ送信、写真編集、ファイル移動など。ただし現在の実装には限界がある。
課題はインテリジェンスではなく統合にある。Siriがアプリを「操作」するには、そのアプリがSiriが発見し呼び出せる形でアクションを公開する必要がある。Appleが提供するメカニズムがApp Intentsフレームワークだ。
App Intentsは、開発者がアプリがSiri、ショートカット、スポットライトに代わって実行できるアクションを定義できるようにするAppleのフレームワークだ。アプリがApp Intentsを採用すると、本質的に「機械呼び出し可能」になる—Siri(または他のシステムコンポーネント)はユーザーがインターフェースをタップすることなく、特定のアクションを呼び出せる。
これがスマホエージェントを実現する基盤だ。App Intentsがなければ、Siriは人間のようにタップやスワイプをシミュレートする必要がある—脆弱で低速だ。App Intentsがあれば、Siriは明確に定義された関数を呼び出せる:「今夜7時にこのレストランを予約して」や「最後の写真をこの連絡先に送って」。
強力な言語モデル(Apple自社かGeminiかを問わず)と構造化されたアクションフレームワーク(App Intents)の組み合わせこそが、真のスマホエージェントを生み出す鍵だ。インテリジェンスだけでは不十分だ。システムには意図をアクションに変換する信頼できる方法が必要だ。
Androidプラットフォームでは、FoneClawが対応するAndroidスマホアクション—通話発信、メッセージ送信、設定管理、必要な権限を持つデバイスでのその他のタスク実行—のために設計されたAIスマホアシスタントだ。FoneClawはAndroidエコシステム内で動作し、Androidのアクセシビリティと自動化機能を活用して実際のスマホアクションを実行する。
重要なニュアンスとして:FoneClawはAndroid用に構築されている。iOSアプリではなく、iPhoneで動作するとも主張していない。Appleのエコシステムには異なるアーキテクチャ上の制約がある—App Intents、SiriKit、iOSが課すより厳格なサンドボックス。FoneClawをSiriやApple Intelligenceと直接比較することは、りんごとりんごの比較ではない。
興味深いのは二つの平行する軌道だ。Apple(Siri + App Intents経由)とAndroidエコシステム(FoneClawのようなツール経由)は同じ方向に向かっている:AIアシスタントはスマホ上で実際に動くべきだ、ただ語るだけでなく。実行パスは異なるが、目的地は似ている。
AppleとGoogle/Androidは反対方向からスマホエージェントの未来に近づいている。Appleは厳密に制御された、プライバシーを最優先するシステムを構築しており、Siriは入念に設計されたフレームワーク(App Intents)を通じてアプリを操作する。GoogleはGeminiをプラットフォームとして開放し、デバイスやサービス(Androidを含む)を横断して統合できるようにしている。
どちらのアプローチが絶対的に優れているわけではない。Appleのモデルはより強力なプライバシー保証と一貫したユーザーエクスペリエンスを提供するが、開発者のApp Intents採用に依存する。Androidモデルはより多くの柔軟性と高速なイテレーションを提供するが、デバイス間の体験が統一されにくい。
ユーザーにとって実際の問題はシンプルだ:あなたのスマホアシスタントはデバイス上で実際のタスクを確実に完了できるか?背後にあるエンジンがAppleのモデルであれGoogleのGeminiであれ、それ以外であれ、価値は実行にある。