Siri có dùng Gemini trong iOS 27 hay không vẫn chưa được xác nhận. Điều quan trọng là khả năng điều khiển ứng dụng và tác vụ điện thoại.
Đã có nhiều bài báo đưa tin rằng Apple có thể tích hợp các mô hình Google Gemini làm nền tảng AI cho Siri trong bản cập nhật iOS 27. Tính đến thời điểm hiện tại, Apple vẫn chưa chính thức xác nhận sự tích hợp này. Nhưng ngay cả khi điều đó xảy ra, sự thay đổi lớn nhất sẽ không nằm ở chất lượng câu trả lời — mà ở khả năng của Siri trong việc vận hành ứng dụng và thực hiện các thao tác trên điện thoại thay bạn. Đây mới là sự khác biệt thực sự.
| Thông tin | Trạng thái | Nguồn |
|---|---|---|
| Apple sử dụng các mô hình LLM nội bộ (Apple Foundation Models) | Đã xác nhận | Apple Intelligence |
| Apple cung cấp Apple Intelligence cho việc hiểu ngôn ngữ và tóm tắt văn bản | Đã xác nhận | Apple Intelligence |
| Apple sử dụng framework App Intents để cho phép ứng dụng tương tác với Siri | Đã xác nhận | Apple App Intents |
| Apple có thể tích hợp Gemini làm mô hình bên ngoài để nâng cao khả năng của Siri | Đưa tin / Tin đồn | Các bài báo chưa được Apple xác nhận |
| Siri sẽ có thể tự động vận hành bất kỳ ứng dụng nào một cách đầy đủ | Chưa chắc chắn | Không có thông báo chính thức |
| Apple sẽ từ bỏ hoàn toàn các mô hình nội bộ của mình | Chưa chắc chắn | Không có thông báo chính thức |
Mọi nhà sản xuất điện thoại đều có mô hình nền tảng tích hợp sẵn. Nhưng việc xây dựng một mô hình LLM đẳng cấp thế giới đòi hỏi nhiều năm nghiên cứu và hàng tỷ đô la đầu tư vào cơ sở hạ tầng. Ngay cả với Apple Intelligence, vẫn còn khoảng cách về khả năng so với các mô hình như Gemini của Google.
Chiến lược có khả năng xảy ra nhất không phải là thay thế hoàn toàn, mà là cách tiếp cận kết hợp: sử dụng các mô hình nội bộ cho các tác vụ đơn giản và nhanh chóng (hiểu các lệnh cơ bản), và giao phó các tác vụ phức tạp (phân tích sâu, tạo nội dung) cho các mô hình bên ngoài như Gemini. Cách này bảo vệ quyền riêng tư đồng thời cải thiện chất lượng câu trả lời.
Đây chính là bước ngoặt then chốt. Cho đến nay, hầu hết các trợ lý AI thông minh — bao gồm cả Siri — chủ yếu hoạt động như những người trả lời câu hỏi: "Thời tiết ngày mai thế nào?" hoặc "Tin tức mới nhất là gì?". Nhưng tương lai thực sự của trợ lý AI là "hoàn thành công việc": "Gửi tài liệu này qua email" hoặc "Đặt lịch hẹn trong lịch" hoặc "Mua sản phẩm này từ cửa hàng".
Sự khác biệt giữa trả lời câu hỏi và hoàn thành công việc giống như sự khác biệt giữa công cụ tìm kiếm và trợ lý cá nhân. Đây mới là ý nghĩa thực sự của "AI Phone Agent".
Apple đã ra mắt framework App Intents để cho phép các nhà phát triển ứng dụng định nghĩa các hành động mà hệ thống có thể thực hiện tự động. Điều này có nghĩa là ứng dụng không cần "hiển thị" cho người dùng — hệ thống có thể gọi trực tiếp các chức năng của ứng dụng.
Tuy nhiên, thực tế phức tạp hơn: không phải tất cả ứng dụng đều hỗ trợ App Intents, và số lượng hành động được hỗ trợ hiện vẫn còn hạn chế. Ngay cả khi Apple thêm Gemini làm nền tảng AI, khả năng vận hành ứng dụng phụ thuộc vào việc các nhà phát triển có áp dụng App Intents hay không — chứ không chỉ vào sự thông minh của trợ lý.
Trên Android, đã có những ứng dụng cố gắng mang đến trải nghiệm AI Phone Agent. FoneClaw là trợ lý AI cho điện thoại Android được hỗ trợ, tập trung vào việc vận hành các thao tác điện thoại được hỗ trợ. FoneClaw cho phép người dùng điều khiển một số thao tác qua lệnh thoại và văn bản.
Cần làm rõ rằng FoneClaw hoạt động độc quyền trên Android trong phạm vi các thao tác được hỗ trợ — không tuyên bố vượt trội hơn Apple hay hoạt động trên iOS. Cả hai hệ thống đều hướng đến cùng mục tiêu (AI Phone Agent), nhưng qua các con đường khác nhau.
Con đường của Apple dựa trên sự tích hợp sâu với hệ điều hành và framework App Intents, cùng với khả năng sử dụng các mô hình bên ngoài như Gemini. Con đường của Android mở hơn: các ứng dụng như FoneClaw có thể truy cập một số chức năng hệ thống trực tiếp thông qua quyền Android.
Không có con đường "đúng" duy nhất. Cả hai đều đối mặt thách thức: Apple phải thuyết phục các nhà phát triển áp dụng App Intents, và các ứng dụng Android phải đối phó với sự phân mảnh của hệ thống và giới hạn quyền. Nhưng xu hướng rõ ràng: năm 2027 sẽ là năm của AI Phone Agent — bất kể nền tảng nào.