Siri จะใช้ Gemini ใน iOS 27 จริงหรือ? ค้นพบข้อมูลที่ยืนยันแล้ว ข่าวลือ และเหตุใดการเปลี่ยนแปลงที่แท้จริงจึงอยู่ที่การสั่งงานแอป ไม่ใช่แค่ตอบคำถาม
มีรายงานข่าวหลายฉบับระบุว่า Apple อาจรวมโมเดล Google Gemini เป็นระบบ AI หลักของ Siri ใน iOS 27 จนถึงขณะนี้ Apple ยังไม่ได้ยืนยันเรื่องนี้อย่างเป็นทางการ แต่แม้ว่าจะเป็นจริง การเปลี่ยนแปลงที่สำคัญที่สุดไม่ใช่คุณภาพของคำตอบ แต่เป็นความสามารถของ Siri ในการสั่งงานแอปและดำเนินการต่างๆ บนโทรศัพท์แทนคุณ นี่คือความแตกต่างที่แท้จริง
| ข้อมูล | สถานะ | แหล่งที่มา |
|---|---|---|
| Apple ใช้โมเดล LLM ภายใน (Apple Foundation Models) | ยืนยันแล้ว | Apple Intelligence |
| Apple ให้บริการ Apple Intelligence สำหรับการทำความเข้าใจภาษาและการสรุปข้อความ | ยืนยันแล้ว | Apple Intelligence |
| Apple ใช้เฟรมเวิร์ค App Intents เพื่อให้แอปโต้ตอบกับ Siri ได้ | ยืนยันแล้ว | Apple App Intents |
| Apple อาจรวม Gemini เป็นโมเดลภายนอกเพื่อเสริมความสามารถของ Siri | รายงาน / ข่าวลือ | รายงานข่าวที่ยังไม่ได้รับการยืนยันจาก Apple |
| Siri จะสามารถสั่งงานแอปใดก็ได้โดยอัตโนมัติเต็มรูปแบบ | ไม่แน่นอน | ไม่มีประกาศอย่างเป็นทางการ |
| Apple จะยกเลิกโมเดลภายในของตัวเองทั้งหมด | ไม่แน่นอน | ไม่มีประกาศอย่างเป็นทางการ |
ผู้ผลิตโทรศัพท์ทุกรายมีโมเดลพื้นฐานในตัว แต่การสร้าง LLM ระดับโลกต้องใช้เวลาหลายปีในการวิจัยและเงินลงทุนมหาศาลในโครงสร้างพื้นฐาน แม้จะมี Apple Intelligence ก็ยังมีช่องว่างในความสามารถเมื่อเทียบกับโมเดลอย่าง Gemini จาก Google
กลยุทธ์ที่เป็นไปได้มากที่สุดคือไม่ใช่การแทนที่ทั้งหมด แต่เป็นแบบผสม: ใช้โมเดลภายในสำหรับงานง่ายและเร็ว (เข้าใจคำสั่งพื้นฐาน) และมอบหมายงานที่ซับซ้อน (การวิเคราะห์เชิงลึก การสร้างเนื้อหา) ให้โมเดลภายนอกอย่าง Gemini วิธีนี้รักษาความเป็นส่วนตัวในขณะที่ปรับปรุงคุณภาพคำตอบ
นี่คือจุดเปลี่ยนที่สำคัญ จนถึงขณะนี้ ผู้ช่วย AI ส่วนใหญ่ รวมถึง Siri ทำงานเป็นหลักในฐานะผู้ตอบคำถาม: "พรุ่งนี้อากาศเป็นอย่างไร?" หรือ "ข่าวล่าสุดคืออะไร?" แต่อนาคตที่แท้จริงของผู้ช่วย AI คือการ "ทำงานให้เสร็จ": "ส่งเอกสารนี้ทางอีเมล" หรือ "นัดหมายในปฏิทิน" หรือ "ซื้อสินค้านี้จากร้านค้า"
ความแตกต่างระหว่างการตอบคำถามกับการทำงานให้เสร็จเหมือนกับความแตกต่างระหว่างเสิร์ชเอนจินกับเลขาส่วนตัว นี่คือความหมายที่แท้จริงของ "AI Phone Agent"
Apple เปิดตัวเฟรมเวิร์ค App Intents เพื่อให้นักพัฒนาแอปสามารถกำหนดการดำเนินการที่ระบบสามารถทำได้โดยอัตโนมัติ ซึ่งหมายความว่าแอปไม่จำเป็นต้อง "มองเห็น" โดยผู้ใช้ ระบบสามารถเรียกใช้ฟังก์ชันของแอปได้โดยตรง
แต่ความเป็นจริงซับซ้อนกว่า: ไม่ใช่ทุกแอปจะรองรับ App Intents และจำนวนการดำเนินการที่รองรับยังมีจำกัด แม้ว่า Apple จะเพิ่ม Gemini เป็น AI หลัก ความสามารถในการสั่งงานแอปยังขึ้นอยู่กับการยอมรับ App Intents ของนักพัฒนา ไม่ใช่แค่ความฉลาดของผู้ช่วย
บน Android มีแอปที่พยายามนำเสนอประสบการณ์ AI Phone Agent อยู่แล้ว FoneClaw เป็นผู้ช่วย AI สำหรับโทรศัพท์ Android ที่รองรับ โดยเน้นการสั่งงานการดำเนินการของโทรศัพท์ที่รองรับ ช่วยให้ผู้ใช้ควบคุมการดำเนินการต่างๆ ผ่านคำสั่งเสียงและข้อความ
ควรระบุให้ชัดเจนว่า FoneClaw ทำงานเฉพาะบน Android ภายในขอบเขตของการดำเนินการที่รองรับเท่านั้น ไม่ได้อ้างว่าเหนือกว่า Apple หรือใช้งานได้บน iOS ทั้งสองระบบมุ่งสู่เป้าหมายเดียวกัน (AI Phone Agent) แต่ผ่านเส้นทางที่แตกต่างกัน
เส้นทางของ Apple อาศัยการผสานรวมเชิงลึกกับระบบปฏิบัติการและเฟรมเวิร์ค App Intents พร้อมความเป็นไปได้ในการใช้โมเดลภายนอกอย่าง Gemini เส้นทางของ Android เปิดกว้างกว่า: แอปอย่าง FoneClaw สามารถเข้าถึงฟังก์ชันบางอย่างของระบบได้โดยตรงผ่านสิทธิ์ Android
ไม่มีเส้นทาง "ถูก" เพียงเส้นทางเดียว ทั้งคู่เผชิญความท้าทาย: Apple ต้องโน้มน้าวให้นักพัฒนาใช้ App Intents และแอป Android ต้องจัดการกับการกระจายตัวของระบบและข้อจำกัดด้านสิทธิ์ แต่แนวโน้มชัดเจน: ปี 2027 จะเป็นปีแห่ง AI Phone Agent ไม่ว่าจะอยู่บนแพลตฟอร์มใดก็ตาม