Google Maps nâng cấp: Biết nghe và trò chuyện với người dùng

Google Maps - Ảnh 1. — Google Maps tích hợp mô hình Gemini 2.5

Sau khi ra mắt mô hình Gemini 2.5, Google tiếp tục đưa trí tuệ nhân tạo vào chính ứng dụng quen thuộc bậc nhất của mình là Google Maps. Lần đầu tiên, bản đồ không chỉ hiển thị đường đi mà còn có thể nghe, hiểu và phản hồi bằng ngôn ngữ tự nhiên, một bước tiến biến công cụ chỉ đường thành trợ lý giao tiếp thực thụ.

Khi Google Maps trở nên thông minh hơn

Theo blog chính thức của Google DeepMind (tháng 11-2025), Gemini 2.5, mô hình AI có khả năng thao tác trình duyệt và xử lý dữ liệu thực tế, đã bắt đầu được tích hợp thử nghiệm vào Google Maps. Mục tiêu là giúp người dùng có thể "trao đổi tự nhiên với bản đồ" thay vì gõ thủ công từng địa điểm hay tùy chọn phức tạp.

Gemini có thể hiểu các yêu cầu như: "Tìm quán ăn mở cửa trễ gần đây, tránh đường đang sửa" hay "Dẫn tôi về nhà nhưng ghé tiệm thuốc trên đường". Hệ thống sẽ tự động đọc dữ liệu giao thông thời gian thực, xác định vị trí người nói, và gợi ý tuyến đường phù hợp nhất.

"Gemini được huấn luyện để hiểu không chỉ từ ngữ mà cả mục đích của người dùng trong không gian thực" - Google mô tả trong bài đăng giới thiệu tính năng "Ask Gemini in Maps".

Theo tìm hiểu của Tuổi Trẻ Online, phiên bản thử nghiệm đầu tiên đang được triển khai tại Mỹ, Canada và Anh, với kế hoạch mở rộng sang các quốc gia châu Á trong năm 2026. Một số người dùng Android đã có thể kích hoạt bằng lệnh thoại "Ask Gemini in Maps" để ra lệnh hoặc trò chuyện trực tiếp.

Điểm đặc biệt là Gemini không chỉ tra cứu bản đồ, mà còn phân tích hình ảnh Street View, đánh giá cộng đồng, thói quen di chuyển và dữ liệu thời tiết nhờ đó, bản đồ có thể nói những câu tự nhiên như "Rẽ phải ở quán cà phê bà Bảy phía trước" thay vì "Rẽ phải sau 200 mét".

Công nghệ "nghe - hiểu - phản hồi" và bước tiến cá nhân hóa

Về mặt kỹ thuật, Gemini trong Maps ứng dụng mô hình đa phương thức (multimodal model) - kết hợp xử lý ngôn ngữ, hình ảnh và dữ liệu định vị để "hiểu" thế giới theo cách con người cảm nhận.

Hệ thống sử dụng kỹ thuật grounding (liên kết ngôn ngữ với vật thể và địa điểm cụ thể) cho phép AI hiểu các câu tự nhiên như "đi về hướng mặt trời lặn" hay "qua ngã ba có bảng hiệu màu đỏ".

So với Google Assistant trước đây, Gemini xử lý nhanh hơn khoảng hai lần, đồng thời giảm tiêu thụ dữ liệu đám mây nhờ khả năng xử lý cục bộ (on-device AI) trên các thiết bị Pixel và Android cao cấp. Điều này không chỉ giúp phản hồi gần như tức thì mà còn bảo vệ quyền riêng tư tốt hơn, vì nhiều lệnh thoại được xử lý ngay trên thiết bị của người dùng.

Giới quan sát công nghệ cho rằng sự xuất hiện của Gemini trong Maps có thể biến bản đồ thành một giao diện hội thoại thực thụ, nơi người dùng có thể đặt câu hỏi, điều chỉnh lộ trình hoặc tìm hiểu địa điểm mà không cần thao tác tay.

Xu hướng này cũng mở ra một giai đoạn mới: AI không chỉ trả lời câu hỏi, mà bắt đầu hành động thay con người trong thế giới thực.

Google vẫn chưa công bố thời điểm phát hành chính thức, nhưng giới chuyên môn dự đoán rằng năm 2026 sẽ là mốc mở rộng tích hợp Gemini sâu hơn vào hệ sinh thái Android từ chỉ đường, đặt xe cho tới quản lý hành trình di chuyển cá nhân.

Trở lại chủ đề

Tuấn Vĩ

Nguồn: https://tuoitre.vn/google-maps-nang-cap-biet-nghe-va-tro-chuyen-voi-nguoi-dung-20251107112218748.htm