ElevenLabs chính thức giới thiệu Conversational AI 2.0, mang đến tác nhân giọng nói AI tinh vi, thông minh và đáng tin cậy. Bản cập nhật này đã được cải tiến đáng kể, giúp doanh nghiệp dễ dàng tạo ra voice agents chuyên nghiệp và hiệu quả, cung cấp trải nghiệm giao tiếp tự nhiên và thông minh. Tìm hiểu kỹ hơn về ElevenLabs Conversational AI 2.0 trong bài viết dưới đây!
ElevenLabs ra mắt Conversational AI 2.0
Vào ngày 30/5/2025, ElevenLabs chính thức ra mắt Conversational AI 2.0, phiên bản nâng cấp toàn diện từ nền tảng 1.0 chỉ mới ra mắt cách đây 5 tháng. Với mục tiêu xây dựng các voice agents thông minh, tự nhiên và tin cậy, phiên bản 2.0 kết hợp những tính năng đột phá, đáp ứng yêu cầu khắt khe của doanh nghiệp hiện đại.
Không chỉ dừng lại ở khả năng giao tiếp mượt mà, Conversational AI 2.0 còn tích hợp các tính năng tiên tiến như Retrieval-Augmented Generation (RAG), turn-taking tự nhiên và hỗ trợ đa ngôn ngữ, giúp doanh nghiệp tối ưu hóa quy trình và nâng cao trải nghiệm người dùng.
Conversational AI 2.0 giao tiếp tự nhiên, thông minh và linh hoạt
Một trong những điểm mạnh của ElevenLabs Conversational AI 2.0 là khả năng xử lý nhịp điệu giao tiếp giống con người. Hệ thống sử dụng mô hình turn-taking (luân phiên lượt nói) tiên tiến, phân tích các tín hiệu giao tiếp như “um”, “ah” trong thời gian thực để xác định thời điểm nên trả lời hoặc chờ đợi. Điều này giúp loại bỏ các khoảng dừng khó xử hay gián đoạn không tự nhiên, mang đến trải nghiệm giao tiếp mượt mà, đặc biệt trong các tình huống như hỗ trợ khách hàng.
Ví dụ, khi người dùng tạm dừng để tìm thông tin (“Ồ, để tôi kiểm tra lại…”), AI sẽ kiên nhẫn chờ và phản hồi nhanh chóng, tạo cảm giác chân thực.
Conversational AI 2.0 sử dụng mô hình Turn-Taking cho giao tiếp tự nhiên
Retrieval-Augmented Generation (RAG) cho phép các tác nhân giọng nói AI truy cập thông tin từ cơ sở dữ liệu cụ thể với độ trễ tối thiểu và bảo mật tối đa. Điều này đặc biệt hữu ích cho các ứng dụng doanh nghiệp như:
Tính năng này không chỉ tăng cường độ chính xác mà còn đảm bảo dữ liệu nhạy cảm được xử lý an toàn, phù hợp với các tiêu chuẩn như HIPAA cho ngành y tế.
Conversational AI 2.0 tích hợp RAG truy cập tri thức nhanh, bảo mật cao
Conversational AI 2.0 tích hợp tính năng phát hiện ngôn ngữ tự động, cho phép AI nhận diện và phản hồi bằng ngôn ngữ mà người dùng sử dụng mà không cần tùy chỉnh ngôn ngữ thủ công. Điều này mở ra cơ hội cho các doanh nghiệp toàn cầu, giúp các cuộc hội thoại đa ngôn ngữ được liền mạch, từ dịch vụ khách hàng đến tiếp thị.
Conversational AI 2.0 phát hiện ngôn ngữ tự động, hỗ trợ đa ngôn ngữ
ElevenLabs Conversational AI 2.0 hỗ trợ xử lý đồng thời cả văn bản và giọng nói, mang lại sự linh hoạt cho người dùng. Ví dụ, người dùng có thể nhập số thẻ tín dụng bằng văn bản để tránh lỗi phiên âm, trong khi vẫn duy trì cuộc trò chuyện bằng giọng nói. Tính năng này giúp giảm sai sót, tăng trải nghiệm người dùng và cải thiện tỷ lệ hoàn thành nhiệm vụ.
ElevenLabs đã phát triển tính năng Batch Calling cho Conversational AI 2.0 giúp các doanh nghiệp tiếp cận lượng lớn khách hàng. Tính năng này cho phép thực hiện nhiều cuộc gọi đi cùng lúc nhờ các tác nhân AI giọng nói. Đây là giải pháp lý tưởng cho các chiến dịch như gửi cảnh báo, khảo sát hoặc gửi tin nhắn cá nhân hóa, đảm bảo tốc độ và tính nhất quán.
Không còn cố định ở một giọng nói như phiên bản 1.0, Conversational AI 2.0 mang đến khả năng chuyển đổi linh hoạt giữa nhiều nhân vật khác nhau trong cùng một tác nhân AI. Nhờ đó, người dùng có được trải nghiệm giao tiếp đa dạng, phù hợp với nhiều ngữ cảnh khác nhau.
Conversational AI 2.0 chuyển đổi đa nhân vật trong cùng một tác nhân
Conversational AI 2.0 được thiết kế với nền tảng vượt trội, đáp ứng các yêu cầu khắt khe của doanh nghiệp:
Tính ứng dụng thực tế của Conversational AI 2.0 được đánh giá cao, phù hợp cho nhiều trường hợp như:
TÍNH NĂNG | CONVERSATIONAL AI 1.0 | CONVERSATIONAL AI 2.0 |
---|---|---|
Điều phối đối thoại | API đàm thoại cơ bản | Mô hình luân phiên lượt nói Turn-taking |
Ngôn ngữ | Thay đổi thủ công | Tự động phát hiện ngôn ngữ |
Tri thức | Không có | RAG tích hợp |
Phương thức | Chỉ có giọng nói | Ba cách: giọng nói, văn bản, giọng nói + văn bản. |
Nhân vật | Giọng nói đơn cho mỗi tác nhân | Thay đổi nhiều nhân vân trong một tác nhân |
Chuẩn bị cho doanh nghiệp | Tiêu chuẩn bảo mật | Tuân thủ HIPAA, lưu trữ tại EU, bảo mật và độ tin cậy nâng cao |
Conversational AI 2.0 đánh dấu một bước nhảy vọt của ElevenLabs từ voice AI đơn giản tới một hệ thống giao tiếp đa ngôn ngữ, thông minh và sẵn sàng cho doanh nghiệp. Với các tính năng như turn-taking tự nhiên, tích hợp RAG, hỗ trợ đa ngôn ngữ và khả năng gọi hàng loạt, đây là giải pháp lý tưởng cho doanh nghiệp muốn nâng cao trải nghiệm khách hàng và tối ưu hóa quy trình.
Tải app theo dõi thông tin đơn hàng và hàng ngàn voucher giảm giá dành cho bạn.