Qwen giới thiệu Qwen3 Embedding series - dòng mô hình nhúng văn bản tiên tiến, đa ngôn ngữ và đa nhiệm, được thiết kế để nâng cao hiệu quả truy xuất thông tin và sắp xếp lại kết quả. Với nhiều kích thước mô hình từ 0.6B đến 8B tham số, Qwen3 Embedding series mở ra cơ hội mới cho các ứng dụng AI hiện đại, từ tìm kiếm nâng cao đến xử lý ngôn ngữ tự nhiên đa dạng.
Qwen giới thiệu Qwen3 Embedding series
Qwen3 Embedding Series là dòng mô hình mới được Qwen công bố, được thiết kế đặc biệt cho các nhiệm vụ nhúng văn bản (text embedding) và xếp hạng (reranking). Dựa trên nền tảng mô hình Qwen3, dòng mô hình này kế thừa khả năng hiểu ngôn ngữ đa dạng, xử lý văn bản dài và khả năng suy luận vượt trội. Với các kích thước mô hình từ 0.6B đến 8B, Qwen3 Embedding Series đáp ứng nhu cầu đa dạng từ hiệu suất cao đến tiết kiệm tài nguyên.
Mô hình embedding (nhúng) sử dụng kiến trúc dual-encoder, giúp trích xuất biểu diễn ngữ nghĩa chính xác cho từng đoạn văn bản. Mô hình reranking (sắp xếp lại) dùng kiến trúc cross-encoder để đánh giá mức độ liên quan giữa truy vấn và tài liệu, từ đó nâng cao chất lượng kết quả tìm kiếm.
Giới thiệu tổng quan về Qwen3 Embedding series
Theo thông tin từ trang chính thức của Qwen, mô hình embedding phiên bản 8B đã đạt điểm số 70.58 trên bảng xếp hạng MTEB đa ngôn ngữ (tính đến ngày 5/6/2025). Cùng với đó, các mô hình reranking cải thiện đáng kể độ liên quan trong kết quả tìm kiếm.
Qwen3 Embedding series trên bảng xếp hạng MTEB
Qwen3 Embedding Series hỗ trợ hơn 100 ngôn ngữ, bao gồm cả các ngôn ngữ lập trình, giúp thực hiện truy xuất và nhúng đa ngôn ngữ, liên ngôn ngữ và truy xuất mã nguồn hiệu quả.
Qwen3 Embedding series cung cấp nhiều kích cỡ (từ 0,6B đến 8B) cho cả mô hình nhúng và xếp hạng lại, đáp ứng đa dạng nhu cầu sử dụng, ưu tiên hiệu quả và hiệu suất. Ngoài ra, mô hình nhúng cho phép điều chỉnh kích thước vector linh hoạt trên mọi chiều, trong khi cả hai mô hình nhúng và xếp hạng lại đều cho phép người dùng tùy chỉnh hướng dẫn đầu vào, nâng cao hiệu quả cho các tác vụ, ngôn ngữ hoặc tình huống cụ thể.
Qwen3 Embedding Series được phát hành dưới giấy phép Apache 2.0, cho phép các nhà phát triển và doanh nghiệp tự do sử dụng và tích hợp vào các dự án. Mô hình có sẵn trên các nền tảng như Hugging Face, ModelScope và GitHub.
LOẠI MÔ HÌNH | PHIÊN BẢN | KÍCH CỠ | LỚP | CHIỀU DÀI CHUỖI | KÍCH THƯỚC VECTOR NHÚNG | HỖ TRỢ MRL | HỖ TRỢ HƯỚNG DẪN |
---|---|---|---|---|---|---|---|
Nhúng văn bản | Qwen3-Embedding-0.6B | 0.6B | 28 | 32K | 1024 | Có | Có |
Qwen3-Embedding-4B | 4B | 36 | 32K | 2560 | Có | Có | |
Qwen3-Embedding-8B | 8B | 36 | 32K | 4096 | Có | Có | |
Sắp xếp lại văn bản | Qwen3-Reranker-0.6B | 0.6B | 28 | 32K | _ | _ | Có |
Qwen3-Reranker-4B | 4B | 36 | 32K | _ | _ | Có | |
Qwen3-Reranker-8B | 8B | 36 | 32K | _ | _ | Có |
Với việc Qwen giới thiệu Qwen3 Embedding series, ngành công nghiệp AI có thêm một lựa chọn mô hình nhúng văn bản đa ngôn ngữ, hiệu suất cao và linh hoạt. Đây là bước tiến quan trọng giúp nâng cao chất lượng truy xuất thông tin, xử lý ngôn ngữ và phát triển các ứng dụng AI đa dạng trong tương lai.
Tải app theo dõi thông tin đơn hàng và hàng ngàn voucher giảm giá dành cho bạn.