Tác giả: Tuyết NgânNgày cập nhật: 17/06/2025172Tác giả: Tuyết Ngân16456
Qwen giới thiệu Qwen3 Embedding series - dòng mô hình nhúng văn bản tiên tiến, đa ngôn ngữ và đa nhiệm, được thiết kế để nâng cao hiệu quả truy xuất thông tin và sắp xếp lại kết quả. Với nhiều kích thước mô hình từ 0.6B đến 8B tham số, Qwen3 Embedding series mở ra cơ hội mới cho các ứng dụng AI hiện đại, từ tìm kiếm nâng cao đến xử lý ngôn ngữ tự nhiên đa dạng.
Qwen giới thiệu Qwen3 Embedding series
1. Qwen3 Embedding series là gì?
Qwen3 Embedding Series là dòng mô hình mới được Qwen công bố, được thiết kế đặc biệt cho các nhiệm vụ nhúng văn bản (text embedding) và xếp hạng (reranking). Dựa trên nền tảng mô hình Qwen3, dòng mô hình này kế thừa khả năng hiểu ngôn ngữ đa dạng, xử lý văn bản dài và khả năng suy luận vượt trội. Với các kích thước mô hình từ 0.6B đến 8B, Qwen3 Embedding Series đáp ứng nhu cầu đa dạng từ hiệu suất cao đến tiết kiệm tài nguyên.
Mô hình embedding (nhúng) sử dụng kiến trúc dual-encoder, giúp trích xuất biểu diễn ngữ nghĩa chính xác cho từng đoạn văn bản. Mô hình reranking (sắp xếp lại) dùng kiến trúc cross-encoder để đánh giá mức độ liên quan giữa truy vấn và tài liệu, từ đó nâng cao chất lượng kết quả tìm kiếm.
Giới thiệu tổng quan về Qwen3 Embedding series
2. Điểm nổi bật của Qwen3 Embedding Series
Hiệu suất vượt trội
Theo thông tin từ trang chính thức của Qwen, mô hình embedding phiên bản 8B đã đạt điểm số 70.58 trên bảng xếp hạng MTEB đa ngôn ngữ (tính đến ngày 5/6/2025). Cùng với đó, các mô hình reranking cải thiện đáng kể độ liên quan trong kết quả tìm kiếm.
Qwen3 Embedding series trên bảng xếp hạng MTEB
Hỗ trợ đa ngôn ngữ và mã lập trình
Qwen3 Embedding Series hỗ trợ hơn 100 ngôn ngữ, bao gồm cả các ngôn ngữ lập trình, giúp thực hiện truy xuất và nhúng đa ngôn ngữ, liên ngôn ngữ và truy xuất mã nguồn hiệu quả.
Linh hoạt với tùy chỉnh
Qwen3 Embedding series cung cấp nhiều kích cỡ (từ 0,6B đến 8B) cho cả mô hình nhúng và xếp hạng lại, đáp ứng đa dạng nhu cầu sử dụng, ưu tiên hiệu quả và hiệu suất. Ngoài ra, mô hình nhúng cho phép điều chỉnh kích thước vector linh hoạt trên mọi chiều, trong khi cả hai mô hình nhúng và xếp hạng lại đều cho phép người dùng tùy chỉnh hướng dẫn đầu vào, nâng cao hiệu quả cho các tác vụ, ngôn ngữ hoặc tình huống cụ thể.
Mã nguồn mở và dễ tích hợp
Qwen3 Embedding Series được phát hành dưới giấy phép Apache 2.0, cho phép các nhà phát triển và doanh nghiệp tự do sử dụng và tích hợp vào các dự án. Mô hình có sẵn trên các nền tảng như Hugging Face, ModelScope và GitHub.
3. Danh sách mô hình Qwen3 Embedding serie
LOẠI MÔ HÌNH
PHIÊN BẢN
KÍCH CỠ
LỚP
CHIỀU DÀI CHUỖI
KÍCH THƯỚC VECTOR NHÚNG
HỖ TRỢ MRL
HỖ TRỢ HƯỚNG DẪN
Nhúng văn bản
Qwen3-Embedding-0.6B
0.6B
28
32K
1024
Có
Có
Qwen3-Embedding-4B
4B
36
32K
2560
Có
Có
Qwen3-Embedding-8B
8B
36
32K
4096
Có
Có
Sắp xếp lại văn bản
Qwen3-Reranker-0.6B
0.6B
28
32K
_
_
Có
Qwen3-Reranker-4B
4B
36
32K
_
_
Có
Qwen3-Reranker-8B
8B
36
32K
_
_
Có
Với việc Qwen giới thiệu Qwen3 Embedding series, ngành công nghiệp AI có thêm một lựa chọn mô hình nhúng văn bản đa ngôn ngữ, hiệu suất cao và linh hoạt. Đây là bước tiến quan trọng giúp nâng cao chất lượng truy xuất thông tin, xử lý ngôn ngữ và phát triển các ứng dụng AI đa dạng trong tương lai.