Qwen giới thiệu Qwen3 Embedding series

Tác giả: Bạch DươngNgày cập nhật: 06/08/2025 08:52:13

Qwen giới thiệu Qwen3 Embedding series - dòng mô hình nhúng văn bản tiên tiến, đa ngôn ngữ và đa nhiệm, được thiết kế để nâng cao hiệu quả truy xuất thông tin và sắp xếp lại kết quả. Với nhiều kích thước mô hình từ 0.6B đến 8B tham số, Qwen3 Embedding series mở ra cơ hội mới cho các ứng dụng AI hiện đại, từ tìm kiếm nâng cao đến xử lý ngôn ngữ tự nhiên đa dạng.

Qwen giới thiệu Qwen3 Embedding series

1. Qwen3 Embedding series là gì?

Qwen3 Embedding Series là dòng mô hình mới được Qwen công bố, được thiết kế đặc biệt cho các nhiệm vụ nhúng văn bản (text embedding) và xếp hạng (reranking). Dựa trên nền tảng mô hình Qwen3, dòng mô hình này kế thừa khả năng hiểu ngôn ngữ đa dạng, xử lý văn bản dài và khả năng suy luận vượt trội. Với các kích thước mô hình từ 0.6B đến 8B, Qwen3 Embedding Series đáp ứng nhu cầu đa dạng từ hiệu suất cao đến tiết kiệm tài nguyên.

Mô hình embedding (nhúng) sử dụng kiến trúc dual-encoder, giúp trích xuất biểu diễn ngữ nghĩa chính xác cho từng đoạn văn bản. Mô hình reranking (sắp xếp lại) dùng kiến trúc cross-encoder để đánh giá mức độ liên quan giữa truy vấn và tài liệu, từ đó nâng cao chất lượng kết quả tìm kiếm.

Giới thiệu tổng quan về Qwen3 Embedding series

2. Điểm nổi bật của Qwen3 Embedding Series

Hiệu suất vượt trội

Theo thông tin từ trang chính thức của Qwen, mô hình embedding phiên bản 8B đã đạt điểm số 70.58 trên bảng xếp hạng MTEB đa ngôn ngữ (tính đến ngày 5/6/2025). Cùng với đó, các mô hình reranking cải thiện đáng kể độ liên quan trong kết quả tìm kiếm.

Qwen3 Embedding series trên bảng xếp hạng MTEB

Hỗ trợ đa ngôn ngữ và mã lập trình

Qwen3 Embedding Series hỗ trợ hơn 100 ngôn ngữ, bao gồm cả các ngôn ngữ lập trình, giúp thực hiện truy xuất và nhúng đa ngôn ngữ, liên ngôn ngữ và truy xuất mã nguồn hiệu quả.

Linh hoạt với tùy chỉnh

Qwen3 Embedding series cung cấp nhiều kích cỡ (từ 0,6B đến 8B) cho cả mô hình nhúng và xếp hạng lại, đáp ứng đa dạng nhu cầu sử dụng, ưu tiên hiệu quả và hiệu suất. Ngoài ra, mô hình nhúng cho phép điều chỉnh kích thước vector linh hoạt trên mọi chiều, trong khi cả hai mô hình nhúng và xếp hạng lại đều cho phép người dùng tùy chỉnh hướng dẫn đầu vào, nâng cao hiệu quả cho các tác vụ, ngôn ngữ hoặc tình huống cụ thể.

Mã nguồn mở và dễ tích hợp

Qwen3 Embedding Series được phát hành dưới giấy phép Apache 2.0, cho phép các nhà phát triển và doanh nghiệp tự do sử dụng và tích hợp vào các dự án. Mô hình có sẵn trên các nền tảng như Hugging Face, ModelScope và GitHub.

3. Danh sách mô hình Qwen3 Embedding serie

LOẠI MÔ HÌNH	PHIÊN BẢN	KÍCH CỠ	LỚP	CHIỀU DÀI CHUỖI	KÍCH THƯỚC VECTOR NHÚNG	HỖ TRỢ MRL	HỖ TRỢ HƯỚNG DẪN
Nhúng văn bản	Qwen3-Embedding-0.6B	0.6B	28	32K	1024	Có	Có
	Qwen3-Embedding-4B	4B	36	32K	2560	Có	Có
	Qwen3-Embedding-8B	8B	36	32K	4096	Có	Có
Sắp xếp lại văn bản	Qwen3-Reranker-0.6B	0.6B	28	32K	_	_	Có
	Qwen3-Reranker-4B	4B	36	32K	_	_	Có
	Qwen3-Reranker-8B	8B	36	32K	_	_	Có

Với việc Qwen giới thiệu Qwen3 Embedding series, ngành công nghiệp AI có thêm một lựa chọn mô hình nhúng văn bản đa ngôn ngữ, hiệu suất cao và linh hoạt. Đây là bước tiến quan trọng giúp nâng cao chất lượng truy xuất thông tin, xử lý ngôn ngữ và phát triển các ứng dụng AI đa dạng trong tương lai.

Trả góp 0%