DeepSeek đề xuất phương pháp “Visual Primitives” để xử lý khoảng trống tham chiếu trong tác vụ đa phương thức, bằng cách đưa các đơn vị hình ảnh cơ bản như điểmDeepSeek đề xuất phương pháp “Visual Primitives” để xử lý khoảng trống tham chiếu trong tác vụ đa phương thức, bằng cách đưa các đơn vị hình ảnh cơ bản như điểm

DeepSeek công bố phương pháp suy luận nguyên thủy thị giác để tăng khả năng lý luận đa phương thức

2026/04/30 19:05
Leu 1 min
Para enviar feedbacks ou expressar preocupações a respeito deste conteúdo, contate-nos em crypto.news@mexc.com

DeepSeek đề xuất phương pháp “Visual Primitives” để xử lý khoảng trống tham chiếu trong tác vụ đa phương thức, bằng cách đưa các đơn vị hình ảnh cơ bản như điểm và khung vào chuỗi suy luận.

Phương pháp này dựa trên kiến trúc DeepSeek-V4-Flash và sử dụng bộ nhớ đệm key-value được nén để giảm tiêu thụ token hình ảnh. Nhóm phát triển cho biết mô hình sẽ được công bố trọng số sau khi tích hợp, đồng thời mở nguồn một phần bộ kiểm tra và dữ liệu trong thời gian tới.

DeepSeek cho biết hệ thống đạt kết quả tương đương GPT-5.4, Claude-Sonnet-4.6 và Gemini-3-Flash ở các bài kiểm tra đếm và suy luận không gian, dù chỉ trong một số chiều đánh giá nhất định.

Isenção de responsabilidade: Os artigos republicados neste site são provenientes de plataformas públicas e são fornecidos apenas para fins informativos. Eles não refletem necessariamente a opinião da MEXC. Todos os direitos permanecem com os autores originais. Se você acredita que algum conteúdo infringe direitos de terceiros, entre em contato pelo e-mail crypto.news@mexc.com para solicitar a remoção. A MEXC não oferece garantias quanto à precisão, integridade ou atualidade das informações e não se responsabiliza por quaisquer ações tomadas com base no conteúdo fornecido. O conteúdo não constitui aconselhamento financeiro, jurídico ou profissional, nem deve ser considerado uma recomendação ou endosso por parte da MEXC.