腾讯KaLM-Embedding登顶MMTEB，12B模型刷新检索性能

📅 发布时间：2026/7/4 23:23:21 👁️ 浏览次数：

腾讯KaLM-Embedding登顶MMTEB12B模型刷新检索性能【免费下载链接】KaLM-Embedding-Gemma3-12B-2511项目地址: https://ai.gitcode.com/tencent_hunyuan/KaLM-Embedding-Gemma3-12B-2511导语腾讯最新发布的KaLM-Embedding-Gemma3-12B-2511模型在多语言文本嵌入基准测试MMTEB中以72.32的任务均值和62.51的任务类型均值斩获榜首标志着中文技术团队在通用嵌入模型领域的重要突破。行业现状嵌入模型Embedding Model作为连接自然语言与机器学习系统的核心组件已成为大语言模型应用生态的关键基础设施。随着RAG检索增强生成技术的普及嵌入模型的性能直接影响智能问答、知识检索、语义分析等场景的效果。当前市场呈现轻量高效与大而全并行发展的趋势主流模型参数规模从数百万到数十亿不等而10B级模型正成为兼顾性能与成本的黄金平衡点。模型核心亮点KaLM-Embedding-Gemma3-12B-2511基于Google Gemma3-12B模型进行优化通过腾讯自研的训练技术实现了性能跃升。从MMTEB评测数据看该模型在12项任务中展现全面优势在检索Retrieval任务中以75.66分位居第一比第二名高出近7分在跨语言文本挖掘Bitext Mining和多标签分类Multilabel Classification任务中也分别以83.76分和33.03分刷新纪录。技术特性方面该模型具备三大优势一是32k的超长上下文处理能力可直接处理长文档语义理解二是支持7种不同维度的嵌入输出从64维到3840维满足不同场景的存储和计算需求三是同时兼容Sentence-Transformers和vLLM推理框架开发者可根据算力条件选择优化方案。行业影响此次登顶意味着中文团队在通用嵌入模型领域已具备与国际顶尖水平竞争的实力。对企业用户而言该模型在信息检索、智能客服、内容推荐等场景将带来显著效果提升——特别是在跨语言检索和长文档理解场景75.66分的检索性能意味着更精准的信息匹配和更低的误检率。值得注意的是腾讯采用基础模型专业优化的技术路线在Gemma3架构基础上针对嵌入任务进行专项优化这种模式为行业提供了高效的模型迭代思路。随着该模型的开源预计将推动国内RAG应用生态的进一步繁荣。结论与前瞻KaLM-Embedding-Gemma3-12B-2511的性能突破印证了大参数嵌入模型在复杂语义理解上的优势。未来随着多模态嵌入技术的发展以及与大语言模型的深度协同嵌入模型将在知识图谱构建、智能决策支持等更广泛领域发挥核心作用。对于开发者而言选择兼顾性能与效率的10B级模型正成为平衡成本与效果的理性选择。【免费下载链接】KaLM-Embedding-Gemma3-12B-2511项目地址: https://ai.gitcode.com/tencent_hunyuan/KaLM-Embedding-Gemma3-12B-2511创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

相关新闻

最新新闻

日新闻

周新闻

月新闻