voyage-code-2 — специализированная эмбеддинг-модель, которая выводит семантический поиск по коду на новый уровень. Этот ИИ значительно превосходит конкурентов в точности извлечения данных, становясь незаменимым инструментом для RAG-систем в сфере разработки ПО.
TL;DR – We are thrilled to introduce voyage-code-2, our latest embedding model specifically tailored for semantic retrieval of codes and related text data from both natural language and code queries. Our comprehensive evaluation, covering 11 code retrieval tasks (derived from popular coding datasets like HumanEval and MBPP), demonstrated a remarkable 14.52% improvement in recall compared to competitors, including OpenAI and Cohere. Additionally, we noted consistent gains, averaging 3.03%, across diverse general-purpose text datasets.