Статья описывает методологию и результаты тестирования крупнейших мультиязычных моделей эмбеддингов. Мы анализируем производительность на редких языках и предлагаем пути улучшения кросс-языкового понимания.
MultilingualEmbeddingsBenchmark
Масштабный мультиязычный бенчмарк для оценки текстовых эмбеддингов на 112 языках и 5 задачах.
Подпишитесь на рассылку и получайте последние новости и исследования Sber AI