Мы представляем ruMTEB — расширение популярного бенчмарка MTEB для оценки качества текстовых представлений (embeddings) специально для русского языка. В статье анализируются десятки моделей и предлагаются новые подходы к их обучению.
EmbeddingsNLPBenchmark