MERA Benchmark | SBER AI | SBER AI

MERA Benchmark

Open Source

Первый открытый бенчмарк для комплексной оценки фундаментальных языковых моделей на русском языке.

10K+

пользователей

MERA Benchmark

Быстрый старт

# Запуск оценки модели на MERA
pip install mera-benchmark

from mera import evaluate

results = evaluate(
    model="ai-forever/rugpt3large",
    tasks=["ruMMLU", "ruTiE", "ruOpenBookQA"]
)

print(results.summary())

Возможности

Комплексность

50+ задач оценки

Лидерборд

Публичный рейтинг

Open Source

Открытый код и данные

Стандарт

Единая методология

О продукте

MERA (Multimodal Evaluation for Russian) — это проект по созданию единого стандарта оценки качества LLM. Он включает в себя десятки разнообразных задач: от логического вывода до понимания культурного контекста. Задачи бенчмарка: - Обеспечение прозрачного сравнения моделей. - Выявление слабых мест в архитектурах нейросетей. - Стимулирование развития открытых моделей на русском языке.

Технологии

BenchmarkEvaluationNLPDataset

Информация

ТипBenchmark

МодальностьТекст

ЛицензияОткрытый доступ

Обновленоянварь 2026 г.