OpenBMB представила MiniCPM5-1B — компактную языковую модель с 1 миллиардом параметров, способную работать на смартфоне без подключения к облаку. Эта разработка поддерживает Model Context Protocol и нативный вызов инструментов, что позволяет реализовать локальные агентные сценарии прямо на пользовательском устройстве.
Модель демонстрирует высокую разговорную плавность и занимает лидирующие позиции среди аналогов своего класса по ряду тестов, включая задачи агентных взаимодействий и логического рассуждения. При этом MiniCPM5-1B способна удерживать в памяти до 128 тысяч токенов, что позволяет проводить длительные диалоги или анализировать большие объемы текста без потери контекста.
В основе лежит инновационная архитектура InfLLM v2, которая сокращает вычислительные ресурсы, обрабатывая каждый токен с минимальным числом соседних элементов. Обучение проводилось на 8 триллионах токенов с применением методов усиленного обучения и эффективной дистилляции, что повысило точность и уменьшило избыточные ответы.
Тесты выявили некоторые ограничения: модель не всегда ловко справляется с логическими ловушками и склонна к уклончивым ответам в сложных вопросах. Тем не менее, при подключении к MCP-серверу снижается вероятность ошибок, а MiniCPM5-1B успешно обращается к внешним данным, например, актуальной информации о ценах или рекомендациям.
MiniCPM5-1B обещает стать удобным инструментом для локальных AI-агентов на слабом «железе» — от ведения разговоров до работы с документами и организацией повседневных задач без интернета. Модель доступна бесплатно на Hugging Face под лицензией Apache 2.0.
