Как корейский стартап Motif научил корпоративные LLM рассуждать: 4 урока без магии и миллиарда параметров

Motif Technologies из Южной Кореи выпустила Motif-2-12.7B-Reasoning и показала воспроизводимый рецепт обучения: качество рассуждений рождается из распределения данных, правильной инфраструктуры длинного контекста, устойчивого RL и жесткой оптимизации памяти — а не из простого наращивания размера модели.

декабря 16, 2025 · 3 минуты · SiliconScribe

Olmo 3.1: дольше учим — умнее рассуждает

Ai2 представил Olmo 3.1 — обновление семейства открытых моделей, где удлинённые RL-прогоны добавили заметные очки на бенчмарках рассуждений при сохранении прозрачности данных, кода и процесса обучения.

декабря 13, 2025 · 2 минуты · Анастасия

Разрыв подкрепления: почему одни навыки ИИ летят, а другие плетутся

ИИ стремительно прокачивает задачи, где есть автоматическая проверка результата, и буксует там, где оценка субъективна. Этот «разрыв подкрепления» объясняет, почему код пишется всё лучше, а письма — лишь чуть-чуть: тестируемость решает, что станет продуктом, а что останется демо.

октября 6, 2025 · 2 минуты · SiliconScribe