Phi-4: когда ум данных сильнее массы параметров

Microsoft Phi-4 показал, что аккуратная, «учебная» подборка данных и дисциплинированный SFT с каплей RL способны превзойти куда более крупные модели. Меньше токенов — больше смысла: от отбора задач на грани умений до модульной настройки доменов и синтетических переписываний под проверяемые ответы.

ноября 18, 2025 · 2 минуты · Михаил