Microsoft представила новейшую разработку в области искусственного интеллекта, модель Phi-3 Mini, обладающую уникальной компактностью и эффективностью. Несмотря на уменьшенный объем данных для обучения, производительность остается на высоком уровне.
Microsoft недавно расширила свою линейку продуктов в области искусственного интеллекта, выпустив модель Phi-3 Mini, которая заметно отличается уменьшенным до 3,8 млрд параметров размером по сравнению с предыдущими моделями. Этот ИИ, доступный на платформах Azure, Hugging Face, и Ollama, демонстрирует производительность, сравнимую с куда более крупными моделями, превосходящими её в размерах в десять раз.
Компания также анонсировала разработку моделей Phi-3 Small и Phi-3 Medium с параметрами 7 млрд и 14 млрд соответственно, подчеркивающие возможности более мелких моделей обрабатывать сложные команды. Эти модели, как ожидается, продолжат тенденцию увеличения эффективности при уменьшении общего объема данных для обучения, показанную Phi-2 в прошлом году.
Важно отметить, что по мнению корпоративного вице-президента по AI платформам Microsoft Azure, Эрика Бойда, усилия компании сосредоточены не только на снижении стоимости эксплуатации ИИ, но и на повышении их функциональности на мобильных устройствах и лэптопах, где Phi-3 Mini по своим возможностям сравним с такими моделями, как GPT-3.5, обеспечивая при этом гораздо более высокую производительность.
В дополнение, Microsoft разрабатывает специализированные модели, как Orca-Math для решения математических задач, и планирует формирование команды, фокусирующейся на создании малых и лёгких моделей ИИ.
Тематика обучения моделей также переориентирована: на смену традиционным методам пришли инновационные подходы, вдохновленные детскими сказками, что способствует более натуральному и понятному взаимодействию с пользователями. Эта стратегия обучения, применяемая разработчиками, использует более 3000 слов и включает создание дополнительных книг при помощи больших языковых моделей.
Настраиваясь на решение более простых задач, Phi-3 продолжает совершенствовать умения предыдущих версий, способствуя тем самым более широкому распространению и доступности ИИ технологий.