Тулинг для MLOps должен покрывать следующие задачи:

Модель зрелости MLOps включает в себя пять уровней технических возможностей:

Уровень Наименование Описание Технологии
0 Отсутствие MLOps - Сложно управлять полным жизненным циклом модели машинного обучения

Уровень 0: Отсутствие MLOps

Роль Разработка модели Релизный цикл Интеграция
Специалисты по анализу данных: изолированы, не поддерживают регулярные связи с более крупной командой

Инженеры по обработке данных (если есть): изолированы, не поддерживают регулярные связи с более крупной командой

Инженеры-программисты: изолированы, получают модель удаленно от других членов команды | Данные собираются вручную Вычислительные мощности, скорее всего, не управляются Эксперименты не версионируются Конечным результатом может быть один файл модели, переданный вручную с входами/выходами | Ручной процесс Скрипт скоринга может быть создан вручную задолго после проведения экспериментов и не контролируется по версиям Релиз обрабатывается только специалистом по анализу данных или инженером по данным | В значительной степени зависит от опыта специалиста по анализу данных для реализации Релизы каждый раз создаются вручную |

Уровень 1: DevOps без MLOps

Роль Разработка модели Релизный цикл Интеграция
Специалисты по анализу данных: изолированы, не поддерживают регулярные связи с более крупной командой

Инженеры по обработке данных (если они есть): изолированы, не поддерживают регулярную связь с большой командой

Инженеры-программисты: изолированы, получают модель удаленно от других членов команды | Пайплайн подготавливает данные автоматически Вычислительные мощности управляются или не управляются Эксперименты не версионируются Конечным результатом может быть один файл модели, переданный вручную с входами/выходами | Ручной процесс Скрипт скоринга может быть создан вручную задолго после проведения экспериментов и не контролируется по версиям Передается инженерам-программистам | В значительной степени зависит от опыта специалистов по исследованию данных для реализации модели Для модели существуют базовые интеграционные тесты Автоматизированный релиз Код приложения имеет модульные тесты |

Уровень 2: Автоматизированное обучение

Роль Разработка модели Релизный цикл Интеграция
Специалисты по исследованию данных: Работа непосредственно с инженерами данных для преобразования экспериментального кода в повторяемые скрипты/задания

Инженеры данных: Работа с инженерами по данным

Инженеры-программисты: изолированы, получают модель удаленно от других членов команды | Пайплайн подготавливает данные автоматически Вычислительные мощности управляются Эксперименты версионируются, результаты отслеживаются Код обучения и результирующие модели контролируются по версиям | Ручной процесс Скрипт скоринга контролируется по версиям с помощью тестов Релиз управляется командой разработчиков программного обеспечения | Реализация модели в значительной степени зависит от опыта специалистов по исследованию данных Для модели существуют базовые интеграционные тесты Автоматизированный релиз ****Код приложения имеет модульные тесты |

Уровень 3: Автоматизированное развертывание модели