Machine Learning: Като облачна услуга (MLaaS)

Машинното обучение отдавна е част от облачното пространство.

Според годишния доклад на RightScale за състоянието на облака, голям дял (над 90%) от компаниите в днешно време използват облачни услуги. Съчетанието на облака и машинното обучение е подходяща комбинация поради възможността да се съхраняват големи обеми от данни, както и да се намаляват разходите и рисковете, които идват с локалните решения.

Как работи машинното обучение като услуга?

Машинното обучение като услуга (Machine Learning as a Service – MLaaS) дава достъп до инструменти за трансформация и визуализация на данни, както и възможност за прилагане на множество ML алгоритми без да е необходимо да се инсталира някакъв специфичен за тази цел софтуер. Прогнозен анализ, разпознаване на лица и обработка на естествен език са само някои от големия набор от функционалности, които предлага MLaaS. Обхванат е целият работен процес, като през графичния интерфейс се избира и настройва моделът, след което специалистите могат да преминат към внедряването му в своите приложения. Контролът обаче, който имат над случващото се зад компонентите, е доста ограничен.

С настоящата статия ще ви запозная с някои популярни платформи за машинно обучение, които са в облака, като ще видите и кои са предимствата и недостатъците на всяка от тях.

Какво ще разгледаме?

Облачни ML платформи

Създадени са множество онлайн решения за прилагане на възможностите на машинното обучение в облачното пространство, като MLaaS платформите позволяват:

  • Управление на данните – съхранение на входни данни за моделите от различни източници
  • Изграждане на модели – може да се създават модели по най-различни начини (от нулата, автоматизирано чрез AutoML, да се импортират готови модели и др.)
  • Обучение на модели – с това изцяло се занимава доставчикът на услугата
  • Следене на изпълнението – получаване на поддръжка и помощ от доставчика след внедряване на модела

Някои често използвани и популярни MLaaS платформи, които ще разгледаме в тази статия, са:

Microsoft Azure Machine Learning

azure ml

Azure ML е платформа, ориентирана както към начинаещи, така и към напреднали специалисти, които искат да се възползват от възможностите, които им предоставя машинното обучение. В Azure ML има множество решения, от които специалистите могат да изберат в зависимост от своите нужди. Azure ML има drag-and-drop графичен интерфейс, чрез който се извършват почти всички операции (обработка на данни, избор на метод, оценка на модел и др.).

Тази платформа позволява и използването на Python и R при разработването на проекти. Специалистите имат достъп до интерактивните тетрадки на Jupyter директно през Azure ML, а могат също така и да пишат скриптове чрез графичните елементи при изграждане на самия модел.

Предимства:

  • има много примерни извадки за тест
  • интерфейсът е опростен и разбираем
  • изпълнение на скриптове на Python и R

Недостатъци:

  • ограничен брой вградени алгоритми
  • платформата е бавна, особено в обучението на модели
  • няма достатъчно параметри за определени алгоритми, не може да се правят достатъчно промени при настройките

IBM Watson Studio

ibm watson

Платформата на IBM позволява създаване, тестване и внедряване на модели за машинно обучение. Може да се работи както с езици за програмиране, така и с инструментите за автоматизация на процесите по изграждане на модели за машинно обучение.

Услугата AutoAI, която може да се добави към проекта, позволява изпълнение на алгоритми върху импортираните данни. Тази стъпка е автоматизирана, като се правят експерименти и се извежда най-добрият резултат. Дава се пълна информация за изпълнението и специалистът може да прецени кой от случаите да запази като модел, който след това да внедри и тества.

Също както Azure ML, IBM Watson Studio съдържа предварително инсталирани библиотеки за Python и R. Има и достъп до интерактивните тетрадки на Jupyter, така че може при необходимост да се импортират и други библиотеки.

Предимства:

  • съдържа множество инструменти за анализ на данни
  • има възможности за автоматизация
  • не се налага ръчно да се изчистват данните, което пести много време

Недостатъци:

  • невинаги предлага правилния модел за машинно обучение
  • автоматичното изчистване не обработва перфектно данните
  • няма достатъчно примери и насоки в документацията

BigML

bigml

BigML е уеб платформа, чийто графичен интерфейс води специалистите през 6 стъпки по време на работния процес – източници, данни, модели, прогнози, ансамбли и оценка. Платформата предлага страхотни визуализации на резултатите от използване на алгоритмите за машинно обучение, както и галерия, в която моделите могат да се направят публични, да се съхраняват и продават. Могат и да се оставят коментари. Друга интересна функционалност, която дава платформата, е 1-Click, която позволява само с 1 клик да се изгради модел, да се раздели извадка и т.н.

През интерактивни тетрадки на Jupyter може да се направи връзка с моделите, които са в BigML, което дава на специалистите неограничени възможности при работа по проектите им.

Предимства:

  • прогнози в реално време
  • безплатният план предлага пълна функционалност
  • има много детайлна документация и видео уроци

Недостатъци:

  • не е с drag-and-drop интерфейс, което може да затрудни редица потребители
  • не предлага много голямо разнообразие от алгоритми за машинно обучение
  • не предлага толкова много услуги колкото IBM Watson и Azure ML

Кой използва тези платформи?

Големи компании в сферата на тъговията, телекомуникациите и здравеопазването са само малка част от ключовите потребители на тези платформи, но малки и средни предприятия също могат да се възползват от възможностите, които те предлагат. MLaaS платформите се стремят да направят така, че алгоритмите за машинно обучение да бъдат достъпни и приложими от всеки. Те се опитват да улеснят процеса на работа при изграждане на модели за машинно обучение, както и да осигурят бързото и лесното им използване.

Искате ли да научите за още подобни платформи?

Популярността на машинното обучение като услуга нараства постоянно. Все повече компании се ориентират към прехвърляне на работата си в облака. Някои други доста популярни и често използвани MLaaS платформи са например Amazon ML Services, Google Cloud AI и DataRobot. Те предоставят множество функционалности и предимства на специалистите, които ги използват по време на работа върху своите проекти. Независимо от сферата, машинното обучение може да прави всичко – от прогнозиране на цени до иденфифициране на измами. Възможностите на тези иновативни технологии са неограничени.

Искате да научите повече за машинното обучение?

Включете се в курса по машинно обучение и анализ на данни с Python.

Научете повече

Автор: Десислава Христова