Машинното обучение отдавна е част от облачното пространство.
Според годишния доклад на RightScale за състоянието на облака, голям дял (над 90%) от компаниите в днешно време използват облачни услуги. Съчетанието на облака и машинното обучение е подходяща комбинация поради възможността да се съхраняват големи обеми от данни, както и да се намаляват разходите и рисковете, които идват с локалните решения.
Как работи машинното обучение като услуга?
Машинното обучение като услуга (Machine Learning as a Service – MLaaS) дава достъп до инструменти за трансформация и визуализация на данни, както и възможност за прилагане на множество ML алгоритми без да е необходимо да се инсталира някакъв специфичен за тази цел софтуер. Прогнозен анализ, разпознаване на лица и обработка на естествен език са само някои от големия набор от функционалности, които предлага MLaaS. Обхванат е целият работен процес, като през графичния интерфейс се избира и настройва моделът, след което специалистите могат да преминат към внедряването му в своите приложения. Контролът обаче, който имат над случващото се зад компонентите, е доста ограничен.
С настоящата статия ще ви запозная с някои популярни платформи за машинно обучение, които са в облака, като ще видите и кои са предимствата и недостатъците на всяка от тях.
Какво ще разгледаме?
- Microsoft Azure Machine Learning
- IBM Watson Studio
- BigML
- Кой използва тези платформи?
- Искате ли да научите за още подобни платформи?
Облачни ML платформи
Създадени са множество онлайн решения за прилагане на възможностите на машинното обучение в облачното пространство, като MLaaS платформите позволяват:
- Управление на данните – съхранение на входни данни за моделите от различни източници
- Изграждане на модели – може да се създават модели по най-различни начини (от нулата, автоматизирано чрез AutoML, да се импортират готови модели и др.)
- Обучение на модели – с това изцяло се занимава доставчикът на услугата
- Следене на изпълнението – получаване на поддръжка и помощ от доставчика след внедряване на модела
Някои често използвани и популярни MLaaS платформи, които ще разгледаме в тази статия, са:
Microsoft Azure Machine Learning
Azure ML е платформа, ориентирана както към начинаещи, така и към напреднали специалисти, които искат да се възползват от възможностите, които им предоставя машинното обучение. В Azure ML има множество решения, от които специалистите могат да изберат в зависимост от своите нужди. Azure ML има drag-and-drop графичен интерфейс, чрез който се извършват почти всички операции (обработка на данни, избор на метод, оценка на модел и др.).
Тази платформа позволява и използването на Python и R при разработването на проекти. Специалистите имат достъп до интерактивните тетрадки на Jupyter директно през Azure ML, а могат също така и да пишат скриптове чрез графичните елементи при изграждане на самия модел.
Предимства:
- има много примерни извадки за тест
- интерфейсът е опростен и разбираем
- изпълнение на скриптове на Python и R
Недостатъци:
- ограничен брой вградени алгоритми
- платформата е бавна, особено в обучението на модели
- няма достатъчно параметри за определени алгоритми, не може да се правят достатъчно промени при настройките
IBM Watson Studio
Платформата на IBM позволява създаване, тестване и внедряване на модели за машинно обучение. Може да се работи както с езици за програмиране, така и с инструментите за автоматизация на процесите по изграждане на модели за машинно обучение.
Услугата AutoAI, която може да се добави към проекта, позволява изпълнение на алгоритми върху импортираните данни. Тази стъпка е автоматизирана, като се правят експерименти и се извежда най-добрият резултат. Дава се пълна информация за изпълнението и специалистът може да прецени кой от случаите да запази като модел, който след това да внедри и тества.
Също както Azure ML, IBM Watson Studio съдържа предварително инсталирани библиотеки за Python и R. Има и достъп до интерактивните тетрадки на Jupyter, така че може при необходимост да се импортират и други библиотеки.
Предимства:
- съдържа множество инструменти за анализ на данни
- има възможности за автоматизация
- не се налага ръчно да се изчистват данните, което пести много време
Недостатъци:
- невинаги предлага правилния модел за машинно обучение
- автоматичното изчистване не обработва перфектно данните
- няма достатъчно примери и насоки в документацията
BigML
BigML е уеб платформа, чийто графичен интерфейс води специалистите през 6 стъпки по време на работния процес – източници, данни, модели, прогнози, ансамбли и оценка. Платформата предлага страхотни визуализации на резултатите от използване на алгоритмите за машинно обучение, както и галерия, в която моделите могат да се направят публични, да се съхраняват и продават. Могат и да се оставят коментари. Друга интересна функционалност, която дава платформата, е 1-Click, която позволява само с 1 клик да се изгради модел, да се раздели извадка и т.н.
През интерактивни тетрадки на Jupyter може да се направи връзка с моделите, които са в BigML, което дава на специалистите неограничени възможности при работа по проектите им.
Предимства:
- прогнози в реално време
- безплатният план предлага пълна функционалност
- има много детайлна документация и видео уроци
Недостатъци:
- не е с drag-and-drop интерфейс, което може да затрудни редица потребители
- не предлага много голямо разнообразие от алгоритми за машинно обучение
- не предлага толкова много услуги колкото IBM Watson и Azure ML
Кой използва тези платформи?
Големи компании в сферата на тъговията, телекомуникациите и здравеопазването са само малка част от ключовите потребители на тези платформи, но малки и средни предприятия също могат да се възползват от възможностите, които те предлагат. MLaaS платформите се стремят да направят така, че алгоритмите за машинно обучение да бъдат достъпни и приложими от всеки. Те се опитват да улеснят процеса на работа при изграждане на модели за машинно обучение, както и да осигурят бързото и лесното им използване.
Искате ли да научите за още подобни платформи?
Популярността на машинното обучение като услуга нараства постоянно. Все повече компании се ориентират към прехвърляне на работата си в облака. Някои други доста популярни и често използвани MLaaS платформи са например Amazon ML Services, Google Cloud AI и DataRobot. Те предоставят множество функционалности и предимства на специалистите, които ги използват по време на работа върху своите проекти. Независимо от сферата, машинното обучение може да прави всичко – от прогнозиране на цени до иденфифициране на измами. Възможностите на тези иновативни технологии са неограничени.
Искате да научите повече за машинното обучение?
Включете се в курса по машинно обучение и анализ на данни с Python.
Автор: Десислава Христова