Uczenie maszynowe a głębokie uczenie: podobieństwa i różnice

Uczenie maszynowe (ang. machine learning) i uczenie głębokie (deep learning) to terminy, które są często ze sobą mylone, a czasem nawet używane zamiennie. Każda z tych definicji ma jednak swoje własne ramy. Czym się różnią? Czy mogą się wzajemnie uzupełniać? Co rzeczywiście oznaczają terminy, które pozornie brzmią tylko jak buzzwords ze świata AI?

Jeśli należysz do grona osób, które chcą lepiej zrozumieć świat sztucznej inteligencji – ten artykuł pomoże Ci lepiej poznać jej podstawowe pojęcia: machine learning i deep learning. Naprawdę warto je poznać, ponieważ zarówno ML, jak i DL są obecnie uważane z jedne z kluczowych trendów technologicznych najbliższych lat.

Z artykułu dowiesz się:

Czym jest uczenie maszynowe (machine learning) a czym uczenie głębokie (deep learning)?

Jaka jest różnica między ML a DL i jak są ze sobą powiązane?

Jaką rolę zajmuje ML i DL wśród wszystkich technologii związanych z AI?

Czym są sieci neuronowe i czy działają już tak skutecznie jak ludzki mózg?

Wprowadzenie: Uczenie maszynowe i głębokie uczenie na tle sztucznej inteligencji

Podstawowe definicje machine learning oraz deep learning, znajdziesz w naszym Słowniku AI. Zależności, jakie zachodzą między tymi pojęciami najlepiej ilustruje jednak poniższa grafika:

machine learning i deep learning na tle AI
Opracowanie graficzne: SIBIZ

Sztuczna inteligencja jest dziedziną nadrzędną wobec uczenia maszynowego, natomiast ML jest szerszą kategorią niż uczenie głębokie (deep learning). Jeśli zakładamy, że AI to całość nauki i badań, jakie zmierzają do odwzorowania ludzkiej inteligencji, to ML i DL są poddziedzinami tej nauki. DL jest natomiast mniejszym zbiorem w kategorii uczenia maszynowego.

Uczenie maszynowe a algorytmy

Uczenie maszynowe też jest dosyć szeroką dziedziną (poddziedziną AI), choć już nie tak rozległą jak „sztuczna inteligencja”. Określenie ML stosowane jest głównie wtedy, gdy mamy na myśli procesy, w trakcie których programy „uczą się” i „podejmują decyzje” na podstawie danych. Zadaniem algorytmów w takich procesach jest właściwe rozpoznanie wzorców i zastosowania adekwatnego działania. Skąd to potrafią? Są wcześniej przygotowywane do rozpoznawania pewnych wzorców w trakcie procesu trenowania, podczas którego zasilane są danymi. Takie trenowania i uczenie się może być nadzorowane i nienadzorowane.

Algorytmy uczenia maszynowego w praktyce: rozpoznawanie obrazów

Chociaż działanie algorytmów ML brzmi dosyć zagadkowo, zastosowanie takich algorytmów jest już o wiele prostsze do zrozumienia. Odpowiednio wytrenowane algorytmy potrafią np. rozpoznawać obrazy. Oczywiście – ich skuteczność jest zależna od kliku czynników. Jak wartościowymi danymi programy zostały wcześniej zasilone? Jak wiele ich było i jak często powtarzano takie próby? Odpowiednio trenowane algorytmy potrafią niemal bezbłędnie wykryć np. zdjęcia człowieka. Odróżnią na fotografii krajobraz morski od górskiego, kota od psa czy samolot od statku.

Bardziej złożone przykłady: co jeszcze uczenie maszynowe może dla nas zrobić?

Machine learning, choć wydaje się działać stosunkowo prosto, ma bardzo wiele potencjalnych zastosowań. Po ML sięgają organizacje, biznes i przemysł na całym świecie, aby uprościć wykonywanie wielu schematycznych zadań i obowiązków, które do tej pory musieli wykonywać pracownicy. Wirtualne roboty działają na przykład na back-office (zapleczu): wprowadzają dane do systemów, pomagają w księgowości. Coraz częściej rozmawiają też z klientami a nawet obsługują pracowników firmy. Z machine learning korzystają wirtualni asystenci (chatboty i voiceboty), którzy są de facto sztuczną inteligencją konwersacyjną. Z mechanizmem ML spotykasz się też wielokrotnie w codziennym życiu: na przykład gdy platforma streamingowa lub sklep internetowy poleca Ci kolejny film/produkt na podstawie Twoich wcześniejszych wyborów.

Wymienione zastosowania to jednak zaledwie pierwsze use case, o których możemy powiedzieć, że „są już w praktyce standardem” i to na szerszą skalę. Dalszy rozwój tej dziedziny będzie otwierał dla nas kolejne możliwości w bardzo wielu sektorach. Spore nadzieje świat nauki i biznesu pokłada w deep learning.

Głębokie uczenie, czyli jeszcze lepsze machine learning

Głębokie uczenie to podzbiór uczenia maszynowego, nie jest to jednak tylko niewielki wycinek tej dziedziny, ale raczej ścieżka dalszej ewolucji ML. Algorytmy deep learning to tak naprawdę bardziej zaawansowane algorytmy uczenia maszynowego. Efekty pracy takich algorytmów są „bardziej spektakularne”, ponieważ proces decyzyjny jest bardziej zbliżony do tego „ludzkiego”. Co to dokładnie oznacza?

Sztuczna sieć neuronowa w algorytmach DL

Aplikacje do głębokiego uczenia wykorzystują warstwową strukturę algorytmów zwaną sztuczną siecią neuronową (ang. ANN – artificial neural network). Inspiracją dla projektu takiej SSN jest biologiczna sieć neuronowa ludzkiego mózgu, co prowadzi do procesu uczenia się o wiele bardziej wydajnego niż w przypadku standardowych modeli ML. Poniżej grafika obrazująca prostą sieć neuronową:

Źródło: WIKIPEDIA

Jakie znaczenie ma sieć neuronowa dla algorytmów deep learning?

Warstwa znajdująca się po lewej stronie to warstwa wejściowa, po prawej – warstwa wyjściowa. Na grafice znajduje się tylko jedna „warstwa środkowa” jednak w praktyce może być ich wiele. Ta warstwa jest przestrzenią ukrytą. Warstwy ukryte pełnią rolę pomocniczą dla uzyskania końcowego wyniku, wartości te nie są jednak notowane. Im więcej warstw „ukrytych” tym głębsza jest sieć. Powyższa grafika ilustruje więc najprostszą sieć głęboką – z tylko jedną warstwą ukrytą. Co więcej, istnieje taka możliwość, by każda warstwa ukryta miała swoją własną „specjalizację”. Algortymy DL mogą więc pełnić podobną rolę jak te ML, jednak robią to z o wiele większą precyzją. Ich zastosowanie jest więc kluczowe w obszarach, które wiążą się z podniesionym ryzykiem: prowadzenie samochodu przez AI, prognozowanie, diagnostyka medyczna.

Głębokie uczenie: wyzwania dla dalszego rozwoju

Deep learning jest o wiele silniejszym mechanizmem niż algorytmy ML, jednak powszechne zastosowania tego rozwiązania wciąż jest wyzwanie. Co stoi na przeszkodzie? Mówiąc najprościej: dostępność danych i moc obliczeniowa, ponieważ precyzyjne wyniki końcowe wymagają przeprowadzenia większej ilości operacji.

Problem mocy obliczeniowej rozwiązuje się dzięki dostępności chmury, jednak gromadzenie danych wejściowych do trenowania modeli wciąż jest pewnym wyzwaniem. Próbuje się je rozwiązać poprzez użycie wcześniej wytrenowanych modeli (transfer learning).

Podsumowując: Deep learning vs machine learning: czy w ogóle warto stawiać takie pytanie?

To, co wyróżnia deep learning na tle całego machine learning to właśnie wykorzystanie sieci neuronowych, zwiększone zapotrzebowanie na dane, ale też mniejsza konieczność kontroli ze strony człowieka (wyniki są bardziej precyzyjne). Głębokie uczenie nie jest w kontrze do uczenia maszynowego, lecz jest nurtem dalszego rozwoju tej dziedziny. Zamiast prostej struktury ML , w głębokim uczeniu występuje wielowarstwowa i spleciona sieć, dzięki czemu algorytm może uczyć się nawet na podstawie własnych błędów, bez udziału człowieka.

Znaczenie deep learning bez wątpienia będzie rosło w najbliższych latach, chociaż dzisiaj możemy raczej obserwować wykorzystanie takich algorytmów głownie przez duże korporacje (chociażby gigantów z Silicon Valley zajmującymi się autonomicznymi pojazdami). Ze względu na konieczność posiadania sporego kapitału, aby sfinansować takie inwestycje, przez długi czas takie projekty były niedostępne dla szerokiego grona przedsiębiorstw. To powoli się zmienia dzięki rozwojowi technologii: coraz większa moc obliczeniowa, chmura, platformy B2B bazujące na głębokim uczeniu oddawane do dyspozycji biznesu – wszystko to przyśpiesza popularyzację DL.