Vad är deep learning och hur det används

#

Att använda Siri eller någon annan röstassistent har blivit en del av vår vardag för att utföra en mängd olika uppgifter snabbt och enkelt. Det är dock inte alla som vet att när vi utnyttjar potentialen i dessa verktyg närmar vi oss djupinlärning. En term som på vårt språk kallas för djupinlärning, vissa kallar den hierarkisk inlärning, och som på två sätt är kopplad till begreppet maskininlärning och, mer allmänt, till begreppet artificiell intelligens (AI), från engelskans Artificial Intelligence. Om maskininlärning är en specifik gren av artificiell intelligens är den teknik som behandlas i den här guiden på samma sätt en delmängd av den förstnämnda och ligger till grund för något mycket bredare än enkel maskininlärning på flera nivåer. Tillämpningarna är följaktligen, som vi redan har sagt, otaliga, och vi kommer naturligtvis att upptäcka de viktigaste av dem i följande punkter.


Definitionen av djup inlärning

Den tekniska definitionen av djup inlärning eller deep learning är en klass av algoritmer för automatisk inlärning, det vill säga forskningsområdet för automatisk inlärning, den redan nämnda maskininlärningen och artificiell intelligens, som bygger på olika representationsnivåer, som motsvarar hierarkier av faktorers eller begreppens egenskaper, där begreppen på hög nivå definieras på grundval av begreppen på låg nivå. Definitionen från observationsorganet för artificiell intelligens vid Politecnico di Milano är ännu mer begriplig för icke-experter: djupinlärning beskrivs i själva verket som en uppsättning tekniker som bygger på artificiella neurala nätverk som är organiserade i olika lager, där varje lager beräknar värdena för nästa lager så att informationen behandlas på ett alltmer fullständigt sätt.

Det är ingen tillfällighet att man bland de arkitekturer som används för djupinlärning brukar nämna djupa neurala nätverk, konvolution av djupa neurala nätverk, djupa trosnätverk och rekursiva neurala nätverk. De representerar alla ett tillvägagångssätt där inlärning sker tack vare data som erhålls genom algoritmer, huvudsakligen statistiska beräkningar.

Du har alltså förstått att den stora mängd data som behandlas av neurala nätverk följer en "väg" som är mycket lik den som sker i den mänskliga hjärnan och som inspirerar samma artificiella nätverk till att fungera. Många forskare och vetenskapsmän är kända för sitt engagemang för djupinlärning, till exempel Andrew Yan-Tak Ng, grundare av Google Brain, Ian J. Goodfellow, som av MIT Boston har utnämnts till en av världens bästa innovatörer under 35 år, Yoshua Bengio, Ilya Sutskever och Geoffrey Everest Hinton, en av nyckelpersonerna inom artificiell intelligens.

Det är deras bidrag som gör att vi nu kan definiera djupinlärning som ett system som utnyttjar en klass av algoritmer för maskininlärning som först och främst använder olika nivåer av kaskadindelade icke-linjära enheter för att utföra extraktion och omvandling av funktioner, där varje successiv nivå använder resultatet från den föregående nivån som indata. Algoritmerna bygger sedan på så kallad oövervakad inlärning av flera hierarkiska nivåer av dataegenskaper, vilket skapar en hierarkisk representation. Dessutom lär de sig flera representationsnivåer som motsvarar olika abstraktionsnivåer, vilket ger upphov till en hierarki av begrepp.

Det var inte förrän runt år 2000 som man började tala om djupinlärning. På relativt kort tid har dock användningsområdena ökat som en löpeld tack vare tekniska framsteg och allt mer sofistikerade neurala nätverk. De första studierna om flerskiktsnätverk producerades och publicerades av den japanske forskaren Kunihiko Fukushima, som 1975 utvecklade modellen för kognitionsnätverk, följt av modellen för neokognitionsnätverk. Samma forskare introducerade idén om neuronernas anslutningsområde, vilket utvecklades till de konvolutionella neurala nätverken.

På 80-talet fortsatte analysen av de artificiella neurala nätverken i flera lager på ett mer avgörande sätt, men det är först under det senaste decenniet, särskilt tack vare tillkomsten av Big Data och övervinnandet av vissa begränsningar, som de visar all sin potential inom en rad olika sektorer. I dag möjliggör systemen för djupinlärning, bland många andra funktioner, till exempel identifiering av objekt i bilder och videor, transkribering av tal till text eller identifiering och tolkning av onlineanvändarnas intressen, vilket ger sökresultat som är närmare deras specifika behov.

Hur djupinlärning fungerar

Som förklaras i föregående stycke i guiden bygger djupinlärning hela sin funktion på klassificering och efterföljande urval av de mest relevanta uppgifterna för att nå en så optimal slutsats som möjligt. En funktion som följer vår biologiska hjärna, antingen för att formulera det korrekta svaret på en fråga eller för att lösa ett specifikt problem, eller till och med för att dra en logisk hypotes. Vissa av er kanske minns det berömda fallet AlphaGo, en programvara som 2016 slog världsmästaren i Go, flera år tidigare än planerat.

Djupinlärning fungerar alltså på samma sätt som mänskligt resonemang, men med hjälp av de artificiella neurala nätverk som vi talade om, dvs. matematiska datormodeller som bygger på hur biologiska neurala nätverk fungerar, som i sin tur består av informationsförbindelser. Ett neuralt nätverk är faktiskt ett adaptivt system: det kan ändra sin struktur, som består av noder och relativa sammankopplingar, på grundval av externa data och interna data, som sedan kopplar samman och korsar det neurala nätverket under inlärnings- och resonemangsfasen.

Inlärningen är då både automatisk och "djup", och med djup menar vi på flera nivåer. Denna typ av inlärning har visat sig vara betydligt mer kraftfull än tidigare AI-teknik, så pass mycket att den nyligen har fått oöverträffad uppmärksamhet i media. Och oundvikligen även vetenskaplig och ekonomisk uppmärksamhet. Det råder ingen brist på begränsningar, men djupinlärning kan definitivt noteras för kvaliteten på de resultat som uppnås, med motsvarande enorma fördelar när det gäller att lära sig att lösa komplexa problem med mönsterigenkänning. Även om kravet på enorm beräkningskapacitet kan vara en begränsning är det skalbarheten hos djupinlärning när mängden tillgängliga data och algoritmer ökar som skiljer den från maskininlärning.

Den förstnämnda förbättrar faktiskt sin prestanda när mängden data ökar, medan den sistnämnda när den väl har nått en viss prestandanivå inte längre kan förfina sin prestanda. Detta beror på att det komplexa neurala nätverket lär sig självständigt hur det ska analysera rådata och utföra en viss uppgift. Datorn kan alltså "lära sig själv", utan mänskliga instruktioner, efter en inledande träningsfas. Det slutgiltiga målet är att spara tid och resurser, särskilt i rutinarbete som utförs mycket effektivare och snabbare än någon människa, utan någon form av ansträngning och med en praktiskt taget konstant kvalitetsnivå.


Användningarna av djupinlärning

Djupinlärning

Stora framsteg har gjorts inom detta område, även om vissa av besluten inom djupinlärning ännu i dag inte är helt begripliga ur ett rent mänskligt perspektiv. Detta hindrar dock inte, vilket nu står klart, att tekniken för djupinlärning ständigt förbättras, framför allt tack vare den mängd data som finns tillgänglig och tillgången till ultrahögpresterande infrastrukturer, särskilt CPU:er och GPU:er. Det är ingen överraskning att djupinlärning för närvarande tillämpas inom olika branscher, och framför allt att den kommer att fortsätta att tillämpas och expandera till många andra områden i vårt dagliga liv inom en snar framtid. Tänk bara på förarlösa bilar, robotdrönare för paketleveranser, röst- och språkigenkänning och syntes för chatbots och servicerobotar, eller ansiktsigenkänning i säkerhetssyfte.

Det finns också medicinska tillämpningar inom radiologi för tidig upptäckt av vissa former av cancer, eller möjligheten att enkelt identifiera genetiska sekvenser för vissa sjukdomar för att kunna framställa mer effektiva läkemedel. Vi kan också nämna automatisk färgning av svartvita bilder, simultan översättning, klassificering av objekt i ett fotografi, automatisk generering av handskrift och text samt intuitiv uppdelning i bildtexter. På samma sätt utvecklades också automatiska spel, där systemet självständigt lär sig hur man spelar ett visst spel. Avslutningsvis får man inte underskatta djupinlärningens förmåga att avslöja oegentligheter i systemverksamheten tack vare oberoende och kontinuerlig inlärning, särskilt när det gäller farliga cyberattacker eller "smarta" videofilmer som installerats på de mest avancerade flygplatserna.

Det är dock viktigt att betona att djupinlärning varken kan eller bör vara den bästa tekniska lösningen på alla problem. Många forskare, särskilt under de senaste fem åren, är övertygade om att man snart kommer att hitta effektivare och kanske billigare metoder som gör hierarkisk inlärning baserad på den mänskliga hjärnans funktionssätt föråldrad. Som om det vore ett övergående fenomen, nedskalat till att bara representera en av de många otroliga! - manifestationer av artificiell intelligens.


Lämna en kommentar