Ken uzelf: slimme machines leren eigen gedrag

Flanders Make ontwikkelt technieken om machines zelflerend te maken, met een sterke focus op veiligheid en leersnelheid. Op die manier mikt het op praktische toepasbaarheid binnen de strenge context van de industrie van vandaag.

Erik Hostens is projectleider en senior researcher voor Flanders Make, het onderzoekscentrum voor de maakindustrie.

8 juni 2018

Levenslang leren: het is een credo dat in onze sterk evoluerende wereld de laatste jaren alleen maar noodzakelijker wordt. Werknemers van vandaag moeten zich constant kunnen aanpassen aan de nieuwste technologische ontwikkelingen, met het oog op meer performantie, efficiëntie en duurzaamheid. De impact hiervan op ons onderwijssysteem is een regelmatig terugkerend thema in het maatschappelijk debat.

Deze trend gaat echter niet alleen op voor werknemers. Ook van machines verwachten we dat ze almaar slimmer worden en zichzelf aanpassen aan onze noden. Hierbij zijn machine learning, big data en Industrie 4.0 concepten die de laatste jaren erg aan populariteit hebben gewonnen. Uit de stroom data gewonnen uit sensoren die de machines continu monitoren en sturen, worden automatisch nieuwe verbanden gelegd. Deze kunnen we gebruiken om de werking van de machines beter te begrijpen, waarmee we bijvoorbeeld hun onderhoud kunnen optimaliseren.

Het onderzoek aan zelflerende controle kan rechtstreeks worden toegepast op de weefmachines van Picanol.

Met voldoende data is machine learning erg goed in het blootleggen van verborgen patronen. Dit kun je met recht zelflerend noemen, want er is amper menselijke inbreng in het proces. Dit sterk exploratieve karakter is de kracht van machine learning, maar gelijk ook de zwakte. Laten we machines op die manier ook hun eigen sturing aanpassen, dan wordt hun gedrag erg onvoorspelbaar, en dat is nu net iets dat veel industriële toepassingen absoluut niet toelaten. Er is geen ruimte voor falen, de lat inzake kwaliteit en veiligheid van machines ligt erg hoog.

Leren uit het verleden

Lerende controle biedt een antwoord op de vraag naar machines die zelf leren, maar binnen de strikte grenzen die worden opgelegd in de industriële context. Hierdoor kan de machine werkelijk zichzelf bijsturen, zonder verdere menselijke inbreng. Een zelflerende regelaar probeert verborgen verbanden niet blind te leren, maar maakt gebruik van fysische modellen. Machines bestaan nu eenmaal uit componenten waarvan de werking erg goed is gekend en beschreven in dergelijke modellen. Door deze kennis te gebruiken, kan het leren veel gerichter en efficiënter gebeuren, en bovendien met veel minder data.

Wiskundige optimalisatie ligt aan de basis van lerende controle. Aan de hand van wat het model voorspelt, berekent de regelaar het stuursignaal dat de machine zijn taak laat uitvoeren met maximale performantie of efficiëntie (of een combinatie van beide), terwijl die tegelijkertijd rekening houdt met de beperkingen van de machine, zoals het beschikbare vermogen. In realiteit is zo’n model nooit honderd procent accuraat. Er zijn altijd afwijkingen omwille van moeilijk te modelleren fenomenen, zoals mechanische wrijving, zodat het werkelijke gedrag zal afwijken van de voorspelling.

Flanders Make paste zijn Rofalt-toolbox toe om een niet-lineair slider-crank-mechanisme zelflerend te regelen.

Maar veel toepassingen in de industrie zijn repetitief, wat betekent dat de regelaar deze afwijkingen kan leren uit het geobserveerde gedrag, en de modelparameters hiermee kan laten overeenstemmen. Vervolgens past hij de stuursignalen aan met behulp van de verbeterde voorspelling van het model. Op die manier kan de regelaar bij elke nieuwe uitvoering van de taak zichzelf een beetje meer verbeteren.

Flanders Make ontwikkelde Rofalt, een gebruiksvriendelijke en opensource Matlab-toolbox om deze twee stappen van lerende controle efficiënt en intuïtief te berekenen. Daarnaast hebben we een aantal concepten voor lerende controle uitgewerkt met het oog op praktische toepasbaarheid in de industrie. Deze hebben we toegepast zowel op opstellingen in het lab als op een aantal industriële cases, in samenwerking met een aantal bedrijven en ondersteund door het Agentschap Innoveren en Ondernemen (Vlaio).

We zijn begonnen met een slider-crank-mechanisme dat veel wordt gebruikt in de industrie om een draaibeweging om te zetten in een lineaire beweging. Dit systeem gedraagt zich erg niet-lineair, wat een uitdaging vormt voor de regeltechniek. Het onderzoek op deze opstelling kon rechtstreeks worden toegepast voor de ontwikkeling van een zelflerende regelaar voor een weefmachine van Picanol, waar dergelijke bewegingen schering en inslag zijn.

Safe learning

Omdat het model niet van het begin de juiste voorspellingen doet, kun je terecht opmerken dat de zelflerende regelaar, net als bij machine learning, te exploratief is. Hij doet in het begin als het ware een gooi en voldoet daarmee niet aan de strenge vereisten binnen de industriële context. Daar is een eenvoudige oplossing voor bedacht: safe learning.

In de meeste gevallen zijn de opgelegde beperkingen asymmetrisch van aard. Een actuator kan bijvoorbeeld een bepaalde maximale kracht leveren, maar uiteraard ook elke kracht lager dan die bovengrens. Als we ervoor zorgen dat we in het begin een bijkomende marge opleggen onder die maximale kracht, zal de werkelijke kracht toch nog lager zijn dan de bovengrens, zelfs als die hoger is dan de voorspelling. Daarvoor moet de marge groter zijn dan de onzekerheid van de voorspelling: in het begin kiezen we die daarom typisch te groot, maar de onzekerheid van de voorspelling wordt snel kleiner bij elke nieuwe poging, zodat de marge ook kan worden verkleind (want een te grote marge gaat ten koste van performantie of efficiëntie). Op die manier krijgen we op lange termijn een optimale werking, en hebben we toch garantie van de veiligheid.

Shared learning

We verwachten van machines meer en meer dat ze, net zoals mensen, niet alleen zuiver repetitieve taken kunnen uitvoeren, maar ook nieuwe gelijkaardige taken snel leren. Dat is cruciaal met het oog op mass customization, waarin geen twee producten in een productielijn nog identiek zijn. Shared learning gaat op voorhand de modelafwijkingen voorspellen voor een nieuwe taak, op basis van wat geleerd is uit vorige taken.

Soms moet een machine een hele rits van taken aanleren vooraleer die in bedrijf wordt genomen. Zo’n kalibratieprocedure is bijvoorbeeld gangbaar voor weefmachines, die in erg uiteenlopende contexten worden ingezet: verschillende draadtypes en -diktes, verschillende weefpatronen, et cetera. De machine is tijdens de kalibratie niet productief, dus deze mag niet te lang duren. Door middel van slimme interpolaties van de aangeleerde signalen voor verschillende contexten, en de volgorde hiervan optimaal te kiezen, kan de leertijd met een factor vijf worden verkort.

Simple learning

De Rofalt-toolbox optimaliseert het hele stuursignaal van de machine. Regelaars in de praktijk doen dit zelden. Meestal hanteren ze een aantal eenvoudige regels die zijn gebaseerd op jarenlange ervaring van de gebruikers. Ze hebben bovendien het voordeel dat de berekeningen eenvoudig genoeg zijn voor embedded hardware met beperkte rekenkracht. Omdat er maar een beperkt aantal stuursignalen uit kunnen komen, zijn ze bovendien ook voorspelbaar en robuust.

Met lerende controle kan de autonomie van vaartuigen worden vergroot, zoals bij de Automate Your Boat-module van Dotocean.

Simple learning biedt een lerend alternatief voor dergelijke rule-based regelaars. In plaats van de volledige stuursignalen worden de regels zelf geoptimaliseerd op basis van dezelfde leerprincipes. Dit heeft Flanders Make toegepast op een geavanceerd simulatiemodel van een voertuig. Met lerende controle kan de autonomie van voertuigen worden vergroot, omdat ze zelf leren omgaan met afwijkingen in het rijgedrag, bijvoorbeeld door bandenslijtage. Twee industriële spelers die hierin hebben meegewerkt, zijn Siemens Industry Software, dat sinds kort onderzoek uitvoert naar autonoom rijden, en Dotocean, een ontwikkelaar van autonome boten. Dat laatste bedrijf is op de markt gekomen met Automate Your Boat (AYB), een cloudgebaseerde unit die op eender welke boot kan worden geïnstalleerd en zelf het vaargedrag leert en optimaliseert. Dit laat klanten toe om zelf hun autonome boot samen te stellen.

Vervolg

Het spreekt voor zich dat lerende controle meer en meer zal worden ingezet in een wereld waar machines autonomer worden, en er steeds meer informatie beschikbaar komt die kan worden gebruikt om hun gedrag te verbeteren. In tegenstelling tot machine learning en artificiële intelligentie – domeinen die hun oorsprong hebben in de computerwetenschappen – stamt lerende controle uit de wereld van regeltechniek, die altijd sterk heeft gefocust op praktische toepasbaarheid. Lerende controle is daarom in staat om de beschikbare machinekennis optimaal te benutten met het oog op sneller en robuuster leren.

In een opvolgproject gaat Flanders Make multi-system learning onderzoeken, voor toepassingen in de nabije toekomst waar machines van velerlei slag verbonden zijn en van elkaar leren, ondanks de verschillen in eigen gedrag en context. Op die manier zet Flanders Make sterk in op de huidige trends van big data en Industrie 4.0.