Machines leren uit hun fouten

De PID-regelaar is van essentieel belang om machineaansturingen te stabiliseren, maar schiet steeds vaker tekort in de hedendaagse, veeleisende apparaten. FMTC onderzocht hoe dit met lerende regelalgoritmes kan worden aangevuld om tot een beter resultaat te komen over de gehele levensduur van de machine.

Walter Verdonck is projectleider bij Flanders Mechatronics Technology Centre (FMTC). Zijn expertises bevinden zich in het gebied van regeltechniek, modellering en simulatie bij het mechatronisch systeemontwerp en robotica.

7 oktober 2010

Regeltechniek heeft een cruciale rol gespeeld in de doorbraak van de automatisering in de industriële omgeving. Machines werden veelal sneller, nauwkeuriger en flexibeler. De PID-regelaar is hierin de meest bekende en zonder twijfel ook de meest gebruikte terugkoppelregelaar. Het algoritme meet het foutsignaal en regelt deze afwijkingen zo snel mogelijk weg.

Prestatie-eisen nemen echter alsmaar toe, zodat een klassieke regeling op basis van terugkoppeling niet langer volstaat. Vooral bij hoogdynamische toepassingen komt de corrigerende actie steeds te laat. Moderne machines moeten bovendien in alle omstandigheden optimaal presteren en zich daarom autonoom kunnen aanpassen aan veranderende werkomstandigheden. Hiervoor is vaak een ingewikkelde sturing noodzakelijk, waarbij het van cruciaal belang is om alle aanstuurparameters exact af te stellen. Om met variaties over de tijd rekening te kunnen houden, is bovendien een regelmatige – tijdrovende – herkalibratie van deze parameters vereist.

Tijdens een FMTC-project onderzochten we hoe we deze herkalibratie kunnen vermijden door lerende controletechnieken in te zetten. Bovendien wilden we weten hoe dit soort technieken de prestaties kunnen verbeteren van machines die telkens dezelfde taak moeten uitvoeren. In dit soort systemen wordt namelijk bij elke herhalende beweging dezelfde fout gemaakt. Denk bijvoorbeeld aan pick-and-place-toepassingen. Met lerende controletechnieken stellen de machines zichzelf bij naar aanleiding van hun fouten, zodat ze steeds dichter bij hun gewenste nauwkeurigheid komen.

Opwindunit

Een lerend regelschema ziet er als in Figuur 1. Op het lage niveau wordt de klassieke feedback-controller aangevuld met een iteratief lerende controller (ILC). Het lerende algoritme is gebaseerd op de afwijkingen die optreden tijdens de vorige uitvoering van de taak. Een tweede regelaar op een hoger niveau observeert het machinegedrag tijdens werking en past de parameters aan op basis van kwaliteitscriteria van de gewenste referentietrajecten.

Een ILC blijkt uiterst efficiënt in het volgen van een gewenste referentie met minimale volgfout en is daarom een waardevolle aanvulling op de klassieke feedbackcontroller. De terugkoppelregelaar stabiliseert het systeem en de ILC verbetert de prestaties. Een groot voordeel van een ILC ten opzichte van andere geavanceerde controletechnieken is dat slechts een beperkte modelkennis nodig is.

Het toepassingsgebied van een ILC is veel ruimer dan enkel pick-and-place-machines. Lerende controle garandeert een optimale aansturing voor machines waarin periodiek verstoringen optreden of waarvan het gedrag (licht) varieert over tijd, typisch door temperatuurschommelingen of slijtage. Door ook op hoog niveau te regelen kan een optimale kwaliteit behouden worden tijdens de volledige levensduur van de machine. Bij FMTC hebben we deze strategie succesvol toegepast en gevalideerd in twee testcases: het opwinden van draad en het sluiten van een natte plaatkoppeling.

Voor een goede opwindkwaliteit van draad op een klos zijn twee elementen belangrijk: een zo constant mogelijke spanning in de draad en een vlak draadoppervlak op de spoel. Een opwindmachine (Figuur 2) bestaat typisch uit een opwindunit die de klos aandrijft, een draadgeleiding die continu heen en weer beweegt en een pendel die de draad op spanning houdt. De beweging van de draadgeleiding is periodiek. Daardoor wijkt de pendel van zijn evenwichtspositie af en ontstaat er een repetitieve verstoring in de spanning. Bovendien bevat dit proces inherent een variatie door een toenemende inertie van de oprollende klos naarmate er meer draad gewonden wordt. Lerende controle is in staat zich aan te passen aan deze variaties en in alle omstandigheden een optimale opwindkwaliteit te bereiken.

De variatie in draadspanning hebben we gereduceerd met behulp van repetitieve controle (RC), een variant van een ILC, toegepast op de beweging van de opwindunit om de pendel op zijn evenwichtpositie te houden (Figuur 3).

Een constante draadspanning garandeert echter nog geen vlak draadoppervlak. Daarvoor dient de beweging van de draadgeleiding goed gekozen te worden, in het bijzonder de omkeerpunten. Deze taak ligt bij een lerend algoritme op hoger niveau. Dat past het referentietraject van de draadgeleiding aan op basis van een kwaliteitscriterium.

Olielekken

Ook machines waarvoor een optimaal aanstuurtraject gevonden moet worden, zijn een interessant voorbeeld van waar lerende controle zinvol is. Traditioneel wordt dit traject manueel door middel van trial and error gekalibreerd en steunt de procedure op heel wat ervaringsregeltjes. Lerende controle biedt een geautomatiseerde procedure ter vervanging van deze meestal erg tijdsverslindende stappen.

FMTC heeft op deze wijze het optimale aanstuurtraject bij het sluiten van een natte platenkoppeling aangeleerd (Figuur 4). Dergelijke koppelingen, waarbij de platen zijn ondergedompeld in een vloeistof, worden gebruikt in automatische transmissies van bijvoorbeeld vorkheftrucks. In dergelijke natte koppelingen duwt een zuiger de platen tegen elkaar aan. Het doel is om dit zo zacht maar snel mogelijk te doen om het rijcomfort te verhogen.

Cruciaal voor een goede sluiting is de vulfase waarbij de zuiger dicht bij de platen wordt gebracht. De beweging moet zachtjes verlopen, zodat de zuiger niet tegen de platen botst. Het systeem is echter niet perfect bekend: wrijving, olielekken, slijtage en temperatuur zijn verstorende elementen die variëren over tijd. Wij hebben lerende regelaars toegepast op twee niveaus. Op een laag niveau zorgt iteratief lerende controle ervoor dat de gewenste drukreferentie nauwkeurig wordt gevolgd. Naarmate het aantal sluitingen toeneemt, stijgt de nauwkeurigheid (Figuur 5).

Om rekening te houden met de variaties in het systeemgedrag past een hoogniveau regelaar het referentieprofiel voor de druk aan op basis van gemeten schakelkwaliteit. Zo wordt steeds een zachte sluiting behaald zonder hoge pieken in het koppel.

Gesterkt door de uitermate positieve ervaringen met bovenvermelde cases willen wij ook in de toekomst verder gaan met lerende controle. Onder impuls van FMTC zijn de Vlaamse universiteiten samengebracht om rond dit thema een kennisplatform op te richten. Binnen het kader van het Lecopro-project (Lerende Controle voor Productiemachines, www.lecopro.org) wordt bekeken hoe andere lerende controletechnieken zoals reinforcement learning en machine learning kunnen worden gebruikt om een machine automatisch de optimale stuurparameters aan te leren en deze aan te passen in functie van variërende omgevingscondities.