Ditte Rude Moncur, digitaliserings- og analysechef hos Vækstfonden. Foto: Vækstfonden.

Hvordan vi arbejder med machine learning i Vækstfonden

BLOG: Vækstfonden har i løbet af de seneste år arbejdet strategisk og fokuseret med at anvende machine learning til det, som er vores kerneforretning; at sikre at iværksættere og vækstvirksomheder har adgang til den rigtige type af risikovillig kapital på det rigtige tidspunkt.

Adgang til risikovillig kapital afhænger i høj grad af den oplevede risiko. Og oplevet risiko er ofte ikke lig med reel risiko. Derfor er vores evne til at forstå og håndtere risiko ved finansiering af iværksættere og vækstvirksomheder afgørende for, at vi kan lykkes med at tage de rigtige risici. Det er en kompetence, som Vækstfonden længe har arbejdet på at opbygge  – og som vi i disse år ser afkastet af. Med machine learning kan vi igen rykke barren for vores forståelse af risiko.

Der er ikke tale om kunstig intelligens eller robotter, der kan erstatte vores dygtige medarbejdere. Men der er tale om en teknologi, som bruger algoritmer til at løse veldefinerede, velafgrænsede problemer – som fx at estimere en konkurssandsynlighed – ved at bygge modeller baseret på de mønstre, som findes i data.

Og al evidens peger på, at det netop er samspillet mellem mennesker og modeller, der giver de bedste løsninger. Det ser vi også i Vækstfonden. Vores mantra er derfor, at modellerne skal bruges til at gøre vores medarbejdere klogere – og vores medarbejdere skal gøre modellerne klogere.

Overordnet set er målet, at det skal blive nemmere og hurtigere at få adgang til den rigtige kapital. Og at vi kan træffe endnu bedre investeringsbeslutninger. Algoritmerne er ikke nødvendigvis nye, men vi har i dag en langt bedre adgang til beregningskraft og til større mænger af data – og ikke mindst relevante machine learning værktøjer. Og på den baggrund har vi bygget to modeller, som vi allerede anvender i dag;

  • en model der estimerer konkurssandsynligheden for etablerede virksomheder, som har brug for lånefinansiering. Vores lånemodel er i første version bygget på regnskabstal, revisorniveau, størrelse, alder, branche, geografi og selskabstype – og den vil løbende blive udbygget med variable som afspejler virksomhedens ledelse, produkt og markedet, som virksomheden opererer i.
  • en model der kan hjælpe os med at den initiale screening af de mange virksomheder, som søger venturekapital. Vores screeningsmodel er bygget til at kunne identificere de virksomheder, som vi gerne vil mødes med. Da der er tale om virksomheder på et tidligt stadig er der ofte få reelle datapunkter, som kan bruges til at forudsige sandsynligheden for succes – så modellen bruges i stedet til initialt at afgøre, om der er et match ift. vores investeringskriterier.

Og samtidig arbejder vi på en række nye modeller;

  • En scouting model, der kan gøre det lettere for investorer – både indenlandske og udenlandske – at finde relevant dealflow i det danske marked.
  • En udvidelse af vores lånemodel til de segmenter, som udgør en stor andel af Vækstfondens portefølje, fx iværksættere, ejerskiftede virksomheder, landbrug mv.
  • En segmenteringsmodel, som kan kanalisere virksomheder, som søger kapital, det rigtig sted hen.

Alt sammen bygger vi i partnerskab med relevante aktører, hvor det giver mening – og hvor det kan lade sig gøre.

Vi anvender typisk flere forskellige algoritmer, når vi bygger vores modeller. Vores lånemodel består eksempelvis af 5 forskellige algoritmer. Vi anvender random forrest (og boosted trees), som er gode til at håndtere både lineære og ikke lineære sammenhænge og finder de bedste lokale løsninger.

Den logistiske regression er derimod god til at finde de globalt bedste løsninger, men den er bedst til lineære sammenhænge. Og så er der de neurale netværk, som kan håndtere både lineære og ikke lineære sammenhænge samt ustrukturerede data.

Udfordringen ved dem er, at de kræver store datamængder og kan væres svære at afkode. Og det er uden tvivl en afgørende parameter for, at vi kan lykkes med mantraet om, modellerne skal kunne gøre vores medarbejdere klogere – nemlig at vi kan forstå modellernes forudsigelser og omsætte det til noget konkret feedback, som vi kan give videre til de virksomheder, som har søgt om kapital.

Hele pointen med indsatsen er som sagt at få oplevede risici til i højere grad af afspejle de reelle risici – og samtidig også at eliminere nogle af de bias, som vi mennesker har skabt os ud fra vores egne erfaringer. Den datadrevne tilgang kan således udvide vores horisont og netop være med til at sikre, at alle lovende iværksættere og vækstvirksomheder kan få adgang til den kapital de har behov for.