Kunstig intelligens og maskinlæring

Begrepet kunstig intelligens (artificial intelligence, AI) oppsto under en konferanse ved Dartmouth College i USA i 1956, der mulighetene for maskinell intelligens var temaet.

Av Bjørn Magnus Mathisen, Stipendiat og Forsker – NTNU, SINTEF og Agnar Aamodt, Professor – NTNU

Analyse av aktivitetsdata samlet fra aktivitetsarmbånd i selfBACK prosjektet. 

Tidligere arbeider av Claude Shannon innen informasjonsteori, Norbert Wiener innen kybernetikk, McCulloch og Pitts innen nevrale nett, og ikke minst Alan Turing innen teoret­isk databehandling, ga bakgrunn for diskusjonene på konferansen. Fokuset til å begynne med var på hvordan menneskelig rasjonell tenking kunne lede til dataprogrammer som kunne løse problemer utover rent regnetekniske oppgaver, dvs. problemer som krevde menneskelig intelligens for å løses. Numeriske beregninger ble ­erstattet av logiske uttrykk og beslutningsregler.

Et av de første suksessprogrammene var The General Problem Solver, som kunne løse ulike typer problemer basert på disse prinsippene. Metodene som ble utviklet var i stor grad basert på kognitive modeller, dvs modeller av hvordan mennesker tenker, løser problemer, og lærer gjennom erfaring.

Men etter hvert forsto man at for å løse komplekse problemer i den reelle verden var ikke generelle resonner­ingsmetoder nok, systemene måtte også ha domene-kunnskap om det spesifikke problemområdet det skulle operere innenfor. Begrepet kunnskapsbaserte systemer, og ekspertsystemer, oppsto. Beslutningsregler ble ofte ut­videt med det som ble kalt dypere modeller, dvs. nettverk av begreper og ulike typer relasjoner mellom dem. Tidlige ekspertsystemer utviklet på 70-tallet viste imponerende evner til problemløsing, bl.a. innen medisinsk diagnose og mange typer industrielle problemer, noe som førte til stor inter­esse og satsing fra industri og forvaltning, spesielt i USA, men også etter hvert i Europa.

Et stort problem med ekspertsystemene var arbeidet med manuelt å bygge regelsettene og nettverks-­modellene, kalt kunnskapsakkvisisjon, og mye forskning ble nedlagt i dette. På den tiden var tilgjengeligheten på data en helt annen enn i dag, og en kunne bare håpe at kunnskapen som trengtes etterhvert kunne læres fra observerte data. Økt tilgang på data ble etter hvert en realitet, og dette ga fart i del-området maskinlæring. Maskinlæring, forenklet sagt, går ut på å automatisk lære nyttige begreper (for eksempel en medisinske diagnose, hvordan en katt ser ut, eller hva neste aksjon bør være i en beslutningssituasjon), ved å motta inn-data om riktige og ikke-riktige eksempler på begrepet. Utifra dette vil så programmet lære seg et generelt mønster som kan brukes til raskt å fortelle om et nytt og ukjent eksempel er et eksempel på begrepet eller ikke. Men det tok mange år og mye data før maskinlæring-metoder ble så slagkraftige at de fikk praktisk nytte. Fremveksten av maskinlæringmetoder medførte at behovet for å bygge manuelle kunnskapsmodeller ble vesentlig redusert.

I dag er situasjonen at vi har uhorvelig mye data tilgjengelig, som også har ført til at nye og stadig bedre lærings­algoritmer har blitt utviklet. Maskinlæring har tatt over som det dominer­ende metodeområdet innen kunstig intelligens, og de gode resultatene som er framvist har ført til en enorm interesse. Tilgangen på mye data har også ført til at statistiske metoder har blitt stadig mer dominerende, og for mange av metodene har behovet for å bruke tid og krefter på å bygge manuelle modeller forsvunnet helt. En kan si at den skjulte kunnskapen som ligger i dataene, og som kan ekstraheres via statistikk-orienterte eller mer kognisjons- baserte metoder, erstatter manuelt bygde kunnskapsmodeller. I løpet av de siste årene har utviklingen av denne typen metoder gått veldig raskt, med stadig nye metoder som gjør det bedre enn tidligere metoder. For tiden er det dype nevrale nett som for mange typer problemer er dominerende, og som har oppvist meget imponerende resultater, bl.a. ved å slå en av verdens beste GO- spillere. GO er et spill som er mye mer komplekst og vanskelig for en maskin å lære seg enn sjakk. Og nyttige praktiske anvendelser øker. Mange firmaer benytter i dag maskinlæring, og i stor grad dype nevrale nett, til å analysere sine data for å komme opp med tolkninger av eksisterende situasjoner samt predikere framtidige forløp. Store firmaer som IBM, Microsoft, Google, Amazon, Netflix, Facebook, etc., har alle store avdelinger for kunstig intelligens med spesielt fokus på ­maskinlæring fra store datamendger.

Framtiden

Når det gjelder framtiden, så er det mange aspekter å ta tak i. Ett sentralt aspekt er hvordan metodene kommer til å utvikle seg, og hvilke nye mulig­heter det kan gi. Ett annet er hvorvidt den økende suksessen til kunstig intelligens kan føre til maskiner som vil overgå menneskers intelligens, med maskiner som ikke lenger vil la seg styre av oss og dermed utgjøre en ­trussel.

For å ta det første først, så vil metode­- området kunstig intelligens – inkludert maskinlæring – selvfølgelig utvikle seg videre. Dagens ’hotte’ metode, dype nevrale nett, har vist seg å fungere imponerende bra for visse typer problemer, og spesielt for læring av generelle mønstre utifra veldig store datamengder. Og forbedrede varianter av denne metoden vil komme. Men andre typer problemer vil kalle på andre typer metoder. For eksempel å lære diagnose av vanskelige og relativt sjeldne sykdommer, eller planlegging av komplekse arbeidsoperasjoner, vil kunne gjøres bedre med en kombinasjon av data-drevne maskinlæring­metoder og kunnskapsbaserte metoder, der systemet kan starte ut med en manuelt utviklet kunnskapsmodell og kombinere den med læring fra data. Det er også en bekymring blant mange forskere at området kunstig intelligens beveger seg bort fra mentale modeller av menneskelig tenking og over i rent statistiske metoder. Et initiativ kalt Artificial General Intelligence ønsker større fokus på det som var et opp­rinnelig mål med fagfeltet, nemlig systemer som kan oppvise intelligent adferd lik menneskets. Det blir ofte nevnt at kunstig intelligens kan være en trussel mot menneskeheten. Etablerte forskere på området har hørt denne prediksjonen dukke opp flere ganger, og de fleste av oss tar denne ’trusselen’ med stor ro. Selv med de seneste tiders suksesser er vi milevidt unna noe som kan ligne på den grunnleggende forståelsen, fleksibiliteten, tilpasningsdyktig­heten, og kommunikative evnen som kjennetegner menneskers intelligens. Mulig misbruk av avansert kunstig intelligens teknologi – av oss mennesker – til formål som ikke gagner menneske­heten er en mye større trussel. Dette er jo en trussel som deles med andre tekno­logiområder. For kunstig intelligens er det tatt initiativer både blant forskere og industri som setter søkelyset på dette problemet, og som forsøker å bygge opp holdninger som skal mot­virke denne faren.

NTNU, ved Institutt for datateknikk og informasjonsvitenskap (IDI), har vært aktiv innen kunstig intelligens siden midten av 80-tallet. Vi bygde opp kompetansen på vårt institutt samtidig som Sintef etablerte en egen gruppe for kunnskapsteknologi. Ved IDI fikk vi vårt første professorat i faget i 1990. Vi har hatt grunnundervisning i emnet siden den tid, samt en portefølje av master-emner inkludert maskinlæring siden midten av 90-tallet, som det eneste universitet i Norge med en ­helhetlig og bred undervisning innen kunstig intelligens. Vi har for øvrig merket en betydelig økt interesse blant våre studenter for å studere kunstig intelligens de siste årene.

I den senere tid har det også vært økt aktivitet innen områder relatert til kunstig intelligens ved flere andre institutter på vårt fakultet. Ved andre fakulteter har vi også registrert økt interesse for anvendelse av kunstig intelligens og maskinlæring.

Anvendelse innen Medisin

Det har vært flere oppslag om at større firmaer som Google Deepmind og IBM tar sikte på å anvende maskinlærings teknologi inn i mot medisin og diagnose. Nylig ble IBM’s Watson brukt til å finne rett diagnose til en kvinne med leukemi på et sykehus i Tokyo, noe legen hadde forsøkt over lang tid. ­Dette kommer i kraft av Watson kunne kryssjekke kvinnens journal med 20 millioner onkologiske rapporter og annen data. Watson ble nylig også tatt i bruk i et nytt innovasjonslaboraturium i tilknytning til Radiumhospitalet .Generellt sett peker dette på hvordan de første fremskrittene vil komme innen medisin som resultat av anvendelse av maskinlæring – Der maskiner kan hjelpe oss og se mønster i store mengder data. I dette tilfellet kunne Watson samstille journalen med titalls millioner av datapunkter, noe mennesker ikke har mulighet til å gjøre uten slike verktøy. Samtidig jobber Google sitt selskap DeepMind med National Health Service i England for å utvikle lignende løsninger basert på innsamlede pasient data.

I Norge finnes det lignende prosjekter som bruker innsamlede data for å støtte pasienters selvbehandling. Selfback (http://selfback.eu) registrerer pasient­ers bevegelsesmønster og bruker dette til å gjøre anbefalinger til brukerne for å unngå ryggsmerter. ADAPT(https://www.sintef.no/en/projects/adapt/) gjør det samme for å evaluere fall risiko hos eldre og andre fall-utsatte pasienter. På den andre siden finnes det valide hindre for slike typer verktøy. Det er en ut­fordring å balansere privatlivets fred og ­sikkerheten til data opp i mot ­verktøyets tilgang til data. Det er også et sterkt lovverk for dette Norge, ­spesielt innenfor forskningsprosjekter.

Til slutt vil nok behovet for å ta i bruk slike verktøy, i kraft av de gode result­atene de oppnår, sannsynligvis tvinge frem forenklinger i reguleringen av dette både i Norge og internasjonalt. •