Ontologia ja taksonomia-lakataan vertaamasta asioita, jotka ovat verrattomia

monille ihmisille, sana “ontologia” saattaa kuulostaa abstraktilta. Se on saanut alkunsa Tim Berners-Leen unelmasta World Wide Webin keksimisestä. Haaveena oli, että Web kykenisi määrittelemään niin sanotun semanttisen webin analysoimalla kaikkea Web-dataa, sisältöjä, linkkejä ja tietokonehenkilöstön transaktioita. Semanttisessa webissä Resurssikuvauskehys (Resource Description Framework, RDF) ja Web Ontology Language (Owl) ovat vakiintuneet sekä tiedon että tiedon jakamisen ja integroinnin standardiformaateiksi—jälkimmäiset ontologioiksi kutsuttujen rikkaiden käsitteellisten järjestelmien muodossa. Tässä artikkelissa sana ontologia toimii työn määritelmä, mutta on syytä mainita, että nykypäivän IT-maailmassa on myös laajasti käyttää termiä “knowledge graph” viitata tähän käsitteeseen.

miksi ontologiasta kannattaa välittää

tekoälyn (AI) osalta termit “big data”, “koneoppiminen” ja “syväoppiminen” ovat hiljalleen korvaamassa sanan ” AI ” käytön. Adrian Bowlesia lainatakseni ” koneälyä ei ole ilman (tiedon) edustusta.”Toisin sanoen tekoäly vaatii joitakin tietotekniikan elementtejä, tietoarkkitehtuuria ja merkittävän määrän ihmistyötä ‘maagisen hermotyönsä’tekemiseen. Sopivasti Alexander Wissner-Gross toteaa, että ehkä tärkeintä on tunnustaa, että juuri älykkäät tietojoukot—eivät algoritmit—ovat todennäköisesti keskeinen rajoittava tekijä ihmisen tason tekoälyn kehityksessä.

” koneälyä ei ole ilman (tieto) edustusta.”

ontologia on jäsennelty ja muodollinen esitys suhteellisesta tiedosta tietyllä alalla. Tämä on välttämätöntä, koska toisin kuin ihmiset, se ei voi suoraan luottaa ihmisen taustatietoihin termin oikeasta käytöstä. Ontologia voi kuitenkin “oppia” termin semanttisen merkityksen järjestelmänsä käsitteiden välisten yhteyksien kautta. Tehokkaita ontologioita on jo olemassa tietyillä aloilla, esimerkkeinä finanssialan yritysten ontologia (FIBO) sekä lukuisat terveydenhuollon, maantieteen tai ammattien ontologiat.

toinen tärkeä osa tekoälyä on semanttinen päättely. Sen lisäksi, että tekoäly tunnistaa mahdollisesti vilpilliset tapahtumat, määrittää käyttäjien tahallisuuden selainhistorian perusteella ja antaa tuotesuosituksia, se voi tehdä myös seuraavia: Se voi suorittaa tehtäviä, jotka vaativat eksplisiittistä päättelyä perustuen yleiseen ja toimialakohtaiseen tietoon, kuten uutisten ymmärtämistä, ruoanvalmistusta tai auton ostamista. Tällaiset tehtävät edellyttävät siis tietoa, joka ei ole osa syöttötietoja, mutta jota on yhdistettävä dynaamisesti tietoon. Tällainen koneellinen päättely voidaan saavuttaa vain ontologioilla ja niiden tiedon mallintamistavalla.

taksonomia ja ontologia eroavat oleellisesti

ontologia sekoitetaan usein taksonomiaan. Sen lisäksi, että molemmat kuuluvat tekoälyn, semanttisen webin ja järjestelmätekniikan aloihin, ei ole oikeastaan paljon sellaista, mikä luonnehtisi niitä synonyymeiksi. Taksonomialuokituksia, kuten O * NET (Occupational Information Network) ja ESCO (European Skills/Competences, qualifications and professions), ei yksinkertaisesti voida verrata ontologioihin. Ne tarjoavat paljon yksinkertaisemman lähestymistavan kohteiden luokitteluun, koska niillä on hierarkkinen rakenne ja ne hyödyntävät vain vanhemman ja lapsen välisiä suhteita ilman mitään ylimääräisiä, kehittyneempiä yhteyksiä. Ontologiat taas ovat paljon monimutkaisempi luokittelun muoto. Vertauskuvallisesti taksonomia on yhtä kuin puu, kun taas ontologia on lähempänä metsää.

esimerkiksi: termi “golf” voisi esiintyä useissa taksonomioissa. Se saattaa sijaita “ihmisen toiminta” puun alla (ihmisen toiminta -> vapaa-ajan toiminta- > urheilu – > golf). Se löytyy myös vaatetukseen liittyvästä taksonomiasta (vaatteet -> casual/active apparel -> sporting apparel -> golfvaatteet ja-asusteet). Se voisi esiintyä jopa jossain aivan muussa, esimerkiksi autojen taksonomiassa (auto -> Saksa -> VW -> Golf). Jokainen näistä taksonomioista voidaan katsoa puuksi, jonka oksat koskettavat niiden ‘golfiin’liittyviä solmukohtia.

toisin sanoen taksonomiat edustavat kokoelmaa aiheita, joissa on “is-a” -suhteita, kun taas ontologiat mahdollistavat paljon monimutkaisemmat yhteydet, kuten “has-a” – ja “use-a” -suhteet. Jos siis palaamme edellä mainittuun luokitteluesimerkkiin, taksonomioilta puuttuu kyky vertailla lapsikäsitteitä.

ESCO-luokituksessa lähes kaikki lääketieteen erikoislääkärit on ryhmitelty “erikoislääkärit” – nimikkeeseen. Lisäksi erikoisammattitaidot on yksinkertaisesti ryhmitelty luetteloihin, joissa ei ole mitään yhteyksiä vastaaviin erikoisammatteihin. Miksi? Yksi syy on se, että luokituksia käytetään pääasiassa tilastointitarkoituksiin. Tästä näkökulmasta ei ole tarpeen luokitella kaikkia yksittäisiä erikoislääkäreitä heidän taitojensa ja koulutustaustansa mukaan. Siksi taksonomioiden mukaan Erikoisalat voidaan tunnistaa vain tehtävänimikkeestään ja täytyy viitata muihin lähteisiin ymmärtääkseen paremmin niiden yksilöllisen merkityksen.

ammattien, pätevyyksien ja taitojen ontologian rakentaminen mahdollistaa automaattisesti yhtäläisyyksien ja erojen tunnistamisen työnimikkeiden välillä. Esimerkiksi lastenlääkäreillä ja neonatologeilla on samanlaisia töitä, joissa molemmissa huolehditaan vastasyntyneiden sairaanhoidosta. Ontologiamallinnuksella voidaan määrittää, että lastenlääkärillä on hyvin suuri osuus samanlaisia taitoja kuin neonatologilla. Lastenlääkärit voivat kuitenkin ottaa neonatologin työn hoitaakseen vasta jatkokoulutuksen jälkeen. Kaikki tämä tieto voidaan esittää ontologiassa käsitteiden välisten suhteiden kautta. Tämä ylittää yksinkertaisen taksonomian kapasiteetin.

ontologiat mahdollistavat täsmäytysaineiston

kun kyseessä on täsmäytys, vaikkapa ansioluetteloiden ja avoimien työpaikkojen yhteensovittaminen, ei ole parempaa tapaa kuin käyttää ontologiaa. Tähän käytetään aivan liian usein yksinkertaisia avainsanapohjaisia täsmäytysmenetelmiä tai sumeita koneoppimismenetelmiä, jolloin monet yhtäläisyydet jäävät havaitsematta ja niitä ei voida sovittaa yhteen, kuten avainsanavariaatiot, synonyymit ja vaihtoehtoiset lauseet. Kun matching, on tärkeää verrata semantiikkaa (taustalla merkitys) kahden kohteen sijaan sanamuoto. Tässä ontologiat astuvat kuvaan. Ne voivat tarjota semanttisen mallinnuksen, joka voi havaita taustalla olevat merkitykset ja yhtäläisyydet ansioluetteloissa ja toimenkuvissa.

ontologian sovitustekniikka edustaa perustekniikkaa monilla aloilla, kuten ontologian yhdistämisessä. Aloilla, joilla on hyvin monimutkaisia sääntöjä (ja monimutkaisia vuorovaikutuksia sääntöjen välillä), ei ole korvaavaa ontologioita. Tämä näkyy esimerkiksi harkittaessa erilaisten verkkotunnusten yhdistämistä. Oletetaan, että on olemassa kaksi erillistä ontologiaa, sää ontologia ja maantieteellinen ontologia, kun tarkastellaan navigointi-tai vakuutusriskejä, kolmannen ontologian luominen, joka yhdistää ja hyödyntää kahta muuta, on hallittavissa oleva propositio.

ontologioiden todellinen arvo

semanttinen järjestelmä nojaa eksplisiittisiin, inhimillis-ymmärrettäviin representaatioihin käsitteistä, suhteista ja säännöistä halutun domain-tiedon kehittämiseksi. On mahdotonta luottaa siihen, että ohjelmoijat rakentavat tällaisen koneoppimiseen perustuvan järjestelmän, koska heiltä puuttuu tarvittava tieto käsitteiden välisten suhteiden määrittelemiseksi tietyillä aloilla. Siksi verkkotunnustuntemus on opittava eri taustoja omaavilta verkkotunnusasiantuntijoilta (esim. Immateriaalioikeus, nestedynamiikka, autonkorjaus, avosydänkirurgia tai koulutus-ja ammattijärjestelmät). Tämä prosessi on ratkaisevan tärkeä kattavan tiedon esittämisen luomiseksi.

monikielisessä JANZZ-ontologiassa kielitaito on avainasemassa. Monissa tapauksissa yksi yhteen-käännös käsite useille kielille ei ole mahdollista, mutta koska Sveitsi on pieni ja integroitu, kaikki JANZZ ontologian kuraattorit puhuvat sujuvasti vähintään kahta kieltä ja jotkut jopa puhuvat enemmän kuin neljä (mukaan lukien Kiina ja arabia). Tämä etu takaa ontologian johdonmukaisuuden ja laadun eri kielissä.

noin vuosikymmen sitten JANZZ alkoi rakentaa ontologiaansa erilaisten ammattiluokitusten, eli ISCO-08: n, ESCO: n ja kaikkien maakohtaisten luokitusten, varaan. Vuosien varrella JANZZ on lisännyt janzz-ontologiaan tuhansia uusia ammatteja ja tehtäviä (esim.Markkinatutkimustieto Mineral, Millennial Generational Expert ja Social Media Manager), joita ei aiemmin ollut yhdessäkään tunnetussa taksonomiassa. Ammattinimikkeiden lisäksi ontologiaan on sisällytetty myös ajan tasalla olevat taidot, koulutus, kokemus ja erikoisalat. Se on oikea työkalu HR: lle ja julkisille työvoimapalveluille, joka tunnistaa työnimikkeiden yhtäläisyydet ja epäselvyydet sen sijaan, että se olisi taksonomian kaltainen termien kokoelma. Nykyään JANZZIN ontologia on ylivoimaisesti suurin, monimutkaisin ja täydellisin ammattitieto ontologia maailmassa.

yksityisille yrityksille ja julkisille työvoimapalveluille, jotka yrittävät valita taksonomiaan perustuvan luokittelujärjestelmän ja ontologiaan perustuvan luokittelujärjestelmän välillä, toivomme tämän artikkelin auttavan sinua tekemään oikean päätöksen ja ymmärtämään, että sijoittamalla ei-semanttiseen järjestelmään (ilman sisältöä) et pääse eteenpäin. Onneksi jotkut hallitukset ja yritykset ovat valinneet oikean tien ja ovat jo hyötyneet uusimmasta teknologiastamme. Jos haluat tietää lisää JANZZ ontologiasta, kirjoita nyt osoitteeseen [email protected]

Ian Horrocks. 2008. Ontologiat ja semanttinen Web. Osoite: http://www.cs.ox.ac.uk/ian.horrocks/Publications/download/2008/Horr08a.pdf

Larry Lefkowitz. 2018. Semanttinen päättely: tekoälyn (lähes) unohdettu puoli. Osoite: https://aibusiness.com/semantic-reasoning-ai/

uusi idea Engineering. 2018. Mitä eroa on Taksonomioilla ja Ontologioilla? Osoite: http://www.ideaeng.com/taxonomies-ontologies-0602

Daniel Tunkelang. 2017. Taksonomiat ja ontologiat. Osoite: https://queryunderstanding.com/taxonomies-and-ontologies-8e4812a79cb2

Nathan Winant. 2014. Mitkä ovat semanttisen päättelyn edut koneoppimiseen verrattuna? URL: https://www.quora.com/What-are-the-advantages-of-semantic-reasoning-over-machine-learning

Vastaa

Sähköpostiosoitettasi ei julkaista.