Projet

Général

Profil

Page en construction. Discussions sur la page

Système d'exploitation Sémantique du Web

Définition

Moterako, Système d'exploitation Sémantique du Web, est chargé d'assurer, dans un environnement sémantique, la liaison entre les composants : utilisateurs, ressources et applications.

Moterako constitue, pour l'utilisateur individuel ou le groupe, un Outil Intégré de gestion de la Connaissance dans la mesure où il permet la construction, la capitalisation et la mise à jour d'une base de connaissance individuelle, tenant compte des besoins, caractéristiques, capacités intellectuelles ou préférences personnelles de l'individu.
Sur le plan communautaire, il représente un Outil social de communication et de collaboration.
Sur le plan général, pour l'ensemble des utilisateurs, il ambitionne de construire une Base de Connaissance commune et libre.

La description de l'environnement sémantique et des composants (utilisateurs, ressources, applications), à travers le Modèle de Représentation de la Connaissance, est l'objet d'une spécification intitulée : Moterako Ontology Language (MOL1).
La description des fonctionnalités du Système d'exploitation Sémantique que constitue Moterako fait l'objet d'une seconde spécification : Moterako Functional Specification (MFS1).
L'élaboration de ces spécifications constituent la mission du volet Conception (Générale) du projet Moterako.

Modèle de Représentation de la Connaissance

L'environnement sémantique, les composants utilisateurs, ressources et applications constituent les éléments d'un système dont l'objectif final est de mettre à la disposition des utilisateurs un outil intégré de gestion de la connaissance. Ce système est construit sur la base de fondements conceptuels dont la définition précise est nécessaire afin d'en dégager les particularités, voire les caractères innovants.

Connaissance et Sémantique

"La connaissance résulte de la capacité d'une personne, ou d'une organisation, à rechercher, collecter, organiser et synthétiser des informations de multiples sources, afin d'en dégager un sens".

Pour passer de l'information brute, dont le web en constitue une source inépuisable, à la Connaissance, il faut nécessairement passer par un traitement cognitif de sémantisation (attribution de sens) et de synthèse.
Ce processus comporte plusieurs niveaux identifiables :

  • Le premier niveau, les données, est construit à partir de tous les documents publiés sur le web (liens) ou sur le site (hébergés). Dans leurs formes, ils peuvent s'agir de textes, images, sons, vidéos ou autres formats de publication. Les documents disponibles à ce stade n'ont qu'un sens intrinsèques pouvant être déterminés par algorithmes mathématiques ou linguistiques (analyse syntaxique du contenu, reconnaissance faciale ou vocale).
  • Le second niveau, les informations, est construit selon un processus humain d'attribution de sens aux données (attribution sémantique). Le modèle Moterako propose à ce stade d'un "système de matérialisation des sens" auxquels les unités de données peuvent être attachées. Les "sens" peuvent être purement sémantiques : idées, évènements, personnes, ou culturelles, c'est-à-d contribuer à apporter plus de précisions aux unités sémantiques, aux objets de données ou aux liaisons sémantiques établies entre les composants : langues, lieux, dates.
  • Le troisième niveau, les connaissances, est construit par un processus humain d'organisation des unités d'informations (sens+données), notamment par l'utilisation d'une base de définition ontologique prédéfinie. Il s'agit en pratique d'enrichir les unités d'informations par les moyens de personnalisation ou d'individualisation, d'établir les liaisons ontologiques entre les différentes unités. La qualité du traitement à ce niveau, indicateur du niveau de connaissance, influe nécessairement sur la capacité de l'individu ou du groupe, plus précisément des applications, à inférer et à créer d'autres unités sémantiques, d'informations ou liaisons sémantiques.
  • Le dernier niveau, la Connaissance ou le Savoir, est le résultat directe du niveau de connaissance précédemment établi et de l'exploitation optimale des applications. Il peut consister en l'étendue, la précision ou la pertinence des applications aussi bien qu'en la base de données propres à chaque application constituée par effet d'apprentissage, s'appliquant directement à l'univers de Connaissance de l'individu ou du groupe.

Par ailleurs, la gestion de la Connaissance doit être un processus permanent, évolutif et itératif. Dans cette vision, Moterako apporte une approche dynamique aux notions traditionnelles de connaissance et d'ontologies.

Utilisateurs

L'utilisateur constitue l'élément central du système Moterako. Il représente à la fois la source et le destinataire final des données sémantiques générées ou utilisées par le système. Le profil Utilisateur constitue l'unique élément dont il est possible de contrôler l'interaction avec les autres composants.
L'ensemble des actions humaines en relation avec le système est exécuté à travers les profils Utilisateurs.
Les éléments de connaissance attribuées aux autres niveaux de profils (Groupe, Population) sont dérivées des actions effectuées au niveau de l'utilisateur, selon diverses degré de contrôle.

Ressources

La notion de Ressource comprend non seulement son acceptation traditionnelle, c'est-à-dire un document publié sur le web, mais s'étend également à des concepts du monde réel, abstraits ou précis. Elle représente tout objet ou concept, abstrait ou personnel, virtuel ou réel, dont la représentation virtuelle (cas des objets réels) ou la consistance peut être exploité sur le site par l'utilisateur, individuellement ou en groupe.

Applications

Les applications permettent l'exploitation des ressources par les utilisateurs.

Moterako Ontology Langage (MOL1)

Moterako fournit les outils conceptuels et syntaxiques pour représenter la connaissance d'un Individu, d'un Groupe ou de toute la Population, à travers une spécification Moterako Ontology Language (MOL1) qui est une extension de OWL2.

La différence fondamentale avec OWL2, qui, par définition, constitue une description formelle d'un domaine de connaissance (approche objective), est que Moterako propose une description formelle de la connaissance d'un profil (approche subjective) qui peut être un individu, une communauté (Groupe) ou toute la Population.
Par ailleurs, MOL fournit une vision dynamique de la gestion de la Connaissance, notamment à travers un modèle d'évènements et de traitement prédéfinis (Règles Dynamiques d'Inférence).

La spécification Moterako Ontology Language (MOL1) comprend une définition de la nature et des limites de la Connaissance telle qu'utilisée dans le concept Moterako, un modèle de définition de la Structure Conceptuelle des Ontologies, du Graphe Sémantique et des Règles Dynamiques d'Inférence, et finalement, un modèle de correspondance (mapping) avec le langage OWL2, et par extension les autres langages sémantiques (RDF, XML).

La représentation de la Structure Conceptuelle, du Graphe Sémantique et des Règles Dynamiques d'Inférence fait usage de langage de modélisation tel que UML, MOF ou BNF.

Limites et Définition de la Connaissance

"Les grands esprits parlent d'idées, les moyens esprits parlent d'évènements, les petits esprits parlent de personnes."

L'expression de la Connaissance, telle que défini et utilisé dans Moterako, comporte certaines limites dont :
  • au niveau linguistique, les expressions littérales (noms, titres, etc) doivent pouvoir être attribuées à l'une des langues disponibles (ISO 639) et disposer d'un système d'encodage (Charset) nécessaire à la représentation;
  • au niveau spatio-temporelle, notamment pour les éléments évènementiels, pouvoir être attaché à une date comprise entre en 01 janvier 1600 et le 31 décembre 2099.

La Connaissance d'un Profil est construite à partir de toutes les idées, abstraites ou se rapportant à des choses précises, exprimées dans une langue qu'il comprend, tous les évènements situés entre les dates limites dont il a pu (passé) ou pourra (futur) avoir connaissance, ainsi que de toutes les personnes (nommées), vivantes ou décédées, auxquelles il pourra rattaché les autres éléments de connaissance.

Structure Conceptuelle des Ontologies

Une ontologie MOL consiste en une description formelle, dynamique, de Toute la Connaissance d'un Profil (Utilisateur, Groupe, Population), indépendamment de toute implication technologique ou syntaxique.

Cette première approche, théorique, fournit les composants suivants :

  • Les Profils : Utilisateurs, Groupes, Population. Le Profil constitue l'élément de base auquel une Ontologie peut être identifiée. La compréhension des motivations (besoins) ou organisations, dans le cas d'un groupe, permet d'anticiper sur le contenu et les domaines d'intérêts d'un profil particulier. La Population constitue un Profil synthétique générée par combinaison des profils individuels.
  • Les Entités : classes, instances et liens (relations) sémantiques. Il s'agit à la fois d'une collection d'entités prédéfinies et des mécanismes et règles de création de nouvelles entités. Les entités utilisées dans MOL constituent des extensions aux modèles d' expression de classes ou d' expression de propriétés du modèle OWL2;
  • Les Propositions sont les formes d'expression explicites (assertions, axiomes), implicites (calculées) ou héritées qui composent le niveau de Connaissance d'un Profil. Les degrés de certitude attachés aux propositions déterminent les possibilités de traitements automatiques ou d'inférence pouvant être appliqués aux composants.
  • Les Evolutions, qui consistent en évènements (actions) initiés par l'utilisateur et constituent les éléments déclencheurs de processus d'inférences prédéfinis, notamment dans le sens vertical : Individu, Groupe, Population.

Les profils et les entités constituent les éléments de connaissance auxquels un système d'identification unique, interne ou externe, peut être attaché (IRI).
La nature du profil détermine les règles et possibilités d'inférences pouvant être appliquées aux autres composants.

Graphe Sémantique

La deuxième approche, orientée vers la pratique, est schématisée par le Graphe Sémantique : un ensemble d'éléments dont certaines paires, ou multiples, sont liées directement par des liens dits sémantiques. Les liens sont orientés et qualifiés, notamment par une arborescence et une définition ontologique prédéfinie. Un élément Profil, qui représente l'élément de base auquel est attaché un ensemble formant une "Connaissance", détermine l'origine (manuelle, synthétique), ainsi que les niveaux d'édition autorisés sur les liens.

Le Graphe Sémantique est composé essentiellement des éléments suivants :

  • Les éléments Système : Motera (Home), Utilisateurs (Users), Groupes(Groups), Knob (KnowledgeBase).
    Ils ont essentiellement pour fonction de permettre l'accès aux composants individuels, notamment les profils.
  • Les profils (de connaissance), dont Utilisateur et Groupe.
    Les profils représentent l'élément de base auquel peut être attaché, et attribué, une Base, et par évaluation, un niveau de connaissance.
    Le Knob, ou Base de Connaissance commune, peut également être qualifié de Profil synthétique.
  • Les éléments (de connaissance)
    Les éléments de connaissance représente à la fois les données (ressources), les "sens" (contextes) ainsi que les liens sémantiques créés ou générés entre ces éléments (liens sémantiques). Chaque élément a obligatoirement une représentation au niveau de la Connaissance Globale (Knob), et peut être attachés et personnalisés par chaque profil (Utilisateur, Groupe).
    • Les ontologies : Classes ontologiques (Expression de classes et de propriétés).
      Les classes ontologiques forment le catalogue des définitions ontologiques prédéfinies applicables aux éléments de connaissance. Elles sont implémentées et utilisées au niveau du système indépendamment de tout syntaxe mais assurent l’interopérabilité du système, notamment en permettant l'exportation ou l'importation de données dans divers standards liées aux ontologies et aux traitements sémantiques.
    • Les contextes : Instances ontologiques.
      Le contexte est un élément qui, seul ou en combinaison (composite), représente un "sens" ou une "unité sémantique", qui représente à son tour, pour le profil auquel il est attaché, un concept ou un objet du monde réel. L'attachement de ressources à un contexte constitue une "attribution sémantique".
      • Les contextes de culture : Groupe, Langue, Lieu, Période (Chronologie);
      • Les contextes sémantiques : Idées, Evènements, Personnes.
        Les contextes sémantiques peuvent être qualifiés, individualisées ou composées, à partir d'un catalogue prédéfini d'ontologies, pour donner des éléments plus précis.
    • Les ressources : Instances ontologiques
      Les ressources représentent l'expression, à travers les différents supports du web, d'un "sens" ou d'une "unité sémantique (composite)".
      • Les ressources Utilisateurs : Documents, Fichiers hébergés;
      • Les ressources de groupe ou communautaires : Discussions, questions;
      • Les ressources Web : Lien ou autre forme de ressource disponible sur le web et externe au site;
      • Les ressources Profils : La représentation d'un profil Utilisateur, qui peut représenter du point de vue d'un autre utilisateur ou d'un groupe, une ressource.
    • Les liens (sémantiques)
      Les liens sémantiques peuvent lier des ressources entre elles (liens de citations, de références), lier des ressources à des contextes (liens constitutifs d'unités d'informations) ou lier des contextes entre elles (liens constitutifs d'unités de connaissance).
      Les liens sont exclusivement synthétiques (générés) dans la base de connaissance commune (Knob), personnalisables dans une base de connaissance au niveau Utilisateur, et mixtes au niveau du groupe, tenant compte de la nature, l'organisation et les règles de fonctionnement du groupe.
  • Les éléments applicatifs : Classes et Instances d'applications.
    La définition des classes d'applications est globale, et les implémentations, qui seront effectivement installées au niveau de chaque élément, peuvent être adaptées à la nature, aux données et informations disponibles, de chaque élément auxquelles elles s'appliquent.

Règles Dynamiques d'Inférence

Les Règles Dynamiques d'Inférence constituent l'élément dynamique du modèle Moterako. Ils consistent en un Modèle d'évènements et de Traitements destinés à réagir aux évolutions, c'est-à-dire aux actions initiées par l'utilisateur dans son propre processus d'acquisition, construction et capitalisation de la Connaissance.
L'ensemble de ce système exploitent l'interdépendance entre, dans un premier niveau, les profils, et dans un niveau étendu, les ressources et les applications.

Syntaxes et Langages Statiques : XML, RDF, OWL, MOL

Moterako est une extension de OWL 2, tant au niveau des spécifications structurelles que syntaxiques.
MOL devra fournir un mécanisme (mapping) pour garantir la compatibilité avec les langages sémantiques : RDF, RDF Schema, XML, XML Schema, OWL 2 (FULL, DL).

Moterako Functional Specification (MFS1)

La spécification des fonctionnalités (Moterako Functional Specification ou MFS 1) a pour objet de décrire les fonctionnalités du Système d'exploitation Sémantique du Web du point de vue de l'utilisateur final, individuellement ou en groupe, en tenant compte de la hiérarchie des besoins : Information, Communication et finalement Connaissance.

Outil intégré de Gestion de la Connaissance

Outil social de Communication et de Collaboration

Forum de discussion : Présentation du concept : Système d'exploitation Sémantique du Web