Dossier : Filtrage D’Information

CERISTNEWS Septième numéro - Décembre 2011

CERISTNEWS Bulletin d’information trimestriel Septième numéro - Décembre 2011 en pdf

Edito

Les technologies de l’information et de la communication (TIC) matérialisées notamment à travers Internet, combinées à la généralisation de l’informatique dans tous les secteurs d’activité ont conduit à la prolifération de sources d’informations distribuées regroupant des volumes considérables d’informations hétérogènes. De ce fait, le développement d’outils automatisés permettant l’accès efficace à ces informations est une nécessité absolue et constitue de nos jours un défi à surmonter.

Ce besoin a engendré des investigations et des recherches pour la mise en place de nouveaux médiateurs, entre les sources d’information et les utilisateurs, parmi lesquels les systèmes de filtrage de l’information. Un système de filtrage d’information (SFI) est défini comme un processus permettant, à partir d’un large volume d’informations dynamiques, de sélectionner et de diffuser seulement l’information intéressant un utilisateur ou un groupe d’utilisateurs. Il permet de cibler et d’acheminer d’une façon continue l’information pertinente répondant aux besoins des utilisateurs.

Le filtrage de l’information (FI) n’est ni un nouveau concept ni un concept exclusivement limité aux documents électroniques. En effet, quand nous lisons un texte quelconque sur papier ou autre support, le processus de filtrage intervient. Ainsi, nous sommes en train de filtrer une partie de l’énorme ensemble d’informations auquel nous avons accès et ce, à chaque fois que l’on désire acquérir une certaine information.

Le processus de filtrage d’information est très proche du processus de recherche d’information (RI), dans le sens où ils ont le même but qui est de retrouver l’information pertinente pour un certain utilisateur. Ils se distinguent par la nature du besoin en information des utilisateurs et du flux d’information. Pour RI, le besoin en information est éphémère et le fond documentaire est stable. Pour FI, le besoin en information est stable et le flux de documents est dynamique.

Par leur rôle de médiateurs, les systèmes de filtrage d’information doivent posséder les méthodes et les connaissances nécessaires pour traiter, évaluer, filtrer et extraire l’information pertinente pour l’utilisateur. Ils devront notamment :

Prendre en compte l’hétérogénéité de l’’information (documents structurés, semi structurés et non structurés)

Prendre en compte la nature multilingue de l’information accessible sur le réseau internet.

Tenir compte du profil de l’utilisateur, tant sur le plan des centres d’intérêt que sur la localisation spatio-temporelle de sa demande.

Évaluer l’information selon certains critères de qualité : sur le contenu (précision de l’information, information récente ou pas, unique ou pas,...), sur les responsables (affiliation institutionnelle, identification de l’auteur,...), sur l’organisation de l’information et sur l’accessibilité (version texte ou pas, chargement rapide ou pas,...)

etc.

Ce dossier a pour objectif de donner un aperçu général sur le domaine du filtrage d’information. Il présente le processus de sélection d’information assimilé au processus de filtrage. Il aborde les questions fondamentales auxquelles doit répondre un système de filtrage, tout en décrivant ses caractéristiques, les différentes formes de filtrage, ainsi que les différents domaines d’application. Il décrit, à la fin, quelques outils bien connus du domaine public et quelques outils développés au niveau du CERIST ainsi que quelques thèmes de recherche actuels liés au domaine du filtrage et d’accès à l’information.


 

Nouali Omar

Directeur de recherche

Division Théorie et Ingénierie des Systèmes Informatiques