Data Mining

Les outils d’exploration de données (data mining) ne se focalisent pas nécessairement sur la phase de collecte de l’information sur l’internet, mais sur le traitement sémantique de gros corpus de texte.

Nous verrons dans cette page des outils logiciels (coûteux dans l’ensemble) à installer sur le poste de travail du veilleur. Cette rubrique peut être lue en parallèle avec celle sur les outils à représentation graphique des données.

Introduction
L'Extraction de Connaissances à partir de Données (ECD), communément appelée DATA MINING, est un domaine de recherche dédié à la recherche du sens dans des corpus de connaissances numériques immenses. Voici une première présentation.
http://www.ultra-fluide.com/ressources/datamining/presentation.htm
[Site nº 1335 - Mis en ligne le 12 septembre 2012]

Un cours sur le Data Mining
Par Gilbert SAPORTA, professeur titulaire de la chaire de statistique appliquée au Conservatoire National des Arts et Métiers.
http://cedric.cnam.fr/~saporta/DM.pdf
[Site nº 1336 - Mis en ligne le 12 septembre 2012]

Logiciels de veille : ARISEM
La société Arisem est sans doute l’une des entreprises les plus connues des professionnels de l’information. Les logiciels Arisem permettent de mettre en place des solutions d’intelligence économique et de veille stratégique.
http://www.arisem.com
[Site nº 167 - Mis en ligne le 23 septembre 2006]

Sites anglais :

PERTIMM : WebProDipper
La fusion de deux sociétés, Systal et Createam a donné naissance au moteur de recherche sémantique universel Pertimm ®. Ce logiciel va analyser et indexer le corpus constitué et offrir des outils de pousser ou de tirer (push ou pull) et de navigation dans la masse d’information.
http://www.pertimm.com/
[Site nº 171 - Mis en ligne le 4 mai 2002]

Solutions de veille : AUTONOMY
La très cotée société anglaise Autonomy offre un éventail d’outil de GED, de Gestion des Connaissances (KM), ERP, de Gestion des Relations Clients (CRM), de création de portails, de commerce électronique. Les sources d’information traitées sont plus larges que celle de l’internet. Il s’agit ici d’une offre globale d’outils de gestion de l’information dans l’entreprise.
http://www.autonomy.com
[Site nº 169 - Mis en ligne le 4 mai 2002]

Cimetière de sites :

LEXIQUEST
La société Lexiquest s’attaque non pas à la collecte de l’information mais de son extraction, sa structuration et ses représentations graphiques. Les outils d’analyse linguistique et statistique ainsi que des dictionnaires de concepts (ou thésauri) sont le point fort de la société.
http://www.lexiquest.com
[Site nº 168 - Mis en ligne le 23 septembre 2006]

Raffinage de l’information : ALOGIC
Alogic réalise, dans son domaine de compétence, l’intégration de systèmes clefs en main, la conception et la réalisation d’applications et les prestations de services associées, autour d’Aperto Libro ® un atelier logiciel d’extraction, de raffinage, de stockage et de distribution d’informations et de connaissances.
http://www.alogic.fr/
[Site nº 172 - Mis en ligne le 4 mai 2002]

Technologie Périclès de DATOPS
Datops a choisi la technologie Périclès ® qui s’articule autour d’une approche en 7 étapes et de trois logiciels. Le premier est un système de pousser (push) sur un ensemble de sources internet (presse, web, mailing listes, newsgroup) sur un thème prédéfini (société, personne, ou produit). Vient ensuite un logiciel de tableau de bord graphique de l’information retrouvée sur les sujets surveillés. Le dernier outil permet aux professionnels de l’information de procéder à des analyses lexicales et des requêtes booléennes sur le corpus constitué.
http://www.datops.com/
[Site nº 170 - Mis en ligne le 4 mai 2002]

Statistiques :

Identification :

Utilisateurs :

Il y a actuellement 1 utilisateur connecté.

Droits d'auteur :

Ce site est mis à disposition
sous un contrat Creative Commons :
http://creativecommons.org