SDC, Data Science and Knowledge

Difference between revisions of "FODOMUST"

From SDC, Data Science and Knowledge
Jump to navigation Jump to search
(Created page with "= FoDoMuST: Fouille de données Multi-Stratégie Multi-Temporelles = center|1200px == L'interface Mustic == L'interface Mustic est une extension de...")
 
 
(112 intermediate revisions by 5 users not shown)
Line 1: Line 1:
= FoDoMuST: Fouille de données Multi-Stratégie Multi-Temporelles =
+
FoDoMuST: '''Fo'''uille de '''do'''nnées '''Mu'''lti-'''S'''tratégie Multi-'''T'''emporelles
  
[[File:plateforme4.png|center|1200px]]
+
= Présentation =
 +
La plateforme FODOMUST est une implantation concrète des méthodes, librairies et interfaces dédiées au clustering de données complexes proposées au sein d’ICube.  
  
== L'interface Mustic ==
+
[[File:Fodomust_interactif.jpg|600px|center]]
  
L'interface Mustic est une extension de Classifx (voir ci-dessous).
+
Elle intègre une version multisource de la méthode de clustering collaboratif multistratégie SAMARAH. Sa principale originalité est qu’elle offre à l’utilisateur les méthodes et les interfaces permettant le clustering sous contraintes incrémental de données temporelles symboliques ou numériques.  [https://seafile.unistra.fr/f/2d5695f510934496b52b/?dl=1 Article de présentation]
  
Mustic (Multi-Strategy Image Classifier) est une interface permettant la classification d'images de télédétection par des approches pixels et orientées objets.  
+
= MultiCube : Une interface pour le clustering sous contraintes incrémental de séries temporelles d'images  =
 +
MultICube (Multi-Strategy Multi-Resolution Multi-Temporal Image Classification) est une interface permettant la classification d'images de télédétection par des approches pixels et orientées objets.  
 +
 
 +
[[File:MulticubePresentation.webm|1200px|center]]                   
  
 
Elle permet de :
 
Elle permet de :
Line 13: Line 17:
 
* classifier (clustering uniquement) des images (par pixels ou basée régions) via la bibliothèque JCL,
 
* classifier (clustering uniquement) des images (par pixels ou basée régions) via la bibliothèque JCL,
 
* segmenter de telles images via la bibliothèque JSL.
 
* segmenter de telles images via la bibliothèque JSL.
 +
* d'imposer des contraintes lors du clustering
 +
<br>
 +
    [[File:InterfaceContraintes.png|600px|center]]
  
<br/>
+
= Deux bibliothèques =
<center><big>[[MusticDownload|'''Télécharger Mustic''']]</big></center>
 
<br/>
 
  
<gallery mode="packed" heights=300px>
+
* Java Clustering Library : regroupe un ensemble des classifieurs classiques (Kmeans, Cobweb, …) et la méthode de classification collaborative multi-stratégie SAMARAH
Fichier:Mustic clustering1.png|Aperçu de la classification
 
Fichier:Mustic segmentation.png|Aperçu de la segmentation
 
</gallery>
 
  
== L'interface Classifx ==
+
[[File:collaboration_multiresolution.png|600px|center]]
  
L'interface Classifx concrétise toutes nos activités de recherche sur la fouille de données collaborative multistratégie et sur la pondération d'attributs.
+
* Java Segmentation Library : regroupe tous les algorithmes de segmentation proposés par l'équipe. Elle permet aussi d'utiliser une part importante de algorithmes intégrés dans l'OTB. L’interface MULTICUBE dédiée à l’analyse de séries temporelles offre aussi un accès à un ensemble d’algorithmes de segmentation soit propres à ICUBE soit faisant appel à l’OTB diffusée par le CNES.
 
Elle permet de :
 
* charger/modifier/sauvegarder des données ARFF (Attribute-Relation File Format),
 
* classifier (clustering uniquement) des données ARFF via la bibliothèque JCL.
 
  
<br/>
+
[[File:vueEnsemble_3.png|600px|center]]  
<center><big>[[Téléchargement de Classifx|'''Télécharger Classifx''']]</big></center>
+
 
<br/>
+
= Téléchargement et exécution de FoDoMuST-MultICube =
  
<gallery mode="packed" heights=300px>
+
Vous pouvez télécharger le client avec le lien ci-dessous. Pour pouvoir l'exécuter il faudra avoir au préalable téléchargé Java 11 JRE (ou JDK) [https://www.oracle.com/fr/java/technologies/javase/jdk11-archive-downloads.html ici].
Fichier:classifx_data.png|Aperçu des données
+
Attention, cette version n'est qu'un client léger et nécessite d'être connecté à un serveur.  
Fichier:classifx_result.png|Aperçu des résultats
 
</gallery>
 
  
== L'interface Area manager ==
+
Un tel serveur est ouvert à tous (sur une machine hébergée à l'Unistra) et est configuré comme serveur par défaut. Si vous rencontrez des problèmes veuillez nous [mailto:gancarski@unistra.fr;lafabregue@unistra.fr;chenglin.xu@unistra.fr contacter] directement.
 +
<center><big>
 +
[https://forge.icube.unistra.fr/sdc-fodomust-dev-group/fodomust/-/releases Télécharger l'exécutable MultICube]
 +
</big></center>
 +
<br />
 +
Attention : To analyze the generated kmz file, we have to use Google Earth Pro. This version of Google Earth doesn't run in browsers and we have to install it on our computer. Here is the link to download it:
 +
https://www.google.com/intl/fr_ALL/earth/about/versions/
  
Area manager est une solution logicielle regroupant deux logiciels complémentaires : GeOpenSim et Ivisualize.
 
 
<br />
 
<br />
<br />
+
Pour le code vous pouvez vous referrer à notre Git : [https://forge.icube.unistra.fr/sdc-fodomust-dev-group/fodomust https://forge.icube.unistra.fr/sdc-fodomust-dev-group/fodomust]
<center><big>[http://fodomust.u-strasbg.fr/~aci/classifx_v5.4.zip Télécharger Area manager (zip)]</big></center>
+
 
<br />
+
= Contacts =
<gallery mode="packed" heights=300px>
+
 
Fichier:GeOpenSim.png|Interface de GeOpenSim dans Area Manager
+
Pour tout renseignement sur les méthodes liées à Mustic et JCL et pour obtenir les sources  [mailto:Pierre.Gancarski@unistra.fr Cliquez ici]
Fichier:Ivisualize.png|Interface de Ivisualize dans Area Manager
+
<!--
</gallery>
+
= Ground Truth Agreement Toolbox (GTAT) =
GeOpenSim, acronyme de Géographique Open Source De Simulation, est un logiciel permettant l' analyse des tissus urbains, en simulant en fonction du temps les évolutions d'une zone urbaine, autant sur le plan de l'expansion que la densification de son ensemble, afin d'analyser les impacts possibles d'une décision de développement urbain sur cette zone. GeOpenSim permet, à partir de données Shapefiles issues de BD Topo type IGN, de créer des îlots urbains, de les classifier en utilisant un arbre de décision et de créer des séquences temporelles correspondant à leurs évolutions.
+
 
 +
This Matlab toolbox accompanies the paper:
 +
 
 +
:T. Lampert, A. Stumpf, and P. Gancarski, 'An Empirical Study into Annotator Agreement, Ground Truth Estimation, and Algorithm Evaluation'. (submitted).
 +
 
 +
It contains implementations of the functions described within the paper related to agreement analysis and the evaluation of detectors using different ground truth estimation techniques. It may also be used to recreate the figures for the fissure case study to gain a better understanding of the method (see the QUICK START section of the included readme file).
  
<gallery mode="packed" heights=300px>
+
It is assumed that you have a number of annotations related to the same image.
Fichier:Arbre_de_décision.png|Aperçu d'un arbre de décision
 
Fichier:GeOpenSimFenetre.png|Aperçu du chargeur de données
 
</gallery>
 
  
Ivisualize est une interface permettant la visualisation, la classification supervisée ou non  de séquences d'évolution temporelle d’îlots créés par GeOpenSim. Il est basé sur DTW, JCL, et une matrice de similarité donnée par l'expert. Les résultats obtenus  peuvent être exportés sous forme graphique (dendrogramme), image, PDF, ou encore Shapefiles.
+
To use the toolbox's functions, simply add the toolbox directory to Matlab's path. Within the header of each function may be found a short description of its purpose and in which section of the paper its mathematical derivation can be found. For more information see the toolbox's README file.
  
<gallery mode="packed" heights=300px>
+
The toolbox is separated into three main functions:
Fichier:examIvi02.png|Aperçu d'une carte sur iVisualize
+
# The agreement_analysis function calculates the statistics outlined in our paper for the collection of annotations passed to it.
Fichier:MatriceSimilarite.png|Aperçu d'une matrice de similarité
+
# The calculate_GTs function calculates ground truths using the methods outlined below:
</gallery>
+
#* the LSML algorithm;
 +
#* the agreement of any annotator;
 +
#* the agreement of 50% of annotators;
 +
#* the agreement of 75% of annotators;
 +
#* the STAPLE algorithm;
 +
#* by excluding outliers of the annotator clustering evaluation;
 +
#* and by excluding outliers and then calculating the 50% agreement level.
 +
# The detector_analysis function determines the detector's performance respective to each of the ground truths passed to the function, it then ranks the detectors based upon these performances.
  
== Java Clustering Library ==
+
The toolbox can be downloaded [http://icube-bfo.unistra.fr/img_auth.php/7/78/Agreement_Toolbox_V1.0.zip here].
Nos premiers travaux ont été écrits en C++ et traduits en Java en 2000 pour obtenir la bibliothèque JCL (Java Clustering Library). Si initialement cette bibliothèque ne contenait que les classifieurs classiques, les classifieurs proposés dans nos recherches y ont été intégrés au fur et à mesure de leur définition.
 
  
Actuellement, elle regroupe un ensemble des classifieurs classiques (Kmeans, Cobweb, …),  la méthode de classification multi-stratégie SAMARAH et les méthodes génétiques dont Maclaw.
+
= Precision-Recall Toolbox (PRT) =
  
A partir de 2003, cette bibliothèque permet la classification de données au format ARFF et celle d'iimages de télédétection.
+
This Matlab toolbox accompanies the paper:
  
== Java Segmentation Library ==
+
:T. Lampert and P. Gancarski, 'The Bane of Skew: Uncertain Ranks and Unrepresentative Precision'. Machine Learning, pp. (submitted), 2013.
  
Cette bibliothèque date de 2012. Elle regroupe tous les algorithmes de segmentation proposés par l'équipe. Elle permet aussi d'utiliser une part importante de algorithmes intégrés dans l'OTB.
+
It contains implementations of the functions described within the paper to calculate Precision-Recall, temporal Precision-Recall, integrated Precision-Recall and weighted Precision-Recall curves given a classifier's response and a corresponding ground truth. It may also be used to recreate the paper's figures to gain a better understanding of the method.
  
== Documents ==
+
To use the toolbox's functions, simply add the toolbox directory to Matlab's path. Within the header of each function may be found a short description of its purpose and in which section of the paper its mathematical derivation can be found. For more information see the toolbox's README file.
  
Vous trouverez aussi un rapport de stage décrivant les grandes lignes de l'interface MUSTIC ainsi qu'une description rapide de SAMARAH : [[Media:Documents.zip]]
+
The toolbox can be downloaded [http://icube-bfo.unistra.fr/fr/img_auth.php/3/3b/IPR_toolbox_v1.0.zip here].
  
== Contacts ==
+
= La plate-forme bioinformatique BISTRO =
 +
[http://bioinfo-bistro.fr plate-forme BISTRO]
  
Pour tout renseignement sur les méthodes liées à Mustic et JCL et pour obtenir les sources  : Cedric.Wemmert@unistra.fr ou Pierre.Gancarski@unistra.fr
+
La plate-forme bioinformatique de Strasbourg BISTRO a été reconnue par l’Institut Français de Bioinformatique comme membre du réseau national des plateformes bioinformatiques (RéNaBi) Nord-Est qui inclut, outre Strasbourg, Lille, Vandoeuvre les Nancy et Reims en accord avec la politique de l’IFB et de RéNaBi d’améliorer la visibilité nationale et internationale des réalisations bioinformatiques françaises en aggrégeant des plateformes de sites multidisciplinaires et multi-instituts. Dans ce cadre, BISTRO réunit sur Strasbourg des équipes IGBMC, IBMC, IBMP, GMGM, IPHC, ICube et est à même de fournir un ensemble bioinformatique cohérent incluant : expertise, outils et ressources, algorithmes d'exploration de données. Ces ressources sont axées sur les analyses évolutives et fonctionnelles dans divers domaines d'application, y compris les études biomédicales, les plantes, les levures et bactéries.
 +
-->

Latest revision as of 11:39, 16 November 2023

FoDoMuST: Fouille de données Multi-Stratégie Multi-Temporelles

Présentation

La plateforme FODOMUST est une implantation concrète des méthodes, librairies et interfaces dédiées au clustering de données complexes proposées au sein d’ICube.

Fodomust interactif.jpg

Elle intègre une version multisource de la méthode de clustering collaboratif multistratégie SAMARAH. Sa principale originalité est qu’elle offre à l’utilisateur les méthodes et les interfaces permettant le clustering sous contraintes incrémental de données temporelles symboliques ou numériques. Article de présentation

MultiCube : Une interface pour le clustering sous contraintes incrémental de séries temporelles d'images

MultICube (Multi-Strategy Multi-Resolution Multi-Temporal Image Classification) est une interface permettant la classification d'images de télédétection par des approches pixels et orientées objets.

Elle permet de :

  • charger/modifier/sauvegarder des images via Orfeo Tool Box (CNES),
  • classifier (clustering uniquement) des images (par pixels ou basée régions) via la bibliothèque JCL,
  • segmenter de telles images via la bibliothèque JSL.
  • d'imposer des contraintes lors du clustering


InterfaceContraintes.png

Deux bibliothèques

  • Java Clustering Library : regroupe un ensemble des classifieurs classiques (Kmeans, Cobweb, …) et la méthode de classification collaborative multi-stratégie SAMARAH
Collaboration multiresolution.png
  • Java Segmentation Library : regroupe tous les algorithmes de segmentation proposés par l'équipe. Elle permet aussi d'utiliser une part importante de algorithmes intégrés dans l'OTB. L’interface MULTICUBE dédiée à l’analyse de séries temporelles offre aussi un accès à un ensemble d’algorithmes de segmentation soit propres à ICUBE soit faisant appel à l’OTB diffusée par le CNES.
VueEnsemble 3.png

Téléchargement et exécution de FoDoMuST-MultICube

Vous pouvez télécharger le client avec le lien ci-dessous. Pour pouvoir l'exécuter il faudra avoir au préalable téléchargé Java 11 JRE (ou JDK) ici. Attention, cette version n'est qu'un client léger et nécessite d'être connecté à un serveur.

Un tel serveur est ouvert à tous (sur une machine hébergée à l'Unistra) et est configuré comme serveur par défaut. Si vous rencontrez des problèmes veuillez nous contacter directement.

Télécharger l'exécutable MultICube


Attention : To analyze the generated kmz file, we have to use Google Earth Pro. This version of Google Earth doesn't run in browsers and we have to install it on our computer. Here is the link to download it: https://www.google.com/intl/fr_ALL/earth/about/versions/


Pour le code vous pouvez vous referrer à notre Git : https://forge.icube.unistra.fr/sdc-fodomust-dev-group/fodomust

Contacts

Pour tout renseignement sur les méthodes liées à Mustic et JCL et pour obtenir les sources Cliquez ici