1
Classification Support Vector Machine Algorithme choisi : Support Vector Machine (SVM) ► supervis ► mthode statistique ► peu de zones chantillons pour l’apprentissage (polygones au format shape) dfinir un hyperplan : minimiser la marge maximale (distance entre l’hyperplan et les chantillons les plus proches) Trois diffrentes catgories sont choisies : Voirie Bâtiments Vgtation Conclusion INSA de Strasbourg - TOPOGRAPHIE Soutenance du XX Septembre 2013 Contact : ophelie.sinagra@insa- strasbourg.fr UNSW, Samsung LIM High St, Kensington NSW 2052 AUSTRALIA FUSION DE DONNEES LiDAR ET MULTISPECTRALES Etude des techniques de segmentation, de classification et d’extraction de donnes LiDAR, d’images multispectrales et de leur fusion Proposition d’une nouvelle technique de traitement de la fusion des donnes et analyse des rsultats Ophelie SINAGRA Mots clés LiDAR – Images multispectrales – Classification supervise – Support Vector Machine (SVM) – Indices multispectraux – Hauteur Introduction L’objectif de cette recherche est de dvelopper une technique permettant la fusion des donnes afin de procder une classification rapide et efficace l’aide d’un algorithme choisi. Certaines contraintes se posent alors telles que les diffrentes rsolutions spatiales de l’image et du nuage de points ou encore le choix de l’algorithme. L’tude des prcdentes recherches a permis de dterminer une nouvelle approche qui consiste crer plusieurs rasters l’aide des donnes de diffrentes sources, de les assembler afin de n’obtenir qu’un seul et unique raster compos de plusieurs couches, et pour finir d’utiliser un algorithme de classification supervise sur le raster cr ́ . Données Image multispectrale LiDAR Deux types de donnes : Capteur : QuickBird. 4 Bandes : bleue, rouge, verte et proche-infrarouge Rsolution spatiale : 2.44 mètres. Système : Date : 10 Mai 2002 Fusion Hauteur Indices de végétation Fusion = Assemblage de couches en un seul raster LiDAR : coordonnes tridimensionnelles ► Extraction des informations et conversion Trois pour la cration du raster reprsentant la variation d’altitude entre les points du sursol par rapport au MNT : Fusion des données Les rasters crs doivent être assembls afin de n’avoir que des rasters composs de plusieurs bandes et ainsi pouvoir parler de fusion des donnes. Classificatio n des points du sol et du sursol Calcul de la hauteur des points du sursol Substitution la coordonne Z Conversion du nuage en raster rsolution 2.44 m Hauteu r Indices de vgtation : indicateurs numriques utilisant plusieurs bandes de l’image multispectrale et fournissant des informations sur la prsence ou non d’lment vgtal. Bande Rouge Bande PIR Bande Bleue Calcul des indices GEMI SAVI NDVI GEMI SAVI NDVI Hauteur Zones chantillons Classificatio n SVM Résultats Mthode d’estimation de la qualit de la classification : Comparaison avec une rfrence Reference : nuage de points LiDAR class manuellement + indice NDVI (les donnes tant acquises des moments diffrents, la vgtation a beaucoup volu. Les pixels de la couche NDVI dont les comptes numriques ont une valeur suprieure 0,2 ont t extraits et utiliss dans la rfrence). Erreur de Commission 6.69 % Précision pour l'utilisateur 93.31 % Erreur d'Omission 9.68 % Précision pour le réalisateur 90.32 % Erreur d’Affectation 16.37 % Précision totale 83.63 % Tests supplémentaires Dtermination des couches importantes: classification effectue sur des rasters comprenant moins de couches (une ou deux couches ont t supprimes). Seule la couche hauteur (issue du lever LiDAR) combine avec la couche NDVI ou avec la couche SAVI s’avère utile: la prcision de la classification est alors de 84.2%. Lorsque les informations issues du LiDAR ne sont pas utilises la prcision de la classification baisse de près de 20%. Couches Précision totale de la classification NDVI + SAVI + GEMI 63.1 % NDVI + SAVI + H 84.3 % GEMI + SAVI + H 83.7 % NDVI + GEMI + H 83.7 % NDVI + H 84.2 % SAVI + H 84.2 % Les diffrents tests effectus permettent de dfinir les lments indispensables une bonne classification: une couche issue du lever LiDAR, reprenant l’information concernant la hauteur des points du sursol, et une issue de l’image multispectrale, avec le calcul d’un indice multispectral par exemple. Les facteurs influant la qualit de la classification et auxquels il est primordial de porter une grande attention sont les paramètres de l’algorithme SVM et les polygones dlimitant les zones d’apprentissage. De plus, la rsolution spatiale des donnes et l’espacement temporel entre les acquisitions influenceront aussi nos rsultats. Il est important d’avoir des donnes acquises dans un espace de temps rduit. Dans le futur, il sera intressant de normaliser l’intensit de chaque point du lever LiDAR et d’utiliser cette donne pour calculer l’indice NDVI. En effet, il est possible de substituer cette information la bande du proche-infrarouge. L’indice pourra alors être de nouveau calcul avec cette nouvelle bande et la bande rouge d’une image satellite ou d’une image arienne (meilleure rsolution spatiale). Cette couche pourra être assemble avec un raster reprenant les hauteurs des points avant d’être utilise pour une classification avec l’algorithme SVM. Solutions Transformation avec polynôme du premier degr Recalage des grilles Problèmes rencontrs Diffrents systèmes de coordonnes et diffrentes projections. Dcalage entre les grilles du raster issu du LiDAR et des rasters issus des bandes multispectrales. WGS dans la projection UTM zone 32N. GEMI SAVI NDVI Hauteur image multispectrale nuage de points LiDAR Zone tudie : ville de Strasbourg (Bas-Rhin, France) ► quartiers de la Krutenau, de l’Esplanade et le centre historique. Nombre de points: 122,000 Densit: 1.3 points / mètre carr Système : NTF dans la projection Lambert zone I. Date : le 5 Septembre 2004 = couche hauteur (LiDAR) + NDVI + SAVI + GEMI (Image satellite) Comparaison : vert = bien class – rouge = mal class

Classification Support Vector Machine Algorithme choisi : Support Vector Machine (SVM) supervisé méthode statistique peu de zones échantillons pour lapprentissage

Embed Size (px)

Citation preview

Page 1: Classification Support Vector Machine Algorithme choisi : Support Vector Machine (SVM) supervisé méthode statistique peu de zones échantillons pour lapprentissage

Classification

Support Vector Machine

Algorithme choisi : Support Vector Machine (SVM)► supervise ► methode statistique ► peu de zones echantillons pour

l’apprentissage (polygones au format shape)

► definir un hyperplan : minimiser la marge maximale (distance entre l’hyperplan et les echantillons les plus proches)

Trois differentes categories sont choisies : Voirie Bâtiments Vegetation

Conclusion

INSA de Strasbourg - TOPOGRAPHIE

Soutenance du XX Septembre 2013

Contact : [email protected]

UNSW, Samsung LIMHigh St, Kensington NSW 2052AUSTRALIA

FUSION DE DONNEES LiDAR ET MULTISPECTRALES

Etude des techniques de segmentation, de classification et d’extraction de donnees LiDAR, d’images multispectrales et de leur fusion

Proposition d’une nouvelle technique de traitement de la fusion des donnees et analyse des resultats

Ophelie SINAGRA

Mots clésLiDAR – Images multispectrales – Classification supervisee – Support Vector Machine (SVM) – Indices multispectraux – Hauteur

Introduction L’objectif de cette recherche est de developper une technique permettant la fusion des donnees afin de proceder a une classification rapide et efficace a l’aide d’un algorithme choisi. Certaines contraintes se posent alors telles que les differentes resolutions spatiales de l’image et du nuage de points ou encore le choix de l’algorithme. L’etude des precedentes recherches a permis de determiner une nouvelle approche qui consiste a creer plusieurs rasters a l’aide des donnees de differentes sources, de les assembler afin de n’obtenir qu’un seul et unique raster compose de plusieurs couches, et pour finir d’utiliser un algorithme de classification supervisee sur le raster creeB .

Données

Image multispectrale

LiDAR

Deux types de donnees :

Capteur : QuickBird. 4 Bandes : bleue, rouge, verte et

proche-infrarouge Resolution spatiale : 2.44 mètres. Système : Date : 10 Mai 2002

Fusion

Hauteur

Indices de végétation

Fusion = Assemblage de couches en un seul raster

LiDAR : coordonnees tridimensionnelles ► Extraction des informations et conversionTrois pour la creation du raster representant la variation d’altitude entre les points du sursol par rapport au MNT :

Fusion des données Les rasters crees doivent être assembles afin de n’avoir que des rasters composes de plusieurs bandes et ainsi pouvoir parler de fusion des donnees.

Classification des points du sol et du

sursol

Calcul de la hauteur des points du sursol

Substitution à la coordonnée Z

Conversion du nuage en raster

résolution 2.44 m

Hauteur

Indices de vegetation : indicateurs numeriques utilisant plusieurs bandes de l’image multispectrale et fournissant des informations sur la presence ou non d’element vegetal.

Bande Rouge

Bande PIR

Bande Bleue

Calcul des indices

GEMISAVINDVI

GEMISAVINDVI

Hauteur

Zones échantillons

Classification SVM

Résultats

• Methode d’estimation de la qualite de la classification : Comparaison avec une reference• Reference : nuage de points LiDAR classe manuellement + indice NDVI (les donnees etant

acquises a des moments differents, la vegetation a beaucoup evolue. Les pixels de la couche NDVI dont les comptes numeriques ont une valeur superieure a 0,2 ont ete extraits et utilises dans la reference).

Erreur de Commission 6.69 % Précision pour l'utilisateur 93.31 %

Erreur d'Omission 9.68 % Précision pour le réalisateur 90.32 %

Erreur d’Affectation 16.37 % Précision totale 83.63 %

Tests supplémentaires

Determination des couches importantes: classification effectuee sur des rasters comprenant moins de couches (une ou deux couches ont ete supprimees).Seule la couche hauteur (issue du lever LiDAR) combinee avec la couche NDVI ou avec la couche SAVI s’avère utile: la precision de la classification est alors de 84.2%. Lorsque les informations issues du LiDAR ne sont pas utilisees la precision de la classification baisse de près de 20%.

CouchesPrécision totale de

la classification

NDVI + SAVI + GEMI 63.1 %NDVI + SAVI + H 84.3 %GEMI + SAVI + H 83.7 %NDVI + GEMI + H 83.7 %

NDVI + H 84.2 %SAVI + H 84.2 %

Les differents tests effectues permettent de definir les elements indispensables a une bonne classification: une couche issue du lever LiDAR, reprenant l’information concernant la hauteur des points du sursol, et une issue de l’image multispectrale, avec le calcul d’un indice multispectral par exemple. Les facteurs influant la qualite de la classification et auxquels il est primordial de porter une grande attention sont les paramètres de l’algorithme SVM et les polygones delimitant les zones d’apprentissage. De plus, la resolution spatiale des donnees et l’espacement temporel entre les acquisitions influenceront aussi nos resultats. Il est important d’avoir des donnees acquises dans un espace de temps reduit.  

Dans le futur, il sera interessant de normaliser l’intensite de chaque point du lever LiDAR et d’utiliser cette donnee pour calculer l’indice NDVI. En effet, il est possible de substituer cette information a la bande du proche-infrarouge. L’indice pourra alors être de nouveau calcule avec cette nouvelle bande et la bande rouge d’une image satellite ou d’une image aerienne (meilleure resolution spatiale). Cette couche pourra être assemblee avec un raster reprenant les hauteurs des points avant d’être utilisee pour une classification avec l’algorithme SVM.

SolutionsTransformation avec polynôme du

premier degreRecalage des grilles

Problèmes rencontresDifferents systèmes de coordonnees et

differentes projections.Decalage entre les grilles du raster issu du

LiDAR et des rasters issus des bandes multispectrales.

WGS dans la projection UTM zone 32N.

GEMISAVINDVI

Hauteur

• image multispectrale • nuage de points LiDAR

Zone etudiee : ville de Strasbourg (Bas-Rhin, France) ► quartiers de la Krutenau, de l’Esplanade et le centre historique.

• Nombre de points: 122,000• Densite: 1.3 points / mètre carre• Système : NTF dans la projection Lambert zone I.• Date : le 5 Septembre 2004

= couche hauteur (LiDAR) + NDVI + SAVI + GEMI (Image satellite) Comparaison : vert = bien classe – rouge = mal classe