11
Centralisation des logs flume-ng HBase Elasticsearch Kibana 3

Elasticsearch meetup#2 @Viadeo - Viadeo

Embed Size (px)

DESCRIPTION

 

Citation preview

Page 1: Elasticsearch meetup#2 @Viadeo - Viadeo

Centralisation des logsflume-ng HBase Elasticsearch Kibana 3

Page 2: Elasticsearch meetup#2 @Viadeo - Viadeo

Problématique

● Problème de disponibilité et capacité limitée

● Dispersion des données : SaaS, BI

● Stockage inadapté : MySQL

● Accès contraignant, problèmes de sécurité

Page 3: Elasticsearch meetup#2 @Viadeo - Viadeo

● Collecter les logs de manière centralisée● Stockage durable et évolutif● Les rendre accessibles

● Initialiser la plate-forme Big data viadeo

Objectifs

Page 4: Elasticsearch meetup#2 @Viadeo - Viadeo

Application servers

DataWarehouse

HDFS

HBASE

Analytics Kibana

flume-ng

Solr

ES

sqoop

Plan d'ensemble

flux continus

import récurrents

plate-forme de stockage

applications tierces

Page 5: Elasticsearch meetup#2 @Viadeo - Viadeo

Mise en œuvre : Indexation

● Rejouer n jours ou n minutes

● Proche du temps réel

● Idempotent

● Sources et formats hétérogènes

Page 6: Elasticsearch meetup#2 @Viadeo - Viadeo

Mise en œuvre : Indexation

● Job MapReduce Hadoop natif

● TransportClient embarqué

● Indexation par lots

● Une configuration logstash "classique"

https://gist.github.com/deverton/2970285

Page 7: Elasticsearch meetup#2 @Viadeo - Viadeo

Mise en œuvre : Métriques

● 17 nœuds Hadoop mutualisés

● 2 serveurs ES dédiés

● 30 mappers

● 260M / 3h de traitement pour 7 jours de logs

● 340K / 30s de traitement pour 8 minutes de logs

Page 8: Elasticsearch meetup#2 @Viadeo - Viadeo

Mise en œuvre : Kibana

Kibana 3 tombe à pic !

● Maintenu au sein d'ElasticSearch

● Très rapidement fonctionnel

● Adaptable à des formats hétérogènes

● Fabriqué avec AngularJS

Page 9: Elasticsearch meetup#2 @Viadeo - Viadeo

Mise en œuvre : Kibana

Page 10: Elasticsearch meetup#2 @Viadeo - Viadeo

Mise en œuvre : Kibana

Page 11: Elasticsearch meetup#2 @Viadeo - Viadeo

Message subliminal : votez pour https://github.com/elasticsearch/elasticsearch/pull/2538 :)