99
LOGO du client #2013 Big Data à l’épreuve des projets d’entreprise

Le big data à l'épreuve des projets d'entreprise

  • Upload
    rubedo

  • View
    947

  • Download
    1

Embed Size (px)

DESCRIPTION

Slide du petit déjeuner du 11 décembre 2013 Dans un contexte économique délicat, les outils du « big data » apportent toute la rapidité, la souplesse et la scalabilité requise pour mettre en oeuvre des projets d'entreprise tirant profit de volumes d'information importants. Ces technologies sont désormais une réalité à intégrer aux projets SI. La société Klee Group organise ce déjeuner thématique en proposant des intervenants du Big Data : - Mongo DB - Elasticsearch - CMS Rubedo

Citation preview

Page 1: Le big data à l'épreuve des projets d'entreprise

LOGO du client

#2013

Big Data à l’épreuve des projets d’entreprise

Page 2: Le big data à l'épreuve des projets d'entreprise

Bretagne 2013

Page 3: Le big data à l'épreuve des projets d'entreprise

Pas tout à fait….

Page 4: Le big data à l'épreuve des projets d'entreprise
Page 5: Le big data à l'épreuve des projets d'entreprise
Page 6: Le big data à l'épreuve des projets d'entreprise
Page 7: Le big data à l'épreuve des projets d'entreprise

Et des camions il y en a ….

Page 8: Le big data à l'épreuve des projets d'entreprise

Et des camions il y en a ….

Page 9: Le big data à l'épreuve des projets d'entreprise

Ecotaxe

§ Flux entrant 24/7

• 2 000 points par seconde

• 200 paquets par seconde

§ Flux sortant 24/7

• 3* 200 paquets par seconde

§ Conservation 3 mois

• 1, 5 Milliard de paquets

• 7 téraoctets

Page 10: Le big data à l'épreuve des projets d'entreprise

Big Data ?

Page 11: Le big data à l'épreuve des projets d'entreprise

Big Data

Règle des 3V

Big data is high-volume, high-velocity and high-variety information

assets that demand cost-effective, innovative forms of information

processing for enhanced insight and decision making.

gartner.com

Page 12: Le big data à l'épreuve des projets d'entreprise

Règle des 3V

Big data is high-volume, high-velocity and high-variety information

assets that demand cost-effective, innovative forms of information

processing for enhanced insight and decision making.

gartner.com

Big Data

Variety Volume

Velocity

Page 13: Le big data à l'épreuve des projets d'entreprise

Data

Page 14: Le big data à l'épreuve des projets d'entreprise

Toujours plus…

Quantité

de données

Temps

Page 15: Le big data à l'épreuve des projets d'entreprise

Toujours plus, et plus encore…

Quantité

de données

Temps

Page 16: Le big data à l'épreuve des projets d'entreprise

Qualité de

décision

Quantité d’informations

Sur information

U /

The Inverted U Peter Morville

U

Sous information

Page 17: Le big data à l'épreuve des projets d'entreprise

Créer du

sens

Page 18: Le big data à l'épreuve des projets d'entreprise

Pour créer du sens

il faut

transformer la donnée en information

Data è Information

Page 19: Le big data à l'épreuve des projets d'entreprise

métadonnées

Donnée propriétés

Exemple : individu, événement,

équipement

Page 20: Le big data à l'épreuve des projets d'entreprise

métadonnées

Donnée propriétés

Métadonnées

Exemple : tags, chronologie, géolocalisation,

relations, notes, commentaires….

Page 21: Le big data à l'épreuve des projets d'entreprise

Information

Donnée propriétés

Métadonnées

Page 22: Le big data à l'épreuve des projets d'entreprise

Méta - Information

Cycle de création

timeline

Data …………………………………………….......

Création Enrichissement

Information

Page 23: Le big data à l'épreuve des projets d'entreprise

Rechercher / Représenter

Dan Roam

Page 24: Le big data à l'épreuve des projets d'entreprise

Rechercher / Représenter

#FacettedSearch

Page 25: Le big data à l'épreuve des projets d'entreprise

Stocker Rechercher Analyser

Trajectoire

Page 26: Le big data à l'épreuve des projets d'entreprise

Stocker Rechercher Analyser

Trajectoire

Page 27: Le big data à l'épreuve des projets d'entreprise

Stocker Rechercher Analyser

Trajectoire

Page 28: Le big data à l'épreuve des projets d'entreprise

Ecotaxe

Stocker Rechercher Analyser

Page 29: Le big data à l'épreuve des projets d'entreprise

§ Flux entrant 24/7

• 2 000 points par seconde

• 200 paquets par seconde

§ Flux sortant 24/7

• 3* 200 paquets par seconde

§ Conservation 3 mois

• 1, 5 Milliard de paquets

• 7 téraoctets

Ecotaxe #Volume #Velocity

Page 30: Le big data à l'épreuve des projets d'entreprise

#MongoDB

#Cluster

#Sharding

#Multi-sites

Architecture

Page 31: Le big data à l'épreuve des projets d'entreprise

§ En phase amont

Lutter contre la peur des décideurs / la résistance des équipes

§ En phase de spécifications /réalisation

Intégrer l’approche documentaire vs approche relationnelle

Former les équipes de développement

Exemple : logique transactionnelle

§ En phase de production

Lutter contre l’hébergement traditionnel / san

Favoriser l’approche horizontale vs verticale

RETEX MongoDB

Changement de paradigme

Page 32: Le big data à l'épreuve des projets d'entreprise

Vertical / Horizontal

« Scalabilité » Verticale Si besoin de plus de puissance

• on ajoute de la mémoire ….

• puis on remplace par un serveur de gamme plus

puissante

Corollaire : les machines sont surdimensionnées

pour absorber une augmentation potentielle de

charge

Page 33: Le big data à l'épreuve des projets d'entreprise

Vertical / Horizontal

« Scalabilité » Verticale Si besoin de plus de puissance

• on ajoute de la mémoire ….

• puis on remplace par un serveur de gamme plus

puissante

Corollaire : les machines sont surdimensionnées

pour absorber une augmentation potentielle de

charge

Page 34: Le big data à l'épreuve des projets d'entreprise

Vertical / Horizontal

« Scalabilité» Horizontale Si besoin de plus de puissance

• on ajoute des serveurs

Corollaire : linéarisation du coût / usage

Page 35: Le big data à l'épreuve des projets d'entreprise

Vertical / Horizontal

« Scalabilité» Horizontale Si besoin de plus de puissance

• on ajoute des serveurs

Corollaire : linéarisation du coût / usage

Page 36: Le big data à l'épreuve des projets d'entreprise

§ Avantages

• Qualité de la documentation

• Mise en œuvre rapide

• Versatilité

§ Bénéfices

• Agilité fonctionnelle

• Evolution du modèle aisée / versionnement natif

• Agilité technique

• Alignement matériel par rapports aux usages

MongoDB

Ne pas utilisez MongoDB si votre système est transactionnel, pour le reste …

§ Inconvénient

• Sharding pas si simple !

Page 37: Le big data à l'épreuve des projets d'entreprise

SPARK

Stocker Rechercher Analyser

Page 38: Le big data à l'épreuve des projets d'entreprise
Page 39: Le big data à l'épreuve des projets d'entreprise
Page 40: Le big data à l'épreuve des projets d'entreprise
Page 41: Le big data à l'épreuve des projets d'entreprise

RETEX Elasticsearch

CQRS Command Query Responsibility Segregation

Store Index

EventBus

Command Query

Page 42: Le big data à l'épreuve des projets d'entreprise

Rubedo Le CMS Big Data

Stocker Rechercher Analyser

Page 43: Le big data à l'épreuve des projets d'entreprise

Premier CMS open-source

basé sur un socle NoSQL

+

RETEX Rubedo

Dans un monde où

LAMP est LA Norme

NoSQL, mais pour quoi faire ?

Page 44: Le big data à l'épreuve des projets d'entreprise

§ Les CMS gèrent des Contenus …

… structurés

et

classés

NoSQL et Gestion de contenus

Page 45: Le big data à l'épreuve des projets d'entreprise

Approche relationnelle

type MySQL

Pour un type de contenu : 1 collection

Pour 10 types de contenus : 1 collection

1 requête unitaire : 1 collection

Pour un type de contenu : 6 tables

Pour 10 types de contenus : 29 tables

1 requête unitaire = 6 tables et 2 jointures

Approche NoSQL

documentaire

type MongoDB

Rubedo : comparaison des approches

Page 46: Le big data à l'épreuve des projets d'entreprise

§ Atouts Fonctionnels • Souplesse de modélisation

• Evolutivité dans le temps

• Fonctionnalités de Recherche

§ Atouts Techniques • Performances en lecture/écriture

• Stockage de grands volumes

• Montée en charge linéaire

• Gestion des fichiers intégrée (MongoDB)

• Sécurité centralisée

Rubedo : les atouts du NoSQL

§ Limites & précautions • Pas de transactions

• Déport des règles métiers dans

la couche applicative

• Framework de développement

indispensable !

• Certaines typologies de projets

peuvent nécessiter une

architecture hybride (site de e-

commerce complexe par

exemple)

Page 47: Le big data à l'épreuve des projets d'entreprise

Performances &

Volumétrie Mobilité

Recherche &

Géolocalisation

Ouverture &

Extensibilité

Souplesse Ergonomie

§ Portails à fort trafic ou volumétrie

§ Plateformes multi-sites

§ Sites mobiles

§ Contenus géo-localisés & cartographie

§ Moteurs de recherche verticaux

§ Plateformes de contribution décentralisées Use

cases

Rubedo : les cas d’usage

Page 48: Le big data à l'épreuve des projets d'entreprise

RUBEDO : démonstration

JavaScript, HTML5, CSS3

NoSQL

HTML5, CSS3

DEMONSTRATION

CSCSS3

Page 49: Le big data à l'épreuve des projets d'entreprise

Pause

10 min

Page 50: Le big data à l'épreuve des projets d'entreprise

LOGO du client

Merci de votre attention

Page 51: Le big data à l'épreuve des projets d'entreprise

Elasticsearch Revolutionizing Data Search

and Analytics

Richard Maurer– SEMEA Territory Manager

Page 52: Le big data à l'épreuve des projets d'entreprise

Agenda

•  Purpose of Elasticsearch

•  Features of Product

•  Customer Examples

•  Company Overview

•  Commercial Offerings

•  Resources

Page 53: Le big data à l'épreuve des projets d'entreprise

Purpose of Elasticsearch

•  Organize data and make it easily accessible

– Through powerful search and analytics

– Easily consumable (even for non-data scientists)

– Elegantly handles extremely large data volumes

– Delivers results in real time

•  Technology stack agnostic

•  Used across all market verticals

Page 54: Le big data à l'épreuve des projets d'entreprise

Features of Elasticsearch

•  Structured & unstructured search

•  Advanced analytics capabilities

•  Unmatched performance

•  Real-time results

•  Highly scalable

•  User friendly installation and maintenance

Page 55: Le big data à l'épreuve des projets d'entreprise

User: GitHub Searches 20TB of data, 1.3 billion files and 130 lines

of code using Elasticsearch

Page 56: Le big data à l'épreuve des projets d'entreprise

User: Foursquare Searches 50,000,000 venues every day using

Elasticsearch

Page 57: Le big data à l'épreuve des projets d'entreprise

User: Fog Creek Software Searches 40,000,000,000 (40 billion) lines of code in

real-time using Elasticsearch

Page 58: Le big data à l'épreuve des projets d'entreprise

User: StumbleUpon

Delivers millions of recommendations every day using Elasticsearch

Page 59: Le big data à l'épreuve des projets d'entreprise

Example: Email Archiving Email Archiving of 2 Petabytes of data across 100’s of servers

Big data, structured and unstructured

Page 60: Le big data à l'épreuve des projets d'entreprise

Example: Support Agents Custom Support – Search, Facets, and Reports

Real time metrics

Page 61: Le big data à l'épreuve des projets d'entreprise

Unprecedented Uptake

Elasticsearch has more than 5 Million downloads … and 400,000 more each month

Cumulative Cummmmmmmmmmmmmmmmmmmmmmmmmmmmuuuuuuuuuuuuuuuuuuuuuuuuuuuuullllllllllllllllaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaattttttttttttttttttttttiiiiiiiiiiiiiiiiiiiiiiiivvvvvvvvvveeee

Page 62: Le big data à l'épreuve des projets d'entreprise

Company Overview

•  More than 5 million downloads

•  400,000 New Downloads per Month

•  1000s of Mission Critical Implementations

•  Top Investors: Benchmark Capital, Index Ventures

•  Seasoned Executive Team – Founded by Creator of Elasticsearch

– Seasoned Executives from SpringSource

Page 63: Le big data à l'épreuve des projets d'entreprise

Users

Page 64: Le big data à l'épreuve des projets d'entreprise

User Raves Chris Cowan @uhduh

I’m in love with @elasticsearch! I want to use it for everything right now!

Alain Richardt @alaincxs

Moving ffrom #solr to # Elasticsearch is like upgrading from a Reliant Robin to a McLaren F1

Pete Connolly @peteconnolly

Two really useful and productive days of training from @kimchy and @uboness all about #elasticsearch. Best training course in years

Cyril Lacôte @clacote

#ElasticSearch is the s*&t. Amazingly simple and powerful. Open source is awesome. That's made my day.

Logan Lowell @fractaloop

Tweaking @elasticsearch for huge indexes can be fun. I'm very glad the IRC channel is so helpful too.

Page 65: Le big data à l'épreuve des projets d'entreprise

Product Offerings: Support Throughout Your Project

1.  Core Elasticsearch Training

2.  Development and Production Support

3.  Technical Account Manager

Page 66: Le big data à l'épreuve des projets d'entreprise

1: Training

Core Elasticsearch Training

•  Two day classroom training

•  Delivered by Elasticsearch developers

1.  Worldwide Public Courses

2.  Onsite Training Course

Page 67: Le big data à l'épreuve des projets d'entreprise

2: Support

Page 68: Le big data à l'épreuve des projets d'entreprise

3: Technical Account Manager

•  Named technical resource

•  Single point of contact into Elasticsearch

•  Onboarding call to assess your goals

•  Four health checks per year

•  Go-to expert to drive success with your Elasticsearch deployment

Page 69: Le big data à l'épreuve des projets d'entreprise

Resources

•  www.elasticsearch.com

•  www.elasticsearch.org

•  User Groups: http://www.elasticsearch.org/community/forum/

•  Contact:

Richard Maurer

Territory Manager

[email protected]

Page 70: Le big data à l'épreuve des projets d'entreprise

Le Big Data à l'épreuve des

projets d'entreprise

Yann Aubry Regional Director

Page 71: Le big data à l'épreuve des projets d'entreprise

The Big Data Unknown

Page 72: Le big data à l'épreuve des projets d'entreprise

3

Top Big Data Challenges?

Translation? Most struggle to know what Big Data is, how to manage it and who can manage it

Source: Gartner

Page 73: Le big data à l'épreuve des projets d'entreprise

4

Understanding Big Data – It’s Not Very “Big”

from Big Data Executive Summary – 50+ top executives from Government and F500 firms

64% - Ingest diverse, new data in real-time

15% - More than 100TB of data

20% - Less than 100TB (average of all? <20TB)

Page 74: Le big data à l'épreuve des projets d'entreprise

When To Use Hadoop, NoSQL

Page 75: Le big data à l'épreuve des projets d'entreprise

6

Enterprise Big Data Stack

EDW Hadoop

Ma

na

ge

me

nt

& M

on

ito

rin

g

Se

cu

rity &

Au

ditin

g

RDBMS

CRM, ERP, Collaboration, Mobile, BI

OS & Virtualization, Compute, Storage, Network

RDBMS

Applications

Infrastructure

Data Management

Online Data Offline Data

Page 76: Le big data à l'épreuve des projets d'entreprise

7

Consideration – Online vs. Offline

•  Long-running •  High-Latency •  Availability is lower priority

•  Real-time •  Low-latency •  High availability

Online Offline vs.

Page 77: Le big data à l'épreuve des projets d'entreprise

8

Consideration – Online vs. Offline

Online Offline vs.

Page 78: Le big data à l'épreuve des projets d'entreprise

9

MongoDB/NoSQL Is Good for!

360° View of the

Customer

Mobile & Social

Apps Fraud Detection

User Data

Management

Content

Management &

Delivery

Reference Data

Product Catalogs Machine to

Machine Apps Data Hub

Page 79: Le big data à l'épreuve des projets d'entreprise

10

Hadoop Is Good for!

Risk Modeling Churn Analysis Recommendation

Engine

Ad Targeting Transaction

Analysis

Trade

Surveillance

Network Failure

Prediction Search Quality Data Lake

Page 80: Le big data à l'épreuve des projets d'entreprise

How To Use The Two Together?

Page 81: Le big data à l'épreuve des projets d'entreprise

12

Insurance leader generates coveted 360-degree view of customers in 90 days – “The Wall”

Case Study

Problem Why MongoDB Results

•  No single view of customer

•  145 yrs of policy data, 70+ systems, 15+ apps

•  2 years, $25M trying to aggregate in RDBMS – failed

•  Agility – prototype in 5 days; production in 90 days

•  Dynamic schema & rich querying – combine disparate data into one data store

•  Hot tech to attract top talent

•  Increased call center productivity

•  Better customer experience, reduced churn, more upsell opps

•  Dozens more projects in the works to leverage this data platform

Page 82: Le big data à l'épreuve des projets d'entreprise

13

Machine Learning

Ad-Serving

•  Catalogs and products

•  User profiles

•  Clicks

•  Views

•  Transactions

•  User segmentation

•  Recommendation engine

•  Prediction engine

Algorithms

MongoDB

Connector for

Hadoop

Page 83: Le big data à l'épreuve des projets d'entreprise

MongoDB overview

Page 84: Le big data à l'épreuve des projets d'entreprise

15

MongoDB

The leading NoSQL database

Document Database

Open-Source

General Purpose

Page 85: Le big data à l'épreuve des projets d'entreprise

16

To provide the best database for how we build and run apps today

MongoDB Vision

Build

–  New and complex data

–  Flexible

–  New languages

–  Faster development

Run

–  Big Data scalability

–  Real-time

–  Commodity hardware

–  Cloud

Page 86: Le big data à l'épreuve des projets d'entreprise

17

•  10 of the Top Financial Services Institutions

•  10 of the Top Electronics Companies

•  10 of the Top Media and Entertainment Companies

•  8 of the Top Retailers

•  6 of the Top Telcos

•  5 of the Top Technology Companies

•  4 of the Top Healthcare Companies

Fortune 500 & Global 500

Page 87: Le big data à l'épreuve des projets d'entreprise

18

5,000,000+ MongoDB Downloads

100,000+ Online Education Registrants

20,000+ MongoDB User Group Members

20,000+ MongoDB Days Attendees

20,000+ MongoDB Management Service (MMS) Users

Global Community

Page 88: Le big data à l'épreuve des projets d'entreprise

19

MongoDB Features

• JSON Document Model with Dynamic Schemas

•  Auto-Sharding for Horizontal Scalability

•  Text Search

•  Aggregation Framework and MapReduce

• Full, Flexible Index Support and Rich Queries

•  Built-In Replication for High Availability

•  Advanced Security

•  Large Media Storage with GridFS

Page 89: Le big data à l'épreuve des projets d'entreprise

20

MongoDB Business Value

Enabling New Apps Better Customer Experience

Lower TCO Faster Time to Market

Page 90: Le big data à l'épreuve des projets d'entreprise

21

Data Hub User Data Management

Big Data Content Mgmt & Delivery Mobile & Social

MongoDB Solutions

Page 91: Le big data à l'épreuve des projets d'entreprise

22

MongoDB Partners (200+)

Software & Services

Cloud & Channel Hardware

Page 92: Le big data à l'épreuve des projets d'entreprise

23

MongoDB Products and Services

Training Online and In-Person for Developers and Administrators

MongoDB Management Service (MMS) Cloud-Based Suite of Services for Managing MongoDB Deployments

Subscriptions MongoDB Enterprise, MMS (On-Prem), Professional Support, Commercial License

Consulting Expert Resources for All Phases of MongoDB Implementations

Page 93: Le big data à l'épreuve des projets d'entreprise

MongoDB Products and Services

Page 94: Le big data à l'épreuve des projets d'entreprise

25

MongoDB Enterprise

Enterprise build with value-added capabilities

•  Advanced Security w/Kerberos

•  On-Prem Management

–  Visualization and alerts on 100+ system metrics

–  Backup features coming soon

–  On-premise version of MongoDB Monitoring Services (MMS)

•  Enterprise Software Integration via SNMP

•  Private, On-Demand MongoDB University Training

•  Certified OS Support

Page 95: Le big data à l'épreuve des projets d'entreprise

26

•  Monitoring, with charts,

dashboards and alerts on 100+

metrics

•  Backup and restore, with point-

in-time recovery, support for

sharded clusters

MongoDB Management Service

Cloud-based suite of services for managing

MongoDB deployments

•  MMS On-Prem included with MongoDB Enterprise

(backup coming soon)

Page 96: Le big data à l'épreuve des projets d'entreprise

27

Consulting

•  Named MongoDB

expert

•  Advisory services

• Ongoing basis

•  Assist with all phases of

project

•  E.g., config., testing,

optimization, best

practices

•  Assess overall status

and health of existing

MongoDB deployment

Lightning Consults also available

Technical Account

Manager

Custom Consulting Health Check

Page 97: Le big data à l'épreuve des projets d'entreprise

28

Public

Training

•  Dev, admin, and

combined courses

available

•  North America and

EMEA

•  Customized to your

needs

•  For devs and admins

• On-Site

•  Free

•  For devs and admins

•  7 weeks

• Weekly lectures,

homework, final exam

Private Online

Private, On-Demand MongoDB University Training Included with MongoDB Enterprise Subscription

Page 98: Le big data à l'épreuve des projets d'entreprise

29

For More Information

Resource Location

MongoDB Downloads mongodb.com/download

Free Online Training education.mongodb.com

Webinars and Events mongodb.com/events

White Papers mongodb.com/white-papers

Case Studies mongodb.com/customers

Presentations mongodb.com/presentations

Documentation docs.mongodb.org

Additional Info [email protected]

Resource Location

Page 99: Le big data à l'épreuve des projets d'entreprise

@yannaubry