1
Ismail Badache [email protected] IRIT, Université Paul Sabatier, Toulouse RI sociale : intégration de propriétés sociales dans un modèle de recherche Comment identifier ces informations sociales et quelle est leur nature ? Comment traduire et quantifier ces informations sociales en propriétés de pertinence sociale ? Quelles propriétés sociales utiles pouvant être exploitées pour améliorer la recherche d’information (ex. pages web, vidéos, etc) ? Problématique 1) Estimation de la fraicheur à partir de la date de la dernière mention associée à la ressource : : lien URL de la ressource r 2) Estimation de la popularité et l’importance de la ressource : Avec : 3) Le score social global : Q : Requête et G : Réseau social 4) Combinaison de la pertinence thématique et la pertinence sociale : Modèle de recherche proposé h ( )= è ( ) ( è ( ) ) ( ) = = 1 9 è ( ) SCORE (Q, r, G) = α * SCORE Thématique (Q, r) + (1 α) * SCORE Social (Q, l r , G) ( , , ) = h ( )+ ( 1 ) ( ) ( ( , , )) 1)Collection de test 8433 films issus du site « imdb.com ». • CGUs collectés depuis 8 réseaux sociaux à travers des APIs. 10 requêtes / 10 utilisateurs. 2) Résultats Evaluation expérimentale Systèmes nDCG@20 P@20 Système 1 : Lucene Solr 0.76 0.38 Système 2: Lucene Solr + Propriétés sociales 0.942 (+24%) 0.73 nDCG@20 P@20 Fig.1 : Schéma de la RI sociale par rapport à notre proposition. Vidéos Photos Pages Web Ressources accessible s via internet Autres Utilisateurs des réseaux sociaux Contenu généré par l’utilisateur (CGU) Marques (Tags) Commentaires/Avis Partages/Recommanda tion Mentions/Votes Clicks Extraction et quantification des propriétés sociales Modèle de Tri (Ranking) Requêt e Résultats Popularit é Importanc e Influence Fraicheur Intégrat ion Recherche d’information sociale : Estimation de la pertinence d’une ressource à partir des propriétés sociales issues des réseaux sociaux. Introduction Contenu généré par l’utilisateur : Interactions utilisateur-ressource. Relations entre utilisateurs. Quantification des propriétés sociales à partir de ces CGUs. Fig.2 : Les CGUs exploités dans la quantification des propriétés sociale. CGU et propriétés sociales ACEBOOK J’aime Partage Commentaire Date de la mention Amis Abonnés WITTER Tweet Follower GOOGLE+ (Mention) +1 Partage LINKED INTEREST DIGG DELICIOU S STUMBLEUPON Marque Influence & Importance Auteur Popularité & Importance Ressourc e Fraicheur Ressourc e Propriétés sociales F ( Requête, Contenu, Propriétés ) Fig.3 : Ajustement des paramètres α avec Fig.4 : Comparaison des mesures entre les deux systèmes. 0.0 0.2 0.4 0.6 0.8 Paramètre α P@20 F ( Requête, Contenu ) 0 0.2 0.4 0.6 0.8 1 0.76 0.38 0.942 0.73 Système 1 : Lucene Solr s

Poster Recherche d'Information Sociale

Embed Size (px)

Citation preview

Page 1: Poster Recherche d'Information Sociale

Ismail [email protected]

IRIT, Université Paul Sabatier, Toulouse

RI sociale : intégration de propriétés sociales dans un

modèle de recherche

• Comment identifier ces informations sociales et quelle est leur nature ?

• Comment traduire et quantifier ces informations sociales en propriétés de pertinence sociale ?

• Quelles propriétés sociales utiles  pouvant être exploitées pour améliorer la recherche d’information (ex. pages web, vidéos, etc) ?

Problématique

1) Estimation de la fraicheur à partir de la date de la dernière mention associée à la ressource :

: lien URL de la ressource r

2) Estimation de la popularité et l’importance de la ressource :

Avec :

3) Le score social global :

Q : Requête et G : Réseau social

4) Combinaison de la pertinence thématique et la pertinence sociale :

Modèle de recherche proposé

h𝐹𝑟𝑎𝑖𝑐 𝑒𝑢𝑟 𝑆𝑜𝑐𝑖𝑎𝑙𝑒( 𝑙𝑟)=𝑇𝑒𝑚𝑝𝑠𝐷𝑒𝑟𝑛𝑖è 𝑟𝑒𝑚𝑒𝑛𝑡𝑖𝑜𝑛

(𝑙𝑟 )𝑀𝐴𝑋 𝑙𝑟 (𝑇𝑒𝑚𝑝𝑠𝐷𝑒𝑟𝑛𝑖è 𝑟𝑒𝑚𝑒𝑛𝑡𝑖𝑜𝑛

(𝑙𝑟 ) )

𝑃𝑜𝑝 𝐼𝑚𝑝𝑆𝑜𝑐𝑖𝑎𝑙 𝑒𝑠 (𝑙𝑟 )=∑𝑖=1

9

𝑓 𝐶𝑟𝑖𝑡è 𝑟𝑒𝑖 ( 𝑙𝑟 )

SCORE (Q, r, G) = α * SCOREThématique (Q, r) + (1 α) * SCORESocial (Q, lr , G)

𝑆𝐶𝑂𝑅𝐸 𝑆𝑜𝑐𝑖𝑎𝑙 (𝑄 ,𝑙𝑟 ,𝐺 )=𝛽 h𝐹𝑟𝑎𝑖𝑐 𝑒𝑢𝑟 𝑆𝑜𝑐𝑖𝑎𝑙𝑒 (𝑙𝑟)+ (1− 𝛽 )𝑃𝑜𝑝 𝐼𝑚𝑝𝑆𝑜𝑐𝑖𝑎𝑙𝑒 (𝑙𝑟)

𝑀𝐴𝑋𝑙 𝑟(𝑆𝐶𝑂𝑅𝐸𝑆𝑜𝑐𝑖𝑎𝑙(𝑄 , 𝑙𝑟 ,𝐺))

1) Collection de test

• 8433 films issus du site « imdb.com ».• CGUs collectés depuis 8 réseaux sociaux à travers des APIs.• 10 requêtes / 10 utilisateurs.

2) Résultats

Evaluation expérimentale

Systèmes nDCG@20 P@20Système 1 : Lucene Solr 0.76 0.38Système 2 : Lucene Solr + Propriétés sociales 0.942 (+24%) 0.73

nDCG@20 P@20

Fig.1 : Schéma de la RI sociale par rapport à notre proposition.

Vidéos

Photos

Pages Web

Ressources accessibles via internet

Autres

Utilisateurs des réseaux sociaux

Contenu généré par l’utilisateur (CGU)

Marques (Tags)Commentaires/Avis

Partages/RecommandationMentions/Votes

Clicks

Extraction et quantification des propriétés sociales

Modèle de Tri (Ranking)

RequêteRésultats

PopularitéImportanceInfluenceFraicheur

Intégration

Recherche d’information sociale : Estimation de la pertinence d’une ressource à partir des propriétés sociales issues des réseaux sociaux.

Introduction

Contenu généré par l’utilisateur :• Interactions utilisateur-ressource.• Relations entre utilisateurs.

Quantification des propriétés sociales à partir de ces CGUs.

Fig.2 : Les CGUs exploités dans la quantification des propriétés sociale.

CGU et propriétés sociales

ACEBOOKJ’aime

PartageCommentaireDate de la mentionAmisAbonnés

WITTERTweetFollower

GOOGLE+(Mention) +1

Partage

LINKEDINTEREST

DIGGDELICIOUSSTUMBLEUPONMarque

Influence & Importance

Auteur

Popularité & Importance

Ressource

Fraicheur

Ressource

Propriétés sociales

F ( Requête, Contenu, Propriétés )

Fig.3 : Ajustement des paramètres α avec

Fig.4 : Comparaison des mesures entre les deux systèmes.

0.000.100.200.300.400.500.600.700.800.901.000.0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

Paramètre α

P@

20

F ( Requête, Contenu )

00.10.20.30.40.50.60.70.80.9

1

0.76

0.38

0.942

0.73

Système 1 : Lucene Solr

Système 2 : Lucene Solr+Propriétés sociale s