Upload
ismail-badache
View
271
Download
1
Embed Size (px)
Citation preview
Ismail [email protected]
IRIT, Université Paul Sabatier, Toulouse
RI sociale : intégration de propriétés sociales dans un
modèle de recherche
• Comment identifier ces informations sociales et quelle est leur nature ?
• Comment traduire et quantifier ces informations sociales en propriétés de pertinence sociale ?
• Quelles propriétés sociales utiles pouvant être exploitées pour améliorer la recherche d’information (ex. pages web, vidéos, etc) ?
Problématique
1) Estimation de la fraicheur à partir de la date de la dernière mention associée à la ressource :
: lien URL de la ressource r
2) Estimation de la popularité et l’importance de la ressource :
Avec :
3) Le score social global :
Q : Requête et G : Réseau social
4) Combinaison de la pertinence thématique et la pertinence sociale :
Modèle de recherche proposé
h𝐹𝑟𝑎𝑖𝑐 𝑒𝑢𝑟 𝑆𝑜𝑐𝑖𝑎𝑙𝑒( 𝑙𝑟)=𝑇𝑒𝑚𝑝𝑠𝐷𝑒𝑟𝑛𝑖è 𝑟𝑒𝑚𝑒𝑛𝑡𝑖𝑜𝑛
(𝑙𝑟 )𝑀𝐴𝑋 𝑙𝑟 (𝑇𝑒𝑚𝑝𝑠𝐷𝑒𝑟𝑛𝑖è 𝑟𝑒𝑚𝑒𝑛𝑡𝑖𝑜𝑛
(𝑙𝑟 ) )
𝑃𝑜𝑝 𝐼𝑚𝑝𝑆𝑜𝑐𝑖𝑎𝑙 𝑒𝑠 (𝑙𝑟 )=∑𝑖=1
9
𝑓 𝐶𝑟𝑖𝑡è 𝑟𝑒𝑖 ( 𝑙𝑟 )
SCORE (Q, r, G) = α * SCOREThématique (Q, r) + (1 α) * SCORESocial (Q, lr , G)
𝑆𝐶𝑂𝑅𝐸 𝑆𝑜𝑐𝑖𝑎𝑙 (𝑄 ,𝑙𝑟 ,𝐺 )=𝛽 h𝐹𝑟𝑎𝑖𝑐 𝑒𝑢𝑟 𝑆𝑜𝑐𝑖𝑎𝑙𝑒 (𝑙𝑟)+ (1− 𝛽 )𝑃𝑜𝑝 𝐼𝑚𝑝𝑆𝑜𝑐𝑖𝑎𝑙𝑒 (𝑙𝑟)
𝑀𝐴𝑋𝑙 𝑟(𝑆𝐶𝑂𝑅𝐸𝑆𝑜𝑐𝑖𝑎𝑙(𝑄 , 𝑙𝑟 ,𝐺))
1) Collection de test
• 8433 films issus du site « imdb.com ».• CGUs collectés depuis 8 réseaux sociaux à travers des APIs.• 10 requêtes / 10 utilisateurs.
2) Résultats
Evaluation expérimentale
Systèmes nDCG@20 P@20Système 1 : Lucene Solr 0.76 0.38Système 2 : Lucene Solr + Propriétés sociales 0.942 (+24%) 0.73
nDCG@20 P@20
Fig.1 : Schéma de la RI sociale par rapport à notre proposition.
Vidéos
Photos
Pages Web
Ressources accessibles via internet
Autres
Utilisateurs des réseaux sociaux
Contenu généré par l’utilisateur (CGU)
Marques (Tags)Commentaires/Avis
Partages/RecommandationMentions/Votes
Clicks
Extraction et quantification des propriétés sociales
Modèle de Tri (Ranking)
RequêteRésultats
PopularitéImportanceInfluenceFraicheur
Intégration
Recherche d’information sociale : Estimation de la pertinence d’une ressource à partir des propriétés sociales issues des réseaux sociaux.
Introduction
Contenu généré par l’utilisateur :• Interactions utilisateur-ressource.• Relations entre utilisateurs.
Quantification des propriétés sociales à partir de ces CGUs.
Fig.2 : Les CGUs exploités dans la quantification des propriétés sociale.
CGU et propriétés sociales
ACEBOOKJ’aime
PartageCommentaireDate de la mentionAmisAbonnés
WITTERTweetFollower
GOOGLE+(Mention) +1
Partage
LINKEDINTEREST
DIGGDELICIOUSSTUMBLEUPONMarque
Influence & Importance
Auteur
Popularité & Importance
Ressource
Fraicheur
Ressource
Propriétés sociales
F ( Requête, Contenu, Propriétés )
Fig.3 : Ajustement des paramètres α avec
Fig.4 : Comparaison des mesures entre les deux systèmes.
0.000.100.200.300.400.500.600.700.800.901.000.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
Paramètre α
P@
20
F ( Requête, Contenu )
00.10.20.30.40.50.60.70.80.9
1
0.76
0.38
0.942
0.73
Système 1 : Lucene Solr
Système 2 : Lucene Solr+Propriétés sociale s