Synodiance > SEO - Le Search de demain - Table Ronde EBG - 19/06/2014

Preview:

DESCRIPTION

Table Ronde du 20/06 animée par Yann Sauvageon (@yahn) Daphne Garcin - EXPEDIA - Senior SEM Specialist Emmanuel Alix - L'EQUIPE 24/24 Directeur Marketing et Projets Nicolas Desgranges - ORANGE Responsable e-business & search activities Fabien Poulard - DICTANOVA - Fondateur Les nouveaux usages de recherche : - Poussés par des objets de plus en plus connectés : Le mobile, Les Google Glass, Les montres connectés (Android Wear) - Recherche vocale : En quoi est-ce différent de la recherche classique ? Comment Google s’adapte et prépare ce nouvel usage ? - Recherche conversationnelle : Dialoguer avec Google, c’est déjà possible. Il pourrait aussi nous répondre Comment Google s’adapte (et façonne) à ces nouveaux usages : - Google souhaite comprendre l’intention qui se cache derrière votre requête. - La sémantique : Du mot clé aux entités : Freebase, Knowledge Graph, Hummingbird. - La réponse directe de Google ? Les nouveaux formats de résultats : les « Cards », le « knowledge graph », les carrousels… Comment s’adapter à ces changements de fond ? - Un changement d’approche dans l’écriture des textes - La thématique de vos sites - Le balisage sémantique (Schema.org)

Citation preview

Le Search de Demain - 19/06 Sémantique, Recherche vocale & conversationnelle

Intervenants

Daphné Garcin / Expedia Inc. Emmanuel Alix / Lequipe.fr Nicolas Desgranges / Orange Fabien Poulard / Dictanova Yann Sauvageon / Synodiance

Daphné Garcin / Expedia Inc.

Spécialiste SEM Senior Expedia › 10 ans d’expérience professionnelle, dont 5 en marketing digital et 3 en SEM › Expérience globale sur les marchés européens, américains et asiatiques › Responsable de stratégie et d’exécution SEM (budgets de l’ordre du M$ /an)

Expedia Inc › Agence de voyage en ligne (OTA) fondée en 2001, spin off de Microsoft › L’un des 2 leaders mondiaux en vente d’hôtels › Expedia vend aussi des vols, séjours, activités, locations de voitures et croisières en temps que tierce-partie (+ technologie en white label)

Mes intérêts › Passion pour les produits de search et Google › Comprendre l’évolution des usages et s’adapter à un marketing digital de plus en plus informé, automatisé, complexe et sous pression compétitive

Emmanuel Alix / Lequipe.fr

Directeur Marketing et Projets

Nicolas Desgranges / Orange

Directeur marketing Search Orange › Orange et son moteur de recherche = Un moteur de recherche généraliste WEB et spécialisé sur l’écosystème Orange

Fabien Poulard / Dictanova

Dirigeant Fondateur de Dictanova SAS › Docteur en TAL (informatique + linguistique)

Dictanova › Solutions pour l’acquisition de connaissance marché (consommateurs et concurrents)

› Fondée en 2011 › 12 personnes aujourd’hui

Industrialise l'analyse de verbatim par la rigueur linguistique

Sommaire

Les nouveaux usages de recherche

Comment Google façonne ces nouveaux usages

Comment s’adapter à ces changements de fond

1. Les nouveaux usages du search

1/ Les nouveaux usages de recherche

1/ Les nouveaux usages de recherche

« OK Google »

1/ Les nouveaux usages de recherche

"I wouldn’t be surprised" if mobile search exceeded desktop queries

this year.

Matt Cutts Head of the webspam team Google – Mars 2014

95%

4,7%

14,4%

15,0%

16,4%

16,7%

18,9%

19,0%

23,0%

25,5%

30,0%

32,2%

36,0%

42,9%

51,6%

59,5%

64,1%

67,2%

82,6%

87,9%

93,3%

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

assurance retraite

ouvrir livret

assurance auto

billet avion

mode femme

jeans homme

hotel paris

restaurant paris

concert paris

beyoncé

serrurier

starbucks

franprix paris 16

serrurier lyon

starbucks paris

restaurant à proximité

station service paris

où suis je

macdo le plus proche

boulangerie à proximité

Part des requêtes mobiles – Mars 2014

1. Le contexte mobile

13,1% 12,1%

14,0% 15,8%

19,3% 19,5% 19,5%

26,3%

31,7% 30,7%

27,7%

32,4%

37,6%

40,5% 40,3%

0,00%

5,00%

10,00%

15,00%

20,00%

25,00%

30,00%

35,00%

40,00%

45,00%

Horaires Cinéma

1/ Les nouveaux usages de recherche

1/ Les nouveaux usages de recherche

Source : http://www.businessinsider.com/global-smartwatch-sales-set-to-explode-2014-3

1/ Les nouveaux usages de recherche

Source : http://www.businessinsider.com/the-internet-of-everything-2014-slide-deck-sai-2014-2?op=1

Source : http://www.businessinsider.com/the-internet-of-everything-2014-slide-deck-sai-2014-2?op=1

1/ Les nouveaux usages de recherche

Constat sur les nouveaux usages de recherche Le clavier est inadapté sur des objets connectés ou des supports écrans déportés (TV, voiture,..). Une réponse immédiate est souhaitée à la place d’une liste standard de 15 liens.

L’intérêt du vocal avec les recherches complexes

1/ Les nouveaux usages de recherche

De nouvelles typologies de recherche

› Depuis que la recherche sur mobile est devenue naturelle (+ de 16% de nos recherches en 2013 !), on constate les évolutions suivantes :

Recherches de plus de 3 mots en langage naturel

Avec des abréviations (fréquent sur mobile)

Sans vigilance sur les fautes d’orthographes / de frappe

Des questions de plus en plus pointues

1/ Les nouveaux usages de recherche

De nouvelles typologies de recherche

Variations autour de l’orthographe

banque populaire du massif central

1/ Les nouveaux usages de recherche

Mobile > L’optique SEM › Part des clicks payants

› Le mobile croit rapidement. › Passage de 7,3% a 12,5% (Janvier a Décembre 2013 dans la zone Euro*)

› Inflation de CPC en Mobile

› 26% d’augmentation en zone Euro de 2012 a 2013* (le Mobile rejoint presque le Desktop en CPC moyen, alors que l’attribution reste encore un domaine a éclaircir et améliorer dans l’industrie)

› Evolution des requêtes

› Pas de variation poussée des mots clé sur Mobile versus Desktop › Différences sur la concision et le caractère immédiat/local des requêtes

*selon une étude de Marin Software : « Mobile Search Advertising Around The Globe » (2014)

1/ Les nouveaux usages de recherche

1/ Les nouveaux usages de recherche

2/ Comment Google façonne

ces nouveaux usages

2/ Comment Google façonne ces nouveaux usages

Trouver le mot clé dans le

contenu

Apporter une réponse à

l’internaute

Freebase Schema.org Knowledge

Graph Hummingbird

Google et la montée du web sémantique

2/ Comment Google façonne ces nouveaux usages

2/ Comment Google façonne ces nouveaux usages

Recherche vocale et conversationnelle

L‘analyse sémantique devient obligatoire pour les moteurs de recherche

reconnaissance

vocale

(speech2text)

1) extraction : sémantique :

reconnaissance des termes pertinents

2) exploitation

appel du service avec bons paramètres

réponse

« quel temps

fait il à Lyon »

« temps » + « lyon » =

Météo + lyon

service météo

paramètre ville = lyon

C’est quoi l’analyse sémantique par les moteurs de recherche ?

Une interprétation de la requête de l’internaute L’exploitation des micro-formats > nouvelles informations sémantiques dans les pages web ..et le web sémantique ? > des résultats enrichis de nouvelles informations immédiates grâce au graphe de liens

verbe

sujet complément

prédicat

sujet objet

est né à

Linguistique

Web sémantique

RDF graph

2/ Comment Google façonne ces nouveaux usages

sujet prédicat objet

ex sister in law 19 juin 1972

41 ans

loves

jealous

A quoi ça sert ?

Les dessous de la recherche sémantique

RI 1990 : › Retourner le document correspondant à une requête

› Un doute ? retourner une liste de documents

› Espérons que quelqu’un ait utilisé ces mots clés !

RI 1998 : › Trop de documents pour une même requête

› Prise en compte d’éléments extérieurs (ex : Page Rank)

Les dessous de la recherche sémantique

Sémantique ? › Lexical › Syntaxique › Sémantique (sens local) › Discursif › Pragmatique

QA ? › Trouver la réponse à une question › Extraction d’information = identifier l’information dans le contenu

› Plus facile si on balise ladite information -> microdata/rdfa

Les dessous de la recherche sémantique

QA = recherche de motifs et réécritures › Analyse de la requête (quel est <…> ? Quand <…> ?) › Extraction d’information lors de l’indexation (X est Y, X est né le Z)

Les dessous de la recherche sémantique

QA = recherche de motifs et réécritures › Analyse de la requête (quel est <…> ? Quand <…> ?) › Extraction d’information lors de l’indexation (X est Y, X est né le Z)

Le problème des ambiguïtés

Recherche ~ Index ~ chaînes de caractères › Homonymies › Tous les mots ne sont pas égaux (substantifs, verbes…) › Les entités nommées ont un rôle particulier

L’apport des entités nommées

Entités nommées › Objets textuels qui désignent une chose unique et précise du « monde réel »

› Personne, lieu, date, valeurs, entreprise…

Rôles d’« ancres sémantique » des requêtes › Besoin de reconnaître les entités dans les requêtes

› Base sémantique (RDF) : Freebase / Dbpedia…

› Knowledge graph !

Exemples d’usage du knowledge graph Identification de l’entité Paris (nom de lieu) : interrogation

d’une base de données structurées externe

Exemples d’usage du knowledge graph Identification de « Leonardo DiCaprio » comme une référence à

l’acteur > Extraction de la filmographie de l’acteur

Exemples d’usage du knowledge graph « Équipe de France » est une référence unique et précise à la sélection nationale de football (et tout un tas d’autres sports) > Utilisation du contexte de l’actualité pour sortir les résultats

de la coupe du monde

Exemples d’usage du knowledge graph « Nantes » est une (très jolie) ville > Extraction des principaux établissements situés à Nantes qui sont de type « restaurant »

Exemples d’usage du knowledge graph « x-men » est le nom d’une série de films dont un opus est à l’affiche en ce

moment et « Nantes » est une ville > Affichage des horaires des séances du dernier film X-Men dans les cinémas de Nantes

L’ambiguïté des entités nommées

Du texte à l’entité : même problème d’ambiguïté Besoin de contexte pour résoudre l’ambiguïté › Contexte dans la requête › Contexte dans l’historique de navigation, la géolocalisation…

L’ambiguïté des entités nommées

Avec du contexte Sans contexte

L’ambiguïté des entités nommées

Historique de recherche Navigation privée (avec géoloc)

Mais comment est-ce possible ?

Algorithmes connus (machine learning) … Mais besoin de (beaucoup) de données d’apprentissage

Base d’entités = Freebase

Géoloc. d’établissements = Google places

Données structurées = opendata + microformats

Apprentissage = votre clic sur le bon lien !

Contexte = n-grams extraits des pages et des livres (modèles de langue)

Mais comment est-ce possible ?

Satisfaire l’internaute Orange dans ses besoins de réponses immédiates pour le fidéliser

Sur Orange : l’enrichissement des résultats

CTR

= 30% !!

CTR

= 2%

2/ Comment Google façonne ces nouveaux usages

Impact SEM › Knowledge Graph / Answer Box / PLAs

› Réduction de l’espace des liens sponsorisés › Inflation de CPC dans un contexte de visibilité réduite en SEM

› L’invitation de Google a s’adapter à de nouveaux produits (PLA).

› Exemple du secteur hôtelier (destinations) › Le haut de page SEM est réduit à 1-2 annonceurs, la droite à 3 annonceurs. › Nouveaux produits Google: HPA (PLA); Google maps dans une moindre mesure. › Le SEO disparait du haut de l’écran ou « above the fold ».

SEM

SEM

Carte

Liens

en rapport

à la carte

HPA (Hotel

Product

Listing)

2/ Comment Google façonne ces nouveaux usages

HPA – PLA pour Hotels • Google met l’accent sur la comparaison de prix • Tentative de bypass de sites comme Tripadvisor • Le prix comme facteur du quality score donc du

calcul du CPC et de la position sur page Google change la donne en terme de visibilité des acteurs.

3/ S’adapter Evolution de la SERP par secteur: ex. le secteur hotelier (propriétés) ›Google facilite l’acces aux revues/ critiques et compare les prix ›Google propose ainsi une compétition directe avec des sites comme Tripadvisor ›Google met également en avant la fonctionnalité Maps et Google+

3/ S’adapter SERP sur le secteur aérien ›Google Flights: comparateurs de vols ›Compétition directe avec des sites comme Skyscanner, Kayak ou Expedia ›SEO disparait du haut d’écran

« Answer Box »

Quel est votre regard sur les « answer box » ? Comment pensez-vous que cela va évoluer ?

De la 9ème place à « l’answer box »

3/ Comment s’adapter à ces changements

de fond ?

S’adapter

Aidez Google à mieux comprendre vos contenus.

S’adapter

Rédactionnel Thématique Schema.org

• Born

• Date How old

• Height

• Tall How tall

• Size

• Dimension How big

3/ S’adapter

Contenu On-Page

Objectif : Créer des contenus dans le champ lexical de vos mots clés cibles

Optimisez pour une thématique.

Mot clé cible

Synonymes

Mots clés associés

Co-occurrence

Phrases usuelles

N-grams

3/ S’adapter > Schema.org

3/ S’adapter > Schema.org

Que peut-on décrire ?

~ 100 catégories au

départ

+ 1 200 aujourd’hui

3/ S’adapter > Schema.org

Le vocabulaire évolue rapidement

Sept. 2011

News

Nov. 2011

Annonces d’emploi

Novembre 2012

Ecommerce

Juin 2012

Santé et Medical

Publications Techniques

Août 2013

Service civil

Décembre 2013

Extension TV /

Radio

Février 2014

Sports

2011 2012 2013 2014

Rich Snippets > Events

3/ S’adapter > Schema.org Thing > Place > TouristAttraction

Thing > Place > LandmarksOrHistoricalBuildings

3/ S’adapter > Schema.org

Thing > CreativeWork > Series > Actors

3/ S’adapter > Schema.org

Demain

Mobile / Voice / Conversationnel

Thématique Être reconnu comme

une réponse Balisage Schema.org

Avant

Desktop Mot Clé Répétition

« simpliste » Balises Méta

3/ S’adapter

Réflexion sur une adaptation par device

Aujourd’hui

• Un rédacteur

• Un seul éditeur

• En 1er lieu pour le web

Demain

• Un rédacteur

• Plusieurs éditeurs

• Mieux « éditer l’usage »

titre de la présentation

Les micro-formats sont ils vraiment utilisés dans les sites web ? Vue de notre observatoire du web francophone

Type Nombre de

pages http://data-vocabulary.org/Breadcrumb 78 470 400

http://schema.org/MusicRecording 28 062 720

http://schema.org/VideoObject 27 659 520

http://schema.org/Person 25 440 000

http://schema.org/WebPage 24 084 480

http://schema.org/Article 21 335 040

http://schema.org/Product 19 703 040

http://schema.org/Blog 12 384 000

http://schema.org/Organization 12 138 240

http://schema.org/BlogPosting 11 089 920

http://schema.org/MusicPlaylist 10 801 920

http://data-vocabulary.org/Product 8 344 320

http://schema.org/LocalBusiness 6 608 640

http://data-vocabulary.org/Review-aggregate 6 182 400

http://schema.org/Book 6 028 800

http://schema.org/ImageObject 5 936 640

http://schema.org/MusicAlbum 4 308 480

3 formats en compétition : Microdata (Google, Bing, Yahoo, Yandex) RDFa (W3C) Microformats la famille des RDFA 15-16% des domaines, en augmentation (+2% en 2013-2014) la famille des microformats 6-7% des hosts, stagnation (en voie de disparition) la famille des micro-datas 8-9% des hosts, en augmentation (+2% en 2013-2014) principalement du schema.org

La position du moteur de recherche d’Orange : investir dans l’open data & sémantique

mettre en valeur les sites francophones à forte valeur ajoutée par leur micro-formats ouvrir notre observatoire du web avec des APIS pour inciter aux innovations Search mieux comprendre les questions complexes sur l’Assistance Orange, (notre mission première) avec l’analyse sémantique des requêtes

Conclusion

Les points à retenir

Changement des usages de recherches >

Mobile, vocal, conversationnel

Meilleure compréhension de la

requête > sens des mots + entités

nommées + contexte

Recherche de la réponse > formulations,

champ sémantique, schema.org

MERCI ! Questions / Réponses

Recommended