Initier une veille : comment trouver les bons mots clés ?

Étape essentielle de toute démarche de veille, la définition des mots clés peut s’avérer être un vrai casse-tête pour les spécialistes de l’intelligence économique. Pourtant, il existe des méthodes et des outils qui peuvent significativement faciliter ce processus.

Définir les mots clés

La définition des mots clés adéquats constitue un élément crucial pour toute personne qui souhaite rechercher une information sur le web. Bien que parfois négligée, elle est pourtant déterminante dans les résultats de recherche.

Le choix des mots clés intervient très tôt dans le cycle de veille. Il arrive juste après la désignation des objectifs, lors de la première étape d’identification des besoins.

Il s’agit de trouver les termes adéquats qui permettront de faire remonter un maximum d’informations pertinentes. L’objectif sera ensuite de mettre en surveillance ces mots clés lors de la phase de collecte, grâce à des requêtes paramétrées dans un outil de veille. Les opérateurs booléens permettront d’affiner les recherches.

Figure 1 – Le cycle du renseignement.

La définition des mots clés doit aussi permettre d’identifier les termes qui n’ont aucun rapport avec la recherche, mais qui sont liés aux mots clés. C’est ce que l’on appelle communément « le bruit ». Prenons l’exemple d’une recherche sur les activités de l’entreprise de télécommunication Orange. On peut facilement imaginer que beaucoup des résultats seront liés au fruit ou à la couleur éponyme. Ainsi, il faudra exclure ces mots clés de la recherche via une requête booléenne (exemple : Orange NOT (Fruit AND couleur)).

Le plus grand risque de la phase de définition des mots clés est celui de passer à côté d’une partie de la problématique. En effet, en fonction des mots clés choisis, il est possible que le veilleur occulte tout un pan de la réponse potentielle à sa recherche. Pour reprendre le cas d’étude de l’activité d’Orange, si le veilleur ne met en surveillance que les activités de télécommunication, il risque de négliger plusieurs segments de l’activité (cybersécurité, banque …).

Après cette étape de réflexion initiale, les requêtes de mots clés devront être ajustées tout au long du cycle du renseignement, en fonction des résultats de la veille.

Quelques outils pour déterminer les mots clés

Il existe de nombreux outils gratuits permettant de définir plus facilement les mots clés. Tout d’abord, les dictionnaires de synonymes et les suggestions de recherche fournies par les moteurs de recherche peuvent constituer un bon début de base de données.

D’autres logiciels disponibles en ligne permettent d’aller plus loin en visualisant graphiquement les termes les plus associés à une recherche sur le web.

Pour débuter votre recherche, deux outils sont conseillés. Ils sont tous les deux accessibles gratuitement sur le web et fonctionnent aussi bien pour les recherches francophones qu’anglophones.

Le premier nommé Infomous permet d’explorer les termes les plus associés aux résultats de recherche. Il vous offre la possibilité de trouver les mots clés liés à une recherche web, Twitter ou bien en fonction d’un flux RSS.

Infomous vous offre également la possibilité de supprimer les termes que vous souhaitez. Cela peut vous être utile si vous devez effectuer un travail de reporting auprès d’un de vos clients de veille. En revanche, les capacités de traitement de la version gratuite d’Infomous semblent très limitées, notamment vis-à-vis de Twitter (une vingtaine de résultats analysés seulement).

Figure 2 – Analyse Actualité Orange Bank.

Carrot2 est un moteur de recherche qui permet de regrouper les résultats par cluster (clustering engine). Contrairement à Infomous, il ne permet pas d’analyser des résultats Twitter ou RSS. Il est néanmoins efficace et propose une interface différente. En effet, Carrot2 offre trois options de visualisation et cinq types de clustering différents (le choix s’effectue dans l’onglet « more option »). La grande limite de Carrot2 est l’agrégation de résultats, puisqu’il intègre au maximum 200 résultats de recherche.

Ci-dessous, un exemple avec l’analyse des résultats pour la recherche « Orange Business Services ». Orange Business Services est une entité du groupe Orange, en charge de l’activité B2B. Elle offre notamment des services de télécommunication, de cloud et de cybersécurité aux entreprises en France et dans le monde entier.

Figure 3 – Analyse Orange Business Services.

Ces outils ne sont pas récents dans le paysage de la veille. Infomous a commencé à être développé en 2011 et Carrot2 en 2002. Cependant, ils continuent de fournir des résultats pertinents.

Jusqu’il y a très peu de temps, il était possible d’utiliser l’outil développé par le Centre National de Ressources Textuelles et Lexicales (CNRTL), affilié au CNRS et à l’Université de Nancy. Le CNRTL propose de nombreux outils d’analyses lexicales (étymologie, lexicographie, morphologie). L’une des équipes du CNRTL a notamment développé un outil de recherche lié à la proxémie (distance de signification entre les mots), avec une interface visuelle. Voici le lien vers le site en question, si le site est toujours actif, l’interface liée à la proxémie semble quant à elle être en maintenance : http://www.cnrtl.fr/proxemie.

Le text mining, une autre approche

Une autre solution consiste à recueillir un premier lot de documents sur le sujet recherché. Une fois ce dossier constitué, il sera possible d’analyser les concepts les plus utilisés grâce à un outil de text mining. Cet outil permettra de mettre en exergue la fréquence d’usage d’un mot-clé dans ce même texte ou page. Les concepts pertinents pourront être utilisés par la suite comme mots clés. Il existe de nombreux logiciels de text mining. Voyant Tools est un outil efficace et gratuit. Fidel Navamuel a récemment publié un article très complet au sujet de Voyant Tools dans son excellent blog « Les Outils Tice ».

Ci-dessous, un exemple d’une analyse de Voyant Tools sur le rapport annuel 2017 d’Orange SA :

Figure 4 – Voyant Tools – Analyse du Rapport Annuel 2017.

L’avenir de ces outils : l’Intelligence Artificielle et le Big Data

Dans un futur proche, les avancées dans le domaine de l’Intelligence Artificielle et du Big Data faciliteront encore plus la recherche d’information. En effet, grâce au développement d’algorithmes de text mining et de sémantique encore plus puissants, les outils seront capables de traiter un volume de données beaucoup plus important. Aujourd’hui, la grande limite des outils à disposition réside dans la capacité à traiter la donnée de manière intelligente et automatique.

Beaucoup d’entreprises travaillent sur ce sujet. C’est le cas notamment de Geotrend. Cette startup Toulousaine a développé une plateforme capable de trouver de manière autonome les informations sur le web et de les comprendre grâce à une intelligence artificielle. Elle est notamment capable d’analyser 60 000 URL par minute, sans aucun paramétrage et sans aucune structure de base de données.

Grâce à l’apprentissage en temps réel, la plateforme de Geotrend est capable de schématiser les informations, de trouver les acteurs pertinents et de caractériser leurs relations (concurrentielles, partenariales, capitalistiques ou poursuites légales) ; mais également les technologies, les mots clés, qui caractérisent le marché et cela de manière autonome.

Ce qu’il faut retenir

Mais ces outils ne remplaceront peut-être jamais l’expertise des veilleurs aguerris qui connaissent leurs thématiques de veille sur le bout des doigts et qui sont capables de mettre en perspective des informations là où la machine ne montre qu’une image factuelle de la situation.

L’équipe Cell’IE


 Sources :

  • Camille Alloing. (2015-2016). Cours dispensé en Master 1 Intelligence Economique et Communication Stratégique. Cours non publié, IAE de Poitiers, Poitiers.
  • Fidel Navamuel. (2018), Blog les outils TICE, En ligne. https://outilstice.com/
  • Christophe Deschamps. (depuis 2003), Blog les outils froids, En ligne. https://www.outilsfroids.net/
  • Bryan Coder. (depuis 2013), Blog Keep It Simple, En ligne. https://www.keepitsimple.fr/
AUCUN COMMENTAIRES

Désolé, les commentaires ne sont plus admis pour le moment.