L'AttrakDiff pour évaluer l’attractivité de vos produits & services

Comment évaluer l’attractivité de vos produits & services ?

Pour concevoir des produits ou des services attractifs, utiles et utilisables, il est important de pouvoir les tester. L'évaluation rigoureuse tout au long du processus de développement permet d'identifier les points forts à renforcer et les éventuels points faibles à corriger.

À cette fin, il existe de nombreux outils et méthodes conçus spécifiquement pour évaluer un produit. L’un de ces outils est l’AttrakDiff. Dans cet article, nous vous expliquons comment utiliser cet outil pour évaluer vos produits et services.

Qu’est-ce que l’AttrakDiff ?

L'AttrakDiff est un outil d’évaluation de l’expérience utilisateur présenté sous la forme d’un questionnaire “standardisé”. Le questionnaire AttrakDiff se compose de 28 items² qui évaluent différents aspects de l'expérience utilisateur. Ils incluent la dimension pragmatique, l'attractivité globale, les dimensions hédoniques de stimulation et l'identification. Les participants à l'étude sont invités à se positionner sur ces 28 items². Les items² se présentent sous la forme de paires de mots contrastés à évaluer par des échelles de Likert¹ en 7 points.

Son objectif principal est d'évaluer l'attraction et la difficulté perçue ainsi que l’image globale des produits / services.

Qu’est-ce qu’une dimension dite hédonique et une dimension dite pragmatique ?

Les termes "hédonique" et "pragmatique" sont souvent utilisés pour décrire deux dimensions distinctes dans la psychologie.

La dimension hédonique renvoie à des qualités qui facilitent la réalisation de buts orientés vers l’individu plutôt que des tâches à exécuter. Elle comprend deux grandes parties :

  • l’identification (comment les produits ou les services reflètent l’image pour ceux qui les possèdent)
  • la stimulation (qui renvoie aux besoins d’expérience nouvelle et de défi pour l’utilisateur).

On peut dire que la perception des qualités hédoniques d’un produit ou service a une influence sur notre avis porté à son égard vis-à-vis de son apparence.

La dimension pragmatique quant-à elle, fait référence aux qualités pragmatiques qui auront un impact important sur notre avis en termes de satisfaction et de qualité globale du produit ou service. Elle englobe des propriétés telles que l’utilité, la facilité d’usage ou encore la fiabilité d’un produit/service. Pour l’AttrakDiff, on distingue 4 qualités :

  • Les qualités hédoniques de stimulation, à quel point le produit soutient le besoin de stimulation de l'utilisateur grâce à des interactions, fonctionnalités… (innovante et stimulante).
  • Les qualités hédoniques d’identification, à quel point l'utilisateur peut s’identifier au produit (en accord avec l'identité et les valeurs de l'utilisateur).
  • Les qualités pragmatiques, à quel point l’utilisateur peut accomplir une tâche ou atteindre son but avec aisance (utilité et efficacité).
  • L’attractivité globale, à quel point l'utilisateur apprécie utiliser le produit (agréable et plaisant).

Qu’est-ce qu’un questionnaire “standardisé” ?

Un questionnaire standardisé est un ensemble d’items² préétablis, formulés de manière cohérente et conçus de manière à recueillir des informations uniformes auprès d'un groupe de personnes. Il peut comporter des questions à choix multiples, des questions ouvertes ou une combinaison des deux. Ces questionnaires suivent un format fixe :

  • la structure globale du questionnaire reste constante d’une administration à l’autre
  • les items² sont formulés de manière identique pour tous les répondants
  • les options de réponse sont prédéfinies et suivent une séquence spécifique
  • le chercheur ayant créé et validé le questionnaire standardisé va systématiquement communiquer les règles d’administration à suivre et il est essentiel de les respecter à la lettre, à chaque administration et dans chaque contexte. Par exemple, la méthode de présentation des items (ordre fixe ou ordre aléatoire) fait partie de ces règles auxquelles il faudra porter attention.

Les questionnaires standardisés sont largement utilisés dans la recherche, les évaluations et les enquêtes pour garantir la fiabilité, la comparabilité et la précision des données recueillies.

D’où vient l’AttrakDiff, comment a t-il été conçu ?

C’est à Marc Hassenzahl, un chercheur en psychologie, que l’on doit la théorie sur laquelle s’appuie l’AttrakDiff, mais également l’outil en lui-même (Hassenzahl, 2003). Hassenzahl est notamment connu pour ses travaux sur l'ergonomie et l'expérience utilisateur et c’est en collaboration avec d'autres chercheurs, qu’il a créé l'AttrakDiff afin d'évaluer de manière systématique l'attraction et la difficulté perçue des produits et des services (Hassenzahl, Burmester, & Koller, 2003).

Depuis son introduction en 2003, l'AttrakDiff a été validé en anglais (Hassenzahl & Monk, 2010) puis en français (Lallemand, Koenig, Gronier & Martin, 2015) et est devenu un outil couramment utilisé dans le domaine de la recherche utilisateur et de la conception centrée sur l'utilisateur.

Le Questionnaire de l’’AttrakDiff se présente sous la forme suivante : Représentation du questionnaire de l'AttrakDiff telle qu'il est présenté aux testeurs

Quand utiliser l'Attrakdiff

L'AttrakDiff se positionne comme un outil polyvalent, répondant à divers besoins d'évaluation et de comparaison au sein du domaine de l'expérience utilisateur. Il peut être utile pour une :

  • Évaluation ponctuelle : adaptée pour une analyse ponctuelle ou répétée d'un produit ou d'un système. Permet de mesurer l'attractivité et la difficulté perçue à un moment donné, offrant un instantané de l'expérience utilisateur.
  • Comparaison pré- et post-implémentation : implique la réalisation de deux évaluations distinctes, avant et après l'implémentation de changements. Fournit un comparatif des effets du changement, permettant une analyse approfondie des améliorations ou des régressions de l'expérience utilisateur. Il est important de noter que les changements à comparer doivent être significatifs. L’Attrakdiff est avant tout un outil d’évaluation de la perception. Autrement dit, il n'est pas utile de s'en servir pour comparer le wording d’un CTA entre deux expériences, mais plutôt pour comparer deux directions artistiques d’une home page.
  • Comparaison entre un produit A et un produit B : deux produits sont soumis à l'évaluation de l'AttrakDiff, offrant une comparaison directe. Permet d'évaluer comment les utilisateurs perçoivent et différencient les caractéristiques des produits, facilitant ainsi la prise de décision entre les alternatives.

Comment calculer le score de l’AttrakDiff ?

Pour obtenir le score de l'AttrakDiff, il est important de calculer le score de chaque item². Tous les items² ne sont pas rangés dans le même ordre.

Les mots à valence positive correspondent toujours aux scores positifs (ex: scores de 1 à 3 pour les mots “humain”, “simple”, “pratique”) et les mots à valence négative correspondent aux scores négatifs (ex: scores de -1 à -3 pour les mots “technique”, “compliqué”, “pas pratique”).

Réaliser l’ensemble des calculs pour interpréter les résultats peut être long et fastidieux. Il est recommandé d’automatiser au maximum le calcul des résultats pour gagner du temps et faciliter l’interprétation.

  • Étape 1 : reporter chaque résultat des pairs de mot par qualité par individu
  • Étape 2 : calculer la moyenne des résultats par qualité par individu
  • Étape 3 : (optionnel) : calculer l’écart-type lié à ces moyennes

Interpréter au mieux vos résultats

Nous vous conseillons vivement d’accompagner chacune de vos moyennes par un écart-type. Cet indice permet de savoir comment vos données sont distribuées autour de votre moyenne. Autrement dit, savoir à quel point vos utilisateurs sont d’accord entre eux ou pas. Il est essentiel de savoir si les données observées sont plutôt hétérogènes ou homogènes car les interprétations seront différentes selon le cas de figure.

Comment interpréter mes résultats ?

La présentation des résultats peut se faire sous différentes formes et sont complémentaires. Elles peuvent en effet être utilisées et combinées selon vos besoins ou ceux de vos interlocuteurs.

Les résultats peuvent être représentés sous l'une de ces 3 formes :

Diagramme des valeurs moyennes

Pour des personnes novices, ayant peu de temps, cette présentation permet d’avoir un premier aperçu dans les grandes lignes de chaque qualité sans rentrer trop dans les détails. Il est alors plutôt facile de comparer les scores de chacune des qualités avec cette visualisation claire et simplifiée.

Elle permet également pour la personne interprétant les scores de cibler des thématiques ayant de moins bons scores et ainsi savoir où mettre l’effort. Pour une meilleure interprétation vous pouvez également ajouter la valeur de l'écart type de chaque dimensions.

Représentation du diagramme de valeur t'elle qu'on peut le retrouver sur le site web de Carine Lallemand

Explication des qualités :

Qualité Pragmatique (QP) : un score élevé signifie que le produit est considéré comme efficace, fonctionnel et facile à utiliser. Un score faible peut indiquer que le produit présente des problèmes d'utilisabilité ou de fonctionnalité.

Qualité Hédonique - stimulation (QHS) : un score élevé suggère que les utilisateurs perçoivent le produit comme esthétiquement agréable. Un score faible peut signifier que le produit ne suscite pas d'émotions positives ou qu'il est perçu comme ennuyeux ou peu attrayant du point de vue sensoriel.

Qualité Hédonique - identification (QHI) : un score élevé suggère que le produit répond à leurs besoins, reflète leur identité ou offre des options de personnalisation qui renforcent leur engagement. Un score faible peut indiquer que le produit ne parvient pas à établir une connexion émotionnelle. Il pourrait être nécessaire d'explorer des moyens de personnalisation pour améliorer l'identification des utilisateurs avec le produit.

Attractivité (ATT) : un score élevé en attractivité indique que le produit est perçu comme étant attractif, engageant et désirable. Un score faible peut signifier que le produit manque d'attrait ou qu'il ne suscite pas l'intérêt des utilisateurs.

Graphique des paires de mots

Cette représentation permet de s’intéresser davantage aux détails. Elle permet de voir rapidement quels aspects sont perçus négativement ou positivement et ainsi mieux connaître ses forces et ses faiblesses. Il est alors plus simple de prioriser des axes d'amélioration.

Les valeurs les plus extrêmes sont particulièrement intéressantes notamment dans cet exemple. On peut ainsi pointer certains mots tels que : “déplaisant”, “prudent” et “technique” qui sont des axes qui devront être pris en compte pour améliorer le produit/service évalué.

Représentation du graphique de paires de mots. Les items sont rangés par paire et on trace une courbe entre chaque paire en s’appuyant sur leurs moyennes.

Portfolio des résultats

Le portfolio des résultats offre une vue d'ensemble qui combine les scores moyens des qualités hédoniques et pragmatiques. Cette représentation permet de facilement tirer une interprétation en fonction de sa position du score sur la grille.
Dans cet exemple ci-dessous, on peut voir que notre expérience est perçue comme orientée tâche et qu'il faudrait travailler sur les dimensions hédoniques pour qu'elle soit davantage perçue comme orientée vers soi.

Représentation du portfolio des résultats t'elle qu'on peut le retrouver sur le site web de Carine Lallemand

  • Superflu : le produit est considéré comme inutile et non attrayant.
  • Trop orienté vers soi : centré sur l'identité de l'utilisateur, manque de fonctionnalité ou d'utilité pratique.
  • Trop orienté tâche : fonctionnel, mais manque d'attrait visuel ou émotionnel.
  • Orienté vers soi : forte identification sur le plan personnel, mais pourrait avoir des améliorations en termes de fonctionnalité ou d'utilité.
  • Orienté tâche : fonctionnel et utile, mais pourrait bénéficier d'une amélioration de son attrait visuel ou émotionnel.
  • Désiré : à la fois attrayant sur le plan esthétique ou émotionnel et en accord avec l’identité des utilisateurs.
  • Neutre : perception neutre du produit, sans forte attraction ni forte utilité.

Conclusion

Dans un monde où l’image et les aprioris ont de puissants effets sur les comportements, pouvoir mesurer comment est perçu un produit et en dresser un profil est un atout dans la prise de décision.

L’AttrakDiff est l’outil idéal parce qu’il permet une mesure standardisée, rapide, nuancée et validée par la communauté scientifique. Il permet de savoir si l’image perçue est en accord avec les objectifs pour déclencher les bonnes actions correctives (changer de stratégie de communication, de charte graphique, de contenu …).

En somme, déployer l'AttrakDiff, c'est se doter d’une formidable clé de lecture des ressentis des utilisateurs, données centrales dans la stratégie de conception de produits centrés utilisateurs.

Références

  • Études sur les échelles de Likert : ALWIN, D.F., & Krosnick, J.A. (1991). The Reliability of Survey Attitude Measurement: The Influence of Question and Respondent Attributes. Sociological Methods Research, vol. 20 (1), p. 139-181.Maydeu-Olivares, A., Fairchild, A.J., & Hall, A.G. (2017). Goodness of Fit in Item Factor Analysis: Effect of the Number of Response Alternatives. Structural Equation Modeling: A Multidisciplinary Journal, vol. 24 (4), p. 495-505.

  • Études sur les questionnaires standardisés : Beyond the NPS: Measuring Perceived Usability with the SUS, NASA-TLX, and the Single Ease Question After Tasks and Usability Tests. (n.d.). Nielsen Norman Group. https://www.nngroup.com/articles/measuring-perceived-usability/Goldberg, L. R. (1992). The development of markers for the Big-Five factor structure. Psychological Assessment, 4(1), 26-42.Eysenck, H. J., & Eysenck, S. B. G. (1975). Manual of the Eysenck Personality Questionnaire. London, UK: Hodder & Stoughton.

  • Études sur des dimensions hédoniques et pragmatiques dans la relation utilisateur-produit : Hassenzahl, M., Burmester, M., & Koller, F. (2003). AttrakDiff: Ein Frage- bogen zur Messung wahrgenommener hedonischer und pragmatischer Qualität. In J. Ziegler, & G. Szwillus (Eds.), Mensch & Computer 2003. Interaktion in Bewegung (pp. 187–196). Stuttgart, Germany: B.G.Teubner. https://link.springer.com/book/10.1007/978-3-322-80058-9

  • Florence Février, N. Gauducheau, Éric Jamet, G. Rouxel, Pascal Salembier. Dans le travail humain 2011/2 (Vol. 74), pages 183 à 201. La prise en compte des affects dans le domaine des interactions homme-machine : quels modèles, quelles méthodes, quels bénéfices.

  • Lallemand, C., Koenig, V., Gronier, G., & Martin, R. (2015, in press). Création et validation d’une version française du questionnaire AttrakDiff pour l’évaluation de l’expérience utilisateur des systèmes interactifs. Revue européenne de psychologie appliquée.

  • Site web Lallemand, C : https://uxmind.eu/

Glossaire

¹ Echelles de Likert : il s’agit des échelles de scores sur lesquelles vos participants doivent se positionner. Elles permettent de limiter certains biais et notamment la variabilité inter-individuelle (e.g., on va chercher à ce que notre échelle signifie la même chose pour tous nos participants, toutefois, plus il y a de points, plus la perception de cette échelle peut différer d’un individu à l’autre).

² Item : Un item désigne généralement l’énoncé d’une question ou un élément utilisé dans le questionnaire. Dans le cadre de l’AttrakDiff, les items font références aux 28 paires de mots contrastés à évaluer par des échelles de. Likert¹.