HiCellTek HiCellTek
Retour au blog
VoLTEMOSQualité voixViSQOL

VoLTE qualité voix : mesurer le MOS automatiquement

Comment mesurer objectivement la qualité vocale VoLTE avec le score MOS. Méthodes ViSQOL et POLQA, protocole de test terrain, corrélation avec les KPIs radio. Guide complet 2025.

Takwa Sebai
Takwa Sebai
Fondatrice & CEO, HiCellTek
20 février 2026 · 7 min de lecture

La qualité vocale VoLTE est un des indicateurs de QoE les plus critiques pour les opérateurs mobiles. Un MOS voix dégradé génère des signalements abonnés, des résiliations et des complications réglementaires (ARCEP, ANFR, etc.). Ce guide explique comment mesurer automatiquement et objectivement la qualité vocale VoLTE sur le terrain, sans jury humain.

Rappel : qu’est-ce que le MOS voix ?

Le MOS (Mean Opinion Score) est l’échelle internationale de mesure de la qualité vocale définie par l’ITU-T (recommandation P.800) :

  • MOS 5 : qualité excellente (transparente, comparable à la présence physique)
  • MOS 4–4.5 : bonne qualité, légère atténuation perceptible
  • MOS 3.5–4 : qualité correcte, acceptable pour usage professionnel
  • MOS 3–3.5 : dégradation audible mais compréhensible
  • MOS < 3 : qualité inacceptable pour usage commercial

Historiquement, le MOS était obtenu par des panels d’évaluateurs humains (écoute de phrases standardisées, notation). Cette méthode est coûteuse et non reproductible sur le terrain. Les algorithmes perceptuels modernes permettent de calculer un MOS objectif automatiquement.

Les codecs VoLTE et leurs plafonds MOS

Le codec utilisé détermine le plafond MOS théorique atteignable, indépendamment de la qualité du réseau :

CodecBandeMOS max théoriqueUsage
AMR-NB 12.2 kbps0.3–3.4 kHz4.1VoLTE basique
AMR-WB 12.65 kbps0.05–7 kHz4.5HD Voice
EVS 13.2 kbps0.05–14.4 kHz4.5+Super HD Voice
EVS 32 kbps SWB0.05–14.4 kHz4.7+Usage premium

Point critique : si un appel VoLTE utilise AMR-NB alors que les deux terminaux supportent AMR-WB, la négociation codec a échoué ou la configuration réseau est sous-optimale. Vérifier les messages SIP (INVITE + SDP) pour confirmer le codec négocié.

Méthodes de calcul MOS automatique

PESQ (Perceptual Evaluation of Speech Quality — ITU-T P.862)

PESQ est le premier algorithme standardisé de calcul MOS automatique. Il compare un signal audio dégradé à un signal de référence et calcule un score perceptuel. Il reste utilisé dans des systèmes legacy mais est considéré comme dépassé pour les codecs modernes (EVS, Opus).

Limitations de PESQ : ne prend pas en compte les codecs large bande (AMR-WB, EVS), ni les caractéristiques perceptuelles des voix non-PSTN.

POLQA (Perceptual Objective Listening Quality Analysis — ITU-T P.863)

POLQA est le successeur de PESQ, standardisé en 2011. Il supporte :

  • Les bandes étroites (NB : 0.3–3.4 kHz)
  • Les bandes larges (WB : 0.05–7 kHz)
  • Les super-larges bandes (SWB : 0.05–14.4 kHz)

POLQA est la référence pour les tests de conformité VoLTE dans les rapports réglementaires et les audits opérateurs. Limitation : licence commerciale coûteuse (Opticom/SwissQual), pas d’usage embarqué dans les outils terrain légers.

ViSQOL (Virtual Speech Quality Objective Listener — Google Research)

ViSQOL est un algorithme open-source développé par Google Research (disponible sur GitHub). Il utilise une approche spectro-temporelle basée sur NSIM (Neurogram Similarity Index Measure) pour comparer le signal dégradé au signal de référence.

Points forts pour l’usage terrain :

  • Open source (Apache 2.0)
  • Hautes performances sur AMR-WB et EVS (supérieur à POLQA dans certains cas)
  • Deux modes : speech (16 kHz) et audio (48 kHz, pour contenu musical/multimédia)
  • Intégrable en natif dans les applications Android via JNI (libvisqol_jni.so)

C’est l’algorithme désormais privilégié pour les mesures VoLTE automatisées sur le terrain.

Protocole de test MOS VoLTE terrain

Setup recommandé

Configuration minimale :

  1. Terminal de mesure (smartphone Qualcomm rooté avec suite de mesure)
  2. SIM active sur le réseau opérateur testé
  3. Point de terminaison de l’appel : serveur IVR de test ou deuxième terminal de référence

Configuration avancée (mesure bout en bout) :

  1. Terminal A (mesure, terrain) : smartphone Qualcomm instrumenté
  2. Terminal B (référence, fixe) : smartphone ou POTS via passerelle SIP
  3. Source audio de référence : fichier WAV standardisé ITU-T P.501 (phrases de test)
  4. Serveur de calcul MOS : sur le terminal ou côté cloud

Séquence de mesure

Étape 1 : Établissement de l’appel VoLTE

  • Composer depuis le terminal A vers le terminal B
  • Vérifier dans les messages SIP : 180 Ringing200 OKACK
  • Vérifier le codec négocié dans le SDP (AMR-NB / AMR-WB / EVS)
  • Vérifier les bearers QCI (QCI 1 pour la voix VoLTE)

Étape 2 : Injection de la référence audio

  • Jouer le fichier WAV de référence depuis le terminal B
  • Le signal traverse le réseau VoLTE et est reçu sur le terminal A
  • Capturer le signal reçu sur le terminal A (permission RECORD_AUDIO requise)

Étape 3 : Calcul MOS

  • Aligner temporellement le signal reçu avec le signal de référence
  • Calculer le MOS ViSQOL (ou POLQA si disponible)
  • Exporter le rapport CSV (score MOS, timestamps, fichiers WAV alignés)

Étape 4 : Corrélation avec les KPIs radio

  • Corréler le MOS calculé avec les KPIs RF (RSRP, SINR, BLER) pendant la durée de l’appel
  • Identifier les corrélations : chutes MOS lors de dégradations radio
  • Corréler avec les messages Layer 3 : vérifier les Bearer Modification, SRVCC triggers

Durée des sessions de test

Pour un MOS statistiquement représentatif :

  • Durée minimale : 30 secondes de parole active (hors silences)
  • Durée recommandée : 90 secondes à 2 minutes d’appel
  • Nombre de répétitions : 5 appels minimum par zone de test

Fichiers de référence standardisés

L’ITU-T P.501 définit les fichiers de référence pour les tests perceptuels. Des phrases dans plusieurs langues (français, anglais, arabe, etc.) sont disponibles pour les tests multi-régions.

Les problèmes VoLTE les plus fréquents et leur diagnostic

Problème 1 : MOS < 3.5 malgré un bon RSRP

Cause probable : jitter ou perte de paquets RTP élevés, malgré une bonne couverture radio.

Diagnostic Layer 3 : analyser les flux RTP (QCI 1 bearer). Un jitter > 20 ms ou une perte > 1% dégrade significativement le MOS, même si le RSRP est excellent.

Cause secondaire fréquente : problème de QoS dans le core network (DPI mal configuré, priorité QCI 1 non respectée en période de charge).

Problème 2 : Basculement SRVCC inattendu

Le SRVCC (Single Radio Voice Call Continuity) est le mécanisme qui bascule un appel VoLTE vers le 2G/3G CS quand la couverture LTE devient insuffisante. Chaque SRVCC introduit une interruption audible de 0.3 à 1.5 secondes.

Diagnostic : détecter les messages RRC Handover Command avec target RAT = UTRAN/GERAN dans les logs Layer 3. La localisation GPS associée révèle les zones de bord de couverture LTE.

Problème 3 : Dégradation MOS en indoor

L’atténuation radio en bâtiment (typiquement 10–20 dB supplémentaires) peut faire descendre le RSRP sous le seuil VoLTE. La suite Android bascule alors vers SRVCC ou vers un appel CS classique.

Diagnostic : cartographier le MOS par zone (intérieur/extérieur, étage) et corréler avec le RSRP indoor. Les zones MOS < 3.5 en indoor révèlent les zones à équiper en répéteurs ou petites cellules.

Problème 4 : Codec AMR-NB forcé au lieu de AMR-WB

Symptôme : MOS plafonné à 4.1 même sur réseau excellent.

Diagnostic : vérifier le message SIP INVITE / SDP : la ligne m=audio doit lister les codecs proposés. Si AMR-WB (payload type 106) est absent, le terminal ne propose pas le HD Voice. Si AMR-WB est présent mais que le 200 OK répond avec AMR-NB → le réseau ou le terminal distant ne supporte pas AMR-WB.

MOS VoLTE : objectifs et seuils opérateurs typiques

Région / OpérateurMOS cible (médiane)MOS minimum (P10)
Europe (ETSI TS 103 531)≥ 4.0≥ 3.5
Golfe (réglementation TRA/CTRA)≥ 4.0≥ 3.5
France (ARCEP)≥ 3.8≥ 3.2
Afrique francophone (ARTEC)≥ 3.5≥ 3.0

Ces seuils sont souvent intégrés dans les contrats SLA entre opérateurs et équipementiers, et dans les cahiers des charges de déploiement.

MOS VoNR (Voice over NR)

Pour les déploiements 5G SA, la voix transite sur VoNR (Voice over New Radio) au lieu de VoLTE. Les méthodes de mesure MOS restent identiques, mais les couches de protocoles changent :

  • Bearer 5G QoS (5QI 1) au lieu de QCI 1
  • Protocoles NAS 5G MM/SM au lieu de EPS
  • IMS SIP identique

L’implémentation VoNR est encore en déploiement dans la plupart des réseaux en 2025, avec SRVCC vers VoLTE (et non vers 2G/3G) comme fallback.

Conclusion

La mesure automatique du MOS VoLTE est aujourd’hui accessible directement sur le terrain, via des algorithmes perceptuels comme ViSQOL, intégrés dans les suites de mesure Android. Cette capacité élimine le besoin de jurys humains ou d’équipements de test dédiés pour obtenir des indicateurs QoE voix comparables aux tests de laboratoire.

Pour un ingénieur RF ou QoS, la corrélation MOS + KPIs radio + messages Layer 3 est l’approche la plus puissante pour diagnostiquer et résoudre les problèmes de qualité vocale VoLTE sur le réseau opérateur.

Pour aller plus loin

Partager : LinkedIn X
Takwa Sebai
Takwa Sebai

Fondatrice HiCellTek. +15 ans dans les télécoms, côté opérateur, côté éditeur, côté terrain. Construit l'outil terrain que les ingénieurs RF méritent.

Prêt à passer au terrain ?

Demandez une démo personnalisée de HiCellTek, diagnostic réseau 2G/3G/4G/5G sur Android.

Recevez des insights RF & tips terrain

Désabonnement en un clic. Données traitées dans l'UE.