Les Codecs VLC et VLR et l'Espace Intermédiaire

Prise en Compte d'un Espace dit Intermédiaire

En 2D, à partir de l'espace des pixels, pour avoir l'espace k:
- Etape 1: on effectue des FFTs (Fast Fourier Transforms) sur chaque ligne (ou bien sur chaque colonne).
- Etape 2: on effectue des FFTs sur chaque colonne obtenue (ou bien sur chaque ligne obtenue).
- Etape 3: on effectue quelques opérations mineures.
Dans ce document, nous désignons par espace intermédiaire, l'espace obtenu après des FFTs sur chaque ligne (ou bien sur chaque colonne).

Dans l'espace k, les magnitudes sont caractérisées par une invariance aux translations pures. Les rotations pures font tourner les lignes de l'espace k autour du centre. Suite à un agrandissement (ou à un rétrécissement), l'espace k subit un rétrécissement (ou un agrandissement).
L'espace k est idéal pour la vision par ordinateur ou pour l'intelligence artificielle, tandis que l'œil humain est sensible à l'espace des pixels.
L'espace intermédiaire est donc un espace entre l'espace des pixels (vision humaine) et l'espace k (vision par ordinateur).

Avantages de l'Espace Intermédiaire

Il y a plusieurs avantages à utiliser les codecs VLC et VLR au niveau de l'espace intermédiaire, pour compresser les images, les séquences d'images ou les vidéos.

1) Non seulement on ne touche pas aux traitements en parallèle, mais on les renforce. L'utilisation de FFT permet les traitements en parallèle. En outre, les lignes sont traitées indépendamment dans l'espace et dans le temps.
2) La vitesse de traitement est très élevée car les étapes 2 et 3 ne sont pas effectuées.
3) A partir d'un stockage ou d'une transmission utilisant l'espace intermédiaire, il suffit d'effectuer des inverse FFTs (iFFTs) pour avoir l'espace des pixels, ou des FFTs pour avoir l'espace k.
4) A partir d'un stockage ou d'une transmission utilisant l'espace intermédiaire, si on a besoin que de quelques lignes, il suffit de ne décompresser que ces lignes.
5) Pour prendre en compte la couleur, on peut considérer 3 plans R, G et B, et appliquer les algorithmes sur chaque plan.
6) Pour prendre en compte la couleur, on peut considérer 3 plans Y, U et V (ou Y, Cb et Cr).
Dans ce cas on applique les algorithmes en entier (avant plan et arrière plan) sur le plan Y (luminance).
Pour la chrominance (qui fixe la couleur, plans U et V, ou plans Cb et Cr), on peut se contenter d'un minimum de bandes de l'arrière plan, ou même supprimer l'arrière plan.

Pour plus d'informations sur les codecs VLC et VLR, voir aux adresses suivantes:
- Algorithmes
- Page d'Accueil

Notes

- L'espace intermédiaire est très compressible.
Les phases ne sont pas aussi négligeables qu'en audio. Il y a lieu de prendre en compte de manière adéquate les phases de l'avant plan.

- On peut utiliser l'espace intermédiaire avec des dimensions supérieures à deux (3D, 4D ou 5D par exemple). Dans ce cas, on n'effectue les FFTs que sur une dimension.

- On peut choisir d'effectuer les FFTs suivant la plus grande dimension afin de minimiser les nombre de FFTs.

- On peut envisager de décomposer les vecteurs du type (x, y, z, alpha, phi) en (x, alpha, phi), (y, alpha, phi) et (z, alpha, phi).

- Les codecs VLC et VLR peuvent utiliser un nombre quelconque de bits par pixel, par exemple 16 bits ou plus. Si on utilise un grand nombre de bits par pixel en compression, lors de la décompression et de l'affichage, il faut se ramener à un nombre correct, par exemple 8 bits en SDR, 10 bits en HDR 10 ou 12 bits en HDR 12.

- Avec une prise en compte correcte des phases, les codecs VLC et VLR peuvent également compresser les espaces k de dimension 2 ou plus (3D, 4D ou 5D par exemple).

- Pour la reconnaissance d'images (vision par ordinateur), généralement on néglige la couleur et on ne tient compte que des bords, lignes et courbes.

- Si on veut avoir de forts taux de compression, il vaut mieux utiliser l'espace k, les fréquences les plus utiles se trouvant vers le centre. En outre, on peut utiliser les propriétés de symétrie autour des axes horizontaux et verticaux.