Avro est un système de sérialisation de données développé dans le cadre du projet Apache Hadoop. Il offre une structure de données riche, un format binaire compact et rapide, un fichier conteneur pour stocker des données persistantes, ainsi que des capacités d'appel de procédure à distance (RPC) et une intégration simple avec des langages dynamiques. Avro utilise JSON pour définir les types de données et les protocoles, tout en sérialisant les données dans un format binaire compact. Son utilisation principale se situe dans Hadoop, où il sert aux services de sérialisation et d'échange de données. Avro est particulièrement adapté aux applications nécessitant une évolution de schéma, car il stocke le schéma avec les données. Cela permet aux lecteurs de traiter les données même si le schéma a été modifié depuis l'écriture. Les capacités d'évolution de schéma d'Avro, combinées à son format binaire efficace, en font un choix populaire pour le stockage et l'échange de données dans les environnements Big Data. Il prend en charge des types de données complexes et est conçu pour être hautement performant tant en lecture qu'en écriture. Les fichiers Avro sont souvent utilisés pour stocker de grands ensembles de données de manière distribuée.