Avro è un sistema di serializzazione dei dati sviluppato all'interno del progetto Apache Hadoop. Offre una struttura dati ricca, un formato binario compatto e veloce, un file contenitore per l'archiviazione persistente dei dati, chiamate di procedura remota (RPC) e una semplice integrazione con linguaggi dinamici. Avro utilizza JSON per definire tipi di dati e protocolli, serializzando le informazioni in un formato binario compatto. Il suo utilizzo principale avviene in ambito Hadoop, dove viene impiegato per servizi di serializzazione e scambio dati. Avro è particolarmente adatto ad applicazioni che richiedono l'evoluzione dello schema, poiché memorizza lo schema insieme ai dati. Ciò consente ai lettori di elaborare le informazioni anche se lo schema è cambiato rispetto al momento della scrittura. Le capacità di evoluzione dello schema di Avro, combinate con il suo efficiente formato binario, lo rendono una scelta popolare per l'archiviazione e lo scambio di dati in ambienti big data. Supporta tipi di dati complessi ed è progettato per essere altamente performante sia in lettura che in scrittura. I file Avro sono spesso utilizzati per archiviare grandi set di dati in modo distribuito.