Hadoop is een open source gedistribueerd verwerkingsraamwerk dat gegevensverwerking en -opslag beheert voor big data-applicaties die in geclusterde systemen draaien. Het bevindt zich in het centrum van een groeiend ecosysteem van big data-technologieën die voornamelijk worden gebruikt ter ondersteuning van geavanceerde analyse-initiatieven, waaronder voorspellende analyse, datamining en toepassingen voor machine learning.
Hadoop kan omgaan met verschillende vormen van gestructureerde en ongestructureerde gegevens, waardoor gebruikers meer flexibiliteit hebben voor het verzamelen, verwerken en analyseren van gegevens dan relationele databases en datawarehouses bieden.