In de onderstaande tabel een overzicht van de stappen in het DNA-sequencing proces hierboven beschreven.
MapReduce
(1) Map fase
(2) Sorteren
(3) Reduce fase
- In de Map fase worden uit de input [= de dataset van 1,5 miljard reads] <key,value> paren gegenereerd, waarbij key staat voor een getal tussen 0 en drie miljard.
- In de Sorteer fase worden de <key,value> paren gesorteerd volgens key.
- De Reduce fase heeft als input alle <key,value> paren per key. De output aggregeert de values.