Discussie
:
Humaan genoom, Big Data, Hadoop MapReduce, gedistribueerde dataopslag, 3 miljard bp
Los bericht bekijken
6 mei 2017, 23:30
#
5
Nr.10
Secretaris-Generaal VN
Geregistreerd: 26 september 2003
Locatie: van Lissabon tot Vladivostok
Berichten: 31.268
één genoom = 12 dagen rekentijd
Dataset
De reads = de dataset.
Bijvoorbeeld 1,5 miljard reads van 100 baseparen.
Komt overeen met 300 GByte aan ruwe data.
Rekentijd
[met een Intel processor 2.60GHz)]
het alligneren aan het referentiegenoom: 2.700 reads per seconde ==> 172 uur
het prepareren van de data:
http://broadinstitute.github.io/picard/
==> 35 uur
"variant calling" (GATK) ==> 80 uur
Totale rekentijd = 12 dagen
__________________
Doorzoek
forum.politics.be
(aangepaste zoekmachine)
Nr.10
Bekijk openbaar profiel
Zoek meer berichten van Nr.10