Los bericht bekijken
Oud 6 mei 2017, 23:54   #6
Nr.10
Secretaris-Generaal VN
 
Nr.10's schermafbeelding
 
Geregistreerd: 26 september 2003
Locatie: van Lissabon tot Vladivostok
Berichten: 31.237
Standaard 50 genomen per dag ???

Maar de sequencers kunnen veel sneller: 50 genomen per dag / 18.000 genomen per jaar. Een ware data-explosie.
12 dagen is te traag ==> een gedistribueerd opslagsysteem is wenselijk.
Parallelisme in het GATK
How to unleash the full potential of your
computer or data center in your analysis
BroadE: Introduction to parallelism for GATK
video, maart 2013
Hier komt Apache Hadoop in beeld:
Analyzing Human Genomes with Apache Hadoop
15 okt 2009
En meer recent Apache Spark:
Cloudera, Broad Institute Collaborate on the Next Generation of the Genome Analysis Toolkit
6 apr 2016
__________________
Doorzoek forum.politics.be (aangepaste zoekmachine)

Laatst gewijzigd door Nr.10 : 7 mei 2017 om 00:05.
Nr.10 is offline   Met citaat antwoorden