50 genomen per dag ???
Maar de sequencers kunnen veel sneller: 50 genomen per dag / 18.000 genomen per jaar. Een ware data-explosie.
12 dagen is te traag ==> een gedistribueerd opslagsysteem is wenselijk. Parallelisme in het GATK
How to unleash the full potential of your
computer or data center in your analysis BroadE: Introduction to parallelism for GATK
video, maart 2013 Hier komt Apache Hadoop in beeld: Analyzing Human Genomes with Apache Hadoop
15 okt 2009 En meer recent Apache Spark: Cloudera, Broad Institute Collaborate on the Next Generation of the Genome Analysis Toolkit
6 apr 2016
Laatst gewijzigd door Nr.10 : 7 mei 2017 om 00:05.
|