Apache Spark

Apache Spark

Apache Spark ™ е бърз и общ двигател за мащабна обработка на данни.SpeedRun програми до 100 пъти по-бързи от Hadoop MapReduce в паметта или 10 пъти по-бързи на диска.
Apache Spark ™ е бърз и общ двигател за мащабна обработка на данни.Програмите за бързо изпълнение стартират до 100 пъти по-бързо от Hadoop MapReduce в паметта или 10 пъти по-бързо на диска.Spark има усъвършенстван механизъм за изпълнение на DAG, който поддържа цикличен поток на данни и изчисления в паметта.
apache-spark

Алтернативи на Apache Spark за Windows

Apache Hadoop

Apache Hadoop

Apache Hadoop е софтуерна рамка с отворен код, която поддържа интензивно разпределени приложения, лицензирани под лиценза Apache v2.
Disco MapReduce

Disco MapReduce

Disco е лека рамка с отворен код за разпределени изчисления, базирана на парадигмата MapReduce и написана в Python.