Main Content

Cette page a été traduite par traduction automatique. Cliquez ici pour voir la version originale en anglais.

Tall Arrays et mapreduce

Analysez des ensembles de Big Data en parallèle à l'aide de tall arrays et de datastores MATLAB® ou mapreduce sur des clusters Spark™ et Hadoop® et des pools parallèles

Vous pouvez utiliser Parallel Computing Toolbox™ pour évaluer des expressions de tall array en parallèle à l'aide d'un pool parallèle sur votre bureau. L'utilisation de tall arrays vous permet d'exécuter des applications Big Data qui ne tiennent pas en mémoire sur votre machine. Vous pouvez également utiliser Parallel Computing Toolbox pour étendre le traitement de grande taille en vous connectant à un pool parallèle exécuté sur un cluster MATLAB Parallel Server™. Vous pouvez également utiliser un cluster Hadoop configuré pour Spark exécutant MATLAB Parallel Server. Pour plus d’informations, consultez Big Data Workflow Using Tall Arrays and Datastores.

Fonctions

développer tout

tallCreate tall array
datastoreCreate datastore for large collections of data
mapreduceProgramming technique for analyzing data sets that do not fit in memory
mapreducerDefine parallel execution environment for mapreduce and tall arrays
partitionPartition a datastore
numpartitionsNumber of datastore partitions

Classes

développer tout

parallel.PoolPool parallèle de workers
parallel.cluster.HadoopHadoop cluster for mapreducer, mapreduce and tall arrays
parallel.cluster.SparkSpark cluster for mapreducer, mapreduce and tall arrays (depuis R2022b)

Exemples et procédures

Concepts