计算机技术论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

  • 欢迎访问 计算机技术论坛-电脑迷与初学者的家园!由于论坛管理严格,新注册会员可能遇到各种问题,无法解决的请发邮件 admin@jsjbbs.cn
查看: 1615|回复: 0

工业通过MATLAB处理大数据的相关分析和介绍

[复制链接]
发表于 2021-4-9 12:59:42 | 显示全部楼层 |阅读模式
#111723#大数据指的是创立的数据和供剖析的数据的数目与速度敏捷增添。
大数据使剖析师和数据专家无机会取得更好的看法,停止更理智的决议,然而它同时也会带来很多的挑衅:可用的内存可能没法足以处置大数据集,可能须要花太久的时光停止处置或可能活动太快而没法存储。尺度算法平日不能以公道的时光或内存来处置大数据集等等。
现在没有任何一种单一方式能够处置大数据。为此,MATLAB 供给了很多东西来处理这些挑衅。

在 MATLAB 中处置大数据
1. 64 位盘算。
64 位版本的 MATLAB 可敏捷增添内存中可保存的数据量——平日可到达恣意 32 位顺序的 2000 倍。32 位顺序限度您只能应用 2 GB 的内存,而 64 位 MATLAB 的内存能够到达操纵体系的物理内存限度。对于 Windows 8,台式机内存为 500 GB,Windows Server 内存为 4 TB。
2. 内存映照的变量。
借助 MATLAB 中的memmapfile函数,您能够将文件或文件的一部份映照到内存中的 MATLAB 变量。如许,您便可以高效拜访磁盘上因为太大而没法保存在内存中或须要花太长时光而没法加载的大数据集。
3. 磁盘变量。
matfile函数使您能够直接从磁盘上的 MAT 文件拜访 MATLAB 变量(应用 MATLAB 索引下令),无需将全体变量加载到内存。这使您能够在大数据集长进行块处置,这些大数据集由于太大而没法保留在内存中。
4. 内涵的多核数学。
MATLAB 中的很多内置数学函数,如fft、inv和eig都是多线程的。通过并交运行,这些函数充足应用盘算机的多核,供给高机能的大数据集盘算。
5. GPU 盘算。
假如您正在应用 GPU,Parallel Computing Toolbox中的GPU 优化的数学函数能够为大数据集供给更高的机能。
6. 并行盘算。
Parallel Computing Toolbox供给并行 for 轮回 , 该轮回在多核盘算机上并交运行您的 MATLAB 代码和算法。假如您应用MATLAB Distributed Computing Server,则能够在呆板聚集上并行履行,这些呆板可扩大到数千台盘算机。
7. 云盘算。
对于数百或数千台盘算机的按需并行处置,您能够在 Amazon Elastic Computing Cloud(亚马逊弹性盘算云)(EC2) 上应用MATLAB Distributed Computing Server并交运行 MATLAB 盘算。借助云盘算,您无需购置或保护您本人的聚集或数据核心便可以处置大数据。
8. 散布式阵列。
应用Parallel Computing Toolbox和MATLAB DistributedComputing Server,您能够处置散布在盘算机聚集内存中的矩阵和多维数组。应用此方式,您能够针对因太大而没法由单台盘算机内存处置的大数据集,停止存储和履行盘算。
9。 流式算法。
应用体系工具,您能够对因太大或太快而没法保存在内存中的数据传入流履行流式处置。另外,您还能够应用MATLAB C++oder通过 MATLAB 算法天生嵌入式 C/C++ 代码,并针对高机能及时体系运转发生的代码。
10. 图象块处置。
应用Image Processing Toolbox中的blockproc函数,您能够处置特殊大的图象,方式是每次以模块的情势高效处置它们。与Parallel Computing Toolbox一同应用时,在多核和 GPU 上并交运行盘算。
11. 呆板进修。
呆板进修有助于通过大数据集提取看法和开辟猜测性模子。普遍的呆板进修算法,包含Statistics and Machine Learning Toolbox和Neural Network Toolbox中供给的增进式 (boosted) 和袋装 (bagged) 决议树、K 均值和分层聚类、k-近来邻搜寻、高斯混杂、冀望最大化算法、隐马尔可夫模子和神经收集。
更多内容阅读推荐:燃气灶松手就灭怎么修
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

无图版|手机版|计算机技术论坛 JSJBBS.CN @ 2008-2024 ( 鲁ICP备17021708号 )

技术支持 : 北京康盛新创科技有限责任公司

快速回复 返回顶部 返回列表