标签:算法
在数学上来看,计算机中存在不断变大的数据集,不存在绝对的大数据,计算机中的所有数据集都是有限集合。大数据采样——把大数据变小、找到与算法相适应的极小样本集、采样对算法误差的影响大数据表示——表示决定存储、表示影响算法效率大数据不一致问题——导致算法失效和无解、如何消解不一致大数据中的超高维问题——超高维导致数据稀疏、算法复杂度增加
大数据最深入的研究分析,关于概念,算法,应用
一、 大数据基本概念
大数据已经渗透于互联网之中,是互联网重要的生产要素。
大数据Big Data是指大小超出了常用的软件工具在运行时间内可以承受的收集,管理和处理数据能力的数据集;大数据是目前存储模式与能力、计算模式与能力不能满足存储与处理现有数据集规模产生的相对概念。