唐山华之骏文化传媒有限公司为您免费提供唐山成人教育、秦皇岛成人教育课程、唐山教育培训价格等相关信息发布和最新资讯,敬请关注!  

新闻中心

联系我们

电话:13373150848

手机:13373150848

邮箱:

网址:www.huazhijun.cn

地址:河北省唐山市路南区新华西道118-8号新华步行街14栋2号

新闻详细

什么是数据大小?

来源:http://www.huazhijun.cn/news50919.html  发布日期:2019-2-26 11:07:00

很多人对数据大小不是很了解,下面就跟唐山成人教育一起来了解一下吧。

不同数据源的数据,或甚至来自同一个源的不同表,通常设计同样的信息但结构却完全不同:

举例来说,想象你们人力资源部有三种不同的表格,一个是员工个人信息表,另一个是员工职位和薪资表第三个是员工职位要求表,诸如此类——而你们财务部门随同保险、福利和其他花费一起记录同样的信息到单个表中。另外,在这些表中的一些表可能提到员工的全名,而另一些则只有名字的首字母,或者二者的结合。为了从所有表中有效使用数据,同时不丢失或重复信息,需要数据建模或准备工作。

这是最简单的用例:更进一步复杂化的是处理最初没有适当地模式的非结构化数据源(例如NoSQL 数据库)。

再次回到模糊的“大数据”概念,你收集的数据量会影响你需要用来分析它的软硬件的类型。这个可以通过原始大小来衡量:字节,TB或PB——数据增长越大,越有可能“窒息”广泛使用的内存数据库(IMDB),依赖于转化压缩数据到服务器内存。其他因素包括多元异构数据——包含很多数据行的表(Excel,可以说是最常用的数据分析工具,最大行数限制为1048576行),或结构化数据——包含很多数据列的表。

你将会发现在分析工具和方法上用于分析100,000行数据和那些用于分析1亿行数据的是明显不同的。

以上就是数据大小的理解,希望可以帮助到大家。


相关标签:数据,