当前位置 : 网站首页 > 新闻中心

2019

05-24


来源:

浏览: 3

作者:

数据仓库中数据维护方法研究
第17届全国数据库学术会议论文集技术报告数据仓库中的数据维护方法丁峰邓西安交通大学软件学院西安永申毅和饥饿与帮助。肠道阴道灯有助于吃掉记录,即公众的眼睛,数据仓库的引入,数据仓库的维护问题,但数据仓库的数据维护问题也出现了,但其需求和机制是与传统数据库不同。在介绍数据仓库的基础上,分析了数据维护问题,提出并讨论了删除过期数据和强制数据的方法。数据仓库简介数据仓库中的多学科和互穿技术是一种解决方案。它基于传统的数据库技术,通过统计分析和其他方法分析数据提取信息,并使用人工智能和其他技术来发现知识并对其进行适当的可视化。对于数据仓库,来自一个或多个数据库的数据副本有许多不同的定义。数据仓库是分散的数据库系统,其与操作数据库不同,操作数据库与在线事务处理系统分离。数据仓库W的父亲的描述与传统的操作系统分离,数据与数据库分离,由封闭的王善等人整合和处理。不可更新的,随时间变化的数据集合,旨在更好地支持业务或组织的决策分析过程的决策过程。数据仓库的tomb功能面向主题。传统的数据库主要面向数据的日常处理。数据仓库中的数据面向主题组织,抽象程度高,因此可以围绕更高级别的概念和需求分析数据,并提取与主题相关的信息。分析的主题基于分析的需要。数据集成。由于数据源数量众多,数据仓库数据应该正确集成,数据应该干净,可以更改相同的信息,可以更改模糊的不同表示,可以正确更改数据,以及错误或矛盾的数据可以消除。消除冗余数据是不可修改的。修改数据是传统数据库提供的主要操作之一,但数据仓库中的数据用于分析。它是第17届全国数据库学术会议技术报告的历史资料。它主要面向高用户层的决策。而不是底层数据操作应用程序,通常不允许或修改它。数据随着时间的推移不断变化。数据仓库随着时间的推移不断添加新内容,需要从传统数据库中捕获新数据以添加到数据仓库中,并且根据及时性从数据仓库中删除超过存储期的数据。此外,还需要集成时间属性。随着时间的推移重新合成。数据仓库架构图是标准数据仓库架构模型。其中,数据提取和集成转换设备在通过提取和清理集成处理后处理来自各种源数据库的数据,并将它们放入数据仓库中。在数据仓库中的数据被不同程度地合成之后,对数据进行分析和挖掘以找出规律。视觉表示工具用于向最终用户表达。最终用户数据仓库图标准数据仓库架构模型数据维护机制开发数据仓库应用系统通常采用原型方法,即逐步开发方法。数据仓库的维护主要是刷新数据仓库的当前详细数据,添加新数据,删除过期数据等。删除过期数据数据仓库中的数据具有一定的存储周期,具体取决于数据仓库的范围和性质应用中,储存期不同,通常为5年。 (他们中的大多数是商业组织几十年甚至更长时间,例如该国的人口或超过指定的时间段后,数据被认为太旧而不会失去决策分析的意义,应从数据仓库中删除。易于删除期间数据,我们考虑在数据仓库中的所有数据的代码键中添加时间属性,指示进入数据仓库的时间,即数据提取和集成设备为代码键添加时间属性用于提取数据,我们称之为人类库。时间是时钟提供的当前时间,用于标记离开数据仓库的时间(对于后来添加的数据,实际上是进入辅助组织的时间)。在数据仓库管理系统中(添加判断机制,使用在当前时刻,减去数据库在代码密钥上的时间。一旦年龄超过预定时期,就可以删除数据的年龄。必须注意的是,为了确保用户的可靠性,应该有一个数据缓冲区,过期的数据应该先放入缓冲区,而不是立即删除,否则将无法响应当时用户的查询和决策要求。当数据仓库使用率最低时(通常在晚上或假日),应该进行真正的删除。随着时间的变化,新数据不断出现,这些新数据应该及时添加到数字中。进入仓库以满足决策分析的及时性要求。数据附加的本质不是移动数据仓库中的数据,而是捕获这些新数据的快照(并集成一批这样的快照,然后在适当的时候将时间添加到数据仓库中。一般数据附加方法是在用户使用率最低的时间段内将综合处理数据传输到数据仓库,以及第17届国家数据库学术会议的论文(技术报告中的现有数据合并和检查)附加是否有效。这种方法相对简单,但是在附加操作期间还存在用户对数据仓库的使用中断的问题,并且数据总是在稍后进入数据仓库而不是被集成。通过pF压印等提出了弥补上述缺陷的方法。该方法在数据仓库和数据提取和转换装置之间添加辅助装置。由随机存储器丢失形成的缓冲器(如图所示)。这种方法的优点是除了通过直接将数据附加到数据仓库来更新基表和视图而不响应用户查询的问题之外,还有一些缺点,即缓冲区大小是多少辅助设备应该是合适的,以及如何处理溢出情况。给出答案。我们认为,遵循原型方法的思想,在数据仓库建立并使用一段时间后,根据经验和测试数据,获得最大数据附加量作为辅助结构的缓冲设计容量。为了解决缓冲区的潜在问题,可以将缓冲区容量作为上限,设置繁殖标志,一旦标记溢出,缓冲区数据自动传输到数据仓库,添加数据仓库后,应将确认信号发送回辅助结构。在接收到确认信号后,辅助结构清除缓冲区并重置溢出标志,等待下一轮数据添加。最后科瑞悦家庭分析和表达工具黔数据数据数据数据撇撇撇撇撇撇撇撇撇撇撇撇撇撇撇撇撇撇撇撇撇撇撇撇撇撇撇撇撇撇撇撇撇撇撇撇撇撇撇撇撇撇常用的方法有:时标方法如果数据包含时标属性,可以根据时间尺度直接判断。这种方法简单易行,但占用了大量存储空间。 。文件由应用程序生成,避免搜索生成文件的整个应用程序并不常见。 。上下文比较方法是在最后一次提取数据之前和添加之前拍摄数据的快照,并比较数据快照以确定此次需要提取的新数据。该方法占用大量资源,并且在操作期间对系统性能具有很大影响。 。在日志文件利用率的一个功能是找出需要通过搜索日志文件提取的新数据。这是一种更常见的方法。总结数据仓库是一个新技术热点,应用程序不是很流行,在数据仓库的设计和使用方面仍存在许多具体问题。上面提出的数据维护是使用中不可避免的实际问题。关于删除过期数据和附加数据机制的讨论在理论上是可行的,但它确实很实用,并且有许多细节需要解决。参考文献,二对一。 (对于第17届全国数据库学术会议论文集技术报告)有了G Bar说服,沉坦比N.,王望山等编辑,数据仓库技术和在线分析处理,科学出版社,Bibtan Dou Liu,与女人'的压力增加了清的数量。切
分享到: