重复数据删除技术:面向大数据管理的缩减技术
上QQ阅读APP看书,第一时间看更新

前言

数据是数字经济时代的“石油”,已成为当今世界最有价值的资源之一,甚至成为了中美贸易战的主战场。然而,纷繁复杂的海量数据存储管理,对当前数据中心的大数据存储提出了严峻的挑战。

人脑的智慧不仅体现在强化有深刻意义的人生大事,还在于能逐步淡忘无意义的生活琐事。类似人脑,大数据系统也需要依据数据的价值进行存储取舍,删除不必要的数据垃圾,这不仅提升降低整体系统建设和管理成本,更有利于提升大数据系统的性能和智能。

本书是国内第一本系统讲解重复数据删除技术的专业图书,内容丰富、彩色印刷。

本书以大数据存储为背景,介绍重复数据删除技术。世界著名数据科学家维克托·舍恩伯格教授所著畅销书《大数据时代》的姊妹篇《删除—大数据时代的取舍之道》,强调大数据时代需要在“记忆”和“遗忘”之间做平衡。大数据时代,个人数据隐私受到极大挑战,适当适时地删除数据,有利于保护大数据时代的隐私权。