重复数据删除技术:面向大数据管理的缩减技术在线阅读
会员

重复数据删除技术:面向大数据管理的缩减技术

付印金 肖侬编著
开会员,本书免费读 >

计算机网络数据库15.1万字

更新时间:2022-07-29 14:42:15 最新章节:参考文献

立即阅读
加书架
下载
听书

书籍简介

本书是一本专门介绍重复数据删除技术的专业书籍。全书共分为8章,以大数据存储为背景,介绍重复数据删除的关键技术及其应用场景。通过学习本书,读者能够了解信息存储技术基础、大数据管理主流技术和高效能存储管理基本知识,并可以深入理解重复数据删除技术的概念、分类、存储原理及关键技术,还可掌握前沿的应用,如感知源端重删机制和高可扩展集群重删技术,了解主流厂商重删存储相关产品及其应用案例。
品牌:清华大学
上架时间:2021-01-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

付印金 肖侬编著
主页

同类热门书

最新上架

  • 会员
    《企业级大数据项目实战:用户搜索行为分析系统从0到1》基于真实业务场景,以项目导向为主线,从0到1全面介绍企业级大数据用户搜索行为分析系统的搭建过程。全书共6章,第1章讲解项目需求与架构设计,详细阐述项目数据流与系统架构;第2章介绍大数据项目开发环境配置,手把手带领读者配置操作系统、Hadoop集群与相关工具,为后续项目实施打下基础;第3~5章逐步实现项目需求,第3章讲解用户行为数据采集模块的开发
    张伟洋计算机9万字
  • 会员
    本书以案例的形式,介绍从思维模型分析到场景实践的数据分析方法。全书围绕“数据分析”与“运营增长”两大关键要素,在系统介绍数据分析思维、数据分析方法、数据采集技能、数据清洗技能等基础知识的同时,以问题为导向,解读运营与增长的关键性业务内容,在获客、激活、留存、变现、自传播循环等各个核心运营环节展开数据分析实战。本书提供案例相关数据集与源码包,适合数据分析、产品运营、市场营销等行业有数据分析具体业务需
    黄佳计算机12万字
  • 会员
    《数据分析师手记:数据分析72个核心问题精解》从底层认知、思维方法、工具技术、项目落地及展望出发,使用问答的形式对数据分析中的72个核心知识点进行讲解,构建了数据分析的知识框架,带领读者认识数据分析背后的奥妙。读者可以用本书作为学习地图,针对具体的方法、技术进行延伸学习。
    刘林 李朝成 饼干哥哥计算机16.8万字
  • 会员
    本书以Python作为开发语言,系统介绍PySpark开发环境搭建流程及基于PySpark进行大数据分析的相关知识。本书条理清晰、重点突出,理论叙述循序渐进、由浅入深。本书共7章,第1?5章包括PySpark大数据分析概述、PySpark安装配置、基于PySpark的DataFrame操作、基于PySpark的流式数据处理、基于PySpark的机器学习库,内容介绍注重理论与实践相结合,通过典型示例
    戴刚 张良均主编计算机10.4万字
  • 会员
    《数据分析实践:专业知识和职场技巧》从初学者的角度出发,讲解了进阶为高级数据分析师所需的知识和技能,其中既包括数据分析岗位的介绍、发展现状及未来趋势,也包括实际工作中各环节的方法策略、实战案例,还包括职场中的困惑解答及面试指导。阅读本书,并基于本书进一步拓展所需要的知识能,可以帮助读者形成一套成系统、可实战的数据分析方法论。
    姜文哲计算机19.6万字
  • 会员
    本书以Python数据分析与挖掘的常用技术与真实案例相结合的方式,深入浅出地介绍Python数据分析与挖掘的重要内容。本书共11章,分为基础篇(第1~5章)和实战篇(第6~11章),基础篇包括数据挖掘基础、Python数据挖掘编程基础、数据探索、数据预处理、数据挖掘算法基础等基础知识;实战篇包括6个案例,分别为信用卡高风险客户识别、餐饮企业菜品关联分析、金融服务机构资金流量预测、O2O优惠券使用预
    翟世臣 张良均主编计算机13.6万字
  • 会员
    时序数据库是一种新型技术,主要用于工业互联网软件建设中。近年来,伴随着物联网技术在智能制造、交通、能源、智慧城市等领域的发展,时序数据库也发展迅速,成为搭建应用的必备数据库之一。《深入理解InfluxDB》从InfluxDB的安装开始,一步步详细介绍InfluxDB的功能及原理,带领读者深入理解以InfluxDB为代表的时序数据库。
    郑强 张伟 刘爽计算机7.6万字
  • 会员
    数据科学的关键技术包括数据存储计算、数据治理、结构化数据分析、语音分析、视觉分析、文本分析和知识图谱等方面。本书的重点是详细介绍文本分析和知识图谱方面的技术。文本分析技术主要包括文本预训练模型、多语种文本分析、文本情感分析、文本机器翻译、文本智能纠错、NL2SQL问答以及ChatGPT大语言模型等。知识图谱技术主要包括知识图谱构建和知识图谱问答等。本书将理论介绍和实践相结合,详细阐述各个技术主题的
    苏海波 刘译璟 易显维 苏萌计算机21.6万字
  • 会员
    本书共3篇:第1篇主要介绍分布式数据库基础理论,包括经典的CAP理论、一致性算法相关的理论、并发控制相关的理论等;第2篇具体介绍Greenplum数据库,从分布式事务、分布式计算和分布式存储3个方面,深入代码层级,讲述分布式理论在工业上的实现;第3篇是总结和展望,介绍云原生数据库和新技术带给Greenplum和数据库管理系统的机遇和挑战。本书打破以理论介绍和架构介绍为主的思路,深入分析工业化的实现
    王凤刚计算机7.1万字

同类书籍最近更新

  • 会员
    《从运维菜鸟到大咖,你还有多远:数据中心设施运维指南》自2016年面世后,得到行业的高度认可。本书作为《从运维菜鸟到大咖,你还有多远:数据中心设施运维指南》的续集,分享行业同仁在企业级数据中心设施的风险评估、规划、建设管理、测试验证方面的经验和教训。本书由业内专家合力编写,并延续了小说体的风格,可阅读性强,使从业人员有很强的带入感,让读者既提升理论知识,也获得更多现场经验。
    程小丹等数据库13.1万字
  • 会员
    本书以实际的学生竞赛项目管理系统为案例依托,从MySQL数据库的相关概念及理论知识出发,介绍系统需求分析、数据库设计与实施、数据库管理与优化等内容,最终实现学生竞赛项目管理系统的设计、开发、部署和运行。全书以项目为单元,共分为9个项目,28个子任务。项目一为数据库的设计,项目二为MySQL数据库,项目三为数据库的管理,项目四为数据表的管理,项目五为数据查询,项目六为数据库编程,项目七为数据库索引与
    冯天亮数据库7.3万字
  • 会员
    《Access数据库创建、使用与管理从新手到高手》详细介绍了使用Access创建和设计数据库的方法和技巧,以及Access数据库在实际中的应用。《Access数据库创建、使用与管理从新手到高手》各章的先后顺序以数据库系统的创建和设计流程进行组织,有助于读者梳理Access知识体系,便于读者学习和理解。《Access数据库创建、使用与管理从新手到高手》包含大量示例,示例文件包括操作前的原始文件和操作
    宋翔编著数据库12.2万字
  • 会员
    本书是主教材《Access2010数据库程序设计》(邵敏敏、董保莲、张楠主编,中国铁道出版社出版)的配套实验教材。本书内容包含课程实验指导与全国计算机等级考试指导两部分。课程实验指导主要内容是与主教材同步的实验以及全国计算机等级考试真题练习与解析,全国计算机等级考试指导主要包括全国计算机等级二级(Access数据库程序设计)考试介绍以及模拟试题与解析。本书内容丰富,覆盖面广,有利于学生巩固所学的知
    张权 刘娟娟数据库8.4万字
  • 会员
    本书是国家级精品课程《计算机基础(文科)》的配套教材和西北大学211建设成果,据最新计算机等级考试的规范《二级Access数据库程序设计考试大纲》进行编写,书中涉及的内容覆盖了大纲的所有知识点。内容由数据库基础和基于Access应用两大部分组成,通过引例,循序渐进地介绍了数据库的设计、建立与使用方法,能够让读者在很短的时间内掌握Access数据库程序设计。本书配备完整的教学资源,包括:课程网站,实
    董卫军 邢为民 索琦编著数据库16.2万字
  • 会员
    全书共5章,包含33个应用案例。第1~3章属于计算机基础知识应用篇,介绍了Windows、Word、Excel软件的使用方法。第4章属于大数据技术应用篇,介绍了WebScraper、Access、MySQL以及MongoDB软件的使用方法。第5章为计算思维与程序设计应用篇,介绍了算法流程图绘制方法、程序设计、运行与调试等应用技巧。本书中案例由浅入深,操作步骤详尽,语言通俗易懂。
    李小航 凌云 黄蔚数据库12.7万字