国产精品一久久香蕉产线看/亚洲图区欧美/亚洲国产精品电影人久久网站/欧美日韩在线视频一区

歡迎光臨中圖網 請 | 注冊

包郵 大數據技術

出版社:上海科學技術出版社出版時間:2023-04-01
開本: 16開 頁數: 324
中 圖 價:¥69.4(5.9折) 定價  ¥118.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

大數據技術 版權信息

  • ISBN:9787547860984
  • 條形碼:9787547860984 ; 978-7-5478-6098-4
  • 裝幀:70g膠版紙
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>

大數據技術 本書特色

適讀人群 :數據科學與大數據技術學科專業的高等院校師生,從事各個領域大數據和數字化轉型的工程技術人員1. 概況 數據、技術、應用,大數據三要素。信息化技術是生產數據的技術,大數據技術則是開發數據的技術。本書完整地介紹了數據開發利用的技術體系,包括大數據計算、管理、安全、可視化、流通、挖掘分析等一系列技術。 2.特色 (1)全面介紹了數據開發利用技術,還特別對數據產品生產技術進行了闡述,這是數據開發利用過程的必然選擇,也是數據市場建設發展的必然選擇。 (2)針對數字經濟發展提供了系統性的數據開發利用技術知識。

大數據技術 內容簡介

本書系統地介紹大數據的概念、原理、技術和應用。內容包括認識和理解大數據;大數據的相關技術(大數據獲取技術、大數據存儲管理技術和大數據可視化技術等);大數據計算框架;大數據挖掘任務(關聯分析、聚類分析、分類分析、演變分析、特異群組分析和異常分析);大數據應用實現;大數據挖掘工具等。本書對大數據技術進行了全面而細致的定義和歸納,并將向讀者展現該領域近期新研究熱點和技術。關于大數據應用實現章節的內容將采用本套叢書編委們實際主持和完成的大數據項目為實際案例,闡述大數據應用實現過程中的問題、解決方案和取得的成果。

大數據技術 目錄

第1章 緒論 1

1.1 大數據的技術挑戰 1

1.1.1 大數據的"大"1

1.1.2 數據"大"的技術挑戰 3

1.1.3 大數據決策的技術挑戰 5

1.1.4 數據安全的技術問題 7

1.2 大數據計算 8

1.2.1 大數據文件 9

1.2.2 大數據計算框架 10

1.2.3 大數據管理 11

1.3 數據開發 12

1.3.1 數據獲取 12

1.3.2 數據分析 13

1.3.3 數據可視化 14

1.4 數據產業支持 15

1.4.1 數據產業需要的技術支持 15

1.4.2 數據資產化 16

1.4.3 數據產品及其質量 17

1.4.4 數據流通與安全 18

1.5 小結 19

參考文獻 19


第 2章 大數據計算 21

2.1 數據訪問21

2.1.1 安全模型 21

2.1.2 訪問控制策略 23

2.1.3 訪問控制與授權 24

2.1.4 訪問控制與審計 24

2.2 分布式文件系統 24

2.2.1 GoogleFS 25

2.2.2 HDFS 27

2.2.3 GlusterFS 28

2.2.4 CephFS 29

2.3 大數據計算框架 30

2.3.1 批處理 30

2.3.2 流數據計算 38

2.3.3 增量計算模型 41

2.3.4 新興計算框架 44

2.3.5 大數據計算框架的發展 46

2.4 多地計算異地計算模式 48

2.4.1 概念48

2.4.2 計算模型 49

2.4.3 特點 49 2.5 小結 49

參考文獻 49


第 3章 大數據管理 51

3.1 概述 51

3.2 分布式文件系統 HDFS 52

3.2.1 前提和設計目標 53

3.2.2 數據塊 53

3.2.3 HDFS架構 54

3.2.4 HDFS容錯機制 54

3.3 列式存儲格式 Parquet 55

3.3.1 行存儲與列存儲文件格式 55

3.3.2 Parquet 概述 56

3.3.3 數據模型 56

3.3.4 Parquet 文件的存儲格式 57

3.4 NOSOL 58

3.4.1 鍵值對數據庫 58

3.4.2 基于列族的數據庫 59

3.4.3 基于文檔的數據庫 59

3.4.4 基于圖的數據庫 60

3.5 鍵值數據庫 Redis 60

3.5.1 Redis簡介 60

3.5.2 Redis數據類型 61 3.5.3 Redis事務 63

3.5.4 Redis 持久化機制 63

3.6 HBase 63

3.6.1 HBase簡介 63

3.6.2 HBase訪問接口 64

3.6.3 HBase數據模型 64

3.6.4 HBase系統架構 65

3.6.5 HBase存儲格式 66

3.7 Dynamo67

3.7.1 Dynamo系統設計假設和前提 67

3.7.2 Dynamo數據分布策略 68

3.7.3 CAP原理 68

3.7.4 Dynamo 的一致性實現技術 69

3.7.5 Dynamo系統訪問接口 69

3.8 Cassandra 69

3.9 MongoDB 70

3.9.1 MongoDB簡介 70

3.9.2 MongoDB數據模型70

3.9.3 MongoDB基礎操作71

3.9.4 MongoDB聚集操作 73

3.9.5 MongoDB復制機制75

3.9.6 MongoDB分片機制 76

3.10 Neo4j 76

3.10.1 Neo4j簡介 76

3.10.2 Neo4j基礎概念 77

3.10.3 NeO4j的Cypher查詢語言和模式 78

......


展開全部

大數據技術 作者簡介

朱揚勇,復旦大學計算機科學技術學院教授、學術委員會主任,上海市數據科學重點實驗室主任,上海市政府信息化專家委員會專家,中國計算機學會大數據專家委員會專家,美國馬里蘭大學客座教授。從事數據領域研究25年,是很早一批從事數據挖掘研究的學者,是數據科學研究的主要倡導者之一。主持過國家自然科學基金、國家863計劃項目、上海市科委重點等多項數據挖掘領域的研究課題,曾獲上海市科技進步一、二、三等獎。相關研究成果在具有影響力的外期刊或會議上發表論文100余篇,出版專著2本,教材3本。2009年發表了數據科學論文Data Explosion, Data Nature 等。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服