-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
深度學習
-
>
Unreal Engine 4藍圖完全學習教程
-
>
深入理解計算機系統-原書第3版
-
>
Word/Excel PPT 2013辦公應用從入門到精通-(附贈1DVD.含語音視頻教學+辦公模板+PDF電子書)
=特異群組挖掘/國之重器出版工程 版權信息
- ISBN:9787115543264
- 條形碼:9787115543264 ; 978-7-115-54326-4
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
=特異群組挖掘/國之重器出版工程 本書特色
1.原創性:特異群組挖掘是作者原創的概念,是原創的新型數據挖掘任務和解決方法。2.受眾廣泛性:特異群組挖掘是一種有多種應用場景的數據挖掘技術,涉及讀者面廣泛。 3.權威性:本書作者朱揚勇教授在數據挖掘領域已經研究了30多年,是國際數據科學研究的主要倡導者之一。經上海市科學技術委員會批準,代領團隊建設了上海市數據科學重點實驗室,該實驗室是全國*早研究數據科學和大數據的科研機構之一,也是**政府支持的數據科學科研機構,積累了大量的數據和數據挖掘的經驗。此外,朱揚勇教授與多地政府合作,并擔任2018年在福州舉辦的“首屆數字中國建設峰會”顧問專家,2019年重慶智博會顧問專家等職務。基于作者團隊雄厚的知識儲備,本書兼具新穎性和權威性。
=特異群組挖掘/國之重器出版工程 內容簡介
高價值、低密度是大數據的特征,挖掘高價值、低密度的數據對象是大數據的一項重要工作。特異群組是一類高價值、低密度的數據形態,是指在眾多行為對象中,少數對象群體具有一定數量的相同(或相似)的行為模式,表現出相異于大多數對象而形成的異常的群組。特異群組挖掘在證券金融、醫療保險、智能交通、社會網絡和生命科學研究等領域具有重要的應用價值。對特異群組挖掘的研究代表了數據挖掘從淺層到深層的發展趨勢和必要性。 本書系統地闡述了特異群組挖掘任務,包括介紹了特異群組挖掘的概念,分析了特異群組挖掘任務與聚類、異常等任務之間的差異,給出了特異群組挖掘任務的相關算法,并且列舉了特異群組挖掘的幾個重點應用。本書適合大數據研究人員、大數據工程師、大數據應用分析師、大數據產業從業人員等閱讀,也可作為數據科學、大數據專業本科生和研究生的教學用書。
=特異群組挖掘/國之重器出版工程 目錄
第 1章 緒論 1
1.1 大數據 2
1.2 大數據挖掘 3
1.3 特異群組挖掘任務 6
1.4 小結 8
參考文獻 9
第 2章 為什么需要特異群組挖掘 11
2.1 聚類 12
2.2 異常檢測 13
2.3 圖數據上的異常挖掘 20
2.4 特異群組挖掘 28
2.5 特異群組挖掘與其他任務間的關系 31
2.6 小結 33
參考文獻 33
第3章 特異群組挖掘的應用 45
3.1 證券市場操縱行為挖掘 46
3.2 醫療保險中的保費欺詐行為挖掘 48
3.3 有組織犯罪行為挖掘 50
3.4 金融風控中團伙欺詐檢測 51
3.5 生命科學研究中的特異群組挖掘 52
3.6 流行病學調查中的密切接觸者發現 53
3.7 其他應用場景 53
3.8 小結 54
參考文獻 55
第4章 特異群組挖掘原理與框架 59
4.1 特異群組挖掘形式化描述 60
4.2 特異群組挖掘框架算法 63
4.3 實驗與結果分析 66
4.4 特異群組挖掘應用步驟 67
4.5 小結 68
參考文獻 69
第5章 相似性與相似性連接 71
5.1 相似性 72
5.2 相似性連接 74
5.3 相似性搜索中的索引結構 77
5.4 異質網絡上的自相似性連接 79
5.4.1 異質信息網絡 79
5.4.2 異質網絡上的相似性度量 83
5.4.3 基于路徑的自相似性連接 83
5.5 實驗與結果分析 90
5.5.1 效率分析 91
5.5.2 有效性分析 95
5.5.3 Topk相似連接示例 98
5.6 小結 101
參考文獻 101
第6章 無監督的復雜行為數據表示學習 107
6.1 行為數據 108
6.2 表示學習 110
6.2.1 詞嵌入模型 110
6.2.2 圖嵌入模型 112
6.2.3 異質網絡表示學習 116
6.2.4 知識圖譜表示學習 117
6.2.5 用戶-商品對表示學習 117
6.3 基于交互圖嵌入的復雜行為數據表示學習 118
6.3.1 交互圖定義 118
6.3.2 無屬性交互圖嵌入 122
6.3.3 IGE模型 124
6.4 實驗與結果分析 129
6.4.1 實驗描述 129
6.4.2 實驗結果分析 131
6.5 IGE算法在證券投資行為分析中的應用 135
6.6 小結 139
參考文獻 139
第7章 半監督的復雜行為數據表示學習 147
7.1 圖半監督學習 148
7.2 問題定義 150
7.3 算法模型 151
7.4 實驗與結果分析 153
7.4.1 實驗描述 153
7.4.2 實驗結果分析 154
7.5 小結 157
參考文獻 157
第8章 半監督群組檢測 159
8.1 群組檢測 160
8.2 問題定義 162
8.3 算法模型 163
8.3.1 判別器 163
8.3.2 生成器 164
8.3.3 預訓練與強制教學 166
8.3.4 群組生成 167
8.4 實驗與結果分析 168
8.4.1 實驗描述 168
8.4.2 實驗結果分析 169
8.5 小結 170
參考文獻 170
第9章 增量復雜行為數據特征分析 173
9.1 問題定義 174
9.2 增量復雜行為數據特征表示算法 175
9.2.1 日交易記錄編碼 175
9.2.2 預測編碼 177
9.2.3 生成式對抗網絡 177
9.2.4 特征向量表示 178
9.3 方法應用與實驗分析:游資賬戶識別 179
9.3.1 業務問題定義 179
9.3.2 數據來源與預處理 181
9.3.3 游資賬戶識別 183
9.3.4 游資賬戶聚類 184
9.4 小結 185
參考文獻 185
第 10章 面向動態圖的節點表示學習 187
10.1 動態網絡節點嵌入 188
10.1.1 靜態網絡節點嵌入方法 190
10.1.2 單向量節點嵌入表示方法 191
10.1.3 多向量節點嵌入表示方法 192
10.1.4 函數式節點嵌入表示方法 193
10.2 問題定義 194
10.3 DynGraphGAN算法 195
10.3.1 生成器 197
10.3.2 判別器 198
10.3.3 算法細節 200
10.4 實驗與結果分析 201
10.4.1 數據集 201
10.4.2 基準算法 202
10.4.3 評估任務 203
10.4.4 鏈路重構和鏈路預測分析 204
10.4.5 參數敏感性分析 207
10.5 小結 209
參考文獻 209
第 11章 多源網絡對齊 213
11.1 多源數據網絡 214
11.2 問題定義 216
11.3 HGANE算法 217
11.3.1 層次圖注意機制 217
11.3.2 對齊網絡表示 220
11.3.3 面向協同鏈接預測的網絡表示框架 222
11.4 實驗與結果分析 223
11.4.1 數據集 223
11.4.2 對比方法 224
11.4.3 實驗設置 225
11.4.4 實驗結果 226
11.4.5 假設驗證 227
11.4.6 參數分析 228
11.5 小結 230
參考文獻 230
第 12章 總結與展望 233
12.1 總結 234
12.2 展望 236
=特異群組挖掘/國之重器出版工程 作者簡介
熊贇熊贇,復旦大學計算機科學技術學院教授、博士生導師,上海市數據科學重點實驗室副主任。研究興趣包括數據科學、數據挖掘和大數據處理。研究工作得到了國家自然科學基金、國家863計劃、國家科技支撐計劃、上海市科學技術委員會基金等資助,在TKDE、KDD、AAAI、ICDM、CIKM等數據領域國際權威期刊和會議上發表論文80余篇,擔任ACM Computing Surveys、TKDE、TKDD等國際期刊審稿人。在國內率先開展大數據和數據科學的研究工作,出版了數據科學專著《數據學》,提出了一類大數據形態——特異群組,提出了一批新型的大數據挖掘算法,這些算法已被應用于醫療、交通和金融等上海市大數據建設的重要領域。 朱揚勇朱揚勇,復旦大學計算機科學技術學院教授、學術委員會主任,上海市數據科學重點實驗室主任!洞髷祿菲诳敝骶帲髷祿䥇f同安全技術國家工程實驗室副理事長,中國自動化學會國防大數據專業委員會副主任,農業大數據產業技術創新戰略聯盟副理事長兼首席科學家。2004年開始從事數據科學研究,2008年提出數據資源保護和開發利用,2009年發表了數據科學論文Data Explosion, Data Nature and Dataology,并出版數據科學專著《數據學》。第462次香山科學會議“數據科學與大數據的理論問題探索”的執行主席!洞髷祿夹g與應用叢書》主編,《大數據資源》主編,大數據科普圖書《旖旎數據》作者。研究興趣包括數據科學和大數據技術,提出數據界(Data Nature)、數據學(Dataology)、數據身、數據自治、數據財政等概念,近期研究重點為數據真實性、數據財政、數據資產、數據自治與數據跨境等。
- >
【精裝繪本】畫給孩子的中國神話
- >
回憶愛瑪儂
- >
新文學天穹兩巨星--魯迅與胡適/紅燭學術叢書(紅燭學術叢書)
- >
李白與唐代文化
- >
我從未如此眷戀人間
- >
二體千字文
- >
名家帶你讀魯迅:故事新編
- >
莉莉和章魚