Python數據分析 版權信息
- ISBN:9787115411228
- 條形碼:9787115411228 ; 978-7-115-41122-8
- 裝幀:暫無
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
Python數據分析 本書特色
作為一種高級程序設計語言,python憑借其簡潔、易讀及可擴展性日漸成為程序設計領域備受推崇的語言。同時,python語言的數據分析功能也逐漸為大眾所認可。
本書是一本介紹如何用python進行數據分析的學習指南。全書共12章,從python程序庫入門、numpy數組、matplotlib和pandas開始,陸續介紹了數據加工、數據處理和數據可視化等內容。同時,本書還介紹了信號處理、數據庫、文本分析、機器學習、互操作性和性能優化等高級主題。在本書的結尾,還采用3個附錄的形式為讀者補充了一些重要概念、常用函數以及在線資源等重要內容。
本書示例豐富、簡單易懂,非常適合對python語言感興趣或者想要使用python語言進行數據分析的讀者參考閱讀。
Python數據分析 內容簡介
實用的python開源模塊的大集合;
簡單易懂、示例豐富的數據分析教程;
掌握數據可視化、機器學習等高端主題;
新手變身數據分析專家的上好讀本;
Python數據分析 目錄
目錄第1章 python程序庫入門 11.1 本書用到的軟件 21.1.1 軟件的安裝和設置 21.1.2 windows平臺 21.1.3 linux平臺 31.1.4 mac os x平臺 41.2 從源代碼安裝numpy、scipy、matplotlib和ipython 61.3 用setuptools安裝 71.4 numpy數組 71.5 一個簡單的應用 81.6 將ipython用作shell 111.7 學習手冊頁 131.8 ipython notebook 141.9 從何處尋求幫助和參考資料 141.10 小結 15第2章 numpy數組 162.1 numpy數組對象 162.2 創建多維數組 182.3 選擇numpy數組元素 182.4 numpy的數值類型 192.4.1 數據類型對象 212.4.2 字符碼 212.4.3 dtype構造函數 222.4.4 dtype屬性 232.5 一維數組的切片與索引 232.6 處理數組形狀 242.6.1 堆疊數組 272.6.2 拆分numpy數組 302.6.3 numpy數組的屬性 332.6.4 數組的轉換 392.7 創建數組的視圖和拷貝 402.8 花式索引 412.9 基于位置列表的索引方法 432.10 用布爾型變量索引numpy數組 442.11 numpy數組的廣播 462.12 小結 49第3章 統計學與線性代數 503.1 numpy和scipy模塊 503.2 用numpy進行簡單的描述性統計計算 553.3 用numpy進行線性代數運算 573.3.1 用numpy求矩陣的逆 573.3.2 用numpy解線性方程組 593.4 用numpy計算特征值和特征向量 613.5 numpy隨機數 633.5.1 用二項式分布進行博弈 633.5.2 正態分布采樣 663.5.3 用scipy進行正態檢驗 673.6 創建掩碼式numpy數組 703.7 小結 75第4章 pandas入門 764.1 pandas的安裝與概覽 774.2 pandas數據結構之dataframe 784.3 pandas數據結構之series 814.4 利用pandas查詢數據 854.5 利用pandas的dataframe進行統計計算 894.6 利用pandas的dataframe實現數據聚合 914.7 dataframe的串聯與附加操作 954.8 連接dataframes 964.9 處理缺失數據問題 994.10 處理日期數據 1024.11 數據透視表 1064.12 訪問遠程數據 1074.13 小結 109第5章 數據的檢索、加工與存儲 1105.1 利用numpy和pandas對csv文件進行寫操作 1105.2 numpy.npy與pandas dataframe 1125.3 使用pytables存儲數據 1155.4 pandas dataframe與hdf5倉庫之間的讀寫操作 1185.5 使用pandas讀寫excel文件 1205.6 使用rest web服務和json 1235.7 使用pandas讀寫json 1245.8 解析rss和atom訂閱 1265.9 使用beautiful soup解析html 1275.10 小結 134第6章 數據可視化 1366.1 matplotlib的子庫 1376.2 matplotlib繪圖入門 1376.3 對數圖 1396.4 散點圖 1416.5 圖例和注解 1436.6 三維圖 1456.7 pandas繪圖 1486.8 時滯圖 1506.9 自相關圖 1516.10 plot.ly 1536.11 小結 155第7章 信號處理與時間序列 1567.1 statsmodels子庫 1577.2 移動平均值 1577.3 窗口函數 1597.4 協整的定義 1617.5 自相關 1647.6 自回歸模型 1667.7 arma模型 1707.8 生成周期信號 1727.9 傅里葉分析 1747.10 譜分析 1777.11 濾波 1777.12 小結 179第8章 應用數據庫 1808.1 基于sqlite3的輕量級訪問 1818.2 通過pandas訪問數據庫 1838.3 sqlalchemy 1858.3.1 sqlalchemy的安裝和配置 1868.3.2 通過sqlalchemy填充數據庫 1888.3.3 通過sqlalchemy查詢數據庫 1898.4 pony orm 1918.5 dataset:懶人數據庫 1928.6 pymongo與mongodb 1958.7 利用redis存儲數據 1968.8 apache cassandra 1978.9 小結 201第9章 分析文本數據和社交媒體 2039.1 安裝nltk 2039.2 濾除停用字、姓名和數字 2069.3 詞袋模型 2089.4 詞頻分析 2099.5 樸素貝葉斯分類 2119.6 情感分析 2149.7 創建詞云 2179.8 社交網絡分析 2229.9 小結 224第10章 預測性分析與機器學習 22510.1 scikit-learn概貌 22610.2 預處理 22810.3 基于邏輯回歸的分類 23010.4 基于支持向量機的分類 23210.5 基于elasticnetcv的回歸分析 23510.6 支持向量回歸 23710.7 基于相似性傳播算法的聚類分析 24010.8 均值漂移算法 24210.9 遺傳算法 24410.10 神經網絡 24910.11 決策樹 25110.12 小結 253第11章 python生態系統的外部環境和云計算 25511.1 與matlab/octave交換信息 25611.2 installing rpy2安裝rpy2 25711.3 連接r 25711.4 為java傳遞numpy數組 26011.5 集成swig和numpy 26111.6 集成boost和python 26411.7 通過f2py使用fortran代碼 26611.8 配置谷歌應用引擎 26711.9 在pythonanywhere上運行程序 26911.10 使用wakari 27011.11 小結 271第12章 性能優化、性能分析與并發性 27212.1 代碼的性能分析 27212.2 安裝cython 27712.3 調用c代碼 28112.4 利用multiprocessing創建進程池 28312.5 通過joblib提高for循環的并發性 28612.6 比較bottleneck函數與numpy函數 28712.7 通過jug實現mapreduce 28912.8 安裝mpi for python 29212.9 ipython parallel 29212.10 小結 296附錄a 重要概念 298附錄b 常用函數 303附錄c 在線資源 309
展開全部
Python數據分析 相關資料
本書從一系列開源的python模塊講起,介紹了很多實用的有關數據檢索、清晰、操作、可視化等知識。同時,還涉及信號處理、預測性分析、機器學習等高端主題。非常適合想要深入學習并使用python進行數據分析的讀者,無論是新手還是有一定python使用基礎的讀者,都將快速成為一名數據分析專家。
Python數據分析 作者簡介
Ivan Idris,實驗物理學碩士,學位論文側重于應用計算機科學。畢業后,他曾經效力于多家公司,從事Java開發、數據倉庫開發以及QA分析等方面的工作;目前,他的興趣主要集中在商業智能、大數據和云計算等專業領域。
Ivan Idris以編寫簡潔可測試的程序代碼以及撰寫有趣的技術文章為樂,同時也是Packt出版社NumPy Beginner's Guide-Second Edition、NumPy Cookbook和Learning NumPy Array等書籍的作者。讀者可以訪問ivanidris.net獲取更多關于他的信息。