高手问答第 215 期 —— 如何使用 Python 进行数据分析与挖掘? - 开源中国

关于数据分析的Python库,这里重点介绍几个工作中常用的。包括numpy模块(用于矩阵运算、随机数的生成等)、pandas模块(用于数据的读取、清洗、整理、运算、可视化等)、matplotlib模块(专用于数据可视化,当然含有统计类的seaborn模块)、statsmodels模块(用于构建统计模型,如线性回归、岭回归、逻辑回归、主成分分析等)、scipy模块(专用于统计中的各种假设检验,如卡方检验、相关系数检验、正态性检验、t检验、F检验等)、sklearn模块(专用于机器学习,包含了常规的数据挖掘算法,如决策树、森林树、提升树、贝叶斯、K近邻、SVM、GBDT、Kmeans等)。


Original url: Access
Created at: 2018-10-31 10:33:56
Category: default
Tags: none

请先后发表评论
  • 最新评论
  • 总共0条评论