博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
利用python做数据分析 札记(一)
阅读量:6153 次
发布时间:2019-06-21

本文共 677 字,大约阅读时间需要 2 分钟。

这里写图片描述

因为自己对商业非常感兴趣,最近听了好多关大数据、BI等数据挖掘的讲座,很感兴趣,结合自己的技术背景与兴趣,志在讲自己的后半生布道在python,大数据、数据挖掘的路上。

故心血来潮的想回顾一下python,并自学一下python的数据挖掘功能,作为笔记供自己参考并分享给大家。

因为工作的关系之前一直用eclipse做python的IDE开发环境,最近潜心数据挖掘,发现好多任用IPython和Anaconda故下载玩了下,确实比分别安装python和各种插件要简单的多,很适合懒人以及入门。

废话少说,进入正题。先来介绍几个python做数据分析的几个重要的名词。拍砖引玉,不懂得可以问谷哥度娘。

  • NumPy库. 提供快速高效的数组对象,线性代数运算,随机数生成等、它在数据分析方面还有一个主要作用是作为算法之间传递数据的容器。对于数值型数据,NumPy数组在存储和处理数据是要比内置的python数据结构高效的多。
  • Pandas库. 用的最多的pandas对象是DataFrame,它是面向列的二维表结构,能很方便的处理excel和关系型数据库
  • matplotlib库. 强大的绘图库
  • SciPy是一组专门解决科学计算中各种标准问题域的包的集合.
    • scipy.integrate: 数值积分和微分方程求解器
    • scipy.signal: 信号处理工具
    • scipy.stats: 标准连续喝离散概率分布、各种统计检验方法以及更好的描述统计法等
  • Ipython: 交互式计算和开发环境。

Windows安装最懒得做法是下载Anaconda,然后万事okay

你可能感兴趣的文章
C++求集合的交集差集
查看>>
execnet: rapid multi-Python deployment
查看>>
windows修改3389端口
查看>>
关于JavaScript词法
查看>>
FreeSwitch中的会议功能(4)
查看>>
【转】adns解析库——域名解析实例(C++、linux)
查看>>
通过Performance Log确定磁盘有性能问题?
查看>>
HDOJ 2828 Lamp DLX反复覆盖
查看>>
Node.js 读取博客首页并获得文章标题
查看>>
四道微软面试经典算法题
查看>>
NYOJ-138 找球号(二)
查看>>
sql 语言
查看>>
前端小知识--从Javascript闭包看let
查看>>
Vue中配合clipboard.js实现点击按钮复制内容到剪切板
查看>>
Wepback + koa2 配置开发环境
查看>>
图片框住一个小视频 谈css padding百分比自适应
查看>>
【CSS 学习】CSS 选择器、选择器的优先级和权重
查看>>
js 创建对象的几种方式
查看>>
Node.js 开发指南 读书笔记
查看>>
一种基于AliOS Things的uData感知设备软件框架
查看>>