选择python进行数据分析的理由和优势
1、python大量的库为数据分析提供了完整的工具集
2、比起MATLAB、R语言等其他主要用于数据分析语言,python语言功能更加健全
3、python库一直在增加,算法的实现采取的方法更加创新
4、python能很方便的对接其他语言,比如c、java等
什么是IPython?
IPython是一个python的交互式的shell(它默认的pythonshell要好用的多、强大的多)
1、支持代码的自动补全、自动缩进,已经支持bashshell
2、JupyterNoteBook(以前称为IPythonNoteBook),它提供了一个用户和IPython内核交互的一个界面,同时它又是一个交互式的笔记本(可以保存你的源代码、运行结果),集文本(markdown)、代码、图像、公式与一体的python的web界面
3、支持交互式数据可视化与其他图形用户界面
4、支持高性能的并行计算
运行环境
数据分析以及机器学习都有许许多多的程序库,这些程序库(比如:numpy、pandas、sckilearn、TensorFlow等),如果我们单独去配置安装比较麻烦,而且有的程序包(如:scipy)依赖的库比较多;官方提供了一个集成的数据分析、机器学习的开发工具,即anaconda安装:官网下载最新版,windows下安装就行
打开:
方式一、用命令
用cmd命令行或者linux终端嵌入命令:jupyternotebook将会运行起来两个程序:IPython的服务程序和jupyternotebook的web界面,然后代码就可以在界面中写
注意】IPython服务端是程序运行的地方,jupyternotebook仅仅提供了一个交互界面,如果你把IPython的服务程序关掉(终端中ctrl+c)jupyternotebook就没什么用了
几个基本操作:
双击D:删除当前的cell
单击M:将当前cell转成markdown文档
jupyter构造:由一个个的cell构成,每个cell的执行时互不影响的,但是数据是共享的
方式二、用anaconda界面打开
方式三、用pycharm打开
【注意】编译器一定要选择anaconda目录下的python编译器,不然无法打开IPython的服务程序