学习Anaconda一定要了解这几件事

Python大数据分析

共 2524字,需浏览 6分钟

 ·

2020-11-02 06:55

点击上方"蓝字"关注我们





Python大数据分析


记录   分享   成长

Anaconda是数据科学利器,它的优势之处在于小白也能快速上手。

我们知道Python的英文表达是蟒蛇,有意思的是anaconda也是蟒蛇的意思,准确是是水莽,莽中之王,更大、更重、更长。

按这层意思理解,anaconda是python的大码款,倒也是有些贴切的。

Anaconda知多少

回到编程,Anaconda对于初学Python的人很友好,一键安装,不必费心配置python环境,也不用安装各种常用的库,就可以直接入手使用。对于数据科学来说,Anaconda是一个百宝箱式的存在。

Anaconda是一个免费开源的Python和R语言的发行版本,用于计算科学(数据科学、机器学习、大数据处理和预测分析),Anaconda致力于简化包管理和部署。

Anaconda的包使用软件包管理系统Conda进行管理。超过1200万人使用Anaconda发行版本,并且Anaconda拥有超过1400个适用于Windows、Linux和MacOS的数据科学软件包。

「总结Anaconda的三大特点:」

  1. 内置python,高度集成python数据科学生态

  2. 拥有强大的包管理工具-conda

  3. 可用超过600个python数据科学库

Anaconda拥有个人版、商业版、团队版、企业版,除个人版不收费外,其他版本都需要付费,

当然对大部分人来说个人版已经完全够用。和python一样,Anaconda不挑平台,在windows、os、linux上都可以用,目前支持python3.8版本的下载 ,下载完成后一路next就能完成安装。

官网:

Anaconda | The World's Most Popular Data Science Platform[1]

下载地址:

Anaconda | Individual Edition[2]

安装教程:

Installation - Anaconda documentation[3]

学习文档:

Anaconda Documentation[4]

Anaconda能做什么?

前面说过Anaconda是一个python数据科学百宝箱,所以它的作用就是燃爆数据科学,让小白也可以轻松玩数据。

你可以利用Anaconda研究数据处理、数据建模、机器学习、神经网络、自然语言处理、可视化展示、教学等等。既能一人独秀,也可以团队作战。

神奇的conda

说说conda,这是Anaconda的杀手锏。

Conda是一个开源、跨平台和语言无关的软件包管理和系统管理系统,通过Conda可安装、升级和升级软件包依赖。Conda为Python程序创造,但是它可以打包、分发任意语言编写的软件(例如R语言)和包含多语言的项目。

conda和pip都可以管理python库,但最大的不同在于conda是跨平台且不限语言的,而且可以独自创建虚拟环境。因为conda立足于数据科学生态,不像pip可以安装几乎所有的python库(来自pypl),conda只能安装anaconda里支持的数据科学库(600多个)。

主要的数据科学内置库包括pandas、numpy、matplotlib、jupyter、scipy、ipython、nltk、notebook、sikit-learn、seaborn、xlrd、xlwt......

一般把这些数据科学库分为四大类:基础库(jupyter、pandas、numpy、scipy),机器学习库(keras、tensorflow、pytorch、sikit-learn、nltk),可视化库(matplotlib、seaborn、plotly)、拓展计算库(numba、dask、pyspark)

这些库可以通过conda安装,也可以在GUI界面Navigator上点击安装或更新。

有兴趣可以去官网看看这些神奇的家伙:Anaconda库大全[5]

附conda文档:Conda - Conda documentation[6]

Anaconda其他优秀特性

  • 拥有界面化的应用程序及包管理应用-Navigator
  • 支持R语言

Anaconda不仅适用于Python,还支持R,使用conda安装R并管理R包

  • 学习社区

Anaconda的缺点

Anaconda的优点也是它的缺点,功能太齐全就显得很臃肿,一个安装包快500M,所以不少人去拥抱miniconda了。

但无论如何,Anaconda都是python数据科学最好的伙伴。

Reference

[1]

Anaconda | The World's Most Popular Data Science Platform: https://www.anaconda.com/

[2]

Anaconda | Individual Edition: https://www.anaconda.com/products/individual

[3]

Installation - Anaconda documentation: https://docs.anaconda.com/anaconda/install/

[4]

Anaconda Documentation: https://docs.anaconda.com/

[5]

Anaconda库大全: https://docs.anaconda.com/anaconda/packages/py3.7_win-64/

[6]

Conda - Conda documentation: https://docs.conda.io/en/latest/


· 往期精选 ·
1

多快好省地使用pandas分析大型数据集

2

关于OLAP数仓,从百万到百亿级数据量实时分析

3

3000字!5大SQL数据清洗方法!




Python大数据分析

data creates value

扫码关注我们

浏览 55
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报