Python数据分析

数据山谷 2020-11-12 18:31:08
Python 分析 数据 据分析


Python数据分析

工欲善其事,必先利其器“,Python是目前为止做数据分析最常用的编程语言,我们可以站在巨人的肩膀上,高效完成数据分析。

我们首先来了解下Python的发展历史,Python语言诞生于20世纪80年代。由荷兰人Guido van Rossum开发完成。我们称Guido van Rossum为Python之父。值得一提的是Python这个名字的由来,Python有蟒蛇的意思,但Guido起这个名字完全和蟒蛇没有关系。当Guido在实现Python的时候,他还阅读了Monty Python's Flying Circus的剧本,这是来自一部来自20世纪70年代的BBC喜剧。Guido认为他需要一个简短、独特且略显神秘的名字,因此他决定将该语言称为Python。

Python1.0版本于1994年1月发布,这个版本的主要新功能是lambda, map, filter和reduce,但是Guido不喜欢这个版本。

六年半之后的2000年10月份,Python2.0发布了。这个版本的主要新功能是内存管理和循环检测垃圾收集器以及对Unicode的支持。然而,尤为重要的变化是开发的流程的改变,Python此时有了一个更透明的社区。

2008年的12月份,Python3.0发布了。Python3.x不向后兼容Python2.x,这意味着Python3.x可能无法运行Python2.x的代码。Python3代表着Python语言的未来。

今天的Python已经进入到了3,0时代,Python的社区也在蓬勃发展,当你提出一个有关的Python问题,几乎总是有人遇到了同样的问题并已经解决了。

Python语言的特点:

Python是完全面向对象的语言,函数、模块、数字、字符串都是对象,在 Python中一切皆对象。支持重载运算符,也支持泛型设计。

Python拥有一个强大的标准库,Python语言的核心只包含数字、字符串、列表、字典、文件等常见类型和函数,而由Python标准库提供了系统管理、网络通信、文本处理、数据库接口、图形系统、XML处理等额外的功能。

Python社区提供了大量的第三方模块,使用方式与标准库类似。它们的功能覆盖科学计算、人工智能、机器学习、Web开发、数据库接口、图形系统多个领域。

由于Python有强大的功能,使用方便,容易入手。我们经常听到人们说“人生苦短,我用Python”。调研机构 Tiobe 本周发布了 2020 年 10 月份的分析报告,Python语言连续两年蝉联第三。而在2020年11月的最新数据中,Python以势不可挡的趋势超越了Java成为了第二名。

选择一个适用的编程语言特别重要,Python语言具有简单,易学,速度快,免费开源,它专注于如何解决问题、自由开放的社区环境以及丰富的第三方库,无需浪费时间去造轮子:各种Web框架、爬虫框架、数据分析框架、机器学习框架应有尽有,拿来即用。从Python的受欢迎程度上看,一直呈上升趋势

我们现在要使用Python来做数据分析,主要从两个方面来考虑问题:

第一:选择什么开发工具。

第二:学习哪些知识来解决数据分析的问题。

开发工具我推荐使用Anaconda。具体软件可以在清华大学开源镜像网站中下载(https://mirror.tuna.tsinghua.edu.cn/help/anaconda/)根据自己使用的电脑的软硬件环境自行下载相应版本的安装包。安装完毕后再控制台输入 jupyter notebook即可。

本公众号中有详细的anaconda的安装流程,文章链接如下:

anaconda安装流程 大斌哥,公众号:数据山谷Python之Anaconda安装

数据分析使用Python中的知识点和常见的科学计算库也需要给大家列举出来:

基础语法:变量、数据类型、条件、循环。

数据结构:集合、元组、字典。

输入和输出

模块

科学计算库:NumPy,Pandas,Matplotlib,Seaborn。

Python做数据分析主要是解决数据清洗及数据可视化的问题,掌握Python基本的语法规则,会调用第三方模块对于提高数据分析能力非常重要。而NumPy和Pandas就是数据清洗最好用的工具,Matplotlib和Seaborn是解决数据可视化的工具包。我们可以从实用的角度来学习Python,提高数据分析的能力和效率。

本文分享自微信公众号 - 数据山谷(BigDataValley) ,作者:木易

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间: 2020-11-09

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

版权声明
本文为[数据山谷]所创,转载请带上原文链接,感谢
https://cloud.tencent.com/developer/article/1747126

  1. 利用Python爬虫获取招聘网站职位信息
  2. Using Python crawler to obtain job information of recruitment website
  3. Several highly rated Python libraries arrow, jsonpath, psutil and tenacity are recommended
  4. Python装饰器
  5. Python实现LDAP认证
  6. Python decorator
  7. Implementing LDAP authentication with Python
  8. Vscode configures Python development environment!
  9. In Python, how dare you say you can't log module? ️
  10. 我收藏的有关Python的电子书和资料
  11. python 中 lambda的一些tips
  12. python中字典的一些tips
  13. python 用生成器生成斐波那契数列
  14. python脚本转pyc踩了个坑。。。
  15. My collection of e-books and materials about Python
  16. Some tips of lambda in Python
  17. Some tips of dictionary in Python
  18. Using Python generator to generate Fibonacci sequence
  19. The conversion of Python script to PyC stepped on a pit...
  20. Python游戏开发,pygame模块,Python实现扫雷小游戏
  21. Python game development, pyGame module, python implementation of minesweeping games
  22. Python实用工具,email模块,Python实现邮件远程控制自己电脑
  23. Python utility, email module, python realizes mail remote control of its own computer
  24. 毫无头绪的自学Python,你可能连门槛都摸不到!【最佳学习路线】
  25. Python读取二进制文件代码方法解析
  26. Python字典的实现原理
  27. Without a clue, you may not even touch the threshold【 Best learning route]
  28. Parsing method of Python reading binary file code
  29. Implementation principle of Python dictionary
  30. You must know the function of pandas to parse JSON data - JSON_ normalize()
  31. Python实用案例,私人定制,Python自动化生成爱豆专属2021日历
  32. Python practical case, private customization, python automatic generation of Adu exclusive 2021 calendar
  33. 《Python实例》震惊了,用Python这么简单实现了聊天系统的脏话,广告检测
  34. "Python instance" was shocked and realized the dirty words and advertisement detection of the chat system in Python
  35. Convolutional neural network processing sequence for Python deep learning
  36. Python data structure and algorithm (1) -- enum type enum
  37. 超全大厂算法岗百问百答(推荐系统/机器学习/深度学习/C++/Spark/python)
  38. 【Python进阶】你真的明白NumPy中的ndarray吗?
  39. All questions and answers for algorithm posts of super large factories (recommended system / machine learning / deep learning / C + + / spark / Python)
  40. [advanced Python] do you really understand ndarray in numpy?
  41. 【Python进阶】Python进阶专栏栏主自述:不忘初心,砥砺前行
  42. [advanced Python] Python advanced column main readme: never forget the original intention and forge ahead
  43. python垃圾回收和缓存管理
  44. java调用Python程序
  45. java调用Python程序
  46. Python常用函数有哪些?Python基础入门课程
  47. Python garbage collection and cache management
  48. Java calling Python program
  49. Java calling Python program
  50. What functions are commonly used in Python? Introduction to Python Basics
  51. Python basic knowledge
  52. Anaconda5.2 安装 Python 库(MySQLdb)的方法
  53. Python实现对脑电数据情绪分析
  54. Anaconda 5.2 method of installing Python Library (mysqldb)
  55. Python implements emotion analysis of EEG data
  56. Master some advanced usage of Python in 30 seconds, which makes others envy it
  57. python爬取百度图片并对图片做一系列处理
  58. Python crawls Baidu pictures and does a series of processing on them
  59. python链接mysql数据库
  60. Python link MySQL database