[pandas Learning note 01] puissant ensemble d'outils pour l'analyse de données structurées

Hang Seng Light Cloud Community 2021-11-25 20:06:14
pandas learning note puissant ensemble

Auteur:Fantastique.

Source::Hang SengLIGHTCommunauté du nuage

Fiche d'information

Lors de l'analyse quantitative,Une base de données volumineuse est toujours nécessaire,Exploiter les associations entre les données,Et finalement trouver les données dont nous avons besoin.Seulement parPythonL'analyse des données est très complexe,Y a - t - il des outils plus simples pour nous aider à analyser les données efficacement et rapidement??

Aujourd'hui.Pandas-Un puissant ensemble d'outils pour analyser des données structurées.

Cet article traite principalement de certaines questions Python Grammaire de base,Besoin d'apprendre Python Les élèves peuvent recharger le tutoriel dans la communauté(developer.hs.net/course/?nav…).

image-20211121200612284.png

Concepts de base

Pandas La bibliothèque est gratuite 、 Tiers Open Source Python Bibliothèque,- Oui. Python Un des outils indispensables à l'analyse des données ,Il est Python L'analyse des données offre une haute performance , Et une structure de données facile à utiliser ,C'est - à - dire: Series Et DataFrame.

Pandas La base d'utilisation est: Numpy( Fournir des opérations matricielles de haute performance ); Pour l'exploration et l'analyse des données ,La fonction de nettoyage des données est également disponible.

Pandas Kukiyu Python NumPy Développement de bibliothèques ,Donc,,Il peut Python La Bibliothèque de calcul scientifique de .

Pandas Depuis sa naissance, il a été utilisé dans de nombreux domaines ,Comme la finance.、Statistiques、Sciences sociales、 Travaux de construction, etc. .

Par l'introduction ci - dessus, Je suppose que tout le monde est d'accord PandasQu'est - ce que c'est?, Pour avoir une idée de base .pandas équivalent à python Moyenne excel: Il utilise des tableaux (C'est - à - dire dataframe), Capable de faire toutes sortes de transformations dans les données , Mais il y a beaucoup d'autres fonctions .

Structure des données

DataFrame

DataFrame Est une structure de données tabulaire,Il contient un ensemble ordonné de colonnes,Chaque colonne peut être un type de valeur différent(Valeur numérique、String、Valeur booléenne).DataFrame Index des lignes et des colonnes,Il peut être considéré comme étant Series Un dictionnaire composé de(Un index commun).

image-20211121202948923.png

DataFrame La méthode de construction est la suivante::

pandas.DataFrame( data, index, columns, dtype, copy)
Copier le Code

Description des paramètres:

  • data:Un ensemble de données(ndarray、series, map, lists, dict Isotype).
  • index:Valeur de l'index, Ou peut - être une étiquette de ligne .
  • columns:Étiquette de colonne,Par défaut RangeIndex (0, 1, 2, …, n) .
  • dtype:Type de données.
  • copy:Copier les données,Par défaut False.

Series

Series Comme une colonne dans un tableau (column), Comme un tableau unidimensionnel ,Vous pouvez enregistrer n'importe quel type de données.

image-20211121203109765.png

Series Par Index(index)Et la composition des colonnes,Les fonctions sont les suivantes:

pandas.Series( data, index, dtype, name, copy)
Copier le Code

Description des paramètres:

  • data:Un ensemble de données(ndarray Type).
  • index: Étiquette de l'index des données ,Si non spécifié,Par défaut à partir de 0 C'est parti..
  • dtype:Type de données, Par défaut, vous jugerez par vous - même .
  • name:Définir le nom.
  • copy:Copier les données,Par défaut False.

Vite!

Introduire des composants

Introduction Pandas Les composants de :

import pandas as pd
Copier le Code

Si elle n'est pas introduite , Indique qu'il y a un problème avec la configuration de l'environnement ou que vous n'avez pas téléchargé , Télécharger les composants de la manière suivante :

pip install Pandas
Copier le Code

SeriesOpération Objet

Adoption Series() Fonction pour créer Series Objet, Cet objet vous permet d'invoquer les méthodes et attributs correspondants :

import pandas as pd
import numpy as np
data = np.array(['a','b','c','d'])
s = pd.Series(data)
print (s)
Copier le Code

DataFrameOpération Objet

Adoption DataFrame() Le format syntaxique de l'objet créé est le suivant :

import pandas as pd
data = [1,2,3,4,5]
df = pd.DataFrame(data)
print(df)
Copier le Code

Lire les données du fichier

Peut passer read_csv() Fonction à local .csv Fichier format pour la lecture :

data = pd.read_csv('file.csv')
data = pd.read_csv('file.csv', nrows=1000, skiprows=[1,5], encoding= gbk)
Copier le Code

Signification des paramètres:

  • 'file.csv' : Indique la lecture du nom du fichier , La position du système peut être ajoutée pour la lecture
  • nrows : Indique le nombre de lignes de données avant la lecture
  • skiprows : Indique que le nombre de lignes non lues est automatiquement sauté lors de la lecture du fichier .
  • encoding : Indique le format d'encodage du fichier de lecture

Avec read_csv ,De la même façon, read_excel LireExcelDonnées du fichier.

Écrire les données du fichier

Pandas Fourni to_csv() Fonction utilisée pour DataFrame Convertir en CSV Données.Si tu veux mettre CSV Fichier d'écriture des données, Il suffit de passer un objet de fichier à la fonction .Sinon,CSV Les données seront retournées sous forme de chaîne .

data.to_csv(‘my_new_file.csv’, index=None)
Copier le Code

Signification des paramètres:

  • index : Indique si un index doit être ajouté , L'index est automatiquement ajouté par défaut

Avec to_csv ,De la même façon, to_excel ÉcrireExcelDonnées du fichier.

Résumé

Cet article présente principalement Pandas Les bases de l'ensemble d'outils ,Apprendre Pandas Peut nous aider à traiter et analyser rapidement les données , L'opération utilitaire sera mise à jour plus tard ,Attendez avec impatience..

版权声明
本文为[Hang Seng Light Cloud Community]所创,转载请带上原文链接,感谢
https://pythonmana.com/2021/11/20211125200601783B.html

  1. Python生成的随机数,要怎么设定成随机数a小于随机数b啊
  2. Python生成的隨機數,要怎麼設定成隨機數a小於隨機數b啊
  3. Le nombre aléatoire généré par Python, comment définir le nombre aléatoire a est inférieur au nombre aléatoire B
  4. Python爬虫能做什么
  5. Python老技师给上路初学者的3点忠告
  6. 3 conseils aux débutants sur la route de l'ancien technicien Python
  7. Que peuvent faire les reptiles Python
  8. The code NPM cloned from git will report a python error after it is installed!
  9. 数据分析从零开始实战,Pandas读写CSV数据
  10. Python基础(十二):类与对象
  11. Python Foundation (12): classes et objets
  12. Python基礎(十二):類與對象
  13. L'analyse des données commence à zéro et pandas lit et écrit les données CSV
  14. Python Qt GUI设计:QSlider滑动条类(基础篇—16)
  15. #yyds干货盘点#数据分析从零开始实战,Pandas读写CSV数据
  16. This paper designs an examination system for automatically setting questions and judging papers by using Python standard library language to investigate the ability of users to calculate four integers within 100.
  17. Yyds Dry Inventory # Data Analysis started from zero, pandas read and write CSV Data
  18. python数据结构:数组、列表、栈、队列及实现
  19. Python编程真的是未来人工智能的主流吗?
  20. Python编写通讯录,支持模糊查询,利用数据库存储
  21. Python編寫通訊錄,支持模糊查詢,利用數據庫存儲
  22. Python編程真的是未來人工智能的主流嗎?
  23. Python écrit le carnet d'adresses, prend en charge les requêtes floues et utilise le stockage de base de données
  24. La programmation Python est - elle vraiment le courant dominant de l'IA future?
  25. Structure des données Python: tableaux, listes, piles, files d'attente et implémentations
  26. Python networkx Practical Social Network Visualization
  27. [译] 通过 for 循环,比较 Python 与 Ruby 编程思想的差别
  28. Comparez les différences de programmation entre Python et Ruby à travers la boucle for
  29. Python basic and introductory tutorials
  30. What you don't know
  31. 人生苦短,能让你更早下班的Python垃圾回收机制
  32. Boring playing Tetris, using Python to do their own without advertising
  33. Seemingly boring Python games, but I fished for work all afternoon!!
  34. A collection of grammar knowledge points for getting started with Python
  35. Benefits of learning Python
  36. Play childhood memories with Python, greedy snake
  37. Python is suitable for beginners
  38. Simple Python game making
  39. Welfare is coming!! Python basic syntax dry goods
  40. Simply understand the learning direction of Python and make yourself a better choice
  41. Why do many people say Python is simple?
  42. Un mécanisme de collecte des ordures Python qui vous permet de quitter le travail plus tôt
  43. Python actual combat battery digital twin [including source code]
  44. Python file operation delete move copy new
  45. Python module accumulation
  46. Python crawler programming idea (70): project practice -- capturing the mobile phone sales ranking of Jingdong Mall
  47. Python crawler programming idea (69): project practice -- capturing Dangdang Book ranking
  48. Python crawler programming idea (68): using pseudo class selectors in pyquery
  49. Eight high-quality Python books are recommended for beginners
  50. L'analyse des données commence à zéro et pandas lit et écrit les données CSV
  51. Write a 5-digit test number in Python
  52. Using Python to batch delete old files n days ago in a specific directory under Windows: batch delete old files under windows, clear cache files, save drive C, and reject drive C explosion
  53. Pandas calculates the statistical data (cumulative time, length change, change rate, variance, mean value, maximum, minimum, etc.) required for prediction and reasoning of the model based on time series data: data duration (minutes), total data change aft
  54. python小问题,各位帮我看一下
  55. Python decrypted the latest rich list in 2021. Ma Yun didn't even enter the top three
  56. 如何使用Python进行单元测试
  57. 基于Python的自动化测试平台开发你要理解的:uWSGI
  58. python:接口自动化测试框架读取配置优化
  59. 代码测试中的Python应用1 | VectorCAST单元测试报告自定义需求的GUI开发
  60. 毕业生简单的用Python实现一个信息管理系统【含示例代码】