Utilisation centrale de pandas

Merde! 2021-10-29 00:28:02
utilisation centrale pandas

NumpyEtPandas

NumpyCalcul scientifique

Numpy Est spécialement conçu pour les opérations matricielles、Open Source for Scientific ComputingPython

PandasAnalyse des données

pandas.Fournit une grande quantité de structures de données et de fonctions qui nous permettent de traiter des données structurées rapidement et facilement
pandasLes deuxNumPyFonctions de calcul de tableaux haute performance et traitement flexible des données pour les tableurs et les bases de données relationnelles
pandas.Contient des structures de données avancées et des opérations qui rendent l'analyse des données plus rapide et plus simple Comme outil,Il est basé surNumpyConstruit, Il y a beaucoup d'opérations similaires

Installationjupyter notebook

Vous pouvez voir quels paquets sont actuellement installés

Effectuer l'installation

Entrée directe dans la console jupyter notebookVous pouvez sauter àwebInterface
CréationPythonProjets

NumpySyntaxe

Structure de base des données ndarray,Est une matrice bidimensionnelle

Création et utilisation de base

Index des tranches



Index booléen

Opérations d'alignement

Ça veut dire ndarray Lors de l'addition, de la soustraction, de la multiplication et de la Division , Ajouter, soustraire, multiplier et diviser la valeur de la position correspondante

Multiplication et Division des matrices

Autres méthodes

PandasSyntaxe

Pandas-Series

SeriesEst un objet qui ressemble à un tableau unidimensionnel,Données(DiversNumPyDonnées Type) Et les étiquettes de données qui y sont associées (Index)Composition
Peut être construit à partir d'un dictionnaire SeriesObjet,Series L'index de l'objet peut également être modifié

Pandas-Dataframe

DataFrameEst une structure de données tabulaire,Il contient un ensemble ordonné de colonnes,Chaque colonne peut être un type de valeur différent(Valeur numérique、String、Booléen, etc.)
DataFrameIndex des lignes et des colonnes, Peut être considéré comme étant causé par SeriesUn dictionnaire composé de

Lire le fichier




PandasNettoyage des données

1.Chargement des données

2.Traitement des données manquantes

2.1 Ajouter une valeur par défaut

2.2 Supprimer les lignes incomplètes

2.3 Modifier les colonnes incomplètes

2.4 Supprimer les colonnes incomplètes
Nous pouvons appliquer les actions ci - dessus aux colonnes.Nous avons juste besoin d'utiliser le Code axis=1 Paramètres.Cela signifie que les colonnes d'action ne sont pas des lignes.
(Nous l'avons déjà utilisé dans nos exemples axis=0,Parce que si on ne passe pas les paramètres, axis,Par défautaxis=0)
Supprimer une colonne entière comme suit:NAColonne::data.dropna(axis=1, how='all')
Supprimer toute colonne contenant une valeur nulle:data.dropna(axis=1,how='any')

  1. Transformation nécessaire
    Les données saisies manuellement peuvent nécessiter certaines transformations nécessaires,Par exemple:
  • Mauvaise typographie
  • L'incohérence des majuscules et des minuscules dans les mots anglais
  • Espace supplémentaire entré

Remplacer la chaîne
data.loc[4,'color']='Color'

En majuscules
data.movie_title=data.movie_title.str.upper()

Enlevez les espaces avant et arrière, etc
data.movie_title=data.movie_title.str.strip()

Renommer le nom de colonne
data = data.rename(columns={'title_year':'Année',
'movie_title':' Année du film '})

  1. Enregistrer le fichier
    data.to_csv('data/cleanfile.csv',index=None,header=None,encoding='utf-8')
    Indique que l'index n'est pas sauvegardé , Ne pas enregistrer le titre ,Format de codageutf8
版权声明
本文为[Merde!]所创,转载请带上原文链接,感谢
https://pythonmana.com/2021/10/20211029002649189e.html

  1. django 自定義中間件如何忽略部分視圖函數
  2. python map函数的使用
  3. python map函數的使用
  4. Utilisation de la fonction de carte Python
  5. 通过对于Arduino或是Python(包括相关库)的使用,结合自己的日常工作,描述相关知识在工作中起到了什么作用。
  6. 2021最全Python接口测试自动化教程【附学习资料】
  7. Python读取配置文件(config.ini),写入配置文件
  8. Python lit le profil (config.ini), écrit le profil
  9. python 两个数据列表匹配查找
  10. python 兩個數據列錶匹配查找
  11. Recherche de correspondance de deux listes de données Python
  12. python循环结构程序编写题目
  13. 【算法学习】1603. 设计停车系统(java / c / c++ / python / go / rust)
  14. Problèmes de programmation de la structure de la boucle Python
  15. 有人能用python写出代码吗wwww
  16. [apprentissage de l'algorithme] 1603. Conception du système de stationnement (Java / C / C + + / python / go / Rust)
  17. Python中if和else,总是显示无效语法是缩进问题吗?是的话可以详细讲解一下吗?
  18. Python的问题,希望有人帮帮忙
  19. Python的問題,希望有人幫幫忙
  20. J'espère que quelqu'un peut m'aider.
  21. Si et autrement en python, est - ce un problème d'indentation d'afficher toujours une syntaxe invalide? Oui, puis - je vous expliquer en détail?
  22. Quelqu'un peut écrire du Code en python?
  23. Dataframe数据,用pandas.to_excel导出成excel问题
  24. Données du cadre de données, en utilisant pandas.to Exporter Excel vers un problème Excel
  25. 请问这个过期的要怎么弄呀,Python是下载的3.10版本的
  26. 請問這個過期的要怎麼弄呀,Python是下載的3.10版本的
  27. Qu'est - ce qu'on fait de ce vieux python?
  28. Python数据处理转置问题??
  29. Problèmes de transposition du traitement des données python??
  30. 使用python的pdfkit把html转pdf时,echarts无法显示
  31. python利用3维的0,1矩阵再matplotlib中画图
  32. Pycham developing Django project template tutorial
  33. Libraries commonly used in Python data analysis
  34. Python utilise une matrice tridimensionnelle 0, 1 pour redessiner les graphiques dans matplotlib
  35. 预备知识-python核心用法常用数据分析库(上)
  36. 預備知識-python核心用法常用數據分析庫(上)
  37. 我在python上创建了个web静态服务器,把一个前端页面,放进去然后在静态服务器上访问只出现了前段页面的代码,代码运行正常,这是怎么回事
  38. Preliminary Knowledge - Python Core use Common Data Analysis Library (ⅰ)
  39. 预备知识-python核心用法常用数据分析库(上)
  40. J'a i créé un serveur Web statique sur Python, j'ai mis une page frontale, j'ai accédé au Code sur le serveur statique qui n'avait que des pages frontales, et le Code fonctionnait correctement
  41. 预备知识-python核心用法常用数据分析库(下)
  42. python 文件排版,怎么控制写入在对应文件的位置(要写吐了,真是服了)
  43. Preliminary Knowledge - Python Core use Common Data Analysis Library (ⅰ)
  44. Typographie de fichiers Python, comment contrôler l'écriture à l'emplacement du fichier correspondant (pour écrire et vomir, vraiment pris)
  45. python:例题求解,不知道怎么等输入完所有数字后再输出
  46. 用python来实现:根据实际查询结果补充完整数据
  47. Mise en œuvre en python: compléter les données complètes en fonction des résultats réels de la requête
  48. python对excel进行分组但不进行聚合统计操作,且输出到不同的表格中?
  49. Python regroupe Excel, mais n'effectue pas de statistiques agrégées, et l'affiche dans différents tableaux.
  50. python如何提交,不要用太复杂的函数
  51. Comment soumettre Python sans utiliser de fonctions trop complexes
  52. Python,数据文件操作问题,想要代码
  53. python 提取多个字符串中的多个字段
  54. python 读入用户输入的一组正整数,到-1结束
  55. Python lit un ensemble d'entiers positifs entrés par l'utilisateur, se terminant par - 1
  56. 测试逐飞的MM32F3277 MicroPython开发板的基本功能
  57. Python timer reference
  58. 关于#python#的问题:python3队列维护
  59. Developing Hongmeng equipment program using python (3-prototype of security system)
  60. Questions sur # # Python #: maintenance de la file d'attente Python 3