L'analyse des données commence à zéro et pandas lit et écrit les données CSV

Vieille montre. 2021-11-25 18:53:45
analyse des donn es commence

C'est ma participation11Le défi du mois de juin16Oh, mon Dieu.,Voir les détails de l'événement:2021Un dernier défi

Un.、C'est écrit devant

Cette série de livres de référence sur les notes d'étude: 《Analyse des données sur le terrain》Tomaz·Jobas,Partagez vos notes d'étude de ce livre,Aussi en série『L'analyse des données commence à zéro』.

2.、Résumé des points de connaissance

1.Créer un virtuelpythonEnvironnement opérationnel,Dédié à cette série d'études;

2.Module commun d'analyse des donnéespandasInstallation

3.UtilisationpandasModule lire et écrireCSVFichier format

Trois、Commencez à bouger la tête

1.Créer un environnement virtuel

Je préfèrePycharm,Donc cette série est destinée à être entièrement utiliséePycharmFais - le.,PycharmL'installation peut être téléchargée directement sur le site officiel,En utilisant la version communautaire.

【Note:】J'adoraisPycharm,Je préfèreVS Code,Vous pouvez également utiliserjupyter notebook.

# Windows/Mac Installation、Utiliser Python Environnement +jupyter notebook

(1)Bon début officiel,Ouvre.Pycharm,Cliquez surFile->New Project,Voir la figure ci - dessous pour la description de la configuration de base..

Instructions spéciales:pythonIl n'y a pas de chinois dans le chemin du projet,En même temps, le nom du projet ne doit pas apparaître en chinois,Dans la mesure du possible, le nom résume le contenu du projet.

Schéma des étapes de fonctionnement

(2)Après avoir créé avec succès,Nous trouverons plus de fichiers de projet et d'environnement virtuel sous le répertoire correspondant.

2.Module commun d'analyse des donnéesPandasInstallation

(1)Tutoriel de base zéro,Apprenez d'abord à tout le monde comment entrer dans un environnement virtuel:Aller dans le répertoireI:\pyCoding\Frame\Data_analysis\Scripts(Mon répertoire d'environnement virtuel),Tiens bon.shift+Clic droit de la souris,Ouvre.powershellOucmd(Si ouipowershellEntrez d'abordcmd),Re - Inputactivate,Accès à l'environnement virtuel,Vous trouverez votre nom d'environnement virtuel entre parenthèses devant le chemin,Indique que vous êtes entré dans un environnement virtuel.Pour plus de détails:

PS I:\pyCoding\Frame\Data_analysis\Scripts> cmd
Microsoft Windows [Version 10.0.17134.112]
(c) 2018 Microsoft Corporation.Tous droits réservés.
I:\pyCoding\Frame\Data_analysis\Scripts>activate
(Data_analysis) I:\pyCoding\Frame\Data_analysis\Scripts>
Copier le Code

Je me demande si tout le monde se sent mal,Je me sens particulièrement mal,Chaque fois que vous entrez dans l'environnement virtuel, vous devez d'abord aller au chemin de fichier spécifié,Puis entrez la commande,Pas dans le style d'un programmeur!

【Note:】J'ai utilisévirtualenvwrapperGestion de l'environnement virtuel,Maintenant je préfère utiliserpipenvGestion de l'environnement virtuel.

(2)InstallationpandasModule

Après avoir utilisé le raccourci pour entrer dans l'environnement virtuel,DirectpipInstallation de la commande

# cmdOpération directe suivante
C:\Users\82055>workon
Pass a name to activate one of the following virtualenvs:
==============================================================================
Data_analysis
spiderenv
C:\Users\82055>workon Data_analysis
(Data_analysis) C:\Users\82055>pip install pandas
Copier le Code

Résultats de l'installation:

Processus d'installation

Le processus d'installation est probablement1Environ une minute.,Une fois terminé

Installing collected packages: pytz, numpy, six, python-dateutil, pandas
Successfully installed numpy-1.15.4 pandas-0.23.4 python-dateutil-2.7.5 pytz-2018.7 six-1.11.0
Copier le Code

Il est évident que,Ce processus n'est pas seulement installépandasSac,Et installénumpy,pytz,six,python-dateutilCes paquets supplémentaires,On va aussi utiliser.

3.UtilisationpandasModule lire et écrireCSVFichier format

(1)Téléchargement de fichiers de données

Cliquez ici pour télécharger,Les données de cette série par livre sont toutes là,《Analyse des données sur le terrain》Le code source du livre est également dans cet entrepôt de code,Bien sûr, je construirai moi - même un entrepôt de code,Documenter votre propre processus d'apprentissage,Vous pouvez d'abord télécharger les fichiers de données d'ici.

(2)pandasIntroduction générale

pandasPourPythonLes langages de programmation offrent des performances élevées,Est basé surNumPy Une structure de données facile à utiliser et un outil d'analyse de données pour,pandasNous offre une structure de données haute performance et avancée(Par exemple,:DataFrame)Et les outils nécessaires pour exploiter efficacement de grands ensembles de données,Il fournit également un grand nombre de fonctions et de méthodes qui nous permettent de traiter les données rapidement et facilement.

(3)UtilisationpandasLireCSVDocumentation

Lire le Code:

# Importer un module de traitement des données
import pandas as pd
import os
# Obtenir le chemin du répertoire parent du fichier courant
father_path = os.getcwd()
# Chemin du fichier de données original
rpath_csv = father_path+r'\data01\city_station.csv'
# Lire les données
csv_read = pd.read_csv(rpath_csv)
# Avant d'afficher les données10Article (s)
print(csv_read.head(10))
Copier le Code

Résultats des opérations:

Analyse fonctionnelle:

read_csv(filepath_or_buffer,sep,header,names,skiprows,na_values,encoding,nrows) Lire dans le format spécifiécsvDocumentation.

Résolution commune des paramètres:

  • filepath_or_buffer:String,Représente le chemin du fichier;
  • sep: String,Spécifier le séparateur,Par défaut’,’;
  • header:Valeur numérique, Spécifiez la ligne comme nom de colonne(Ignorer les lignes d'annotation),Si aucun nom de colonne n'est spécifié,Par défautheader=0; Si un nom de colonne est spécifiéheader=None;
  • names: Liste,Spécifier le nom de colonne,Si le fichier ne contient pasheaderOui.,Devrait être expliciteheader=None.
  • skiprows:Liste,Nombre de lignes à ignorer(De0C'est parti.),Le nombre de lignes défini ne sera pas lu.
  • na_values:Liste,Le réglage exige que la valeur soit remplacée parNANValeur de,pandasPar défautNANPar défaut,Peut être utilisé pour traiter certains défauts、Mauvaise valeur.
  • encoding:String,PourunicodeFormat de codage de texte pour.Par exemple,"utf-8"Ou"gbk"Format d'encodage du texte égal.
  • nrows:Nombre de lignes à lire.
(4)UtilisationpandasÉcrireCSVDocumentation

ÉcrireCSVDocumentation:

import pandas as pd
import os
# Obtenir le chemin du répertoire parent du fichier courant
father_path = os.getcwd()
# Enregistrer le chemin du fichier de données
path_csv = father_path+r'\data01\temp_city.csv'
# Écrire des données(Nom de la colonne+Valeur de colonne)
data = {"Nom du site": ["Pékin Nord", "Pékin est", "Beijing", "Pékin sud", "Beijing West"],
"Nom de code": ["VAP", "BOP", "BJP", "VNP", "BXP"]}
# Les données sont initialisées àDataFrameObjet
df = pd.DataFrame(data)
# Écrire des données
df.to_csv(path_csv)
Copier le Code

Résultats des opérations:

Analyse fonctionnelle:

to_csv(path_or_buf,sep,na_rep,columns,header,index)

  • path_or_buf:String,Nom du fichier、Document spécifique、Chemin relatif、Flux de fichiers, etc;
  • sep:String,Symbole de partage de fichiers;
  • na_rep:String,Oui.NaNConvertir en valeur spécifique;
  • columns:Liste,Sélectionnez une colonne partielle pour écrire;
  • header:None,Ignorer le nom de colonne lors de l'écriture;
  • index:FalseChoisissez de ne pas écrire d'index,Par défautTrue.

Quatre、Conclusion

Tiens bon. and Un effort. : J'ai enfin quelque chose..

C'est compliqué.,

La mise en œuvre est intéressante,

Tant que tu n'abandonnes pas,

Il y aura un jour de gloire..

—《Poème huileux de la vieille montre》

On se voit plus tard.,J'aime les chats, j'aime la technologie,Si vous pensez que cet article vous aidera,Bienvenue à la fête、Commentaires、Concentre - toi sur moi.!

版权声明
本文为[Vieille montre.]所创,转载请带上原文链接,感谢
https://pythonmana.com/2021/11/20211125185344066U.html

  1. 关于#python_while循环的写法#的问题,如何解决?
  2. Python异常处理中异常的种类有哪些?你知道几个?
  3. Python异常處理中异常的種類有哪些?你知道幾個?
  4. Quels sont les types d'exceptions dans la gestion des exceptions python? Combien en savez - vous?
  5. À propos de # Python Comment résoudre le problème de l'écriture de la Boucle while?
  6. Python如何操作system.data.sqlite数据库
  7. python数字游戏,让你欲罢不能
  8. Python中的可迭代对象、迭代器、For循环工作机制、生成器
  9. 一个从没接触过编程的人,如何自学进入Python行业?
  10. 一份超级实用的 Python ”技巧“清单
  11. Python 程序员给上路初学者的3点忠告
  12. 3 conseils pour les débutants sur la route par les programmeurs Python
  13. Une liste de conseils Python super pratiques
  14. Comment quelqu'un qui n'a jamais été en contact avec la programmation peut - il apprendre à entrer dans l'industrie python?
  15. Objets itérables, itérateurs, pour le mécanisme de travail circulaire, générateurs en python
  16. Les Jeux de chiffres Python vous font vous arrêter
  17. Comment Python fonctionne avec la base de données system.data.sqlite
  18. Python之html与markdown互相转换
  19. Python之html與markdown互相轉換
  20. Conversion HTML et markdown de Python
  21. Python生成的随机数,要怎么设定成随机数a小于随机数b啊
  22. Python生成的隨機數,要怎麼設定成隨機數a小於隨機數b啊
  23. Le nombre aléatoire généré par Python, comment définir le nombre aléatoire a est inférieur au nombre aléatoire B
  24. Python爬虫能做什么
  25. Python老技师给上路初学者的3点忠告
  26. 3 conseils aux débutants sur la route de l'ancien technicien Python
  27. Que peuvent faire les reptiles Python
  28. The code NPM cloned from git will report a python error after it is installed!
  29. 数据分析从零开始实战,Pandas读写CSV数据
  30. Python基础(十二):类与对象
  31. Python Foundation (12): classes et objets
  32. Python基礎(十二):類與對象
  33. L'analyse des données commence à zéro et pandas lit et écrit les données CSV
  34. Python Qt GUI设计:QSlider滑动条类(基础篇—16)
  35. #yyds干货盘点#数据分析从零开始实战,Pandas读写CSV数据
  36. This paper designs an examination system for automatically setting questions and judging papers by using Python standard library language to investigate the ability of users to calculate four integers within 100.
  37. Yyds Dry Inventory # Data Analysis started from zero, pandas read and write CSV Data
  38. python数据结构:数组、列表、栈、队列及实现
  39. Python编程真的是未来人工智能的主流吗?
  40. Python编写通讯录,支持模糊查询,利用数据库存储
  41. Python編寫通訊錄,支持模糊查詢,利用數據庫存儲
  42. Python編程真的是未來人工智能的主流嗎?
  43. Python écrit le carnet d'adresses, prend en charge les requêtes floues et utilise le stockage de base de données
  44. La programmation Python est - elle vraiment le courant dominant de l'IA future?
  45. Structure des données Python: tableaux, listes, piles, files d'attente et implémentations
  46. Python networkx Practical Social Network Visualization
  47. [译] 通过 for 循环,比较 Python 与 Ruby 编程思想的差别
  48. Comparez les différences de programmation entre Python et Ruby à travers la boucle for
  49. Python basic and introductory tutorials
  50. What you don't know
  51. 人生苦短,能让你更早下班的Python垃圾回收机制
  52. Boring playing Tetris, using Python to do their own without advertising
  53. Seemingly boring Python games, but I fished for work all afternoon!!
  54. A collection of grammar knowledge points for getting started with Python
  55. Benefits of learning Python
  56. Play childhood memories with Python, greedy snake
  57. Python is suitable for beginners
  58. Simple Python game making
  59. Welfare is coming!! Python basic syntax dry goods
  60. Simply understand the learning direction of Python and make yourself a better choice