Yyds Dry Inventory # Data Analysis started from zero, pandas read and write CSV Data

Jane parle de Python. 2021-11-25 18:29:21
yyds dry inventory data analysis

C'est ma participation11Le défi du mois de juin14Oh, mon Dieu..

Un.、C'est écrit devant

Cette série de livres de référence sur les notes d'étude: 《Analyse des données sur le terrain》Tomaz·Jobas,Partagez vos notes d'étude de ce livre,Aussi en série『L'analyse des données commence à zéro』.

2.、Résumé des points de connaissance

1.Créer un virtuelpythonEnvironnement opérationnel,Dédié à cette série d'études;

2.Module commun d'analyse des donnéespandasInstallation

3.UtilisationpandasModule lire et écrireCSVFichier format

Trois、Commencez à bouger la tête

1.Créer un environnement virtuel

Je préfèrePycharm,Donc cette série est destinée à être entièrement utiliséePycharmFais - le.,PycharmL'installation peut être téléchargée directement sur le site officiel,En utilisant la version communautaire.

【Note:】J'adoraisPycharm,Je préfèreVS Code,Vous pouvez également utiliserjupyter notebook.

(1)Bon début officiel,Ouvre.Pycharm,Cliquez surFile->New Project,Voir la figure ci - dessous pour la description de la configuration de base..

Instructions spéciales:pythonIl n'y a pas de chinois dans le chemin du projet,En même temps, le nom du projet ne doit pas apparaître en chinois,Dans la mesure du possible, le nom résume le contenu du projet.

#yydsInventaire des marchandises sèches#L'analyse des données commence à zéro,PandasLire et écrireCSVDonnées_python

(2)Après avoir créé avec succès,Nous trouverons plus de fichiers de projet et d'environnement virtuel sous le répertoire correspondant.

2.Module commun d'analyse des donnéesPandasInstallation

(1)Tutoriel de base zéro,Apprenez d'abord à tout le monde comment entrer dans un environnement virtuel:Aller dans le répertoireI:\pyCoding\Frame\Data_analysis\Scripts(Mon répertoire d'environnement virtuel),Tiens bon.shift+Clic droit de la souris,Ouvre.powershellOucmd(Si ouipowershellEntrez d'abordcmd),Re - Inputactivate,Accès à l'environnement virtuel,Vous trouverez votre nom d'environnement virtuel entre parenthèses devant le chemin,Indique que vous êtes entré dans un environnement virtuel.Pour plus de détails:

PS I:\pyCoding\Frame\Data_analysis\Scripts> cmd
Microsoft Windows [Version 10.0.17134.112]
(c) 2018 Microsoft Corporation.Tous droits réservés.
I:\pyCoding\Frame\Data_analysis\Scripts>activate
(Data_analysis) I:\pyCoding\Frame\Data_analysis\Scripts>

  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.

Je me demande si tout le monde se sent mal,Je me sens particulièrement mal,Chaque fois que vous entrez dans l'environnement virtuel, vous devez d'abord aller au chemin de fichier spécifié,Puis entrez la commande,Pas dans le style d'un programmeur!

【Note:】J'ai utilisévirtualenvwrapperGestion de l'environnement virtuel,Maintenant je préfère utiliserpipenvGestion de l'environnement virtuel.

(2)InstallationpandasModule

Après avoir utilisé le raccourci pour entrer dans l'environnement virtuel,DirectpipInstallation de la commande

# cmdOpération directe suivante
C:\Users\82055>workon
Pass a name to activate one of the following virtualenvs:
==============================================================================
Data_analysis
spiderenv
C:\Users\82055>workon Data_analysis
(Data_analysis) C:\Users\82055>pip install pandas

  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.

Résultats de l'installation:

#yydsInventaire des marchandises sèches#L'analyse des données commence à zéro,PandasLire et écrireCSVDonnées_CSV_02

Le processus d'installation est probablement1Environ une minute.,Une fois terminé

Installing collected packages: pytz, numpy, six, python-dateutil, pandas
Successfully installed numpy-1.15.4 pandas-0.23.4 python-dateutil-2.7.5 pytz-2018.7 six-1.11.0

  • 1.
  • 2.

Il est évident que,Ce processus n'est pas seulement installépandasSac,Et installénumpy,pytz,six,python-dateutilCes paquets supplémentaires,On va aussi utiliser.

3.UtilisationpandasModule lire et écrireCSVFichier format

(1)Téléchargement de fichiers de données

 Cliquez ici pour télécharger,Les données de cette série par livre sont toutes là,《Analyse des données sur le terrain》Le code source du livre est également dans cet entrepôt de code,Bien sûr, je construirai moi - même un entrepôt de code,Documenter votre propre processus d'apprentissage,Vous pouvez d'abord télécharger les fichiers de données d'ici.

(2)pandasIntroduction générale

pandasPourPythonLes langages de programmation offrent des performances élevées,Est basé surNumPy Une structure de données facile à utiliser et un outil d'analyse de données pour,pandasNous offre une structure de données haute performance et avancée(Par exemple,:DataFrame)Et les outils nécessaires pour exploiter efficacement de grands ensembles de données,Il fournit également un grand nombre de fonctions et de méthodes qui nous permettent de traiter les données rapidement et facilement.

(3)UtilisationpandasLireCSVDocumentation

Lire le Code:

# Importer un module de traitement des données
import pandas as pd
import os
# Obtenir le chemin du répertoire parent du fichier courant
father_path = os.getcwd()
# Chemin du fichier de données original
rpath_csv = father_path+r'\data01\city_station.csv'
# Lire les données
csv_read = pd.read_csv(rpath_csv)
# Avant d'afficher les données10Article (s)
print(csv_read.head(10))

  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
  • 12.
  • 13.

Résultats des opérations:

#yydsInventaire des marchandises sèches#L'analyse des données commence à zéro,PandasLire et écrireCSVDonnées_python_03

Analyse fonctionnelle:

read_csv(filepath_or_buffer,sep,header,names,skiprows,na_values,encoding,nrows)
Lire dans le format spécifiécsvDocumentation.

Résolution commune des paramètres:

  • filepath_or_buffer:String,Représente le chemin du fichier;
  • sep: String,Spécifier le séparateur,Par défaut’,’;
  • header:Valeur numérique, Spécifiez la ligne comme nom de colonne(Ignorer les lignes d'annotation),Si aucun nom de colonne n'est spécifié,Par défautheader=0; Si un nom de colonne est spécifiéheader=None;
  • names: Liste,Spécifier le nom de colonne,Si le fichier ne contient pasheaderOui.,Devrait être expliciteheader=None.
  • skiprows:Liste,Nombre de lignes à ignorer(De0C'est parti.),Le nombre de lignes défini ne sera pas lu.
  • na_values:Liste,Le réglage exige que la valeur soit remplacée parNANValeur de,pandasPar défautNANPar défaut,Peut être utilisé pour traiter certains défauts、Mauvaise valeur.
  • encoding:String,PourunicodeFormat de codage de texte pour.Par exemple,"utf-8"Ou"gbk"Format d'encodage du texte égal.
  • nrows:Nombre de lignes à lire.
(4)UtilisationpandasÉcrireCSVDocumentation

ÉcrireCSVDocumentation:

import pandas as pd
import os
# Obtenir le chemin du répertoire parent du fichier courant
father_path = os.getcwd()
# Enregistrer le chemin du fichier de données
path_csv = father_path+r'\data01\temp_city.csv'
# Écrire des données(Nom de la colonne+Valeur de colonne)
data = {"Nom du site": ["Pékin Nord", "Pékin est", "Beijing", "Pékin sud", "Beijing West"],
"Nom de code": ["VAP", "BOP", "BJP", "VNP", "BXP"]}
# Les données sont initialisées àDataFrameObjet
df = pd.DataFrame(data)
# Écrire des données
df.to_csv(path_csv)

  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
  • 12.
  • 13.
  • 14.
  • 15.

Résultats des opérations:

#yydsInventaire des marchandises sèches#L'analyse des données commence à zéro,PandasLire et écrireCSVDonnées_CSV_04

Analyse fonctionnelle:

to_csv(path_or_buf,sep,na_rep,columns,header,index)

  • path_or_buf:String,Nom du fichier、Document spécifique、Chemin relatif、Flux de fichiers, etc;
  • sep:String,Symbole de partage de fichiers;
  • na_rep:String,Oui.NaNConvertir en valeur spécifique;
  • columns:Liste,Sélectionnez une colonne partielle pour écrire;
  • header:None,Ignorer le nom de colonne lors de l'écriture;
  • index:FalseChoisissez de ne pas écrire d'index,Par défautTrue.

Quatre、Conclusion

Tiens bon. and Un effort. : J'ai enfin quelque chose..

C'est compliqué.,

La mise en œuvre est intéressante,

Tant que tu n'abandonnes pas,

Il y aura un jour de gloire..

—《Poème huileux de la vieille montre》

On se voit plus tard.,J'aime les chats, j'aime la technologie,Si vous pensez que cet article vous aidera,Bienvenue à la fête、Commentaires、Concentre - toi sur moi.!

版权声明
本文为[Jane parle de Python.]所创,转载请带上原文链接,感谢
https://pythonmana.com/2021/11/20211125182532032d.html

  1. [learning notes] Python - pyecarts
  2. Python automated operation and maintenance -- actual combat (I)
  3. Python 多分支语句的三种结构
  4. Python 输出指定范围的闰年
  5. Fatal Python error: init_ fs_ encoding: failed to get the Python codec of the filesystem encoding
  6. Using Python to obtain a video address is as simple as
  7. #yyds干货盘点# 6. Python 元组,不可变的列表,滚雪球学 Python
  8. Yyds Dry Inventory # 6. Python tuples, invariant List, snowball Learning Python
  9. You cannot enter the registration page using Django registration redux
  10. 笨办法学Python第十八天:更多文件操作
  11. Python编辑代码,帮个忙呗
  12. pandas转换object为int失败了,有人能解答吗
  13. python解释题,解释这串,所代表的意思
  14. 用python用while语句写1000以内能被5和9整除的数和个数
  15. #python 我写了一个“饭店”程序
  16. Comprehensive application of Python foundation -- Development
  17. Écrivez en python le nombre et le nombre d'entiers qui peuvent être divisés par 5 et 9 jusqu'à 1000 dans une instruction while
  18. python3.7 FileNotFoundError: [WinError 2] 系统找不到指定的文件。
  19. 最全面的Python重点知识汇总
  20. You can learn Python articles without reading online classes (day 4)
  21. You can learn Python articles without reading online classes (the third day)
  22. python中 我想爬取一个网页,我在cmd中pip list中已经把requests 以及bs4 弄好了 但是他还是提示我没有那个模块
  23. You can learn Python articles without reading online classes (the next day)
  24. You can learn Python articles without reading online classes (the first day)
  25. 在Python和Go项目之后使用Rust的经验分享 - scaleway
  26. 使用PyO3从Python调用 Rust:加速Python
  27. Python 3.7 filenotfounderror: [winerror 2] le système n'a pas pu trouver le fichier spécifié.
  28. Python 一切皆对象
  29. 【Pandas学习笔记01】强大的分析结构化数据的工具集
  30. 求各位亲们可以解答一下嘛,为什么跑不出来呀,大学Python
  31. 【Pandas学习笔记01】强大的分析结构化数据的工具集
  32. python飞机大战如何让飞机始终在界面中,不能跑出界面
  33. Python代码阅读(第63篇):数字奇偶性
  34. python建立⼀個圖形介⾯應⽤(GUI app)
  35. python接口自动化的html格式报告以邮件形式发送展示的原文很丑怎么处理
  36. 针对初学者,我建议你学这 3 个 Python AutoEDA 工具包
  37. #yyds干货盘点#Python-爬虫_urlib一个类型和六个方法
  38. Pour les débutants, je vous recommande d'apprendre ces 3 kits autoeda Python
  39. 我想问python怎么入门嘞?求各路人士
  40. Summary of today's Django lessons: data reverse query triggers error field 'score_ jieshoufankui‘ expected a number but got ‘‘-20211109
  41. 关于#python_while循环的写法#的问题,如何解决?
  42. Python异常处理中异常的种类有哪些?你知道几个?
  43. Python异常處理中异常的種類有哪些?你知道幾個?
  44. Quels sont les types d'exceptions dans la gestion des exceptions python? Combien en savez - vous?
  45. À propos de # Python Comment résoudre le problème de l'écriture de la Boucle while?
  46. Python如何操作system.data.sqlite数据库
  47. python数字游戏,让你欲罢不能
  48. Python中的可迭代对象、迭代器、For循环工作机制、生成器
  49. 一个从没接触过编程的人,如何自学进入Python行业?
  50. 一份超级实用的 Python ”技巧“清单
  51. Python 程序员给上路初学者的3点忠告
  52. 3 conseils pour les débutants sur la route par les programmeurs Python
  53. Une liste de conseils Python super pratiques
  54. Comment quelqu'un qui n'a jamais été en contact avec la programmation peut - il apprendre à entrer dans l'industrie python?
  55. Objets itérables, itérateurs, pour le mécanisme de travail circulaire, générateurs en python
  56. Les Jeux de chiffres Python vous font vous arrêter
  57. Comment Python fonctionne avec la base de données system.data.sqlite
  58. Python之html与markdown互相转换
  59. Python之html與markdown互相轉換
  60. Conversion HTML et markdown de Python