9 Bar valeur Bar _Conseils sur les comptes () pour améliorer l'efficacité de l'analyse des données pandas

Deep Hub 2021-09-15 14:40:32
valeur conseils sur les comptes


Les spécialistes des données consacrent généralement la plus grande partie de leur temps à l'exploration et au prétraitement des données.Quand il s'agit d'analyser les données et de comprendre la structure des données,Pandas value_counts() Est l'une des fonctions les plus populaires.Cette fonction renvoie une série contenant un nombre unique de valeurs.ProduitSeriesPeut être trié par ordre décroissant ou ascendant,Inclure ou exclure par le contrôle des paramètresNA.

Dans cet article,Nous allons explorer Pandas value_counts() Différents cas d'utilisation de.Vous apprendrez à l'utiliser pour les tâches communes suivantes.

  1. Paramètres par défaut
  2. .Trier les résultats par ordre croissant
  3. Résultats par ordre alphabétique
  4. Le résultat contient une valeur nulle
  5. Afficher les résultats en pourcentage
  6. Diviser les données continues en intervalles discrets
  7. Grouper et appeler value_counts()
  8. Convertir la série de résultats en DataFrame
  9. Appliquer àDataFrame

1、Paramètres par défaut

Pandas value_counts() La fonction renvoie une série contenant un nombre unique de valeurs.Par défaut,Les séries de résultats sont présentées par ordre décroissant,Ne contient aucun NA Valeur.Par exemple,Commençons par Titanic Acquisition de l'ensemble de données“Embarked”Nombre de colonnes.

 >>> df['Embarked'].value_counts()
S 644
C 168
Q 77
Name: Embarked, dtype: int64

2、.Trier les résultats par ordre croissant

value_count() Les séries retournées sont par défaut classées par ordre décroissant . Pour les résultats ascendants , Nous pouvons définir l'ordre croissant des paramètres à True.

 >>> df['Embarked'].value_counts(ascending=True)
Q 77
C 168
S 644
Name: Embarked, dtype: int64

3、Résultats par ordre alphabétique

Nous avons appris l'ordre croissant des paramètres pour obtenir le nombre par valeur ASC Ou DESC Résultats du tri .Dans certains cas, Il est préférable d'afficher nos résultats par ordre alphabétique .Cela peut se faire en value_counts() Appelé plus tard sort_index(ascending=True) Pour finir,Par exemple

 >>> df['Embarked'].value_counts(ascending=True).sort_index(ascending=True)
C 168
Q 77
S 644
Name: Embarked, dtype: int64

4、 Inclure dans les résultats NA

Par défaut, Tout ce qui contient NA Ligne de valeur.Il y a un paramètre dropna Pour le configurer . Nous pouvons définir cette valeur à False Pour inclure NA Nombre de lignes pour.

 df['Embarked'].value_counts(dropna=False)
S 644
C 168
Q 77
NaN 2
Name: Embarked, dtype: int64

5、Afficher les résultats en pourcentage

Lors de l'analyse exploratoire des données , Il est parfois plus utile de voir le pourcentage de valeurs uniques . Ceci peut être fait en plaçant le paramètre normalize Set to True Pour finir,Par exemple:

 df['Embarked'].value_counts(normalize=True)
S 0.724409
C 0.188976
Q 0.086614
Name: Embarked, dtype: float64

Si nous préférons utiliser un pourcentage (%) Formater les résultats ,Nous pouvons définir Pandas Les options d'affichage sont les suivantes :

 >>> pd.set_option('display.float_format', '{:.2f}%'.format)
>>> df['Embarked'].value_counts(normalize = True)
S 0.72%
C 0.19%
Q 0.09%
Name: Embarked, dtype: float64

6、Diviser les données continues en intervalles discrets

Pandas value_counts() Disponible pour utilisation avec bin Les paramètres divisent les données continues en intervalles discrets .Avec Pandas cut() Fonctions similaires, Nous pouvons passer un entier ou une liste à bin Paramètres.

Quand un entier est passé à bin Heure, Cette fonction discrète les valeurs continues en bin,Par exemple:

 >>> df['Fare'].value_counts(bins=3)
(-0.513, 170.776] 871
(170.776, 341.553] 17
(341.553, 512.329] 3
Name: Fare, dtype: int64

Quand la liste est passée à bin Heure, Cette fonction divise les valeurs continues en groupes personnalisés ,Par exemple:

 >>> df['Fare'].value_counts(bins=[-1, 20, 100, 550])
(-1.001, 20.0] 515
(20.0, 100.0] 323
(100.0, 550.0] 53
Name: Fare, dtype: int64

7、 Grouper et exécuter value_counts()

Pandas groupby() Permet de diviser les données en différents groupes pour effectuer des calculs pour une meilleure analyse . Un cas d'utilisation courant est de grouper par une colonne , Puis obtenir le nombre de valeurs uniques pour l'autre colonne .Par exemple, Pressons. “Embarked” Colonnes groupées et obtenir différentes “Sex” Nombre de valeurs .

 >>> df.groupby('Embarked')['Sex'].value_counts()
Embarked Sex
C male 95
female 73
Q male 41
female 36
S male 441
female 203
Name: Sex, dtype: int64

8、Convertir la série de résultats en DataFrame

Pandas value_counts() Retour à unSeries, Y compris avant avec MultiIndex Exemple de. Si nous voulons que nos résultats soient DataFrame,Nous pouvons value_count() Appelé plus tard to_frame().

 >>> df.groupby('Embarked')['Sex'].value_counts().to_frame()

9、Appliquer àDataFrame

Jusqu'à présent, On va toujours value_counts() Appliquer à Pandas Series,In Pandas DataFrame Il y a une méthode équivalente .Pandas DataFrame.value_counts() Renvoie un contenant DataFrame Série avec un nombre de lignes unique en .

Voyons un exemple pour mieux comprendre :

 df = pd.DataFrame({
'num_legs': [2, 4, 4, 6],
'num_wings': [2, 0, 0, 0]},
index=['falcon', 'dog', 'cat', 'ant']
)
>>> df.value_counts()
num_legs num_wings
4 0 2
6 0 1
2 2 1
dtype: int64

En df Appel supérieur value_counts(), Il en retourne un pour num_legs Et num_wings Indexé MultiIndex Série. À partir des résultats , On peut trouver qu'il y a 2 Les enregistrements num_legs=4 Et num_wing=0.

Encore une fois,Nous pouvons appeler to_frame() Convertir les résultats en DataFrame

 >>> df.value_counts().to_frame()

Résumé

Dans cet article,Nous avons discuté de Pandas value_counts() Différents cas d'utilisation de. J'espère que cet article vous aidera à économiser vos études Pandas Le temps. Je vous suggère de vérifier value_counts() API Documentation et autres choses que vous pouvez faire .

Merci pour la lecture.. Le Code de cet article est ici :https://github.com/BindiChen/machine-learning/blob/master/data-analysis/046-pandas-value_counts/pandas-value_counts.ipynb

Cet article est partagé par Wechat public Number - DeepHub IMBA(deephub-imba) ,Auteur:P**nHubSite des frères

La source originale et les informations reproduites sont détaillées dans le texte,En cas d'infraction,Veuillez contacter: yunjia_community@tencent.com Supprimer.

Date de publication originale: 2021-09-03

Participation à cet articleTencent Cloud Self - media Sharing Plan,Bienvenue à la lecture,Partager ensemble.

版权声明
本文为[Deep Hub]所创,转载请带上原文链接,感谢
https://pythonmana.com/2021/09/20210915143831402p.html

  1. 从0起步学Python(附程序实例讲解)第1讲
  2. 从0起步学Python(附程序实例讲解)第1讲
  3. Apprendre Python à partir de 0 (avec des exemples de programme) leçon 1
  4. Apprendre Python à partir de 0 (avec des exemples de programme) leçon 1
  5. With Python, I'll take you to enjoy it for a month when the Mid Autumn Festival is coming
  6. You can't write interface software in Python! Which software on sale has no UI?
  7. Python国内外原题解析及源码1~15
  8. Python实现长篇英文自动纠错~
  9. Python implémente la correction automatique des erreurs en anglais long
  10. Analyse des problèmes originaux et code source de Python au pays et à l'étranger 1 ~ 15
  11. 一张思维导图学Python之表白
  12. Python教学中课程思政建设的研究探索2
  13. Recherche sur la construction idéologique et politique du Programme d'études dans l'enseignement Python 2
  14. Une présentation de la cartographie mentale Python
  15. Python高级用法总结(8)-函数式编程
  16. Python + Mirai development QQ robot starting tutorial (2021.9.9 test is valid)
  17. Python Advanced use Summary (8) - functional Programming
  18. How to get started with Python and share learning methods for free. All you want to know is here
  19. Python + Mirai development QQ robot starting tutorial (2021.9.9 test is valid)
  20. Python趣味编程中(PPT适合青少儿和零基础学习Python)
  21. Python基础第1讲(含代码、Python最新安装包、父与子的编程之旅:与小卡特一起学Python中文版)
  22. 用 Python 增强 Git
  23. Python基礎第1講(含代碼、Python最新安裝包、父與子的編程之旅:與小卡特一起學Python中文版)
  24. Base Python leçon 1 (y compris le Code, le dernier paquet d'installation Python, le voyage de programmation parent - enfant: apprendre la version chinoise de python avec le petit Carter)
  25. Dans la programmation amusante Python (ppt pour les jeunes enfants et l'apprentissage de base zéro Python)
  26. 非常好的题目详解Python字典的用法
  27. Python teaches you to build wechat push live Betta reminder from 0 (single room simplified version)
  28. Python 协程与 JavaScript 协程的对比
  29. 手把手带你用Python实现一个量化炒股策略
  30. Main dans la main pour mettre en œuvre une stratégie quantitative de spéculation boursière en python
  31. Comparaison des coproductions Python et JavaScript
  32. 【python种子项目ppc】一行代码生成项目与开发详细指导
  33. Docker 部署一个用 Python 编写的 Web 应用
  34. Python - poetry(4)管理环境
  35. Python - poetry(2)命令介绍
  36. [Python Seed Project PPC] a line of Code Generation Project and Development detailed guidance
  37. Introduction à la commande python - Poetry (2)
  38. Python - Poetry (4) Management Environment
  39. I collected Banhua's spatial data set in Python. In addition to meizhao, I found her other secrets again!
  40. I modified ban Hua's boot password in Python and found her secret after logging in again!
  41. After my girlfriend said good night to you, she was still online. I made a script in Python and successfully conquered it
  42. Python crawlers are used by you to climb sister pictures. We are ashamed to be with them!
  43. Python basic exercises, including answer analysis
  44. I used Python to capture the hot reviews of Wu's microblog events, chatting about technology and eating melons
  45. 60000 word summary of Python basic knowledge points, liver explosion, staying up late in a week [recommended collection]
  46. How do Python crawlers learn? Learn about the responsibilities of recruitment positions and see how much you can earn for your skills
  47. 20 lines of Python code crawl 2W multiple audio file materials [source code attached + detailed analysis] necessary for new media creation
  48. 微软开源浏览器自动化工具Playwright for Python(附源码)
  49. Python 中的进制转换
  50. Python 的算术运算符
  51. Python 的整数
  52. You love me, I love you. It's a headache for IP to be blocked [Python crawler practice: IP proxy JS reverse collection]
  53. Django learning knowledge points, road map, data summary, recommended collection!
  54. Headmaster Wang was hammered instead of flirting with his sister? No matter how rich you are, you just lick the dog [Python reptile actual combat: microblog comments]
  55. We are addicted to short videos and can't extricate ourselves? Python crawler advanced, take you to play short video
  56. How to learn Python Programming? Which books are suitable for beginners
  57. Python is so popular, what's the difference between it and other programming languages?
  58. Python web crawler - Jingdong Mall product list
  59. Django custom user model
  60. All the learning routes of Python and the knowledge system you want are here. Don't do useless work