Sweetviz: vous permet d'effectuer une analyse exploratoire des données python avec seulement trois lignes de code

Python Learning and Data Mining 2021-10-29 12:57:29
sweetviz vous permet effectuer une

Sweetviz Est une source ouverte Python Bibliothèque,Il suffit de trois lignes de code pour créer une belle visualisation de haute précision pour démarrerEDA(Analyse exploratoire des données).Produit unHTML.Le Groupe d'échange technique est fourni à la fin du document,Comme un peu de soutien,Collection.
Photos
Comme le montre la figure ci - dessus,Non seulement ça dépend du sexe、Analyse longitudinale des données pour différentes colonnes telles que l'âge,Vous pouvez aussi modéliser chaque colonne、Max.、Comparaison latérale minimale, etc.

Toutes les valeurs saisies、Les messages texte sont automatiquement détectés,Analyse des données、Visualisation et contraste,Enfin, il vous aide automatiquement à résumer,Est un bon assistant pour l'analyse exploratoire des données.

1.Préparez - vous.

Veuillez sélectionner l'une des méthodes suivantes pour saisir les dépendances d'installation de la commande
1. Windows Environnement Ouvre. Cmd (C'est parti.-Exécution-CMD).
2. MacOS Environnement Ouvre. Terminal (command+Entrée d'espaceTerminal).
3. Si vous utilisez VSCodeÉditeur Ou Pycharm,Vous pouvez utiliser directement leTerminal.

pip install sweetviz

2.sweetviz Utilisation de base

sweetviz Le principe utilisé est, Utilisez une ligne de code , Objet pour générer un rapport de données (Parmi eux,my_dataframe- Oui.pandasDansDataFrame, Une structure de données tabulaire ):

import pandas as pd
import sweetviz as sv
# Lire les données
my_dataframe = pd.read_csv('../ImpartData/iris.csv')
# Analyse des données
my_report = sv.analyze(my_dataframe)
# Produire un rapport
my_report.show_html()

Une fois l'exécution terminée, Génère un HTML Rapport de

Photos

Double - cliquez dessushtml, Vous pouvez voir le rapport d'analyse exquis :

Photos

Parmi eux, Il existe trois fonctions pour analyser les données ,En plus de ce qui précèdeanalyzeFonctions,Et compare Et compare_intra Fonctions.

D'abordanalyzeFonctions:

analyze(source: Union[pd.DataFrame, Tuple[pd.DataFrame, str]],
target_feat: str = None,
feat_cfg: FeatureConfig = None,
pairwise_analysis: str = 'auto')

On peut voir qu'il a ce qui suit 4 Les paramètres peuvent être configurés :

  • source: ParpandasDansDataFrame Structure des données en tant qu'objet d'analyse .

  • target_feat: Chaîne à marquer comme objet cible .

  • feat_cfg: Besoin d'être sauté 、 Ou des caractéristiques qui doivent être converties de force en un certain type de données .

  • pairwise_analysis: L'analyse de corrélation peut prendre beaucoup de temps . Si vous dépassez votre tolérance , Vous devez définir ce paramètre à onOuoff, Pour déterminer si une analyse de la corrélation des données est nécessaire .

compare() 丨 comparaison de deux ensembles de données

my_report = sv.compare([my_dataframe, "Training Data"], [test_df, "Test Data"], "Survived", feature_config)

Pour comparer deux ensembles de données , Il suffit d'utiliser ce compare() Fonctions.Ses paramètres sont liés à analyze() Même chose., Il suffit d'insérer un deuxième paramètre pour écraser le cadre de données de comparaison .Utilisation recommandée [dataframe, “name”] Format des paramètres pour une meilleure distinction entre les cadres de données de base et les cadres de données de comparaison .(Par exemple [my_df, "Train"] Que my_df C'est mieux.)

compare_intra() 丨 comparaison des colonnes de l'ensemble de données

my_report = sv.compare_intra(my_dataframe, my_dataframe["Sex"] == "male", ["Male", "Female"], feature_config)

Pour analyser les paramètres d'une colonne d'un ensemble de données , En utilisant cette fonction .
Par exemple,Si une comparaison est nécessaire“Sexe”Sous la colonne“Hommes”Et“Femmes”, Vous pouvez utiliser cette fonction .

3. Ajuster la présentation du rapport

Une fois que vous avez créé votre objet de rapport , Il suffit de le transmettre à deux showUne des fonctions:

1. show_html():

show_html( filepath='SWEETVIZ_REPORT.html',
open_browser=True,
layout='widescreen',
scale=None)

**show_html(…)** Sera créé et sauvegardé dans le chemin de fichier actuel HTML Rapport. Il y a les paramètres suivants :

  • layout (Mise en page):Que ce soit 'widescreen’Ou ‘vertical’. Lorsque la souris passe au - dessus de chaque fonction , La disposition de l'écran large affiche les détails sur le côté droit de l'écran .Nouveau(De 2.0 C'est parti.) La disposition verticale est plus compacte horizontalement , Et vous pouvez étendre chaque zone de détail en cliquant .

  • scale: Utiliser un nombre flottant (scale=0.8Ou None ) Pour mettre à l'échelle l'ensemble du rapport .

  • open_browser:Activer Web Ouverture automatique du Navigateur pour afficher le rapport .Si ce n'est pas nécessaire, Vous pouvez le désactiver ici .

2.show_notebook():

show_notebook( w=None,
h=None,
scale=None,
layout='widescreen',
filepath=None)

Il sera incorporé dans un IFRAME Élément,Innotebook Afficher le rapport dans (Par exemple Jupyter、Google Colab Attendez.).

Votre attention, s'il vous plaît.,Parce queNotebook Un environnement généralement plus restreint , Utilisez donc une largeur personnalisée /Hauteur/Valeur proportionnelle (w , h , scale) Ça pourrait être une bonne idée .Les options sont::

  • w(Largeur): Définir la largeur de la fenêtre de sortie du rapport . Peut être une chaîne de pourcentage ( w=“100%”) Ou pixels (w=900).

  • h(Hauteur): Définir la hauteur de la fenêtre de sortie du rapport . Ça peut être le nombre de pixels (h=700) Ou Extruder la fenêtre à toutes les caractéristiques ( h=“full”)Même hauteur.

  • scale:Et au - dessus show_html Même chose..

  • layout:Et au - dessus show_html Même chose..

  • scale:Et au - dessus show_html Même chose..

  • filepath: Sortie facultative HTML Rapport.

C'est la fin de notre article., Si vous aimez l'article d'aujourd'hui ,- Oui.、Soutien、Attention.


Communication Technique

Bienvenue à la réimpression、Collection、J'ai quelque chose à gagner.!

Insérer la description de l'image ici

Le Groupe d'échange technique est actuellement ouvert,Le Groupe d'amis a dépassé2000Les gens,La meilleure façon d'ajouter des commentaires est:Source:+Direction de l'intérêt,Pour trouver des amis partageant les mêmes idées

  • Comment①、Envoyer l'image suivante à Wechat,Reconnaissance par presse longue,Retour en arrière - plan:Ajouter un groupe;
  • Comment②、Ajouter un microsignal:dkl88191,Remarques:DeCSDN
  • Comment③、Wechat Search public Number:PythonApprentissage et exploration des données,Retour en arrière - plan:Ajouter un groupe

Attention

版权声明
本文为[Python Learning and Data Mining]所创,转载请带上原文链接,感谢
https://pythonmana.com/2021/10/20211029125554776m.html

  1. Python crawler selenium framework. You can start with these five questions | Python skill tree
  2. It is said that Python is omnipotent. It's really good to see Liyang photography circle with Python this time
  3. 【Python 爬虫】 4、爬虫基本原理
  4. 【Python 爬蟲】 4、爬蟲基本原理
  5. 【 Python crawler】 4. Principes de base du crawler
  6. 这道python题到底应该要怎么做
  7. Que doit faire exactement ce problème Python
  8. Après l'importation des variables du module Python, les valeurs imprimées sont fixes.
  9. Nouveau singe Muzi Lee: 0 cours de formation Python de base types de hachage pour les opérations Python redis
  10. Looking at problems from a fresh perspective: analyzing selenium principle from the perspective of Python
  11. Insérez le format de date dans la base de données MySQL en python et ne l'exécutez pas.
  12. Try Python 3.10 with CONDA
  13. Répondez en python et demandez à quelqu'un de vous aider.
  14. Un simple problème de travail Python, qui ne fonctionne pas
  15. Problèmes d'écriture Python pour la boucle
  16. Comment Python exécute les commandes du programme à plusieurs reprises au lieu de quitter
  17. YYDS! Dexplot: one line of Python code to easily draw statistical charts!
  18. pandas生成的透视表如何和源数据一起保存
  19. pandas生成的透視錶如何和源數據一起保存
  20. Comment sauvegarder le tableau pivot généré par pandas avec les données sources
  21. 10 fois plus efficace avec cache dans le développement de Django
  22. 求Python *.svg文件操作方法
  23. 求Python *.svg文件操作方法
  24. Trouver la méthode de fonctionnement du fichier Python *.Svg
  25. 【 python】 Internal Guide for Unit Test Practice
  26. 用Python编程佩尔数列pell数列循环结构
  27. 【 python】 échafaudage fastapi: spécification du développement du projet d'interface arrière fastapi
  28. [Python] restful Specification Practice Based on fastapi
  29. Python代码阅读(第26篇):将列表映射成字典
  30. How to use Python to make a screen color extractor with Exe file
  31. Lecture du Code Python (article 26): cartographie des listes dans les dictionnaires
  32. Python代码阅读(第26篇):将列表映射成字典
  33. Python代碼閱讀(第26篇):將列錶映射成字典
  34. Lecture du Code Python (article 26): cartographie des listes dans les dictionnaires
  35. 使用 Python 进行数据可视化之Seaborn
  36. Real time access to stock data, free—— Python crawler Sina stock actual combat
  37. Seaborn pour la visualisation des données en python
  38. 浅识XPath(熟练掌握XPath的语法)【python爬虫入门进阶】(03)
  39. Python中if else语句进行操作的时候哪里除了错,搞不懂
  40. Python题,我刚学,还不会
  41. Python題,我剛學,還不會
  42. Je viens d'apprendre, pas encore.
  43. 云计算开发:Python3-find()方法详解
  44. Real time access to stock data, free—— Python crawler Sina stock actual combat
  45. Développement de l'informatique en nuage: détails de la méthode Python 3 - find ()
  46. 如何使用Python进行超参调参和调优
  47. 如何使用Python進行超參調參和調優
  48. Comment utiliser Python pour le réglage hyperparamétrique
  49. Première connaissance du module urllib Python
  50. Python入门:看了这篇文章如果1个小时没法入门Python,那么还是换个语言吧!!
  51. Python(day1):Python 3 教程
  52. Python(day3):Python3 安装与环境搭建
  53. Python (day3): installation et environnement Python 3
  54. Python (day1): tutoriel Python 3
  55. Démarrer avec Python: Si vous ne pouvez pas commencer avec Python en une heure, changez de langue!!
  56. Pandas:DataFrame对象的基础操作
  57. 关于#python#的问题:月球上物体的体重在地球上的16.5%,编写程序输出未来10年在地球上和月球上的体重状况
  58. 反转一个3位整数(Python 实现)
  59. Questions sur # Python #: les objets lunaires pèsent 16,5% de la masse de la terre et un programme est programmé pour produire la masse de la terre et de la lune au cours des 10 prochaines années
  60. Use of Python pandas!!!!! Explain in detail