pandas DataFrame的新增行列,修改、删除、筛选、判断元素以及转置操作

元小疯 2021-01-21 17:34:09
pandas 新增 dataframe 修改 行列


1)指定行索引和列索引标签

    index 属性可以指定 DataFrame 结构中的索引数组,  columns 属性可以指定包含列名称的行,

    而使用 name 属性,通过对一个 DataFrame 实例进行 df 设置( df.index.name 和 df.columns.name)就可以为 DataFrame 结构指定行索引标签和列索引标签。

   例如,对产品价格表指定行索引标签和列索引标签,其示例代码如下:

In [24]: df.index.name = 'id'
In [25]: df.columns.name = 'item
In [26]: df
Out[26]:
item product price
id
0 电视机 2300.0
1 空调 1980.0
2 洗衣机 780.0
3 电脑 NaN

2) 添加一列元素

为 DataFrame 实例添加一列元素的方法就是指定 DataFrame 实例新列的名称,并为其赋值即可。例如,为产品价格增加一个折扣率列,其示例代码如下:

In [27]: df['discount']=[0.9,0.85,0.95,1]
In [28]: df
Out[28]:
item product price discount
id
0 电视机 2300.0 0.90
1 空调 1980.0 0.85
2 洗衣机 780.0 0.95
3 电脑 NaN 1.00

或者用 insert() 函数在指定位置添加一列元素。例如,在折扣率列后面,添加一列价格(“price”)乘以折扣率(“discount”)的实际价格(“Actual_price”)列,其示例代码如下:

In [29]: df.insert(3,'Actual_price',df['price']*df['discount'])
In [30]: df
Out[30]:
item product price discount Actual_price
id
0 电视机 2300.0 0.90 2070.0
1 空调 1980.0 0.85 1683.0
2 洗衣机 780.0 0.95 741.0
3 电脑 NaN 1.00 NaN

3) 添加一行元素

为 DataFrame 实例添加一行元素的方法就是使用 loc 属性为 DataFrame 实例新添加一行,并为此行赋值即可。例如,为产品价格增加一个手机产品的价格行,其示例代码如下:

In [31]: df.loc['add_row'] = ['手机',1900,1,1900]
In [32]: df
Out[32]:
item product price discount Actual_price
id
0 电视机 2300.0 0.90 2070.0
1 空调 1980.0 0.85 1683.0
2 洗衣机 780.0 0.95 741.0
3 电脑 NaN 1.00 NaN
add_row 手机 1900.0 1.00 1900.0

4) 修改一行元素

修改 DataFrame 对象中的一行元素,只需要使用 loc 属性指定 DataFrame 实例中行索引,并为此行赋值即可。例如,修改产品价格中电脑一行的数据,其示例代码如下:

In [33]: df.loc[3] = ['电脑',4500,1,4500]
In [34]: df
Out[34]:
item product price iscount Actual_price
id
0 电视机 2300.0 0.90 2070.0
1 空调 1980.0 0.85 1683.0
2 洗衣机 780.0 0.95 741.0
3 电脑 4500.0 1.00 4500.0
add_row 手机 1900.0 1.00 1900.0

5) 修改一列元素或一个元素

修改 DataFrame 实例中的一列元素,只要指定 DataFrame 实例中列名称,将要更新的一列元素存放到数组中,然后将此数组赋值给这一列即可。
例如,修改产品价格中的价格为新价格 [3000,2300,560,5600],其示例代码如下:

In [35]: df['price']=[3000,2300,560,5600,1880]
In [36]: df
Out[36]:
item product price discount Actual_price
id
0 电视机 3000 0.90 2070.0
1 空调 2300 0.85 1683.0
2 洗衣机 560 0.95 741.0
3 电脑 5600 1.00 4500.0
add_row 手机 1880 1.00 1900.0

修改一个元素,只需要选择该元素,直接给其赋值即可。例如 df['discount'][1]=0.96。

6) 删除元素

 6.1) 使用 del 命令删除一列元素

如果要删除一整列的所有数据,使用 del 命令。例如,删除产品价格中的实际价格列,其示例代码如下:

In [37]: del df['Actual_price']
In [38]: df
Out[38]:
item product price discou
id
0 电视机 3000 0.90
1 空调 2300 0.85
2 洗衣机 560 0.95
3 电脑 5600 1.00
add_row 手机 1880 1.00

6.2) 使用 pop() 函数删除一列元素

  pop() 函数可以将所选列从原数据块中删除,原数据块不再保留该列。例如,使用 pop() 函数删除折扣率列,其示例代码如下:

In [39]: df.pop('discount')
Out[39]: id
0 0.90
1 0.85
2 0.95 3 1.00
add_row 1.00
Name: discount, dtype: float64

 6.3) 使用 drop() 函数删除一列元素或删除一行元素

在 drop() 函数中有两个参数,一个参数是 axis,当参数 axis=1 时,则删除列元素;当 axis=0 时,则删除行元素。还有一个参数是 inplace,当 inplace 为 True 时,drop() 函数执行内部删除,不返回任何值,原数据发生改变;当 inplace 为 False 时,原数据不会发生改变,只是输出新变量删除。

例如,先添加 1 列折扣率列,然后再用 drop() 函数设置参数 axis=1 和 inplace=True 删除折扣率的列元素,其示例代码如下:

In [40]: df['discount']=0.94
In [41]: df.drop(['discount'],axis=1,inplace=True)

如果要删除一行,则设置 axis=0,并指定删除的行索引或行标签。例如,删除行标签为 add_row 的一行元素,其示例代码如下:

In [42]: df.drop(['add_row'],axis=0,inplace=True)

如果要删除多行,除了设置 axis=0 外,还要指定删除的行索引或行标签,例如,删除第 1 行和第 3 行元素,其示例代码如下:

In [43]: df.drop([0,2],axis=0,inplace=True)

7) 筛选元素

对于 DataFrame 对象,也可以通过指定条件来筛选元素。例如,筛选出产品价格中价格大于 2000 元的产品信息,其示例代码如下:

In [44]: df[df['price']>2000]
Out[44]:
item product price
id
0 电视机 3000
1 空调 2300
3 电脑 5600

例如,筛选出产品价格中所有元素都小于 2000 元的产品信息,其示例代码如下:

In [45]: df[df<2000]
Out[45]:
item product price
id
0 电视机 NaN
1 空调 NaN
2 洗衣机 560
3 电脑 NaN

返回的 DataFrame 对象中只包含满足条件的数字,各元素的位置保持不变,其他不符合条件的元素替换成 NaN。

8)判断元素是否存在

使用 isin() 函数可以判断给定的一列元素是否包含在 DataFrame 结构中,如果给定的元素包含在数据结构中,isin() 函数返回是 True,否则返回是 False。利用此函数可以筛选 DataFrame 列中的数据。

例如判断产品价格中是否存在“电脑”和 2300 这两个元素,并返回满足条件的元素,其示例代码如下:

In [46]: df[df.isin(['电脑',2300])]
Out[46]:
item product price
id
0 NaN NaN
1 NaN 2300.0
2 NaN NaN
3 电脑 NaN

9) DataFrame 转置

DataFrame 数据结构类似于表格数据结构,在处理表格数据时,常常会用到转置操作,即将列变成行,行变成列。pandas 提供了一种简单的转置方法,就是通过调用T属性获得 DataFrame 对象的转置形式。

例如将产品价格数据结构进行转置操作,其示例代码如下:

In [47]: df.T
Out[47]:
id 0 1 2 3
item
product 电视机 空调 洗衣机 电脑
price 3000 2300 560 5600

版权声明
本文为[元小疯]所创,转载请带上原文链接,感谢
https://www.cnblogs.com/aitree/p/14309197.html

  1. Centos7 installing Python 3.8
  2. Centos7 installing Python 3.8
  3. Django——图书管理系统(六)
  4. Django——图书管理系统(五)
  5. Django -- library management system (6)
  6. Django -- library management system (5)
  7. python批量插入数据小脚本
  8. Python batch insert data script
  9. ZoomEye-python 使用指南
  10. Zoomeye Python User's Guide
  11. 用Python写代码,一分钟搞定一天工作量,同事直呼:好家伙 - 知乎
  12. Using Python to write code, one minute to complete a day's workload, colleagues call: good guy - Zhihu
  13. Python 上的可视化库——PyG2Plot
  14. Pyg2plot: a visualization library on Python
  15. Python 上的可视化库——PyG2Plot
  16. Python实用代码-无限级分类树状结构生成算法
  17. Pyg2plot: a visualization library on Python
  18. Python utility code - infinite classification tree structure generation algorithm
  19. 奇技淫巧,还是正统功夫?Python推导式最全用法
  20. Pandas 的这个知识点,估计 80% 的人都得挂!
  21. 前后端分离有什么了不起,手把手教你用Python爬下来!
  22. 在 Azure 上执行一些简单的 python 工作
  23. 推荐 :利用Python的混合集成机器学习(附链接)
  24. Cunning or orthodox Kung Fu? The most complete usage of Python derivation
  25. It's estimated that 80% of pandas people have to hang up!
  26. What's so great about the separation of front and rear ends? Hand in hand teach you to climb down with Python!
  27. Doing some simple Python work on azure
  28. Recommendation: hybrid integrated machine learning using python (link attached)
  29. Learning PPO algorithm programming from scratch (Python version)
  30. Python OpenCV 图片模糊操作 blur 与 medianBlur
  31. Python OpenCV image blur operation blur and mediablur
  32. 成功解决cv2.error: OpenCV(4.1.2) C:\projects\opencv-python\opencv\modules\imgproc\src\color.cpp:182: err
  33. Cv2.error solved successfully: opencv (4.1.2) C:: (projects / opencv Python / opencv modules / imgproc / SRC)\ color.cpp:182 : err
  34. Python 中使用 virtualenv 管理虚拟环境
  35. Using virtualenv to manage virtual environment in Python
  36. 如何使用Python执行系统命令?Python学习教程!
  37. How to use Python to execute system commands? Python tutorial!
  38. 快速掌握Python中的循环技术
  39. Quickly grasp the loop technology in Python
  40. Python主流Web框架之Tornado
  41. appium+python自动化63-使用Uiautomator2报错问题解决
  42. Tornado: the mainstream Python Web Framework
  43. Appium + Python automation 63 - using uiautomator2 to solve the problem of error reporting
  44. 爬虫+django,打造个性化API接口
  45. Crawler + Django to create personalized API interface
  46. 爬虫+django,打造个性化API接口
  47. Crawler + Django to create personalized API interface
  48. C、C++、Java、PHP、Python主要应用在哪里方面?
  49. C. Where are the main applications of C + +, Java, PHP and python?
  50. Python 无限级分类树状结构生成算法 「实用代码」
  51. Python infinite classification tree structure generation algorithm "practical code"
  52. 【Azure 存储服务】Python模块(azure.cosmosdb.table)直接对表存储(Storage Account Table)做操作示例
  53. [azure storage service] Python module( azure.cosmosdb.table )Direct operation example of storage account table
  54. 【Azure 存储服务】Python模块(azure.cosmosdb.table)直接对表存储(Storage Account Table)做操作示例
  55. [azure storage service] Python module( azure.cosmosdb.table )Direct operation example of storage account table
  56. openpose c++ 配置教程 + python api
  57. Openpose C + + configuration tutorial + Python API
  58. PYTHON爬虫实战_垃圾佬闲鱼爬虫转转爬虫数据整合自用二手急速响应捡垃圾平台_3(附源码持续更新)
  59. 使用python javaSerializationTools模块拼接生成 8u20 Gadget
  60. 萌新入门之python基础语法