pandas系列之DataFrame数据结构

1.DataFrame介绍

​ DataFrame是由一组数据与一对索引(行索引和列索引)组成的表格型数据结构,与Excel的数据形式类似。

​ eg:

QQ拼音截图未命名.png

该数据结构和Excel的数据结构很像,既有行索引又有列索引,由行索引和列索引确定唯一值

2.DataFrame创建

import pandas as pd
复制代码

方法:pd.DataFrame()

给方法传入不同的对象即可实现创建DataFrame对象

2.1 传入一个列表创建

2.1.1 只传入一个单一列表

s1 = pd.DataFrame(["a", "b", "c", "d"])
print(s1)
复制代码

result:

   0
0  a
1  b
2  c
3  d
复制代码

此时该列表的值会显示成一列,且行和列都是从0开始的默认索引

2.1.2 传入一个嵌套列表

s2 = pd.DataFrame([["a", "A"], ["b", "B"], ["c", "C"], ["d", "D"]])
print(s2)
复制代码

result:

   0  1
0  a  A
1  b  B
2  c  C
3  d  D
复制代码

此时会根据列表数显示成多列数据,行、列索引同样是从0开始的默认索引

2.1.3 设置行索引

通过设置index参数自定义行索引

s2 = pd.DataFrame([["a", "A"], ["b", "B"], ["c", "C"], ["d", "D"]])
print(s2)
复制代码

result:

   0  1
0  a  A
1  b  B
2  c  C
3  d  D
复制代码

2.1.4 设置列索引

通过设置columns参数自定义列索引

s4 = pd.DataFrame([["a", "A"], ["b", "B"], ["c", "C"], ["d", "D"]], columns=["小写字母", "大写字母"])
print(s4)
复制代码

result:

  小写字母 大写字母
0    a    A
1    b    B
2    c    C
3    d    D
复制代码

2.1.5 同时设置行索引和列索引

s5 = pd.DataFrame([["a", "A"], ["b", "B"], ["c", "C"], ["d", "D"]], index=["一", "二", "三", "四"],
                  columns=["小写字母", "大写字母"])
print(s5)
复制代码

result:

  小写字母 大写字母
一    a    A
二    b    B
三    c    C
四    d    D
复制代码

2.2 传入字典创建

2.2.1只传入一个字典

s6 = pd.DataFrame({'小写字母': ['a', 'b', 'c', 'd'], '大写字母': ['A', 'B', 'C', 'D']})
print(s6)
复制代码

result:

  小写字母 大写字母
0    a    A
1    b    B
2    c    C
3    d    D
复制代码

此时字典的key相当于列索引,行索引使用从0开始的默认索引

2.2.1设置行索引

通过设置index参数自定义行索引

s6 = pd.DataFrame({'小写字母': ['a', 'b', 'c', 'd'], '大写字母': ['A', 'B', 'C', 'D']},
                  index=["一", "二", "三", "四"])
print(s6)
复制代码

result:

  小写字母 大写字母
一    a    A
二    b    B
三    c    C
四    d    D
复制代码

3.获取索引

3.1 获取行索引

通过index方法获取DataFrame的行索引

s1 = pd.DataFrame([["a", "A"], ["b", "B"], ["c", "C"], ["d", "D"]], index=["一", "二", "三", "四"],
                  columns=["小写字母", "大写字母"])
print(s1.index)
复制代码

result:

Index(['一', '二', '三', '四'], dtype='object')
复制代码

3.2 获取列索引

通过index方法获取DataFrame的列索引

s1 = pd.DataFrame([["a", "A"], ["b", "B"], ["c", "C"], ["d", "D"]], index=["一", "二", "三", "四"],
                  columns=["小写字母", "大写字母"])
print(s1.columns)
复制代码

result:

Index(['小写字母', '大写字母'], dtype='object')
复制代码
© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享