Vlookup本质上用于垂直排列的数据。Vlookup是一个用来合并两个不同的数据表的操作,基于一些条件,两个表之间必须有至少一个共同的属性(列)。执行这个操作后,我们得到一个由两个表的所有数据组成的表,这些数据是匹配的。
但如何使用python脚本实现Vlookup呢,下面我们用一些实例讲解用法:
首先介绍Pandas merge函数:
merge是用来拼接两张表的,那么拼接时自然就需要将用户信息一一对应地进行拼接,所以进行拼接的两张表需要有一个共同的识别用户的键(key)。总结来说,整个merge的过程就是将信息一一对应匹配的过程,
merge参数:
参数 | 说明 |
left | 左表 |
right | 右表 |
how | 连接方式,inner、left、right、outer,默认为inner |
on | 用于连接的列名称 |
left_on | 左表用于连接的列名 |
right_on | 右表用于连接的列名 |
left_index | 是否使用左表的行索引作为连接键,默认False |
right_index | 是否使用右表的行索引作为连接键,默认False |
sort | 默认为False,将合并的数据进行排序 |
copy | 默认为True,总是将数据复制到数据结构中,设置为False可以提高性能 |
suffixes | 存在相同列名时在列名后面添加的后缀,默认为(’_x’, ‘_y’) |
indicator | 显示合并数据中数据来自哪个表 |
merge的'inner'的类型称为内连接,它在拼接的过程中会取两张表的键(key)的交集进行拼接。我们有以下的数据,主表有 "i" "j" "year" 等列,及GPD等其它若干子表
读取主表
data=pd.read_excel("变量a.xlsx",sheet_name="面板数据")
data