欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

python数据分析-pandas模块基础知识(1)

程序员文章站 2023-09-17 23:42:19
呀~博主是正在学习数据分析的一员,记录的是自己学习过程中总结的知识点,肯定有不完善的地方,如有问题可以私聊我改正,共同学习进步。希望大家都能保持学习的热情,坚持自己,不断超越自己!博客地址:qxi的博客#今天就开始总结pandas模块的基础知识啦~#为了入门pandas,需要熟悉两个常用的工具数据结构,Series和DataFrame。尽管他们并不能解决所有的问题,但它们为大多数应用提供了一个有效、易用的基础。这篇文章先介绍Series,Series是一种一维数组型对象,它包含了一个值序列(与n....

呀~博主是正在学习数据分析的一员,记录的是自己学习过程中总结的知识点,肯定有不完善的地方,如有问题可以私聊我改正,共同学习进步。希望大家都能保持学习的热情,坚持自己,不断超越自己!
博客地址:qxi的博客

#今天就开始总结pandas模块的基础知识啦~#
为了入门pandas,需要熟悉两个常用的工具数据结构,SeriesDataFrame。尽管他们并不能解决所有的问题,但它们为大多数应用提供了一个有效、易用的基础。
这篇文章先介绍Series,Series是一种一维数组型对象,它包含了一个值序列(与numpy中的类型相似),并且包含了数据标签,称为索引(index)。换个角度考虑Series,可以认为它是一个长度固定且有序的字典,因为它将索引值以及序列值按位置配对。
PS:文中的pd代表模块pandas
①直接用pd.Series()函数就可以生成Series了,可以看到索引值在左边,序列值在右边,当不知道索引时,默认生成的索引是从0到N-1(N是数据的长度)。可以通过values属性以及index属性分别获取Series对象的值和索引。

import pandas as pd
s=pd.Series([12,3,5,-7]) #括号里是一维数组,就是一个序列
print(s)
print(s.values)
print(s.index)

运行结果:

0    12
1     3
2     5
3    -7
dtype: int64 #数据类型
[12  3  5 -7]  #获取序列值
RangeIndex(start=0, stop=4, step=1) #获取索引值,与range(4)类似

②利用index=[]对Series对象指定索引

import pandas as pd
s=pd.Series([12,3,5,-7],index=['a','b','c','d'])
print(s)

运行结果:

a    12
b     3
c     5
d    -7
dtype: int64

③利用索引标签进行索引,提取出数据
[‘a’,’b’,’c’]包含的不是数字而是字符串,作为索引列表

import pandas as pd
s=pd.Series([12,3,5,-7],index=['a','b','c','d'])
print(s)
print(s['a'])
print(s[['a','b','c']]) #两个中括号

运行结果:

a    12
b     3
c     5
d    -7
dtype: int64
12 #s['a']结果
a    12
b     3
c     5   #s[['a','b','c']]结果

④对数据进行更改,类似字典中更改值的操作

import pandas as pd
s=pd.Series([12,3,5,-7],index=['a','b','c','d'])
print(s)
s['a']=10 #对数据进行更改,类似字典的操作
print(s['a'])

运行结果:

a    12
b     3
c     5
d    -7
dtype: int64
10

⑤使用布尔值数组进行过滤,与标量相乘,或者是应用数学函数对Series对象进行操作

import pandas as pd
import numpy as np
s=pd.Series([12,3,5,-7],index=['a','b','c','d'])
print(s>0) #仅仅是判断而已,返回True或者False
print(s[s>0]) #判断并提取出来
print(s*10) #乘上10
print(np.exp(s)) 

运行结果:

a     True
b     True
c     True
d    False
dtype: bool
a    12
b     3
c     5
dtype: int64
a    120
b     30
c     50
d    -70
dtype: int64
a    162754.791419
b        20.085537
c       148.413159
d         0.000912
dtype: float64

如果觉得对你有一点点帮助的话记得点赞哟~

本文地址:https://blog.csdn.net/hswqxi/article/details/107368822