Python数据标准化
程序员文章站
2022-07-16 17:07:57
...
Catalog
零一标准化
import pandas as pd
import matplotlib.pyplot as mp
d = {'name': list('ABCD'), 'value': [1002, 1000, 1010, 1001]}
df = pd.DataFrame(d)
# 0-1标准化
value_01 = (
(df['value'] - df['value'].min())
/
(df['value'].max() - df['value'].min())
)
df['0-1'] = value_01
print(df)
# 可视化
mp.figure(num='Title', facecolor='lightgray', figsize=(6, 3))
# 左图:处理前
mp.subplot(1, 2, 1)
mp.title('origin', fontsize=12)
mp.bar(df['name'], df['value'], 0.2, color='dodgerblue', label='value')
mp.legend()
# 右图:【零一标准化】处理后
mp.subplot(1, 2, 2)
mp.title('0-1 standardization', fontsize=12)
mp.bar(df['name'], df['0-1'], 0.2, color='orangered', label='0-1')
mp.legend()
# 展示
mp.tight_layout() # 紧凑布局,防止叠压
mp.show()
以中位数为0的可视化
import pandas as pd
import matplotlib.pyplot as mp
d = {'name': list('ABCD'), 'value': [101, 95, 115, 100]}
df = pd.DataFrame(d)
# 中位数变0
median0 = (
(df['value'] - df['value'].median())
)
df['median-->0'] = median0
print(df)
# 可视化
mp.figure(num='Title', facecolor='lightgray', figsize=(6, 3))
# 左图:处理前
mp.subplot(1, 2, 1)
mp.title('origin')
mp.bar(df['name'], df['value'], 0.2, color='dodgerblue', label='origin')
mp.legend()
# 右图:【中位数变0】处理后
mp.subplot(1, 2, 2)
mp.title('median-->0')
ax = mp.gca() # 获取当前坐标轴对象
ax.spines['bottom'].set_position(('data', 0)) # 将底边框置于数据坐标原点
mp.bar(df['name'], df['median-->0'], 0.2, color='orangered', label='median-->0')
mp.legend()
# 展示
mp.tight_layout() # 紧凑布局,防止叠压
mp.show()
上一篇: TensorFlow——批标准化
下一篇: BugkuCTF:想蹭网先解开密码
推荐阅读
-
当用python读取几十万行文本时,会出现什么状况?
-
通过Java实现批量导入数据到SQLServer数据库
-
PHP 正则匹配h1的数据报错 preg_match(): Unknown modifier 'h' in
-
SpringMVC参数绑定学习总结【前后端数据参数传递】
-
为了能早点买房,我用 Python 预测房价走势!
-
python基础(9):基本数据类型四(set集合)、基础数据类型补充、深浅拷贝
-
Python爬虫使用selenium爬取qq群的成员信息(全自动实现自动登陆)
-
Python代码报错看不懂?记住这20个报错提示单词轻松解决bug
-
python基础(10):文件操作
-
给缺少Python项目实战经验的人