Li‘s影像组学视频学习笔记(19)-数据标准化、归一化极简概述--688IT编程网

Li‘s影像组学视频学习笔记（19）-数据标准化、归⼀化极简概述

本笔记来源于B站Up主: 有Li 的影像组学系列教学视频

本节(19)主要介绍:

为什么要进⾏标准化、归⼀化？

1. 机器学习算法的要求

2. 便于横向⽐较

# 标准化 (影像组学中最常⽤)

# z = (x - u)/s

# 异常值⼀般对结果影响不⼤

from sklearn.preprocessing import StandardScaler

data = [[10,-20],[0.3,999],[-1,12],[0.1,21]]

res = StandardScaler().fit_transform(data)

print(res)

Output:

# [[ 1.72127555 -0.63345074]

# [-0.46125685 1.73096796]

# [-0.75376119 -0.55920011]

# [-0.50625751 -0.53831711]]

# 归⼀化

# X_std = (X - X.min(axis=0)) / (X.max(axis=0) - X.min(axis=0))

transform中文翻译# 异常值有可能对结果有重要影响

from sklearn.preprocessing import MinMaxScaler

data = [[10,-20],[0.3,999],[-1,12],[0.1,21]]

res = MinMaxScaler().fit_transform(data)

print(res)

Output:

# [[1. 0. ]

# [0.11818182 1. ]

# [0. 0.03140334]

# [0.1 0.04023553]]

# 与IQR第1四分位数（第25个分位数）和第3个四分位数（第75个分位数）之间的范围相关。

# 不常⽤

from sklearn.preprocessing import RobustScaler

data = [[10,-20],[0.3,999],[-1,12],[0.1,21]]

res = RobustScaler().fit_transform(data)

print(res)

Output:

[[ 3.37931034 -0.13957935]

[ 0.03448276 3.75717017]

[-0.4137931 -0.01720841]

[-0.03448276 0.01720841]]

Notes:

# 影像组学研究中有两处涉及标准化或归⼀化，⼀是在图像预处理时，⼆是特征提取后

# Image normalization 图像归⼀化

# normalize 当设置为True时，对图像进⾏归⼀化处理，默认为False

# normalizeScale: 对图像进⾏归⼀化处理的⽐例，默认为1

# RemoveOutliers: 从图像中剔除的离值

继续深化学习这两个概念时，发现⽹上对这个的讨论很热闹，原因是由于翻译的不⼀致，导致概念的混乱，所以最好的办法就是回归英⽂中的本来定义。

"标准化"和"归⼀化"这两个中⽂词要指代四种Feature scaling(特征缩放)⽅法：

Rescaling (min-max normalization) ，有时简称normalization(有点坑)。

⼀般把第⼀种叫做归⼀化，第三种叫做标准化。

具体可参考知乎上的讨论帖：

答主@龚焱及@gokenu 回答的⽐较详细了。

RadiomicsWorld “影像组学世界”论坛：

688IT编程网

Li‘s影像组学视频学习笔记(19)-数据标准化、归一化极简概述

发表评论

推荐文章

Linux怎么直接执行PHP脚本文件

php文件写入或追加数据

php中实现文件上传的函数

php文件上传类程序代码

413 request entity too large 解决方法 -回复

热门文章

php中用来导入其他文件的语句

php获取文件后缀名的方法

创建php文件方法

国家电网公司电子商务平台常见问题

【2018-2019】别克英朗说明书-实用word文档 (12页)

诺基亚E71常见问题以及解决方法

HXD3型电力机车故障应急处理

卫星电视中星9号解密方法及节目参数,长期可用

硬盘U盘等启动奶瓶beini详细步骤教程

BT3使用教程

破解网通铁通电信封路由器的几种方法

手把手教你WPA2加密无线网络

教你如何破解搜索到的无线网络

Get清风OD入门系列图文详细教程、破解做辅助起步

java rar破解原理

同余方程在密码学中的应用与破解

无限网络解码

winrar破解方法

macOS终端中的文件加密和解密技巧

rar加密原理

最新文章

php中实现文件上传的函数

413 request entity too large 解决方法 -回复

php实现编辑和保存文件的方法

php 配置文件的用法 -回复

突破php网站上传文件大小限制

php(实现url重写)

标签列表