Python使用逻辑回归估算OR值--688IT编程网

Python使⽤逻辑回归估算OR值第⼀种是统计学⽅法，需要⽤到 statsmodels包

是统计和计量经济学的package，包含了⽤于参数评估和统计测试的实⽤⼯具

第⼆种是机器学习，需要使⽤sklearn中的LogisticRegression

下⾯以计算dis1-->dis2的OR值为例，也就是说dis1为⾃变量，dis2为因变量

⾸先我们先造⼀组数据： x为⾃变量，y为因变量

df = pd.DataFrame({'x': ['dis1', 'dis1', 'dis1', 'dis1', 'dis3', 'dis3', 'dis3', 'dis3'], 'y': ["dis2", "dis2",

"dis2", "dis4", "dis4", "dis4", "dis4", "dis2"]})

因为我要使⽤逻辑回归估计OR值，所以⾸先会计算出实际的OR值

患dis2不患dis2

患dis1A B

不患dis1C D

OR值的计算:OR_dis1_dis2 = AD/BC，其中A = 3, B = 1, C = 1, D = 3

ct = pd.crosstab(df.x, df.y)

oddsratio, pvalue = stats.fisher_exact(ct)

使⽤stamodel包中的逻辑回归进⾏OR值的估计：

df["intercept"] = 1.0 # 截距项，初始化截距项，不可省

# 拟合模型

logit = sm.Logit(df['y'], lumns[1:]])

result = logit.fit()

print(result.summary())

# 计算得到OR值

OR1 = np.exp(result.params)

使⽤机器学习⽅法计算OR

df = pd.get_dummies(df)

clf = LogisticRegression(penalty='none')

clf.fit(df[['x_dis1']], df[['y_dis2']].values)

print(clf)

odds_ratio = np.f_)

print(odds_ratio)

完整代码：

import pandas as pd

import statsmodels.api as sm

from sklearn.linear_model import LogisticRegression

import numpy as np

# 构造数据

df = pd.DataFrame({'x': ['dis1', 'dis1', 'dis1', 'dis1', 'dis3', 'dis3', 'dis3', 'dis3'], 'y': ["dis2", "dis2",

odds

"dis2", "dis4", "dis4", "dis4", "dis4", "dis2"]})

# 计算实际OR

ct = pd.crosstab(df.x, df.y)

oddsratio, pvalue = stats.fisher_exact(ct)

# 使⽤统计学⽅法计算

df["intercept"] = 1.0 # 截距项，初始化截距项，不可省# 拟合模型

logit = sm.Logit(df['y'], lumns[1:]])

result = logit.fit()

print(result.summary())

# 计算得到OR值

OR1 = np.exp(result.params)

# 使⽤机器学习⽅法计算

df = pd.get_dummies(df)

clf = LogisticRegression(penalty='none')

clf.fit(df[['x_dis1']], df[['y_dis2']].values)

print(clf)

odds_ratio = np.f_)

print(odds_ratio)

发表评论

688IT编程网

Python使用逻辑回归估算OR值

发表评论

推荐文章

vb窗体fillcolor的用法

arm是一个处理器

实验一MC68HC908GP32入门实验

GIS原理与应用教案——《GIS设计与开发》实习指导书 1个

信息技术考试100题--1、信息的编程加工里面()是编程的核心,是解决问题...

热门文章

vb大一考试题库

教科版选修1第二节《编一个简单的VB程序》同步测试

缺VB、吃食物的目的、VE、VA、VC、一日三餐、健康问题

netlogo基础知识讲解

项目一计算机基础知识

VB书面习题答案(1-8章)

vb前三章练习题

高中信息技术 2.4.1 FOR循环语句教学设计

选修1算法与程序设计《21枚举算法》优质课教案

VBAI-第一章概述

vb scriptlet1 用法

vb中10mod3的值

数据类型、常量和变量的教学设计与反思

API入门教程

超有用的VB 基础集合

高中VB必考知识点汇总

vb net程序设计知识点

vb6.0的基本表达式

VB教案(6)vb的数据类型

VB实习报告

最新文章

vb窗体fillcolor的用法

arm是一个处理器

信息技术考试100题--1、信息的编程加工里面()是编程的核心,是解决问题...

粤教版高中信息技术选修1 3

《信息技术基础》模拟测试卷(一)

2012年上海市高中《信息科技》学业水平考试1-5(含答案)

标签列表

688IT编程网

Python使用逻辑回归估算OR值

发表评论

推荐文章

vb窗体fillcolor的用法

arm是一个处理器

实验一MC68HC908GP32入门实验

GIS原理与应用教案——《GIS设计与开发》实习指导书 1个

信息技术考试100题--1、信息的编程加工里面()是编程的核心,是解决问题...

热门文章

vb大一考试题库

教科版选修1第二节《编一个简单的VB程序》同步测试

缺VB、吃食物的目的、VE、VA、VC、一日三餐、健康问题

netlogo基础知识讲解

项目一 计算机基础知识

VB书面习题答案(1-8章)

vb前三章练习题

高中信息技术 2.4.1 FOR循环语句教学设计

选修1算法与程序设计《21枚举算法》优质课教案

VBAI-第一章 概述

vb scriptlet1 用法

vb中10mod3的值

数据类型、常量和变量的教学设计与反思

API入门教程

超有用的VB 基础集合

高中VB必考知识点汇总

vb net程序设计知识点

vb6.0的基本表达式

VB教案(6)vb的数据类型

VB实习报告

最新文章

vb窗体fillcolor的用法

arm是一个处理器

信息技术考试100题--1、信息的编程加工里面()是编程的核心,是解决问题...

粤教版高中信息技术选修1 3

《信息技术基础》模拟测试卷(一)

2012年上海市高中《信息科技》学业水平考试1-5(含答案)

标签列表

项目一计算机基础知识

VBAI-第一章概述