机器学习——特征工程和评价指标

2023-09-20 21:42:44

0、前言:

  • 首先学习特征工程这部分知识之前,要对机器学习的算法用过使用。

1、特征工程:

  • 就机器学习的数据而言,特征就是数据的列名,有多少列,就有多少个维度的特征。就定义而言,特征是指数据中抽取出来对结果预测有用的信息。
  • 特征工程就是使用一些技巧来处理数据,使数据特征能在机器学习算法中发挥更好的作用
  • 本质而言,特征工程其实就是数据预处理

2、机器学习常见评价指标:

  • 1、AUC是二分类模型的一个评价指标,与AUC相关的就是ROC曲线,AUC的值是ROC曲线下的面积,AUC越接近1,说明模型越好,越接近0,说明模型越差,AUC的值在0.7以上就算比较好了。ROC曲线绘制原理如下:
    在这里插入图片描述

  • 2、Precision(精确率/查准率)、Recall(召回率/查全率)、F-measure、Accuracy(准确率)
    在这里插入图片描述


3、绘制ROC曲线:

  • 通过下面的示例,主要了解sklearn.metrics第三方库是用于评价机器学习模型的库,并且知道其中的auc和roc_curve两个评价指标的调用方式。
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.datasets import load_iris
data, target = load_iris(return_X_y=True)
data.shape # (150, 4)
# AUC是二分类问题才能计算的
c = target<2
a = [0,1]
data2 = data[c].copy()
target2 = target[c].copy()
data2.shape,target2.shape
from sklearn.metrics import auc,roc_curve
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
x_train,x_test,y_train,y_test = train_test_split(data2,target2,test_size=0.2)
x_train.shape,y_train.shape
lr = LogisticRegression()
lr.fit(x_train,y_train)
y_pred = lr.predict(x_test)
y_pred
# ROC曲线
# 参数1:y_true(真实结果),y_score(预测结果)
fpr,tpr,_ = roc_curve(y_true=y_test,y_score=y_pred) # (array([0., 0., 1.]), array([0., 1., 1.]), array([inf,  1.,  0.]))

# ROC曲线横轴是FPR,纵轴是TPR
plt.plot(fpr,tpr,ls='--')
plt.title('ROC')
# AUC是ROC曲线下的面积,不好计算时,可以通过函数获取auc(fpr,tpr)
AUC = auc(fpr,tpr)
AUC

在这里插入图片描述


更多推荐

ELK 企业级日志分析系统

ELK概述1、ELK简介ELK平台是一套完整的日志集中处理解决方案,将ElasticSearch、Logstash和Kiabana三个开源工具配合使用,完成更强大的用户对日志的查询、排序、统计需求。ElasticSearch:是基于Lucene(一个全文检索引擎的架构)开发的分布式存储检索引擎,用来存储各类日志。Ela

Java虚拟机栈

Java虚拟机栈(JavaVirtualMachineStack)也是线程私有的,它的生命周期与线程相同。虚拟机栈描述的是Java方法执行的线程内存模型:每个方法被执行的时候,Java虚拟机都会同步创建一个栈帧(StackFrame)用于存储局部变量表、操作数栈、动态连接、方法出口等信息。每一个方法被调用直至执行完毕的

游戏笔记本电脑可以进行 3D 建模和渲染吗?有哪些优势与缺点?

3D建模和渲染是创建令人惊叹的数字艺术、动画和游戏体验的最流行和最广泛使用的工具之一。随着技术的进步,对运行这些模型的强大计算机的需求呈指数级增长。对于那些寻求强大机器来处理3D建模任务的人来说,游戏笔记本电脑已成为一个可行的选择。游戏笔记本电脑适合3d建模吗?游戏笔记本电脑因其性能和便利性而变得越来越受欢迎,而且它们

大数据课程M1——ELK的概述

文章作者邮箱:yugongshiye@sina.cn地址:广东惠州▲本章节目的⚪了解ELK的定义;⚪掌握ELK的使用;一、什么是ELK1.简介ELK是elastic公司提供的一套完整的日志收集以及展示的解决方案,是三个产品的首字母缩写,分别是ElasticSearch、Logstash和Kibana。2.ELASTIC

【ELK】日志分析系统概述及部署(ELFK部署实验)

目录一、ELK概述1、ELK是什么?2、ELK的组成部分2.1ElasticSearch(1)分片和副本(2)es和传统数据库的区别2.2Kiabana2.3Logstash(1)LogStash主要组件2.4可添加的其它组件3、为什么要使用ELK二、完整日志系统基本特征三、ELK工作原理四、部署ELK日志分析系统实验

0基础学习VR全景平台篇 第100篇:美团酒店丨平台上传全景全流程

目前美团平台已经具备VR全景图在美团App客户端的展示能力,但目前E-Booking暂未开通上传通道,若商家您有全景图且有意愿上传至平台,需要签署授权书,并依照规定的格式要求发送邮件申请,由平台代为人工上传。具体规则和要求有哪些呢?小编带大家了解一下!应用人群本功能适用于所有已经入驻了美团酒店平台的酒店商家上传流程邮件

【PostgreSQL内核学习(十一)—— (CreatePortal)】

CreatePortal概述CreatePortal函数GetPortalByName函数PortalHashTableLookup函数MemoryContextAllocZero函数AllocSetContextCreate函数ResourceOwnerCreatePortalHashTableInsert总结声明:

分享VR眼镜加密播放器OEM方案

随着科技的发展,电子成品更新换代很快,用户的娱乐工具也更加多样化,从电脑、手机、平板在到现在使用越来越多的VR眼镜,给用户的体验也越来越多样。而对于内容提供商来说,内容是其竞争优势所在。那么如何做好视频在VR眼镜中的安全播放呢?考虑VR眼镜的特殊性,用户在初期使用可能不是很熟悉,因此对VR视频加密要考虑用户的便捷性。如

MyBatis执行SQL的两种方式

MyBatis有两种执行SQL语句的方式,如下:通过SqlSession发送SQL通过SqlSession获取Mapper接口,通过Mapper接口发送SQLSqlSession发送SQL有映射器之后就可以通过SqlSession发送SQL了。我们以getWebsite这条SQL为例看看如何发送SQL。Websitew

注入之SQLMAP(工具注入)

isqlmap是一个自动化的SQL注入工具,其主要功能是扫描,发现并利用给定的URL和SQL注入漏洞,其广泛的功能和选项包括数据库指纹,枚举,数据库提权,访问目标文件系统,并在获取操作权限时执行任意命令。希望这篇文章能让你不仅有一定的收获,而且可以愉快的学习,如果有什么建议,都可以留言和我交流sqlmap相关参数介绍-

广州华锐互动:利用VR复原文化遗址,沉浸式体验历史文物古迹的魅力

在过去的几十年里,科技发展飞速,为我们打开了无数新的视角和可能性。其中,虚拟现实(VirtualReality,简称VR)技术的崭新应用,为我们提供了一种全新的、近乎身临其境的体验历史的方式。本文将重点探讨VR技术在复原历史古迹方面的应用及其潜力。虚拟现实技术是一种可以创建和体验虚拟世界的计算机模拟系统。它利用计算机生

热文推荐