B-经济学-基尼指数

目录

基尼指数
一、基尼指数简介

更新、更全的《机器学习》的更新网站，更有python、go、数据结构与算法、爬虫、人工智能教学等着你：https://www.cnblogs.com/nickchen121/

基尼指数

一、基尼指数简介

基尼指数（gini coefficient）代表了模型的不纯度，基尼指数越小，则不纯度越低；基尼指数越大，则不纯度越高，这和信息增益比是相反的。

假设一个训练集有\(K\)个类别，样本属于第\(k\)个类别的概率为\(p_k\)，则它的基尼指数为
\[
G(p) = \sum_{k=1}^K p_k (1-p_k) = 1 - \sum_{k=1}^K p_k^2
\]
如果是二分类问题，其中一个分类的概率为\(p\)，则它的基尼指数为
\[
G(p) = 2 p(1-p)
\]
对于某一个训练集\(D\)，假设训练集有\(K\)个类别，并且第\(k\)个类别有\(C_k\)个样本，则\(D\)的基尼指数为
\[
G(D) = 1 - \sum_{k=1}^K ({\frac {|C_k|} {|D|}})^2
\]
对于某一训练集\(D\)，如果根据特征\(T\)的某个特征值是否等于\(t\)把\(D\)分成两个子集\(D_1\)和\(D_2\)
\[
D_1 = \{(x,y)\in{D}|A(x)=t\},\quad D_2 = D-D_1
\]
则\(D\)的基尼指数为
\[
G(D,A) = ({\frac {|D_1|} {|D|}})G(D_1) + ({\frac {|D_2|} {|D|}})G(D_2)
\]
基尼指数\(G(D)\)表示\(D\)的不确定性，基尼指数\(G(D,A)\)表示经过\(T=t\)分割后\(D\)的不确定性。基尼指数越大，样本集合的不确定性也就越大，不纯度越高。

原文地址：https://www.cnblogs.com/nickchen121/p/11686701.html

时间： 2024-10-09 14:01:49

B-经济学-基尼指数的相关文章

决策树中的熵和基尼指数

决策树是一种很基本的分类与回归方法,但正如前面博文机器学习排序算法:RankNet to LambdaRank to LambdaMART中所讲的LambdaMART算法一样,这种最基本的算法却是很多经典.复杂.高效的机器学习算法的基础.关于什么是决策树,网上一搜就会有很多博客文章,所以本文并不想讨论这个话题.本文想讨论的是决策树中两个非常重要的决策指标:熵和基尼指数.熵和基尼指数都是用来定义随机变量的不确定性的指标.下面先介绍什么是随机变量的不确定性. 1. 随机变量的不确定性什么是随机变量

决策树系列三——基尼指数，减枝和

-- coding: utf-8 -- """ Created on Tue Aug 14 17:36:57 2018 @author: weixw """ import numpy as np 定义树结构,采用的二叉树,左子树:条件为true,右子树:条件为false leftBranch:左子树结点 rightBranch:右子树结点 col:信息增益最大时对应的列索引 value:最优列索引下,划分数据类型的值 results:分类结果 s

比基尼美女_人像摄影吧主题 - 云寻觅云贴吧

云贴吧首页注册登录首页贴吧分类人像摄影吧比基尼美女比基尼美女回复主题楼主佚名比基尼美女比基尼美女这是在地下3层的洗车房的群拍作品. [器材]:佳能数码相机佳能 5D Mark III [参数] 光圈: F/1.6 焦距:35 毫米感光度:160 2楼匿名用户比基尼美女 [器材]:佳能数码相机佳能 5D Mark III [参数] 光圈: F/1.6 焦距:35 毫米感光度:800 2014-12-02 16:20 3楼匿名用户比基尼美女 [器材]:佳能数码

物化时代：“美国小姐”取消比基尼比赛

感谢雪梨! 今日导读一年一度的"美国小姐"大赛,总能吸引大批观众和粉丝的目光.最近外媒官方宣布,过往最吸睛的项目之一:比基尼选秀,从明年度(2019)大赛开始将被取消.<纽约时报>新刊登的一篇新闻就对此事进行了独到的评论,语言讽刺有深意,很值得一读,今天就让我们跟着雪梨老师一起来读一读其中的节选. 新闻正文 The bikini contest is over, but we are living inside the beauty pageant 比基尼选美结束了,但我

JASFKD比基尼DSG秀大长腿F彩虹股

http://www.iliangcang.com/i/usermain/favour/?id=800396012 http://www.iliangcang.com/i/usermain/favour/?id=279243458 http://www.iliangcang.com/i/usermain/favour/?id=115256356 http://www.iliangcang.com/i/usermain/favour/?id=537438345 http://www.iliangc

决策树-预测隐形眼镜类型（ID3算法，C4.5算法，CART算法，GINI指数,剪枝，随机森林）

1. 1.问题的引入 2.一个实例 3.基本概念 4.ID3 5.C4.5 6.CART 7.随机森林 2. 我们应该设计什么的算法,使得计算机对贷款申请人员的申请信息自动进行分类,以决定能否贷款? 一个女孩的母亲要给这个女孩介绍男朋友,于是有了下面的对话: 女儿:多大年纪了? 母亲:26. 女儿:长的帅不帅? 母亲:挺帅的. 女儿:收入高不? 母亲:不算很高,中等情况. 女儿:是公务员不? 母亲:是,在税务局上班呢. 女儿:那好,我去见见. 决策过程: 这个女孩的决策过程就是典型的分类树决策.

决策树学习基决策树学习基本算法

决策树学习基本算法输入:训练集; ???? 属性集. 过程:函数 1: 生成结点node; 2: if 中样本全属于同一类别 then 3: ????将node标记为类叶结点; return 4: end if 5: if 中样本在上取值相同 then 6: 将node标记为叶结点,其类别标记为中样本数最多的类; return 7: end if 8: 从中选择最优化分属性 9: for 的每一个值 do 10: 为node生成一个分支; 令表示中在上取值为的样本子集; 11:???? if

决策树（理论篇）

定义由一个决策图和可能的结果(包括资源成本和风险组成),用来创建到达目的的规划.——维基百科通俗理解给定一个输入值,从树节点不断往下走,直至走到叶节点,这个叶节点就是对输入值的一个预测或者分类. 算法分类 ID3(Iterative Dichotomiser 3,迭代二叉树3代) 历史 ID3算法是由Ross Quinlan发明的用于生成决策树的算法,此算法建立在奥卡姆剃刀上.奥卡姆剃刀又称为奥坎的剃刀,意为简约之法则,也就是假设越少越好,或者“用较少的东西,同样可以做好的事情”,即越是小

基尼系数（Gini coefficient）,洛伦茨系数

20世纪初意大利经济学家基尼,于1922年提出的定量测定收入分配差异程度的指标.它是根据洛伦茨曲线找出了判断分配平等程度的指标(如下图). 设实际收入分配曲线和收入分配绝对平等曲线之间的面积为A,实际收入分配曲线右下方的面积为B.并以A除以A+B的商表示不平等程度.这个数值被称为基尼系数或称洛伦茨系数.如果A为零,基尼系数为零,表示收入分配完全平等:如果B为零则系数为1,收入分配绝对不平等.该系数可在零和1之间取任何值.收入分配越是趋向平等,洛伦茨曲线的弧度越小,基尼系数也越小,反之,收入分配越

猜你喜欢

级联复制转化成一主两从

1.如图,级联复制如果转化成一主两从? GTID复制处理方法: 只需要把S2的复制停掉,然后重新change到M上即可: S2: stop slave; reset slave all; change ...

redis常用知识总结(一)

Redis相关知识总结(一) 一.redis的安装 1. 在windows上安装redis服务器 1) 下载windows版的redis安装包解压到c盘根目录 2) 在解压后 ...

让程序只运行一个实例

Windows 下一个典型的特征就是多任务,我们可以同时打开多个窗口进行操作,也可以同时运行程序的多个实例,比如可以打开许多个资源管理器进行文件的移动复制操作.但有时出于某种考虑(比如安全性),我们要 ...

粤嵌java培训第一天笔记-java基础概念

一.二进制数 1.最高位为0,表示正数:最高位为1,表示负数. 2.相应的负数与正数之间进行转换方式:通过补码方式进行转换,即:取反再加1. 例如:0000 0001 表示 +1:通过对 0000 0 ...

实现文件上传，以及表单提交成功的回调函数

最近在项目中需要实现图片的上传,并且成功后返回图片上传保存路径,通过查找资料探索研究,实现了项目功能需求,记在这方便自己以后查阅,也为有同样需求的码友分享,功能实现比较简单,如果有好的建议和实现方法, ...

unity3d之角色的移动篇 -- 俯视视角下的鼠标移动

类似DOTA游戏的移动方法, 其余没什么好说的了. using UnityEngine; using System.Collections; public class gogogogo : MonoB ...

dsfggdsa

http://www.yueduge.net/book/39/39571/3814810.html http://www.yueduge.net/book/39/39571/3814813.html ...

css中的浮动

在写程序的过程中经常会遇到这样的问题:希望某一个块或者元素到我指定的区域.这就涉及到定位和浮动的问题,下面我将详细说明css中的浮动. 一.浮动(float)------- 正常文档流中:块级元素从上 ...

static inner class 什么时候被加载

一直认为在加载outer class 的同时也会加载inner class 并且完成静态变量和代码块的初始化,今天在维基百科上面看到 "The static class definition ...

锁屏黑屏界面手势绘图打开应用

韩梦飞沙韩亚飞 [email protected] yue31313 han_meng_fei_sha 黑屏手势直击应用锁屏激活 koncker v1.6[GCA汉化组]..._机锋论坛

Python3基础 pop(有参数) 取出列表中的指定索引的元素

镇场诗: 诚听如来语,顿舍世间名与利.愿做地藏徒,广演是经阎浮提. 愿尽吾所学,成就一良心博客.愿诸后来人,重现智慧清净体.-------------------------------------- ...

java导出大量的excel

废话少说,直入主题基本思路为创建一个临时文件写入数据导出数据删除临时文件首先需要两个jar包 antlr和stringtemplate 创建数据库中的类Row private ...

理解the Username-Password OAuth Authentication Flow

用户名-密码身份验证流可用于在身份验证,当用户拥有用户的凭据时.在这个流程中,用户的凭据由应用程序使用,用以请求一个访问令牌,如下列步骤中所示. 此oauth身份验证流来回传递用户凭据.仅当必要时,使 ...

linux下配置ssledge代理服务器

ssl edge 是一个非常好用的VPN/proxy, 比云梯稳定快速的多. 在LINUX下开发 Titanium 需要用到各种FQ,所以它是必备工具. 1. 根据自己付费后的用户名和密码,下载 ...

Effective C++(Third Edition) Item29 为“异常安全”而努力是值得的

“异常安全”有两个条件: 1.不泄露任何资源可以通过以对象管理资源的方式(Item13). 2.不允许数据败坏异常安全函数提供以下三种保证之一 a.基本承诺如果异常被抛出,程序内的任何事物都仍然 ...

软件工程随堂小作业——随机四则运算Ⅱ（C++）

一.设计思路设计思路已在上一篇日志中给出,此处不再赘述. 二.源代码三.截图四.PSP0级记录表项目计划总结: 周活动总结表姓名:袁佩佩日期: 日期 ...

javaweb：判断当前请求是否为移动设备访问

这段时间都是在做pc端的业务,结果经理找到我说,可能要做移动端的应用,后台逻辑还是用我写的逻辑,但是需要改动一些,看看怎么处理. 由于移动端和pc端还是稍微有些区别的,我觉得最好是在一个地儿统一判断, ...

OpenCV Error: Insufficient memory问题解析

前言项目程序运行两个月之久之后突然挂了,出现OpenCV Error: Insufficient memory的错误,在此分析一下该问题. 问题的表现形式: 程序内存使用情况: 问题: OpenCV ...

随机得到指定长度的随机字符串，可以用于实现动态验证码

在开发过程中,可能需要得到指定长度的字符串,比如验证码就有这种需求,对此存在几种常见的方法,总结如下: 1.指定一个数组或者字符串,通过Math.random()得到一个随机数,并作为下表进行字符的获 ...

MATLAB——第二天矩阵

写在前面我们都知道,在没有持久化存储的情况下,大部分的数据是存储在数组里面的, 也就是对应于数学中的矩阵, 对于一个矩阵而已,最重要的不外乎:赋值,操作,取值初始化矩阵在MATLAB里给一个矩阵 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.026 s.