西瓜书课后习题——第一章

1.1

若表中只包含编号1和4两个样例,则训练数据集为

色泽 根蒂 敲声 是否好瓜
青绿 蜷缩 浊响
乌黑 稍蜷 沉闷

上表有三个属性,每个属性有两种取值,所以上述数据集的假设空间大小为3*3*3+1=28

编号 色泽 根蒂 敲声 与训练集正例是否一致
1 青绿 蜷缩 浊响
2 青绿 蜷缩 沉闷  
3 青绿 蜷缩
4 青绿 稍蜷 浊响  
5 青绿 稍蜷 沉闷  
6 青绿 稍蜷  
7 青绿 浊响
8 青绿 沉闷  
9 青绿
10 乌黑 蜷缩 浊响  
11 乌黑 蜷缩 沉闷  
12 乌黑 蜷缩  
13 乌黑 稍蜷 浊响  
14 乌黑 稍蜷 沉闷  
15 乌黑 稍蜷  
16 乌黑 浊响  
17 乌黑 沉闷  
18 乌黑  
19 蜷缩 浊响
20 蜷缩 沉闷  
21 蜷缩
22 稍蜷 浊响  
23 稍蜷 沉闷  
24 稍蜷  
25 浊响
26 沉闷  
27  
28 空集      

所以版本空间为假设1、3、7、9、19、21、23

1.2

训练数据集1.1有三个属性,色泽有3种情况(青绿、乌黑、※),根蒂有4种情况(蜷缩、硬挺、稍蜷、※),敲声有4种情况(浊响、清脆、沉闷、※),加上空集则共有3*4*4+1=49种假设。在不考虑沉余的情况下,最多包含49个合取式来表达假设空间,每次从中选取k个合取式来组成折合式,共有ΣCk49=249种情况。但是其中包含了很多沉余的情况(至少存在一个合取式被剩余的析合式完全包含<空集除外>)。

https://blog.csdn.net/icefire_tyh/article/details/52065626

1.3

通常认为两个数据的属性越相近,则更倾向于将他们分为同一类。若相同属性出现了两种不同的分类,则认为它属于与他最临近几个数据的属性。也可以考虑同时去掉所有具有相同属性而不同分类的数据,留下的数据就是没误差的数据,但是可能会丢失部分信息。

1.4

1.5

问题的特征表示:用一组特征向量来表示问题,需要体现出问题的语义方面的相关信息,类似自然语言处理。

原文地址:https://www.cnblogs.com/zwtgyh/p/10692937.html

时间: 2024-12-15 12:00:11

西瓜书课后习题——第一章的相关文章

西瓜书课后习题——第六章

6.1 6.2 from libsvm.svm import * from libsvm.svmutil import * y = [1,1,1,1,1,1,-1,-1,-1,-1,-1,-1] x = [{1:0.774,2:0.376},{1:0.634,2:0.264},{1:0.608,2:0.318},{1:0.556,2:0.215},{1:0.403,2:0.237}, {1:0.481,2:0.149},{1:0.666,2:0.091},{1:0.243,2:0.267},{1

西瓜书课后习题练习——Ch3.3编程实现对率回归

很久没来写博客了,感觉自己也懈怠了很多,最近毕业,工作,身份变化很大,烦心事也很多,对自己的第一份工作不是特别满意,所以决定自学一下机器学习,给自己留一条后路.希望多日以后的自己再看到这篇文章的时候还能记起当时痛苦的心情. 题目是:编程实现对率回归,并给出西瓜数据集3.0α上的结果. 西瓜数据集如下: 在这里我们主要使用了sklean,matplotlib,numpy和pandas几个库,由于sklearn中自带了有关线性回归的算法,所以可以直接调用,另外使用了matplotlib对其进行可视化

课后习题1-2章

第一章课后习题 (1) linux的发展史 Linux 操作系统的诞生创始人林纳斯·托瓦兹.发展和成长过程始终依赖着五 个重要支柱:UNIX 操作系统.MINIX 操作 系统.GNU计划.POSIX 标准 和Internet 网络. 1981 年IBM公司推出微型计算机IBM PC. 1991年,GNU计划已经开发出了许多工具软件,最受期盼的GNU C编译器 已经出现,GNU的操作系统核心HURD一直处于实验阶段,没有任何可用性, 实质上也没能开发出完整的GNU操作系统,但是GNU奠定了Linu

虎书课后习题【第二章】

写着玩,不保证对,尽可能使用较短的正则表达式来完成. 正则表达式用的是自制正则表达式测试器(逃. 2.1 在b出现之前可以是a或c,而a和c没有限制,确保出现a之后就可以出现任意字符,所以应该是c*a+[a-c]* 偶数个a……而且位置不确定,但是呢,可以保证的是a的数量是2的倍数,所以可以将两个a分为一组,把0也算上吧,于是就是([bc]*a[bc]*a[bc]*)*,当然吧前后两个[bc]*拿出来应该也是可以的(然后发现自制的测试器出bug了,回头再改……先用VS吧……) 这个就是能除4就好

第3章课后习题第一题--0703

代码: import java.util.Scanner; public class Min_Max { public static void main(String[] args) { System.out.print("请输入一个整数(输入0结束):"); Scanner input = new Scanner(System.in); int num = input.nextInt(); //将第一次输入的值当成最大值以及最小值,往后输入的数与最大值最小值比较 while(!(nu

课后习题3-4章

1. sshd默认监听22端口,这个端口我们可以自定义更改,更改/etc/ssh/sshd_config配置文件,port 22 改为 port 1122 ,那么sshd就会监听1122端口了. 2. PuTTY, SecureCRT, Xshell等 3. 需要修改 /etc/sysconfig/network-scripts/ifcfg-eth0(这里的eth0为你网卡的名字,注意区分), 一般需要修改IPADDR, NETMASK, GATEWAY, DNS1, DNS2 4. cento

java语言程序设计基础课后习题第二章

1 //exercise 2.2 2 package secondchapterexercise1; 3 4 public class first01 { 5 6 public static void main(String[] args) { 7 // TODO Auto-generated method stub 8 double miles=100; 9 double KILOMETERS_PER_MILE=1.609; 10 double kilometers=miles*KILOMET

网络操作系统习题第一章

1.什么是网络操作系统?网络操作系统具有哪些基本功能? 答:   除了实现单机操作系统全部功能外,还具备管理网络中的共享资源,实现用户通信以及方便用户使用网络等功能,是网络的心脏和灵魂. 网络操作系统是网络用户与计算机网络之间的接口,是计算机网络中管理一台或多台主机的软硬件资源.支持网络通信.提供网络服务的程序集合. 功能(1)共享资源管理 (2)网络通信 (3)网络服务 (4)网络管理 (5)互操作能力 2.网络操作系统具有哪些特征? (1)客户/服务器模式 (2)32位操作系统 (3)抢先式

《西瓜书》第三章,线性回归

? 使用线性回归来为散点作分类 ● 代码 1 import numpy as np 2 import matplotlib.pyplot as plt 3 from mpl_toolkits.mplot3d import Axes3D 4 from mpl_toolkits.mplot3d.art3d import Poly3DCollection 5 from matplotlib.patches import Rectangle 6 7 dataSize = 10000 8 trainRat