正在进行安全检测...

发布时间:2024-04-28 00:04:30   来源:文档文库   
字号:

实验二用身高和/或体重数据进行性别分类的实验
一、实验目的
1加深对Fisher线性判别方法原理的理解和认识2掌握Fisher线性判别方法的设计方法

二、实验数据
训练样本集
FAMALE.TXT50个女生的身高、体重数据MALE.TXT50个男生的身高、体重数据测试样本集
test1.txt35个同学的身高、体重、性别数据(15个女生、20个男生)test2.txt300个同学的身高、体重、性别数据(50个女生、250个男生)

三、实验内容
试验直接设计线性分类器的方法,与基于概率密度估计的贝叶斯分类器进行比较。同时采用身高和体重数据作为特征,用Fisher线性判别方法求分类器,将该分类器应用到训练和测试样本,考察训练和测试错误情况。将训练样本和求得的决策边界画到图上,同时把以往用Bayes方法求得的分类器(例如:最小错误率Bayes分类器)也画到图上,较结果的异同。

四、原理简述、程序流程图
1Fisher线性判别方法
mi
首先求各类样本均值向量
1Ni
x
x,i1,2
i

T
sixmixmi,i1,2
然后求各个样本的来内离散度矩阵
xwi


s
再求出样本的总类内离散度
根据公式
p1s1p2s2
1Ni
1
m1m2s
求出把X投影到Y的最好的投影方向。
mi'
再求出一维Y空间中各类样本均值
y
y,i1,2
i

y*x,
,其中



N1m1'N2m2'y0
N1N2,
本次实验的分界阈值我们用如下方法得到:
最后,将测试样本中的值代入,求出y,并将其与y0来进行比较来分类。
2、流程图

五、实验结果
1、错误率表格
男生错误个数
女生错误个数
总错误
男生错误率
女生错误率
总错误率
278
24
2912
10.8%16%
4%8%
9.67%12%
分析:用训练样本得到的分类器测试测试样本时错误率低,测试结果较好,但测试训练样本时,其错误率较高,测试结果不好。2Fisher判别方法图像


本文来源:https://www.2haoxitong.net/k/doc/d059112659f5f61fb7360b4c2e3f5727a4e924c4.html

《正在进行安全检测....doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式