发帖

[经验]

一个基本的AI建模议题：分类的标签(LABEL)设定

2020-11-25 11:21:51

1407 高焕堂人工智能

1

<<议题>>
为什么在多类别的分类时，其标签(Label)值要设定像[0,0,1]、[0,1,0]、[1,0,0]这样的格式呢?
<<观摩范例>>

例如，针对104网页上的工作机会，如果只取一个特征(如<钱多>)来作为判断(即分类)的依据，而进行分类，分为<喜欢>与<不喜欢>两类。使用Excel表达如下：

因为分为两类，所以就设定两个Label值：[10]和[01]。这里的[10]就代表数学的阵列[1,0]的意思。以此类推，如果分为3类，如下：

这是根据两个特征(性别和学历)而进行分类，将其分为3类：男、女、漂亮博士。所以就设定3个Label值：[100]、[010]和[001]。这里的[100]就代表数学的阵列[1,0,0]的意思。以此类推，再看看这个例子：

这个范例是参考Donald J. Norris所写的〝Raspberry Pi Python Prolog〞一书的范例。只利用几条直线线段来呈现0到9等十位数字。例如下图：

透过五条线段的组合，可以组合出<0>、<1>、<2>与<3>阿拉伯数字，如下：

人们很容易就能辨识出来，那么我们如何去训练AI机器，让它具有智慧，也能迅速辨别出来呢? 本章就透过这范例，让您来观摩一下啰。其中，最后一个看起来很像数字<6>，在本范例里刻意也将它视为数字<0>。这个模型经过训练之后，将能辨别<0>、<1>、<2>与<3>共四个阿拉伯数字。也就是分为4类。于是设定其Label值如下：

第#0笔资料的实际值是t[1 ,0, 0, 0] --- 代表数字<0>
第#1笔资料的实际值是t[0 ,1, 0, 0] --- 代表数字<1>
第#2笔资料的实际值是t[0 ,0, 1, 0] --- 代表数字<2>
第#3笔资料的实际值是t[0 ,0, 0, 1] --- 代表数字<3>
第#4笔资料的实际值是t[1 ,0, 0, 0] --- 代表数字<0>

<<说明缘由>>
这需要复习一下，最基本的NN(神经网路)结构：

其运算公式是：

设定：W0 = 1, b0 = 0。而且设定：W1 = -1， b1 = 1。

输入第1笔资料(即工作-1)的特征值：

计算出结果：

上面已经输入第1笔资料(即工作-1)的特征值：1(代表钱多)。而输出的值：[1,0]则代表<喜欢>。

于是，在Excel上列出其中的对应关系，来训练AI模型：

以上是从简单的NN模型架构，让您充分理解为什么我们要为每一笔资料做<标注>(Label)，而且是像[10000]、[01000]这样的格式。这就是当今主流的AI：监督式学习。接下來，按下<求Z>，就展开<训练>的动作：

例如，针对第#1笔资料而计算出了z[] = [0.958, 0.042]。其中，最大值是0.958，就以1来取代0.958，并以0来取代其他较小的值，就得到新的阵列值：[1, 0]，它就是代表<喜欢>的Label值，于是这AI机器就预测您会喜欢这第#1笔资料所代表的：工作-1。

再如，针对第#2笔资料而计算出了z[] = [0.063, 0.937]。其中，最大值是0.937，就以0来取代0.937，并以0来取代其他较小的值，就得到新的阵列值：[0, 1]，它就是代表<不喜欢>的Label值，于是这AI机器就预测您不会喜欢这第#2笔资料所代表的：工作-2。
~ END ~

只看该作者 淘帖0 举报

相关推荐

只有小组成员才能发言，加入小组>>

高焕堂AI创新学习专区

17个成员聚集在这个小组

精选推荐

如何培养《未来架构师》(1) ：VR+AI潮流下的教育新方向

4033 浏览 0 评论
先进的创新教育：AI 思维+设计思维

4107 浏览 0 评论
如何培养<龍傳人>的科学创新思考技术

14924 浏览 0 评论
高焕堂老师AI教程：思考技术与创新能力

5468 浏览 0 评论
高焕堂AI概论：以Python撰写 AI模型框架

1918 浏览 0 评论

最新话题

热门话题

创建小组步骤

创建小组创建自己的地盘
个性设置精心打造小组空间
邀请好友邀请好友加入我的小组
小组升级小组积分升级赢得社区推荐

创建属于自己的小组

快速回复 返回顶部 返回列表

关注微信公众号

电子发烧友网

电子发烧友论坛

社区合作: 刘勇; 联系电话：15994832713; 邮箱地址：liuyong@huaqiu.com

社区管理: elecfans短短; 微信：elecfans_666; 邮箱：users@hauqiu.com

返回高焕堂AI创新学习专区

回复

关闭

站长推荐 /6

快速回复 返回顶部 返回列表

- 技术社区: HarmonyOS技术社区

RISC-V MCU技术社区

FPGA开发者技术社区

- OpenHarmony开源社区: OpenHarmony开源社区

- 嵌入式论坛: ARM技术论坛

STM32/STM8技术论坛

嵌入式技术论坛

单片机/MCU论坛

RISC-V技术论坛

瑞芯微Rockchip开发者社区

FPGA|CPLD|ASIC论坛

DSP论坛

- 电路图及DIY: 电路设计论坛

DIY及创意

电子元器件论坛

专家问答

- 电源技术论坛: 电源技术论坛

无线充电技术

- 综合技术与应用: 机器人论坛

USB论坛

电机控制

模拟技术

音视频技术

综合技术交流

上位机软件（C/Python/Java等）

- 无线通信论坛: WIFI技术

蓝牙技术

天线|RF射频|微波|雷达技术

- EDA设计论坛: PCB设计论坛

DigiPCBA论坛

Protel|AD|DXP论坛

PADS技术论坛

Allegro论坛

multisim论坛

proteus论坛|仿真论坛

KiCad EDA 中文论坛

DFM|可制造性设计论坛

- 测试测量论坛: LabVIEW论坛

Matlab论坛

测试测量技术

传感技术

- 招聘/交友/外包/交易/杂谈: 项目外包

供需及二手交易

工程师杂谈|交友

招聘|求职|工程师职场

- 官方社区: 发烧友官方/活动

华秋商城

华秋电路

time

recommend

hot

post

—
—
—

版
块
导
航