用故事解释分类问题和回归问题
1.分类问题的故事——森林里的神秘果子
在一片神秘的森林里,小明发现了许多奇怪的果子。有些果子可以吃,而有些果子有毒。他想找到一个方法来区分这些果子。
他观察到:
?颜色:红色的果子通常是可食用的,紫色的果子通常是有毒的。
?形状:圆形的果子大多能吃,尖尖的果子往往有毒。
?大小:太小的果子似乎更危险。
于是,小明决定建立一个“吃不吃果子”的规则系统:
?如果果子是红色且圆形,就吃!
?如果是紫色且尖尖的,就不吃!
?其他情况要谨慎判断。
这个过程就是分类问题——它的目标是给每个果子打上一个“可吃”或“不可吃”的标签。
分类问题的典型特征:
答案是离散的类别(例如:“可吃”vs.“不可吃”)
数据用于区分不同类别(红色vs.紫色,圆形vs.尖形)
最终输出是一个标签(1=可吃,0=不可吃)
现实中的应用:
?邮件是否是垃圾邮件?(垃圾vs.非垃圾)
?贷款申请者是否值得批准?(批准vs.拒绝)
?识别图片中的动物是什么?(猫vs.狗)
2.回归问题的故事——小明卖柠檬水
夏天到了,小明在街头卖柠檬水。他想预测明天应该准备多少杯柠檬水,以免浪费或卖不够。
他发现:
?温度越高,卖出的柠檬水越多。
?天气越晴朗,卖出的柠檬水也越多。
?湿度太高时,人们反而不太想买柠檬水。
他收集了一些数据,比如:
?昨天30°c,卖出50杯
?昨天35°c,卖出70杯
?昨天28°c,卖出45杯
他想建立一个预测模型,比如:
这样,如果明天预测是32°c,他可以计算:
书本网