手机浏览器扫描二维码访问
巧妇难为无米之炊,数据就是机器学习的“米”。
- 数据收集:比如要做推荐系统,得收集用户的浏览记录、点击行为;要做疾病预测,得收集病人的病历、检查报告。
- 数据预处理:这步特别关键,就像淘米要去沙。包括:
- 处理缺失值:比如某个人的年龄没填,得想办法补上或删掉。
- 处理异常值:比如收入里突然出现一个“1亿”,明显不合理,得处理掉。
- 特征缩放:比如身高是“170cm”,体重是“60kg”,单位和数值范围不一样,得统一缩放(比如都缩到0-1之间),不然模型会“偏心”。
2. 特征工程:给数据“化妆”,让模型看得更清楚
“特征”就是数据里的关键信息。比如判断西瓜好坏,“色泽、根蒂、敲声”就是特征。特征工程是从原始数据里提炼出有用特征的过程,直接影响模型效果。
- 有时候要人工设计特征:比如把“日期”拆成“星期几”“是否节假日”。
- 有时候用算法自动提取特征:比如深度学习里的CNN,能自动从图像里提取“边缘、形状”这些特征,不用人类操心。
3. 模型训练:让机器“刷题涨本事”
选好算法(比如决策树、神经网络),把处理好的数据喂给它,机器就开始“学习”了。它会不断调整内部参数,让预测结果和真实情况越来越接近。
- 训练过程中,得注意过拟合和欠拟合:
- 欠拟合:模型太“笨”,连训练数据都没学好,比如把所有邮件都当成正常邮件。
- 过拟合:模型太“教条”,把训练数据里的噪声也学进去了,比如只认识训练过的那几张人脸,换张角度就不认识了。
解决方法也不少,比如“正则化”(给模型加约束,不让它学太细)、“增加数据量”“模型简化”等。
4. 模型评估:给机器“考试”打分
训练好的模型得测试一下准不准。常用的指标有:
- 准确率(Accuracy):预测对的比例,比如100个邮件,90个判对了,准确率就是90%。但它在“数据不平衡”时不准,比如垃圾邮件只有5%,模型全判正常,准确率也有95%,但没用。
处心积虑x笨蛋美人 梁北林x程殊楠 程家倒了,大人小孩都跑了。 只剩下一个骄纵着长大没什么本事的小少爷程殊楠,又笨又美,还自不量力。 和人叫嚣:“你等着,我让我男朋友收拾你!” 后来被男朋友治了几次,才发现,原来被收拾的是自己。 才发现,原来家没了竟是男朋友布的一场大局。 ** 梁北林觉得程殊楠真是蠢。 被家人抛弃的小狗,被自己玩弄于股掌的炮灰,还认不清形势,遇上事就跑来撒娇求抱抱。 梁北林一朝翻脸,淡声发问:“你觉得,凭什么?” 程殊楠理直气壮:“我是你男朋友啊。” ** 后来,男朋友变成小玩意儿。 后来,程殊楠一犯错就吓得道歉:“对不起,我以前不懂事。” 后来,梁北林终于知道,那不是蠢,是毫不设防的爱,是淤泥下不染的莲。 可他的男朋友再也回不来了。 划重点:大写的HE。真爱变包养。狗血虐文。年上,差7岁,攻28,受21。 接上一篇《欲夺》和《清路尘》同背景,两文攻受都有客串。 wb:她行歌...
从小到大,苟小河一直觉得边桥烦他 边桥不爱跟他说话,不爱跟他胡闹,作业都不乐意跟他趴在一张桌上写,天天爱生气 但是苟小河一点也不烦边桥 他把边桥当成最好的朋友,好东西都想给他,成天想着招儿的往人身边黏,直到边桥离开苟家村 三年以后,苟小河摸着地址去城里找人,背个脏书包在边桥家别墅门口睡着了 边桥对他还跟小时候似的不待见,不过这回给了他一个理由 边桥:我喜欢男的 苟小河:? 边桥:所以离我远点 苟小河:我懂了,你别怕,你永远是我最好的朋友! 边桥:……烦死了 【本质醋缸子攻×自以为很机灵受】...
诺亚之光情节跌宕起伏、扣人心弦,是一本情节与文笔俱佳的网游动漫小说,诺亚之光-雾启-小说旗免费提供诺亚之光最新清爽干净的文字章节在线阅读和TXT下载。...
雁断胡天月情节跌宕起伏、扣人心弦,是一本情节与文笔俱佳的历史军事小说,雁断胡天月-秋砆-小说旗免费提供雁断胡天月最新清爽干净的文字章节在线阅读和TXT下载。...
一场车祸,来到了鬼神地窟,还能无限复活!不断探索,不断变强。曾拯救万千,也曾毁灭众生,和刑天喝过酒,也和宙斯打过架。当我站在众神之巅,大剑所指,即是众神心之所向!......
本文又名:《攻略者今天黑化了么?》/《对不起,我只是个NPC》/《总有攻略者死在我手上》 被当作NPC攻略无数次的苏纯纯觉醒了意识,而要驱逐攻略者的唯一办法,就是让他们对目标——动心。 看久了攻略者们鲜花宝马摸头杀,强吻壁咚床上拉的手段,苏纯纯表示她可是有一整套反骗攻略的人!…… 注: 1.女主演技光环MAX。 2.女主又名苏炸天。 3.作者深度主角控。...