轻识Logo
目录

    收藏 | 机器学习模型与算法最全分类汇总!

    机器学习


    Author:louwill

    Machine Learning Lab

         

    本文总共涉及了26种机器学习模型与算法,几乎涵盖了全部主流的机器学习算法。包括线性回归、逻辑回归、Lasso回归、Ridge回归、线性判别分析、近邻、决策树、感知机、神经网络、支持向量机、AdaBoost、GBDT、XGBoost、LightGBM、CatBoost、随机森林、聚类算法与kmeans、主成分分析、奇异值分解、最大信息熵、朴素贝叶斯、贝叶斯网络、EM算法、隐马尔可夫模型、条件随机场和马尔可夫链蒙特卡洛方法。


    其中决策树、神经网络、支持向量机和聚类算法都各自代表了一个大类算法,比如说决策树具体包括ID3、C4.5和CART,神经网络包括DNN、CNN或者是RNN等其他网络模型,这里仅对大类算法做区分。


    下面我们分别从单模型和集成学习模型、监督学习和无监督学习模型和判别式模型和生成式模型、概率模型和非概率模型等多个维度来讨论本书所涉及到的26个算法。

    图1 机器学习模型知识体系

     

    单模型与集成模型

    从模型的个数和性质角度来看,我们可以将机器学习模型划分为单模型(single model)和集成模型(ensemble model)。所谓单模型,是指机器学习模型仅包括一个模型,以某种模型独立进行训练和验证使用的。本书监督学习模型中大多数模型都可以算作单模型,包括线性回归、逻辑回归、Lasso回归、Ridge回归、线性判别分析、近邻、决策树、感知机、神经网络、支持向量机和朴素贝叶斯等。


    与单模型相对立的,就是集成模型,集成模型就是将多个单模型进行组合构成一个强模型,这个强模型能取所有单模型之所长,达到一个相对的最佳性能。集成模型中的单模型既可以是同种类别的,也可以是不同类别的,总体呈现一种“多而不同”的特征。常用的集成模型包括Boosting和Bagging两大类,主要包括AdaBoost、GBDT、XGBoost、LightGBM、CatBoost和随机森林等模型。单模型和集成模型分类如图2所示。

    图2 单模型与集成模型

     

    监督模型与无监督模型

    监督模型(supervised model)和无监督模型(unsupervised model)代表了机器学习模型的最典型划分方式,几乎所有的模型都可以归类到这两类模型当中。监督模型是指模型在训练过程中根据数据输入和输出进行学习,监督学习模型包括分类(classification)、回归(regression)和标注(tagging)等模型。无监督模型是指从无标注的数据中学习得到模型,主要包括聚类(clustering)、降维(dimensionality reduction)和一些概率估计模型。


    图2中所有的单模型和集成模型都是监督模型,以及图1中的一部分概率模型也属于监督模型,包括隐马尔可夫模型和条件随机场,它们属于监督模型中的标注模型。无监督模型主要包括kmeans聚类、谱聚类和层次聚类等一些聚类模型,以及主成分分析和奇异值分解等降维模型。另外,马尔可夫链蒙特卡洛方法也可以作为一种概率无监督模型。监督模型和无监督模型的划分如图3所示。

    图3 监督模型与无监督模型

     

    生成式模型和判别式模型

    监督模型在机器学习模型中占主要部分,针对监督模型,我们又可以根据其模型学习方式将其分为生成式模型(generative model)和判别式模型(discriminative model)。生成式模型的学习特点在于学习数据的联合概率分布,然后基于联合分布求条件概率分布作为预测模型。如下式所示。


    常用的生成式模型包括朴素贝叶斯、隐马尔可夫模型以及隐含狄利克雷分布模型等。


    判别式模型的学习特点在于基于数据直接学习决策函数或者条件概率分布作为预测模型,判别式模型关心的是对于给定的输入,应该预测出什么样的。常用的判别式模型有很多,像线性回归、逻辑回归、Lasso回归、Ridge回归、线性判别分析、近邻、决策树、感知机、神经网络、支持向量机、最大信息熵模型、全部集成模型以及条件随机场等,都属于判别式模型。生成式与判别式模型划分如图4所示。

    图4 生成式模型与判别式模型

     

    概率模型与非概率模型

    机器学习模型还有一种根据模型函数是否为概率模型的方式,将机器学习模型分为概率模型(probabilistic model)和非概率模型(non-probabilistic model)。通过对输入和输出之间的联合概率分布和条件概率分布进行建模的机器学习模型,都可以称之为概率模型。而通过对决策函数建模的机器学习模型,即为非概率模型。


    常用的概率模型包括朴素贝叶斯、隐马尔可夫模型、贝叶斯网络和马尔可夫链蒙特卡洛等,而线性回归、近邻、支持向量机、神经网络以及集成模型都可以算是非概率模型。


    需要注意的是,概率模型与非概率模型的划分并不绝对,有时候有些机器学习模型既可以表示为概率模型,也可以表示为非概率模型。比如说决策树、逻辑回归、最大熵模型和条件随机场等模型,就兼具概率模型和非概率模型两种解释。概率模型和非概率模型的划分如图5所示。

    图5 概率模型与非概率模型



    往期精彩:

    【原创首发】机器学习公式推导与代码实现30讲.pdf

    【原创首发】深度学习语义分割理论与实战指南.pdf

      谈中小企业算法岗面试

      算法工程师研发技能表

      真正想做算法的,不要害怕内卷

      算法工程师的日常,一定不能脱离产业实践

      技术学习不能眼高手低

      技术人要学会自我营销

      做人不能过拟合

    求个在看

    浏览 75
    点赞
    评论
    收藏
    分享

    手机扫一扫分享

    举报
    收藏 | 机器学习最全知识点汇总(万字长文)
    小白学视觉
    0
    机器学习最全知识点汇总
    新机器视觉
    0
    机器学习模型的可解释性算法汇总!
    机器学习算法与Python实战
    0
    【建议收藏】机器学习最全知识点汇总(万字长文)
    机器学习算法与Python实战
    0
    【机器学习】机器学习算法优缺点对比(汇总篇)
    机器学习初学者
    0
    机器学习中算法与模型的区别
    数据分析挖掘与算法
    0
    关于机器学习模型可解释性算法的汇总
    SAMshare
    0
    机器学习中算法与模型的区别
    小白学视觉
    0
    【机器学习】6大监督学习模型:毒蘑菇分类
    机器学习初学者
    0
    点赞
    评论
    收藏
    分享

    手机扫一扫分享

    举报

    哆哆女性网巫峡棺山马年女宝宝起名技工学校起名印染公司起名面馆怎么起名太原起名公司锦衣香闺云南米线加盟若你安好便是晴天在哪里可以看回收公司起名大全免费起个品牌姓名大全吸血鬼女王百度影音神之墓地3.0.4北逃何字起店名6月9日是什么星座吴怎么起名字鼠年男孩起名字缺金赵姓女起名专业起名网址免费给姓汪的女孩起名升迁之路算八字起名大全郭起名字给宾馆起名字好西太后给男宝宝起名字龙有关起名的软件下载用国学起名合伙公司怎么起名淀粉肠小王子日销售额涨超10倍罗斯否认插足凯特王妃婚姻不负春光新的一天从800个哈欠开始有个姐真把千机伞做出来了国产伟哥去年销售近13亿充个话费竟沦为间接洗钱工具重庆警方辟谣“男子杀人焚尸”男子给前妻转账 现任妻子起诉要回春分繁花正当时呼北高速交通事故已致14人死亡杨洋拄拐现身医院月嫂回应掌掴婴儿是在赶虫子男孩疑遭霸凌 家长讨说法被踢出群因自嘲式简历走红的教授更新简介网友建议重庆地铁不准乘客携带菜筐清明节放假3天调休1天郑州一火锅店爆改成麻辣烫店19岁小伙救下5人后溺亡 多方发声两大学生合买彩票中奖一人不认账张家界的山上“长”满了韩国人?单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#青海通报栏杆断裂小学生跌落住进ICU代拍被何赛飞拿着魔杖追着打315晚会后胖东来又人满为患了当地回应沈阳致3死车祸车主疑毒驾武汉大学樱花即将进入盛花期张立群任西安交通大学校长为江西彩礼“减负”的“试婚人”网友洛杉矶偶遇贾玲倪萍分享减重40斤方法男孩8年未见母亲被告知被遗忘小米汽车超级工厂正式揭幕周杰伦一审败诉网易特朗普谈“凯特王妃P图照”考生莫言也上北大硕士复试名单了妈妈回应孩子在校撞护栏坠楼恒大被罚41.75亿到底怎么缴男子持台球杆殴打2名女店员被抓校方回应护栏损坏小学生课间坠楼外国人感慨凌晨的中国很安全火箭最近9战8胜1负王树国3次鞠躬告别西交大师生房客欠租失踪 房东直发愁萧美琴窜访捷克 外交部回应山西省委原副书记商黎光被逮捕阿根廷将发行1万与2万面值的纸币英国王室又一合照被质疑P图男子被猫抓伤后确诊“猫抓病”

    哆哆女性网 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化