background picture of the home page

Welcome to Keggin's blog!!!

Python实现购物篮分析:从Apriori到FP-Growth算法实战

以生活中常见的超市购物为例,我们熟知的啤酒与尿布故事是指某超市在对顾客购物习惯分析时,发现,男性顾客在购买婴儿尿片时,常常会顺便搭配几瓶啤酒来犒劳自己,于是尝试推出了将啤酒和尿布摆在一起的促销手段,最后使得啤酒与尿布销量双双提升。这是因为啤酒与尿布之间存在某种巧妙的相互关联,这种关联使得二者容易同时

thumbnail of the cover of the post

数据包络分析(DEA)入门:从原理到DEAP软件实战教程

DEA是一种用来衡量、评价效率的一种有效数学模型,是运筹学、数理经济学与管理科学交叉研究的一个新领域,它是根据多项投入指标和多项产出指标,利用线性规划的方法,对具有可比性的同类型单位进行相对有效性评价的一种数量分析方法。 模型简介 以公司的办事效率作为评判对象,进行数据包络分析的简介,一个公司的办事

thumbnail of the cover of the post

机器学习特征工程:独热编码(One-Hot)与相关性分析实战

独热编码 独热编码的概念 独热编码(one-hot)是解决无法量化类属性的优秀方法,其以简单高效的特点深受好评。例如我们在进行数据分类时会遇到一些特征:人的性别有男、女,人的国籍有中国,法国,德国....这些都是不能直接量化的变量。 假如使用[0,3]表示一个德国的男性,看似没有问题,实际 上是不可

thumbnail of the cover of the post

控制收敛定理

Arzela控制收敛定理与Lebesque控制收敛定理 Arzela控制收敛定理 设f_n(x)(n=1,2,3...)是定义在[a,b]上黎曼可积函数,且

thumbnail of the cover of the post