挖矿笔记(一)

论坛 期权论坛 期权     
医本正经儿   2020-3-28 04:13   1465   0
毋某人的挖矿笔记(一)
       此挖矿不是彼挖矿,而是学着从数据中挖掘出隐性的知识宝藏,严肃地称为“数据挖掘”,可以使用spss modoler 进行挖掘,因为该软件提供一个月免费的使用期限。
       作为一个小白,就先从Apriori算法整起。(拿平时收集到的15个治疗咳嗽的中药开学习。)

       首先用excel表格将数据整理成如图的形式。T表示用了这个药,F表示没用这个药。(可以先把表格全部输成F,然后再把T填进去。应该有直接把方剂导出成F/T的形式,但目前作为小白刚起步,搞不出来。这样的做的好处是对数据进行了规范化。)

       在源中将excel拖到操作区。

       双击点开后,把录好的excel导入进去。

       数据选项这个不用管,点过滤器。

       ×掉我们不用的属性(字段)。之后点类型。

       将患者编号的角色设置为目标,桑叶等中药测量设为标记,角色选择任意。(选择输入为前项,选择目标为后项,选择任意则既是前项,又是后项。)而目前所处的状态是半实例化,通过点击读取值将其变为实例化。

       实例化后会发现值变成了T/F。点击应用。之后关掉窗口。

       在建模区将Apriori算法拖到工作区。

       将两者进行连接后,Apriori算法的文件会出现37字段(也就是输入的37个中药的名称),双击点开算法,设置支持度和置信度。比如都是百分之50。(可以看别人的论文都用多少,自己也用多少就OK)。前项想设置几个看你自己需要,反正不能超过37。

       点击运行,连接点的箭头变绿了,然后生出了下面这个图。

       这个时候把黄色的37字段双击戳开,就得到了用药中经常使用的高频药对。

       Apriori算法的机理如下图:
       其余补充,见评论。猫叼走了毋某人的巨无霸肘花火腿后,毋某人变得额外烦躁了。



分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:40
帖子:3
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP