挖矿笔记（一）

毋某人的挖矿笔记（一）
   此挖矿不是彼挖矿，而是学着从数据中挖掘出隐性的知识宝藏，严肃地称为“数据挖掘”，可以使用spss modoler 进行挖掘，因为该软件提供一个月免费的使用期限。
   作为一个小白，就先从Apriori算法整起。（拿平时收集到的15个治疗咳嗽的中药开学习。）

   首先用excel表格将数据整理成如图的形式。T表示用了这个药，F表示没用这个药。（可以先把表格全部输成F，然后再把T填进去。应该有直接把方剂导出成F/T的形式，但目前作为小白刚起步，搞不出来。这样的做的好处是对数据进行了规范化。）

   在源中将excel拖到操作区。

   双击点开后，把录好的excel导入进去。

   数据选项这个不用管，点过滤器。

   ×掉我们不用的属性（字段）。之后点类型。

   将患者编号的角色设置为目标，桑叶等中药测量设为标记，角色选择任意。（选择输入为前项，选择目标为后项，选择任意则既是前项，又是后项。）而目前所处的状态是半实例化，通过点击读取值将其变为实例化。

   实例化后会发现值变成了T/F。点击应用。之后关掉窗口。

   在建模区将Apriori算法拖到工作区。

   将两者进行连接后，Apriori算法的文件会出现37字段（也就是输入的37个中药的名称），双击点开算法，设置支持度和置信度。比如都是百分之50。（可以看别人的论文都用多少，自己也用多少就OK）。前项想设置几个看你自己需要，反正不能超过37。

   点击运行，连接点的箭头变绿了，然后生出了下面这个图。

   这个时候把黄色的37字段双击戳开，就得到了用药中经常使用的高频药对。

   Apriori算法的机理如下图：
   其余补充，见评论。猫叼走了毋某人的巨无霸肘花火腿后，毋某人变得额外烦躁了。

挖矿笔记（一）

浏览过的版块