数据挖掘模型优化中,Precision,Recall,F值这三个指标应该优先优化哪个?

论坛 期权论坛 期权     
匿名用户   2018-9-28 00:21   7169   4
提示: 作者被禁止或删除 内容自动屏蔽
分享到 :
0 人收藏

4 个回复

倒序浏览
2#
熊辰炎  4级常客 | 2018-9-28 00:21:22 发帖IP地址来自
取决于你的具体问题。如果啥背景都不给的话,就是F值综合考虑。

但是大部分互联网公司里和用户相关的算法时,更看重的是precision。
比如想要在Google的搜索系统里用的某个新算法,recall可以是0.01%,但是考虑到总体的用户数量,0.01%依然是很大的数字。但是precision必须要足够高,一般都要求95%以上。因为用户对效果的提升并不怎么敏感,但是对bad case却非常在意。可能你某个算法更好的满足了100个用户,他们却并不知情,但是伤害到了1个用户,他可能就截图发Facebook嘲笑你了。。。

也有的时候是只看recall的。。。比如黄反过滤和墙。。。 宁可错杀一万,不能放过一个。不然就要被找去喝茶了。
3#
刘知远  3级会员 | 2018-9-28 00:21:23 发帖IP地址来自
根据你的需求来,F值就是尝试做precision和recall之间协调的一个评价指标,一般看F值,只有当precision和recall都还不错的时候,F值才会高。
4#
霸天虎  3级会员 | 2018-9-28 00:21:26 发帖IP地址来自
和场景无关,意味从本质来分析。P和R都很高,是非常正常的,因为这与数据分布有关。此时,F值接近(1+1/a平方)/2,不是越大越好。





5#
王晨晖  3级会员 | 2018-9-28 00:21:27 发帖IP地址来自
这篇文章写得挺详细的,ROC曲线和PR(Precision-Recall)曲线的联系
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:
帖子:24326
精华:1
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP