图片社交网站的大数据挖掘如何进行?能产生哪些价值?

论坛 期权论坛 期权     
任君   2018-10-3 21:45   4062   2
instagram 和 tumblr等大型的图片社交网站,每天上传的照片数量那么多,未来有可能进行挖掘吗,怎么进行?


本题已加入圆桌 数据挖掘应用,更多「数据挖掘」相关的话题欢迎关注讨论
分享到 :
0 人收藏

2 个回复

正序浏览
3#
深陷统计的汪汪汪  4级常客 | 2018-10-3 21:45:02 发帖IP地址来自
谢邀。本科刚毕业,下文有不准确不全面的地方敬请批评指出。
问题一:社交网站产生的图片未来有可能进行大数据挖掘吗?如何进行挖掘?
问题二:这能产生什么价值?
就社交网站来说,每天会产生成千上万的图片,这些信息传递给公司,他们是进行了比较浅度的挖掘的。简单的几个方面:
1.对每位用户发出的图片进行分类,风景、人像、动物、食物、衣服、截图……通过长期对每位用户的图片分类,可以得到用户发某种图片的众数,将众数相同的用户分为一类,可以在首页形成“感兴趣的人”、“感兴趣的话题”…
2.再细一点,比如某位用户的众数是人物,那么通过图片可以得到他是否进行修图,是进行了浅度修图还是深度修图,可以据此对用户推荐App,是推荐某图秀秀还是Ps,这也是各个公司正在干的事,也是他们的广告来源。
3.还有一些场景,比如你在哪里看到一张剧照,却不知是哪部剧,这时候就能帮到你,当你发了某张图片的时候,根据图像识别技术,可以帮你找到属于某部电影或者电视剧。社交网站也可以与视频网站合作,在旁边弹出“可能感兴趣”:《***》,点击外链进入视频网站观看视频,互赢。
4.某度某宝正在做的事。图片搜索功能,通过图片搜索更高分辨率的图片,通过图片搜索网购宝贝。或许他们会和社交网站合作,通过日常发送的动态来获取个人喜好,进而推荐自己网站关联账号的首页。
当然,以上都是答主所理解到的很肤浅的部分。期待斧正。
2#
LuvDDDD  1级新秀 | 2018-10-3 21:45:01 发帖IP地址来自
来抛砖引玉一下。
图片社交网站除了产出图片之外,还有其他的数据可供挖掘,其本质还是以社交为基础的,只不过以图片的形式在UGC(User-generated Content)模式中作为导向。
图片社交的产品当中,用户既是内容及图片的产出者,又是其他数据的输出者(点赞、关注等),由于海量图片在当下技术还比较难以挖掘,所以挖掘多是从User之间的关系进行。
User之间关系能提供的数据:
  • 标签
  • 关注人群
  • 好友
  • 评论/转发
  • 收藏
User的数据:
  • 手机品牌
  • 位置
  • 使用时间
得到以上数据之后,可以寻找到User之间的社交关系,并且建立社交网,将数据集中之后寻找每个细分领域下的KOL,对KOL的内容集中分析,从而获取相关社交关系的兴趣爱好以及偏好。
在内容上,图片暂时难以大量进行分析,所以图片社交网站多使用用户自己添加tab、LBS(Location Based Service),根据tab来将大量的图片进行归总和分类,实现一定程度的内容垂直化,再推送给相关用户,通过用户手动修正产生面向个人的算法。


Ins在上传前可使用滤镜添加。滤镜添加起到了美化图片的作用。美化之后的图片发布之后可能更加得到他人的青睐(可视的审美影响)。做一个猜测,后期可以添加类似美图秀秀之类的五官修改。根据用户在每个五官上的操作判断他本身对于自身五官是否有一定不满,可以依据这一类数据推送相关的时尚美妆品类产品,该部分数据也可以提供给各类厂商进行分析,对于该地区的某个年龄段的潜在客户群进行挖掘并且进行精准画像。
给图片添加标签,一是可以增加图片的传播和曝光量,同时也是便于数据使用方进行管理和筛查,最后分类打包。
现在某些人工智能软件已经可以分析图片了,比如识图找到相近的图片,通过协同滤过寻找图片中的关联度。但究其本质,图片产出的背后是一个个产出者,对人物进行用户画像,将图片作为产出品(标签)回溯到社交的本质,可能是一个更好的做法。


期待斧正。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:
帖子:
精华:
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP