夜鹰教程网-程序员的加油站
 当前位置:文章中心 >> 产品经理
专访郑昀:探索语义聚合为你呈现精彩信息
夜鹰教程网 来源:www.yyjcw.com 日期:2016-10-27 15:42:15
互联网的信息很庞大也很杂乱,很大的精力浪费在了寻找信息而不是吸收信息上,感觉玩聚网是个充满想象力的东西。玩聚网致力于语义聚合,最大化地寻找有价值的信息,并有效聚合起来。本期中国站长站站长访谈栏目,请来玩聚网(www.ju690.com)创始人郑昀,就这一精彩图景
互联网的信息很庞大也很杂乱,很大的精力浪费在了寻找信息而不是吸收信息上,感觉玩聚网是个充满想象力的东西。玩聚网致力于语义聚合,最大化地寻找有价值的信息,并有效聚合起来。本期中国站长站站长访谈栏目,请来玩聚网(www.ju690.com)创始人郑昀,就这一精彩图景做一展示。

中国站长站《站长访谈》主持人王小东:欢迎郑昀做客中国站长站!首先向郑昀表达一个敬意,在互联网的“好文章”后面,常常可以看到你的勤奋身影。

郑昀:我们一直关注如何找到互联网上最优秀的内容和人,基于各种各样的数据和方法,把它们有效整合,并力图完美呈现。

王小东:对,你也曾经说过,玩聚网的内容取舍很大程度上源自你的审美趣味,很多内容特别是早期的玩聚网,多是你平时阅读的RSS订阅列表。那么,呈现玩聚网现在的样子,相信不仅仅是列表的呈现吧。可否详细介绍一下你所说的语义技术作为二层过滤,达到一个有价值主题呈现的这一图景?甄选好文章,主要有哪些途径呢?

郑昀:发现互联网最优秀最新鲜的文章或热点,我们探索的大致有两种测量维度:

一,找到用户或站方信赖的信源。比如,天涯社区的一些板块,Twitter,FriendFeed,某些博客,等等,相对值得信赖,它们上面的信息相对好。

二,找到用户或站方信赖的人。

具体的测量方法,有三种途径:

一,监测信赖的信源。如果足够多的资讯都在说同一件事,那么这件事可能是值得看的热点;如果足够多的资讯都在重复传播同一篇文章,那么这篇文章可能值得阅读。

二,监测信赖的人。如果足够多的人都推荐、分享和转发了同一个资讯,那么这个资讯就可能是优质的、值得被你信赖的。

三,把上面两点混合起来用。

其中,检测不同文章是讲同一件事,以及检测不同文章其实是一篇文章,这都需要语义计算。

王小东:有另外一个类似的网站——FeedzShare。FeedzShare 是统计Google Reader和鲜果的读者在RSS阅读器里面分享的内容, 然后把用户分享最多的文章呈现在首页上。玩聚网和FeedzShare有哪些区别吗?我看到内容重合度很高的。

郑昀:我曾经说过,玩聚SR = (RssMeme + TweetMeme + Popacular + …)+ 语义计算。FeedzShare 是 RssMeme 的模式在中国的第一个实现者。

对互联网科技社群来说,大部分分享和阅读行为都发生在RSS阅读器中,但也有相当比例的推荐行为第一时间发生在 Twitter 为首的微博客中。而且微博客的热点追踪能力更强更快,所以在中国要想做好实时的优质内容发现,必须要加强对微博客领域的监控。

微博客的热门链接追踪虽好,但在中国也有缺点,就是容易剑走偏锋,过于新特奇,缺少让人沉稳耐读的资讯。这就需要 RssMeme 的模式来补充。

另外,站方必须考虑的一点就是,流行的社会化媒体,都往往存在被封锁的风险,所以也必须考虑多种信源聚合,而不是把自己绑在Twitter或者Google Reader战车上,避免因信源被封而无米下锅,比如近期我们整合进来饭否的统计数据。

至于不同聚合服务内容有一定重合,我认为在现阶段中国这是必然的。因为活跃的中国互联网用户其实就这么多,尤其是社会化媒体,基本都是科技社群这批人作为主力军,每天产生出来的好内容也就那么多,那么作为RSS分享聚合的FeedzShare和鲜果热文,与多种信源聚合的玩聚SR,内容有一定重合,这是必然的。这就像网易新闻和新浪新闻多数是重合的一样。对于此,我的建议是,保持对一个聚合服务的关注即可。你犯不上新浪新闻和网易新闻全都看。

王小东:玩聚网是使用Django构建的吗?介绍一下这方面的情况,以及关于Python 编程语言。

郑昀:玩聚网的Web部分都是Django框架搭的,便于快速构建。

后台则跑了很多很多的服务,如爬虫,如语义计算,如统计,如数据挖掘,等等,都是用Python写的独立服务。

自然语言处理部分,如分类、相似性计算、标签提取、重复检测等,都是C++写的。

王小东:自己一个切身体验。我发现豆瓣网(douban.com)的数据分析很厉害,检索一个自己喜欢的电影或者书籍,豆瓣网向你推荐的相关内容,十之八九就是你喜欢的,这很不简单。豆瓣网现在也采取了IMDB评分机制,豆瓣九点和玩聚网相关度也很高,其实本质上,豆瓣网和玩聚网都是社会化推荐。我也是这次向你请教关于玩聚网的事情,更加发现豆瓣很不简单。

郑昀:这个不知道该怎么回答。相对于没有用户的玩聚网,豆瓣有海量用户,拥有高质量的用户行为数据,有强力的协同过滤算法,这些玩聚网都没有,而且互联网上也没有这么好的开放数据。国内没有谁能和他们比的。

复制链接 网友评论 收藏本文 关闭此页
上一条: 那些注定的软件  下一条: 美女CEO张毅在15分钟融资3000万美元
夜鹰教程网成立于2008年,目前已经运营了将近 13 年,发布了大量关于 html5/css3/C#/asp.net/java/python/nodejs/mongodb/sql server/android/javascript/mysql/mvc/easyui/vue/echarts原创教程。 我们一直都在坚持的是:认证负责、一丝不苟、以工匠的精神来打磨每一套教程,让读者感受到作者的用心。我们默默投入的时间,确保每一套教程都是一件作品,而不是呆板的文字和视频! 目前我们推出在线辅导班试运营,模式为一对一辅导,教学工具为QQ。我们的辅导学科包括 java 、android原生开发、webapp开发、商城开发、C#和asp.net开发,winform和物联网开发、web前端开发,但不仅限于此。 普通班针对的是国内学员,例如想打好基础的大学生、想转行的有志青年、想深入学习的程序员、想开发软件的初学者或者业余爱好者等。 就业办针对即将毕业上岗的大四学生,或者打算转行的初级开发工程师。 留学生班针对的是在欧美、加拿大、澳洲、日本、韩国、新加坡等地留学的中国学子,目的是让大家熟练地掌握编程技能,按时完成老师布置的作业,并能顺利地通过考试。 详细咨询QQ:1416759661   夜鹰教程网  基于角色的权限管理系统(c-s/b-s)。
  夜鹰教程网  基于nodejs的聊天室开发视频教程
  夜鹰教程网  Git分布式版本管理视频教程
  夜鹰教程网  MVC+EasyUI视频教程
  夜鹰教程网  在线考试系统视频教程
  夜鹰教程网  MongoDB视频教程。
  夜鹰教程网 Canvas视频教程
  夜鹰教程网 报表开发视频教程
  热点推荐
分享一套sql面试题附参考答案
程序员面试应该注意的问题
安慰一下女程序员这颗备受摧残的心…
浅谈网络公司程序员生存之道
20岁就该明白的31个事实,你看懂几…
赖霖枫:人才问题是个人网站扩张的…
李彦宏做客《咏乐汇》与美女共舞
揭秘IT精英的成长路线
戴志康:Discuz!、UCHome和Manyou…
李开复《选择的智慧》
马草原谈网站不能承受之重
一个现实的理想主义者-陈天桥
站长郭吉军创业目前不考虑赚钱
“你被解雇了!”
选择一个好的公司不如选择一个好的…
  最近更新
高考之后如何学习编程
软件开发新人注意事项
云计算发展历程大事记
程序员的出路在哪里?
“高效工作,快乐生活”才应该是我…
程序人生之八年数据库开发之路
多久能学会编程?
转载:程序员发展十分重要的习惯
帮一个好久不联系的女网友解决电脑…
面向对象设计的原则及经验
如何开发用QQ登录网站
(转)实际项目中编程和学校里面编…
为什么你一个月只有2、3K?
10年程序员谈.Net程序员的职业规划…
基础能力:电脑常用快捷键操作【部…

关于我们 | 网站建设 | 技术辅导 | 常见问题 | 联系我们 | 友情链接

夜鹰教程网 版权所有 www.yyjcw.com All rights reserved 备案号:蜀ICP备08011740号3