Reddit上面总是有好东西,既papersWithCode.com之后,最近发现了一个超级给力的research利器:connectedpapers.com。
通常在读完一篇paper之后,想知道相关的paper有什么。或者研究一个领域,想一下子纵览这个领域主要的paper有哪些。传统方法除了google scholar里面关键字搜索,按照年份和citation次数筛选之外,通常是看cite的paper或者读一些survey paper,但是cite的有些paper和original paper的相关性并没有那么强。而且这些方式并没有提供一个一目了然的纵览图,来表明某个领域paper之间的关系。
在这种痛点之下,以前就想应该有这么个东西存在,就是一个graph表明paper之间的关系,几天前兴奋的在reddit上看到了connectedpapers.com。

如上图所示,比如输入一篇paper的title“Faster r–cnn: Towards real-time object detection with region proposal networks”,就可以生成一个以这篇文章为基础的graph,于是相关的paper,这个领域主要的一些paper,和它们之间的关系就一目了然,圆圈大小代表引用多少,颜色深代表年份more recent。这样以图的形式对一个领域的主要工作纵览一目了然。同时每个paper还有直接的pdf,code,google scholar等链接。看了一些connectedpapers.com原始blog的介绍,说图里的相关性(edge) 并不是直接按照citation的关系(citation tree这样的图以前有人做过了),而是综合两篇paper的co-citation和一些其他因素来衡量相关性,这样就合理很多。同时connectedpapers.com已经和arXiv合作所以arXiv的paper中增加了connectedpapers的链接。
想要真正体会到它的价值,当然是自己试用一下了。
学术界一般只重视core的研究,对于把学术界的东西做成类似于让research community更容易交流检索的形式(类似与产品形态的东西)不太重视。最近出现的paperswithcode.com和connectedpapers.com都是这方面很大的进步,意义非凡,自己也通过总结计算机视觉的全景图contribute过一点,希望以后看到更多这样的东西出现。