对于加入缓存功能的想法

好像很多很多年前,在研究生的故事里还写过搜索引擎算法相关的论文。。。。
其实我觉得某种程度上,网页的缓存查看功能是一种对搜索资料的补充。
当然,坏处可能会更占用资源空间。所以也许可以作为一个如果未来发展的比较好的话,的一个想法;
而且对于一个具有现代感的搜索引擎,也许我们可以做一个更具有现代感的缓存办法,
例如现在很多网页的框架算法其实都是有迹可循的,同样很多朋友做网页笔记都习惯于使用浏览器端的网页抓取扩展。而此类浏览器扩展,其实也是基于某些框架去抓取关键内容的。那么是否可以做一个对曾经网页进行内容摘抄整理后的缓存模式,然后符合某种需求,例如Markdown等等。

1 Like

你好! 这个想法太!好!了!

我们也在构思怎么帮用户更好的去管理知识 - 知识工作者大部分的知识都是从网上获取的, 碎片度特别高 (摘录笔记 + 收藏夹), 后期的整理和复用度都是想的很好, 其实做的不好的.

如果我们能生成 markdown, 生成摘要, 省去用户粗加工的时间, 用户可以高效地二次加工. 并且让这个可以有网络效应, 类似的网页摘录可以共享给都摘录过这个网页的其他用户 (网络上一个节点变聪明, 让所有节点变聪明), 是不是更好?

1 Like

对于失效页面的追溯,这才是cache功能存在的意义。因为很多知识点页面时间久了就会存在大量的重复和失效。打个比方:CSDN那种博客,存在着大量无用的重复内容。另外,很多现在想要找的知识,现在只能依靠360知识库这种地方去回看。在此基础上整理只是格式问题。:)
当然,也许黑白名单的做法其实更容易,更节约成本。而且使用规则列表更容易实现~,在这一点上你是对的!

2 Likes