对于加入缓存功能的想法

Icelune · 2021年12月14日 13:46

好像很多很多年前，在研究生的故事里还写过搜索引擎算法相关的论文。。。。
其实我觉得某种程度上，网页的缓存查看功能是一种对搜索资料的补充。
当然，坏处可能会更占用资源空间。所以也许可以作为一个如果未来发展的比较好的话，的一个想法；
而且对于一个具有现代感的搜索引擎，也许我们可以做一个更具有现代感的缓存办法，
例如现在很多网页的框架算法其实都是有迹可循的，同样很多朋友做网页笔记都习惯于使用浏览器端的网页抓取扩展。而此类浏览器扩展，其实也是基于某些框架去抓取关键内容的。那么是否可以做一个对曾经网页进行内容摘抄整理后的缓存模式，然后符合某种需求，例如Markdown等等。

cwang · 2021年12月14日 13:51

你好! 这个想法太!好!了!

我们也在构思怎么帮用户更好的去管理知识 - 知识工作者大部分的知识都是从网上获取的, 碎片度特别高 (摘录笔记 + 收藏夹), 后期的整理和复用度都是想的很好, 其实做的不好的.

如果我们能生成 markdown, 生成摘要, 省去用户粗加工的时间, 用户可以高效地二次加工. 并且让这个可以有网络效应, 类似的网页摘录可以共享给都摘录过这个网页的其他用户 (网络上一个节点变聪明, 让所有节点变聪明), 是不是更好?

Icelune · 2021年12月14日 14:30

对于失效页面的追溯，这才是cache功能存在的意义。因为很多知识点页面时间久了就会存在大量的重复和失效。打个比方：CSDN那种博客，存在着大量无用的重复内容。另外，很多现在想要找的知识，现在只能依靠360知识库这种地方去回看。在此基础上整理只是格式问题。：）
当然，也许黑白名单的做法其实更容易，更节约成本。而且使用规则列表更容易实现~，在这一点上你是对的！