feedId:85205011365325824+userId:41446102316176384
嗯,我有两万张纯文本的卡片笔记,使用场景包括 Win/Mac 两种桌面系统+iOS/Android 两种移动系统。使用中最突出的两个问题,一是不同平台高度依赖各自的索引,直接搜索纯文本效率极低了;二是上文提到的关键字污染。关于关键字污染,举个例子,如果一本书,书名中包含“印象笔记”四个字,无论这本书之下的笔记谈论的是张三还是李四,在纯文本环境下搜索“印象笔记”这个关键字,所有张三李四的内容,哪怕与“印象笔记”无关,也会被带出来。这个,很难通过纯文本关键字前缀是“@”还是“#”解决。WordPress就不然,可以通过设置是否包含分类和标签过滤搜索范围。另外,MySQL技术架构下的容量讨论,是“单表两千万条记录”、“单表过亿记录”,容量远超个人使用需求。纯文本库的笔记数超过 5000,效率会直线下降——哪怕是现在近乎封神的 Obsidian,搜索效率一样不高。另外,也是坚守传统博客的一点理由吧,毕竟技术架构和博客一样,维护成本其实比较有限。欢迎交流!纯文本笔记管理的最大漏洞:关键词污染https://kangjian.net/blog/2340/
嗯,我有两万张纯文本的卡片笔记,使用场景包括 Win/Mac 两种桌面系统+iOS/Android 两种移动系统。使用中最突出的两个问题,一是不同平台高度依赖各自的索引,直接搜索纯文本效率极低了;二是上文提到的关键字污染。
回复删除关于关键字污染,举个例子,如果一本书,书名中包含“印象笔记”四个字,无论这本书之下的笔记谈论的是张三还是李四,在纯文本环境下搜索“印象笔记”这个关键字,所有张三李四的内容,哪怕与“印象笔记”无关,也会被带出来。这个,很难通过纯文本关键字前缀是“@”还是“#”解决。WordPress就不然,可以通过设置是否包含分类和标签过滤搜索范围。另外,MySQL技术架构下的容量讨论,是“单表两千万条记录”、“单表过亿记录”,容量远超个人使用需求。纯文本库的笔记数超过 5000,效率会直线下降——哪怕是现在近乎封神的 Obsidian,搜索效率一样不高。
另外,也是坚守传统博客的一点理由吧,毕竟技术架构和博客一样,维护成本其实比较有限。欢迎交流!
纯文本笔记管理的最大漏洞:关键词污染
https://kangjian.net/blog/2340/