lucene判断两篇文章的相似度

Singlr5i2022-10-04 11:39:542条回答

lucene判断两篇文章的相似度
有两篇文章A和B,怎样用lucene编程序将它们的相识度算出来?

已提交,审核后显示!提交回复

共2条回复
zzhllm99_99 共回答了17个问题 | 采纳率76.5%
用lucene的简单分词,然后用余弦定理
1年前
jacky293 共回答了10个问题 | 采纳率
这两篇在中学语文书的八年级上册啊 <桥之美> <故宫博物馆> <乔家大院> 赵州桥 赵州桥
1年前

相关推荐

谁能明白Lucene中的Occur.MUST_NOT,Occur.MUST,Occur.SHOULD的用法
jinkey4291年前1
天杀孤心 共回答了20个问题 | 采纳率90%
MUST和MUST:取得连个查询子句的交集.
MUST和MUST_NOT:表示查询结果中不能包含MUST_NOT所对应得查询子句的检索结果.
MUST_NOT和MUST_NOT:无意义,检索无结果.
SHOULD与MUST、SHOULD与MUST_NOT:SHOULD与MUST连用时,无意义,结果为MUST子句的检索结果.与MUST_NOT连用时,功能同MUST.
SHOULD与SHOULD:表示“或”关系,最终检索结果为所有检索子句的并集.
用lucene做 通过拼音搜索产品,希望大家说说思路啊
塞南克修道院1年前1
april627 共回答了20个问题 | 采纳率85%
这个我觉得可以从两点入手.
1.索引的时候,就建立关键字的拼间索引,如 网络工程 就建立 wlgc 或者全拼的拼音,做为索引的filed.这样,搜索的时候,对拼音这个field也进行搜索就可以了.
2.在搜索的时候对搜索的拼音进行中文转化,然后搜索.
两种方式 都 要用到 转化工具,可以用下icu.