博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
solr4.5配置中文分词器mmseg4j
阅读量:7050 次
发布时间:2019-06-28

本文共 601 字,大约阅读时间需要 2 分钟。

solr4.x虽然提供了分词器,但不太适合对中文的分词,给大家推荐一个中文分词器mmseg4j

mmseg4j的下载地址:

通过以下几步就可以把mmseg4j分词器集成到中:

1、解压mmseg4j-1.9.1.zip,把dist下面的所有jar文件拷贝到你应用服务器下的/WEB-INF/lib中(如果你的应用服务器下面没有,请参考《》)。

2、拷贝data到solr_home/中(与core文件平级),并改名为dic(请参考《》)

3、进入到你想使用mmseg4j分词器的core中(此处以自带的collection1为例),用编辑器打开collection1/conf/schema.xml配置文件,添加如下代码:

4、引用mmseg4j分词器

上面我们已经定义了mmseg4j分词器,如何引用呢?

用编辑器打开collection1/conf/schema.xml配置文件,找到<fields>…</fields>,修改需要使用中文分词的字段,type=”text_mmseg4j”

.......//省略

通过以上步骤就可以成功配置mmseg4j分词器到solr中了。

 

本文出自 ,转载时请注明出处及相应链接。

本文永久链接:

你可能感兴趣的文章
《Android的设计与实现:卷I》——第3章 3.4.4解析Service
查看>>
中菲关系大转折 对中国光伏企业而言是陷阱?
查看>>
《游戏设计师修炼之道:数据驱动的游戏设计》一1.5 漏洞的来源
查看>>
中国多项5G核心技术取得重要突破
查看>>
人工智能「风口」,先行者为什么是搜索引擎?
查看>>
苹果将成首家万亿市值公司?巴克莱并不这么看
查看>>
覆盖全国317城 北斗服务助智慧城市升级
查看>>
Neural Attention Model for Abstractive Sentence Summarization
查看>>
《R语言编程艺术》——3.5 向量与矩阵的差异
查看>>
智慧巴彦淖尔,正向我们走来
查看>>
银行间债市衍生工具扩容:新版CRM落地 参与门槛降低
查看>>
Kubernetes总架构图
查看>>
“平台+应用”助力智慧城市建设
查看>>
天融信风险探知系统荣获2016中国计算机行业发展年度优秀产品奖
查看>>
2015跨国跨境投诉成为新热点 消费者信息安全难保障
查看>>
做数据中心操作系统的Mesosphere获7350万美元C轮融资
查看>>
日本中部机场网站间歇性瘫痪 疑遭黑客攻击
查看>>
EXV大屏系统助力招行全球视频会议中心
查看>>
移动互联:智慧城市背后的“智慧运营”
查看>>
CRM选型:比产品质量更重要的是维
查看>>