太原Java培训
达内太原java培训中心

0351-5608878

热门课程

Jcseg 2.4.0 发布,Java 轻量级开源自然语言处理包

  • 时间:2018-11-08 09:42
  • 发布:开源中国
  • 来源:开源中国

Jcseg 2.4.0 发布,Java 轻量级开源自然语言处理包

Jcseg是基于mmseg算法的一个轻量级中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于Jetty的web服务器,方便各大语言直接http调用,同时提供了最新版本的lucene,solr和elasticsearch的分词接口!

Jcseg 2.4.0更新如下:

1,修复时间组合实体识别的bug,有时候会出现错误组合的情况。

2,优化NLP模式的时间实体的识别,区分组合时间,例如:"米"实体为"length.m","3米"为"nuc_length.m"。

3,依据百度的汉语数据修复词条中的部分拼音错误:https://gitee.com/lionsoul/jcseg/commit/4f08a01ea94828e4c4ac585a744b4755f33c8c4b

4,修复中文数字转阿拉伯数字后词条的offset错误。

5,依据百度的汉语数据修复词条中的部分拼音错误:https://gitee.com/lionsoul/jcseg/commit/3de95015056a7ea683c5955faef891fa68af36b5

6,修改Elasticsearch的资源访问为官网建议的安全资源访问形式,意味着es插件不需要再grant privileges。

7,Elasticsearch插件中增加插件级别的单例词库创建接口并且使用安全方式加载词库。

8,修改jcseg-server中的jetty版本为:9.3.24.v20180605

9,jcseg-server.properties配置文件增加自定义host支持,便于外网访问。

10,修复maven编译中的全部javadoc报错。

11,README中增加了jcseg的使用案例和链接,以及微信和QQ沟通账号。

如果有人推荐你学习一门IT技术,第一反应一般人都是学习开发,学习java语言。达内Java培训班,有就业、有基础,有培优大数据等等班型,选择太原Java培训,走进太原达内的大家庭,每月开设免费技能训练营让你感受代码的魅力,为你的IT之路添砖加瓦。

【免责声明】本文系本网编辑部分转载,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与管理员联系,我们会予以更改或删除相关文章,以保证您的权益!

预约申请免费试听课程

         

上一篇:亚马逊发布用于Amazon Lightsail的托管数据库
下一篇:Scylla 3.0 发布,高吞吐低延迟的 NoSQL 数据库

RabbitMQ 3.7.9 发布,Erlang 的 AMQP 开源实现

Apache Qpid JMS 0.38.0,Java Message Service 客户端

内江师范学院与达内时代科技集团签订战略合作协议!

Egg 2.14.0 发布,阿里开源的企业级 Node.js 框架

选择城市和中心
贵州省

广西省

海南省