太原Java培训
达内太原java培训中心

0351-5608878

热门课程

Jcseg 2.1.1 发布,Java 轻量级开源自然语言处理包

  • 时间:2017-04-05
  • 发布:开源中国
  • 来源:开源中国

Jcseg 2.1.1 发布,Java 轻量级开源自然语言处理包

Jcseg 2.1.1 发布了。Jcseg是基于mmseg算法的一个轻量级中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于Jettyweb服务器,方便各大语言直接http调用,同时提供了最新版本的lucenesolrelasticsearch的分词接口!

Jcseg 2.1.1 更新内容:

优化JcsegTokenizer的实现:clearAttributes改为到reset中调用,去除end()的调用,方便TokenStream外引用做相关统计查询工作。

修复Word#toStringjson字符串的特殊字符转义bug,增加"\的预处理。 reported by https://github.com/luohuan02

修复《》之间五内容切出空字符串的bug reported by http://git.oschina.net/fige

NLP切分模式增加标准的datetime实体识别。例如:2017/03/072017-03-07

NLP切分模式增加中文通用datetime实体识别。例如:201737日,明天下午4点半,下周二上午845分等,明天凌晨2点一刻。

NLP切分模式增加混合dateime实体识别。例如:明天下午15:45,下周二10:302017-03-15下午三点半,2017/12/24下午15:45

优化了IWord词条对象的可能的并发访问问题,目前主要是出现在开启词库更新自动加载的情况下IWord.clone()调用时,更新线程和切分线程的竞争。

好了,今天就给大家讲这么多吧,喜欢我的内容可以关注或者分享(微信公众平台:tytedu)选择太原java培训,不再孤军奋战,轻轻松松做IT高薪白领。太原达内培训带领有明确目标的学子迈向成功之路!

上一篇:太原Java培训助力程序员成功的几个好习惯
下一篇:Android Studio 2.4 Preview 4 发布,内置 Java 8 支持

太原Java开发培训——java语言的优缺

Apache Commons BCEL 6.2 发布,更好的支持 Java 9

太原Java知识分享——Effective Java 第二版

用了这么久的JavaScript你知道他多大了么

选择城市和中心
贵州省

广西省

海南省