太原Java培训
达内太原java培训中心

0351-5608878

热门课程

Jcseg 2.1.1 发布,Java 轻量级开源自然语言处理包

  • 时间:2017-04-05 14:16
  • 发布:开源中国
  • 来源:开源中国

Jcseg 2.1.1 发布,Java 轻量级开源自然语言处理包

Jcseg 2.1.1 发布了。Jcseg是基于mmseg算法的一个轻量级中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于Jettyweb服务器,方便各大语言直接http调用,同时提供了最新版本的lucenesolrelasticsearch的分词接口!

Jcseg 2.1.1 更新内容:

优化JcsegTokenizer的实现:clearAttributes改为到reset中调用,去除end()的调用,方便TokenStream外引用做相关统计查询工作。

修复Word#toStringjson字符串的特殊字符转义bug,增加"\的预处理。 reported by https://github.com/luohuan02

修复《》之间五内容切出空字符串的bug reported by http://git.oschina.net/fige

NLP切分模式增加标准的datetime实体识别。例如:2017/03/072017-03-07

NLP切分模式增加中文通用datetime实体识别。例如:201737日,明天下午4点半,下周二上午845分等,明天凌晨2点一刻。

NLP切分模式增加混合dateime实体识别。例如:明天下午15:45,下周二10:302017-03-15下午三点半,2017/12/24下午15:45

优化了IWord词条对象的可能的并发访问问题,目前主要是出现在开启词库更新自动加载的情况下IWord.clone()调用时,更新线程和切分线程的竞争。

好了,今天就给大家讲这么多吧,喜欢我的内容可以关注或者分享(微信公众平台:tytedu)选择太原java培训,不再孤军奋战,轻轻松松做IT高薪白领。太原达内培训带领有明确目标的学子迈向成功之路!

预约申请免费试听课程

怕钱不够?就业挣钱后再付学费!     怕学不会?0基础入学,达内定制课程!     担心就业?近12万家雇主企业,推荐名企就业!

上一篇:java如何写一个高效率的及时获取更新文件改动的方式
下一篇:Android Studio 2.4 Preview 4 发布,内置 Java 8 支持

欧盟希望过滤上传到互联的所有代码,或成开发者噩梦

Hikic.js 史上最大 1.2 版本更新,插件支持助力更多功能

传苹果开发平民版HomePod:或下半年发布

匈牙利算法的Java语言实现

选择城市和中心
贵州省

广西省

海南省