• •    

基于类型论的汉语分词系统TTCS

高东平   

  • 出版日期:2011-08-25 发布日期:2011-09-13

  • Online:2011-08-25 Published:2011-09-13

摘要: 针对汉语分词中的未登录词识别和歧义消除这两个瓶颈问题和目前方法的不足,将类型论的思想引入到汉语分词领域中,提出了类型匹配模型,以类型论函数贴合为主要算法,融合了全切分、统计,前后缀识别信息等多种技术手段,将分词、未登录词识别、歧义消除,词典的动态扩充有机的融合到一个统一的理论模型当中。在此理论框架的基础上,最后实现了基于类型论的汉语分词系统TTCS。