论文部分内容阅读
时间的表示和时阃关系的计算是时间分析任务的关键和难点。其中不确定时间的规范化由于关系到不同语言之间时间共享,而且中文时间表达方式丰富多样,因此时间规范化是一个重要而又复杂的问题。针对这个问题,参考国际标准时间定义,重新定义了时间关系类型;然后参考TIMEX2标记规范,通过解析时间表达式内部规则,对时间短语的规范化技术进行了研究。实验结果表明:该方法可以较好地解决规则不完善导致准确率低以及近义词造成的工作量大的问题,在人民日报语料上取得的准确率为89.52% 。