文件名称:prop200406
介绍说明--下载内容均来自于网络,请自行研究使用
概率句法分析器对于统计自然语言处理的很多高层应用,如统计机器翻译、问答系统、信息抽取、文本挖掘等都是至关重要的,直接决定这些应用系统的最终性能。本系统是一个概率型的Chart分析器。系统的分析算法是采用了多种优化策略。分析结果是概率最大的一棵分析树。在概率模型方面,本系统在一定程度上突破了pcfg的上下文无关假设,引入了结构上下文条件,使得分析结果正确率有了明显提高。在使用宾州中文树库进行的实验中,我们的分析器的标记召回率和标记精确率平均在75%-80%左右。在使用一个短句树库进行的实验中,两个指标都在90%以上。概率句法分析既需要建立合理的概率模型,又需要积累树库等语言资源。我们把所做的一点工作进行开放,就是希望抛弃闭门造车的做法,集思广益,推动这个基础领域的发展,使汉语的句法分析尽早实现实用化-probability syntax analyzer for statistical natural language processing of many senior applications, such as statistical machine translation, quiz systems, information extraction, text mining are essential, these applications directly determine the final performance. The system is a probability - based Chart analyzer. Systematic analysis algorithm is optimized using a variety of strategies. Results of the analysis is the greatest probability of a tree. The probability model, the system to some extent breakthrough in the context of pcfg unrelated to the assumption that the introduction of the context of the structural conditions, making results of the analysis accuracy rate has markedly improved. The use of Chinese tree of Pennsylvania library experiments, the analyzer markers recall rate a
(系统自动生成,下载前可以参看下载内容)
下载文件列表
压缩包 : 567365prop200406.rar 列表 prop prop\propexec prop\propexec\prop.exe prop\propexec\prcfg-结构上下文相关.txt prop\propexec\pcfg-上下文无关.txt prop\propexec\test-测试例句.txt prop\propsource prop\propsource\SYMBTBL.Cpp prop\propsource\ChildFrm.h prop\propsource\CntrItem.h prop\propsource\ERROR.H prop\propsource\GrammarDlg.h prop\propsource\GRMRGRPH.H prop\propsource\GRMRPARS.H prop\propsource\InputBar.h prop\propsource\InputComboBox.h prop\propsource\MainFrm.h prop\propsource\Monitor.h prop\propsource\prop.h prop\propsource\propDoc.h prop\propsource\propView.h prop\propsource\PtreeDoc.h prop\propsource\PtreeView.h prop\propsource\Resource.h prop\propsource\ROLEINVS.H prop\propsource\RRTBL.H prop\propsource\SlstDoc.h prop\propsource\SlstView.h prop\propsource\sntncelex.h prop\propsource\sntncepars.h prop\propsource\StdAfx.h prop\propsource\SYMBOL.H prop\propsource\SYMBTBL.H prop\propsource\sntncelex.c prop\propsource\ChildFrm.cpp prop\propsource\CntrItem.cpp prop\propsource\ERROR.Cpp prop\propsource\GrammarDlg.cpp prop\propsource\GRMRGRPH.Cpp prop\propsource\GRMRPARS.Cpp prop\propsource\InputBar.cpp prop\propsource\InputComboBox.cpp prop\propsource\MAIN.Cpp prop\propsource\MainFrm.cpp prop\propsource\Monitor.cpp prop\propsource\prop.cpp prop\propsource\propDoc.cpp prop\propsource\propView.cpp prop\propsource\PtreeDoc.cpp prop\propsource\PtreeView.cpp prop\propsource\ROLEINVS.Cpp prop\propsource\RRTBL.Cpp prop\propsource\SlstDoc.cpp prop\propsource\SlstView.cpp prop\propsource\sntncelex.cpp prop\propsource\sntncepars.cpp prop\propsource\StdAfx.cpp prop\自然语言处理开放资源许可证.doc prop\概率句法分析的研究.ppt prop\概率句法分析器ICTPROP使用说明.doc prop\概率句法分析器ICTPROP产权声明.txt