收藏本站
《新疆大学》 2018年
收藏 | 手机打开

维吾尔语事件间因果关系抽取

周兴发  
【摘要】:因果关系作为事件外部关联中的一种语义关系,在文本中既常见又非常重要,有着广泛的应用前景。它反映了事件间的先后相继、由因及果的一种关系。因果关系的识别对文本事件抽取,深层语义理解有着重要意义,有助于获取事件演变的过程,对事件的发生进一步认识,从而为决策者提供重要的信息来预判事件后期的发展。本文针对传统的方法不能有效抽取维吾尔语事件间因果关系问题,对维吾尔语词性标注和事件间的因果关系进行了研究,提出了一种基于双向长短时记忆网络的维吾尔语事件因果关系抽取方法。为了适应维吾尔语事件间因果关系的抽取,结合现有的词性标注集,本文对维吾尔语词性标注集筛选扩充,最终确定了40种词性。条件随机场和长短时记忆网络是常用的两种词序列标注模型。在实际研究过程中,条件随机场的特征函数对模型最终的性能非常重要,需要精心设计;同时长短时记忆网络在最终打标签阶段,采用softmax进行处理,这种方法在处理输出标签有直接强烈关系的数据时,效果有限。为了解决这些问题,本文提出了一种基于双向长短时记忆网络和条件随机场混合神经网络模型,使用条件随机场对双向长短时记忆网络的输出概率矩阵进行建模,得到最终的词性标注序列。最终实验表明P、R和F值分别达到了90.48%、85.32%和87.36%。相比于条件随机场等方法,该混合模型对维吾尔语词性标注有更好的标注效果。在维吾尔语事件间因果关系抽取任务中,传统的方法采用手工提取词性,实体以及句法信息等特征,然后带入浅层机器学习方法中。这类方法未能充分考虑事件句的深层语义信息,实验结果也表明传统的方法不能有效的抽取事件间的因果关系。因此,本文提出一种基于双向长短时记忆网络的维吾尔语事件间因果关系抽取方法,将维吾尔语事件间因果关系抽取问题转换为对事件对分类的问题。首先通过对维吾尔语的格语法、词干词尾和语序结构等语言特点以及事件间因果关系特点的研究,提取出11项基于维吾尔语事件内部结构信息的特征;为了充分利用事件句的深层语义信息,本文引入词向量作为双向长短时记忆网络的输入,提取出维吾尔语事件句隐含的深层语义特征,同时为了加速模型的收敛,引入批量规范化算法加速双向长短时记忆网络的收敛;最后融合11项事件内部结构信息特征和深层语义特征作为softmax分类器的输入,最终完成维吾尔语事件间的因果关系抽取。最终实验表明P、R和F值分别达到了89.19%、83.19%和86.09%,验证了该方法对维吾尔事件间因果关系抽取的有效性。
【学位授予单位】:新疆大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP391.1

【参考文献】
中国期刊全文数据库 前6条
1 赛迪亚古丽·艾尼瓦尔;向露;宗成庆;艾克白尔·帕塔尔;艾斯卡尔·艾木都拉;;融合多策略的维吾尔语词干提取方法[J];中文信息学报;2015年05期
2 贺宇;潘达;付国宏;;基于自动编码特征的汉语解释性意见句识别[J];北京大学学报(自然科学版);2015年02期
3 钟军;禹龙;田生伟;吐尔根·依布拉音;;基于双层模型的维吾尔语突发事件因果关系抽取[J];自动化学报;2014年04期
4 付剑锋;刘宗田;刘炜;周文;;基于层叠条件随机场的事件因果关系抽取[J];模式识别与人工智能;2011年04期
5 干红华;潘云鹤;;一种基于事件的因果关系的结构分析方法[J];模式识别与人工智能;2003年01期
6 王素格,张永奎;汉语词性自动标注系统的设计与实现[J];计算机工程;2001年03期
【共引文献】
中国期刊全文数据库 前8条
1 张旭洁;刘宗田;刘念祖;;基于概念代数的事件表示与运算规则[J];计算机科学;2015年S1期
2 钟军;禹龙;田生伟;吐尔根·依布拉音;;基于双层模型的维吾尔语突发事件因果关系抽取[J];自动化学报;2014年04期
3 胡学军;;环境侵权中的因果关系及其证明问题评析[J];中国法学;2013年05期
4 付剑锋;刘宗田;刘炜;周文;;基于层叠条件随机场的事件因果关系抽取[J];模式识别与人工智能;2011年04期
5 仲兆满;刘宗田;;利用事件影响关系识别文本集合中重要事件的方法[J];模式识别与人工智能;2010年03期
6 张卫;;词性标注系统的设计与实现[J];情报杂志;2008年11期
7 王朝静,郑庆华;面向答疑文本的词类标注方法的研究与实现[J];计算机工程与应用;2004年16期
8 吴晓慧,柴佩琪;提高韵律短语正确切分方法的研究[J];计算机工程;2003年02期
【二级参考文献】
中国期刊全文数据库 前9条
1 麦热哈巴·艾力;姜文斌;王志洋;吐尔根·依布拉音;刘群;;维吾尔语词法分析的有向图模型[J];软件学报;2012年12期
2 付剑锋;刘宗田;刘炜;周文;;基于层叠条件随机场的事件因果关系抽取[J];模式识别与人工智能;2011年04期
3 姜文斌;吴金星;乌日力嘎;那顺乌日图;刘群;;蒙古语有向图形态分析器的判别式词干词缀切分[J];中文信息学报;2011年04期
4 刘宗田;黄美丽;周文;仲兆满;付剑锋;单建芳;智慧来;;面向事件的本体研究[J];计算机科学;2009年11期
5 早克热·卡德尔;艾山·吾买尔;吐尔根·依布拉音;艾斯卡尔·艾木都拉;;维吾尔语名词构形词缀有限状态自动机的构造[J];中文信息学报;2009年06期
6 米热古丽·艾力;米吉提·阿不力米提;艾斯卡尔·艾木都拉;;基于词法分析的维吾尔语元音弱化算法研究[J];中文信息学报;2008年04期
7 古丽拉·阿东别克,米吉提·阿布力米提;维吾尔语词切分方法初探[J];中文信息学报;2004年06期
8 米吉提·阿布力米提,库尔班·吾布力;在多文种环境下的维吾尔语文字校对系统的开发研究[J];系统工程理论与实践;2003年05期
9 干红华;潘云鹤;;一种基于事件的因果关系的结构分析方法[J];模式识别与人工智能;2003年01期
【相似文献】
中国期刊全文数据库 前10条
1 麦热哈巴·艾力;吐尔根·依布拉音;加米拉·吾守尔;;维吾尔语依存树库构建及统计分析[J];中文信息学报;2018年11期
2 吐鲁洪;阿达来提;;高校维吾尔语专业(零基础)教学面临的困境及对策探索——以西北民族大学为例[J];延边教育学院学报;2017年05期
3 邹艾璇;;从克拉申第二语言习得理论看维吾尔语学习[J];语文学刊;2015年19期
4 李萍;;维吾尔语教学中听力能力的培养[J];语文学刊;2016年11期
5 温碧华;谭玲;王明慧;蒲晓华;;对新疆兵团基层汉族干部维吾尔语培训的思考[J];课程教育研究;2016年36期
6 克力木·哈力克;;浅谈维吾尔语影视剧译制工作[J];电视指南;2017年11期
7 姑丽爱热穆·依布拉音;;浅谈维吾尔语对偶词[J];中国民族博览;2017年03期
8 曹玉东;阿依努尔·克力木;;汉语兼语句的维译研究[J];中国民族博览;2017年02期
9 艾散江·麦提喀斯木;;维吾尔语和田方言特有词汇浅析[J];中国民族博览;2017年02期
10 杨超;;维吾尔语摹拟词的符号性探析[J];文教资料;2010年23期
中国重要会议论文全文数据库 前10条
1 热依曼·吐尔逊;艾力·海如拉;吾守尔·斯拉木;努尔麦麦提·尤鲁瓦斯;;维吾尔语方言口音资源库的建设及研究[A];第十四届全国人机语音通讯学术会议(NCMMSC’2017)论文集[C];2017年
2 梁洁;杨新璐;;维吾尔语韵律层级边界感知及其声学特征研究[A];第九届中国语音学学术会议论文集[C];2010年
3 阿依克孜.卡德尔;开沙尔.卡德尔;吐尔根.依布拉音;;面向自然语言信息处理的维吾尔语名词形态分析研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年
4 吾守尔.斯拉木;马欢;;维吾尔语文语转换系统的研究[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年
5 牛洪梅;吐尔根.伊不拉音;;维吾尔语的词性标注校对初探[A];第三届学生计算语言学研讨会论文集[C];2006年
6 热木土拉·麦麦提;古丽尼尕尔·买合木提;毛丽丹·尼加提;艾斯卡尔·艾木都拉;;基于上下文关系的维吾尔语词语拼写查错与自动纠正[A];第十四届全国人机语音通讯学术会议(NCMMSC’2017)论文集[C];2017年
7 阿布都瓦依提·尼亚孜;;论新疆维吾尔语种网站存在的问题及对策[A];中国少数民族地区信息传播与社会发展论丛(2011年刊)[C];2011年
8 努尔麦麦提·尤鲁瓦斯;刘俊华;吾守尔·斯拉木;热依曼·吐尔逊;;跨语言声学模型在维吾尔语语音识别中的应用[A];第十四届全国人机语音通讯学术会议(NCMMSC’2017)论文集[C];2017年
9 王海波;;维吾尔语语调的标注及功能研究[A];第十四届全国人机语音通讯学术会议(NCMMSC’2017)论文集[C];2017年
10 阿孜古丽·夏力甫;;基于复杂特征的维吾尔语VN结构[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
中国重要报纸全文数据库 前10条
1 吴郁真 刘冰 杨立洋;以多语种服务打造沟通新渠道[N];中国青年报;2010年
2 范磊;认亲,从娃娃做起[N];新疆日报(汉);2016年
3 本报记者 颜春燕 通讯员 张建军 苏衍宽;嵌入式居住培育民族团结之花[N];喀什日报(汉);2017年
4 通讯员 杨新远;我区有序推进“访惠聚”驻村工作无缝交接[N];喀什日报(汉);2017年
5 著名作家 王蒙;善良与阳光的底色[N];贵州日报;2017年
6 艾克拜尔·吾拉木 维吾尔族;以“一带一路”为契机,促进维吾尔族文学的发展[N];文艺报;2017年
7 记者 张慧疆 通讯员 林海;倍加珍惜爱护民族团结 坚定坚决维护社会稳定[N];巴音郭楞日报(汉);2017年
8 张辉 崔瑞祥 驻站记者 张锦星;让青春在强军实践中闪光[N];人民武警报;2017年
9 全媒体记者 贾梦妍;百名居民发声亮剑从自身做起守护美好家园[N];乌鲁木齐晚报(汉);2017年
10 记者井波、实习生郁萌;维吾尔语水平考试系统进入研发阶段[N];新疆日报(汉);2010年
中国博士188bet全文数据库 前10条
1 木沙江·艾力;古代维吾尔语历法和占卜文献的语文学研究[D];中央民族大学;2016年
2 倪宏鸣;维吾尔语和阿美语语言特征对比分析[D];中央民族大学;2007年
3 木再帕尔(Muzappar Abdurusul);论维吾尔语的名词化短语[D];中央民族大学;2007年
4 斯迪克江·伊布拉音;现代维吾尔语中的比喻研究[D];华东师范大学;2008年
5 魏玉清;维吾尔语和谐现象的音系学研究[D];华东师范大学;2010年
6 尼加提·苏皮;维吾尔语伊犁土语研究[D];中央民族大学;2010年
7 徐彦;从维吾尔语外来词看相关文化对维吾尔族文化的影响[D];新疆大学;2014年
8 阿克里·先木西;维吾尔语表语—系动词谓语结构[D];中央民族大学;2012年
9 卡依沙尔·艾合买提;Bwin[D];中央民族大学;2011年
10 艾合买提江·塔西(hmtjan TASH);维语心理谓词和操维语者在汉语二语环境下对英语心理谓词的三语习得研究[D];陕西师范大学;2015年
中国硕士188bet全文数据库 前10条
1 徐健;维吾尔语语音语料库管理平台的研究与实现[D];新疆大学;2018年
2 陶豆豆;维吾尔语名词短语指代消歧研究[D];新疆大学;2018年
3 周兴发;维吾尔语事件间因果关系抽取[D];新疆大学;2018年
4 阎婷婷;和田方言词与标准语之对应及汉译研究[D];伊犁师范学院;2018年
5 迪力尼卡·阿不都艾尼;维吾尔语传统行业词汇研究[D];新疆大学;2018年
6 穆凯待斯·阿布都艾尼;维吾尔语动词bol-的依存关系研究[D];新疆大学;2018年
7 地里米盖尔·多力坤;维吾尔语对汉语的影响研究[D];新疆大学;2018年
8 古丽拜合热姆·图尔荪;基于数据库的维吾尔语构词成分的功能研究[D];新疆大学;2018年
9 阿布来提·阿布都拉;维吾尔语构词附加成分的挖掘与利用研究[D];新疆大学;2018年
10 古丽尼尕尔·买合木提;汉—维神经机器翻译中减少集外词的方法研究[D];新疆大学;2018年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026