首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于SOM的语义词典自动构建实验研究
引用本文:陈涛,孙茂松.基于SOM的语义词典自动构建实验研究[J].情报学报,2007,26(1):77-83.
作者姓名:陈涛  孙茂松
作者单位:1. 宁波大学信息管理系,宁波,315211
2. 清华大学计算机科学与技术系,北京,100084
摘    要:语义词典在语言学和自然语言处理研究中占有相当关键的位置.语义词典的构造,通常有两类做法.一类是基于语言学家的主观判断,另一类则是基于机器的自动聚类.后者是本文所要研究的主题.本文基于大规模的语料库,利用自组织映射神经网络(SOM)对词典进行无监督的自动构造.首先从语料库中抽取待聚类词的上下文窗口中的词,并利用信息增益(Information Gain)对特征词进行选择,然后借鉴信息检索模型中的TFIDF计算特征向量中每一个特征的特征权重,最后将构造好的待聚类词的特征向量作为SOM的输入,经过网络的迭代计算将不同类别的词映射在SOM输出网格的不同结点.

关 键 词:词典  自组织映射  上下文窗口  信息增益
修稿时间:2006年1月4日

Automated Construction of Chinese Thesaurus Based on Self-Organizing Map
Chen Tao,Sun Maosong.Automated Construction of Chinese Thesaurus Based on Self-Organizing Map[J].Journal of the China Society for Scientific andTechnical Information,2007,26(1):77-83.
Authors:Chen Tao  Sun Maosong
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号