基于空间向量模型的先秦文献相似性研究 |
| |
引用本文: | 屈探春.基于空间向量模型的先秦文献相似性研究[J].文教资料,2014(30):160-163. |
| |
作者姓名: | 屈探春 |
| |
作者单位: | 南京师范大学文学院,江苏南京210097 |
| |
摘 要: | 本文基于空间向量模型,利用TF-IDF值,对《楚辞》、《公羊传》、《管子》、《谷梁传》、《国语》、《韩非子》、《老子》、《礼记》、《论语》、《吕氏春秋》、《孟子》、《墨子》、《商君书》、《诗经》、《孙子》、《武子》、《孝经》、《荀子》、《晏子春秋》、《仪礼》、《周礼》、《周易》、《庄子》、《尚书》和《左传》等二十五本先秦文献进行了相似度计算,通过分析文本的相似系数,考察文本间的相似程度和文献本身的特殊性。最终发现:部分文献用词较为封闭,用语风格独树一帜;部分文献用词则包容性,与其他文本的一致性较高。
|
关 键 词: | 先秦文献 相似性 向量空间模型 TF-IDF值 |
本文献已被 维普 等数据库收录! |
|