文本挖掘实操|用文本挖掘剖析54万首诗歌,我发现了这些(4)

2024-06-15 来源:旧番剧

文本挖掘实操|用文本挖掘剖析54万首诗歌,我发现了这些


笔者观察其中部分结果,发现一字词、二字词才能算得上一般意义上的词汇,如“不”、“烁”、“岁寒”、“留滞”等 ;三字词和四字词一般是多类词性词汇的组合,严格上讲,应该算作短语或者固定表达,如“随流水”、”云深处”、“人间万事”、“江湖万里”等。但本文为了表述方便,笔者将它们统一称之为词。
下面,笔者分别展示词长从1到4的TOP100的高频词词云(点击图片可放大查看)。

文本挖掘实操|用文本挖掘剖析54万首诗歌,我发现了这些


一字高频词中,除去“不”、“无”、“有”这类“虚词”,单看“人山风日天云春花年月水”这11个高频字,暗合了中国天人合一哲学传统,作诗如作画,作诗者是把人放到自然环境、天地岁月这个时空大画卷中,七情六欲、天人感应,诗情画意就由感而生,诗意盎然了!
“诗画本一律”,古人诚不我欺!

文本挖掘实操|用文本挖掘剖析54万首诗歌,我发现了这些


猜你喜欢
动漫推荐
免责声明:动漫番剧数据来源网络!本站不收费,无vip,请勿上当!

www.jiufanju.com-旧番剧