文本挖掘实操|用文本挖掘剖析54万首诗歌,我发现了这些(20)
2024-06-15 来源:旧番剧
七言律诗<sep>沧海月明<sep>静悟禅机<sep>沧浪万顷白鸥群,此地曾经此地分。海上楼台今夜月,山中楼阁几秋云。月明古寺僧初定,潮落空江雁正闻。明日相逢又相别,不知何处是离群。
上述生成结果,平仄符合,押韵亦可,诗意也不错。不敢说很完美,但至少很多人写不出如此观感的诗歌。
此外,上述按题材生成的结果,笔者进行了大量的题材诗歌生成测试,结果表明诗歌题材和生成诗歌之间的关联性较高,这也从侧面验证了笔者上述构建的诗歌题材语料库具有一定的合理性。
此外,笔者还通过生成的诗句发现了古今诗歌表达方面的一些差异,例如,笔者以“金戈铁马”作为生成题材,分别用毛主席《人民解放军占领南京》和陈老总的《梅岭三章》中的首联打头,各生成9首诗歌,结果如下(点击可查看大图):
上面两张图中占据中间C位的是原诗歌,其余的诗歌由毛主席和陈老总诗歌的首联“引导”而成,基本含有“金戈铁马”相关的意象,题材贴合度较高,大都跟征战、戌边、杀敌保国有关,比如:
闻道汉家多战伐,将军今日重南邦。
旌旗影动三军肃,刁斗声传五夜长。
中原战血三千里,南国英魂一断肠。
西风鼓角寒吹雁,南国旌旗夜渡河。
...
然而,可能跟学习了大量封建时代的诗歌有关,这些生成的诗歌到末尾大都是一个悲情的基调,略显消极,如以下几句:
从此边城多战伐,不须笳鼓更悲凉。