文本挖掘实操|用文本挖掘剖析54万首诗歌(17)
2024-06-15 来源:旧番剧
即使一些诗歌不是严格的用韵(即一首诗只能押一个韵),也会自动采用邻韵的方式来缓解韵律失和的问题。3)对人张若虚的乐府旧题《春江花月夜》(因为是乐府诗,字数较多,未参与诗歌生成模型的训练)中的若干诗句,采用对对子的方法生成下联,毫无违和感:
【上联】春江潮水连海平,海上明月共潮生 【下联】古塔风云绕山青,峰顶彩霞共霭晖
【上联】滟滟随波千万里,何处春江无月明 【下联】幽幽如幻五十年,此间尘世有风流
【上联】江流宛转绕芳甸,月照花林皆似霰 【下联】山势氤氲浮翠霭,风梳杨柳欲飞烟
【上联】斜月沉沉藏海雾,碣石潇湘无限路 【下联】春江漫卷漾烟雨,长河日夜有缘人
【上联】不知江月待何人,但见长江送流水 【下联】只向渔家寻旧迹,试问何处答耕桑
【上联】白云一片去悠悠,青枫浦上不胜愁 【下联】碧水千层横漠漠,赤雁南来正飞歌
【上联】鸿雁长飞光不度,鱼龙潜跃水成文 【下联】渔家小住月相随,鸥鹭往来船载歌
【上联】此时相望不相闻,愿逐月华流照君 【下联】何处觅人犹有约?欲邀仙子去还家
【上联】江畔何人初见月?江月何年初照人 【下联】天下有地可藏龙,海风哪处可观心
【上联】江天一色无纤尘,皎皎空中孤月轮 【下联】杨柳千丝犹有梦,蒙蒙江上满船灯
4)嵌入笔者所在的公司名称---“达观数据”作为藏头字,分别以“山川巍峨”、“得道修仙”、“田园躬耕”为题材,生成三首七言律诗:
《其一》
达摩七十二峰高,天下英雄气郁陶。
观海三山云缥缈,登楼千仞势岧峣。
数茎白发身长健,百尺丹梯路不遥。
据险未能穷胜览,凭栏徙倚思飘飖。
《其二》
达者由来本自然,人间何处不神仙。
观空已悟三千界,阅世方知二十年。
数点青山随杖屦,一行白鸟下云烟。
据鞍更欲凌风去,回首孤城落照边。
《其三》
达摩万象付评量,造化从来自一方。
观物有时开口笑,看人无处着心忙。
数间茅屋临流水,几个渔舟傍夕阳。
据得此中真面目,乾坤何地不沧桑。
5)在训练和生成式引入更多的诗歌标签信息,如风格、题材和藏头字,引导GPT2朝期望的方向的生成诗歌。训练好模型后,笔者输入诗歌风格(七言绝句、七言律诗)、藏头字(沧海月明)和题材(金戈忒吗、世事变迁、静悟禅机等),生成如下诗歌: