第二部分的伪作或伪经为例进行讨论
Posted: Thu Feb 06, 2025 7:11 am
西班牙的黄金时代似乎是为定量文本分析量身定制的。在虚拟图书馆中,例如著名的 BVMC(米格尔·德·塞万提斯虚拟图书馆),有大量文本和各种版本的数字形式。然而,文体分析不仅需要文本本身,还需要正确、完整的元数据。由于即使是黄金时代的当代版本在文本质量方面也难以验证,因此有关文本、作者、创作日期和地点的附加信息(所谓的元数据)变得更加重要。下面,我们将文体分析的现有文本基础进行问题化,并将其应用于阿韦利亚内达 (化名) 所著伪经《堂吉诃德》第二卷作者归属的例子。目的不是揭露阿韦拉内达的真实身份,而是用不同的参数(余弦增量、限制词列表、剔除、滚动增量)测试该方法,并在其他作者归属方法以及传统文学史和学术背景下讨论结果。
对于定量文学分析来说,西班牙黄金时代似乎是一个完美的研究领域。虚拟图书馆提供许多文本,例如最著名的米格尔·德·塞万提斯虚拟图书馆 (BVMC)。但对于像文体学这样的文本分析来说,不仅文本本身,而且元数据也应该是完整和正确的。由于黄金时代的当代版本本身很难判断文本的原创性,因此需要有关文本来源、作者、日期、地点的附加信息(通常称为元数据)。本文以阿韦利亚内达(化名)所著的伪经《堂吉诃德》第二卷的作者归属为例,探讨了文体分析的现有文本基础问题。目的不是发现作者阿韦利亚 巴基斯坦电报数据 内达的真实身份,而是用各种参数(余弦增量、选定的词表、剔除、滚动增量)测试该方法,并在其他现有作者归属方法和传统文学史和研究的背景下讨论结果。
版本 2.0(2021 年 6 月 8 日)
所做的修改如下:根据专家意见对内容进行了调整。更新和补充书目信息。正式更正。
1. 简介
2. 西班牙近代文学的数字文本基础——文本和版本的可用性和质量
3. 阿韦亚内达的假堂吉诃德:与塞万提斯的文学争论
4. 作者归属比较
5. 使用 R 语言对西班牙近代文学进行文体学研究:语料库、方法、结果
6. 合作创作的可能性:测试塞万提斯《堂吉诃德 II》的滚动三角洲
7. 结论:文体计量学研究的结果如何反馈到专业讨论中?
书目信息
进一步阅读
图例和参考文献
介
[ 1 ]从文学史的角度来看,西班牙的黄金时代(Siglo de Oro)在两个方面非常适合数字化。一方面,它被认为是西班牙最重要的文学和文化时代,并与古典戏剧(即兴喜剧、西班牙古典剧场)、诗歌(贡戈拉)和小说(从 《小狷士》到《堂吉诃德》)一起影响了世界文学。另一方面,16 和 17 世纪的文本不再受到数字出版所必须遵守的版权法的约束。此外,2005年至2016年间有多个400周年纪念日,从第一部《堂吉诃德》到塞万提斯逝世周年,因此也为数字化项目带
对于定量文学分析来说,西班牙黄金时代似乎是一个完美的研究领域。虚拟图书馆提供许多文本,例如最著名的米格尔·德·塞万提斯虚拟图书馆 (BVMC)。但对于像文体学这样的文本分析来说,不仅文本本身,而且元数据也应该是完整和正确的。由于黄金时代的当代版本本身很难判断文本的原创性,因此需要有关文本来源、作者、日期、地点的附加信息(通常称为元数据)。本文以阿韦利亚内达(化名)所著的伪经《堂吉诃德》第二卷的作者归属为例,探讨了文体分析的现有文本基础问题。目的不是发现作者阿韦利亚 巴基斯坦电报数据 内达的真实身份,而是用各种参数(余弦增量、选定的词表、剔除、滚动增量)测试该方法,并在其他现有作者归属方法和传统文学史和研究的背景下讨论结果。
版本 2.0(2021 年 6 月 8 日)
所做的修改如下:根据专家意见对内容进行了调整。更新和补充书目信息。正式更正。
1. 简介
2. 西班牙近代文学的数字文本基础——文本和版本的可用性和质量
3. 阿韦亚内达的假堂吉诃德:与塞万提斯的文学争论
4. 作者归属比较
5. 使用 R 语言对西班牙近代文学进行文体学研究:语料库、方法、结果
6. 合作创作的可能性:测试塞万提斯《堂吉诃德 II》的滚动三角洲
7. 结论:文体计量学研究的结果如何反馈到专业讨论中?
书目信息
进一步阅读
图例和参考文献
介
[ 1 ]从文学史的角度来看,西班牙的黄金时代(Siglo de Oro)在两个方面非常适合数字化。一方面,它被认为是西班牙最重要的文学和文化时代,并与古典戏剧(即兴喜剧、西班牙古典剧场)、诗歌(贡戈拉)和小说(从 《小狷士》到《堂吉诃德》)一起影响了世界文学。另一方面,16 和 17 世纪的文本不再受到数字出版所必须遵守的版权法的约束。此外,2005年至2016年间有多个400周年纪念日,从第一部《堂吉诃德》到塞万提斯逝世周年,因此也为数字化项目带