地方志知识组织及内容挖掘研究——以《方志物产·广东》为例

来源 :南京农业大学 | 被引量 : 0次 | 上传用户:Erinhim
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
20世纪50年代,在著名农史专家万国鼎先生主持下,历时6年多,中国农业遗产研究室从全国各地收藏的6000多种地方志中摘抄并整理出“物产”资料,汇编成431册的《方志物产》,约3000万字,它基本上完整地保存了明、清和民国期间全国各地的物产史料,具有极高的农业科技、经济史料价值。本文将以这套资料为基础,探索方志信息组织的思路和方法。 本文首先从方志目录学整理角度出发,主要探讨方志目录类型和志书著录方式、方法,总结我国新旧方志索引工作的成绩和特点;其次,从农史物产史料整理角度出发,对农史物产史料的来源及其整理成果进行探讨和总结。 本文的重点是以《方志物产·广东》(即《方志物产》广东部分)为例,首先构建了一个《方志物产》信息系统,探索地方志知识组织和内容挖掘的方法。然后从以从信息系统中获得的有关基本数据,进行物产研究和引书研究。主要研究内容如下: (1)《方志物产·广东》信息系统的设计和构建。该系统主要包括全文数据库、物产索引子系统和引书挖掘及索引子系统等功能模块。 全文数据库构建,分析志书的行文格式,提取出能够概括全部来源志书的、规范的物产行文叙述格式,作为全文数据库字段设计的依据。本文设计的全文数据库除具有全文检索这一基本功能外,还有关键词检索、聚类检索和数据统计功能。 物产索引子系统,采用模式识别的方法,识别出物产的异名别称,建立物产异名标引词典,与物产正名标引词典一起,构建物产标引词典,用于物产的计算机标引和索引生成。物产索引子系统具有模式维护、异名别称识别、款目库维护、索引生成及浏览四项功能。 引书挖掘及索引子系统,采用引书引用模式、引书名称特征模式、人名引用模式,挖掘引书,建立引书标引词典,用于引书的计算机标引和索引生成。引书索引子系统具有引书模式库维护、引书模式识别、款目库维护、索引生成和浏览四项功能。 (2)((方志物产·广东》之物产研究,包括物产分布统计和分析、物产分类研究、物产异名别称研究。 物产分布统计分析,对《方志物产·广东》中的全部物产数据按历史时期和地域进行统计和分析。历史时期的结果表明:明代每部志书所载物产数量最多,民国其次,清代最少;民国时期平均每部志书篇幅最大,清代其次,明代最小,从明代到清代到民国,志书叙述物产越来越详细。地域的结果表明:从通志到府志到县志,平均每部志书所载物产数按地域面积大小逐步递减;从粤西、珠三角、粤北,粤东,平均每部志书所载物产数按地域位置由西向东逐渐减小。 物产的分类研究,对《方志物产·广东》所有来源志书的门目特征和类目特征进行分析和总结,探讨了植物、动物和货物的分类特点、类目设置得失和分类依据,在此基础上拟定一个能够类分所有物产的物产分类体系表,该表设立植物、动物和货物三个一级类目,植物类下设立13个二级类目,动物类下设立14个二级类目,货物类下设立9个二级类目。 物产的异名别称研究,对从《方志物产·广东》中辑得的1418条物产异名别称的表达模式,归纳为有别称词、避忌特称、地域特称、文献特称和特殊行业特称等五种,并对其命名来源进行探讨。物产异名别称的表达模式是物产异名别称挖掘的基础。 (3)引书研究,包括全部引书数据的统计分析、引书的引用方式研究。 全部引书数据的统计分析,主要是针对《方志物产·广东》引用的31670次各类文献,从来源志书角度和引书角度出发,以引用频次为视角进行统计分析。来源志书角度的引书统计分析表明:从历史时期看,明、清、民国三个历史时期的每部志书的引书平均数,都是按时代顺序递增,且民国远高于其他两个历史时期;从地域范围看,引用平均数最高的是记载全省物产的通志性志书;从地域位置看,珠三角地区的引用平均数高于粤西、粤东、粤北。引书角度的引书统计分析表明:诗词歌谣俗谚,引用2141次,其来源有三:岭南本地文人作品、岭外游宦文人作品、岭南当时民间歌谣俗谚;独立成篇的论著,引用29529次,其构成特点是:大量征引以岭南方志为主的岭南地方文献,大量录引反映当时真实物产状况的《采访册》,大量征引中医药文献。 引书的引用方式,本文辑录出《方志物产·广东》所有的引书名称引用模式和引用的表达模式。其中,引书名称引用模式有引用丈献名称、引用作者姓名和引用作者姓名+文献名称三种,引用表达模式有前标志型、后标志型和封闭型三种。引书名称引用模式和引用的表达模式,是进行引书挖掘研究的依据和途径. 另外,本文还以《岭南丛述》(物产)为例进行引书分析,这是针对该著述中除诗词歌谣俗谚以外的独立成篇的论著,以引书种类为视角进行统计分析,主要从历史时期、引用频次、地域、学科等方面,探讨该著述的信息来源及资料结构。 总之,本文采用农史史料学、情报学方法和计算机技术,尝试对地方志文献的物产资料进行基于知识内容的整理,意图探索方志知识组织和农史物产史料整理的思路。本文创新之处在于: 1.采用模式识别理论和方法,尝试应用于方志这类古代文献,用来识别、挖掘物产的异名别称和方志文献中的引书; 2.分析、提取《方志物产》文献内容的行文格式,形成统一、规范的方志物产文献的数据库格式,以期探索基于内容分析的古籍整理方法; 3.运用文献计量学方法,分析《方志物产》中的引书,试图探寻农业古籍的内容结构,为农业古籍的“辨章学术,考镜源流”提供量化研究方法。 4 本文针对方志文献特点,首次构建了《方志物产·广东》信息系统,用于检索方志物产文献全文、生成物产索引和引书索引,以及进行物产异名别称和引书的挖掘研究。
其他文献
一夜之间被“薅”到关店果小云店发布的声明  “羊毛党”现象引起网络舆论的广泛关注,起因是不久前的一起“销售事故”。果小云旗舰店由小布和他的叔叔打理。小布负责网店的运营,叔叔负责采摘发货。店里只有一款产品——现摘现发的四川产新鲜脐橙。2019年“双十一”期间,果小云旗舰店标出活动价促销,却因操作失当,险被羊毛党“薅”至关门。  据B站(bilibili视频网站)网友“小帅喵萌萌哒”爆料,B站一位拥有
期刊
区块链:一种去中心化、互联万物的新技术邱润根南昌大学法学院教授、德国洪堡大学访问学者  5G技术,万物互联,世界进入了物联时代。在这样一个物联时代,世间万物都会以数据的形式存在。收集万物的数据成了物联时代最为重要的基础性工作,但数据收集只是解决了最初数据的记录和存储问题。在数据被收集之后,数据由于其本身特性会流动起来,也就是说这些数据会被传播开来。并且,这些数据在大数据运算下会进一步形成新的数据。
期刊
据统计,“网络黑灰产业”的从业人员已经超过150万人,年产值可达千亿元级别,“羊毛党”正是“网络黑灰产业”中一个重要的获利群体。我们在任意一个网络或移动社交平台上输入“羊毛”等关键词,都会发现成百上千个“羊毛党”群,每个群的成员少则百人,多则近2000人。  需要指出的是,受害店铺的遭遇可能更容易引起广大网友的关注,而事实上,“羊毛党”的主攻方向并不是商家,而是电商平台。全新模式:买卖联手“薅”平
期刊
与传统发电方式相比,风能具有无煤耗和无污染的优势,但由于风速具有间歇性和不确定性,因此大容量风电场并网后会给电力系统的安全性和稳定性造成影响。本文主要研究含风电场的电力系统短期调度及其经济性风险管理,将风速的不确定性量化为风电成本纳入到短期调度模型中,并利用智能优化算法求出其最优解,根据考虑的因素不同分别建立了两个不同的调度模型:(1)将风险价值(VaR)和条件风险价值(CvaR)理论融入到含风电
针对未来特高压和智能电网的发展需求,需要一种非接触、小型化和智能化的电压互感器。目前,D-dot电场传感器的研究主要解决了单相测量的问题,而在三相输电线路中,由于电场耦合,将导致测量系统的电容矩阵扩大、电场分布的改变,D-dot电场传感器分别运行在单相线路和三相的某一相线路时,测量结果将有所不同,正是这种区别的存在,在三相D-dot电场传感器设计时,需要考虑分布参数和邻相电场影响。基于场路耦合法实
案例一:网店“一折甩卖”的背后  谁能想象,一家网店一夜之间竟然做成了5616单生意,卖出3.4万余件商品,而且均在原价的基础上以一折的折扣价成交,如果发货,将会给商家造成200多万元的损失。  经上海市宝山区人民检察院提起公诉,一审法院以破坏生产经营罪判处该网店原员工龙某有期徒刑一年。  龙某曾在张某的网店打工。2018年7月,张某进行人事调整,让龙某把公司电商平台上的App业务全部移交给另一名
期刊
写意精神是中国画的重要特性,现代画坛对于它的谈论往往围绕着写实与写意展开。五四运动以来,美术理论界曾就中国画是现实主义的还是浪漫主义的,是写实的还是写意的,展开过长
本文通过对荣华二采区10
全美第一電商亚马逊合法运营的“羊毛党”  早在10年前,美国就兴起了合法的“羊毛党”——优惠券销售公司。人们主要从报纸和杂志上剪下各种优惠券,然后兑换使用。由于优惠券的种类太多太杂,于是就有专门的公司(职业“羊毛党”)收集并向消费者出售优惠券。如今美国的优惠券销售公司仍然存在,它们销售的优惠券大部分都从纸质券变成了在线提供的电子链接或二维码。  帮你收集了优惠券,你就得付钱。例如一款沐浴露的优惠券
期刊
期刊