作为关系型数据库,“中国历代人物传记数据库”(China Biographical Database Project,简称CBDB)因拥有42万多条中国历代人物传记数据而成为从大数据视角整体关照明清进士家族的首选。它的“亲属关系”查询,能够呈现亲属关系网络,方便进行进士家族的梳理。同时,也应承认CBDB存在着匹配不准确、字段多重复等问题,这些问题可以借助家谱等文献得以解决。现阶段,中华寻根网提供了2392种家谱影像全文,便于我们利用爬虫程序提取家谱目录中的相关信息,进而自动判断进士家族,这是对CBDB的有益补充。在此基础上,借助社会网络分析,可以直观呈现以血缘、姻亲为核心的进士家族世系图谱。姻亲关系能够将多个进士家族之间联系起来,可以使视角由单个进士家族向有关联的多个进士家族转移,例如可以考察这些姻亲家族在治经、传经等方面是否存在影响等。依赖家谱留存下来的家族成员的文学作品,既是考察家族文学发展流变的基础,又是建构更加广泛的社会网络分析图谱的基石。
关注微信公众号 "盖瑞文化传媒"
输入文件号"317102",获取下载密码.