通过结合专家咨询和文献调查的方法,确定了文化遗产领域具有代表性的本体或模型。主要包括了文化遗产领域通用型本体、图档博领域常用本体、项目应用型本体三大类型,涉及文献、档案、文物、建筑、艺术、戏剧、图像等多个主题。
(1)领域通用型本体。包括文化遗产领域广泛应用的CIDOC CRM模型、EDM模型等。
(2)图档博领域常用本体,包括书目本体BIBO、书目框架BIBFRAME与FRBR模型、针对档案资源的整理与描述的档案描述本体(OAD)以及国际档案理事会“上下文记录本体”(RiC-O)等。同时,选取了文化遗产领域广泛使用的AAT、TGN、ULAN等盖蒂词表的GVP本体。
(3)项目应用型本体。选取国外文化遗产资源建设领域比较知名的项目,包括意大利文化遗产知识图谱项目构建的ArCo本体、欧洲数字文化遗产CrossCult项目构建的顶层本体模型等。此外,还选取了描述与编码戏剧作品的戏剧综合本体Drammar以及描述图像与照片档案等视觉要素和视觉符号的身份与关系的“视觉表示本体”等。
本研究最终确定了15个具有代表性的文化遗产领域本体模型,共计包含819个类,1761个对象属性。从关联开放词表(Linked Open Vocabulary, LOV)等本体存储库或项目官方网站,获取样本本体的OWL或RDF编码文件。
| 序号 | 前缀 | 本体名称 | 命名空间 | 类数量 | 对象属性数量 | 说明 |
|---|---|---|---|---|---|---|
| 1 | frbr | Functional Requirements for Bibliographic Record | http://purl.org/vocab/frbr/core# | 25 | 52 | 书目记录的功能需求 |
| 2 | bf | BIBFRAME Vocabulary 2.0 | http://id.loc.gov/ontologies/bibframe/ | 188 | 132 | 书目框架 |
| 3 | bibo | The bibliographic ontology V1.3 | http://purl.org/ontology/bibo/ | 70 | 53 | 书目本体 |
| 4 | crm | CIDOC CRM V6.2 | http://www.cidoc-crm.org/cidoc-crm/ | 84 | 275 | 文化遗产领域信息整合、交换、共享和重用的概念参考模型 |
| 5 | edm | Europeana Data Model V5.2.4 | http://www.europeana.eu/schemas/edm/ | 40 | 53 | 欧盟数字图书馆项目制定的统一数据模型 |
| 6 | gvp | Getty Vocabulary Program Ontology | http://vocab.getty.edu/ontology# | 14 | 319 | 盖蒂词表本体 |
| 7 | hico | Historical Context Ontology | http://purl.org/emmedi/hico | 5 | 10 | 文化对象的历史情境信息描述本体模型 |
| 8 | crosscult | CrossCult ontology | http://kb.crosscult.eu/ | 85 | 230 | 欧洲数字文化遗产CrossCult项目顶层本体 |
| 9 | cis | Cultural Institute/Site and Cultural Event Ontology | http://dati.beniculturali.it/cis/ | 57 | 58 | 文化机构和文化事件本体 |
| 10 | arco | ArCo ontology | https://w3id.org/arco/ontology/core/ | 27 | 34 | 意大利文化遗产知识图谱本体 |
| 11 | oad | ontology for archival description V1.3 | http://culturalis.org/oad# | 25 | 28 | 档案描述本体 |
| 12 | drammar | Drammar: A comprehensive ontology of drama | http://www.purl.org/drammar | 55 | 74 | 戏剧综合本体 |
| 13 | biro | Bibliographic Reference Ontology | http://purl.org/spar/biro | 11 | 7 | 书目参考本体 |
| 14 | rico | ICA records in contexts-ontology | https://www.ica.org/standards/RiC/RiC-O_v0-2.html | 109 | 422 | 国际档案理事会档案本体,RiC-CM概念模型的本体表示 |
| 15 | vir | Visual Representation Ontology V1.2 | http://w3id.org/vir# | 24 | 14 | 视觉表示本体 |
| 总计 | - | - | - | 819 | 1761 | - |
复用现有的本体是构建本体的一个重要参考原则。本文对15个领域本体模型与外部本体或词表之间的复用情况进行数量统计和可视化。下图所示是领域本体之间及与外部词表间的复用关系,节点大小表示被复用的次数。
文化遗产领域本体的形式化表示普遍采用W3C国际标准以保证本体的通用性和互操作性。除了采用RDF、RDFs和OWL描述语言对本体进行形式化编码外,FOAF、SKOS和DC元数据标准等通用型词表常被用于参考与复用。
| 前缀 | 本体名称 | 命名空间 | 统计 |
|---|---|---|---|
| FOAF | Friend of a Friend | http://xmlns.com/foaf/0.1/ | 9/15 |
| SKOS | Simple Knowledge Organization System | http://www.w3.org/2004/02/skos/core# | 7/15 |
| DCT | DCMI Metadata Terms | http://purl.org/dc/terms/ | 7/15 |
| DC | Dublin Core | http://purl.org/dc/elements/1.1/ | 6/15 |
| vann | A vocabulary for annotating vocabulary descriptions | http://purl.org/vocab/vann/ | 5/15 |
| dcmitype | DCMI Type Vocabulary | http://purl.org/dc/dcmitype/ | 4/15 |
| voaf | Vocabulary of a Friend | http://purl.org/vocommons/voaf# | 4/15 |
| geo | WGS84 Geo Positioning | http://www.w3.org/2003/01/geo/wgs84_pos# | 4/15 |
| crm | CIDOC Concept Reference Model | http://www.cidoc-crm.org/cidoc-crm/ | 4/15 |
| event | The Event Ontology | http://purl.org/NET/c4dm/event.owl# | 3/15 |
本体前缀及其命名空间:
bio: http://purl.org/vocab/bio/0.1/
cc: http://web.resource.org/cc/
cito: http://purl.org/spar/cito/
ore: http://www.openarchives.org/ore/terms/
olo: http://purl.org/ontology/olo/core#
prov: http://www.w3.org/ns/prov#
schema: https://schema.org/
co: http://purl.org/co/