Matthew J. Westerby (国家美术馆) | 《开放人文图书馆》2024年刊
提出"上游注释"概念,倡导学者自主管理IIIF注释数据层,突破机构API的技术与社会双重约束,构建持续的知识生产空间。
"本文主要是从从事数字研究和数据密集型项目的艺术史学家的立场撰写的,本文探讨了可互操作图像上的注释以及注释作为 “厚数据” 的可能性。图像和描述性元数据可以在任何数量的上下文中使用和重用,但是注释是学术见解的上下文片段,不容易跨域翻译。尽管在技术意义上明确定义了web注释的数据模型,但它们的实现是出于社会动机的。本文简要概述了IIIF注释的生态系统,这些注释是沙盒项目和美术馆和图书馆开放获取计划的产物。我建议艺术史学家应该通过维护构成其注释输出的数据来实践 “上游注释”,同时承认注释空间的社会技术能力和短暂性。"
注释, 艺术史, 博物馆, 舱单, 收藏, 帆布, IIIF
2023年10月,由于广泛报道的网络攻击,大英图书馆托管的一系列数字服务不可用。该机构网页上的书籍和手稿的数字替代品突然无法访问。这部分是由于大英图书馆国际图像互操作性框架 (IIIF) 服务系统的丢失。当大英图书馆的IIIF API端点变得无响应时,该机构的IIIF清单和图像的其他 “下游” 使用受到影响。这些IIIF端点的丢失揭示了机构与在线收藏用户之间关系的相对较新但根本性的变化,其中存在单独的层来提供图像,并呈现真实世界对象的数字代理,例如书。认识到网络出版的这一重大变化现在是学者们迫切关注的问题,正如Suzanne Paul,Benjamin Albritton和其他小组成员在 “现在你看到了,现在你没有:“ 数字时代的可持续接入 ”,由数字中世纪主义者由劳拉·莫雷尔 (Laura Morreale) 主持数字中世纪主义者。
尽管IIIF被大型机构广泛实施,但艺术史领域才刚刚开始适应其所代表的互操作性和可重用性范式。从更广泛的意义上讲,作为人文学科的一个专门领域,艺术历史实践突然对以b é atrice joyeux-prunel为特征的 “数字可复制时代” 做出了回应。在这个范例中,图像和描述性元数据可以重复使用和分散-假设内容是在开放的,共享的许可下发布的,对于现代和当代艺术的图像而言,情况可能并非如此。在本文中,我反思了将可互操作的图像作为艺术历史实践的注释。尽管IIIF的自我实施目前被归类为数字学者,专家和技术人员唯一关注的问题,艺术史领域的所有学者在在线查找来源并查看或注释图书馆,档案馆和博物馆发布的数字收藏时,都会参与可互操作的图像。IIIF画布,清单和集合作为IIIF API规范的关键解释字段,代表了大量的知识和专业知识。
除技术规范外,注释空间的实现还由社会环境定义。在本文中,我简要概述了IIIF注释的生态系统,这些注释是由机构领导的开放获取计划和主要由个人领导的沙盒项目的产物。我认为,数字学者和艺术史学家应该注意他们所从事的架构以及他们创作的注释的位置。学者可以不依靠机构管理的IIIF系统,而是努力管理他们作为数据服务和研究成果撰写的注释,从而 “注释上游”-我在这里定义为发布和维护自己的注释。这也可能意味着发布和维护注释所针对的数字存储库,例如IIIF清单。我通过将知识重新定义为实践,创建有意义的清单作为数字讲故事的组成部分以及用于社会注释的工具的部分,回到了这个概念。
注释上游
机构权威对于了解博物馆和图书馆馆藏信息的准确性至关重要。艺术史学家将继续将收藏机构视为权威来源。同时,数据来源是分散的链接开放数据 (LOD) 环境中的一个重要因素,因此,数字学者将更喜欢重用机构创建的IIIF清单,特别是如果一个学者没有手段,能力或时间来产生自己的表现。但是,IIIF注释层可以看作是一个独特的内容空间,由学术见解的上下文片段组成,并且包含语义关系,当脱离上下文时,该语义关系可能会被破坏。机构可能不包括允许以后重用的持久性标识符,例如IIIF画布的uuid (通用唯一标识符)。在技术意义上,IIIF注释的关系由Web注释数据模型定义,至少对于当前的IIIF演示API 3.0规范。机构可以实施系统来跟踪变化,并使重新显示的对象的历史透明。还可以应用标识符 (如ARKs),以便当机构重新表示IIIF对象时,保留对先前标识符的引用,从而确保一定程度的连续性和可追溯性。
在上游,更具体地说,作为注释和目标的来源,预示着数字学者在连续的艺术历史解释过程中的位置。引用Emily Pugh通过制度变革和学术实践对信息管理领域和系统的概述,连续的解释行为从根本上依赖于 “如何描述书籍或文档,分类,分类,和accessed',它 '在顾客搜索收藏品时会在下游感受到连锁反应'。将IIIF清单视为与顾客通过网页访问的搜索服务处于同一类别的数据产品,这种涟漪效应延伸到顾客以IIIF清单或集合的形式编写关于项目的web注释的点。
对于艺术史领域,上游注释的实践也是一种塑造知识体系的干预。通过有意将IIIF注释空间的现象作为话语的场所,艺术史学家可以避免在不知不觉中采用由技术人员设计的数据模型,这些技术人员不可能设想未来对项目的每一次潜在的重用或重新解释。继后来在Pugh的 “现在的艺术史” 论文中提出的挑衅之后,如果艺术史学家希望 “继续对艺术品,艺术家,和关于艺术的想法。这些见解可能采取由IIIF注释或在线社交注释社区共享的内容驱动的创意展览的形式,以及同行评审的论文和正式写作。它们也可能是计算分析的输出。最后,我通过解决一个场景,在该场景中,用户和计算机生成的注释在单个画布上的扩散可能被视为定性分析的站点,其中许多注释层针对相同的源,我将其描述为 “厚数据” 的一种形式。
复刻知识
关于对象的备注可以完全独立于对象而存在。艺术史上的一种持久做法是在物体图像上方或附近重新刻写书面文字。从这个意义上说,描述,论文和数据系统都是代表现实的手段。被视为指针系统,它们 “在特定的有界上下文内提供对该现实的结构化理解”。可以以注释的形式在材料对象的数字代理上重新刻写描述。这也适用于原始的IIIF共享画布数据模型。一个非IIIF示例重用了归因于圣丹尼斯住持Suger的翻译文本,在摄影测量3D模型上以数字注释的形式描述古代碗周围的彩色石带。中呈现的Sketchfab观看者,注释将 “石头的红色sard与onyx的黑色形成鲜明对比” 的方式传达给现实世界对象的替代对象,自记录此描述以来已有800多年。
屏幕截图显示了在用户生成的圣丹尼斯住持Suger圣杯的摄影测量3D模型上带有文本主体的单点数字注释,公元前2/1世纪 (cup);(安装),国家美术馆,。使用Polycam创建并查看Sketchfab查看器。
为了演示注释空间作为用艺术品图像重新刻写文本的站点,可以在可互操作的图像上重新刻写有关博物馆对象的网页的概述。使用Orazio Gentileschi的公共领域描述和图像的示例琵琶演奏者在国家美术馆展示了如何做到这一点数字Mappa2.0,用于数字奖学金项目的工作区,可让用户轻松导入IIIF清单URL,并开始使用颜色编码的文本突出显示对集合进行注释。作为开源软件,启动实例所需的资源数字Mappa是创建用于研究,教学或出版的基于web的注释沙箱的相对较低的障碍。
从这个意义上说,IIIF内容空间中的注释重新定义了知识。而不是依靠机构来维护定义内容空间的给定数据服务 (如IIIF端点),数字学者可以重用机构提供的开放访问图像和元数据,作为定义自己的注释空间的起点。Tanya Clement和Liz Fischer描述了这种情况,其中清单是由读者创建或复制并重新共享的,他们可能希望重新定向 [一个] 对象如何在线呈现。通过引用或创建仅指向对象的最小细节的链接,例如图像或音频文件 (梵高的 “星夜” 中最亮的星星或一首诗中的一个短语作者: Maya Angelou),该读取器可以创建一个清单,该清单完全重新定向对象的读取或访问方式 '。对于IIIF空间中的注释,由下游用户产生的清单将理想地使用由博物馆或库生成的相同的IIIF画布ID以用于上下文的连续性。即使未提供此IIIF画布ID的定位器,例如DOI或方舟引用URL,分配给该IIIF画布的UUID可以在将来匹配或引用。这可能被视为数字法医艺术历史研究的一种形式。
重新使用机构生成的IIIF清单的数字学者现在应该意识到,IIIF图像像网站一样,可以随时消失。这些数据服务的用户可能并不确切地知道他们在什么时候进入信息生态系统。尽管系统可以分散,但文化遗产数据的用户可能更喜欢参考机构服务,因为它们被视为权威,从这个意义上说,用户是机构的下游。任何给定的IIIF清单的值与网页的不同之处在于,网页不为不可预见的下游数字展览或其他类型的网络演示提供数据服务 (清单文件客户端IIIF查看器)。如果数字项目依赖于API端点来引用注释数据并且该端点消失,则计算机呈现语义关系的能力被破坏。如果存在任何持久性的期望,则由最终用户创作的针对机构IIIF清单的注释固有地存在风险。例如,博物馆可能会将其收藏中的对象重新呈现 (即创建新清单) 为具有不同IIIF画布标识符的新数字对象。这里又是一个URL定位器,如DOI或方舟对于IIIF画布ID,它是链接可互操作内容空间的重要一步。
随着时间的推移,互联网档案馆生成的可互操作的图像和清单可能比博物馆和图书馆生成的图像和清单更持久,但同样依赖于机构监督。在2023,互联网档案馆开始正式支持托管用户上传的IIIF图像,寻求为普通互联网用户服务,用Josh Hadro的话说,'可能无法从与传统研究机构提供的基础设施相同的访问或隶属关系中受益'。作为比较,维基百科尚未发布IIIF清单。总体而言,这意味着大多数IIIF画布和清单都是短暂的,这意味着给定的IIIF清单 “没有作为内容空间定义的既定权威”,如Tom Crane所述,IIIF技术规范的特约作者。同时,博物馆和图书馆公开IIIF的方式表现为在线收藏网页上IIIF查看器的功能,鼓励了它们在其他应用程序中的直接重用。集合图像和数据的聚合器是共享的一种方法,我将在本文后面讨论聚合器的示例Europeana。就像大英图书馆的网络攻击一样,互联网档案馆也面临着反复的网络攻击,并且在本文提交发表时于2024年10月无法访问。
机构也可以通过共享和分散数字馆藏而受益。这也可以看作是一种分布式集合安全策略。继Dot Porter之后,馆藏共享意味着来自一个机构的数字馆藏由另一个机构共享和托管,“以一种不依赖于原始机构系统的方式”。利用分散的协议,如IPFS (星际文件系统) 为分布式存储和区块链提供唯一标识符是实现更广泛去中心化的一种策略。
实现诸如可重用性之类的理想以实现上下文连续性的愿望可能与对学生和学者的要求背道而驰。支持STEM领域的机构可能更有可能遵守公平数据原则 (可找到、可访问、可互操作和可重用)。一个例子是建立在公平数字对象框架上的分布式科学收藏系统 (DiSSCo)。在数字人文和数字艺术史领域,缺乏资金或专业知识来实现这些理想可能会使公平原则沦为可选功能的地位,除了需要起草和实施数据策略的大型赠款资助的研究项目外。为IIIF画布分配uuid是遵循公平原则的一种方法,也是我在本文后面讨论的一种做法。
对于艺术史和人文科学,公平原则可能无法解决未来最需要的标准,以质疑我们当前关于过去的论述。针对土著数据主权提出了关怀原则 (集体利益,控制权,责任,道德)。B é atrice joyeux-prunel倡导增加道德和专业知识,来源提及和时间戳,以将公平扩展到最公平。被认为不仅仅是元数据,源提及和时间戳可能有助于跨重新定义的知识系统进行转换。从这个意义上说,数字学者将自己及其解释置于时间,地点和道德体系中。Wikidata也可以被视为重新记录的知识的来源,因为Wikidata不是过去的来源,而是我们如何讨论和构想过去的话语模型,其中在Wikidata记录版本历史记录中跟踪时间戳和用户名。给定用户的 “谈话” 页面可以例如记录该用户已经展示的道德和专业知识。作为重新记录知识和记录来源和时间的网站,数字学者必须考虑他们参与的IIIF清单的出处。
有意义的清单和讲故事
到目前为止我所关注的上游注释的论点相反,有很多理由直接重用由机构生成的IIIF清单。文化遗产机构也在响应对发现代表其藏品的清单的需求。一个例子是在伦敦国家美术馆开发的简单的IIIF发现工具。博物馆清单url也可以在开放知识系统中作为LOD共享。例如,华盛顿国家美术馆在2018年试行了一个项目,向维基共享资源和维基数据 (Wikimedia Commons和Wikidata) 捐赠开放获取图像和数据。茨威格,为包含IIIF清单url的艺术品创建Wikidata声明,以使数字学者更有可能发现并重用博物馆的清单。因为国家美术馆在Creative Commons 0 (CC0) 许可下向Wikimedia Commons捐赠了图像和收藏数据,数字学者可以将结构复制到他们自己的产品中,并对这些IIIF清单进行注释,正如克莱门特和菲舍尔所描述的那样,其中注释存在于 “未经授权的,分发的,和分散系统 (2021: 4)。博物馆和图书馆的可发现性为数字学者提供了实践上游注释的机会。
IIIF清单内的描述性值或元数据通常再现与网页相同的有关艺术品或对象的信息。为了避免重复,web开发人员Mat Jordan和Mark Baggett设计了一个静态站点生成器天篷IIIF要从IIIF清单和集合构建网站,请将IIIF清单设想为HTML
在这一点上,我认为艺术史学家和数字学者应该产生IIIF资源,而不仅仅是依靠机构数据服务。换句话说,学者应该定义一个语料库,并尽可能将他们的解释作为其他用户在一个连续的内容空间中分层。注释也可以被看作是关于解释的社会产生的数据,它们的流通程度依赖于用户对同一来源发表评论或对早期注释发表评论的能力。IIIF中的这个话语中心是 “注释空间”,带有指向由可互操作的图像表示的事物的指针。
带有可互操作图像的故事驱动的数字展览也由注释驱动,并通过对图像区域进行构图并将书面描述作为叙事实践来促进潜在的话语轨迹。一个例子是展品,由Mnemoscene开发,基于通用查看器。展品是一个易于使用的web应用程序,具有许多用于编写视觉叙述或创建交互式教学材料 (如测验) 的应用程序。但是,除非数字学者或机构部署自托管的展品,IIIF画布上的注释会驱动 “滚动” 故事中的文本和图像关系,这些注释会存储到Mnemoscene的展品web服务器。
其他基于web的故事讲述工具要求编辑人员将其智力工作的这些输出保存到GitHub用户帐户中,这些决定具有深远的影响。公告例如,由Niqui O'Neill开发的,使学者能够为IIIF注释部署GitHub工作区,而无需启动IIIF注释服务器。在一次采访中,O'Neill表示他们 “决定使用注释url作为数据源,以使该工具可用于更广泛的图像并减少用户劳动”。O'Neill进一步指出,“如果清单被用作数据源,则外部用户将不得不创建并托管自己的单独清单”。在这里,IIIF清单再次成为许多艺术史学家所掩盖的话语场所。
考虑到提出的问题,学者们可能会想到切实可行的方法来将可互操作的图像重新体现为 “上游” 来源。面向数字学者的软件插件和有用指南是一个起点。档案研究工具的插件Tropy允许用户导入和导出IIIF清单。例如,一组15世纪书籍的开放获取 (CC0) 图像导入到Tropy在数字学者的计算机上可以丰富元数据和笔记,然后可以将其映射到IIIF演示文稿并导出到Github用户配置文件以发布为静态网页。笔记写在Tropy接口可以使用免费和开源插件导出tropiiify,由ARKA数字工作室创建。从local开始,艺术史学家 (像我自己) 可以识别书籍的数字替代中描绘的主题,链接到Wikidata Q标识符和注释作者的ORCID标识符。Tropy注释在HTML中导出为IIIF清单中引用的注释,该清单使用tropiiify。使用的分步指南和有帮助的上下文tropiiify插件在Raffaele Messuti的博客文章中共享和肖恩·格雷厄姆。
屏幕截图显示Tropy与通过名称和wikidataq标识符标识木刻中的主题的注释接口,其中一行文本标识具有ORCID标识符和日期的注释作者的姓名。意大利15世纪艺术家 (威尼斯人和费拉雷塞) 和贾科莫·菲利波·福雷斯蒂·达·贝加莫 (作者),De plurimis claris selectisque Mulieribus,出版于1497年4月,边界日期为1493年; 装订成册,有172幅木刻小插图肖像。国家美术馆
如果导入IIIF清单以启动此过程,则创建者/重新声明者应考虑重用图像和元数据的最佳做法。Missuti和Graham都建议为您的每个项目生成唯一标识符的步骤Tropy您打算发布的集合。如果导入的清单已经为IIIF画布提供了唯一标识符或UUID,则可以重新使用或引用此标识符。的IIIF食谱为实现者提供了场景和示例,但重复使用清单或清单的一部分是一种不断发展的实践。假设remanifestor使用Github发布他们的新清单,对清单JSON文件的任何更改也将被跟踪和发现。
社交注释和厚数据
考虑到从机构到个别学者的IIIF清单和注释的范围,对上游注释和社交注释平台的比较研究揭示了开放注释模型的理想与商业模型需求之间的差距。尽管个人将注释作为数据进行管理的工具相对易于访问,如前面使用Github的示例所示,社会技术现实鼓励网络上的大多数人在多个平台上创建免费的用户帐户,从而生成封闭的内容空间。社交注释是数字出版平台的一项功能,如歧管,读者可以与阅读组共享亮点,这些阅读组可以在用户的阅读界面中打开或关闭。类似的功能被捆绑到教学和教学平台中,如帆布。鼓励跨用户组的对话和讨论是这些平台的共同特征。>
其他web技术通过实现Web注释数据模型 (WADM)。这是由公益公司Anno支持的名为Hypothesis的社交注释工具的目标,该工具旨在 “将内容和对话与一层社交注释结合在一起”。使用浏览器扩展和单个用户帐户,用户可以注释他们在internet上看到和阅读的内容,并与定义的组共享注释。
假设数字学者在最广泛的意义上共享注释,人们可以设想这样一种场景,其中引用单个IIIF画布的用户和计算机生成的注释的激增可以被分析为 “厚数据”。该术语适用于将大数据用于人种学研究的研究人员,在人类学家Clifford Geertz的工作中认识到 “厚描述” 的概念。粗描述是指 “解释而不是描述的帐户”。由Paul Moore阐述的 “厚数据” 方法表明,使用数据的方式是文化问题而不是技术问题,强调 “所有技术最终不仅取决于用户的需求,还取决于使用它们的环境”。在这里,摩尔的见解与Alison Langmead和David Newbury对现象世界的基于指针和代理的模型以及计算机系统的社会地位使用的基本解释相似,注意到 “默示和明确的上下文不能在不损害其知识连贯性和随后的影响的情况下转移到其他上下文”。
实际上,IIIF注释的这种 “厚数据” 需要一个集中式平台。分析大量人类和计算机生成的注释作为解释性实践的能力依赖于用户对可以被引用、查询或映射的集体注释空间的贡献。这些存储库以注释空间的 “厚重数据” 作为话语场所来解决艺术历史研究问题的潜力才开始超越特殊利益群体。像假设web注释工具一样,同样基于Web注释数据模型,EuropeanaAnnotations API是一个注释空间,允许创建、检索和管理针对Europeana对象。可以想象未来的研究问题,这些问题以定量或定性的方法考虑给定IIIF上的注释的数量或类型,可以用这种方式来描述博物馆物品的文化意义。这与将已发表的文章作为数据或关于艺术的机器可读写作进行分析的新兴方法相似。
最近由生成式AI创建的内容的爆炸式增长可能会模糊 “厚数据” 和 “数据污染” 之间的界限。IIIF社区开始回应这个问题。Allison Sherrick和Diego Pino Navarro提议在IIIF清单中使用 “无AI” 或 “受监管的AI” 许可证标签,以防止AI机器人收获; 他们还建议标记AI生成的输出,像图像描述或指向图像区域的注释,以标识其创建方法。在艺术历史话语中,“数据污染” 是一种熟悉的现象,诚然规模要有限得多。一个例子是遵循西欧鉴赏家传统的艺术品制造商的学术归属,该鉴赏家为匿名大师提供了名字。策展人和研究人员的学术共识所坚持的notname被用作诸如Getty联盟艺术家名称列表 (ULAN) 之类的词汇中的数据点,但是notname不能总是通过可观察到的事实来解决。例如,在Wikidata模型中,“匿名主机”可能具有冲突的语句 “实例”实体 “人” 和 “实例” 类 “notname”。与人类曾经生活和行动的可观察事实不同,匿名大师的名字是由关于风格和学校的学术话语产生的,并且可能不是基于可观察或可复制的事实。因此,它们代表了一种循环的学术讨论形式,产生了相互冲突的陈述-或关于陈述的陈述-随着它们在学术文献中的重复,这些陈述会被进一步掩盖。由LLMs (大型语言模型) 提供支持的人工智能产品,当它们被用于在相同的内容空间内生成注释时,代表了一种不同但相关的现象。
尽管在数据科学中避免了冗长,但它仍然是艺术史中知识生产的共同特征。CRMaaa(艺术和建筑论证概念参考模型),这是对CIDOC CRM标准,旨在表示不容易建模的历史数据。CRMaaa引入 “制度事实” 和 “言语行为” 来代表社会行为作为历史事实。可以使用类似的方法来表示以IIIF注释的形式发布的计算机生成的内容。基于学术讨论,这种类型的模型引入了近乎无限的复杂性,可能不适合机构实施,因为元数据的完整性和权威性是主要任务。为了解决计算机生成的注释,机构可能会实施预测或响应超出其控制范围的风险的策略,例如提供标签以识别作者,创建日期,以及他们发布的内容和注释的期望用途,如从公平到公平的扩展中所建议的。通过这种方式,显化和重新显化图像和元数据的机构和数字学者在他们创建的内容空间中采取了道德立场,即使他们缺乏机构来限制或警察恶意使用其可互操作的集合 (例如IIIF清单和画布)。
结论
艺术史学家和数字学者可以通过实践上游注释来掌握他们的见解和讲故事的产出,更喜欢以他们创建和托管的IIIF画布为目标,或者以上传到免费使用的集中式平台 (如Internet Archive) 或分散但可通过持久标识符定位的图像为目标。采用最佳实践,如时间戳的层次的解释,可以进一步有助于有价值的使用共享的画布和有意义的清单。这种做法本身不会导致更好地保存学术注释内容,但它可能会影响数字学者注意他们的输出。具有开放访问内容的博物馆和图书馆创建的IIIF清单可以成为正在进行的重新刻划和生成知识的社会过程的起点,而不是作为给定机构的API端点的产品而存在。
致谢
这篇文章是根据我在2023年美国文艺复兴协会会议上的圆桌讨论 “数字时代的可引用文本: 图像,文字和音乐” 中提出的思想大纲而开发的。我非常感谢Angela Dressen组织RSA圆桌会议并编辑此特别收藏。我还感谢评论者的评论和建议,他们的评论和建议大大改善了本文的形式和内容,并感谢许多同事亲自和在线进行有关IIIF的合作和对话,包括IIIF社区 # 注释和 # 博物馆松弛频道。
利益冲突 提交人没有要声明的竞争利益
论文原文: https://doi.org/10.16995/olh.17217
如有侵权请联系我们hongxx0810@qq.com