全文字数:3800字 阅读时间:8分钟
平日里我们听到的“开源”一词,大多来自父母和其他长辈的教导,“要学会开源节流,勤俭持家”。今天要跟大家介绍的是本来今年要举办的国际档案大会的一个小主题。那接下来,快随我们一起来看看此“开源”与档案间的关联吧。
一、 相关概念介绍
1. 源代码(Source Coding)
未编译的按照一定的程序设计语言规范书写的文本文件,是一系列人类可读的计算机语言指令。
2. 开源(OS)
全称为开放源代码(Open Source)。开源就是要用户利用源代码在其基础上修改和学习的,但开源系统同样也有版权,同样也受到法律保护。
3. 开源软件(OSS)
开源软件(Open Source Software)简单地说就是源代码对公众开放的软件。
4. 开源社区
又称开放源代码社区(Open Source Software Community or Open Source Community),一般由拥有共同兴趣爱好的人所组成,根据相应的开源软件许可证协议公布软件源代码的网络平台,同时也为网络成员提供一个自由学习交流的空间。
二、开源技术助力数字档案高效保存
1.保护文化遗产
澳大利亚:Mukurtu——保存土著数字档案安全的在线系统
Mukurtu: an online dilly bag for keeping Indigenous digital archives safe
时间:2019年4月16日
来源:The conversation
http://theconversation.com/mukurtu-an-online-dilly-bag-for-keeping-indigenous-digital-archives-safe-112949
几年前,新南威尔士州图书馆与位于莫里的Dhiiyaan Centre合作收集了1965年“自由之旅”(Freedom Rides)的档案照片。“自由之旅”是由原住民领导的一场抗议活动,旨在反对新南威尔士州当时实行的种族隔离政策。
为了管理和共享数字文化遗产,克里斯汀•索普(Kirsten Thorpe)和美国数字管理和奖学金中心的教授等参与者合作,开发了Mukurtu在线系统,Mukurtu的意思是“网袋(dilly bag)”或神圣材料的安全保管场所。这是一个免费的开源平台,旨在帮助土著社区保存故事、视频、照片、歌曲、单词列表和其他数字档案,并已被美洲土著社区用于存储和保存数字档案,成为土著居民保护和管理数字档案的最佳技术。上述参与者将积极采取行动,以确保该项目获得所需的机构支持,并帮助保护原住民社群未来几代的文化遗产。
自由之旅”活动现场照片
爱尔兰电影学院获得第二届国际档案奖
Irish Film Institute wins second International Archive Award
时间:2019年10月9日
来源:irishcentral
https://www.irishcentral.com/news/irish-film-institute-award
爱尔兰电影学院(IFI)是爱尔兰的国家电影文化机构。它通过爱尔兰电影档案馆保存和宣传爱尔兰的动态影像遗产。
学院在应对影像档案数字保存的挑战时,一直积极倡导采用开源的方法。他们开发了一套由55个开源脚本(IFIScripts)组成的组件,以可持续、高效的方式支持其数字保存活动。爱尔兰电影学院的数字和数据系统管理人员基兰奥利里(Kieran O'Leary)及其档案团队还创建了一套开源Python工具,用于其影像档案的数字保存工作。
2019年10月5日,爱尔兰电影学院因其开创性的数字保存工作,获得了视听档案协会联合会(CCAAA)颁发的首届JTS奖。这不仅是对爱尔兰电影学院在动态影像档案中所做的开创性工作的认可,也是对开源脚本IFIScripts的开源精神的褒奖。
IFI的最新奖项
小察评新闻
无论是Mukurtu开源平台在美洲土著社区的使用,还是IFIScripts开源脚本、开源Python工具在动态影像档案机构的广泛应用,都体现了开源技术正用可持续的、高效的方式支持着数字档案的保存活动。同时这种技术应用的创新也为我们保护文化遗产提供重要的支撑和保障。
2.留存社会记忆
黎巴嫩:建立革命的记忆:程序员存档黎巴嫩的抗议活动
Building the revolution’s memory: Coders archive Lebanon’s protests
时间:2020年1月2日
来源:Al-Monitor
https://www.al-monitor.com/pulse/originals/2019/12/lebanon-protests-archives-online-projects.html
近年来,许多记录政治运动的在线档案项目在中东地区如雨后春笋般涌现。比如,在黎巴嫩发生的大规模反政府示威活动中,一些精通技术的公民为了确保抗议活动的相关信息不因时间的流逝而丢失或扭曲,通过开源的在线项目来保存和归档与示威活动相关的材料。
项目代表拉姆西表示合作开展档案工作来保存抗议活动记录是一种利用新兴技术来帮助他人的方式。希哈比认为档案可以让人们学习和借鉴过去:如何才能确保黎巴嫩发生的一切被完整、真实地记录以便人们能够更好地在未来理解它。另一个代表法拉也提到目前虽然没有足够技术来解决革命中极其复杂的政治、社会和社区问题,但可以记录目前黎巴嫩正在发生的事情的基本真相,以便未来能够记住它。
美国:新的数字档案馆记录占领行动的历史及其持续性影响
A decade after the Occupy movement, a new digital archive chronicles its history—and continuing influence
时间:2020年8月5日
来源:phys.org
https://phys.org/news/2020-08-decade-occupy-movement-digital-archive.html
2020年8月,在占领行动10周年之际,凯斯西储大学启动一个开源项目,即建立了免费的开源数字档案馆——“占领档案馆”。该项目旨在促使公民和学者重新审视“占领行动”的多面性,进一步认识占领行动起源于当代对改革与正义的呼吁。
馆藏包括1200多页的档案及400多种数字化资料,其中包括“占领行动”发生数年后收集到的对组织者或参与者的采访资料以及文学艺术等作品。这些档案有助于展现占领运动的巨大规模、草根气息及持久影响。
背景信息:
占领行动:从2011年9月17日开始的纽约“占领华尔街”民众抗议活动,一直持续至今。 “占领行动”是首批结合了网络舆论与街头抗议的大规模示威活动之一,目前抗议浪潮已从美国五十多个城市迅速蔓延至英国、德国、日本等国家和地区。
小察评新闻
在社会性活动面前,有公民自发运用开源技术来保存档案、记录历史真相,也有机构组织积极创建开源数字档案馆以便多方收集档案材料。开源技术以开放、便利的方式支持着个人或机构收集档案材料留存社会记忆,这不仅有助于为未来活动家、研究人员和学者提供宝贵资源,还有助于公众更好地理解和评价那些有深刻影响的社会事件。
三、档案工作保障开源代码长久可读
美国:FOSSID建立世界上最大的源代码档案馆的第一个独立镜像
FOSSID Establishes First Independent Mirror of World's Largest Source Code Archive
时间:2018年12月6日
来源:美通社
https://www.prnewswire.com/news-releases/fossid-establishes-first-independent-mirror-of-worlds-largest-source-code-archive-300761167.html
FOSSID和Software Heritage 在2018年12月6日宣布合作建立世界上最大的源代码档案馆的第一个独立镜像。
Software Heritage是由法国计算机科学与自动化研究所(Inria)发起的一项非营利性项目,旨在通过收集、保存和访问所有可用软件的源代码来满足保护文化遗产和开展学术研究的需求。
FOSSID则是一种软件解决方案,可以无缝集成到软件开发过程中,并检测代码库中免费开源软件(FOSS)的所有足迹,从整个组件到完整文件再到代码片段。FOSSID揭示了许可证义务和合规性问题,专注于为客户提供最有价值的东西。
Software Heritage在通用的软件存储归档中收集、保存和共享软件代码(包括免费和非免费)。FOSSID则帮助将档案保存到法国计算机科学和自动化研究的独立镜像中。迄今为止,该档案馆拥有来自8640万个项目的53亿个源文件,包括Debian、HitHub、GitLab、Gitorious、GoogleCode、GNY、HAL、Inria等。
美国:GitHub在北极存储库中储存巨大的开源档案馆
GitHub just buried a giant open-source archive in an Arctic vault for 1,000 years
时间:2020年7月17日
来源:zdnet
https://www.zdnet.com/article/github-just-buried-a-giant-open-source-archive-in-an-arctic-vault-for-1000-years/
GiHub于2019年11月和2020年2月20日宣布了归档计划,随后将21TB的快照写入186卷胶卷,并于7月8日将这批档案放存在挪威的斯瓦尔巴群岛(Svalbard)山上的旧煤矿中,后又进入数百年冻土深处的暗室。该代码将履行把全球开源代码保存千余年的使命。
该存储库包括公共代码存储库和大量的休眠存储库。快照由每个存储库默认分支的HEAD组成,减去大小大于100kB的任何二进制文件,然后将每个存储库打包为单个TAR文件。并且出于效率考虑,大多数数据将存储为QR码。易于阅读的索引和指南将逐项列出每个存储库的位置,并说明如何恢复数据。
背景信息:
Github是一家面向开源及私有软件项目的托管平台,于2008年4月10日正式上线,因为只支持git作为唯一的版本库格式进行托管,因此得名。目前,其注册用户已超过350万,托管版本数量也是非常之多,其中不乏知名开源项目 Ruby on Rails、jQuery、python等。
小察评新闻
在上述新闻中我们可以了解到开源技术在档案领域的应用,这些开放源代码的重要性也显而易见。目前有多种开放源代码档案的保存方式,例如FOSSID通过和Software Heritage 合作建立源代码档案馆的独立镜像,进行归档备份,以确保软件源代码能长期保存并访问;或是像GitHub一样,通过将胶片存放至北极,也是使档案能长期保存的有效尝试。
对源代码的归档整理与保护,有利于帮助个人和组织机构高效地利用开源软件,清楚地认识到该软件的来源、许可和使用限制,也有助于未来开放源代码的可持续访问与使用,从而满足各个领域的学术研究和行业工作的需求。
小闻小察来总结
小闻小察之前跟大家聊过“开启档案‘云’应用”、“AI赋能档案工作”等前沿话题,也一起探索过档案工作中的一些新技术。其实,这些文中提到的大数据、人工智能、云计算等新兴信息技术领域发展的背后驱动力便是开源。开源可以说既是一种协作模式,也是一种特色的产品。
档案与开源两者是相辅相成的。一方面,开源技术助力数字档案高效保存:个人或社会组织或档案部门可以凭借开源技术的低成本、高效率的优势,积极开展归档工作,高效保存数字档案,从而更好地保护文化遗产,留存社会记忆;另一方面,档案工作保障开源代码长久可读:包括开源代码在内的所有源代码托管平台,都可以与档案机构积极展开合作,通过利用特殊材质将开源代码保存在特定地点进行归档备份的方式,全面系统地收集与长期保存代码,从而保证多年以后代码的完整性与可读取性。
正如开源代表着的开放协作精神,我们也希望未来档案部门,能更加善于吸纳各方力量,并积极开展多方合作,共同推动档案事业发展。
最后,如果你对本期“档案与开源”有什么想法,可以在下方留言哦~
参考文献
[1]中国信息通信研究院.开源生态白皮书(2020年)[R/OL].[2020-11-1].http://www.caict.ac.cn/kxyj/qwfb/bps/202010/t20201016_360023.htm.
本文图片均来自网络,如有侵权,请联系删除
文字 | 贾沣琦 何雅妮
排版 | 何雅妮 贾沣琦
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。