美国开放图书馆建设研究
杨㊀弃
(中国文化遗产研究院,北京100029)
摘㊀要:开放图书馆是美国成立较早并运行至今的大型在线数字图书馆,每天有10万人次以上通过互联网在线访问开放图书馆,查询阅读各种数字化图书资料㊂文章详细介绍了美国开放图书馆的起源㊁组织架构㊁所藏资料及提供的各种特服务,希望对我国在线数字图书馆的建设提供借鉴㊂
关键词:开放图书馆;在线数字图书馆;图书数字化
引用本文格式:杨弃.美国开放图书馆建设研究[J].大学图书情报学刊,2022(1):140-144.
Research on the Construction of American Open Library
YANG Qi
(Chinese Academy of Culture Heritage,Beijing㊀100029,China)
Abstract:The Open Library is a large-scale online digital library that was established earlier in the Unite
d States and has been in operation today.More than100,000people visit the Open Library online through the Internet every day to inquire and read various digital books and materials.The article introduces in detail the origin,organizational structure,collection of materials and various characteristic services provided by the American open library,hoping to provide a reference for the construction of online digital libraries in China.
Key words:open library;online digital library;book digitization
1㊀引言
随着信息化的进一步发展,各行各业都不断运用信息化技术提高自身生产力,给使用者带来更流畅的用户体验与更高的工作效率㊂对于图书情报行业来说也是如此,各种图书机构都运用数字化与互联网技术,将图书等资料数字化,并将信息搬上互联网,供用户在网上检索查询及阅读㊂在充分发挥利用图书资料价值的同时,也创造了巨大的社会效应与公益价值,大大加快了知识的流动,促进了社会整体生产力的发展㊂本文介绍的开放图书馆()是北美最大的在线数字图书馆网站,每天有成千上万用户对其进行访问,在线免费查阅海量的文献资料,其运行方式与设计理念对于我国的数字图书馆建设具有较大的参考价值与借鉴意义㊂
2㊀开放图书馆的起源与宗旨
开放图书馆()的建立始于2006年,其网站网址是(网站主页如图1),创始人为Aaron Swartz㊂项目初始是作为美国著名的非盈利组织Internet Archive(互联网档案馆)的一个子项目,在项目发展期间又陆续由Brewster Kahle,Alexis Rossi,Anand Chitipothu,Rebecca Malamud 等人负责领导实施㊂开放图书馆的项目资金主要来源于加利福尼亚州立图书馆和Kahle/Austin基金会,并以社会捐赠赞助作为资金的补充
图1㊀开放图书馆网站主页
开放图书馆的建设宗旨是 为世界上的每一本书都创建一个网络页面,让世界上的所有人读到世界上的每一本书 ㊂开放图书馆希望经过他们的努力,让住在农村社区的有才华的数学专家可以在线探索高
041
2022年1月
第40卷第1期㊀
㊀㊀㊀㊀㊀㊀㊀大学图书情报学刊
Journal of Academic Library and Information Science㊀㊀㊀㊀㊀㊀㊀㊀
Jan,2022
Vol.40No.1
等数学的著作,让一位老者可以印刷任何一本书的大字版,让富有创新精神的年轻学者可以跳过漫长而艰巨的出版过程,直接将他的数字图书出版到这个伟大的图书馆,是一个具有远大抱负的公益项目㊂
3㊀开放图书馆的技术架构
开放图书馆拥有一个由开发人员㊁数据科学家和图书馆员组成的团队,他们共同努力,不断改进开放图书馆,在经历多次系统改良和重新设计发布之后,目前图书馆数据库端使用的技术是基于PostgreSQL的数据库框架开发的Infobase软件,而图书馆后台使用的是由Python语言编写的Wiki引擎Infogami㊂Infogami框架是一个基于web.py的干净㊁简单的Wiki 应用程序框架㊂与其他Wiki不同,Infogami框架可以
灵活处理不同类型的数据,包括结构化数据,使其成为Open Library的理想平台㊂
在Infogami软件内部,数据都被存储为一组一组被称为 事物 的对象的集合㊂例如,在开放图书馆每个页面书籍,作者和用户都是数据库中的 事物 ,而每个 事物 都有一系列任意的键值对作为属性㊂比如,作为对象的图书就具有名为 title标题 的属性键和相应的属性值,与名为 genre类别 的属性键与属性值㊂每个键值对的集合都与其保存时间与提交人存储在一起作为一个版本㊂在我们需要获得数据时,只需要查相应的对象就可以获得与其有关的所有数据㊂开放图书馆目前已经将其项目的源代码
上传到github,全世界的人都可以免费下载源代码进行研究或使用㊂
目前开放图书馆的月均访问量已达到300万人次,每月新增注册人数8万人,月均在线借阅30多万册图书,已经具有非常大的社会效应和公益价值㊂
4㊀开放图书馆的藏书与特服务
4.1㊀开放图书馆的藏书
由于开放图书馆是互联网档案馆(internet archive)的一个子项目,而互联网档案馆有着世界上最大的公共版权图书数字化项目  古登堡工程(Project Gutenberg)㊂古登堡工程目前已经完成170万册的公共版权图书的数字化工作,其中包括很多的绝版图书,然后将数字化后的电子图书提供给全世界的读者下载阅读㊂
因为与互联网档案馆良好的关系,因此开放图书馆项目目前就包含了这170万册公共版权图书的电子版供全世界读者阅读,并且为读者提供这些电子图书的多种格式文件,包括pdf,epub,mobi等格式㊂除了这170万册公共版权电子图书,开放图书馆自成立之后就不断纳入世界上一些大型图书馆的馆藏图书记录以及一些其他公开来源的图书记录,包括美国国会图书馆,amazon网站,以及用户贡献的资料等,到目前为止已经收纳了超过2000万条的图书记录,这些图书记录提供了每一种图书的详细信息,
包括书名㊁著者㊁封面㊁出版者㊁内容简介等,并且尽可能给出图书实体副本或电子副本的借阅或购买方式,例如图书的亚马逊商城购买链接,或者收藏有实体图书副本的图书馆借阅链接等,方便读者获取相应的图书㊂
近几年为了扩大图书来源,开放图书馆还推出了图书赞助计划,用户可以通过该计划直接捐赠现金来购买和扫描任何图书,作为回报,捐赠者在预定借阅图书的时候具有优先权㊂
4.2㊀开放图书馆的图书检索与借阅方式
开放图书馆给读者提供了多种图书在线检索方式,包括书名㊁著者㊁ISBN号码㊁图书主题㊁出版地㊁出版商和全文检索等,用户可以根据自己的使用习惯或偏好,用特定的条件对图书进行检索,特别是全文搜索功能,开放图书馆提供超过400万册图书资料的文本内容检索,使读者能够查参考任何文本片段的图书,大大增加了用户查有效信息的能力㊂
㊀㊀开放图书馆内根据版权和格式分类提供3类图书信息,分别是:公共版权电子图书信息,非公共版权电子图书信息和实体图书信息㊂
对于公共版权的电子图书,用户可以直接在开放图书馆网站免费在线阅读或下载阅读㊂
对于版权仍然生效的非公共版权图书,开放图书馆采用可控数字借阅(controlled digital lending)的方式
供读者借阅图书㊂可控数字借阅(controlled digital lending)是专门为具有版权的图书设计的电子副本借阅方式,因为对于版权图书,开放图书馆不能简单地对图书进行扫描,然后分发数字副本,那将会导致侵权㊂
141
总第189期大学图书情报学刊2022年第1期
可控数字借阅(controlled digital lending)的具体做法是,首先购买图书的若干本纸质副本,然后对这些图书进行数字扫描,创建图书的电子副本,之后开放图书馆会在网络上提供与购买的纸质副本相同数量的电子图书副本进行网络借阅㊂其关键是要确保实体图书和借出数字图书的比例为1ʒ1,如果需要借出大量的电子版图书,必须先购买获得最低相同数量的实体图书,否则便会在版权使用上出现问题㊂
在开放图书馆这个例子中,用户可以使用网站提供的BookReader在线插件进行在线阅读,或者在计算机安装Adobe Digital Editions软件进行阅读㊂在用户阅读数字副本的同时,相应的纸质副本借阅便会受到限制,无法进行借阅,同时对电子图书副本的借阅时间采取限制,一般不超过两个星期,一旦借阅到期或者用户归还电子图书副本后,用户阅读器上面的电子图书副本便会自动失效㊂此外,可控数字借阅系统还会使用技术措施对电子书进行加密,使用户无法永久保存下载的电子副本图书,来保证借阅的顺利执行㊂在美国等国家和地区,很多的图书馆和档案馆正在推广并开始实践可控数字借阅,
虽然目前可控数字借阅仍有争议,有一些出版业协会对其采取抵制的态度,相关的法律问题并未完全解决,但是这种确实是现行最有效率㊁最便捷的电子图书借阅办法,而支持CDL受控数字借阅方式的图书馆和图书管理员数目也变得越来越多㊂
最后对于开放图书馆存储的不提供电子版的实体图书,网站提供了站外的相关信息链接,比如亚马逊网站或美国国会图书馆的相应图书链接,帮助读者到拥有该实体图书的图书馆进行图书借阅,或者到网上商城购买该图书㊂
4.3㊀开放图书馆提供的阅读日志与分享功能
开放图书馆给每个用户提供了一个 阅读日志 功能,该功能可以显示用户当前正在阅读㊁已完成阅读或想要阅读的图书,在默认情况下阅读日志的内容是公开的㊂虽然这个功能看起来微不足道,但这种读书清单的公开展示,让每一位读者的信息有了个性,不再那么千篇一律㊂给了每位读者与他人分享阅读经历㊁阅读喜悦的途径,第三方可以通过观察读书列表了解到哪些书籍是热门的或受人喜欢的等有用的信息㊂4.4㊀开放图书馆与用户的互动
开放图书馆工程的目标是收录世界上每一本图书的资料,其目标十分庞大,如果只依靠开放图书馆自身聘用的有限人员,工作进度将会十分缓慢,因此,开放图书馆允许并鼓励用户或者志愿者创建和编辑图书内容㊂用户在开放图书馆网站注册账号后,可以点击每条图书信息上的edit按钮,对页面进行编
辑㊂用户可以编辑的信息多种多样,从书籍的简介信息到书籍本身的外观信息(大小㊁格式和页数等),此外用户还可以添加与图书相关的超级链接,引导读者完成与图书相关的扩展行为,比如购买图书或者延伸阅读等,用户甚至可以为新的图书书目创建信息页面并加入内容,图书信息编辑完成之后,管理人员会对内容进行审核,审核通过后便会最终发布到网站上㊂除了普通的用户参与,开放图书馆还会定期吸纳志愿者深度参与图书馆工作,包括进行marc图书数据的整理和json格式图书数据的导入工作等㊂有的用户志愿者特别为图书馆编写了用来捕获和清理图书文字资料中垃圾邮件的程序,对数百万本图书和作者条目进行清理,而有的志愿者甚至对开放图书馆的系统架构进行了改进,修复了数以百万计的孤立版本图书记录㊂由此可见,开放图书馆给了用户相当大自由度的同时,也从与用户的互动中给项目增添了大量有价值的内容,受益匪浅㊂
4.5㊀开放图书馆对盲人等残障人士的服务
开放图书馆在拥有广大藏书量的同时,特别考虑如何给盲人等残障人士提供在线图书服务,因为这部分人的阅读需求比较特殊,为了实现这一目标,开放图书馆与美国国会图书馆和为阅读障碍者提供服务的组织合作,为盲人等残障人士推出了以DAISY格式存储的数字图书,DAISY格式的全名是Digital Accessible Information System,中文翻译为数字无障碍信息系统,是一种将文字书籍转化为有声读物来进行
浏览和听取的数字文件格式㊂DAISY格式能帮助患有 印刷障碍 的人,包括失明㊁视力障碍和阅读障碍者,以听觉格式阅读相应的电子图书㊂
目前开放图书馆已经在网站为超过100万种的图书提供了daisy格式的电子图书副本,有需求的用户只需要安装相应的播放器软件就可以播放这些电子图书,为盲人与残障人士的阅读提供了极大便利,最
241
杨㊀弃:美国开放图书馆建设研究
大限度地为这些特殊体提供了免费而优质的在线图书服务,十分值得人们借鉴㊂
4.6㊀开放图书馆提供的网络程序接口与数据下载功能
Open library的开发者们,为了让全世界更便捷地使用开放图书馆所提供的多种服务与海量图书数据,特地为开放图书馆编写了一组RESTful API网络程序接口(表现层状态转换应用程序接口),全世界具有程序开发能力的用户或者公司只需用他们的程序通过互联网访问到这一组RESTful API程序接口,便可获得以JSON㊁YAML和RDF/XML这三种格式打包的图书数据㊂
目前开放图书馆已经提供了books api,covers api,list api,read api,recent changes api,search api, sear
ch inside api,subjects api等程序接口来给用户提供图书基本信息㊁封面图片信息㊁用户读书列表信息㊁图书搜索功能和内容全文检索等功能㊂
世界上很多机构用户与开发者已经利用开放图书馆提供的api建立了很多有用的项目:澳大利亚国家图书馆使用Open Library API辅助建立了Trove项目,它能帮助人们从多个澳洲档案馆与历史资料库查询澳洲各方面的历史信息,当查询到的信息为在线电子图书时,Trove项目便会用open library api显示指向开放图书馆的图书链接㊂美国国会图书馆建立的v网站,使用了经过修改的开放图书馆的book reader软件,用来提供珍贵书籍的在线阅读服务㊂Evergreen是一款具有高可扩展性的图书馆管理软件,用来帮助读者到各种图书资料,并且帮助图书馆管理者进行图书资料的编目㊁管理㊁内部流转等工作, evergreen使用open library api来展现图书目录㊁封面等信息㊂Koha公共图书馆编目与读者管理系统使用open library api来进行图书封面等信息的展示,同时用open library api内的read api进行电子图书的借阅㊂除此之外,很多用户和开发者还使用开放图书馆的网络程序接口建立了各种便捷的插件程序,比如火狐浏览器上面的开放图书馆搜索程序插件,让用户可以在浏览器的搜索框中对开放图书馆进行搜索㊂wordpress博客系统的OpenBook插件,让博客使用者非常方便地添加图书封面,描述具体图书链接等信息到博客上㊂
除了提供开放的rest api,开放图书馆还会每月将其存储的所有数据进行分类并提供数据压缩包下载,供用户使用这些数据㊂
5㊀开放图书馆对我国数字图书馆建设的启示5.1㊀数字图书馆有着十分巨大的社会需求与价值
根据公开的数据统计,目前开放图书馆的月均访问量已经达到300万人次,每月新增注册账户8万个,月均借阅数字图书30多万册㊂如此巨大的访问量与电子图书借阅数量证明开放图书馆提供了巨大的社会公益价值,说明数字图书馆能够为读者提供一种新的㊁有效的到图书的方式,拓宽了图书的获取渠道,促进了信息的交流㊂它尤其给一些偏远农村地区及经济发展落后地区带来了巨大的信息红利,缩减了落后地区与发达地区间的信息鸿沟㊂可以说,在线数字图书馆的建设顺应了时代潮流的发展,让读者在任何时间㊁任何地点都能获取所需的图书知识信息,具有巨大的社会价值与发展前景,以实践证明了我国确实应该进行大力推广㊂
5.2㊀应尽可能地吸收多方力量参与数字图书馆建设
数字图书馆建设需要复杂的IT技术,处理海量的数据,需要高昂的运营成本与庞大的工作量㊂这么大量的复杂工作对于任何一个独立机构都是一项艰巨的任务㊂为了解决这个难题,开放图书馆在尽可能提高自身组织效率的同时,积极与各个图书文献机构㊁企业合作,开放图书馆联合了美国亚马逊网站与美国国会图书馆等机构共同进行数字图书馆建设㊂这种机构整合的工作方法,不仅利用了现存的数字内容资源与技术基础设施,大幅度提升了整体项目的建设速度,也避免了重复劳动,节约了很多资源,非常值得我们借鉴㊂
除了联合相关文献机构,开放图书馆还吸纳了很多社会志愿者及热心读者参与到数字图书馆的建设中,工作内容包括小到对数字图书资料的编辑修改,数字化图书清单的建议,大到对后台海量json㊁marc数据的整理㊁清洁㊁数据导入及整体程序的重构等㊂在数字内容的获取上,开放图书馆也提供了用户捐赠的方式,允许读者以捐赠的方式给图书馆提供资源㊂正是在如此多的政府和社会参与者的共同努力
341
总第189期大学图书情报学刊2022年第1期
下,开放图书馆以极快的速度发展壮大,为社会创造了巨大的公益价值㊂
5.3㊀知识产权与法律方面的启示
在数字图书馆的建设上,内容的版权问题是一个绕不开的话题,随着数字化趋势越来越强烈,知识产权问题也日渐严重,这也是我国数字图书馆建设中遇到的问题之一㊂开放图书馆使用了可控数字借阅(CDL)这种借阅方式,一定程度上解决了这个问题,当然我国的国情和美国并不完全相同,一方面我们可
以在现有框架下,借鉴开放图书馆的数字借阅模式,另一方面我们也可以试着使用其他方式,比如:
在法律保障方面,积极推进相关法律法规的制定和完善,为公共数字资源建设寻求法律保障;在资源建设方面,最大程度地利用版权法中的 合理使用 条款,与出版商签订特殊使用协议等,将版权问题妥善解决,这样我国数字图书馆的发展才能快速推进,造福我国广大读者㊂
5.4㊀不要忽视对弱势体的服务
开放图书馆为了消除数字鸿沟,特别为盲人等残障人士推出了以DAISY(数字无障碍信息系统)格式存储的音频数字图书㊂有视力障碍和阅读障碍的人可以用专门的播放器软件播放这些图书㊂目前开放图书馆已经在网站上为超过100万种图书提供了daisy格式的电子图书副本,为盲人与残障人士的阅读提供了极大便利㊂目前国内无论是实体图书领域还是数字图书领域,对盲人等残障人士提供的无障碍阅读资源非常稀少,远远不能满足我国一千多万视力残障人士的阅读需求,因此,尽快推出大量类似以DAISY 格式存储的无障碍图书服务资源,是我国应该借鉴并且也应尽快实行的一项工作㊂
6㊀结语
开放图书馆()自成立之初到现在已经运行了14年,这段时间里,开放图书馆从一个小项目发展成为集聚了海量数据与用户,每月浏览量达到几百万的北美最大在线数字图书馆,同时也为全世界的互联网用户查询㊁阅读图书提供了巨大的帮助与便利,它的设计理念㊁组织架构㊁技术特点㊁运行方式㊁用户互动及业务扩展等方面对于国内的在线数字图书馆建设与发展无疑是有巨大参考与借
鉴意义的㊂希望通过对开放图书馆的详细介绍,能对国内相似机构与项目的建设和发展起到抛砖引玉的作用,促进我国图书情报事业的蓬勃发展㊂
参考文献:免费源码下载网站有哪些
[1]Internet Archive的OpenLibrary提供新的图书馆电子书
借阅模式[J].现代图书情报技术,2011(4):94. [2]杨弃.美国互联网档案馆建设[J].档案与建设,2018 (4):24-26,13.
[3]范雯然.美国互联网档案馆的网络记忆在线展览[J].
北京档案,2017(11):41-43.
[4]何汶.北美公共图书馆免费电子资源的使用[J].图书
馆杂志,2015(7):77-82.
[5]张甜.互联网环境下图书馆信息化建设研究[J].信息
记录材料,2019(8):171-172.
作者简介:杨㊀弃,男,高级工程师㊂
收稿日期:2021-04-13
(责任编辑:郑㊀玲)
441
杨㊀弃:美国开放图书馆建设研究