近期,收到一封来自开发者l0o0的GitHub邮件。从邮件中我得知:一个重磅Zotero插件Jasminum
诞生了!
为开发者疯狂打call👍
万众期待的Zotero中文文献识别功能终于来了!
来,直接上结果!
看完结果,下面来细说。👇
重磅插件Jasminum诞生了
大家应该知道,在之前,如果拖入了一个PDF文件到Zotero中,只有英文文献能够自动识别(Retrieve Metadata),即能够抓取英文文献的元数据,但是中文文献是不支持的。
这是因为Zotero抓取元数据的功能是通过提取英文PDF内的部分文字内容,并和数据库进行对比来实现的。
这导致Zotero对中文PDF的元数据抓取一直没有得到支持。
所以,对于中文文献,大家一般在浏览器端用Zotero Connector来抓取文献的题录以及PDF。
尽管已经能够满足需求,但是知网等中文数据库的Zotero Connector翻译器偶尔会出现bug(不少粉丝和学员都反映),一定程度上影响了使用体验。
今天这一切将迎来改变!
插件Jasminum
(中文名:茉莉花
)为Zotero带来了中文文献的元数据抓取能力。
下面一起来看看。
在插件Jasminum
的GitHub网页,可以看到该插件的功能介绍,也可下载Jasminum
插件的xpi
文件。
(网速不好的,可以在公众号后台回复Jasminum
获取插件)
下载插件后,在Zotero进行安装。
Jasminum插件目前主要有三个功能:
- 根据知网上下载的文献文件来抓取引用信息(就是根据文件名)
- 拆分或合并 Zotero 中条目作者姓和名
- 为知网的学位论文PDF添加书签
中文文献元数据识别
第一个功能是大家最为关心的,我已经在本文开头用动图进行了效果演示,这里再看一遍。
值得注意的是,目前该插件只支持知网文献的识别,其他中文数据库(比如万方)尚未支持,但是相信知网足以能够满足大部分人需要了。
原理方面,它是通过文献的文件名进行识别和数据库匹配的(不同于Zotero自带的英文文献抓取原理),而且支持PDF和CAJ两种格式。
具体来说,你的文件名需要是以下4种格式之一。
- title_author.pdf/caj
- title.pdf/caj
- titlePart1_titlePart2_author.pdf/caj
- titlePart1_titlePart2.pdf/caj
且author的汉字姓名为4字以内。👇
之所以是以上4种格式,是因为一般从知网下载的文献名称都是以上4种格式之一。
比如这个样子。
下载了中文文献后,将它们拖入Zotero,然后选中文献(单篇或者批量),点击右键菜单中的Retrieving CNKI Metadata,即可完成元数据的抓取。(元数据主要用来参考文献排版)
中英文Zotero下的Jasminum
菜单如下。👇
这里还要提醒一下,由于Jasminum
插件是通过文件名来识别的,因此如果文件名不符合上述四种格式是无法识别的。
不过这也代表着:如果你从其他中文数据库(万方)下载了一篇中文文献,且碰巧该文献在知网中也有,那么只要该文献的名称符合上述四种格式,也是可以成功抓取元数据的(亲测)。
以上就是对Jasminum
插件的知网中文文献元数据识别功能的介绍,下面介绍一下该插件的第二个功能:作者姓名的拆分或合并。
作者姓名的拆分或合并
一张动图演示下作者姓名的拆分或合并。👇
关于作者姓名的拆分或合并,是为了方便在PDF命名中完整显示作者的姓名。
之前在下面这篇推文中,介绍过使用ZotFile通配符的方法实现该功能。
我个人更推荐上文中的方法,因为它是全局生效的。Jasminum
插件则需要在手动选择文献后,才能完成作者姓名的拆分或合并。
为知网的学位论文PDF添加书签
为知网的学位论文PDF添加书签,需要首先下载PDFtk server。👇
这里就不多介绍了,感兴趣的可以自己捣鼓捣鼓。
下载
Jasminum插件下载:青柠学术
公众号后台回复关键词Jasminum
。
致谢
最后,再次感谢开发者l0o0的优秀作品Jasminum
!
Zotero变得更好用了,Zotero的中文生态更加完善了!