在LaTeX文档里去除 Mendeley输出的URL

之前写文档也曾经遇到的问题,Mendeley自动输出的bib文档里包含了所有的信息。弄到bibtex里,除了几个特别的bibtex格式,都存在比较烦人的URL。如图:

搜索了网页,没有发现可以直接解决的方案。

这次会议论文四页,在参考文献里去除这些多余的信息,每次都需要手动修改bbl文件。下面是个想到的折中方法,就是直接用vim修改bib文档。

  1. 复制Mendeley自动备份的bib文档,到工作目录。
  2. 用vim删除含有url关键词的行,于是有个新的bib文档
  3. 用bibtex编译,在生成的文档里没有了url。
  4. 同样的方法可以去除issn, arXiv, doi等等。

vim里的命令为

:g/url/d

:g/issn/d

:g/arXiv/d

意义为搜素文档,删除含有关键词(url, issn, arXiv)的行。

搞定。

发表评论

Mendeley 文献管理

Mendeley这个桌面文献系统,不算是很新的东西。但是我从开始用到现在,才一个月时间,越用越顺手。反正个人感觉对于研究人员而言,是“居家旅行、杀人灭口必备良药”。

这个桌面应用,对于LaTeX /Word /OpenOffice 都没有问题,兼容多种操作系统,包括iOS/Andriod系统,还有网络同步和社区功能。同步可以和Dropbox衔接,有多种文献导入方式和文件夹监测更新。这里从个人角度谈谈几个优点。

PDF信息提取
这是第一个让我惊讶的功能,也就是从开始用就再也不想别的软件的原因。做一个简单的拖拽功能,把PDF文档导入Mendeley的桌面应用,软件就可以在文档中抓取索引信息,例如题目,作者,期刊名称,页码等等。据我所知,类似EndNote之类收费软件并没有这个功能。对于新的文档,准确率还是不低的。另外,Mendeley还会自动在背景更新更正信息,比对搜索在Google Scholar以及在Mendeley已有的数据库的信息。

当然很多时候,对于比较老的文档,或者不是特别标准的论文格式,可能会有不少错误。在这种情况下,Mendeley会做一个“need reviewing”的标记,就需要手动更新,或者输入正确的文档题目,可以选择自动进行Google Scholar的搜索。

多种文献录入方式
上面提到的PDF录入,不仅可以在数据库中添加文档信息,还自动加入里对于源文件的链接,方便查询和阅读。个人感觉PDF录入是最有效的方式,而且可以批量录入。虽然经常需要手动补全和修改信息,但只是做一次就可以了。其它的文献录入方式有:1)到Mendeley网站,寻找文档,添加到自己的帐号里。通过同步就可以在本地的数据库中找到;2)通过修改BibTeX的文件,同步数据库。我用的是JabRef,非常方便;3)还有就是石器时代的方法,手动录入。

文献阅读和标记
在Linux下,找不到特别合适的PDF标注软件。Mendeley自带一个阅读器,整合在桌面软件内,有简单的标注功能。主要的好处还在于可以通过同步在不同的计算机之间看到标注和笔记。另外添加自定义的分类和Tags,可以方便文献索引。

文件夹监测和同步
这个功能太强大了。一般我都把文件放在特定文件夹内,然后随时更新。之前用JabRef,录入信息以后,还需要手动定位PDF文档。Mendeley检测文件夹,每次添加新的文档都会进行新文档的识别,自动添加文档信息和链接。也就是说,每次阅读新文献,都只需要复制到这个文件到文件夹内部,就可以在Mendeley数据库里找到,进行阅读、标记、分类,而不用担心还需要手动做文献信息处理的工作了。

Mendeley自带网络云存储的功能,通过不同地点的桌面应用或者直接网络访问,就可以获取自己数据库中的文献。另外还具有和Dropbox协同工作的能力。Dropbox整合同步的一个好处就是:文档地址往往是绝对路径,换到另外一台计算机,可能就无法直接带开文档了。用Dropbox以后,就可以不再关注文档路径的问题了。

LaTeX/OpenOffice 兼容性
用LaTeX的话,实在是太方便了。复制索引的Key(软件自动生成,作者+年份),放到文档里就可以。原始数据库可以通过Tool-Options-BibTeX设置,完成以后就有自动同步更新的效果。另外那个同步出来的是个bib文档,可以直接用JabRef管理。对于OpenOffice也是有支持的插件的。其实,就算是使用Office也是可以通过Mendeley管理的,因为复制文献信息,就可以生成相应的索引条目。远比手动管理有效率多了,只不过我没有用过而已。

社区功能
Mendeley的网站上,可以做以下的几件事情:1)生成自己的Profile,添加论文列表。当然Mendeley会由于版权问题确认你是这篇文章的作者。2)可以看到你在看的文献,读者群的基本信息。例如地理位置,专业背景等。3)还可以在研究小组里共享和讨论文献。

缺点
1)PDF文献识别的问题。
2)免费空间1G(包括500M个人存储),似乎有些小,而升级到7G的费用又有些高(5US$每月)。当然如果是研究经费出钱,就没有什么问题了。

===============

Comments (3)