• 使用了一段时间的Zotero,发现比EndNote方便多了,速度也很快。

    Zotero是一个类似EndNote的文献管理工具,它可以方便的收集、组织、分析文献,并且可以引用到Word、OpenOffice中,提供了多种期刊杂志的引用格式,方便论文的撰写。Zotero是一个Firefox的扩展,文献的收集也只需要通过Firefox浏览时点击地址栏的相应图标就可以收集了。收集可以通过Google scholar、Amazon和一些文献数据库网站直接浏览导入,也可以现在标准的文献数据导入。对于撰写论文来说用得最多的可能是论文的引用了,有了这个就不需要在写参考文献时在论文中到处寻找,在参考文献出考虑排序这些繁杂的工作,只需要点击几个按钮就可以实现上述功能了。同时还提供了30多种语言,最关键的是免费,不用像EndNote那样,缴费才能用。

    Zotero的使用是很简单的。首先到http://www.zotero.org安装Firefox扩展(在该网站的右上部提供了1.0版本和2.0的beta版,直接点击就可以安装了),也可以在Firefox的工具菜单->附加组件里查找安装。安装好后会在Firefox的右下角出现一个zotero的图标,点击就可以看到管理界面了。

  • 花了一天时间,终于完成了TF-IDF算法的验证实验,结果还算不错。

    TF-IDF算法是一种简单快捷的文档特征词抽取方法,通过统计文档中的词频来对文档进行主题分类。TF-IDF(term frequency–inverse document frequency)是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正 比增加,但同时会随着它在语料库中出现的频率成反比下降。TF-IDF加权的各种形式常被搜索引擎应用,作为文件与用户查询之间相关程度的度量或评级。

    TF-IDF其主要思想是,如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能 力,适合用来分类。TF词频(Term Frequency)指的是某一个给定的词语在该文件中出现的次数。IDF反文档频率(Inverse Document Frequency)是指,如果包含词条的文档越少,IDF越大,则说明词条具有很好的类别区分能力。使用TF-IDF可以计算某个关键字在某篇文章里面 的重要性,可以用此关键词来表达文档所包含的含义。

  • 前几日,及其莫名其妙中了木马,用360弄了一晚上才搞定。今日用McAfee给U盘杀毒,想看看病毒库是什么时候的,结果发现已经半个月没有升级了,运行更新程序提示“初始化Common Updater子系统失败。确保……”,如下图所示。

    打开服务,准备启动“McAfee Framework Service”,系统告知不能启动。修复安装后问题依旧,重新安装也一样。最后在网上搜到了如下的方法,还算凑效。方法如下:

  • 北川之行 - [生活杂记]

    2009-08-24 | Tag:北川 地震 县城

    注意:如果你在中国大陆且看不见上面的图片,请按照这里的说明修改Hosts文件。

    2009年8月初,时隔5.12一年多以后,第一次进入北川,进入那座曾经让全世界人们关注的北川县城。

  • 注意:如果你在中国大陆且看不见上面的图片,请按照这里的说明修改Hosts文件。

    我们的最后一站是耿马和沧源—佤乡。从澜沧到耿马走214国道,说是国道,其实就是弹石路,时速也就30~40公里。在澜沧境内全是在丛山峻岭中穿梭的弹石路,下雨天比较危险,进入耿马境内后路况很好,全是柏油路。全长210多公里,走了整整8小时。