jump to navigation

从Semantic Web想到了Wikis December 28, 2005

Posted by Jackie in Theses.
1 comment so far

对wikipedia的了解不多,记得以前上信息组织课的时候用到过,好像我当时是用来查询”历史上的今天”。对它的应用仅仅局限于搜索我需要的一些信息,对它的认识也只是在线的百科全书。昨天看了只说的文儿《wikipedia与semantic web》。 只说将wikipedia和语义网联系起来了,列举了很多wikipedia与semantic web相关的研究和应用。当然文章的重点提到了wikipedia如何实现semantic web,这顿时让我兴趣倍增。不过因为刚开始学习相关知识,看了两遍还没有看明白到底wikipedia怎么就和semantic web有这么大联系了。但是这倒促使我去了解wikipedia。以下是我的学习笔记。 (more…)

[Links]tag造反? December 25, 2005

Posted by Jackie in Notes.
add a comment

FRBR Word Search December 25, 2005

Posted by Jackie in Notes.
add a comment

到现在还不太明白FRBR到底是怎么一会事情,只能说知道这个模型可以用来描述数字资源对象的生命周期,对揭示资源的语义及其有帮助。
前段时间读过一篇相关的文章,但是似乎明白了些,现在又都全忘光光了。
今天上The FRBR Blog随便逛逛,看到主人William Denton在圣诞夜留了个趣味题

“The words listed at the bottom appear in the jumble of letters in the big square, and the point of the game is to find them and draw a circle around each one.”
pdf文件里有个字母方阵,排列没有规律。在该正方形下方有22个与FRBR相关的名次。游戏者所要做的就是将方阵所包含的这些相关名词找出来。
hoho,Denton说小孩子同样也能从这个游戏中找到乐趣。

他去过圣诞节了,因此留了个打发时间的游戏给大家。
今年自己没有节目,但似乎就是过节的情绪了,表现就是人懒惰了。
Pete Johnston的一篇文章说长是长,说难不难,也就是介绍他们IEMSR的情况。看第一遍的时候,晕晕糊糊,看了后面忘了前面。本准备看第二遍的时候好好总结一下他所说的。毕竟注册系统/机制还是很重要的。可结果,第二遍到现在还么有结束,而且都放弃了。

嘿嘿……..but,I will come back.Time is the question.Hoho!!!!!!

[Music]陈奕迅《怎么样》 December 23, 2005

Posted by Jackie in Stuff.
add a comment

eason.jpg

陈奕迅是品质的保证,我想很多人都是这样认为的吧。

新专辑《怎么样》没有给我带来太多的惊喜,却仍是高水准的。虽然今年听的华语专辑只有3、4张,但是我相信很少能够强过这张。叶世荣都说了,香港乐坛已经得了癌症,即将死亡

Eason久违两年的国语专辑理应重拳出击,继《黑白灰》后再创佳绩,可惜似乎没有像《十年》和《兄妹》这样的作品打动大陆歌迷的心。看来我还要等待Eason的下一张国语专辑,开始在大陆建立霸主地位,呵呵。

整张专辑偏向软摇滚风格,Eason有新尝试。媒体上时常提到的,他自己也说感觉王菲上身的两首歌《一夜销魂》和《浮城》。瞧,连歌名都是王菲风格。尝试没有什么不好,歌迷听着新鲜。前一首歌完完全全的王式情歌,Eason当然表现很好,可我觉得如果让王菲来唱一定唱得更好,特别最后随性的哼唱部分。后面一首歌,我反而觉得Eason唱得有些像朴树。

简单说说两首我喜欢的作品:

《不能再等待》,Eason向媒体朋友表示自己对这首歌的喜爱。歌词旋律平平淡淡,Eason的表现也没有什么特别处理、中规中矩的,总之就是很大路的一首歌,可是简单的作品反而更耐听。

《Hippie》很棒的一个作品。我感觉歌词完全是Eason的心境。里面一小段吉他solo也有点意思。

相比较加入正东的第一张专辑《U87》,《怎么样》显然逊色很多。更喜欢听到Eason玩自己的声音,做更大尺度的尝试,同时专辑中又有大众化的情歌。另外听《U87》时候的心情是兴奋的、愉快的,而到《怎么样》的时候有些失落。也许是Eason成功地传递了《怎么样》要表现的两大主题,逃避和追寻吧。

总的来说,Eason进入环球后带给我们的两张专辑都让我们看到他能够做些自己想做的事情。值得令人高兴。不过不可否认,英皇商业运作的确成功。从专辑选曲、制作、概念、企划和宣传等等虽然是商业化,但是就其歌曲来说不少都是好作品。《怎么样》专辑中歌都不差,但是似乎曲目安排有些问题。比如《不能再等待》放在第一首,也许是因为Eason对这歌的喜爱,可是这类歌曲显然不适合作专辑的开始。还有放了两首广东歌,大大破坏了专辑的完整性。像《听听》这样的广告歌吧。怎么也和先前的歌曲风格不统一。建议,把广东歌作为bonus track,另做一张碟片,然后一起发行。

看到报道说,这是一个月努力得来的专辑,我没有去考证到底是不是,但从专辑上看来似乎可信。我想一年一张专辑已经不算少了,不必强求每年有多少产量。

不过还是市场说了算嘛,也许可能也是唱片合约上要求的。

媒体报道:

陈奕迅“王菲上身”演绎新曲 兴致高昂脱衣献唱

陈奕迅2005年二度重锤出击 国语新专辑>

纪念古龙 December 23, 2005

Posted by Jackie in Stuff.
7 comments

古龙2.jpg

前几天在网上晃悠的时候,无意中看到论坛有帖子贴了一张图,斑竹让大家猜是谁。我的确没有看出来是古龙。(可惜当时没有收藏,现在找不到了。)他的照片经典的也就那么一张,是胖胖的脸。而斑竹提供的照片却是消瘦的,估计是生病后照的吧。

看了这个帖子,到让我怀念起以前迷恋武侠小说的时光了。初中看得最多,高中就开始不看了。现在是碰都不碰了。

古龙是我最喜欢的作家。但是他的经典著作完整地只看过《陆小凤》,《楚留香》、《小李飞刀》都是看过部分,其他都是杂七杂八的,有的我所读的估计还是倪匡等其他人代笔的吧。

前面搜了几张大侠的照片,才发现他是1985年去世的,今年是他20年忌辰。

想象一下大侠如果还活着,估计活得是很潇洒滴。虽然其为人似乎有些忧郁有些悲观。

当今海峡两岸,活得潇洒的中老年男性估计是谢贤和李敖。在我眼里,四哥是表面光鲜,李敖有点做秀,而古龙是真性情。

再贴两张刚搜滴:

古龙1.jpg

古龙3.jpg(这张看来更像金庸)

Folksonomies or Ontologies? (Ⅱ) December 23, 2005

Posted by Jackie in Notes.
8 comments

Tag ontology design应该是今年三月份写的,之后修改添加内容多次。文章开头显示本月21日又有些变动,将原先文中用N3描述的tag ontology的例子拿出来,置于独立的网页中。

作者Richard Newman引用说明了Seth Russell的观点。他们所提及的tag ontology,我认为在概念上不能完全等同于我们平时说的知识本体,而应该是对tag的语义说明、结构化和形式化的一系列操作。其实也就是,tag在经过广泛地创造使用后,通过对它tag ontology,我们就可以复用共享tag。

文章内容分为对tag ontology设计的预备概念、tagging (这里所指的是宽泛的概念包括tagger,tag等) 和rss : item的区别及联系、举例说明。

我觉得全文比较有价值的一些观点是:

1、tag要通过URI来建模(I suggest that tags are modelled through URIs)。先前我看的Folksologies: de-idealizing ontologies里面Stefano也是这个观点。不同的是,Richard主张用命名域来实现,而后者是用邮件地址。不管怎么样,tag应该用统一资源标识符来显示,有利于复用和维护,也确保了唯一性。

2、tagging应该体现并具体化tag创建者、tag、资源和创建日期之间的多重关系。(Taggings reify the n-ary relationship between a tagger, a tag, a resource, and a date. Relationships exist for each of these roles.)下面在’Relationships between tags’一节中解释了如何表现这些元素之间的关系。’Example’中有更多作者所举出的运用,比如:taggedBy,taggedOn,associatedTag等。

3、tag ontology中有个tagger,可以理解为对应于dc的creator元素。在建模时,运用foaf : agent标记。(Taggers are foaf:Agents.)

4、处理tagging和RSS item。到底是将它们合在一起描述资源对象,还是分开来。Richard偏向于区分开来。原因有两个,其一,可以然tagger无缝地tag资源;其二,通过rss : item和rdfs我们可以推断出tag元素,究竟仅仅是’ Tagging’、’ associatedPlainTextTag’、’ taggedOn’和’ taggedResource’等。列出的这些标记都有各自作者所赋予的含义。其实也就是说,我们可以运用原有的描述进行推断,而没有必要再加入tag,如果这样做的话反而成了自己来tag自己了。

如何建立tag ontology,前一篇文章似乎思路和文章框架更为清晰。

Tag受到人们的喜爱。这是因为Tag如此平民亲切,就像搬家时,在打包的行李上贴上标签。它的广泛运用也给人们带来了技术上的思考。如何复用共享tag,这也就是tag ontology提出的缘由。不少信息技术人员对tag乐此不疲,我们看到他们正在一砖一瓦地搭建民间分类体系。我想,tag的火也可以归咎于元数据、现行分类法主题法的学术化专业化。虽然元数据如DC有开放性,但是似乎都是内容专家或者元数据专家的特权。从构建tag ontology的过程中,可以看到dc等元数据,rdf等置标语言的身影,Richard对于tag本身语义的思考其实也就是元数据规范制定的一套流程。2004年DC会议上Wayne HodginsEric Duval都谈了自己对元数据发展的看法。不少观点都相同,其中有很重要的一点就是,相信用户并让他们来创建元数据。元数据如果真的能够向这个方向发展增加开放性和交互性的话,没有理由不相信元数据会all the way down。但是目前看来,知道tag的人应该比知道元数据多吧,而且我相信听到过元数据并且知道它究竟是怎么一回事的人更少。

[资料整理]Wordnet December 13, 2005

Posted by Jackie in Notes.
8 comments

之前在看本体的时候,看到有提了Wordnet,它是分类于术语本体Terminology Ontology。

积累了点材料与大家分享一下吧。:-)

1词义 – WordNet 介绍(ICL-PKU)(很全面的介绍Wordnet的材料)

2WordNet – Princeton University Cognitive Science Laboratory(普林斯顿大学认知科学实验室)

3WordNet–普林斯顿大学认知科学实验室(上面英文网站的中译版)

4中央研究院語言學研究所 文獻語料庫研究室(台湾的相关研究)

5《知网》中文版(大陆的Wordnet)

又看到一篇文章,提及大陆知网

“‘知网’作法的特色是独树一帜;不采用英文Wordnet的架构,只要采取他自己的架构。而且他先把世界知识本体做个定义,在这定义里再去做区分。这个由上而下的方法,与英语与欧语Wordnet由下而上的方法不同,当然有其可取之处。可惜的是,由于当年资源与讯息的限制,董振东教授与他的儿子董强,基本上是凭着信念与热诚完成‘知网’的,过程中绝少外界的奥援,也并为与世界相关研究接轨。他跟他儿子花了约有七、八年的功夫来做这个事。但是基本上跟其他语言的Wordnet连接,并无架构上的基础,而其上层知识分类,也是两人的自由心证,不能说错,却也缺乏理论的基础,面临一些与其他系统互通性(inter-operability)的问题。”

(摘自《语义网、词网与知识本体:浅谈未来网路上的知识运筹》)

p.s.这篇不知道怎么从网上搜来的

6WordNet:結合辭典和本體論的文字百科全書 | 科學人雜誌網站(一则新闻)

我觉得他比喻得很好啊…..

Folksonomies or Ontologies? December 13, 2005

Posted by Jackie in Notes.
9 comments

K师在网摘中提到了Tagontology,这篇文章无法一窥原文(无法登陆blogspot,也没有用Bloglines订阅,也没有去设置代理服务器)。不过倒是看到几篇讨论这些个buzz的文章。分别是:

1)Stefano’s Linotype Folksologies: de-idealizing ontologies

2)Tag ontology design

3)Ontology is Overrated: Categories, Links, and Tags(这篇文章,K师很早就写了相关的评论文章。)

前面两篇已经看过了,最后一篇实在是长!!没信心读完呐。我预计是一篇一篇来解读,希望自己能够做到,呵呵。 (more…)