Help:Semantic MediaWiki入门
| SMW 用户手册 |
|---|
| 入门 |
| 浏览界面 |
| Special:Ask |
| Special:Browse |
| 语义搜索 |
| 页面选择 |
| 严格的比较操作符 |
| 显示信息 |
| 结果格式 |
| 嵌入式查询 |
| 概念 |
| 推理 |
| 编辑 |
| 属性及类型 |
| 特殊属性 |
| 自定义计量单位 |
| 语义网 |
| RDF导出 |
| SMW 管理员手册 |
Semantic MediaWiki(SMW,语义MediaWiki)乃是MediaWiki的一个扩展。MediaWiki则是支撑驱动Wikipedia 的最为著名的维基应用程序。SMW有助于维基内容的搜索、组织、标记、浏览、评价以及分享。传统维基之中仅仅包含的是计算机既无法理解也无法评价的文本,而SMW则向其中新增了语义标注(semantic annotations),从而使维基可以作为一种协作式数据库来发挥作用。Semantic MediaWiki最初发布于2005年,目前拥有十多位开发人员,并且正在用于数百个站点。此外,目前人们还创建了大量的相关扩展,从而扩展了对SMW所存储数据的编辑、显示和浏览能力: "Semantic MediaWiki"这条术语有时用来指所有这些扩展所构成的整个家族。
Semantic MediaWiki得到了欧盟框架计划(Framework Programmes,FP)项目、SEKT和ACTIVE以及Halo项目的部分资助。
Contents |
为何需要Semantic Mediawiki?
维基已经成为用于在社区当中收集和分享知识的强大手段。这些知识大多数包含在文本和多媒体文件里面,因而便于人类读者理解和使用。尽管维基非常善于存储和检索具体的事实,但在信息的查询或整合方面却用处较小。举个简单的例子,比如下面这个问题:
- «市长为女性的世界100大城市有哪些?»
Wikipedia应当能够回答这个问题:其中包括有所有的大城市及其市长,以及可让我们了解市长性别的关于市长的文章。 然而,对人来说,几乎不可能回答出这个问题,因而首先必须阅读全部关于所有大城市的文章。即便是找出了答案,答案保持有效的时间也不会太久。计算机可以相当轻松地处理大型数据集,而当要从维基上寻求答案时,计算机能够给我们提供的支持就不是非常多了:即使是高级复杂的计算机程序也无法阅读和«理解»人类的自然语言文本,除非这些文本的主题和语言有着非常严格的限制。维基的关键词搜索也帮不上忙。
Semantic MediaWiki则可以使维基之中的知识变得适合于计算机处理,比如回答上述问题。
SMW在何处有用
Semantic MediaWiki在维基文本之中额外引入了某些标记,从而让用户能够为维基添加"语义标注"。乍看上去这把事情变得更为复杂了,但其却大大地简化了维基的结构,有助于用户更快地找到更多的信息,并且改善了维基的总体质量和一致性。如下是应用SMW的一些好处:
自动化生成的列表
维基之中往往会包括有许许多多的聚合列表(aggregated lists);Wikipedia本身就拥有数千张这样的列表,如"按人口排列的西班牙都市圈列表"。此类列表容易出错,因为必须加以手工维护。此外,潜在地令人感兴趣的列表也数目庞大,不可能都以令人接受的质量来提供所有这些列表。在SMW之中,列表是采取像这样的方式而自动生成的。这种列表始终保持最新,而且可以轻松地加以定制,从而获取进一步的信息。
信息的可视化呈现
语义结果格式(Semantic Result Formats)和语义地图(Semantic Maps)之类的额外扩展所定义的各种各样的显示格式,允许在比如日历、时间线、图形和地图等等当中呈现信息,与简单的列表相比,提供了更为丰富的数据视图。
经过改进的数据结构
MediaWiki维基站点往往倾向于大量采用类别来实现数据的结构化。一般来说,这些类别的确有用,如Wikipedia类别"1620年代的逝者";然而,假如采用SMW来存储这些页面的信息的话,就可以采用简单的查询来取代这些类别,减少了采用复杂分类体系的必要性。而且,如果把维基之中的语义标记保存在模板,又称为语义模板(semantic templates)之中的话,维基站点即可轻松地获得一种稳固的数据结构。语义表单(Semantic Forms)扩展可让管理员能够创建表单,用于在语义模板之中添加和编辑数据,从而,与传统的维基文本相比,使得语义信息的添加可能甚至显得更加容易,更加简便直观。
信息搜索
在Halo和Semantic Drilldown(语义钻取)之类扩展的支持下,具体的用户可以通过创建自己的查询,来搜索特定的信息。
跨语言的一致性
在诸如Wikipedia之类横跨多种语言的维基里面,数据常常存在着大量的冗余,从而可能造成形形色色的矛盾或者说不一致。例如,就在编写当前页面的英文版之时,关于爱丁堡的人口数,英文版、德语版和法语版的Wikipedia就互不相同。如果从语义层面上存储数据,您就可以,比如,在对汉语大字不识一个的情况下,查询中文Wikipedia之上所给出的北京市人口数量。籍此可在不同语言之中相互查询数据,从而达到重复利用的目的或者发现矛盾之处。
外部的重复利用
一旦在SMW维基中创建之后,数据并不是就非得放在其维基站点当中;可轻松地将其导出成CSV、JSON和RDF之类的格式。这使得SMW维基站点可作为其他应用程序的数据源,或者在企业应用的情况下,可以取代关系型数据库通常所扮演的角色。借助于外部数据扩展和结果格式呈现,基于SMW的维基站点甚至还可以利用另一个SMW维基站点的数据,消除维基站点之间冗余的必要。利用任何现场可用的triplestore三元组存储连接器(triplestore connector)扩展,您还可以通过RDF triplestore查询SMW的数据。
数据的集成与混合
一个SMW安装包之中所包含的数据并非必须作为孤立的信息存储地。数据导入、数据传输和外部数据之类的扩展,可使您能够集成外部数据(来自比如遗留系统、Web服务或者在链数据源<linked data sources>),并将其与该维基站点之中现有的语义数据相互联系起来。因此,在信息技术世界当中,SMW所支撑驱动的维基站点可以成为一种重要的中心信息枢纽。
究竟谁在使用Semantic MediaWiki?
自从发端于学术研究项目,Semantic MediaWiki已经走过了不短的旅程。当前,在全球范围内,SMW正在活跃地应用于许多种语言的数百家网站,包括《财富》五百强企业、生物医学项目、政府机构以及消费者目录。 Wikipedia上关于Semantic MediaWiki的文章之中包括有一个列出了SMW知名用户的小节。另外,还有一张使用SMW的站点列表以及本站点所提供的站点目录。应当注意的是,这两张列表着重于公共站点,尽管或许半数以上使用Semantic MediaWiki的站点属于私有,仅供公司和组织机构内部使用。
如今,有大量的咨询公司把SMW作为自己解决方案的组成部分来加以实施,其中包括Benchmarking Partners, FZI、gesinn.it、LeveragePoint、ontoprise以及WikiWorks。(在"专业支持"页面上,您可以找到一张可以受雇开展基于SMW的工作的人员和公司列表。)
当前,至少有两家网站为Semantic MediaWiki及其一些扩展提供着服务器:Wikia和Referata。
关于不同公司、组织机构和个人使用SMW的正面经验,可参阅用户褒奖页面。
更多详情
这个站点上还备有多得多的关于设置和运行Semantic MediaWiki安装包的信息。
- 管理员手册提供的是关于SMW的下载、安装和故障处理方面的信息,以及关于可以安装起来与SMW协调工作的各种扩展的信息。
- 用户手册则提供的是关于定义属性、运行查询以及浏览数据等等方面的信息。
- 常见问题解答则提供的是关于技术事项和非技术事项方面常见问题的解答。
联系方式与用户支持
要联系SMW项目,请参见联系方式页面。若要发表评价意见和提问,请参见您可以加入的活跃用户邮件列表以及IRC频道(#semantic-mediawiki)。有关SMW支持的更多详情,请参见获得帮助。
在BugZilla可提交关于SMW的错误和功能请求;有关情况请参见错误报告文档。