UAM Corpus Tool 2.0 Manual 中文手册参考指南

第一节:关于 UAM CorpusTool 1

简介

UAM CorpusTool 是文本和图像语言标注的工具集,其核心内容包括: 用户制定一个“项目”,即一组文档,和应用于每一文档的分析规则; 每一类“分析规则”可视为标注的“层系”。

CorpusTool 现在有两种类型的标注。

1. 整体文档标注整体文档标注:文档(文本或图像)的整体特征标注。例如,这些特征可以表明该文档的语域(语场、语旨、语式)或文本类型。

2. 切分段标注切分段标注:用户选择文件中的节,并分别赋予特征。节可通过鼠标在文本/图像中拖动指定,同时提示用户指定该节的特征值。 后续版本将添加其他标注类型,可以是修辞结构理论(RST),体裁结构(GSP),参与者链条(participant chaining),句子结构(比如主语、谓语、情态、附加语adjunct 等),口语数据标注等等。

UAM CorpusTool 取代作者之前的 Systemic Coder 软件仅能在单一层系上对单个文档标注。UAM CorpusTool 是为了克服 Coder 用户诸多限制的一个尝试。我希望感谢广大 Coder 用户近年来作出的评论和本新软件的评论。参见附录一讲Systemic Coder 研究结果导入 CorpusTool。

详细内容请点击下载~

相关下载

点击下载

参与评论