文本标注
申请职位
2000-4000
学历本科 · 经验1年以下 · 招20人
职位详情
一、文本数据标注的类型文本数据标注主要包括序列标注、关系标注、属性标注和类别标注等类型。(1)序列标注:序列标注的涵盖范围非常广泛,包括分词、实体、关键字、韵律、意图理解等。它是自然语言处理任务中*基础的任务。(2)关系标注:对复句的句法关联和语义关联作出重要标注的一种任务,是复句自动分析的形式标记。关系标注包括:指向关系、修饰关系、平行语料等等。(3)属性标注:对事物属性进行标签,属性标注包括:文本类别、新闻、娱乐等;(4)类别标注:对文章的类别进行标注,例如篇章级的阅读理解等。二、文本数据标注的基本流程文本数据标注的基本工作流程可分为:预处理、标注、线上标注、线下标注、质检、验收、数据处理和数据交付。具体操作细节如下:(1)预处理:根据数据的规范要求,对数据进行算法的初步处理;(2)标注:根据项目要求,将源数据上传到“数据标注平台”,对其打上具体的语义、构成、语境、目的、情感等数据标签。(3)质检:根据数据合格率要求,由熟知合格数据规范的质检人员,对已经标注数据进行抽查;(4)验收:由验收方对质检合格数据进行按比例的抽检;(5)数据处理:利用技术处理成客户需要的格式(如:JSON、UTF-8文本或Excel等);(6)数据交付:数据加密后交付客户。
联系我时,请说是在58同城上看到的,谢谢!
马上申请

公司信息

一起数据(沈阳)有限公司

1至49人
企业认证企业认证个人认证
沈阳沈北新区广发银行(沈北支行)4楼
免费申请职位
  • 热门搜索
  • 热门职位
  • 热门城市
  • 周边城市
  • 推荐详情
  • 专题推荐
58安全提醒
58严禁企业和求职者参与违法违规活动,包括但不限于传销刷单/刷钻、套路贷款等行为,一旦发现请立即进行举报,平台会进行严肃处理。 投诉举报