实体识别的结果包含实体在文本中的开始位置(start)、结束位置(end)、实体的值(value)、实体的类型(entity)。除这几个常见字段外,结果中还可能包含其他辅助信息,如置信度(confidence)、提取器信息(extractor_info)。需要注意,实体的值可能和文本对应位置的值不一致,这是因为一些高级组件可能会在原始值的基础上进行一些加工,方便开发者使用,如将日期解析成标准日期格式。
下面是一个实体的示例。