在POI数据生产中,高德主要运用了以下几种计算机视觉技术:
- 自然场景文字识别:从一张图片中,找到里面的文本,给出正确的字符。这是一个具有挑战性的任务,因为文本可能出现在各种背景和光照条件下,字体、大小写、方向等也可能各不相同。高德使用深度学习技术,如卷积神经网络(CNN),进行文字识别。这些网络能够从训练数据中学习到识别文字的特征,并在测试时进行准确识别。
- 文本属性判定:这个任务主要是判断一个文本行是否为POI名称。这需要考虑文本的内容、位置等多个因素。例如,仅仅根据“会员上网,2元/小时”这样的文本,可以初步判断这可能不是POI名称。而当文本为“百世快递”并且出现在店铺的牌匾上时,更有可能是POI名称。高德使用图像和文本双通道的卷积神经网络进行属性判定,取得了较好的效果。
- 结构化输出:在识别出POI名称后,需要将其结构化输出。这包括提取名称、位置、营业时间等信息。高德使用自然语言处理(NLP)技术进行文本的结构化处理,如命名实体识别(NER)和关系抽取等。这些技术能够从文本中识别出特定的实体和关系,如地点、时间、业务等,从而为地图提供更丰富、更准确的信息。
- 名称自动生成:在某些情况下,POI名称可能无法直接从图像中获取,或者获取的名称可能不够准确。在这种情况下,高德使用计算机视觉技术和自然语言处理技术进行名称的自动生成。例如,通过分析图像中的内容和位置信息,结合高德已有的知识图谱,可以生成合理的POI名称。同时,为了确保生成的名称准确、合理,高德还引入了人工审核机制。
- 语义分割:为了确定每个牌匾的独立边界,高德引入了语义分割技术。这有助于确保主名称的唯一性。
- 降噪处理:在处理图像时,可能会遇到一些无效的POI文本。为了确保数据的准确性,高德使用了图像和文本双通道的卷积神经网络进行降噪处理,取得了比较明显的降噪效果。
- 数据标注与审核:为了确保数据的准确性,高德引入了人工标注和审核的环节。标注主要是对图像中的文本进行识别和分类,而审核则是对标注结果进行质量检查,确保数据的可靠性和准确性。
总的来说,高德在POI数据生产中运用了多种计算机视觉技术,包括自然场景文字识别、文本属性判定和结构化处理、名称自动生成等。这些技术不仅提高了数据的准确性,还大大提高了数据生产的效率。未来随着技术的不断发展,相信会有更多的计算机视觉技术被应用到POI数据生产中,进一步提高地图的准确性和丰富性。