简介:知擎者利用 Milvus 实现图形商标近似检索,通过特征提取和向量索引,快速准确地为用户提供近似商标图片。本文将详细介绍这一实践过程,帮助读者了解图形商标检索的最新技术。
在当今的商业环境中,图形商标的重要性日益凸显。为了保护品牌形象和避免侵权纠纷,许多企业需要快速准确地检索近似商标图片。知擎者作为一家专注于知识产权保护的技术公司,利用 Milvus 向量相似度搜索引擎成功实现了图形商标近似检索。本文将详细介绍知擎者的 Milvus 实践过程,帮助读者了解这一技术的实际应用。
一、特征提取
首先,知擎者使用卷积神经网络 VGG16 模型对大量图形商标数据进行训练,提取出每个商标的特征向量。这一过程是在多台服务器上并行完成的,通过请求 flask 获取任务以实现图片数据同步处理,快速获取特征向量。这样提取出的特征向量能够准确表示商标的形状、线条、颜色等关键信息。
二、向量索引
接下来,知擎者将提取出的特征向量归纳起来,统一插入到 Milvus 向量搜索引擎中。Milvus 支持单点上传数据,并在数据上传时同步建立向量索引。这一过程使得特征向量能够被快速检索和比较。同时,知擎者还根据类别为分区标签将特征向量数据分区存储在 Milvus 中,以提高检索效率。
三、近似检索
当用户上传一个图形商标时,知擎者的客户端程序会自动通过同一个模型提取特征向量,然后从 Milvus 中查找近似向量的 id。Milvus 提供了多种索引方式,可以根据不同的需求选择不同的索引方式进行检索。在获取到近似向量的 id 后,程序会进一步筛选官方给定的图片内容形容词、图形商标类别以及 Milvus 返回的近似得分等,将结果返回给客户端。这样,用户就可以快速获取到与上传商标相似的其他商标图片。
四、优势与特点