searchusermenu
  • 发布文章
  • 消息中心
计算机视觉
6 文章512 阅读1 订阅
全部 视频监控 1AI 6
计算机视觉
6 文章512 阅读1 订阅
全部
  • 利用语义推理网络来进行场景文字识别
    钱****翔
    2024-12-12
    0
    23
    0
  • Reformer主要是为了解决Transformer结构显存占用大、模型复杂度度高的缺点(无法处理长序列、无法在单GPU上进行训练),而进行的模型结构改进。
    钱****翔
    2024-08-13
    0
    13
    0
  • 传统的目标检测任务中,对于ground_truth(gt)和anchor的配对,都采取固定的策略(例如依赖IOU阈值--RetinaNet,对于Anchor-free类算法则往往依据anchors是否包含gt的中心点或者核心区域--FCOS)。这篇论文就提出了将anchor当作label需求方,而gt当作label提供方,而label从gt传输(匹配)至anchor的传输成本就是分类和回归的loss加权和(对于负样本只计算分类loss),这样就将gt和anchor的匹配问题变成了一个最优化传输成本的问题(Optimal Transport (OT) problem),可以使用Sinkhorn-Knopp迭代来进行问题求解。
    钱****翔
    2024-05-07
    0
    53
    2
  • 通过将耦合检测头更改为非耦合检测头,并利用了Anchor-free思想,YOLOX开创了YOLO系列目标检测算法另一个派系
    钱****翔
    2023-06-01
    0
    189
    1
  • MOT(multi-object tracking)多目标追踪中的前沿算法,由字节跳动和华中科技大学AI团队研究并开源,在MOT领域取得了非常好的效果
    钱****翔
    2023-05-16
    0
    112
    0
  • 本文介绍了最新的SVTR模型,利用单视觉模型进行场景文字识别,达到媲美视觉模型+序列的识别效果
    钱****翔
    2023-04-28
    0
    122
    0
全部
  • 利用语义推理网络来进行场景文字识别
  • Reformer主要是为了解决Transformer结构显存占用大、模型复杂度度高的缺点(无法处理长序列、无法在单GPU上进行训练),而进行的模型结构改进。
  • 传统的目标检测任务中,对于ground_truth(gt)和anchor的配对,都采取固定的策略(例如依赖IOU阈值--RetinaNet,对于Anchor-free类算法则往往依据anchors是否包含gt的中心点或者核心区域--FCOS)。这篇论文就提出了将anchor当作label需求方,而gt当作label提供方,而label从gt传输(匹配)至anchor的传输成本就是分类和回归的loss加权和(对于负样本只计算分类loss),这样就将gt和anchor的匹配问题变成了一个最优化传输成本的问题(Optimal Transport (OT) problem),可以使用Sinkhorn-Knopp迭代来进行问题求解。
  • 通过将耦合检测头更改为非耦合检测头,并利用了Anchor-free思想,YOLOX开创了YOLO系列目标检测算法另一个派系
  • MOT(multi-object tracking)多目标追踪中的前沿算法,由字节跳动和华中科技大学AI团队研究并开源,在MOT领域取得了非常好的效果
  • 本文介绍了最新的SVTR模型,利用单视觉模型进行场景文字识别,达到媲美视觉模型+序列的识别效果
  • 没有更多了