发 帖  
  • 目前的视网膜血管分割方法根据输入类型大致分为 image-level 和 patches-level 方法,为了从这两种输入形式中受益,这篇文章引入了一个双分支 Transformer 模块,被叫做 DBTM,它可以同时...
    0
    2095次阅读
    0条评论
  • 现有深度学习模型都不具有普适性,即在某个数据集上训练的结果只能在某个领域中有效,而很难迁移到其他的场景中,因此出现了迁移学习这一领域。...
    0
    1429次阅读
    0条评论
  • YOLOv5网络结构解析

    2022-10-28 10:38
    比如上面把width_multiple设置为了0.5,那么第一个 [64, 6, 2, 2] 就会被解析为 [3,64*0.5=32,6,2,2],其中第一个 3 为输入channel(因为输入),32 为输出chann...
    0
    5100次阅读
    0条评论
  • Deep neural networks 在Computer Vision领域取得了非常大的成功,但严重依赖于训练和测试的domain遵循 identical distribution的假设。...
    0
    1538次阅读
    0条评论
  • 在H100发布之际,英伟达还带来一个“重磅产品”——Transformer Engine。在Transformer大火之际推出这么一个产品,无疑是炼丹师福音。...
    0
    5485次阅读
    0条评论
  • 介绍一篇关于概率生成模型非常有意思的工作,保持了Aleksander Madry一如既往的风格。...
    0
    770次阅读
    0条评论
  • 目前,许多人在看相关目标检测的论文时,常常误以为正样本就是我们手动标注的GT(ground truth),这个理解是错误的,正确的理解是这样的:...
    0
    5182次阅读
    0条评论
  • 人们很容易用文字来描述类别的视觉特征,并利用这些文字描述来辅助感知,用于分类检测等各种感知任务。...
    0
    1577次阅读
    0条评论
  • 因此,合适的prompt对于模型的效果至关重要。大量研究表明,prompt的微小差别,可能会造成效果的巨大差异。研究者们就如何设计prompt做出了各种各样的努力——自然语言背景知识的融合、自动生成prompt的搜索、不...
    0
    2075次阅读
    0条评论
  • CLIP是近年来在多模态方面的经典之作,得益于大量的数据和算力对模型进行预训练,模型的Zero-shot性能非常可观,甚至可以在众多数据集上和有监督训练媲美。...
    0
    6035次阅读
    0条评论
  • 其一是实际环境中的动态物体不一定被预训练,另一是算法无法区分"动态物体"和"静止但可能移动的物体"。...
    0
    1809次阅读
    0条评论
ta 的专栏

成就与认可

  • 获得 3 次赞同

    获得 0 次收藏
关闭

站长推荐 上一条 /9 下一条

返回顶部