发 帖  
  • 发布了文章 2022-11-10 10:18
    为了解决AI部署落地难题,我们发起了FastDeploy项目。FastDeploy针对产业落地场景中的重要AI模型,将模型API标准化,提供下载即可运行的Demo示例。相比传统推理引擎,做到端到端的推理性能优化。FastDeploy还支持在...
    0
    1193次阅读
    0条评论
  • 发布了文章 2022-11-9 15:15
    本文旨在寻求一种无监督的3D物体分割方法。我们发现,运动信息有望帮助我们实现这一目标。如下图1所示,在左图中的蓝色/橙色圆圈内,一辆汽车上的所有点一起向前运动,而场景中其他的点则保持静止。那么理论上,我们可以基于每个点的运动,将场景中属于汽...
    0
    2061次阅读
    0条评论
  • 发布了文章 2022-11-7 14:32
    如下图所示,我们凭经验发现边距和预测分数与每个类的基数相关(一个类的基数即该类别拥有数据的数量)。具体来说,在校准之前,头类往往比尾类具有更大的边距和预测分数。因此,需要校准这种不平衡的边距以获得平衡的预测分数去避免未校准的边距对分类性能产...
    0
    876次阅读
    0条评论
  • 发布了文章 2022-11-2 13:33
    最近的工作表明,transformers 还可以通过将离线强化学习(RL)视作顺序预测问题,进而从离线数据中学习策略。Chen et al. (2021)的工作表明,transformers 可以通过模仿学习从离线 RL 数据中学习单任务策...
    0
    902次阅读
    0条评论
  • 发布了文章 2022-11-1 15:26
    手写数学公式识别是将包含数学表达式的图像转换为结构表达式,例如LaTeX数学表达式或符号布局树的过程。手写数学表达式的识别已经带来了许多下游应用,如在线教育、自动评分和公式图像搜索。在在线教育场景下,手写数学表达式的识别率对提高学习效率和教...
    0
    1538次阅读
    0条评论
  • 发布了文章 2022-10-31 17:03
    自Google提出Vision Transformer(ViT)以来,ViT渐渐成为许多视觉任务的默认backbone。凭借着ViT结构,许多视觉任务的SoTA都得到了进一步提升,包括图像分类、分割、检测、识别等。...
    0
    974次阅读
    0条评论
  • 发布了文章 2022-10-28 16:00
    当前,绝大部分基于深度学习的图像去模糊算法是不区分场景的,也就是他们是对常见的自然与人为设计的场景进行去模糊。但是,在现实生活中,经常会遇到一些特定场景的图像去模糊。比如人脸去模糊、文本去模糊、双目去模糊。本文总结了这些不同场景的特点,以及...
    0
    2313次阅读
    0条评论
  • 发布了文章 2022-10-27 13:55
    通过引入像素注意力,PAN在大幅降低参数量的同时取得了非常优秀的性能。相比通道注意力与空域注意力,像素注意力是一种更广义的注意力形式,为进一步的探索提供了一个非常好的基线。...
    0
    1021次阅读
    0条评论
  • 发布了文章 2022-10-25 14:28
    判断模型是否可以生成特定图像,这是一个比较难计算的问题,而且很多深度生成模型并没有提供有效方法来估计密度,其本身也不支持评估跨模态相似性。而蒙特卡洛这种基于抽样的方法又会使模型搜索过程变得非常缓慢。...
    0
    479次阅读
    0条评论
  • 发布了文章 2022-10-24 09:52
    我们首先follow了特征重构 [2] 的框架,并测试了3种通用的网络架构MLP、CNN、transformer (上图)。...
    0
    1516次阅读
    0条评论
  • 发布了文章 2022-10-20 11:35
    针对车辆分析场景共性的底层模型进行优选迭代;针对几个高频场景进行了详细的后处理策略设计,可以满足业务的快速上线需求。同时提供丰富的二次开发教程,方便用户根据自己的业务场景进行私有化开发。...
    0
    2044次阅读
    0条评论
  • 发布了文章 2022-10-19 15:52
    随着深度学习的兴起,深度半监督学习算法也取得了长足的进步。同时,包括Google、Meta和微软等在内的科技巨头也认识到了半监督学习在实际场景中的巨大潜力。...
    0
    559次阅读
    0条评论
  • 发布了文章 2022-10-19 14:51
    想要直接训练一个text-to-3D的模型非常困难,因为DALL-E 2等模型的训练需要吞噬数十亿个图像-文本对,但三维合成并不存在如此大规模的标注数据,也没有一个高效的模型架构对3D数据进行降噪。...
    0
    952次阅读
    0条评论
  • 发布了文章 2022-10-11 14:34
    我们指出在真实场景下,一个简单的后处理模块,就可以形成有效,用户友好,即插即用的防御。为了专门防御基于查询分数的攻击,我们设计了对攻击者的攻击,通过细微的输出扰动干扰攻击者。广泛的实验表明我们的方法在抵御攻击,精度,置信度准确度,速度上,显...
    0
    981次阅读
    0条评论
  • 发布了文章 2022-10-10 16:53
    作为最简单直接且不需要点云标签的三维场景重建方式,在这个工作中我们重点研究自监督环视深度估计这个任务。...
    0
    1003次阅读
    0条评论
ta 的专栏

成就与认可

  • 获得 1 次赞同

    获得 0 次收藏
关闭

站长推荐 上一条 /6 下一条

返回顶部