jf_pmFSk4VX的专栏_电子工程师 - 电子技术论坛

jf_pmFSk4VX

经验：积分：14

查看完整档案 >>

+关注发私信

使用自适应条形采样和双分支Transformer的DA-Net
2022-10-31 14:41

目前的视网膜血管分割方法根据输入类型大致分为 image-level 和 patches-level 方法，为了从这两种输入形式中受益，这篇文章引入了一个双分支 Transformer 模块，被叫做 DBTM，它可以同时...

0

2095次阅读

0条评论
基于graph-relational domains的自适应问题
2022-10-28 15:31

现有深度学习模型都不具有普适性，即在某个数据集上训练的结果只能在某个领域中有效，而很难迁移到其他的场景中，因此出现了迁移学习这一领域。...

0

1429次阅读

0条评论
YOLOv5网络结构解析
2022-10-28 10:38

比如上面把width_multiple设置为了0.5，那么第一个 [64, 6, 2, 2] 就会被解析为 [3,64*0.5=32,6,2,2]，其中第一个 3 为输入channel(因为输入)，32 为输出chann...

0

5100次阅读

0条评论
一种提高网络泛化能力的概率方法
2022-10-25 09:40

Deep neural networks 在Computer Vision领域取得了非常大的成功，但严重依赖于训练和测试的domain遵循 identical distribution的假设。...

0

1538次阅读

0条评论
详解NVIDIA H100 TransformerEngine
2022-10-24 15:26

在H100发布之际，英伟达还带来一个“重磅产品”——Transformer Engine。在Transformer大火之际推出这么一个产品，无疑是炼丹师福音。...

0

5485次阅读

0条评论
利用基本分类框架来执行广泛的图像合成任务
2022-10-24 09:56

介绍一篇关于概率生成模型非常有意思的工作，保持了Aleksander Madry一如既往的风格。...

0

770次阅读

0条评论
不同种类的anchor-based和anchor-free的相关算法
2022-10-21 08:58

目前，许多人在看相关目标检测的论文时，常常误以为正样本就是我们手动标注的GT（ground truth），这个理解是错误的，正确的理解是这样的：...

0

5182次阅读

0条评论
一种新的基于视觉语言模型的零镜头分类框架
2022-10-20 09:56

人们很容易用文字来描述类别的视觉特征，并利用这些文字描述来辅助感知，用于分类检测等各种感知任务。...

0

1577次阅读

0条评论
如何充分挖掘预训练视觉-语言基础大模型的更好零样本学习能力
2022-10-19 14:39

因此，合适的prompt对于模型的效果至关重要。大量研究表明，prompt的微小差别，可能会造成效果的巨大差异。研究者们就如何设计prompt做出了各种各样的努力——自然语言背景知识的融合、自动生成prompt的搜索、不...

0

2075次阅读

0条评论
介绍一个基于CLIP的zero-shot实例分割方法
2022-10-13 09:13

CLIP是近年来在多模态方面的经典之作，得益于大量的数据和算力对模型进行预训练，模型的Zero-shot性能非常可观，甚至可以在众多数据集上和有监督训练媲美。...

0

6035次阅读

0条评论
一种动态环境下的直接视觉里程计
2022-10-12 09:22

其一是实际环境中的动态物体不一定被预训练，另一是算法无法区分"动态物体"和"静止但可能移动的物体"。...

0

1809次阅读

0条评论