发 帖  
  • 发布了文章 2022-9-20 15:25
    信息抽取任务包括命名实体识别(NER)、关系抽取(RE)、事件抽取(EE)等各种各样的任务。...
    0
    1164次阅读
    0条评论
  • 发布了文章 2022-9-20 15:18
    深度学习和简单的统计学是一回事吗?很多人可能都有这个疑问,毕竟二者连术语都有很多相似的地方。在这篇文章中,理论计算机科学家、哈佛大学知名教授 Boaz Barak 详细比较了深度学习与经典统计学的差异,认为“如果纯粹从统计学角度认识深度学习...
    0
    1026次阅读
    0条评论
  • 发布了文章 2022-9-20 14:30
    视觉语言导航(VLN)是一个新兴的研究领域,旨在构建一种可以用自然语言与人类交流并在真实的3D环境中导航的具身代理,与计算机视觉、自然语言处理和机器人等研究领域紧密关联。...
    0
    3668次阅读
    0条评论
  • 发布了文章 2022-9-20 12:04
    面向目标的多模态情感分类(TMSC)是方面级情感分析的一个新的子任务,旨在预测一对句子和图片中提到的意见目标的情感极性。...
    0
    1005次阅读
    0条评论
  • 发布了文章 2022-9-19 11:18
    文中提出的迁移学习框架主要包括model-level transfer和item-level transfer。其中model-level transfer通过学习一个多样本模型和一个少样本模型,并学习一个二者参数的映射函数,实现模型参数上...
    0
    1103次阅读
    0条评论
  • 发布了文章 2022-9-19 11:14
    当然了,和往常的文章一样,我不会复述这一篇文章,而是聊聊里面的一些关键点和一些有意思的内容,拿出来和大家讨论一下。...
    0
    1036次阅读
    0条评论
  • 发布了文章 2022-9-19 09:19
    训练越来越大的深度学习模型已经成为过去十年的一个新兴趋势。如下图所示,模型参数量的不断增加让神经网络的性能越来越好,也产生了一些新的研究方向,但模型的问题也越来越多。...
    0
    1317次阅读
    0条评论
  • 发布了文章 2022-9-15 14:54
    因为直接对原是文本进行数据增强,很难保证维持原始的文本语义,因此可以通过在语义空间上进行隐式数据增强,简单列出几种方法:...
    0
    1647次阅读
    0条评论
  • 发布了文章 2022-9-14 11:16
    最近,Scaled-YOLOv4的作者(也是后来的YOLOR的作者)和YOLOv4的作者AB大佬再次联手推出了YOLOv7,目前来看,这一版的YOLOv7是一个比较正统的YOLO续作,毕竟有AB大佬在,得到了过YOLO原作的认可。...
    0
    7326次阅读
    0条评论
  • 发布了文章 2022-9-9 17:11
    文中对比了简单模型LeNet和现代模型ResNet的校准情况,LeNet的输出结果校准性很好,而ResNet则出现了比较严重的过自信问题(over-confidence),即模型输出的置信度很高,但实际的准确率并没有那么高。...
    0
    6982次阅读
    0条评论
  • 发布了文章 2022-6-10 10:58
    一个典型的原子事件类型归纳的研究是Nathanael Chambers和Dan Jurafsky在2013年发表的一篇关于如何在没有预设模板的情况下进行基于模板的事件模式归纳的方法[1]。这篇文章的开创性部分在于文章着重于在无监督的情况下学...
    0
    1573次阅读
    0条评论
  • 发布了文章 2022-6-9 11:19
    Confusionset-guided Pointer Network看起来跟之前提及的CopyNet思路很接近文本生成系列之文本编辑,同时考虑到copy原文跟生成新字两种可能性,相对于之前的seq2seq模型的改进主要是引入混淆集来控制可...
    0
    5838次阅读
    0条评论
  • 发布了文章 2022-6-7 09:57
    为了减轻上述问题,提出了NoisyTune方法,即,在finetune前加入给预训练模型的参数增加少量噪音,给原始模型增加一些扰动,从而提高预训练语言模型在下游任务的效果,如下图所示,...
    0
    2364次阅读
    0条评论
  • 发布了文章 2022-6-7 09:54
    近年来,预训练语言模型在各种 NLP 任务上取得了令人瞩目的表现。然而,一些研究发现,由预训练模型得出的原始句表示相似度都很高,在向量空间中并不是均匀分布的,而是构成了一个狭窄的锥体,这在很大程度上限制了句表示的表达能力。...
    0
    1772次阅读
    0条评论
  • 发布了文章 2022-6-7 09:48
    提交的系统使用XLM-RoBERTa作为编码器,在预处理过程中对训练数据的惯用语短语(MWE)进行特殊标记,在训练过程中使用R-Drop作为辅助训练目标...
    0
    1107次阅读
    0条评论
ta 的专栏

成就与认可

  • 获得 5 次赞同

    获得 0 次收藏
关闭

站长推荐 上一条 /6 下一条

返回顶部