发 帖  
  • 发布了文章 2025-3-4 11:10
    近年来,大规模语言模型(Large Language Models, LLMs)在自然语言处理领域取得了革命性进展。以 GPT 系列、LLaMA 等为代表的模型,通过千亿级参数的复杂结构展现出强大的语义理解和生成能力。...
    0
    925次阅读
    0条评论
  • 发布了文章 2025-2-17 17:44
    在追求人工智能极限的道路上,"更大即更强" 似乎已成为共识。特别是在数学推理这一被视为 AI 终极挑战的领域,业界普遍认为需要海量数据和复杂的强化学习才能获得突破。 然而,来自上海交通大学的最新研究却给出了一个令人震惊的答案:仅需 817 ...
    0
    946次阅读
    0条评论
  • 发布了文章 2025-2-17 17:31
    在自然界中,好奇心驱使着生物探索未知,是生存和进化的关键。人类,作为地球上最具智能的物种,其探索精神引领了科技、文化和社会的进步。1492 年,哥伦布怀揣探索未知的理想,勇敢地向西航行,最终发现了新大陆。 正如人类在面对未知时展现出的探索行...
    0
    676次阅读
    0条评论
  • 发布了文章 2025-1-21 10:11
    训练方法与推理策略 性能评测体系 现存挑战与未来方向 综述的完整目录如下: 多模态的 Tokenization 我们认为多模态的 Tokenization 是 MMNTP 的基石和最重要的部分,它将各种模态的信息(如图像、视频和音频片段)分...
    0
    939次阅读
    0条评论
  • 发布了文章 2025-1-21 09:45
    自 Hinton 等人的开创性工作以来,基于 Kullback-Leibler 散度(KL-Div)的知识蒸馏一直占主导地位。 然而,KL-Div 仅比较教师和学生在相应类别上的概率,缺乏跨类别比较的机制,应用于中间层蒸馏时存在问题,其无法...
    0
    1022次阅读
    0条评论
  • 发布了文章 2025-1-15 13:49
    近日,中国电信翼支付针对大模型推理加速的最新研究成果《Falcon: Faster and Parallel Inference of Large Language Models through Enhanced Semi-Autoregr...
    0
    1475次阅读
    0条评论
  • 发布了文章 2025-1-15 13:45
      论文标题:Universal Domain Adaptive Object Detection via Dual Probabilistic Alignment 论文地址: https://arxiv.org/abs/2412.1144...
    0
    1187次阅读
    0条评论
  • 发布了文章 2025-1-15 09:30
      背景简介 随着图像编辑工具和图像生成技术的快速发展,图像处理变得非常方便。然而图像在经过处理后不可避免的会留下伪影(操作痕迹),这些伪影可分为语义和非语义特征。因此目前几乎所有的图像篡改检测模型(IML)都遵循“语义分割主干网络”与“精...
    0
    837次阅读
    0条评论
  • 发布了文章 2025-1-3 14:05
    在人工智能领域,目前有很多工作采用自回归方法来模拟或是替代扩散模型,其中视觉自回归建模(Visual AutoRegressive modeling,简称 VAR)就是其中的典型代表,该工作利用自回归取得了比传统基于噪声的扩散模型更好的生成...
    0
    1663次阅读
    0条评论
  • 发布了文章 2025-1-3 09:28
    本文分享香港大学计算和数据科学学院俞益洲教授及其研究团队发表于 AAAI 2025 的论文——SparX,一种强化 Vision Mamba 和 Transformer 的稀疏跳跃连接机制,性能强大,代码已开源。 论文标题: SparX: ...
    0
    1815次阅读
    0条评论
  • 发布了文章 2024-12-30 18:09
    图像复原又来新突破了!还记得性能超越SwinIR(基于Transformer)的MambaIR吗?一种基于Mamba的图像复原基准模型,登上ECCV 2024。最近原作者又开发了新版本MambaIRv2,更高性能、更高效率!另外还有ACM ...
    0
    1639次阅读
    0条评论
  • 发布了文章 2024-12-17 10:21
    GPT-4o 提供的全双工语音对话带来了一股研究热潮,目前诸多工作开始研究如何利用 LLM 来实现端到端的语音到语音(Speech-to-Speech)对话能力,但是目前大部分开源方案存在以下两个问题:   LLM 灾难性遗忘:由于现有方案...
    0
    1330次阅读
    0条评论
  • 发布了文章 2024-12-6 11:31
    背景介绍 本文是基于我们之前的 RPN(Reconciled Polynomial Network)研究的后续工作。在此前的研究中,我们提出了 RPN 这一通用模型架构,其包含三个组件函数:数据扩展函数、参数调和函数和剩余函数。 我们先前的...
    0
    2159次阅读
    0条评论
  • 发布了文章 2024-12-6 11:24
    在 AI 领域,近期的新闻焦点无疑是关于「Scaling Law 是否撞墙?」的辩论。这一曾经被视作大模型发展的第一性原理,如今却遭遇了挑战。   在这样的背景下,研究人员开始意识到,与其单纯堆砌更多的训练算力和数据资源,不如让模型「花更多...
    0
    1187次阅读
    0条评论
  • 发布了文章 2024-11-27 09:21
    随着扩散生成模型的发展,人工智能步入了属于 AIGC 的新纪元。扩散生成模型可以对初始高斯噪声进行逐步去噪而得到高质量的采样。当前,许多应用都涉及扩散模型的反演,即找到一个生成样本对应的初始噪声。当前的采样器不能兼顾反演的准确性和采样的质量...
    0
    1079次阅读
    0条评论
ta 的专栏

成就与认可

  • 获得 11 次赞同

    获得 0 次收藏
关闭

站长推荐 上一条 /9 下一条

返回顶部