发 帖  
  • 发布了文章 2023-7-16 20:45
    当前学界和工业界都对多模态大模型研究热情高涨。去年,谷歌的 Deepmind 发布了多模态视觉语言模型 Flamingo ,它使用单一视觉语言模型处理多项任务,在多模态大模型领域保持较高热度。Flamingo 具备强大的多模态上下文少样本学...
    0
    716次阅读
    0条评论
  • 发布了文章 2023-7-10 10:05
    随着 GPT-4 和 Stable Diffusion 等模型多模态能力的突飞猛进,多模态大模型已经成为大模型迈向通用人工智能(AGI)目标的下一个前沿焦点。总体而言,面向图像和文本的多模态生成能力可以大致分为两类: 1. 在图生文(ima...
    0
    708次阅读
    0条评论
  • 发布了文章 2023-7-7 22:35
      为促进我省数字化产业转型升级,探索校企共创数字化新模式,太原理工大学 大数据融合分析与应用山西省重点实验 联合 山西省数字经济联合会 大数据与人工智能专委会 、ACM太原分会、CCF太原分部 共同主办“数字山西 校企共创”专题研讨会,特...
    0
    371次阅读
    0条评论
  • 发布了文章 2023-7-2 20:55
    数学将成为第一门借助AI实现重大突破的学科? 去年 2 月份,DeepMind 发布了编程辅助利器 AlphaCode。它使用人工智能技术来帮助程序员更快地编写代码,可以自动完成代码、提供代码建议并检查错误,从而提高编程效率。AlphaCo...
    0
    402次阅读
    0条评论
  • 发布了文章 2023-7-2 20:35
    我们知道,将激活、权重和梯度量化为 4-bit 对于加速神经网络训练非常有价值。但现有的 4-bit 训练方法需要自定义数字格式,而当代硬件不支持这些格式。在本文中,清华朱军等人提出了一种使用 INT4 算法实现所有矩阵乘法的 Transf...
    0
    658次阅读
    0条评论
  • 发布了文章 2023-6-27 10:05
    三年时光,转瞬即逝 时光匆匆 欢声笑语中已携手走过三年 此刻,即将告别 但所有的离开都是为了更好的相遇    师生大合照 未 来 可 期      三年时光飞逝,大数据融合分析与应用山西省重点实验室23届硕士毕业生共21名,他们怀揣着热情和...
    0
    次阅读
    条评论
  • 发布了文章 2023-6-18 21:30
    继开源 LLaMA 之后,Meta 在生成式 AI 方向又公布一项重大研究。 我们知道,GPT、DALL-E 等大规模生成模型彻底改变了自然语言处理和计算机视觉研究。这些模型可以生成高保真文本或图像,而且它们有个重要特点就是「通才」,可以解...
    0
    662次阅读
    0条评论
  • 发布了文章 2023-6-11 21:40
    Tracking Everything Everywhere All at Once. 前段时间,Meta 发布「分割一切(SAM)」AI 模型,可以为任何图像或视频中的任何物体生成 mask,让计算机视觉(CV)领域研究者惊呼:「CV 不...
    0
    471次阅读
    0条评论
  • 发布了文章 2023-6-6 11:05
    AI 造假的成功率很高,前几天「10 分钟骗 430万」还上了热搜。在最热门的大语言模型上,研究人员最近探索了一种识别方法。 随着生成式大模型的不断进步,它们生成的语料正逐步逼近人类。虽然大模型正在解放无数文书的双手,它以假乱真的强劲能力也...
    0
    470次阅读
    0条评论
  • 发布了文章 2023-6-6 11:00
    对于具有挑战性的 step-by-step 数学推理问题,是在每一步给予奖励还是在最后给予单个奖励更有效呢?OpenAI 的最新研究给出了他们的答案。 现在,大语言模型迎来了「无所不能」的时代,其中在执行复杂多步推理方面的能力也有了很大提高...
    0
    367次阅读
    0条评论
  • 发布了文章 2022-11-21 11:57
    这里给模型的输入描述是「一只坐下的狗」,但是按照人们的日常交流习惯,最自然的描述应该是「让这只狗坐下」。有研究者认为这是一个应该优化的问题,模型应该更符合人类的语言习惯。...
    0
    963次阅读
    0条评论
  • 发布了文章 2022-11-21 11:55
    然而,扩散模型在使用上最大的问题就是其极慢的采样速度。模型采样需要从纯噪声图片出发,一步一步不断地去噪,最终得到清晰的图片。在这个过程中,模型必须串行地计算至少 50 到 100 步才可以获得较高质量的图片,这导致生成一张图片需要的时间是其...
    0
    1859次阅读
    0条评论
  • 发布了文章 2022-11-21 11:32
    我们以语言模型 Minerva为例。当在足够多的数据训练之后,我们发现它的数学能力非常强,可以在高中数学测试中拿到高于平均分水平。然而这样的语言模型也有不足,它只能模仿,而不能自主训练而提高数学水平。形式化证明系统提供了一个训练环境,但形式...
    0
    555次阅读
    0条评论
  • 发布了文章 2022-11-1 16:30
    在回答复杂的问题时,人类可以理解不同模态的信息,并形成一个完整的思维链(Chain of Thought, CoT)。深度学习模型是否可以打开「黑箱」,对其推理过程提供一个思维链呢?近日,UCLA 和艾伦人工智能研究院(AI2)提出了首个标...
    0
    1354次阅读
    0条评论
  • 发布了文章 2022-10-31 16:03
    有些时候,人们形容网络的效率「不如卡车运硬盘」:亚马逊 AWS 就有一种名为 snowmobile 的服务,真的使用集装箱卡车,一次可以传输 100Pb。这种大号 U 盘传数据的体量可谓巨大,但也从另一个方面告诉我们,网络传输数据存在很大的...
    0
    509次阅读
    0条评论
ta 的专栏

成就与认可

  • 获得 11 次赞同

    获得 0 次收藏
关闭

站长推荐 上一条 /6 下一条

返回顶部