X1OI_tyutcsplab的个人主页_电子工程师 - 电子技术论坛

X1OI_tyutcsplab

经验：积分：4

查看完整档案 >>

+关注发私信

他的动态

发布了文章 2023-7-16 20:45

更强更通用：智源「悟道3.0」Emu多模态大模型开源，在多模态序列中「补全一切」

当前学界和工业界都对多模态大模型研究热情高涨。去年，谷歌的 Deepmind 发布了多模态视觉语言模型 Flamingo ，它使用单一视觉语言模型处理多项任务，在多模态大模型领域保持较高热度。Flamingo 具备强大的多模态上下文少样本学...

0

716次阅读

0条评论
发布了文章 2023-7-10 10:05

VisCPM：迈向多语言多模态大模型时代

随着 GPT-4 和 Stable Diffusion 等模型多模态能力的突飞猛进，多模态大模型已经成为大模型迈向通用人工智能（AGI）目标的下一个前沿焦点。总体而言，面向图像和文本的多模态生成能力可以大致分为两类： 1. 在图生文（ima...

0

708次阅读

0条评论
发布了文章 2023-7-7 22:35

“数字山西校企共创”专题研讨会

为促进我省数字化产业转型升级，探索校企共创数字化新模式，太原理工大学大数据融合分析与应用山西省重点实验联合山西省数字经济联合会大数据与人工智能专委会、ACM太原分会、CCF太原分部共同主办“数字山西校企共创”专题研讨会，特...

0

371次阅读

0条评论
发布了文章 2023-7-2 20:55

大模型帮陶哲轩解题、证明数学定理：数学真要成为首个借助AI实现突破的学科了？

数学将成为第一门借助AI实现重大突破的学科？去年 2 月份，DeepMind 发布了编程辅助利器 AlphaCode。它使用人工智能技术来帮助程序员更快地编写代码，可以自动完成代码、提供代码建议并检查错误，从而提高编程效率。AlphaCo...

0

402次阅读

0条评论
发布了文章 2023-7-2 20:35

类GPT模型训练提速26.5%，清华朱军等人用INT4算法加速神经网络训练

我们知道，将激活、权重和梯度量化为 4-bit 对于加速神经网络训练非常有价值。但现有的 4-bit 训练方法需要自定义数字格式，而当代硬件不支持这些格式。在本文中，清华朱军等人提出了一种使用 INT4 算法实现所有矩阵乘法的 Transf...

0

658次阅读

0条评论
发布了文章 2023-6-27 10:05

愿有前程可奔赴，亦有岁月可回首

三年时光，转瞬即逝时光匆匆欢声笑语中已携手走过三年此刻，即将告别但所有的离开都是为了更好的相遇师生大合照未来可期三年时光飞逝，大数据融合分析与应用山西省重点实验室23届硕士毕业生共21名，他们怀揣着热情和...

0

次阅读

条评论
发布了文章 2023-6-18 21:30

语音领域的GPT时刻：Meta 发布「突破性」生成式语音系统，一个通用模型解决多项任务

继开源 LLaMA 之后，Meta 在生成式 AI 方向又公布一项重大研究。我们知道，GPT、DALL-E 等大规模生成模型彻底改变了自然语言处理和计算机视觉研究。这些模型可以生成高保真文本或图像，而且它们有个重要特点就是「通才」，可以解...

0

662次阅读

0条评论
发布了文章 2023-6-11 21:40

随时随地，追踪每个像素，连遮挡都不怕的「追踪一切」视频算法来了

Tracking Everything Everywhere All at Once. 前段时间，Meta 发布「分割一切（SAM）」AI 模型，可以为任何图像或视频中的任何物体生成 mask，让计算机视觉（CV）领域研究者惊呼：「CV 不...

0

471次阅读

0条评论
发布了文章 2023-6-6 11:05

识别「ChatGPT造假」，效果超越OpenAI：北大、华为的AI生成检测器来了

AI 造假的成功率很高，前几天「10 分钟骗 430万」还上了热搜。在最热门的大语言模型上，研究人员最近探索了一种识别方法。随着生成式大模型的不断进步，它们生成的语料正逐步逼近人类。虽然大模型正在解放无数文书的双手，它以假乱真的强劲能力也...

0

470次阅读

0条评论
发布了文章 2023-6-6 11:00

OpenAI要为GPT-4解决数学问题了：奖励模型指错，解题水平达到新高度

对于具有挑战性的 step-by-step 数学推理问题，是在每一步给予奖励还是在最后给予单个奖励更有效呢？OpenAI 的最新研究给出了他们的答案。现在，大语言模型迎来了「无所不能」的时代，其中在执行复杂多步推理方面的能力也有了很大提高...

0

367次阅读

0条评论
发布了文章 2022-11-21 11:57

GPT-3、Stable Diffusion一起助攻，让模型听懂甲方修图需求

这里给模型的输入描述是「一只坐下的狗」，但是按照人们的日常交流习惯，最自然的描述应该是「让这只狗坐下」。有研究者认为这是一个应该优化的问题，模型应该更符合人类的语言习惯。...

0

963次阅读

0条评论
发布了文章 2022-11-21 11:55

Stable Diffusion采样速度翻倍！仅需10到25步的扩散模型采样算法

然而，扩散模型在使用上最大的问题就是其极慢的采样速度。模型采样需要从纯噪声图片出发，一步一步不断地去噪，最终得到清晰的图片。在这个过程中，模型必须串行地计算至少 50 到 100 步才可以获得较高质量的图片，这导致生成一张图片需要的时间是其...

0

1859次阅读

0条评论
发布了文章 2022-11-21 11:32

AI再卷数学界，DSP新方法将机器证明成功率提高一倍

我们以语言模型 Minerva为例。当在足够多的数据训练之后，我们发现它的数学能力非常强，可以在高中数学测试中拿到高于平均分水平。然而这样的语言模型也有不足，它只能模仿，而不能自主训练而提高数学水平。形式化证明系统提供了一个训练环境，但形式...

0

555次阅读

0条评论
发布了文章 2022-11-1 16:30

全新科学问答数据集ScienceQA让深度学习模型推理有了思维链

在回答复杂的问题时，人类可以理解不同模态的信息，并形成一个完整的思维链（Chain of Thought, CoT）。深度学习模型是否可以打开「黑箱」，对其推理过程提供一个思维链呢？近日，UCLA 和艾伦人工智能研究院（AI2）提出了首个标...

0

1354次阅读

0条评论
发布了文章 2022-10-31 16:03

单激光器实现最快数据传输纪录

有些时候，人们形容网络的效率「不如卡车运硬盘」：亚马逊 AWS 就有一种名为 snowmobile 的服务，真的使用集装箱卡车，一次可以传输 100Pb。这种大号 U 盘传数据的体量可谓巨大，但也从另一个方面告诉我们，网络传输数据存在很大的...

0

509次阅读

0条评论