X1OI_tyutcsplab的个人主页_电子工程师 - 电子技术论坛 - 广受欢迎的专业电子论坛!

发帖

X1OI_tyutcsplab

经验：积分：4

查看完整档案 >>

+关注发私信

发布了文章 2025-3-4 11:10

一种基于正交与缩放变换的大模型量化方法

近年来，大规模语言模型（Large Language Models, LLMs）在自然语言处理领域取得了革命性进展。以 GPT 系列、LLaMA 等为代表的模型，通过千亿级参数的复杂结构展现出强大的语义理解和生成能力。...

0

925次阅读

0条评论
发布了文章 2025-2-17 17:44

大模型的数学能力或许一直都在关键在于如何唤醒它

在追求人工智能极限的道路上，"更大即更强" 似乎已成为共识。特别是在数学推理这一被视为 AI 终极挑战的领域，业界普遍认为需要海量数据和复杂的强化学习才能获得突破。然而，来自上海交通大学的最新研究却给出了一个令人震惊的答案：仅需 817 ...

0

946次阅读

0条评论
发布了文章 2025-2-17 17:31

TeleAI提出COPO对齐方法:8B模型超越Llama3-70B的表现

在自然界中，好奇心驱使着生物探索未知，是生存和进化的关键。人类，作为地球上最具智能的物种，其探索精神引领了科技、文化和社会的进步。1492 年，哥伦布怀揣探索未知的理想，勇敢地向西航行，最终发现了新大陆。正如人类在面对未知时展现出的探索行...

0

676次阅读

0条评论
发布了文章 2025-1-21 10:11

2025年Next Token Prediction范式会统一多模态吗

训练方法与推理策略性能评测体系现存挑战与未来方向综述的完整目录如下：多模态的 Tokenization 我们认为多模态的 Tokenization 是 MMNTP 的基石和最重要的部分，它将各种模态的信息（如图像、视频和音频片段）分...

0

939次阅读

0条评论
发布了文章 2025-1-21 09:45

大连理工提出基于Wasserstein距离(WD)的知识蒸馏方法

自 Hinton 等人的开创性工作以来，基于 Kullback-Leibler 散度（KL-Div）的知识蒸馏一直占主导地位。然而，KL-Div 仅比较教师和学生在相应类别上的概率，缺乏跨类别比较的机制，应用于中间层蒸馏时存在问题，其无法...

0

1022次阅读

0条评论
发布了文章 2025-1-15 13:49

中国电提出大模型推理加速新范式Falcon

近日，中国电信翼支付针对大模型推理加速的最新研究成果《Falcon: Faster and Parallel Inference of Large Language Models through Enhanced Semi-Autoregr...

0

1475次阅读

0条评论
发布了文章 2025-1-15 13:45

探索对抗训练的概率分布偏差：DPA双概率对齐的通用域自适的目标检测方法

论文标题：Universal Domain Adaptive Object Detection via Dual Probabilistic Alignment 论文地址： https://arxiv.org/abs/2412.1144...

0

1187次阅读

0条评论
发布了文章 2025-1-15 09:30

SparseViT：以非语义为中心、参数高效的稀疏化视觉Transformer

背景简介随着图像编辑工具和图像生成技术的快速发展，图像处理变得非常方便。然而图像在经过处理后不可避免的会留下伪影（操作痕迹），这些伪影可分为语义和非语义特征。因此目前几乎所有的图像篡改检测模型（IML）都遵循“语义分割主干网络”与“精...

0

837次阅读

0条评论
发布了文章 2025-1-3 14:05

基于移动自回归的时序扩散预测模型

在人工智能领域，目前有很多工作采用自回归方法来模拟或是替代扩散模型，其中视觉自回归建模（Visual AutoRegressive modeling，简称 VAR）就是其中的典型代表，该工作利用自回归取得了比传统基于噪声的扩散模型更好的生成...

0

1663次阅读

0条评论
发布了文章 2025-1-3 09:28

港大提出SparX:强化Vision Mamba和Transformer的稀疏跳跃连接机制

本文分享香港大学计算和数据科学学院俞益洲教授及其研究团队发表于 AAAI 2025 的论文——SparX，一种强化 Vision Mamba 和 Transformer 的稀疏跳跃连接机制，性能强大，代码已开源。论文标题： SparX: ...

0

1815次阅读

0条评论
发布了文章 2024-12-30 18:09

Mamba入局图像复原,达成新SOTA

图像复原又来新突破了！还记得性能超越SwinIR（基于Transformer）的MambaIR吗？一种基于Mamba的图像复原基准模型，登上ECCV 2024。最近原作者又开发了新版本MambaIRv2，更高性能、更高效率！另外还有ACM ...

0

1639次阅读

0条评论
发布了文章 2024-12-17 10:21

准确性超Moshi和GLM-4-Voice,端到端语音双工模型Freeze-Omni

GPT-4o 提供的全双工语音对话带来了一股研究热潮，目前诸多工作开始研究如何利用 LLM 来实现端到端的语音到语音（Speech-to-Speech）对话能力，但是目前大部分开源方案存在以下两个问题： LLM 灾难性遗忘：由于现有方案...

0

1330次阅读

0条评论
发布了文章 2024-12-6 11:31

CNN, RNN, GNN和Transformer模型的统一表示和泛化误差理论分析

背景介绍本文是基于我们之前的 RPN（Reconciled Polynomial Network）研究的后续工作。在此前的研究中，我们提出了 RPN 这一通用模型架构，其包含三个组件函数：数据扩展函数、参数调和函数和剩余函数。我们先前的...

0

2159次阅读

0条评论
发布了文章 2024-12-6 11:24

复旦提出大模型推理新思路：Two-Player架构打破自我反思瓶颈

在 AI 领域，近期的新闻焦点无疑是关于「Scaling Law 是否撞墙？」的辩论。这一曾经被视作大模型发展的第一性原理，如今却遭遇了挑战。在这样的背景下，研究人员开始意识到，与其单纯堆砌更多的训练算力和数据资源，不如让模型「花更多...

0

1187次阅读

0条评论
发布了文章 2024-11-27 09:21

浙大、微信提出精确反演采样器新范式，彻底解决扩散模型反演问题

随着扩散生成模型的发展，人工智能步入了属于 AIGC 的新纪元。扩散生成模型可以对初始高斯噪声进行逐步去噪而得到高质量的采样。当前，许多应用都涉及扩散模型的反演，即找到一个生成样本对应的初始噪声。当前的采样器不能兼顾反演的准确性和采样的质量...

0

1079次阅读

0条评论

12 3 4 5 6 7 8 9 10 ... 25 / 25 页下一页

ta 的专栏

成就与认可

获得 11 次赞同
获得 0 次收藏

关注

粉丝

关闭

站长推荐 /9

返回顶部

- 厂商专区: 飞凌嵌入式

瑞萨单片机论坛

米尔电子

Aigtek安泰电子

斯丹麦德电子

芯佰微电子

其利天下技术小组

道生物联技术社区

视美泰

FCom富士晶振

合众恒跃

进迭时空

RT-Thread论坛

EASY-EAI灵眸科技

- 技术社区: 张飞电子技术社区

KaihongOS技术社区

FPGA开发者技术社区

RISC-V MCU技术社区

HarmonyOS技术社区

- OpenHarmony开源社区: OpenHarmony开源社区

- 嵌入式论坛: ARM技术论坛

STM32/STM8技术论坛

嵌入式技术论坛

单片机/MCU论坛

RISC-V技术论坛

瑞芯微Rockchip开发者社区

FPGA|CPLD|ASIC论坛

DSP论坛

- 电路图及DIY: 电路设计论坛

DIY及创意

电子元器件论坛

专家问答

- 电源技术论坛: 电源技术论坛

无线充电技术

- 综合技术与应用: 机器人论坛

USB论坛

电机控制

模拟技术

音视频技术

综合技术交流

上位机软件（C/Python/Java等）

- 无线通信论坛: WIFI技术

蓝牙技术

天线|RF射频|微波|雷达技术

- EDA设计论坛: PCB设计论坛

DigiPCBA论坛

Protel|AD|DXP论坛

PADS技术论坛

Allegro论坛

multisim论坛

proteus论坛|仿真论坛

KiCad EDA 中文论坛

DFM|可制造性设计论坛

- 测试测量论坛: LabVIEW论坛

Matlab论坛

测试测量技术

传感技术

- 招聘/交友/外包/交易/杂谈: 项目外包

供需及二手交易

工程师杂谈|交友

招聘|求职|工程师职场

- 官方社区: 发烧友官方/活动

华秋商城

华秋电路

+ 元器件搜索引擎: 元器件搜索引擎

time

recommend

hot

post

—
—
—

版
块
导
航