发帖

[经验]

【幸狐Omni3576边缘计算套件试用体验】使用rkllm运行DeepSeek的服务模式体验

2025-3-24 09:22:44

1942 rk3576 大模型 DeepSeek

0

一、前言:

继之前把rkllm方式的大模型案例:【幸狐Omni3576边缘计算套件试用体验】开发板基础体验:大模型和推流测试

跑起来之后,一直想着搞一搞server模式,然后翻阅文档中发现官方已经提供了,先把测试记录贴上来。

二、步骤

官方自带的rknn服务端案例位于rknn-llm-main/examples/rkllm_server_demo/：

首先把rknn_server_demo拷贝或发送到开发板中,然后创建python的虚拟环境,进入虚拟环境,下载flask库:

然后运行demo:

** python3 flask_server.p y --rkllm_model_path /DeepSeek/DeepSeek_R1_Distill/DeepSeek-R1-Distill-Qwen-1.5 B_FP16_RK3576.rkllm --target_platform rk3576**

运行成功后如下图:

然后可以开启另一个窗口,运行chat_rknn_server.py即可,注意:运行前要修改一下代码里面关于server_url的内容,这里,我因为在本机上运行,所以用localhost,如果是在别的机器上,就要写板卡的地址了:

运行成功,这下离我的本地版小智又近一步啦

三、然后是带界面方式

**然后体验一下带界面的方式,首先安装gradio:**pip install gradio

然后运行gradio的demo就行:

python3 gradio_server.py --rkllm_model_path /DeepSeek/DeepSeek_R1_Distill/DeepSeek-R1-Distill-Qwen-1.5B_W4A16G128_RK3576.rkllm --target_platform rk3576

然后启动成功后打开网页就可以看到效果了,目前原生的demo界面比较简陋,等有时间改个好看的界面出来:

问点问题测试一下吧:

回了一堆不知道是啥玩应儿,猜想会不会字符编码的问题,兴许通过网页的方式,字符编码错乱了呢,用英语问问看:

感觉还是显示得有点奇怪,看一下后台:

后台挺正常的,到网页上就变样了.

打开gradio_server.py源码,看到提示词就明白了,这啥乱八七糟的,怪不得出问题,改改改:

改完再运行,就正常多了:

一本正经胡说八道:

看来还得运行更高级的模型才行,试试7B吧,正好发现rk官方发布了7B模型,下载来试试看.

四、运行官方的7B模型

下载地址:https://meta.box.lenovo.com/v/link/view/ad7482f6712844b48902f07287ed3359 口令:rkllm

把模型下载之后拷到板子上,然后加载一下,随便问了个问题:

感觉还是有点胡说八道啊,而且运行过程中还有异常抛出,是不是国外的名著不太清楚,问个中国的.

还是会有错误爆出,而且回答都是错的,说射雕英雄传是古龙的,唉..

而且问题的原因有点像是运算过程中抛异常导致的丢内容

再次使用server_flask模式看看:

还是不太理想,回头再看看具体原因吧.

五、尝试自行转换模型

因为我用的是8+64G的版本,所以这里大胆采用8B模型,到HuggingFace的镜像站去下载8B模型:

https://hf-mirror.com/deepseek-ai/DeepSeek-R1-Distill-Llama-8B/tree/main

git clone https://hf-mirror.com/deepseek-ai/DeepSeek-R1-Distill-Llama-8B

下载完之后,用RKToolKit转化成rknn格式:

首先安装rkllmToolkit工具:

执行导入命令没有出错,安装成功

然后还要更新内核的npu驱动,要0.9.8以上:

而我的板子,用的最新的202503版本固件，还是0.9.7,GG啦

**来吧,编内核吧!!**下一篇走起

本主题由 dianzi_0101 于 2025-3-24 09:30 审核通过

只看该作者 淘帖0 举报

相关推荐

评论

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容图片侵权或者其他问题，请联系本站作侵删。侵权投诉

精选推荐

谁有3566+电池+POE充电的方案,有个项目需要用该功能的主板

304 浏览 0 评论
RK3588的GMAC0与PHY的参考时钟电平匹配问题？？？？？？

4374 浏览 1 评论
请问各位大佬，如何解决，瑞芯微 RV1126B 使用 mpp 自带工具调试时，内核直接报错崩溃！

1798 浏览 0 评论
使用rk3568开发板，核0\\1\\3运行linux，核2运行hal，在核0中怎么关闭核2

2354 浏览 0 评论
3588香橙派上显示hdmi输入延迟问题

2356 浏览 0 评论

快速回复 返回顶部 返回列表

关注微信公众号

电子发烧友网

电子发烧友论坛

社区合作: 刘勇; 联系电话：15994832713; 邮箱地址：liuyong@huaqiu.com

社区管理: elecfans短短; 微信：elecfans_666; 邮箱：users@huaqiu.com

返回瑞芯微Rockchip开发者社区

回复

关闭

站长推荐 /9

快速回复 返回顶部 返回列表

- 厂商专区: 飞凌嵌入式

瑞萨单片机论坛

米尔电子

Aigtek安泰电子

斯丹麦德电子

芯佰微电子

其利天下技术小组

道生物联技术社区

视美泰

FCom富士晶振

大大通

合众恒跃

进迭时空

RT-Thread论坛

EASY-EAI灵眸科技

- 技术社区: 张飞电子技术社区

KaihongOS技术社区

FPGA开发者技术社区

RISC-V MCU技术社区

HarmonyOS技术社区

- OpenHarmony开源社区: OpenHarmony开源社区

- 嵌入式论坛: ARM技术论坛

STM32/STM8技术论坛

嵌入式技术论坛

单片机/MCU论坛

RISC-V技术论坛

瑞芯微Rockchip开发者社区

FPGA|CPLD|ASIC论坛

DSP论坛

- 电路图及DIY: 电路设计论坛

DIY及创意

电子元器件论坛

专家问答

- 电源技术论坛: 电源技术论坛

无线充电技术

- 综合技术与应用: 机器人论坛

USB论坛

电机控制

模拟技术

音视频技术

综合技术交流

上位机软件（C/Python/Java等）

- 无线通信论坛: WIFI技术

蓝牙技术

天线|RF射频|微波|雷达技术

- EDA设计论坛: PCB设计论坛

DigiPCBA论坛

Protel|AD|DXP论坛

PADS技术论坛

Allegro论坛

multisim论坛

proteus论坛|仿真论坛

KiCad EDA 中文论坛

DFM|可制造性设计论坛

- 测试测量论坛: LabVIEW论坛

Matlab论坛

测试测量技术

传感技术

- 招聘/交友/外包/交易/杂谈: 项目外包

供需及二手交易

工程师杂谈|交友

招聘|求职|工程师职场

- 官方社区: 发烧友官方/活动

华秋商城

华秋电路

+ 元器件搜索引擎: 元器件搜索引擎

time

recommend

hot

post

—
—
—

版
块
导
航