【中国研究生电子设计竞赛】AMD命题报名与作品提交分别截止至

发布时间:2025-07-10      截稿时间:2025-07-15      阅读量:75次     

  研电赛.
  研电赛官方服务平台
  20th
  “AMD”命题
  第二十届中国研究生电子设计竞赛
  AMD成立于1969年,总部位于美国加州圣克拉拉,现已发展为全球领先的高性能与自适应计算公司,全球员工超过28,000名(截至2025年3月)。公司产品涵盖CPU、GPU、FPGA、DPU及系统级芯片,并结合强大的软件能力,广泛应用于云端、边缘和终端设备。
  AMD致力于推动人工智能发展,提供端到端的AI训练与推理解决方案,构建开放生态系统,并积极与中国生态伙伴合作,助力产业数字化转型。
  中国是AMD全球战略的重要市场。自1993年进入中国以来,AMD不断扩大在华投入,业务涵盖产品销售、战略合作、新品开发等。2004年成立大中华区总部,现由高级副总裁潘晓明领导。
  2006年,AMD在上海设立研发中心,以上海研发中心为主体的中国研发中心逐渐发展壮大,现已成为全球研发体系的重要组成,拥有超4,000名研发人员,覆盖芯片设计、软件开发与系统测试,并与本地客户紧密合作,推动技术落地。近年来,AMD在AI创新与可持续发展方面表现突出,荣获“2023年度杰出可持续创新企业”“2023-2024年度最受尊敬企业”称号,2024“世界互联网大会杰出贡献奖”等多项荣誉。
  一等奖:1名¥10,000
  二等奖:2名¥5,000
  三等奖:3名¥2,000
  (一)报名截止时间:2025年7月15日24:00。
  (二)作品提交截止时间:2025年7月20日24:00。
  (三)报名方式:采用线下报名方式,报名截止前完成报名费缴纳,并将参赛作品打包压缩,与线下报名表(见附件)、缴费凭证一并发送至官方邮箱。建议优先提交报名表,便于命题企业提供技术支持。
  (四)报名邮箱:CIEEDA 163.COM
  (五)缴费账号(线下转账):
  1.开户名称:中国电子学会
  2.账号:9558850200000514831
  (六)其他:
  1.7月15日报名截止后,秘书处将组织团队在官网完善信息并生成获奖证书,电子发票将发至队长邮箱。
  2.线下报名仅延长截止时间,不影响其他赛程安排。
  赛题一:
  基于ROCm on Radeon™平台的
  DeepSeek大语言模型部署性能优化
  1、赛题描述:
  随着AMD ROCm软件栈对RDNA3架构支持的不断完善,面向专业及创意人士设计的AMD Radeon™PRO W7000系列工作站显卡,凭借其卓越的48GB GDDR6显存容量,正逐步成为应对当前AI开发面临的严峻挑战时有效且经济的解决方案。目前,ROCm搭配W7000系工作站GPU的组合已支持大部分业内主流的模型以及部署框架。
  本命题要求参与者在搭载单张W7000工作站GPU的平台上优化使用vLLM框架部署DeepSeek-R1-Distill-Qwen-7B模型的性能。
  建议的优化方向包括但不限于:
  提升常见算子(如Elementwise、GEMM等)的执行效率,并对部署管线中的算子进行融合优化。
  ROCm on Radeon™对诸多量化方法(如AWQ、Marlin等)提供支持。
  对算法使用的计算内核(如Attention、MoE等)进行优化。
  2、提交要求:
  参赛者应基于指定代码仓库(如vLLM、PyTorch、Triton等)进行代码更改,经本地编译验证后提交code patch,并附上本地测试结果显示的性能提升幅度。性能提升基于代码改正,而非依靠部署参数调整。具体参数参见技术支持部分。
  3、评分标准:
  所有提交的代码将统一在ROCm on Radeon™平台上进行验证,并根据性能提升的幅度进行排名。
  基础得分=优化幅度百分比x 100
  加分项:(由AMD评审团打分)
  创新性(5分):优化方案的原创程度及复杂程度。
  实用性(5分):优化方案对ROCm生态推广的积极作用。
  可读性(2分):提交优化方案的详细阐述文档或PPT。
  4、硬件平台配置:
  (报名审核后,通知云服务申请表)
  5、视频教程:
  在8卡AMD W7800运行DeepSeek R1链接:
  https://www.bilibili.com/video/BV1i8j3zJExM
  6、本地开发环境:
  推荐使用AMD Radeon™PRO W7800
  7、技术支持:
  扫描二维码加入技术支持QQ群:
  8、软件环境:
  Benchmark教程(以修改vLLM为例)
  (1)准备DeepSeek-R1-Distill-Qwen-7B模型和ShareGPT_V3_unfiltered_cleaned_split.json数据集
  (2)推荐使用PyTorch-On-ROCm Docker Image创建container。
  (3)在container内安装带有本地修改的vLLM。
  (4)启动vLLM server
  (1)运行benchmark并观测结果
  9、相关链接:
  AMD Radeon™PRO W7800 Professional Graphics Specification:
  https://www.amd.com/en/products/graphics/workstations/radeon-pro/w7800.html
  Getting Started Guide:Using AMD ROCm™Software on Radeon™GPUs:
  https://www.amd.com/en/developer/resources/ml-radeon.html
  Inferencing and serving with vLLM on AMD GPUs:
  https://rocm.blogs.amd.com/artificial-intelligence/vllm/README.html
  赛题二:基于AMD APU系统的AI应用开发(自由命题)
  1.赛题描述:
  AIPC(人工智能个人电脑)是一种集成AI技术的个人电脑,通过本地算力、自然语言交互、个性化大模型等核心能力,重构传统PC的体验,使其从工具升级为“个人智能助理”。
  参赛队伍使用AMD指定的APU产品开发一个AI应用,围绕以下领域(包括但不限于):
  AI应用专业领域
  AI应用日常生活娱乐
  AI PC与其他智能设备的链接与整合
  补充说明:
  (1)AIPC本地模型优化方案:针对AI Agent等现有应用,提出优化其在AIPC本地运行效能的创新方案(可融合大预言模型LLM、计算机视觉CV、文本处理OCR、语音交互ASR等):
  a.模型轻量化:应用模型压缩技术(量化、蒸馏、剪枝等),实现模型精简与本地适配,兼顾精度。
  评分依据:优化前后模型大小、推理性能、系统负载数据对比。
  b.推理加速:采用优化技术(算子、图结构、内存管理等),提升本地推理效率(如prefill、token generation速度)。
  评分依据:性能提升量化数据。
  (2)行业赋能方案:为教育、医疗、娱乐、办公等场景,设计基于AIPC本地AI的创新应用(例如:作业批改、病例分析、文章润色)。
  评分核心:创新性、实用性、可行性。
  (3)其他
  2、赛题要求:
  2.1硬件环境
  AIPC云平台接入(报名审核后,通知云服务申请表)
  型号:Beelink SER/处理器:AMD Ryzen HX370/内存:32GB RAM/存储:1TB SSD
  操作系统:Windows 11
  外设请根据AI应用设计自行配置
  2.2 AI应用的设计与实现
  基于所提供的硬件环境,以及利用AMD推荐模型https://huggingface.co/amd或者自选模型,完成所选场景下的AI应用开发。
  参赛作品须提出创新的解决方案,展示其前瞻性的思考和设计。
  参赛作品须具有实际的应用价值。
  参赛作品须充分发挥AMD产品的算力优势(iGPU,NPU,CPU)实现本地AI推理。
  加分项:充分利用本地AI算力前提下,提升电源利用能效。
  2.3赛题提交要求(初赛)
  技术论文–Word文档(必选)
  视频文件,限制3分钟(必选)
  门型展架,尺寸180cm*80cm(必选)
  演示说明–PPT文档(可选)
  2.4赛题提交要求(决赛)
  技术论文–Word文档(必选)
  演示说明–PPT文档(必选)
  3、评分标准:
  3.1技术创新和实用性30%
  AI应用基于的模型(或模型组)
  提出创新的解决方案
  能够有效地解决现实世界中的问题
  复杂度和计算效率
  示例:一个使用深度学习技术进行图像分类的模型,若其准确率超过90%且计算速度快于现有方法,则会得高分。
  3.2 AI应用程序与用户交互程度20%
  示例:一个语音助手模型,若能根据用户的口音和语调自适应,并提供直观的界面,则会得高分。
  3.3论文,PPT的清晰度与逻辑20%
  文献综述全面、正确
  方法描述清晰、易于理解
  结果分析合理、令人信服
  3.4功能完整度+稳定性15%
  完成所有预定任务
  运行速度和稳定性
  示例:一个文本生成模型,若其能生成高质量文本且运行速度快、稳定,则会得高分。
  3.5 Demo(现场直播、预先录制视频等形式)10%
  清晰展示该应用的功能和性能
  可以帮助用户轻松理解和使用该应用
  示例:一个人脸识别模型,若其Demo能快速、准确识别人脸并提供友好界面,则会得高分。
  3.6用户隐私数据是否受到保护5%
  是否收集和存储用户的隐私数据
  用户的本地隐私数据是否加密
  是否会将本地存储的隐私数据上传到网络
  是否有明确的隐私政策和使用条款
  示例:一个社交媒体分析模型,若其在不收集用户隐私数据的情况下完成分析,并提供清晰的隐私政策,则会得高分。
  4、参考链接:
  •AMD AI Solutions:
  https://www.amd.com/en/solutions/ai.html
  •AMD HIP SDK on Windows:
  https://rocm.docs.amd.com/projects/install-on-windows/en/latest/index.html
  •AMD Ryzen AI:
  https://ryzenai.docs.amd.com/en/latest/index.html

  5、赛题-竞赛交流QQ群:

  点击阅读原文下载报名表

https://mp.weixin.qq.com/s/nXOwdLGW0qO8aEyVg22STQ